- เฟรมเวิร์กหลายเอเจนต์แบ่งงานที่ซับซ้อนออกเป็นเอเจนต์เฉพาะทางแทนที่จะเป็นเอเจนต์ขนาดใหญ่เพียงตัวเดียว LLM ลูป
- ตัวแทนสื่อสารผ่านข้อความที่จัดการโดยตรรกะการกำหนดเส้นทางและสถานะเวิร์กโฟลว์ที่แชร์กัน
- ประโยชน์ ได้แก่ การดีบักที่ดีขึ้น ตรรกะที่นำกลับมาใช้ใหม่ การปรับขนาดที่ง่ายขึ้น และการจัดการข้อผิดพลาดที่เชื่อถือได้
- เครื่องมือเช่น Botpress LangChain และ CrewAI ช่วยให้นักพัฒนาสร้างระบบตัวแทนประสานงานได้รวดเร็วยิ่งขึ้น
นักพัฒนาส่วนใหญ่ที่พยายามสร้างตัวแทน AI มักจะเริ่มด้วยลูปโมเดลภาษาขนาดใหญ่เพียงอันเดียว — พร้อมต์ระบบและบางทีก็อาจมีเครื่องมือหนึ่งหรือสองอัน — และสำหรับงานเล็กๆ น้อยๆ นั่นก็เพียงพอแล้ว
แต่เมื่อคุณต้องการโครงสร้าง ระบบก็จะเริ่มมีปัญหา ผลลัพธ์ที่ได้จะคาดเดาไม่ได้ เวิร์กโฟลว์จะแก้ไขได้ยาก และคุณจะใช้โทเค็นไปกับการทำซ้ำแทนที่จะใช้ความคืบหน้า
เวิร์กโฟลว์หลายเอเจนต์ช่วยให้คุณ สร้างเอเจนต์ AI ที่ทำงานคล้ายกับทีมมากขึ้น โดยมีบทบาทที่ชัดเจนและสามารถมองเห็นได้ว่าการตัดสินใจต่างๆ เกิดขึ้นอย่างไร และทำงานไปสู่เป้าหมายเดียวกัน
Multi-Agent Framework คืออะไร?
กรอบงานหลายเอเจนต์คือโครงสร้างพื้นฐานที่คุณใช้ในการสร้าง รัน และจัดการ เอเจนต์ AI หลายตัวอย่างประสานงานกัน
เป็นโครงสร้างพื้นฐานที่จัดการวิธีการสื่อสารของตัวแทนและวิธีเคลื่อนย้ายงานระหว่างตัวแทน
หากคุณทำงานกับ ระบบหลายเอเจนต์ กรอบงานนี้คือสิ่งที่ทำให้ระบบทำงานได้
ที่สำคัญที่สุดคือ โมเดลภาษาขนาดใหญ่ แบบดิบ ( LLMs ) เป็นตัวแทนที่มีขอบเขต โดยแต่ละตัวมีบทบาทและวิธีการดำเนินการที่คาดเดาได้
แทนที่จะเขียนตรรกะการประสานกันตั้งแต่ต้น เฟรมเวิร์กนี้จะให้โครงสร้าง การควบคุม และการทำซ้ำแก่คุณ
กรอบงานมัลติเอเจนต์: แนวคิดหลัก
เฟรมเวิร์ก Multi-Agent ทำงานอย่างไร?
กรอบงานมัลติเอเจนต์สร้างโครงสร้างให้กับวิธีเรียกใช้เอเจนต์ วิธีส่งข้อมูล และวิธีที่ระบบติดตามความคืบหน้า
พวกเขาจัดเตรียมองค์ประกอบพื้นฐานในการประสานงานตัวแทนในลักษณะที่สามารถปรับขนาดได้ตามความซับซ้อน และทำให้สามารถใช้งานได้จริง
ตัวอย่างหนึ่งคือการใช้การตั้งค่าหลายตัวแทนเพื่อขับเคลื่อน แชทบ็อตของ WhatsApp ในกรณีนี้ ตัวแทนที่แตกต่างกันสามารถจัดการงานต่างๆ เช่น การจอง การประมวลผลการคืนเงิน หรือการยืนยัน โดยทำงานร่วมกันเบื้องหลังโดยไม่ต้องพึ่งพาการตั้งค่าบ็อตแบบองค์รวมเพียงตัวเดียว
.webp)
ตัวแทนได้รับการลงทะเบียนเป็นส่วนประกอบที่สามารถเรียกได้ในระบบ
ก่อนที่ตัวแทนจะสามารถดำเนินการใดๆ ได้ กรอบงานจะต้องทราบก่อนว่าตัวแทนนั้นมีอยู่ ซึ่งหมายถึงการแจ้งให้ระบบทราบชื่อตัวแทน หน้าที่รับผิดชอบของตัวแทน และเครื่องมือหรือข้อมูลใดที่ตัวแทนสามารถเข้าถึงได้
ในกรอบงานส่วนใหญ่ การตั้งค่านี้เกิดขึ้นผ่านไฟล์กำหนดค่าหรือโค้ดบางส่วน โดยที่คุณกำหนดบทบาทของตัวแทนแต่ละคนและวิธีเปิดใช้งาน ตัวอย่างเช่น คุณอาจแจ้งระบบดังนี้:
“นี่คือเครื่องมือวางแผน ซึ่งจะอ่านข้อมูลจากผู้ใช้และตัดสินใจว่าจะทำอะไรต่อไป”
“นี่คือตัวตรวจสอบ ซึ่งจะรับข้อมูลผู้ใช้และส่งกลับ booking_id และข้อมูลผู้ใช้”
เมื่อลงทะเบียนแล้ว เฟรมเวิร์กสามารถ "เรียก" ตัวแทนเหล่านี้ตามชื่อได้ ซึ่งหมายความว่าเฟรมเวิร์กจะทราบวิธีการรันตัวแทนแต่ละตัวเมื่อถึงตาตัวแทนเหล่านั้นในเวิร์กโฟลว์
ตัวแทนกำหนดเส้นทางจะตัดสินใจว่าตัวแทนใดจะทำงานต่อไป
ฟังก์ชันตัวแทนวางแผนหรือตัวควบคุมจะจัดการ การกำหนดเส้นทางของตัวแทน AI โดยจะดูผลลัพธ์ของบอทล่าสุด ประวัติการสนทนาปัจจุบัน และบางครั้งอาจรวมถึงอินพุตของผู้ใช้เดิม เพื่อตัดสินใจว่าจะต้องดำเนินการอะไรต่อไป
ตัววางแผนบางตัวจะอิงตามการแจ้งเตือน โดยจะรับข้อความของระบบและแสดงชื่อของตัวแทนตัวถัดไปที่จะรัน
คนอื่นๆ ใช้ลอจิกแบบฮาร์ดโค้ดหรือกราฟการไหล ขึ้นอยู่กับ เฟรมเวิร์กของเอเจนต์ AI ที่คุณกำลังทำงานด้วย
กรอบงานจะรับเอาต์พุตนั้นและใช้ในการเรียกตัวแทนคนต่อไป เราเตอร์จะตัดสินใจว่าใครควรทำหน้าที่นี้แทนที่จะทำหน้าที่นี้
ข้อมูลถูกส่งระหว่างตัวแทนโดยใช้ข้อความ
ตัวแทนไม่แชร์หน่วยความจำโดยตรง เมื่อทำงานเสร็จสิ้น เอาต์พุตจะถูกจัดกลุ่มเป็นข้อความ ซึ่งโดยปกติจะเป็นพจนานุกรมหรืออ็อบเจ็กต์ JSON และส่งต่อไปยังตัวแทนถัดไปเป็นอินพุต
กรอบงานจะจัดการการถ่ายโอน โดยจะจัดเก็บข้อความในพื้นที่หน่วยความจำที่ใช้ร่วมกันหรือส่งต่อโดยตรงไปยังอินเทอร์เฟซอินพุตของตัวแทนรายต่อไป ขึ้นอยู่กับโครงสร้างของระบบ
ข้อความมักจะรวมมากกว่าแค่เนื้อหา:
- ใครส่งมา (ตัวแทนหรือผู้ใช้)
- มาจากเวิร์กโฟลว์ไหน
- ควรใช้งานอย่างไร (เช่น ทริกเกอร์ อินพุต การตัดสินใจ)
- เมตริกเสริม เช่น จำนวนโทเค็นหรือไทม์สแตมป์
บริบทนี้ช่วยให้ระบบกำหนดเส้นทางงานได้อย่างชัดเจนและรักษาตัวแทนให้แยกจากกัน
ติดตามการดำเนินการโดยใช้สถานะเวิร์กโฟลว์และทริกเกอร์
กรอบงานจะติดตามสิ่งที่เกิดขึ้นจนถึงตอนนี้ — ตัวแทนใดที่รัน ตัวแทนใดที่ส่งคืน และตัวแทนใดที่ยังต้องดำเนินการ ข้อมูลนี้จะถูกเก็บไว้ในอ็อบเจ็กต์สถานะ ซึ่งจะอัปเดตหลังจากแต่ละขั้นตอน
ทริกเกอร์จะกำหนดสิ่งที่จะเกิดขึ้นต่อไป โดยใช้ค่าเอาต์พุตหรือเงื่อนไขเพื่อแยกสาขาของโฟลว์
วิธีนี้ช่วยให้ระบบเดินหน้าต่อไปได้โดยไม่ต้องฮาร์ดโค้ดตรรกะลงในตัวแทนทุกตัว สถานะจะควบคุมเวิร์กโฟลว์ ไม่ใช่ตัวแทนเอง
ประโยชน์หลักของการใช้กรอบงานมัลติเอเจนต์
ตรรกะการปรับขนาดโดยไม่ต้องโอเวอร์โหลดตัวแทนตัวเดียว
ตัวแทน AI เพียงตัวเดียวสามารถทำได้เพียงเล็กน้อยก่อนที่จะกลายเป็นสิ่งที่ยุ่งยากด้วยคำแนะนำ เครื่องมือ และความรับผิดชอบที่ไม่ชัดเจน เฟรมเวิร์กตัวแทนหลายตัวช่วยให้คุณแบ่งตรรกะนั้นออกเป็นตัวแทนที่เน้นเฉพาะ โดยแต่ละตัวจะจัดการกับงานที่ชัดเจนหนึ่งงาน
แทนที่จะขยายตัวแทนตัวเดียวให้บางลง คุณสามารถกำหนดขั้นตอนเฉพาะ เช่น การดึงข้อมูล การตรวจสอบ หรือการดำเนินการ ให้กับตัวแทนที่แยกจากกันและขยายระบบทีละชิ้น
ดีบักการทำงานร่วมกันของตัวแทนด้วยการมองเห็นเต็มรูปแบบ
เมื่อตัวแทน AI ทำงานร่วมกัน ปัญหาต่างๆ อาจติดตามได้ยาก เฟรมเวิร์กจะแสดงให้คุณเห็นว่าตัวแทนแต่ละตัวได้รับอะไร ส่งคืนอะไร และหยุดทำงานที่ใด
คุณไม่ต้องเดาว่าอะไรพัง แต่ตรวจสอบการส่งต่อและแก้ไขโดยตรง การมองเห็นแบบนี้ทำให้สามารถจัดการการทำงานร่วมกันของตัวแทน AI ได้
นำตัวแทนมาใช้ซ้ำในเวิร์กโฟลว์ต่างๆ
หากตัวแทนใช้งานได้ ให้ใช้งานซ้ำ เฟรมเวิร์กช่วยให้คุณเชื่อมต่อตัวแทนเดียวกันเข้ากับโฟลว์ต่างๆ ได้โดยไม่ต้องเขียนใหม่ วิธีนี้จะทำให้ทุกอย่างสอดคล้องกันและทำให้การทดสอบเร็วขึ้น
ตัวอย่างเช่น ตัวแทนการตรวจสอบความถูกต้องที่ตรวจสอบอินพุตของผู้ใช้หรือการรับรองความถูกต้องสามารถใช้ได้ในทั้ง แชทบอทฝ่ายบริการลูกค้า และ แชทบอทฝ่ายจองห้องพัก ในกรณีที่ใช้ตรรกะเดียวกัน
จัดการความล้มเหลวและการลองใหม่โดยอัตโนมัติ
เมื่อตัวแทนล้มเหลว เฟรมเวิร์กสามารถลองใหม่ ข้าม หรือเดินหน้าต่อไปได้ คุณไม่จำเป็นต้องเขียนตรรกะนั้นเอง
ระบบสำรองในตัวช่วยให้เวิร์กโฟลว์เชื่อถือได้มากขึ้นโดยไม่ต้องทำงานเพิ่มเติม และความน่าเชื่อถือแบบนี้คือสิ่งที่ขับเคลื่อนระบบในโลกแห่งความเป็นจริง
สร้างโฟลว์ตัวแทนที่เปลี่ยนแปลงได้ง่าย
เมื่อคุณแบ่งงานระหว่างตัวแทน คุณจะไม่ต้องทำงานระบบทั้งหมดซ้ำทุกครั้งที่มีการเปลี่ยนแปลงบางอย่าง
คุณสามารถอัปเดตตัววางแผนโดยไม่ต้องแตะการดำเนินการหรือเปลี่ยนวิธีการตอบสนองของตัวแทนหนึ่งรายโดยไม่ต้องเขียนส่วนที่เหลือใหม่
ความสะดวกในการเข้าถึงนั้นให้ผลตอบแทนที่ดี—Salesforce รายงานว่า ทีมที่ใช้ AI แบบเอเจนต์สามารถประหยัดเวลาได้ 11 ชั่วโมงต่อพนักงาน หนึ่งคนต่อสัปดาห์ ซึ่งส่วนหนึ่งก็ต้องขอบคุณความสามารถในการปรับตัวของเวิร์กโฟลว์
เฟรมเวิร์กมัลติเอเจนต์ 5 อันดับแรก
การเลือกกรอบงานหลายเอเจนต์จะขึ้นอยู่กับสิ่งที่คุณกำลังสร้างและระดับการควบคุมที่คุณต้องการควบคุมวิธีที่เอเจนต์ทำงาน สื่อสาร และกู้คืนจากความล้มเหลว
เฟรมเวิร์กที่ดีที่สุดนั้นมีการแลกเปลี่ยนที่แตกต่างกันออกไป — บางเฟรมเวิร์กเหมาะสำหรับเวิร์กโฟลว์ที่มีโครงสร้าง ในขณะที่เฟรมเวิร์กอื่นๆ มอบความยืดหยุ่นมากกว่าแต่ต้องแลกมาด้วยความชัดเจน
คุณต้องการบางอย่างที่ตรงกับความต้องการของทีมและคุณวางแผนที่จะพัฒนาระบบไปไกลแค่ไหน
1. Botpress
.webp)
Botpress เป็นแพลตฟอร์มการพัฒนาภาพสำหรับการสร้างตัวแทน AI ที่สามารถประสานงานข้ามขั้นตอน บทบาท และช่องทางต่างๆ
แทนที่จะใช้ตรรกะในการเดินสายในโค้ด คุณสามารถกำหนดวิธีการทำงานของตัวแทนได้โดยใช้โฟลว์ หน่วยความจำ เงื่อนไข และการเรียกใช้เครื่องมือ
พฤติกรรมของเอเจนต์หลายตัวถูกสร้างขึ้นจากคำสั่ง เวิร์กโฟลว์ และเครื่องมือภายนอก แต่ละโหนดใน Botpress การไหลทำหน้าที่เป็นหน่วยที่มุ่งเน้นโดยมีคำสั่งและขอบเขตของตัวเอง
คุณสามารถแยกการใช้เหตุผลออกเป็นโหนดอัตโนมัติและแบบคงที่หลายโหนด เพิ่มเลเยอร์การตรวจสอบ หรือกำหนดเส้นทางอินพุตของผู้ใช้ผ่านตรรกะการตัดสินใจที่ใช้เครื่องมือแทนที่จะจัดการทุกอย่างในขั้นตอนเดียว
หน่วยความจำมีขอบเขตสำหรับแต่ละโฟลว์ ดังนั้นตัวแทนจึงใช้เฉพาะสิ่งที่จำเป็นเท่านั้น อินพุตและเอาต์พุตได้รับการกำหนดไว้อย่างชัดเจน และสามารถเพิ่มการเรียกใช้เครื่องมือได้โดยตรงผ่าน การรวมระบบ ในตัว
คุณสมบัติหลัก
- การประสานงานตัวแทนภาพโดยใช้โฟลว์และโหนด
- หน่วยความจำที่มีขอบเขตและการควบคุมตัวแปรระหว่างโหนด
- หน่วยความจำแบบหลายเทิร์น ตรรกะสำรอง และการลองใหม่อีกครั้ง
- การใช้เครื่องมือผ่านการเรียก API เว็บฮุก และการป้อนฟังก์ชัน
2. ลังเชน

LangChain เป็นกรอบงานสำหรับนักพัฒนาเพื่อสร้าง LLM ขับเคลื่อนแอปพลิเคชันด้วยการเชื่อมโยงคำสั่ง เครื่องมือ และหน่วยความจำเข้าด้วยกัน
มันเริ่มต้นจากวิธีการสร้างโครงสร้าง LLM เรียกใช้เครื่องมือ เช่น การค้นหาและเครื่องคำนวณ แต่ค่อยๆ ขยายไปสู่ระบบนิเวศน์ที่กว้างขวาง
รุ่นหนึ่งให้ความสำคัญกับ "ตัวแทน" ตามด้วย "ผู้ช่วย" แล้วจึงตามด้วย "สิ่งที่สามารถรันได้" ผลลัพธ์คือชุดเครื่องมืออันทรงพลังที่สามารถทำได้เกือบทุกอย่าง แต่การนำทางมักใช้เวลานาน
คุณสามารถกำหนดชุดเครื่องมือและสร้างตรรกะการกำหนดเส้นทางข้ามตัวแทนได้ จุดที่โดดเด่นคือการทำงานแบบโมดูลาร์ ส่วนประกอบต่างๆ สามารถนำกลับมาใช้ใหม่ได้ ผสมและจับคู่กันได้ และบูรณาการกับ API ภายนอกได้ดี
แต่คุณจะเขียนโค้ดกาวมากกว่าที่คาดไว้ และเมื่อการแยกย่อยเปลี่ยนแปลงอย่างรวดเร็ว จึงควรตรวจสอบว่าวิธีการที่คุณใช้นั้นยังคงเป็นวิธีที่นิยมใช้หรือไม่
คุณสมบัติหลัก
- การเชื่อมโยงโมดูลาร์ของคำเตือน เครื่องมือ และหน่วยความจำ
- ผสานรวมกับ LLMs , ร้านค้าเวกเตอร์ และ API
- การติดตามและประเมินผลแบบเลือกได้ด้วย LangSmith
3. ครูเอไอ

CrewAI ช่วยให้สร้างเวิร์กโฟลว์สำหรับหลายตัวแทนได้อย่างง่ายดาย โดยแต่ละตัวแทนจะมีบทบาทและงานที่กำหนดไว้ คุณสามารถสร้างทีมงาน กำหนดเป้าหมาย และให้ตัวแทนประสานงานผ่านผู้จัดการที่ใช้ร่วมกัน
เป็นหนึ่งในวิธีที่เร็วที่สุดในการสร้างแบบจำลองการทำงานร่วมกันของตัวแทนโดยไม่ต้องเขียนตรรกะการประสานงานขึ้นมาใหม่
เหมาะอย่างยิ่งสำหรับการตั้งค่าแบบคู่วางแผน-ผู้ดำเนินการ กระแสวิจัย-ผู้ตรวจสอบ หรืองานแบบทีมใดๆ ที่มีการแบ่งความรับผิดชอบอย่างชัดเจน
แต่เมื่อคุณเริ่มเพิ่มความซับซ้อน การแยกส่วนก็จะแคบลง ความยืดหยุ่นในการทำงานของเอเจนต์จะน้อยลง และการปรับเปลี่ยนพฤติกรรมมักจะหมายถึงการก้าวออกนอกกรอบค่าเริ่มต้น
คุณสมบัติหลัก
- การตั้งค่าตัวแทนตามบทบาทพร้อมชื่อ เป้าหมาย และหน่วยความจำ
- รองรับการดำเนินการตัวแทนแบบต่อเนื่องและขนาน
- หน่วยความจำลูกเรือที่ใช้ร่วมกันสำหรับการทำงานร่วมกันของตัวแทน
- การบูรณาการที่ง่ายดายด้วยเครื่องมือ ฟังก์ชัน และคำแนะนำที่กำหนดเอง
4. ออโต้จีพีที

AutoGPT เป็นโครงการแรกที่แสดงให้เห็นว่าจะเป็นอย่างไรเมื่อคุณตั้งเป้าหมายให้กับ แชทบอท GPT และปล่อยให้มันทำงานต่อไป - วางแผน คิด วิจัย และดำเนินการโดยไม่ต้องมีอินพุตจากมนุษย์อย่างต่อเนื่อง
คุณกำหนดเป้าหมาย และ AutoGPT จะวนซ้ำผ่านขั้นตอนการให้เหตุผล สร้างเป้าหมายย่อย เรียกใช้เครื่องมือ และปรับกลยุทธ์ไปพร้อมกัน
นับเป็นก้าวกระโดดครั้งใหญ่ในการทำให้พฤติกรรมของตัวแทนมีความเป็นอิสระและมีพลวัต แต่ไม่ได้สร้างขึ้นมาเพื่อความแม่นยำ
วงจรงานนั้นเปราะบาง และตัวแทนก็มีแนวโน้มที่จะติดอยู่ในการเขียนแผนเดิมใหม่หรือไล่ตามงานย่อยที่ไม่เกี่ยวข้อง
คุณสามารถเชื่อมต่อหน่วยความจำ เครื่องมือ และ API ได้ แต่การเชื่อมทุกอย่างเข้าด้วยกันมักจะทำให้เกิดการไหลที่ไม่สามารถคาดเดาได้ ซึ่งยากต่อการดีบักหรือควบคุม
คุณสมบัติหลัก
- ตัวแทนที่มุ่งเป้าหมายพร้อมการแจ้งเตือนตนเองและการวางแผนงาน
- การสร้างงานย่อยและวงจรการดำเนินการอัตโนมัติ
- รองรับการใช้เครื่องมือผ่านปลั๊กอินและการเรียก API
- ขยายได้ด้วยสคริปต์ ฟังก์ชัน และการบูรณาการที่กำหนดเอง
5. ออโตเจน

Autogen เป็นกรอบงานโอเพ่นซอร์สจาก Microsoft ที่มุ่งเน้นไปที่การสนทนาระหว่างตัวแทนหลายราย โดยที่ตัวแทนจะโต้ตอบกันผ่านข้อความแบบมีโครงสร้างตามรอบการพูดคุย
เป็นสิ่งที่ดีโดยเฉพาะเมื่อคุณต้องการควบคุมการแลกเปลี่ยนทุกครั้ง เช่น ในการวางแผน วงจรการดำเนินการ หรือระบบ ที่มีมนุษย์ร่วมอยู่ในวงจร
Autogen โดดเด่นในเรื่องความโปร่งใส คุณสามารถแทรกฟังก์ชันระหว่างการสนทนา กำหนดเส้นทางการตัดสินใจผ่านตรรกะที่กำหนดเอง และติดตามได้อย่างแม่นยำว่าตัวแทนแต่ละคนพูดอะไรและทำไม
แต่การปรับขนาดต้องใช้ความพยายาม การประสานข้อความมีความยืดหยุ่นแต่ไม่แยกส่วน คุณยังต้องจัดการประวัติ การกำหนดค่าตัวแทน และตรรกะขั้นตอนด้วยตัวเอง
สำหรับการตั้งค่าการวิจัย การทดสอบแบบควบคุม หรือพฤติกรรมของตัวแทนที่ทำซ้ำได้ ถือเป็นกรอบงานที่มีความแม่นยำมากที่สุดกรอบหนึ่งที่มีอยู่
คุณสมบัติหลัก
- กรอบการทำงานการสื่อสารแบบหลายตัวแทนตามผลัดกัน
- รองรับตัวแทนการเรียกใช้งานแบบ human-in-the-loop และฟังก์ชัน
- การติดตามข้อความที่โปร่งใสและการแทรกตรรกะแบบกำหนดเอง
วิธีการสร้างด้วยกรอบงานมัลติเอเจนต์
วิธีที่ง่ายที่สุดในการเริ่มต้นคือการเลือกเวิร์กโฟลว์จริงหนึ่งอย่าง — ซึ่งมีความซับซ้อนมากเกินไปสำหรับตัวแทนเพียงตัวเดียว — และแยกมันออกเป็นส่วนง่าย ๆ ไม่กี่ส่วน
ลองนึกถึง แชทบอทสำหรับสร้างโอกาสทางการขาย การจอง หรืออะไรก็ได้ที่ตรรกะ การตรวจยืนยัน และการดำเนินการเริ่มสับสน
มอบตัวแทนให้กับแต่ละขั้นตอน จากนั้นเชื่อมต่อโดยใช้เครื่องมือกำหนดเส้นทางและข้อความของกรอบงาน
ขั้นตอนที่ 1: ระบุจุดที่ตรรกะตัวแทนเดี่ยวของคุณขัดข้อง
มองหาจุดในบอทหรือระบบของคุณที่สิ่งต่างๆ เริ่มแพร่กระจายออกไป เช่น การแจ้งเตือนยาวๆ หรือการเรียกใช้เครื่องมือแบบต่อเนื่องที่ให้ความรู้สึกเหมือนถูกยึดติด นั่นคือจุดเข้าของคุณ ต่อไปนี้คือตัวอย่างทั่วไปบางส่วนที่สังเกตได้ง่าย:
- ขั้นตอนการขอคืนเงินที่วิเคราะห์อินพุตของผู้ใช้ ตรวจสอบสิทธิ์ ออกเงินคืน และส่งการยืนยัน — ทั้งหมดนี้ในลูปเดียว
- ลำดับการออนบอร์ดที่รวบรวมข้อมูล ตรวจสอบแบบฟอร์ม กำหนดประเภทผู้ใช้ และส่งอีเมลในห่วงโซ่คำเตือนเดียว
แทนที่จะออกแบบระบบใหม่ทั้งหมด คุณแค่แยกเวิร์กโฟลว์ที่มีข้อบกพร่องอยู่แล้วออกไป
ขั้นตอนที่ 2: กำหนดบทบาทก่อนที่คุณจะแตะกรอบงาน
เมื่อคุณพบตรรกะที่ยุ่งวุ่นวายแล้ว ให้แบ่งมันออกเป็นความรับผิดชอบที่แท้จริง
หากมีสิ่งใดที่ตรวจสอบอินพุต นั่นก็เป็นตัวแทนหนึ่ง หากมีสิ่งใดที่จัดการการดำเนินการภายนอก นั่นก็เป็นตัวแทนอีกตัวหนึ่ง
เขียนออกมาด้วยภาษาที่เรียบง่าย — เพียงพอที่จะแสดงว่าการส่งต่ออยู่ที่ไหน
เมื่อทุกอย่างอยู่ตรงหน้าคุณแล้ว คุณจะเห็นว่าสิ่งใดที่จำเป็นต้องแยกออกและสิ่งใดที่สามารถยุบลงได้ นอกจากนี้ คุณยังรับรู้ได้ด้วยว่าคุณต้องการกรอบงานแบบใด
บทบาทแต่ละอย่างควรมีลักษณะเหมือนบางอย่างที่คุณสามารถทดสอบได้ด้วยตัวเอง
ขั้นตอนที่ 3: เลือกกรอบงาน
เลือกแพลตฟอร์มที่เหมาะกับรูปแบบเวิร์กโฟลว์ของคุณ
- ภาพ : Botpress หากคุณต้องการโฟลว์แบบอิงตามโหนดและหน่วยความจำที่มีขอบเขต
- เน้น การเขียนโค้ดเป็นอันดับแรก : LangChain หรือ CrewAI หากคุณถนัดเรื่องการเดินสายลอจิกใน Python
กรอบงานจะตัดสินใจว่าตัวแทนจะได้รับการลงทะเบียน เรียกใช้งาน และเชื่อมต่ออย่างไร
ขั้นตอนที่ 4: สร้างเวิร์กโฟลว์แรก
ตอนนี้เปลี่ยนบทบาทเหล่านั้นให้เป็นตัวแทน กำหนดบทบาทเหล่านั้นภายในกรอบงานของคุณ — ตั้งชื่อบทบาทแต่ละบทบาท หน้าที่ และเครื่องมือหรือการเข้าถึง API ที่จำเป็น
เมื่อติดตั้งเรียบร้อยแล้ว ให้เชื่อมต่อ ใช้เส้นทางใดก็ได้ที่กรอบงานจัดเตรียมไว้เพื่อย้ายจากตัวแทนหนึ่งไปยังตัวแทนถัดไป
เป้าหมายที่นี่คือการทำให้เวิร์กโฟลว์ที่สมบูรณ์ทำงานจากต้นจนจบโดยมีตัวแทนอยู่ในเลนของตนเอง
ขั้นตอนที่ 5: เรียกใช้ระบบและตรวจสอบการส่งต่อทุกครั้ง
เรียกใช้งานเวิร์กโฟลว์ทั้งหมดตั้งแต่ต้นจนจบและติดตามสิ่งที่เกิดขึ้น คุณควรสังเกตว่าแต่ละเอเจนต์ได้รับอะไร ส่งกลับอะไร และโฟลว์ดำเนินไปอย่างราบรื่นระหว่างเอเจนต์เหล่านั้นหรือไม่
หากตัวแทนเกิดความสับสนในการป้อนข้อมูล แสดงว่าคุณอาจกำหนดขอบเขตไม่ถูกต้อง หากตรรกะเกิดการกระโดดโดยไม่คาดคิด แสดงว่าคุณต้องแก้ไขการกำหนดเส้นทาง
เมื่อการส่งต่อข้อมูลสะอาดแล้ว คุณจะมีระบบการทำงาน
แนวทางปฏิบัติที่ดีที่สุดสำหรับการใช้กรอบงานมัลติเอเจนต์
การเลือกกรอบงานเป็นเพียงจุดเริ่มต้น สิ่งที่สำคัญกว่าคือวิธีที่คุณออกแบบ ทดสอบ และจัดการเวิร์กโฟลว์ที่คุณสร้างด้วยกรอบงานนั้น
เมื่อระบบ AI มีลักษณะแบบโมดูลาร์และอัตโนมัติมากขึ้น การตรวจสอบย้อนกลับก็ทำได้ยากขึ้น
รักษาตรรกะหลักให้เป็นศูนย์กลาง
หลีกเลี่ยงการกระจายการตัดสินใจที่สำคัญไปยังตัวแทนหลายๆ ตัว การบำรุงรักษาและการทดสอบจะง่ายกว่าเมื่อการใช้เหตุผลสำคัญเกิดขึ้นในที่เดียว แทนที่จะแยกออกเป็นชิ้นส่วนที่เชื่อมต่อกันอย่างหลวมๆ
กำหนดอินพุตและเอาต์พุตของตัวแทนล่วงหน้า
ตัวแทนแต่ละคนควรมีสัญญาที่กำหนดไว้อย่างชัดเจน ว่าสัญญานั้นรับอะไรเข้ามา และสัญญานั้นส่งคืนอะไร ซึ่งจะทำให้ตัวแทนสามารถสลับหรือเชื่อมต่อกับเวิร์กโฟลว์ใหม่ได้ง่ายขึ้น โดยไม่ทำลายตรรกะของโฟลว์
บันทึกทุกข้อความที่ส่งผ่านระหว่างตัวแทน
หากคุณไม่เห็นสิ่งที่ตัวแทนกำลังสื่อสารกัน คุณจะไม่สามารถแก้ไขอะไรได้เลย ตรวจสอบให้แน่ใจว่าอินพุตและเอาต์พุตทั้งหมดได้รับการบันทึกด้วยบริบทที่เพียงพอเพื่อติดตามย้อนกลับผ่านโฟลว์
ใช้หน่วยความจำแบบมีขอบเขตเพื่อลดเสียงรบกวนและต้นทุน
มอบบริบทที่จำเป็นให้กับแต่ละเอเจนต์เท่านั้น การเข้าถึงหน่วยความจำแบบเต็มจะทำให้เกิดข้อความแจ้งเตือนที่พองตัว การใช้โทเค็นที่มากขึ้น และพฤติกรรมที่คาดเดาไม่ได้จากเอเจนต์ที่ควรได้รับการโฟกัส
เริ่มสร้าง AI ที่สามารถประสานงานได้
ระบบส่วนใหญ่จะล้มเหลวเมื่อจำเป็นต้องมีการประสานงานที่แท้จริง Botpress ช่วยให้คุณควบคุมวิธีที่ตัวแทนมอบหมายงานได้ — ด้วยบทบาทและตรรกะที่กำหนดไว้ คุณสามารถทดสอบและทำความเข้าใจได้
นอกจากนี้ยังช่วยให้คุณส่งข้อมูลระหว่างโฟลว์ได้อย่างชัดเจน คุณสามารถติดตามทุกขั้นตอนด้วยบันทึกแบบหลายขั้นตอนที่แสดงว่ามีการเรียกใช้เครื่องมือใด เหตุใดจึงเรียกใช้ และใช้งานอย่างไรในเวิร์กโฟลว์
แทนที่จะปรับแต่งอย่างรวดเร็วและควบคุมภาพหลอน คุณจะมุ่งเน้นไปที่การทำงานจริง — สร้างตัวแทนที่ทำงานเหมือนซอฟต์แวร์
เริ่มสร้างวันนี้ — ฟรี
คำถามที่พบบ่อย
ฉันจะรู้ได้อย่างไรว่าโครงการ AI ของฉันจำเป็นต้องใช้เฟรมเวิร์กหลายเอเจนต์จริงหรือไม่ หรือเอเจนต์ตัวเดียวก็เพียงพอ
โครงการ AI ของคุณอาจต้องมีกรอบงานหลายตัวแทนหากคำเตือนหรือเวิร์กโฟลว์ของตัวแทนรายเดียวของคุณยาวเกินไปหรือยากต่อการแก้ไข โดยเฉพาะอย่างยิ่งเมื่อต้องจัดการงานที่แตกต่างกันหลายงาน ในขณะที่กรณีการใช้งานที่ง่ายกว่า เช่น คำถามและคำตอบพื้นฐานหรือบอทสำหรับจุดประสงค์เดียว มักจะทำงานได้ดีกับตัวแทนเพียงตัวเดียว
การสร้างเฟรมเวิร์กแบบมัลติเอเจนต์นั้นใช้ได้กับโปรเจ็กต์องค์กรขนาดใหญ่เท่านั้นหรือไม่ หรือเหมาะสำหรับสตาร์ทอัพขนาดเล็กด้วยหรือไม่
การสร้างด้วยกรอบงานหลายเอเจนต์ไม่ได้มีไว้สำหรับองค์กรขนาดใหญ่เท่านั้น แต่สำหรับสตาร์ทอัพขนาดเล็กก็สามารถได้รับประโยชน์เช่นกัน เนื่องจากแม้แต่โปรเจ็กต์ขนาดเล็กก็สามารถดีบักได้ง่ายกว่าเมื่อแบ่งงานที่ซับซ้อนออกไปยังเอเจนต์เฉพาะทางแทนที่จะรวบรวมทุกอย่างไว้ในลูปขนาดใหญ่ที่จัดการยาก
การใช้ระบบหลายตัวแทนหมายความว่าฉันต้องแยกทุกอย่างออกเป็นตัวแทนแยกกันหรือฉันสามารถผสมตรรกะตัวแทนเดี่ยวและหลายตัวแทนได้หรือไม่
การใช้ระบบหลายเอเจนต์ไม่ได้หมายความว่าคุณต้องแยกทุกอย่างออกเป็นตัวแทนแยกจากกัน คุณสามารถผสมตรรกะของเอเจนต์ตัวเดียวสำหรับงานง่ายๆ ในขณะที่สำรองการประสานงานของหลายเอเจนต์ไว้สำหรับเวิร์กโฟลว์ที่ซับซ้อน
ระบบตัวแทนหลายรายแตกต่างจากการใช้ API หรือไมโครเซอร์วิสหลายรายการในแอปพลิเคชันของฉันอย่างไร
ระบบหลายเอเจนต์แตกต่างจากการใช้ API หรือไมโครเซอร์วิสหลายตัว เนื่องจากระบบนี้ประสานงานเอเจนต์ AI เฉพาะทางที่มีบทบาทและความสามารถในการใช้เหตุผลที่แตกต่างกันซึ่งส่งข้อความที่มีโครงสร้างและสถานะ ในขณะที่ API และไมโครเซอร์วิสจัดการฟังก์ชันที่แยกจากกันแต่ไม่ประสานเวิร์กโฟลว์ที่ซับซ้อนอย่างเป็นอิสระ
ต้นทุนในการรันระบบหลายเอเจนต์เทียบกับการรันระบบขนาดใหญ่เพียงระบบเดียวเป็นอย่างไร LLM -
ต้นทุนในการรันระบบหลายเอเจนต์อาจต่ำกว่าการรันระบบขนาดใหญ่เพียงระบบเดียว LLM เนื่องจากตัวแทนเฉพาะทางขนาดเล็กสามารถจัดการงานเฉพาะได้อย่างมีประสิทธิภาพโดยไม่ต้องเสียโทเค็นกับคำสั่งยาวๆ หรือบริบทที่ซ้ำซาก แต่ยังเพิ่มภาระงานในการจัดการการประสานงานและการสื่อสารระหว่างตัวแทนอีกด้วย ดังนั้นการประหยัดจึงขึ้นอยู่กับความซับซ้อนของกรณีการใช้งานของคุณ