แม้ว่าคุณจะใช้เป็นประจำทุกวัน แต่คุณอาจมีคำถามเกี่ยวกับวิธีการทำงานของ ChatGPT
มาเจาะลึกเบื้องหลังของ AI chatbot ที่ได้รับความนิยมมากที่สุดในโลกกันดีกว่า
ChatGPT 101
หากคุณมีเวลาเพียง 20 วินาที นี่คือวิธีการ ChatGPT ผลงาน:
- คุณส่งคำขอ 'กรุณาเขียนอีเมล
- ChatGPT แยกข้อมูลอินพุตออกเป็นโทเค็นเพื่อประมวลผล
- ใช้ NLP เพื่อวิเคราะห์อินพุตและทำความเข้าใจบริบท
- ทำนายคำถัดไปโดยใช้รูปแบบที่เรียนรู้จากข้อมูลฝึกอบรม
- มุ่งเน้นไปที่ส่วนที่เกี่ยวข้องที่สุดของข้อมูลที่คุณป้อน (โดยใช้กลไกการใส่ใจ)
- ChatGPT สร้างคำตอบฉบับเต็มคำต่อคำและส่งกลับมาให้คุณ
เหล่านี้เป็นขั้นตอนพื้นฐานของวิธีการ ChatGPT รับและตอบคำถาม
การประมวลผลภาษาธรรมชาติ
ส่วนหนึ่งของสิ่งที่ทำให้ ChatGPT ดูเหมือนว่าเวทมนตร์คือการใช้ การประมวลผลภาษาธรรมชาติ มันสามารถพูดคุยกับเราได้เพราะมันสามารถประมวลผลและเข้าใจภาษาธรรมชาติของมนุษย์ได้
การประมวลผลภาษาธรรมชาติคืออะไร?
การประมวลผลภาษาธรรมชาติ (NLP) เป็นสาขาหนึ่งของปัญญาประดิษฐ์ซึ่งมุ่งเน้นการโต้ตอบระหว่างคอมพิวเตอร์และมนุษย์ผ่านภาษาธรรมชาติ
ช่วยให้เครื่องจักรสามารถเข้าใจ ตีความ และสร้างภาษามนุษย์ในลักษณะที่มีความหมายและมีประโยชน์
NLP กับ NLU กับ NLG
NLP เป็นสาขาที่กว้างซึ่งครอบคลุมหลายสาขาวิชาย่อย รวมถึง ความเข้าใจภาษาธรรมชาติ (NLU) และการสร้างภาษาธรรมชาติ (NLG)
NLP เป็นโดเมนที่ครอบคลุม ในขณะที่ NLU และ NLG เป็นพื้นที่เฉพาะทางภายในนั้น นั่นเป็นเพราะการประมวลผลภาษาธรรมชาติต้องเกี่ยวข้องกับทั้งความเข้าใจ จากนั้นการสร้างระหว่างการสนทนาไปมา
NLP ทำงานอย่างไร?
NLU แบ่งภาษาของมนุษย์ออกเป็นสองส่วนเพื่อตีความความหมายและเจตนาของมัน โดยแต่ละขั้นตอนจะมีการทำงานดังนี้:
- ข้อความได้รับการประมวลผลล่วงหน้าเพื่อลบองค์ประกอบที่ไม่จำเป็นออก (เช่น เครื่องหมายวรรคตอนและคำหยุด)
- ระบบระบุส่วนประกอบที่สำคัญ เช่น เอนทิตี คำสำคัญ และวลี จากข้อความ
- วิเคราะห์โครงสร้างประโยคเพื่อทำความเข้าใจความสัมพันธ์ระหว่างคำและแนวคิด
- โมเดล NLU จะจับคู่องค์ประกอบที่รู้จักกับเจตนาหรือเป้าหมายที่เจาะจง
- เอ็นจิ้น NLU ปรับปรุงความเข้าใจตามบริบทและประวัติการโต้ตอบของผู้ใช้
ระบบจัดให้มีผลลัพธ์ที่มีโครงสร้างซึ่งสามารถกระตุ้นการดำเนินการหรือการตอบสนองที่เหมาะสมได้
การ GPT ของ ChatGPT
การ GPT ของ ChatGPT ย่อมาจาก 'generative pre-trained transformer' องค์ประกอบทั้ง 3 นี้เป็นกุญแจสำคัญในการทำความเข้าใจว่า ChatGPT ผลงาน
กำเนิด
ChatGPT เป็นโมเดล AI เชิงสร้างสรรค์ ซึ่งสามารถสร้างข้อความ โค้ด รูปภาพ และเสียง ตัวอย่างอื่นๆ ของ AI เชิงสร้างสรรค์ ได้แก่ เครื่องมือสร้างภาพ เช่น DALL-E หรือเครื่องกำเนิดเสียง
การฝึกอบรมล่วงหน้า
ด้านการ ‘ฝึกอบรมล่วงหน้า’ ของ ChatGPT นั่นคือเหตุผลว่าทำไมมันถึงดูเหมือนจะรู้ทุกอย่างบนอินเทอร์เน็ต GPT โมเดลได้รับการฝึกอบรมจากข้อมูลจำนวนมากในกระบวนการที่เรียกว่า 'การเรียนรู้แบบไม่มีผู้ดูแล'
ก่อน ChatGPT โมเดล AI ถูกสร้างขึ้นด้วยการเรียนรู้แบบมีผู้ดูแล โดยโมเดลเหล่านี้ได้รับข้อมูลอินพุตและเอาต์พุตที่มีป้ายกำกับอย่างชัดเจน และได้รับการสอนให้จับคู่ข้อมูลทั้งสองเข้าด้วยกัน กระบวนการนี้ค่อนข้างช้า เนื่องจากชุดข้อมูลจะต้องได้รับการรวบรวมโดยมนุษย์
เมื่อช่วงต้น GPT โมเดลได้รับการเปิดเผยต่อชุดข้อมูลขนาดใหญ่ที่ใช้ฝึกอบรม โดยดูดซับรูปแบบภาษาและความหมายเชิงบริบทจากแหล่งต่าง ๆ มากมาย
นี่เป็นเหตุผลว่าทำไม ChatGPT เป็นแชทบอทความรู้ทั่วไป ซึ่งได้รับการฝึกฝนด้วยชุดข้อมูลขนาดใหญ่ก่อนที่จะเปิดตัวสู่สาธารณะ
ผู้ใช้ที่ต้องการฝึกอบรมเพิ่มเติม GPT เครื่องยนต์ – เพื่อให้มีความเชี่ยวชาญในงานบางอย่าง เช่น การเขียนรายงานสำหรับองค์กรเฉพาะของคุณ – สามารถใช้ เทคนิคต่างๆ เพื่อปรับแต่ง LLMs ได้
หม้อแปลงไฟฟ้า
ทรานส์ฟอร์มเมอร์เป็นสถาปัตยกรรมเครือข่ายประสาทชนิดหนึ่งที่ได้รับการแนะนำในเอกสารปี 2017 ที่มีชื่อว่า "Attention is All You Need" โดย Vaswani และคณะ ก่อนที่จะมีทรานส์ฟอร์มเมอร์ โมเดลต่างๆ เช่น เครือข่ายประสาทแบบเรียกซ้ำ (RNN) และเครือข่ายหน่วยความจำระยะสั้น (LSTM) มักใช้ในการประมวลผลลำดับของข้อความ
เครือข่าย RNN และ LSTM จะอ่านข้อความที่ป้อนตามลำดับแบบเดียวกับที่มนุษย์ทำ แต่สถาปัตยกรรมทรานสฟอร์มเมอร์สามารถประมวลผลและประเมินแต่ละคำในประโยคได้ในเวลาเดียวกัน ทำให้สามารถให้คะแนนคำบางคำว่ามีความเกี่ยวข้องมากขึ้น แม้ว่าจะอยู่ในกลางหรือท้ายประโยคก็ตาม ซึ่งเรียกว่ากลไกการใส่ใจตนเอง
ลองใช้ประโยคนี้: “หนูไม่สามารถเข้าไปในกรงได้เพราะมันใหญ่เกินไป”
หม้อแปลงสามารถให้คะแนนคำว่า "หนู" ว่าสำคัญกว่า "กรง" และระบุได้อย่างถูกต้องว่า "มัน" ในประโยคนั้นหมายถึงหนู
แต่โมเดลเช่น RNN อาจตีความ "มัน" ว่าเป็นกรง เนื่องจากเป็นคำนามที่ได้รับการประมวลผลล่าสุด
ลักษณะ 'หม้อแปลง' ช่วยให้ ChatGPT เพื่อเข้าใจบริบทได้ดีขึ้นและตอบสนองได้อย่างชาญฉลาดมากขึ้นกว่ารุ่นก่อนๆ
กระบวนการฝึกอบรม
ChatGPT ได้รับการฝึกอบรมผ่านกระบวนการสองขั้นตอน: ขั้นตอนก่อนการฝึกอบรม และขั้นตอนปรับปรุง
การฝึกอบรมล่วงหน้า
ประการแรก โมเดล AI จะต้องเปิดเผยข้อมูลข้อความจำนวนมาก จากหนังสือ เว็บไซต์ และไฟล์อื่นๆ
ในระหว่างการฝึกอบรมเบื้องต้น โมเดลจะเรียนรู้ที่จะทำนายคำถัดไปในประโยค ซึ่งจะช่วยให้โมเดลเข้าใจรูปแบบในภาษาได้ โดยพื้นฐานแล้ว โมเดลจะสร้างความเข้าใจทางสถิติเกี่ยวกับภาษา ซึ่งทำให้โมเดลสามารถสร้างข้อความที่ฟังดูสอดคล้องกันได้
การปรับแต่งอย่างละเอียด
หลังจากการฝึกอบรมเบื้องต้นแล้ว โมเดลจะถูกปรับแต่งให้เหมาะสมกับชุดข้อมูลที่เฉพาะเจาะจงมากขึ้น ChatGPT ซึ่งรวมถึงชุดข้อมูลที่จัดเตรียมไว้สำหรับการสนทนา
ส่วนสำคัญของขั้นตอนนี้เกี่ยวข้องกับการเรียนรู้เสริมแรงจากข้อเสนอแนะของมนุษย์ (RLHF) ซึ่งผู้ฝึกสอนมนุษย์จะจัดอันดับการตอบสนองของแบบจำลอง วงจรข้อเสนอแนะนี้ช่วย ChatGPT ปรับปรุงความสามารถในการสร้างการตอบสนองที่เหมาะสม มีประโยชน์ และถูกต้องตามบริบท
คำหลัก
โทเค็น
หน่วยข้อความ (คำหรือส่วนของคำ) ที่แบบจำลองประมวลผล ChatGPT อินพุตและเอาต์พุตถูกโทเค็นเพื่อการคำนวณที่มีประสิทธิภาพ
การเรียนรู้แบบ Zero Shot
ความสามารถของโมเดลในการดำเนินการงานต่างๆ นั้นไม่ได้รับการฝึกอบรมมาโดยเฉพาะโดยอาศัยความรู้ทั่วไป
การเรียนรู้แบบ One-Shot เกี่ยวข้องกับการให้ตัวอย่างหนึ่งแก่โมเดล ในขณะที่การเรียนรู้แบบ n-Shot เกี่ยวข้องกับการให้ตัวอย่างจำนวนมากแก่โมเดลเพื่อให้สามารถเรียนรู้ได้
กลไกการใส่ใจ
ส่วนประกอบของโมเดลหม้อแปลงที่ช่วยให้สามารถเน้นที่ส่วนต่างๆ ของข้อความอินพุตเมื่อสร้างการตอบสนอง
อาการประสาทหลอน
โมเดล AI จะ "เกิดภาพหลอน" เมื่อสร้างข้อมูลที่ไม่ถูกต้องหรือไม่สมเหตุสมผล อาการประสาทหลอนสามารถบรรเทาได้ด้วยกลยุทธ์ต่างๆ เช่น การค้นหาข้อมูลและการสร้างข้อมูลเสริม (RAG)
ความคิดแบบห่วงโซ่แห่งเหตุผล
วิธีการที่ช่วยให้โมเดลคิดทีละขั้นตอนซึ่งช่วยปรับปรุงความสามารถในการจัดการคำเตือนหรือภารกิจที่ซับซ้อน
บาง ChatGPT โมเดลต่างๆ จะติดตั้งกลยุทธ์นี้ไว้โดยอัตโนมัติ เช่นเดียวกับ โมเดล OpenAI o1 รุ่นล่าสุด แต่คุณสามารถขอให้เวอร์ชันใดๆ ก็ตามทำการ ให้เหตุผลแบบลำดับความคิดได้ เพียงแค่ขอให้อธิบายเหตุผลทีละขั้นตอน
การฝึกอบรมล่วงหน้า
ระยะเริ่มต้นซึ่งจะมีการฝึกโมเดลบนชุดข้อมูลขนาดใหญ่เพื่อเรียนรู้รูปแบบภาษา ก่อนที่จะปรับแต่งให้เหมาะกับงานเฉพาะ
การปรับแต่งอย่างละเอียด
กระบวนการปรับแต่งแบบจำลองในชุดข้อมูลหรืองานที่แคบลงเพื่อเพิ่มประสิทธิภาพในกรณีการใช้งานที่เฉพาะเจาะจง
หน้าต่างบริบท
ข้อจำกัดของจำนวนข้อความอินพุตที่โมเดลสามารถพิจารณาเมื่อสร้างการตอบสนอง
หน้าต่างบริบทระดับต่ำหมายความว่าคุณไม่สามารถส่งรายงานยาวและขอให้สรุปได้ – โมเดลจะ “ลืม” จุดเริ่มต้นของเอกสาร
วิธีการปรับแต่ง ChatGPT
มีหลายวิธีในการปรับแต่งอันทรงพลัง LLMs , เช่นเดียวกับ GPT เครื่องยนต์ที่ให้พลัง ChatGPT -
กำหนดเอง GPTs
OpenAI ช่วยให้ผู้ใช้สามารถปรับแต่งได้ GPTs ตามความชอบของคุณ คุณสามารถสั่งทำพิเศษได้ GPT เพื่อช่วยให้คุณเรียนรู้กฎของเกมกระดานบางเกม ออกแบบโปสเตอร์วงดนตรีร็อคเมทัล หรือสอนแนวคิด AI
ตัวแทน AI ที่กำหนดเอง
ด้วยความก้าวหน้าของเทคโนโลยี AI คุณสามารถสร้างของคุณเองได้อย่างง่ายดาย (และฟรี) LLM -ขับเคลื่อนด้วย ตัวแทน AI
ตั้งแต่โปรแกรมสร้างแบบลากและวางที่ใช้โค้ดน้อยไปจนถึงระบบนิเวศการเขียนโค้ดขั้นสูง มี แพลตฟอร์มการสร้าง AI ที่ยอดเยี่ยม สำหรับกรณีการใช้งานและระดับทักษะใดๆ
การสร้างของคุณเอง LLM ตัวแทนที่ขับเคลื่อนด้วยพลังหมายความว่าคุณสามารถออกแบบ ผู้ช่วย AI เฉพาะที่กำหนดเวลาการประชุมของคุณและสร้างรายงานเมตริกรายสัปดาห์ของคุณ หรือคุณสามารถสร้าง ตัวแทน AI ฝ่ายสนับสนุนลูกค้า ที่คุณปรับใช้บน WhatsApp ได้ มีความเป็นไปได้มากมาย
สร้าง GPT - แชทบอทที่ขับเคลื่อนด้วยวันนี้
ChatGPT เป็นแชทบอททั่วไป แต่คุณสามารถใช้แชทบอทอันทรงพลังได้ GPT เครื่องยนต์จาก OpenAI เพื่อสร้างแชทบอท AI ที่กำหนดเองของคุณเอง
ใช้ประโยชน์จากพลังของเทคโนโลยีล่าสุด LLMs ด้วยแชทบอทที่คุณกำหนดเอง
Botpress เป็นแพลตฟอร์มแชทบอท AI ที่มีความยืดหยุ่นและขยายได้ไม่จำกัด ช่วยให้ผู้ใช้สามารถสร้างตัวแทน AI หรือแชทบอทประเภทใดก็ได้สำหรับการใช้งานทุกกรณี
รวมแชทบอทของคุณเข้ากับแพลตฟอร์มหรือช่องทางใดๆ หรือเลือกจากไลบรารีการรวมที่สร้างไว้ล่วงหน้าของเรา เริ่มต้นด้วยบทช่วยสอนจาก Botpress ช่อง YouTube หรือคอร์สเรียนฟรีจาก Botpress Academy -
เริ่มสร้างวันนี้ มันฟรี.
สารบัญ
ติดตามข่าวสารล่าสุดเกี่ยวกับตัวแทน AI
แบ่งปันสิ่งนี้บน: