- OpenAI o1 เป็นชุดโมเดลใหม่ (เริ่มด้วย o1-preview และ o1-mini) เน้นที่การใช้เหตุผลแบบเรียลไทม์ ไม่ใช่แค่การฝึกอบรมเบื้องต้นเท่านั้น
- o1 มีประสิทธิภาพเหนือกว่า GPT -40 ในงาน STEM ทำคะแนนได้ 83% ในการประเมิน IMO เทียบกับ GPT -40 คือ 13% และอยู่ในอันดับที่เปอร์เซ็นไทล์ที่ 89 บน Codeforces
- o1 ใช้การใช้เหตุผลแบบลำดับความคิดโดยกำเนิด ซึ่งทำให้ช้าลงแต่แม่นยำกว่าอย่างเห็นได้ชัดในงานที่ซับซ้อน
- o1 ยากกว่ามากในการเจลเบรก โดยมีคะแนน 84/100 ในการทดสอบความปลอดภัยเชิงต่อต้านเมื่อเทียบกับ GPT -40's 22.
หลังจากที่แฟนๆ ChatGPT คาดเดากันมานานหลายเดือน OpenAI สตอเบอร์รี่ใหม่ล่าสุด LLM ปล่อยออกแล้ว – และไม่ได้เรียกว่า GPT -5
ก่อนหน้านี้จะเรียกด้วยชื่อรหัสที่ซับซ้อนและน่าสนใจ เช่น Q* และ Strawberry ในที่สุดซีรีย์โมเดลล่าสุดก็ได้ใช้ชื่อเล่นว่า OpenAI o1
การอัปเดตครั้งใหญ่ที่สุดด้วย OpenAI รูปแบบใหม่คือทักษะการใช้เหตุผลที่ได้รับการปรับปรุง OpenAI อธิบายว่า o1 ได้รับการฝึกให้ใช้เวลาในการคิดมากกว่าโมเดลก่อนๆ ซึ่งใกล้เคียงกับสติปัญญาของมนุษย์มากขึ้น
อะไรคือ OpenAI o1?
OpenAI o1 คือซีรีส์ล่าสุดของโมเดลภาษาขนาดใหญ่ที่เผยแพร่โดย OpenAI ในวันที่ 12 กันยายน พ.ศ. 2567 โดยปัจจุบันประกอบด้วย 2 โมเดล ได้แก่ o1-preview และ o1-mini
ความแตกต่างที่ใหญ่ที่สุดระหว่าง o1 กับรุ่นก่อนหน้าของบริษัทคือเหตุผลที่ล้ำหน้ากว่า แม้ว่าจะยังไม่ได้เปิดตัวเต็มรูปแบบ แต่รุ่นพรีวิวและรุ่นมินิก็เปิดตัวไปแล้ว GPT -4o ออกจากน้ำในการทดสอบคณิตศาสตร์ วิทยาศาสตร์ และการเขียนโค้ด
OpenAI โมเดล o1
การเปิดตัวในเดือนกันยายนประกอบด้วยโมเดลสองรุ่น ได้แก่ o1-preview และ o1-mini ซึ่งเป็นรุ่นแรกในซีรีส์โมเดลที่จะออกวางจำหน่ายต่อ OpenAI ปรับปรุงใหม่ของพวกเขา LLM -
ความแตกต่างคืออะไร? โมเดล o1-mini มีขนาดเล็กกว่าและราคาถูกกว่าโมเดลตัวอย่างถึง 80% โมเดลนี้สร้างขึ้นสำหรับงานที่ต้องใช้การใช้เหตุผลขั้นสูงแต่ไม่ได้มีความรู้ที่กว้างขวางกว่า โมเดลนี้เหมาะอย่างยิ่งสำหรับงานที่เกี่ยวข้องกับการเขียนโค้ดหรือคณิตศาสตร์
ฉลาดขนาดไหน OpenAI o1?
OpenAI ได้นำเสนอรายการเกณฑ์มาตรฐาน STEM ที่แสดงให้เห็นความสามารถในการใช้เหตุผลของ o1 รวมถึง:
- มีประสิทธิภาพที่คล้ายคลึงกับนักศึกษาปริญญาเอกในการทดสอบมาตรฐานในวิชาฟิสิกส์ เคมี และชีววิทยา
- ติดอันดับนักเรียน 500 อันดับแรกในการแข่งขันคณิตศาสตร์โอลิมปิกของสหรัฐอเมริกา
- อันดับอยู่ในเปอร์เซ็นไทล์ที่ 89 ใน Codeforces ซึ่งเป็นการทดสอบการเขียนโค้ดแบบแข่งขัน
คุณสามารถอ่านเพิ่มเติมเกี่ยวกับความสามารถในการใช้เหตุผลของ o1 ได้ใน OpenAI การเผยแพร่ผลงานวิจัย ของ
การใช้เหตุผลแบบห่วงโซ่แห่งความคิดคืออะไร?
โมเดล o1 ใช้ การใช้เหตุผลแบบลำดับความคิด ซึ่งเป็นวิธีที่ยาวนานและละเอียดถี่ถ้วนยิ่งขึ้นในการแบ่งคำขอออกเป็นส่วนๆ
หากโมเดล o1 ได้รับคำใบ้ โมเดลจะไม่ตอบทันที ดังนั้นจึงต้องรอนาน แต่โมเดลจะใช้เหตุผลในแต่ละขั้นตอน พิจารณาข้อมูลแต่ละส่วนและผลที่ตามมาอย่างรอบคอบก่อนตัดสินใจดำเนินการขั้นตอนต่อไป โมเดลจะไม่ให้คำตอบจนกว่าจะคิดขั้นตอนทั้งหมดที่จำเป็นในการขอคำตอบ
o1 ต่างจาก GPT -40?
1) ความสามารถในการใช้เหตุผล
ศูนย์กลางของสติปัญญาโดยทั่วไปคือความสามารถใหม่ในการใช้เหตุผลของ o1 “บางทีพื้นที่แห่งความก้าวหน้าที่สำคัญที่สุดอาจอยู่ที่ความสามารถในการใช้เหตุผล” อัลท์แมนกล่าวกับเกตส์ “ตอนนี้ GPT -4 สามารถใช้เหตุผลได้เพียงวิธีที่จำกัดอย่างมากเท่านั้น”
การใช้เหตุผลนั้นยากอย่างยิ่ง แม้แต่สำหรับมนุษย์ด้วย OpenAI o1 เป็นรุ่นแรกที่ได้สิทธิ์ดังกล่าว
โมเดล o1 สามารถให้เหตุผลแบบเรียลไทม์ได้ แทนที่จะต้องพึ่งพาข้อมูลก่อนการฝึกอบรม นี่คือเหตุผลที่โมเดลใหม่นี้จึงดีกว่าในงานวิทยาศาสตร์ คณิตศาสตร์ และการเขียนโค้ดเมื่อเทียบกับโมเดลก่อนหน้า OpenAI แบบจำลอง
2) การเจลเบรกยากขึ้น
เนื่องจากความกังวลด้านความปลอดภัยเพิ่มมากขึ้น LLMs เติบโตทั้งในด้านความนิยมและพลัง ความปลอดภัยจึงถือเป็นจุดเน้นหลัก OpenAI การพัฒนาล่าสุดของบริษัท บริษัทได้ร่วมมือกับสถาบันความปลอดภัย AI ของสหรัฐอเมริกาและสหราชอาณาจักรในการพัฒนาซีรีส์ o1 และทำงานร่วมกับรัฐบาลสหรัฐอเมริกาเพื่อสร้างความรอบคอบในการดำเนินการ
ก้าวสำคัญอีกก้าวหนึ่งคือซีรีย์ o1 นั้นยากต่อการเจลเบรกหรือหลีกเลี่ยงมาตรการความปลอดภัยมากกว่ารุ่นก่อนๆ มาก
ในการทดสอบการเจลเบรกที่ยากที่สุดครั้งหนึ่ง โมเดล o1-preview ทำคะแนนได้ 84 จาก 100 คะแนน เมื่อเทียบกับคะแนนที่น่าผิดหวังเพียง 22 คะแนนจาก GPT -40.
3) รูปแบบการตั้งชื่อใหม่
แม้ว่าชื่อของมันจะไม่ใช่สิ่งที่น่าตื่นเต้นที่สุดเกี่ยวกับสิ่งใหม่ OpenAI LLM เป็นการเปลี่ยนแปลงที่มีความหมายโดยเจตนา
OpenAI o1 เป็นโมเดลแรกที่จะปลด ' GPT ' ชื่อนี้เป็นเพราะบริษัทอ้างว่าเป็นขั้นแรกของ 'กระบวนทัศน์การใช้เหตุผล' แบบใหม่ ในขณะที่รุ่นเก่านั้นเป็นส่วนหนึ่งของ 'กระบวนทัศน์ก่อนการฝึกอบรม'
โมเดลใหม่ใช้เวลาในการให้เหตุผลแบบเรียลไทม์ แทนที่จะต้องพึ่งพาข้อมูลก่อนการฝึกอบรม
4) เก่งในการแก้ปัญหา STEM
การใช้เหตุผลที่ดีขึ้นจะทำให้มีทักษะคณิตศาสตร์ที่ดีขึ้น
ทั้ง o1 และ GPT -40 คนได้รับการขอให้เข้าสอบวัดคุณสมบัติสำหรับการแข่งขันคณิตศาสตร์โอลิมปิกนานาชาติ GPT -4o แก้ไขปัญหาได้ 13% ขณะที่ o1 แก้ไขปัญหาได้ 83%
5) เวลาในการรอคอยนานขึ้น
การใช้เหตุผลแบบเรียลไทม์ใช้เวลานานกว่าการอ้างอิงข้อมูลการฝึกอบรมและสร้างการตอบสนอง หากคุณถามคำถาม OpenAI o1-preview เมื่อเทียบกับรุ่นอื่นๆ คุณจะต้องรอคอยนานกว่ามาก
อย่างไรก็ตาม ความสามารถในการใช้เหตุผลจากภายนอกนั้นถือเป็นราคาที่ต้องจ่ายเพียงเล็กน้อย ความเร็วของโมเดล o1 น่าจะดีขึ้นเมื่อมีการเปิดตัวโมเดลถัดไปในซีรีส์นี้
ใครสามารถใช้ o1 ได้บ้าง?
ณ วันที่ 12 กันยายน พ.ศ. ChatGPT Plus และผู้ใช้ทีมสามารถเข้าถึงโมเดล o1 ได้ ChatGPT -
OpenAI ประกาศว่าพวกเขาจะทำให้ o1-mini พร้อมใช้งานแก่ผู้ใช้ฟรี แม้ว่าจะยังไม่ได้ระบุวันที่ชัดเจน
อัตราส่วนจำกัดรายสัปดาห์ปัจจุบันอยู่ที่ 30 ข้อความสำหรับ 01-preview และ 50 ข้อความสำหรับ o1-mini แต่จะเพิ่มขึ้นในเร็วๆ นี้
ฉันควรใช้ o1 เพื่ออะไร?
ความสามารถในการใช้เหตุผลขั้นสูงของ o1 มีประโยชน์อย่างยิ่งในการแก้ปัญหาที่ซับซ้อนในคณิตศาสตร์ วิทยาศาสตร์ และการเขียนโค้ด OpenAI อธิบาย :
ข้อจำกัดของ OpenAI โอ1
จากการดูตัวอย่าง รุ่นนี้ยังไม่มีความสามารถทั้งหมด GPT -4o. หากคุณกำลังมองหาการใช้ LLM หากต้องการเรียกดูข้อมูลบนเว็บหรือต้องการอัปโหลดไฟล์หรือรูปภาพ คุณจะต้องปฏิบัติตาม GPT -4o จนกว่าจะมีรุ่น o1 ออกมาใหม่
วิธีการแจ้งเตือน OpenAI โอ1
OpenAI ข้อเสนอแนะที่กระตุ้นของ o1 มีการเปลี่ยนแปลงไปจากรุ่นก่อนหน้าเนื่องจากการใช้เหตุผลที่ได้รับการปรับปรุง
ให้คำกระตุ้นของคุณเรียบง่าย เป็นโมเดลที่ชาญฉลาด และไม่ต้องการคำแนะนำมากเท่ากับ GPT -4 ซีรีส์ ซึ่งหมายความว่าหลีกเลี่ยงการใส่ความคิดแบบเป็นห่วงโซ่ – โมเดลกำลังใช้เหตุผลภายในอยู่แล้ว
สร้าง GPT ตัวแทน AI ที่ขับเคลื่อนด้วย
จะเกิดอะไรขึ้นหากตัวแทน AI ของคุณซิงโครไนซ์กับทุกสิ่งโดยอัตโนมัติ OpenAI อัปเดต?
Botpress เป็นแพลตฟอร์มตัวแทน AI ที่เปิดกว้างและขยายได้อย่างสมบูรณ์ stack ช่วยให้นักพัฒนาสามารถสร้างแชทบอทและตัวแทน AI ที่มีความสามารถต่างๆ ได้ในทุกเวิร์กโฟลว์
แพลตฟอร์มเดียวที่ครอบคลุมตั้งแต่การตั้งค่าโค้ดต่ำไปจนถึงการปรับแต่งและขยายได้ไม่สิ้นสุด Botpress ให้คุณรับพลังจากรุ่นล่าสุดได้โดยอัตโนมัติ GPT เวอร์ชันบนแชทบอทของคุณ – ไม่ต้องใช้ความพยายาม
เริ่มสร้างวันนี้ มันฟรี.
คำถามที่พบบ่อย
1. What does “o1” stand for? Is there a naming logic for future models (e.g., o2, o3)?
The name “o1” most likely stands for “OpenAI 1,” indicating the start of a new model family. Based on this, it's reasonable to expect sequential naming like “o2,” “o3,” etc., for future versions in this series.
2. Why did OpenAI move away from the “GPT” naming convention?
OpenAI shifted from the “GPT” naming convention to “o1” to signal a change in focus – from general pre-trained language models to models optimized for real-time reasoning and interactive capabilities.
3. Is OpenAI o1 the successor to GPT-4 or an entirely new product line?
OpenAI o1 is not a direct successor to GPT-4 but represents the beginning of a new product line designed around real-time reasoning and efficiency, though it builds on the progress made with GPT-4 and GPT-4o.
4. Can o1 handle multi-language inputs better than GPT-4?
OpenAI has not formally stated how o1 compares to GPT-4 in multilingual performance, but since o1 is optimized for reasoning and newer capabilities, it’s possible future iterations may handle multilingual input even more effectively.
5. When will o1 be generally available for free-tier users?
OpenAI has confirmed that a version called “o1-mini” will be released to free-tier users, but as of now, there is no official date announced for general availability.