
ความเร็วสองเท่าและราคาครึ่งหนึ่ง – ทําอะไร GPT-4o หมายถึงแชทบอท AI?
หลังจากการประกาศลึกลับของพวกเขา OpenAI เปิดตัวรุ่นล่าสุดของรุ่นเรือธงของพวกเขา: GPT-4o.
รุ่นล่าสุดไม่เพียงแต่ได้รับการเรืองแสงที่ฉูดฉาดในความสามารถแบบหลายโหมดเท่านั้น แต่ยังเร็วกว่าและถูกกว่าด้วย GPT -4 Turbo ในขณะที่สื่อกระแสหลักต่างพากันหลงใหลในความสามารถด้านวิดีโอและเสียงของรุ่นเรือธงใหม่สำหรับ ChatGPT แต่ต้นทุนและความเร็วใหม่ก็ส่งผลกระทบต่อผู้ใช้เช่นกัน GPT เพื่อเพิ่มประสิทธิภาพให้แอปของพวกเขา

"ความพร้อมใช้งานของ 4o มีพลังในการปรับปรุงทั้งผู้สร้างและประสบการณ์ผู้ใช้อย่างมีนัยสําคัญ" Patrick Hamelin, a software engineer lead ที่ Botpress. "ผลกระทบนั้นกว้างไกลกว่าที่เราคิด"
มาดูกันว่าโมเดลใหม่จะเขย่า AI ได้อย่างไร chatbots.
ความสามารถของโมเดล
รุ่นเรือธงใหม่มาพร้อมกับรายการอัปเดตที่น่าตื่นเต้นและคุณสมบัติใหม่: ความสามารถด้านเสียงและวิดีโอที่ได้รับการปรับปรุงการแปลแบบเรียลไทม์ความสามารถทางภาษาที่เป็นธรรมชาติมากขึ้น สามารถวิเคราะห์ภาพทําความเข้าใจอินพุตเสียงที่หลากหลายมากขึ้นให้ความช่วยเหลือในการสรุปอํานวยความสะดวกในการแปลแบบเรียลไทม์และสร้างแผนภูมิ ผู้ใช้สามารถอัปโหลดไฟล์และสนทนาด้วยเสียงเป็นเสียงได้ มันยังมาพร้อมกับแอพเดสก์ท็อป
ในชุดวิดีโอเปิดตัวของพวกเขา OpenAI พนักงาน (และผู้ร่วมงานเช่น Sal Khan จาก Khan academy) สาธิตเวอร์ชันล่าสุดของ GPT การเตรียมผู้ใช้สําหรับการสัมภาษณ์งานการร้องเพลงการระบุอารมณ์ของมนุษย์ผ่านการแสดงออกทางสีหน้าการแก้สมการทางคณิตศาสตร์ที่เป็นลายลักษณ์อักษรและแม้แต่การโต้ตอบกับผู้อื่น ChatGPT-4o.
การเปิดตัวแสดงให้เห็นถึงความเป็นจริงใหม่ที่โมเดล AI สามารถวิเคราะห์การเขียนในสมุดบันทึกของเด็กและสามารถตอบสนองได้ มันสามารถอธิบายแนวคิดของการบวกเศษส่วนเป็นครั้งแรกเปลี่ยนน้ําเสียงและกลวิธีตามความเข้าใจของบุตรหลานของคุณมันสามารถข้ามเส้นจากแชทบอทเป็นติวเตอร์ส่วนตัว

ทําอะไร GPT-4o หมายถึง LLM แชทบอท?
แชทบอท AI ที่ทำงานบน LLMs มีของขวัญอัปเดตทุกครั้งที่บริษัทเช่น OpenAI อัปเดตโมเดลของพวกเขา หาก ตัวแทน LLM เชื่อมต่อกับแพลตฟอร์มสร้างบอท เช่น Botpress ,พวกเขาได้รับผลประโยชน์ทั้งหมดจากล่าสุด GPT สร้างแบบจำลองในแชทบอทของตนเอง
ด้วยการเปิดตัว GPT-4o แชทบอท AI สามารถเลือกทํางานบนโมเดลขั้นสูง โดยเปลี่ยนความสามารถ ราคา และความเร็วได้แล้ว รุ่นใหม่มีขีดจํากัดอัตราที่สูงขึ้น 5 เท่าจาก GPT-4 Turbo พร้อมความสามารถในการประมวลผลโทเค็นสูงถึง 10 ล้านโทเค็นต่อนาที
สําหรับบอทที่ใช้การรวมเสียงเช่น Twilio บน Botpressโลกใหม่ของการโต้ตอบที่ขับเคลื่อนด้วยเสียงได้ถือกําเนิดขึ้น แทนที่จะถูกจํากัดให้อยู่ในการประมวลผลเสียงของปีกลาย chatbots เข้าใกล้การเลียนแบบปฏิสัมพันธ์ของมนุษย์มากขึ้น
บางทีสิ่งที่สําคัญที่สุดคือต้นทุนที่ต่ํากว่าสําหรับผู้ใช้ที่ชําระเงิน การใช้แชทบอทที่มีความสามารถใกล้เคียงกันในราคาเพียงครึ่งเดียวสามารถเพิ่มการเข้าถึงและความสามารถในการจ่ายได้ทั่วโลกอย่างมาก และ Botpress ผู้ใช้ไม่ต้องเสียค่า AI เพิ่มเติมสําหรับบอท – ดังนั้นการประหยัดเหล่านี้จึงส่งตรงไปยังผู้สร้าง
และในด้านผู้ใช้ของสมการ GPT-4o หมายถึงประสบการณ์การใช้งานที่ดีขึ้นมาก ไม่มีใครชอบรอ เวลาตอบสนองที่สั้นลงหมายถึงความพึงพอใจของผู้ใช้ที่สูงขึ้นสําหรับผู้ใช้แชทบอท AI

ผู้ใช้ชื่นชอบความเร็ว
ผู้เช่าหลักของการนําแชทบอทมาใช้คือการปรับปรุงประสบการณ์ผู้ใช้ และอะไรที่ช่วยปรับปรุงประสบการณ์ของผู้ใช้ได้มากกว่าการลดเวลารอ
"มันจะเป็นประสบการณ์ที่ดีขึ้นอย่างแน่นอน" Hamelin กล่าว "สิ่งสุดท้ายที่คุณต้องการทําคือรอใครสักคน"
มนุษย์เกลียดการรอคอย ย้อนกลับไปในปี 2003 การศึกษา พบว่าผู้คนเต็มใจที่จะรอประมาณ 2 วินาทีเพื่อให้หน้าเว็บโหลด ความอดทนของเราไม่ได้เพิ่มขึ้นอย่างแน่นอนตั้งแต่นั้นมา
และทุกคนเกลียดการรอคอย
มีเคล็ดลับ UX มากมายเพื่อลดเวลารอที่รับรู้ บ่อยครั้งที่เราไม่สามารถปรับปรุงความเร็วของกิจกรรมได้ดังนั้นเราจึงมุ่งเน้นไปที่วิธีทําให้ผู้ใช้รู้สึกว่าเวลาผ่านไปเร็วขึ้น การตอบสนองด้วยภาพ เช่น รูปภาพแถบโหลด มีไว้เพื่อย่นระยะเวลารอที่รับรู้
ใน เรื่องราวที่มีชื่อเสียงของเวลารอลิฟต์อาคารเก่าในนิวยอร์กกําลังร้องเรียน ผู้อยู่อาศัยต้องรอ 1-2 นาทีเพื่อให้ลิฟต์มาถึง อาคารไม่สามารถอัพเกรดลิฟต์เป็นรุ่นใหม่กว่าได้ และผู้อยู่อาศัยก็ขู่ว่าจะผิดสัญญาเช่า
พนักงานใหม่ที่ได้รับการฝึกฝนด้านจิตวิทยาพบว่าปัญหาที่แท้จริงไม่ใช่เวลาที่เสียไปสองนาที แต่เป็นความเบื่อหน่าย เขาแนะนําให้ติดตั้งกระจกเพื่อให้ผู้อยู่อาศัยสามารถมองดูตัวเองหรือผู้อื่นขณะรอได้ การร้องเรียนเกี่ยวกับลิฟต์หยุดลง และตอนนี้ เป็นเรื่องปกติที่จะเห็นกระจกในล็อบบี้ลิฟต์
แทนที่จะใช้ทางลัดเพื่อปรับปรุงประสบการณ์ของผู้ใช้ เช่น คําติชมด้วยภาพ OpenAI ได้ปรับปรุงประสบการณ์ที่ต้นทาง ความเร็วเป็นศูนย์กลางของประสบการณ์ผู้ใช้ และไม่มีเคล็ดลับใดที่ตรงกับความพึงพอใจของการโต้ตอบที่มีประสิทธิภาพ
ออมทรัพย์สําหรับทุกคน
การใช้โมเดล AI ใหม่นี้เพื่อเรียกใช้แอปพลิเคชันก็มีราคาถูกลงอย่างกะทันหัน ราคาถูกกว่ามาก
การใช้แชทบอท AI ในวงกว้างอาจมีราคาแพง ดิ LLM บอทของคุณขับเคลื่อนโดยกําหนดจํานวนเงินที่คุณจะจ่ายสําหรับการโต้ตอบกับผู้ใช้แต่ละครั้งในระดับที่ใหญ่ขึ้น (อย่างน้อยก็ที่ Botpressซึ่งเราจับคู่การใช้จ่าย AI แบบ 1:1 กับ LLM ค่าใช้จ่าย)
และการประหยัดเหล่านี้ไม่ได้มีไว้สําหรับนักพัฒนาที่ใช้ API เท่านั้น ChatGPT-4o เป็นเวอร์ชันล่าสุดฟรีของ LLMคลอ GPT-3.5. ผู้ใช้ฟรีสามารถใช้ ChatGPT แอพโดยไม่มีค่าใช้จ่าย
โทเค็นที่ดีขึ้น
หากคุณโต้ตอบกับโมเดลในภาษาที่ไม่ใช้อักษรโรมัน GPT-4o ช่วยลดต้นทุน API ของคุณให้ดียิ่งขึ้นไปอีก

รุ่นใหม่มาพร้อมกับขีด จํากัด การใช้งานที่ดีขึ้น มันให้การก้าวกระโดดที่สําคัญในประสิทธิภาพโทเค็น ซึ่งส่วนใหญ่กระจุกตัวอยู่ที่ภาษาที่ไม่ใช่ภาษาอังกฤษบางภาษา
โมเดลโทเค็นใหม่ต้องการโทเค็นน้อยลงในการประมวลผลข้อความที่ป้อน มีประสิทธิภาพมากกว่าสําหรับภาษาโลโก้ (เช่น ภาษาที่ใช้สัญลักษณ์และอักขระแทนตัวอักษรแต่ละตัว)
ประโยชน์เหล่านี้ส่วนใหญ่กระจุกตัวอยู่ที่ภาษาที่ไม่ใช้อักษรโรมัน การลดเงินออม ได้รับการประเมิน ดังต่อไปนี้:
- ภาษาอินเดีย เช่น ฮินดี ทมิฬ หรือคุชราต มีโทเค็นลดลง 2.9 – 4.4 เท่า
- ภาษาอาหรับมีโทเค็นลดลง ~2 เท่า
- ภาษาในเอเชียตะวันออก เช่น จีน ญี่ปุ่น และเวียดนามมีโทเค็นลดลง 1.4 – 1.7 เท่า
ปิดช่องว่างทางดิจิทัล AI
ยุคดิจิทัลได้นํามาซึ่งการขยายช่องว่างความมั่งคั่งที่มีอายุเก่าแก่และมีเอกสารอย่างดี นั่นคือความเหลื่อมล้ําทางดิจิทัล เช่นเดียวกับการเข้าถึงความมั่งคั่งและโครงสร้างพื้นฐานที่แข็งแกร่งเป็นเอกสิทธิ์สําหรับประชากรบางกลุ่ม การเข้าถึง AI และโอกาสและผลประโยชน์ที่มาพร้อมกับมันก็เช่นกัน
Robert Opp ประธานเจ้าหน้าที่ฝ่ายดิจิทัลของโครงการพัฒนาแห่งสหประชาชาติ (UNDP) อธิบายว่า การมีอยู่ของแพลตฟอร์ม AI มีความสามารถในการสร้างหรือทําลายตัวชี้วัดการพัฒนาของทั้งประเทศ:

โดยลดค่าใช้จ่ายลงครึ่งหนึ่งของ GPT-4o และแนะนําระดับฟรี OpenAI กําลังดําเนินการขั้นตอนสําคัญในการขจัดหนึ่งในปัญหาที่ใหญ่ที่สุดใน AI และจัดการกับความไม่เท่าเทียมกันในใจของผู้กําหนดนโยบายและนักเศรษฐศาสตร์โดยตรง
การประชาสัมพันธ์เชิงบวกสําหรับ AI ขนาดใหญ่มีความจําเป็นมากกว่าที่ผู้ที่ชื่นชอบคิด เนื่องจาก AI ปรากฏมากขึ้นในชีวิตประจําวันของเราผู้สนับสนุนและผู้คลางแคลงต่างก็ถามว่าเราจะสามารถใช้ AI 'เพื่อประโยชน์' ได้อย่างไร

Louis Bouchard ปริญญาเอกและนักการศึกษา AI กล่าวว่าการกระจายการเข้าถึง AI ในวงกว้างคือวิธีที่เราทําอย่างนั้น: "การทําให้ AI เข้าถึงได้เป็นวิธีหนึ่งในการใช้ AI 'ให้ดี' หากไม่ใช่วิธีที่ดีที่สุด" เหตุผลของเขา? หากเราไม่สามารถควบคุมผลกระทบเชิงบวกและเชิงลบของเทคโนโลยี AI ได้อย่างเต็มที่ อย่างน้อยก็ในช่วงแรกๆ เราสามารถรับประกันการเข้าถึงผลประโยชน์ที่อาจเกิดขึ้นได้อย่างเท่าเทียมกัน
ขยายศักยภาพต่อเนื่องหลายรูปแบบ
วิธีที่ได้รับความนิยมในการโต้ตอบกับแชทบอทของธุรกิจคือผ่านข้อความ แต่ความสามารถต่อเนื่องหลายรูปแบบที่ได้รับการปรับปรุงของ OpenAIโมเดล AI ใหม่ของ AI แนะนําว่าสิ่งนี้อาจเปลี่ยนแปลงได้ในอนาคต
ในปีหน้า เราน่าจะได้เห็นนักพัฒนาจํานวนมากเปิดตัวแอปพลิเคชันใหม่ๆ ที่ใช้ประโยชน์สูงสุดจากความสามารถด้านเสียง การมองเห็น และวิดีโอที่เข้าถึงได้ใหม่
เช่น GPTแชทบอทที่ขับเคลื่อนด้วย -Powered สามารถ:
- ขอรูปภาพสินค้าที่พวกเขาส่งคืนจากลูกค้าเพื่อระบุผลิตภัณฑ์และตรวจสอบให้แน่ใจว่าสินค้าไม่ได้รับความเสียหาย
- ให้การแปลเสียงในการสนทนาแบบเรียลไทม์ที่คิดเป็นภาษาถิ่นเฉพาะภูมิภาค
- บอกว่าสเต็กของคุณปรุงจากภาพในกระทะหรือไม่
- ทําหน้าที่เป็นมัคคุเทศก์ส่วนตัวโดยไม่มีค่าใช้จ่าย ให้บริบททางประวัติศาสตร์ตามภาพของมหาวิหารเก่า ให้การแปลแบบเรียลไทม์ และให้ทัวร์ชมด้วยเสียงที่กําหนดเองซึ่งช่วยให้สามารถสื่อสารและถามคําถามไปมาได้
- ขับเคลื่อนแอปพลิเคชันการเรียนรู้ภาษาที่ฟังอินพุตเสียง สามารถให้ข้อเสนอแนะเกี่ยวกับการออกเสียงตามวิดีโอการเคลื่อนไหวของปากของคุณ หรือสอนภาษามือผ่านรูปภาพและวิดีโอ
- ให้การสนับสนุนด้านสุขภาพจิตที่ไม่เร่งด่วนโดยการรวมความสามารถในการตีความเสียงและวิดีโอทําให้สามารถบําบัดการพูดคุยได้ในราคาประหยัด
ด้วยโมเดล AI ที่สามารถตีความภาพและเสียงได้ LLMs สามารถให้บริการเราได้ขยายตัวอย่างรวดเร็ว
Multimodality หมายถึงการเข้าถึง
เราได้เห็นคุณสมบัติต่อเนื่องหลายรูปแบบที่ได้รับการปรับปรุงเพื่อสังคมแล้ว ตัวอย่างที่สมบูรณ์แบบคือ OpenAIความร่วมมือกับ Be My Eyes
Be My Eyes เป็นสตาร์ทอัพสัญชาติเดนมาร์กที่เชื่อมโยงผู้ใช้ที่มีความบกพร่องทางการมองเห็นกับอาสาสมัครที่มองเห็น เมื่อผู้ใช้ต้องการความช่วยเหลือ เช่น การเลือกสินค้ากระป๋องที่เหมาะสมที่ซูเปอร์มาร์เก็ตหรือการระบุสีของเสื้อยืด แอปจะเชื่อมต่อพวกเขากับอาสาสมัครที่เห็นทั่วโลกผ่านวิดีโอผ่านสมาร์ทโฟน

OpenAIความสามารถในการมองเห็นแบบใหม่ของ Be My Eyes สามารถมอบประสบการณ์ที่เป็นประโยชน์ยิ่งขึ้นสําหรับผู้ใช้ Be My Eyes แทนที่จะพึ่งพาอาสาสมัครที่เป็นมนุษย์ในการถอดรหัสภาพหรือวิดีโอแบบเรียลไทม์ผู้ใช้ที่ตาบอดสามารถถ่ายทอดภาพหรือวิดีโอไปยังอุปกรณ์ของตนซึ่งโมเดลสามารถตอบสนองด้วยข้อมูลเสียง
OpenAI และ Be My Eyes ซึ่งปัจจุบันเป็นพันธมิตรที่เชื่อถือได้กําลังปูทางไปสู่ความเป็นอิสระมากขึ้นสําหรับคนตาบอดตามกฎหมายทั่วโลก Michael Buckley ซีอีโอของ Be My Eyes อธิบายถึงผลกระทบ:

บริการใหม่จะเปิดตัวเร็ว ๆ นี้ในฤดูร้อนปี 2024 เป็นครั้งแรก ผู้ใช้ที่เล่นระหว่างพัฒนาได้ทดสอบเบต้าฟีเจอร์การมองเห็น วิดีโอ และเสียงใหม่เพื่อรับคําวิจารณ์อย่างล้นหลาม แม้ว่าผลกระทบของ AI อาจทําให้เกิดความกังวลสําหรับผู้คลางแคลงใจ แต่ความร่วมมือนี้เป็นสัญญาณที่ชัดเจนถึงผลกระทบเชิงบวกที่อาจเกิดขึ้น การทําความเข้าใจความดีทางสังคมที่มาพร้อมกับ AI ขั้นสูงเป็นขั้นตอนสําคัญสําหรับการประชาสัมพันธ์
เราจะตัดสินอนาคตอย่างไร LLM รุ่น
ในขณะที่คู่แข่งยังคงแข่งขันกันจนถึงจุดต่ําสุด – เพื่อสร้างราคาถูกที่สุด เร็วที่สุด LLM – มันทําให้เกิดคําถาม: เราจะตัดสินโมเดล AI ในวันพรุ่งนี้อย่างไร?
เมื่อถึงจุดหนึ่งในอนาคต LLM ผู้สร้าง (น่าจะ OpenAI และ Google) จะสูงในความเร็วที่โมเดลของพวกเขาสามารถทํางานได้และราคาถูกเพียงใดที่พวกเขาสามารถให้การเข้าถึง เมื่อเรามีเสถียรภาพในด้านต้นทุนและความเร็วแล้วเราจะครองตําแหน่งผู้นําตลาดได้อย่างไร?
อะไรจะกลายเป็นสัญญาณใหม่ของเวลา? ไม่ว่าจะเป็นบุคลิกที่มีอยู่ของโมเดลปัญญาประดิษฐ์ของคุณความสามารถในการเพิ่มประสิทธิภาพวิดีโอคุณสมบัติที่มีให้สําหรับผู้ใช้ฟรีหรือเมตริกใหม่ล่าสุดที่อยู่นอกเหนือความเข้าใจในปัจจุบันของเรารุ่นต่อไป LLMs อยู่ใกล้แค่เอื้อม
เอไอ Chatbots ทําได้ง่าย
จะเกิดอะไรขึ้นถ้าแชทบอท AI ของคุณซิงโครไนซ์กับทุก ๆ โดยอัตโนมัติ GPT อัพเดต
Botpress ได้ให้บริการโซลูชันแชทบอท AI ที่ปรับแต่งได้ตั้งแต่ปี 2017 โดยมอบเครื่องมือที่จําเป็นสําหรับนักพัฒนาเพื่อสร้างแชทบอทได้อย่างง่ายดายด้วยพลังของล่าสุด LLMs. Botpress แชทบอทสามารถฝึกอบรมเกี่ยวกับแหล่งความรู้ที่กําหนดเอง เช่น เว็บไซต์หรือแคตตาล็อกผลิตภัณฑ์ของคุณ และผสานรวมกับระบบธุรกิจได้อย่างราบรื่น
แพลตฟอร์มเดียวที่มีตั้งแต่ไม่ต้องตั้งค่าโค้ดไปจนถึงความสามารถในการปรับแต่งและขยายได้ไม่รู้จบ Botpress ช่วยให้คุณได้รับพลังล่าสุดโดยอัตโนมัติ GPT เวอร์ชันบนแชทบอทของคุณ – ไม่ต้องใช้ความพยายาม
เริ่มสร้างวันนี้ มันฟรี.