Dalawang beses ang bilis at kalahati ng presyo - ano ang ginagawa GPT -4o ibig sabihin para sa AI chatbots?
Kasunod ng kanilang mahiwagang anunsyo, OpenAI inilunsad ang pinakabagong bersyon ng kanilang flagship model: GPT -4o.
Ang pinakabagong modelo ay hindi lamang nakatanggap ng isang marangya na glow-up sa mga multimodal na kakayahan. Ito ay mas mabilis at mas mura kaysa sa GPT -4 Turbo. Bagama't ang mainstream media coverage ay nabighani sa mga kakayahan sa video at boses ng bagong flagship model, ang bagong gastos at bilis ay kasing-epekto para sa mga gumagamit GPT upang paganahin ang kanilang mga app.
"Ang pagkakaroon ng 4o ay may kapangyarihan upang makabuluhang mapabuti ang parehong tagabuo at ang karanasan ng gumagamit," sabi Patrick Hamelin , isang software engineer na nangunguna sa Botpress . "Ang epekto ay higit na umaabot kaysa sa aming iniisip."
Kaya't sumisid tayo sa kung paano yayanig ng bagong modelo ang AI chatbots.
Mga Kakayahang Modelo
Ang bagong flagship na modelo ay may kasamang kapana-panabik na listahan ng mga update at bagong feature: pinahusay na kakayahan sa boses at video, real time na pagsasalin, mas natural na kakayahan sa wika. Maaari itong magsuri ng mga larawan, maunawaan ang mas malawak na iba't ibang mga audio input, magbigay ng tulong sa pagbubuod, mapadali ang real time na pagsasalin, at lumikha ng mga chart. Maaaring mag-upload ng mga file ang mga user at magkaroon ng voice-to-voice na pag-uusap. May kasama pa itong desktop app.
Sa kanilang serye ng mga video sa paglulunsad, OpenAI ipinapakita ng mga empleyado (at mga kasama tulad ni Sal Khan ng Khan academy) ang pinakabagong bersyon ng GPT inihahanda ang isang user para sa isang panayam sa trabaho, pagkanta, pagtukoy sa mga emosyon ng tao sa pamamagitan ng mga ekspresyon ng mukha, paglutas ng mga nakasulat na equation sa matematika, at kahit na pakikipag-ugnayan sa iba ChatGPT -4o.
Ang paglulunsad ay naglalarawan ng isang bagong katotohanan kung saan ang isang modelo ng AI ay may kakayahang pag-aralan ang pagsulat sa notebook ng iyong anak at magagawang tumugon. Maaari nitong ipaliwanag ang konsepto ng pagdaragdag ng mga fraction sa unang pagkakataon, pagbabago ng tono at taktika batay sa pang-unawa ng iyong anak - maaari itong tumawid sa linya mula sa chatbot patungo sa personal na tagapagturo.
Ano ang GPT -4o ibig sabihin para sa LLM Chatbots?
AI chatbots na tumatakbo LLMs ay binibigyan ng isang update sa tuwing gusto ng mga kumpanya OpenAI i-update ang kanilang mga modelo. Kung ang isang chatbot ay konektado sa isang bot-building platform tulad ng Botpress , natatanggap nila ang lahat ng mga benepisyo ng pinakabagong GPT modelo sa kanilang sariling mga chatbot.
Sa paglabas ng GPT -4o, ang AI chatbots ay maaari na ngayong mag-opt na tumakbo sa advanced na modelo, binabago ang kanilang mga kakayahan, presyo, at bilis. Ang bagong modelo ay may 5x na mas mataas na mga limitasyon sa rate mula sa GPT -4 Turbo, na may kakayahang magproseso ng hanggang 10 milyong token kada minuto.
Para sa mga bot na gumagamit ng mga audio integration tulad ng Twilio sa Botpress , isang bagong mundo ng pakikipag-ugnayan na pinapagana ng boses ang lumitaw. Sa halip na makulong sa pagproseso ng audio noong nakaraan, ang mga chatbot ay isang hakbang na mas malapit sa paggaya sa pakikipag-ugnayan ng tao.
Marahil ang pinakamahalaga ay ang mas mababang halaga para sa mga binabayarang user. Ang pagpapatakbo ng chatbot na may katulad na kakayahan para sa kalahati ng gastos ay maaaring tumaas nang husto sa pag-access at pagiging affordability sa buong mundo. At Botpress ang mga gumagamit ay hindi nagbabayad ng karagdagang gastos sa AI sa kanilang mga bot – kaya ang mga matitipid na ito ay direktang napupunta sa mga tagabuo.
At sa gilid ng gumagamit ng equation, GPT -4o ay nangangahulugan ng isang mas mahusay na karanasan ng user. Walang mahilig maghintay. Ang mas maikling oras ng pagtugon ay nangangahulugan ng mas mataas na kasiyahan ng user para sa mga user ng AI chatbot.
Gustung-gusto ng mga gumagamit ang Bilis
Ang isang pangunahing nangungupahan ng chatbot adoption ay ang pagpapabuti ng karanasan ng user. At ano ang mas nagpapabuti sa karanasan ng user kaysa sa pagbawas sa mga oras ng paghihintay?
"Ito ay magiging isang mas mahusay na karanasan para sigurado," sabi ni Hamelin. "Ang huling bagay na gusto mong gawin ay maghintay sa isang tao."
Ayaw ng mga tao sa paghihintay. Kahit noong 2003, natuklasan ng isang pag-aaral na handa lamang ang mga tao na maghintay ng humigit-kumulang 2 segundo para mag-load ang isang web page. Ang aming pasensya ay tiyak na hindi tumaas mula noon.
At lahat ay nasusuklam sa paghihintay
Mayroong isang kalabisan ng mga tip sa UX out doon upang bawasan ang pinaghihinalaang oras ng paghihintay. Kadalasan hindi namin magawang pahusayin ang bilis ng mga kaganapan, kaya tumutuon kami sa kung paano iparamdam sa mga user na mas mabilis ang paglipas ng oras. Ang visual na feedback, tulad ng isang naglo-load na larawan ng bar, ay umiiral upang paikliin ang nakikitang oras ng paghihintay.
Sa isang sikat na kuwento ng mga oras ng paghihintay ng elevator , isang lumang gusali sa New York ang naghaharap ng sandamakmak na reklamo. Kinailangang maghintay ng 1-2 minuto ang mga residente para dumating ang elevator. Hindi nagawang i-upgrade ng gusali ang elevator sa isang mas bagong modelo at ang mga residente ay nagbabanta na sirain ang kanilang mga lease.
Nalaman ng isang bagong upahan, na sinanay sa sikolohiya, na ang tunay na problema ay hindi ang dalawang minuto ng nawalang oras – ito ay pagkabagot. Iminungkahi niya ang paglalagay ng mga salamin para matingnan ng mga residente ang kanilang sarili o ang iba habang naghihintay. Tumigil ang mga reklamo tungkol sa elevator, at ngayon, karaniwan nang makakita ng mga salamin sa mga lobby ng elevator.
Sa halip na gumawa ng mga shortcut para mapahusay ang karanasan ng user – tulad ng visual na feedback – OpenAI ay napabuti ang karanasan sa pinagmulan nito. Ang bilis ay sentro sa karanasan ng user, at walang trick na tumutugma sa kasiyahan ng isang mahusay na pakikipag-ugnayan.
Pagtitipid para sa Lahat
Ang paggamit ng bagong AI model na ito para magpatakbo ng mga application ay biglang naging mura. Mas mura.
Ang pagpapatakbo ng AI chatbot sa sukat ay maaaring maging mahal. Ang LLM ang iyong bot ay pinapagana ng tumutukoy kung magkano ang babayaran mo para sa bawat pakikipag-ugnayan ng user sa mas malaking sukat (kahit sa Botpress , kung saan tinutugma namin ang AI spend 1:1 with LLM gastos).
At ang mga pagtitipid na ito ay hindi lamang para sa mga developer na gumagamit ng API. ChatGPT -4o ay ang pinakabagong libreng bersyon ng LLM , sa tabi GPT -3.5. Nagagamit ng mga libreng user ang ChatGPT app nang walang bayad.
Mas mahusay na tokenization
Kung nakikipag-ugnayan ka sa modelo sa isang wikang hindi gumagamit ng alpabetong Romano, GPT -4o ay higit pang nagpapababa sa iyong mga gastos sa API.
Ang bagong modelo ay may pinahusay na mga limitasyon sa paggamit. Nagbibigay ito ng makabuluhang hakbang sa kahusayan ng tokenization, na higit sa lahat ay nakatuon sa ilang mga wikang hindi Ingles.
Ang bagong modelo ng tokenization ay nangangailangan ng mas kaunting mga token upang maproseso ang input text. Ito ay mas mahusay para sa logographic na mga wika (ibig sabihin, ang mga wika na gumagamit ng mga simbolo at character sa halip na mga indibidwal na titik).
Ang mga benepisyong ito ay higit na nakatuon sa mga wikang hindi gumagamit ng alpabetong Romano. Ang mga pagbawas sa ipon ay tinatantya bilang mga sumusunod:
- Ang mga wikang Indian, tulad ng Hindi, Tamil, o Gujarati, ay may 2.9 – 4.4x na pagbawas sa mga token
- Ang Arabic ay may ~2x na pagbawas sa mga token
- Ang mga wika sa Silangang Asya, tulad ng Chinese, Japanese, at Vietnamese ay may 1.4 – 1.7x na pagbawas sa mga token
Pagsara ng AI digital divide
Ang digital era ay nagdala ng isang extension ng edad-old, well-documented wealth gap - ang digital divide. Kung paanong ang pag-access sa kayamanan at malakas na imprastraktura ay eksklusibo sa ilang partikular na populasyon, gayundin ang pag-access sa AI at ang mga pagkakataon at benepisyo na kasama nito.
Ipinaliwanag ni Robert Opp, ang Chief Digital Officer sa United Nations Development Programme (UNDP), na ang pagkakaroon ng mga AI platform ay may kakayahang gumawa o masira ang mga sukatan ng pag-unlad ng buong bansa:
Sa pamamagitan ng paghahati sa halaga ng GPT -4o at nagpapakilala ng libreng tier, OpenAI ay gumagawa ng isang mahalagang hakbang patungo sa pag-neutralize sa isa sa mga pinakamalaking problema sa AI - at direktang pagtugon sa hindi pagkakapantay-pantay sa isipan ng mga gumagawa ng patakaran at ekonomista.
Ang isang positibong hakbang sa PR para sa malaking AI ay mas kailangan kaysa sa maaaring isipin ng mga mahilig. Habang ang AI ay lalong lumaganap sa ating pang-araw-araw na buhay, ang mga tagapagtaguyod at mga nag-aalinlangan ay parehong nagtanong kung paano natin magagamit ang AI 'para sa kabutihan'.
Ayon sa AI PhD at tagapagturo na si Louis Bouchard, ang pamamahagi ng mas malawak na access sa AI ay kung paano namin ginagawa iyon nang eksakto: "Ang paggawa ng AI na naa-access ay isang paraan, kung hindi man ang pinakamahusay, upang magamit ang AI 'para sa kabutihan.'" Ang kanyang pangangatwiran? Kung hindi namin ganap na makontrol ang mga positibo at negatibong epekto ng teknolohiya ng AI – kahit sa mga unang araw nito – maaari naming sa halip masiguro ang pantay na pag-access sa mga potensyal na benepisyo nito.
Pinalawak na Multimodal Potensyal
Ang sikat na paraan upang makipag-ugnayan sa chatbot ng isang negosyo ay sa pamamagitan ng text, ngunit ang pinahusay na multimodal na kakayahan ng OpenAI Iminumungkahi ng bagong modelo ng AI na maaaring magbago ito sa hinaharap.
Sa darating na taon, malamang na makakakita tayo ng mga developer na naglulunsad ng mga bagong application na sinusulit ang mga bagong naa-access na audio, vision, at mga kakayahan sa video.
Halimbawa, GPT -Ang mga chatbot na pinapagana ay maaaring magkaroon ng kakayahang:
- Humingi ng larawan sa mga customer ng item na ibinabalik nila upang matukoy ang produkto at matiyak na hindi ito nasisira
- Magbigay ng audio translation sa real time na pag-uusap na tumutukoy sa mga dialect na partikular sa rehiyon
- Sabihin kung ang iyong steak ay luto mula sa isang imahe nito sa kawali
- Gumagana bilang walang bayad na personal na tour guide, na nagbibigay ng makasaysayang konteksto batay sa isang imahe ng isang lumang katedral, nagbibigay ng pagsasalin sa real time, at nagbibigay ng customized na voice tour na nagbibigay-daan para sa pabalik-balik na komunikasyon at mga tanong
- Paganahin ang isang application sa pag-aaral ng wika na nakikinig sa input ng audio, maaaring magbigay ng feedback sa pagbigkas batay sa isang video ng mga galaw ng iyong bibig, o magturo ng sign language sa pamamagitan ng mga larawan at video
- Magbigay ng hindi-kagyat na suporta sa mental wellness sa pamamagitan ng pagsasama-sama ng kakayahan nitong mag-interpret ng audio at mga video, na nagbibigay-daan para sa murang talk therapy
Sa mga modelo ng AI na maaaring magbigay-kahulugan sa mga larawan at audio, ang aming pag-unawa kung paano LLMs maaaring magsilbi sa amin ay mabilis na lumalawak.
Ang ibig sabihin ng multimodality ay accessibility
Nakita na natin ang mga pinahusay na tampok na multimodal na inilagay sa kabutihang panlipunan. Ang isang perpektong halimbawa ay ang pakikipagtulungan ng OpenAI sa Be My Eyes .
Ang Be My Eyes ay isang Danish na start-up na nag-uugnay sa mga user na may kapansanan sa paningin sa mga nakakakitang boluntaryo. Kapag ang isang user ay nangangailangan ng tulong - tulad ng pagpili ng tamang mga de-latang paninda sa supermarket o pagtukoy ng kulay ng isang t-shirt - ikinokonekta sila ng app sa isang nakakakitang boluntaryo sa buong mundo sa pamamagitan ng video sa pamamagitan ng smartphone.
OpenAI Ang bagong kakayahan sa paningin ni ay maaaring magbigay ng mas kapaki-pakinabang na karanasan para sa mga gumagamit ng Be My Eyes. Sa halip na umasa sa isang boluntaryong tao na visually decipher ang isang imahe o video sa real time, ang mga bulag na user ay maaaring mag-relay ng isang larawan o video sa kanilang device na maaaring tumugon ang modelo gamit ang audio na impormasyon.
OpenAI at Be My Eyes, na ngayon ay pinagkakatiwalaang mga kasosyo, ay nagbibigay daan sa higit na kalayaan para sa mga legal na bulag na indibidwal sa buong mundo. Ipinaliwanag ng Be My Eyes CEO Michael Buckley ang epekto nito:
Malapit nang ilunsad ang bagong serbisyo, sa tag-araw ng 2024, sa unang pagkakataon. Ang mga user ng maagang pag-access ay sinusubok ng beta ang bagong vision, video, at audio na mga feature para sa mga review. Bagama't ang mga epekto ng AI ay maaaring magdulot ng pag-aalala para sa mga nag-aalinlangan, ang partnership na ito ay isang malinaw na tanda ng mga positibong epekto na maidudulot nito. Ang pag-unawa sa kabutihang panlipunan na kasama ng advanced AI ay isang mahalagang hakbang para sa PR nito.
Paano natin hahatulan ang hinaharap LLM mga modelo?
Habang ang mga kakumpitensya ay nagpapatuloy sa isang karera hanggang sa ibaba - upang lumikha ng pinakamurang, pinakamabilis LLM – nagtatanong ito: paano natin huhusgahan ang mga modelo ng AI bukas?
Sa ilang mga punto sa hinaharap, ang major LLM mga tagalikha (malamang OpenAI at Google) ay talampas sa kung gaano kabilis tumakbo ang kanilang mga modelo at kung gaano kamura ang maaari nilang magbigay ng access. Kapag naabot na natin ang katatagan sa gastos at bilis, paano natin makokoronahan ang modelong nangunguna sa merkado?
Ano ang magiging bagong tanda ng panahon? Magagamit man ito ng mga personalidad ng iyong modelo ng artificial intelligence, ang mga kakayahan sa pagpapahusay ng video, ang mga feature na available sa mga libreng user, o ang mga bagong sukatan na lampas sa aming kasalukuyang pang-unawa, ang susunod na henerasyon ng LLMs ay nasa pintuan namin.
Naging Madali ang AI Chatbots
Paano kung awtomatikong mag-synchronize ang iyong AI chatbot sa bawat GPT update?
Botpress ay nagbigay ng mga nako-customize na AI chatbot solution mula noong 2017, na nagbibigay sa mga developer ng mga tool na kailangan nila para madaling makabuo ng mga chatbot gamit ang pinakabago. LLMs . Botpress Ang mga chatbot ay maaaring sanayin sa mga custom na mapagkukunan ng kaalaman – tulad ng iyong website o katalogo ng produkto – at walang putol na isama sa mga sistema ng negosyo.
Ang tanging platform na mula sa walang code set-up hanggang sa walang katapusang pagpapasadya at pagpapalawig, Botpress nagbibigay-daan sa iyong awtomatikong makuha ang kapangyarihan ng pinakabago GPT bersyon sa iyong chatbot – walang kinakailangang pagsisikap.
Simulan ang pagtatayo ngayon. Ito'y LIBRE.
Talaan ng mga Nilalaman
Manatiling napapanahon sa pinakabago sa mga ahente ng AI
Ibahagi ito sa: