Dua kali kelajuan dan separuh harga - apa yang berlaku GPT-4o bermaksud chatbots AI?
Berikutan pengumuman misteri mereka, OpenAI melancarkan versi terkini model perdana mereka: GPT-4o.
Model terbaru tidak hanya menerima cahaya kilat dalam keupayaan multimodal. Ia lebih pantas dan lebih murah daripada GPT-4 Turbo. Walaupun liputan media arus perdana dilengkapi dengan keupayaan video dan suara model perdana baharu, kos dan kelajuan baharu sama seperti memberi kesan kepada mereka yang menggunakan GPT untuk menghidupkan apl mereka.
"Ketersediaan 4o mempunyai kuasa untuk meningkatkan dengan ketara kedua-dua pembina dan pengalaman pengguna," katanya. Patrick Hamelin, seorang jurutera perisian memimpin di Botpress. "Kesannya lebih jauh daripada yang kita fikirkan."
Oleh itu, mari kita selami bagaimana model baru akan menggegarkan chatbots AI.
Keupayaan Model
Model perdana baharu dilengkapi dengan senarai kemas kini dan ciri baharu yang menarik: keupayaan suara dan video yang dipertingkatkan, terjemahan masa nyata, kebolehan bahasa yang lebih semula jadi. Ia boleh menganalisis imej, memahami pelbagai input audio yang lebih luas, memberikan bantuan meringkaskan, memudahkan terjemahan masa nyata dan membuat carta. Pengguna boleh memuat naik fail dan mempunyai perbualan suara ke suara. Ia juga dilengkapi dengan aplikasi desktop.
Dalam siri video pelancaran mereka, OpenAI pekerja (dan rakan sekutu seperti Sal Khan dari akademi Khan) menunjukkan versi terkini GPT mendahului pengguna untuk temu duga kerja, menyanyi, mengenal pasti emosi manusia melalui ekspresi muka, menyelesaikan persamaan matematik bertulis, dan juga berinteraksi dengan yang lain ChatGPT-4o.
Pelancaran ini menggambarkan realiti baru di mana model AI mampu menganalisis penulisan dalam buku nota anak anda dan dapat bertindak balas. Ia dapat menerangkan konsep menambah pecahan buat kali pertama, mengubah nada dan taktik berdasarkan pemahaman anak anda - ia boleh menyeberangi garis dari chatbot ke tutor peribadi.
Apa yang berlaku GPT-4o min untuk LLM Chatbots?
Chatbots AI yang berjalan LLMs dihadiahkan kemas kini setiap kali syarikat suka OpenAI Kemas kini model mereka. Jika chatbot disambungkan ke platform pembinaan bot seperti Botpress, mereka menerima semua faedah terkini GPT model dalam chatbots mereka sendiri.
Dengan pembebasan GPT-4o, chatbots AI kini boleh memilih untuk menjalankan model canggih, mengubah keupayaan, harga, dan kelajuan mereka. Model baru mempunyai had kadar 5x lebih tinggi daripada GPT-4 Turbo, dengan keupayaan untuk memproses sehingga 10 juta token seminit.
Untuk bot yang menggunakan penyepaduan audio seperti Twilio pada Botpress, dunia baru interaksi berkuasa suara telah muncul. Daripada terhad kepada pemprosesan audio semalam, chatbots adalah satu langkah yang lebih dekat untuk meniru interaksi manusia.
Mungkin yang paling penting ialah kos yang lebih rendah untuk pengguna berbayar. Menjalankan chatbot yang sama berkeupayaan untuk separuh kos secara drastik dapat meningkatkan akses dan kemampuan di seluruh dunia. Dan Botpress pengguna tidak membayar perbelanjaan AI tambahan untuk bot mereka - jadi penjimatan ini pergi terus kepada pembina.
Dan di sisi pengguna persamaan, GPT-4o bermaksud pengalaman pengguna yang jauh lebih baik. Tiada siapa yang suka menunggu. Masa tindak balas yang lebih pendek bermakna kepuasan pengguna AI chatbot yang lebih tinggi.
Pengguna suka Kelajuan
Penyewa utama penggunaan chatbot adalah meningkatkan pengalaman pengguna. Dan apa yang meningkatkan pengalaman pengguna lebih daripada mengurangkan masa menunggu?
"Ia akan menjadi pengalaman yang lebih baik pasti," kata Hamelin. "Perkara terakhir yang anda mahu lakukan ialah menunggu seseorang."
Manusia benci menunggu. Malah pada tahun 2003, satu kajian mendapati bahawa orang hanya sanggup menunggu kira-kira 2 saat untuk memuatkan laman web. Kesabaran kita pastinya tidak meningkat sejak itu.
Dan semua orang benci menunggu
Terdapat banyak petua UX di luar sana untuk mengurangkan masa menunggu yang dirasakan. Selalunya kami tidak dapat meningkatkan kelajuan acara, jadi kami memberi tumpuan kepada cara membuat pengguna berasa seperti masa berlalu lebih cepat. Maklum balas visual, seperti imej bar pemuatan, wujud untuk memendekkan masa menunggu yang dirasakan.
Dalam kisah masa menunggu lif yang terkenal, sebuah bangunan lama New York sedang membuat aduan. Penduduk terpaksa menunggu 1-2 minit untuk lif tiba. Bangunan itu tidak dapat menaik taraf lif kepada model yang lebih baru dan penduduk mengancam untuk memecahkan pajakan mereka.
Pekerja baru, terlatih dalam psikologi, mengetahui bahawa masalah sebenar bukanlah dua minit masa yang hilang - ia adalah kebosanan. Beliau mencadangkan memasang cermin supaya penduduk boleh melihat diri mereka sendiri atau orang lain sambil menunggu. Aduan mengenai lif berhenti, dan sekarang, adalah perkara biasa untuk melihat cermin dalam lobi lif.
Daripada mengambil jalan pintas untuk meningkatkan pengalaman pengguna - seperti maklum balas visual - OpenAI telah bertambah baik pada pengalaman di sumbernya. Kelajuan adalah penting kepada pengalaman pengguna, dan tidak ada muslihat yang sepadan dengan kepuasan interaksi yang cekap.
Simpanan untuk Semua Orang
Menggunakan model AI baru ini untuk menjalankan aplikasi tiba-tiba menjadi lebih murah. Jauh lebih murah.
Menjalankan chatbot AI pada skala boleh menjadi mahal. The LLM Bot anda dikuasakan dengan menentukan jumlah yang akan anda bayar untuk setiap interaksi pengguna pada skala yang lebih besar (sekurang-kurangnya sekurang-kurangnya pada Botpress, di mana kita sepadan dengan AI menghabiskan 1:1 dengan LLM kos).
Dan penjimatan ini bukan hanya untuk pembangun yang menggunakan API. ChatGPT-4o ialah versi percuma terkini LLMBersama GPT-3.5. Pengguna percuma dapat menggunakannya ChatGPT aplikasi tanpa sebarang kos.
Tokenisasi yang lebih baik
Jika anda berinteraksi dengan model dalam bahasa yang tidak menggunakan abjad Rom, GPT-4o juga mengurangkan kos API anda.
Model baharu ini dilengkapi dengan had penggunaan yang dipertingkatkan. Ia memberikan lonjakan ketara dalam kecekapan tokenisasi, sebahagian besarnya tertumpu kepada bahasa bukan Bahasa Inggeris tertentu.
Model tokenisasi baru memerlukan lebih sedikit token untuk memproses teks input. Ia jauh lebih cekap untuk bahasa logografi (iaitu bahasa yang menggunakan simbol dan aksara dan bukannya huruf individu).
Manfaat ini sebahagian besarnya tertumpu kepada bahasa yang tidak menggunakan abjad Rom. Pengurangan simpanan telah dianggarkan seperti berikut:
- Bahasa India, seperti Hindi, Tamil, atau Gujarati, mempunyai pengurangan token sebanyak 2.9 - 4.4x
- Bahasa Arab mempunyai ~ 2x pengurangan token
- Bahasa Asia Timur, seperti bahasa Cina, Jepun, dan Vietnam mempunyai pengurangan token sebanyak 1.4 - 1.7x
Menutup jurang digital AI
Era digital telah membawa bersamanya lanjutan jurang kekayaan yang lama dan didokumentasikan dengan baik - jurang digital. Sama seperti akses kepada kekayaan dan infrastruktur yang kuat adalah eksklusif untuk populasi tertentu, begitu juga akses kepada AI dan peluang dan faedah yang mengiringinya.
Robert Opp, Ketua Pegawai Digital di Program Pembangunan Pertubuhan Bangsa-Bangsa Bersatu (UNDP), menjelaskan bahawa kehadiran platform AI mempunyai keupayaan untuk membuat atau memecahkan metrik pembangunan negara keseluruhan:
Dengan mengurangkan separuh kos GPT-4o dan memperkenalkan peringkat percuma, OpenAI mengambil langkah penting ke arah meneutralkan salah satu masalah terbesar dalam AI - dan secara langsung menangani ketidaksamaan pada minda pembuat dasar dan ahli ekonomi.
Langkah PR positif untuk AI besar lebih diperlukan daripada yang mungkin difikirkan oleh peminat. Oleh kerana AI telah muncul lebih banyak hadir dalam kehidupan seharian kita, penyokong dan skeptik sama-sama telah bertanya bagaimana kita mungkin dapat menggunakan AI 'untuk kebaikan'.
Menurut PhD AI dan pendidik Louis Bouchard, mengedarkan akses yang lebih luas kepada AI adalah bagaimana kita melakukan dengan tepat bahawa: "Membuat AI boleh diakses adalah satu cara, jika bukan yang terbaik, untuk menggunakan AI 'untuk kebaikan.'" Alasan beliau? Sekiranya kita tidak dapat mengawal sepenuhnya kesan positif dan negatif teknologi AI - sekurang-kurangnya pada hari-hari awalnya - kita sebaliknya dapat memastikan akses yang sama kepada potensi manfaatnya.
Potensi Multimodal yang Diperluas
Cara popular untuk berinteraksi dengan chatbot perniagaan adalah melalui teks, tetapi keupayaan multimodal yang dipertingkatkan OpenAI"Model AI baharu menunjukkan bahawa ini mungkin berubah pada masa hadapan.
Pada tahun akan datang, kami mungkin akan melihat arus pembangun melancarkan aplikasi baharu yang memanfaatkan sepenuhnya keupayaan audio, visi dan video yang baru diakses.
Sebagai contoh GPTChatbots berkuasa boleh mempunyai keupayaan untuk:
- Minta pelanggan untuk imej item yang mereka kembali untuk mengenal pasti produk dan memastikan ia tidak rosak
- Sediakan terjemahan audio dalam perbualan masa nyata yang merangkumi dialek khusus rantau
- Beritahu sama ada stik anda dimasak daripada imejnya dalam kuali
- Berfungsi sebagai pemandu pelancong peribadi tanpa kos, menyediakan konteks sejarah berdasarkan imej katedral lama, memberikan terjemahan dalam masa nyata, dan memberikan lawatan suara tersuai yang membolehkan komunikasi dan soalan berulang-alik
- Kuasakan aplikasi pembelajaran bahasa yang mendengar input audio, boleh memberikan maklum balas mengenai sebutan berdasarkan video pergerakan mulut anda, atau mengajar bahasa isyarat melalui imej dan video
- Menyediakan sokongan kesejahteraan mental yang tidak mendesak dengan menggabungkan keupayaannya untuk mentafsir audio dan video, membolehkan terapi bercakap kos rendah
Dengan model AI yang boleh mentafsir imej dan audio, pemahaman kami tentang bagaimana LLMs boleh berkhidmat kepada kita berkembang pesat.
Multimodaliti bermaksud kebolehcapaian
Kami telah melihat ciri-ciri multimodal yang dipertingkatkan untuk kebaikan sosial. Contoh yang sempurna ialah OpenAI'perkongsian dengan Be My Eyes.
Be My Eyes ialah syarikat permulaan Denmark yang menghubungkan pengguna cacat penglihatan dengan melihat sukarelawan. Apabila pengguna memerlukan bantuan - seperti memilih barangan dalam tin yang betul di pasar raya atau mengenal pasti warna kemeja-t - aplikasi menghubungkan mereka dengan melihat sukarelawan di seluruh dunia melalui video melalui telefon pintar.
OpenAIKeupayaan penglihatan baru dapat memberikan pengalaman yang lebih berguna untuk pengguna Be My Eyes. Daripada bergantung kepada sukarelawan manusia untuk menguraikan imej atau video secara visual dalam masa nyata, pengguna buta boleh menyampaikan imej atau video ke peranti mereka yang model boleh bertindak balas dengan maklumat audio.
OpenAI dan Be My Eyes, rakan kongsi yang kini dipercayai, membuka jalan kepada lebih banyak kemerdekaan untuk individu buta secara sah di seluruh dunia. Ketua Pegawai Eksekutif Be My Eyes Michael Buckley menerangkan kesannya:
Perkhidmatan baru akan dilancarkan tidak lama lagi, pada musim panas 2024, buat kali pertama. Pengguna akses awal telah beta menguji ciri visi, video dan audio baharu untuk mendapatkan ulasan. Walaupun kesan AI boleh menimbulkan kebimbangan terhadap keraguan, perkongsian ini adalah tanda jelas kesan positif yang boleh dibawanya. Memahami kebaikan sosial yang datang dengan AI maju adalah langkah penting untuk PRnya.
Bagaimana kita akan menilai masa depan LLM Model?
Apabila pesaing terus berlumba ke bawah - untuk mencipta yang paling murah, terpantas LLM - ia menimbulkan persoalan: bagaimana kita akan menilai model AI esok?
Pada satu ketika di masa depan, utama LLM Pencipta (mungkin OpenAI dan Google) akan menentukan berapa pantas model mereka boleh berjalan dan berapa murah mereka boleh menyediakan akses. Sebaik sahaja kita mencapai kestabilan pada kos dan kelajuan, bagaimana kita akan menobatkan model terkemuka di pasaran?
Apa yang akan menjadi tanda baru zaman? Sama ada personaliti yang tersedia untuk model kecerdasan buatan anda, keupayaan peningkatan video, ciri yang tersedia untuk pengguna percuma, atau metrik baru di luar pemahaman semasa kami, generasi akan datang LLMs berada di depan pintu kami.
AI Chatbots Dibuat Mudah
Bagaimana jika chatbot AI anda disegerakkan secara automatik dengan setiap GPT Kemaskini terakhir?
Botpress telah menyediakan penyelesaian chatbot AI yang boleh disesuaikan sejak 2017, menyediakan pembangun dengan alat yang mereka perlukan untuk membina chatbots dengan mudah dengan kuasa terkini LLMs. Botpress Chatbots boleh dilatih pada sumber pengetahuan tersuai - seperti laman web atau katalog produk anda - dan mengintegrasikan dengan lancar dengan sistem perniagaan.
Satu-satunya platform yang berkisar dari tiada penyediaan kod hingga penyesuaian dan kebolehpanjangan yang tidak berkesudahan, Botpress membolehkan anda mendapatkan kuasa terkini secara automatik GPT versi chatbot anda - tiada usaha diperlukan.
Mula membina hari ini. Ia percuma.
Senarai Kandungan
Ikuti perkembangan terkini tentang ejen AI
Kongsi ini pada: