
Dua kali lebih cepat dan setengah harga - apa arti GPT-4o untuk chatbot AI?
Menyusul pengumuman misterius mereka, OpenAI meluncurkan versi terbaru dari model andalan mereka: GPT-4o.
Model terbaru ini tidak hanya menerima peningkatan yang mencolok dalam kemampuan multimodal. Lebih cepat dan lebih murah daripada GPT Turbo. Sementara liputan media arus utama terpikat dengan kemampuan video dan suara model unggulan baru untuk ChatGPTbiaya dan kecepatan baru ini juga sama berdampaknya bagi mereka yang menggunakan GPT untuk mendukung aplikasi mereka.

"Ketersediaan 4o memiliki kekuatan untuk secara signifikan meningkatkan pengalaman pembangun dan pengguna," kata Patrick Hamelin, seorang insinyur perangkat lunak yang memimpin di Botpress. "Dampaknya lebih luas dari yang kita pikirkan."
Jadi, mari kita pelajari bagaimana model baru ini akan mengguncang AI chatbots.
Kemampuan Model
Model unggulan baru ini hadir dengan daftar pembaruan yang menarik dan fitur-fitur baru: kemampuan suara dan video yang disempurnakan, terjemahan waktu nyata, kemampuan bahasa yang lebih alami. Dapat menganalisis gambar, memahami input audio yang lebih beragam, memberikan bantuan meringkas, memfasilitasi terjemahan waktu nyata, dan membuat bagan. Pengguna dapat mengunggah file dan melakukan percakapan suara-ke-suara. Bahkan dilengkapi dengan aplikasi desktop.
Dalam rangkaian video peluncurannya, karyawan OpenAI (dan rekanan seperti Sal Khan dari Khan academy) mendemonstrasikan versi terbaru GPT yang mempersiapkan pengguna untuk wawancara kerja, bernyanyi, mengidentifikasi emosi manusia melalui ekspresi wajah, memecahkan persamaan matematika tertulis, dan bahkan berinteraksi dengan ChatGPT-4o lainnya.
Peluncuran ini menggambarkan realitas baru di mana model AI mampu menganalisis tulisan di buku catatan anak Anda dan mampu merespons. AI ini dapat menjelaskan konsep penjumlahan pecahan untuk pertama kalinya, mengubah nada dan taktik berdasarkan pemahaman anak Anda - AI ini dapat melintasi batas dari chatbot menjadi tutor pribadi.

Apa arti GPT-4o untuk LLM Chatbots?
Chatbot AI yang berjalan di LLMs diberikan pembaruan setiap kali perusahaan seperti OpenAI memperbarui model mereka. Jika agenLLM terhubung ke platform pembuatan bot seperti Botpress, mereka menerima semua manfaat dari model GPT terbaru di chatbot mereka sendiri.
Dengan dirilisnya GPT-4o, chatbot AI sekarang dapat memilih untuk menggunakan model yang lebih tinggi, mengubah kemampuan, harga, dan kecepatannya. Model baru ini memiliki batas kecepatan 5x lebih tinggi dari GPT-4 Turbo, dengan kemampuan untuk memproses hingga 10 juta token per menit.
Untuk bot yang menggunakan integrasi audio seperti Twilio di Botpress, dunia baru interaksi bertenaga suara telah muncul. Alih-alih terbatas pada pemrosesan audio di masa lalu, chatbots selangkah lebih dekat untuk meniru interaksi manusia.
Mungkin yang paling penting adalah biaya yang lebih rendah untuk pengguna berbayar. Menjalankan chatbot dengan kemampuan yang sama dengan setengah biaya dapat secara drastis meningkatkan akses dan keterjangkauan di seluruh dunia. Dan pengguna Botpress tidak membayar biaya tambahan untuk pengeluaran AI untuk bot mereka - jadi penghematan ini langsung masuk ke pembuat.
Dan dari sisi pengguna, GPT-4o berarti pengalaman pengguna yang jauh lebih baik. Tidak ada yang suka menunggu. Waktu respons yang lebih singkat berarti kepuasan pengguna yang lebih tinggi bagi pengguna chatbot AI.

Pengguna Menyukai Kecepatan
Salah satu manfaat utama dari adopsi chatbot adalah meningkatkan pengalaman pengguna. Dan apa yang lebih meningkatkan pengalaman pengguna daripada mengurangi waktu tunggu?
"Pasti akan menjadi pengalaman yang lebih baik," kata Hamelin. "Hal terakhir yang ingin Anda lakukan adalah menunggu seseorang."
Manusia tidak suka menunggu. Bahkan pada tahun 2003, sebuah penelitian menemukan bahwa orang hanya mau menunggu sekitar 2 detik untuk memuat halaman web. Kesabaran kita tentu saja tidak meningkat sejak saat itu.
Tabungan untuk Semua Orang
Menggunakan model AI baru ini untuk menjalankan aplikasi menjadi lebih murah. Jauh lebih murah.
Menjalankan chatbot AI dalam skala besar bisa jadi mahal. LLM bot Anda didukung oleh menentukan berapa banyak Anda akan membayar untuk setiap interaksi pengguna dalam skala yang lebih besar (setidaknya di Botpress, di mana kami mencocokkan pengeluaran AI 1: 1 dengan biaya LLM ).
Dan penghematan ini tidak hanya untuk pengembang yang menggunakan API. ChatGPT-4o adalah versi gratis terbaru dari LLM, di samping GPT-3.5. Pengguna gratis dapat menggunakan aplikasi ChatGPT tanpa biaya.
Tokenisasi yang lebih baik
Jika Anda berinteraksi dengan model dalam bahasa yang tidak menggunakan alfabet Romawi, GPT-4o akan mengurangi biaya API Anda.

Model baru ini hadir dengan batas penggunaan yang lebih baik. Model ini memberikan lompatan yang signifikan dalam efisiensi tokenisasi, yang sebagian besar terkonsentrasi pada bahasa non-Inggris tertentu.
Model tokenisasi yang baru membutuhkan lebih sedikit token untuk memproses teks masukan. Model ini jauh lebih efisien untuk bahasa logografi (yaitu bahasa yang menggunakan simbol dan karakter, bukan huruf).
Manfaat ini sebagian besar terkonsentrasi pada bahasa yang tidak menggunakan alfabet Romawi. Pengurangan penghematan diperkirakan sebagai berikut:
- Bahasa India, seperti Hindi, Tamil, atau Gujarat, memiliki pengurangan token sebesar 2,9 - 4,4x
- Bahasa Arab memiliki pengurangan token ~ 2x lipat
- Bahasa-bahasa Asia Timur, seperti bahasa Mandarin, Jepang, dan Vietnam memiliki pengurangan token sebesar 1,4 - 1,7x
Potensi Multimoda yang Diperluas
Cara populer untuk berinteraksi dengan chatbot bisnis adalah melalui teks, tetapi kemampuan multimodal yang ditingkatkan dari model AI baru OpenAImenunjukkan bahwa hal ini mungkin akan berubah di masa mendatang.
Di tahun mendatang, kita mungkin akan melihat gelombang pengembang yang meluncurkan aplikasi baru yang memanfaatkan kemampuan audio, visi, dan video yang baru dapat diakses.
Sebagai contoh, chatbot yang didukung oleh GPT dapat memiliki kemampuan untuk itu:
- Mintalah gambar barang yang mereka kembalikan kepada pelanggan untuk mengidentifikasi produk dan memastikan produk tersebut tidak rusak
- Menyediakan terjemahan audio dalam percakapan waktu nyata yang memperhitungkan dialek wilayah tertentu
- Mengetahui apakah steak Anda sudah matang dari gambarnya di dalam wajan
- Berfungsi sebagai pemandu wisata pribadi tanpa biaya, memberikan konteks sejarah berdasarkan gambar katedral tua, memberikan terjemahan secara real time, dan memberikan tur suara yang disesuaikan yang memungkinkan untuk komunikasi dan pertanyaan bolak-balik
- Memberdayakan aplikasi pembelajaran bahasa yang mendengarkan input audio, dapat memberikan umpan balik tentang pengucapan berdasarkan video gerakan mulut Anda, atau mengajarkan bahasa isyarat melalui gambar dan video
- Memberikan dukungan kesehatan mental yang tidak mendesak dengan menggabungkan kemampuannya untuk menginterpretasikan audio dan video, sehingga memungkinkan terapi bicara berbiaya rendah
Dengan model AI yang dapat menginterpretasikan gambar dan audio, pemahaman kita tentang bagaimana LLMs dapat melayani kita berkembang pesat.
Multimodalitas berarti aksesibilitas
Kami telah melihat fitur multimodal yang disempurnakan digunakan untuk kebaikan sosial. Contoh yang sempurna adalah kemitraanOpenAIdengan Be My Eyes.
Be My Eyes adalah perusahaan rintisan asal Denmark yang menghubungkan pengguna yang memiliki gangguan penglihatan dengan sukarelawan tunanetra. Ketika pengguna membutuhkan bantuan - seperti memilih produk kaleng yang tepat di supermarket atau mengidentifikasi warna kaos - aplikasi ini menghubungkan mereka dengan sukarelawan tunanetra di seluruh dunia melalui video melalui ponsel pintar.

OpenAIKemampuan penglihatan baru ini dapat memberikan pengalaman yang lebih bermanfaat bagi pengguna Be My Eyes. Alih-alih mengandalkan sukarelawan manusia untuk menguraikan gambar atau video secara visual dalam waktu nyata, pengguna tunanetra dapat menyampaikan gambar atau video ke perangkat mereka yang dapat ditanggapi oleh model dengan informasi audio.
OpenAI dan Be My Eyes, yang kini menjadi mitra tepercaya, membuka jalan menuju kemandirian bagi para penyandang tunanetra di seluruh dunia. CEO Be My Eyes, Michael Buckley, menjelaskan dampaknya:

Layanan baru ini akan segera diluncurkan pada musim panas 2024, untuk pertama kalinya. Pengguna akses awal telah melakukan uji coba beta untuk fitur penglihatan, video, dan audio baru dan mendapatkan sambutan hangat. Meskipun dampak AI dapat menimbulkan kekhawatiran bagi mereka yang skeptis, kemitraan ini merupakan tanda yang jelas akan dampak positif yang dapat dibawanya. Memahami kebaikan sosial yang hadir dengan AI yang canggih adalah langkah penting bagi PR-nya.
Bagaimana kami akan menilai model LLM di masa depan?
Ketika para pesaing terus berlomba untuk menjadi yang termurah dan tercepat - untuk menciptakan LLM yang termurah dan tercepat - hal ini menimbulkan pertanyaan: bagaimana kita akan menilai model AI di masa depan?
Pada suatu saat di masa depan, pembuat LLM utama (kemungkinan OpenAI dan Google) akan mencapai titik puncak dalam hal seberapa cepat model mereka dapat berjalan dan seberapa murah mereka dapat menyediakan akses. Setelah kita mencapai kestabilan dalam hal biaya dan kecepatan, bagaimana kita akan memahkotai model yang memimpin pasar?
Apa yang akan menjadi tanda zaman yang baru? Entah itu kepribadian yang tersedia dari model kecerdasan buatan Anda, kemampuan peningkatan video, fitur yang tersedia untuk pengguna gratis, atau metrik baru di luar pemahaman kita saat ini, generasi berikutnya dari LLMs sudah di depan mata.
AI Chatbots Dibuat Mudah
Bagaimana jika chatbot AI Anda secara otomatis disinkronkan dengan setiap pembaruan GPT ?
Botpress telah menyediakan solusi chatbot AI yang dapat disesuaikan sejak 2017, menyediakan alat yang dibutuhkan pengembang untuk membangun chatbot dengan mudah dengan kekuatan LLMs terbaru. Botpress chatbot dapat dilatih dengan sumber pengetahuan khusus - seperti situs web atau katalog produk Anda - dan terintegrasi dengan sistem bisnis secara mulus.
Satu-satunya platform yang berkisar dari tidak ada pengaturan kode hingga kustomisasi dan perluasan tanpa batas, Botpress memungkinkan Anda untuk secara otomatis mendapatkan kekuatan versi GPT terbaru pada chatbot Anda - tidak perlu usaha.
Mulaimembangun hari ini. Ini gratis.
Daftar Isi
Bagikan ini: