Dua kali lebih cepat dan setengah harga - apa arti GPT-4o untuk chatbot AI?
Menyusul pengumuman misterius mereka, OpenAI meluncurkan versi terbaru dari model andalan mereka: GPT-4o.
Model terbaru ini tidak hanya mendapatkan peningkatan yang mencolok dalam kemampuan multimodal. Lebih cepat dan lebih murah daripada GPT-4 Turbo. Sementara liputan media arus utama terpikat dengan kemampuan video dan suara model andalan baru ini, biaya dan kecepatan baru sama berdampaknya bagi mereka yang menggunakan GPT untuk mendukung aplikasi mereka.
"Ketersediaan 4o memiliki kekuatan untuk secara signifikan meningkatkan pengalaman pembangun dan pengguna," kata Patrick Hamelin, seorang insinyur perangkat lunak yang memimpin di Botpress. "Dampaknya lebih luas dari yang kita pikirkan."
Jadi, mari kita pelajari bagaimana model baru ini akan mengguncang AI chatbots.
Kemampuan Model
Model unggulan baru ini hadir dengan daftar pembaruan yang menarik dan fitur-fitur baru: kemampuan suara dan video yang disempurnakan, terjemahan waktu nyata, kemampuan bahasa yang lebih alami. Dapat menganalisis gambar, memahami input audio yang lebih beragam, memberikan bantuan meringkas, memfasilitasi terjemahan waktu nyata, dan membuat bagan. Pengguna dapat mengunggah file dan melakukan percakapan suara-ke-suara. Bahkan dilengkapi dengan aplikasi desktop.
Dalam rangkaian video peluncurannya, karyawan OpenAI (dan rekanan seperti Sal Khan dari Khan academy) mendemonstrasikan versi terbaru GPT yang mempersiapkan pengguna untuk wawancara kerja, bernyanyi, mengidentifikasi emosi manusia melalui ekspresi wajah, memecahkan persamaan matematika tertulis, dan bahkan berinteraksi dengan ChatGPT-4o lainnya.
Peluncuran ini menggambarkan realitas baru di mana model AI mampu menganalisis tulisan di buku catatan anak Anda dan mampu merespons. AI ini dapat menjelaskan konsep penjumlahan pecahan untuk pertama kalinya, mengubah nada dan taktik berdasarkan pemahaman anak Anda - AI ini dapat melintasi batas dari chatbot menjadi tutor pribadi.
Apa arti GPT-4o untuk LLM Chatbots?
Chatbot AI yang berjalan di LLMs diberikan pembaruan setiap kali perusahaan seperti OpenAI memperbarui model mereka. Jika chatbot terhubung ke platform pembuatan bot seperti Botpress, mereka menerima semua manfaat dari model GPT terbaru di chatbot mereka sendiri.
Dengan dirilisnya GPT-4o, chatbot AI sekarang dapat memilih untuk menggunakan model yang lebih tinggi, mengubah kemampuan, harga, dan kecepatannya. Model baru ini memiliki batas kecepatan 5x lebih tinggi dari GPT-4 Turbo, dengan kemampuan untuk memproses hingga 10 juta token per menit.
Untuk bot yang menggunakan integrasi audio seperti Twilio di Botpress, dunia baru interaksi bertenaga suara telah muncul. Alih-alih terbatas pada pemrosesan audio di masa lalu, chatbots selangkah lebih dekat untuk meniru interaksi manusia.
Mungkin yang paling penting adalah biaya yang lebih rendah untuk pengguna berbayar. Menjalankan chatbot dengan kemampuan yang sama dengan setengah biaya dapat secara drastis meningkatkan akses dan keterjangkauan di seluruh dunia. Dan pengguna Botpress tidak membayar biaya tambahan untuk pengeluaran AI untuk bot mereka - jadi penghematan ini langsung masuk ke pembuat.
Dan dari sisi pengguna, GPT-4o berarti pengalaman pengguna yang jauh lebih baik. Tidak ada yang suka menunggu. Waktu respons yang lebih singkat berarti kepuasan pengguna yang lebih tinggi bagi pengguna chatbot AI.
Pengguna menyukai Kecepatan
Salah satu manfaat utama dari adopsi chatbot adalah meningkatkan pengalaman pengguna. Dan apa yang lebih meningkatkan pengalaman pengguna daripada mengurangi waktu tunggu?
"Pasti akan menjadi pengalaman yang lebih baik," kata Hamelin. "Hal terakhir yang ingin Anda lakukan adalah menunggu seseorang."
Manusia tidak suka menunggu. Bahkan pada tahun 2003, sebuah penelitian menemukan bahwa orang hanya mau menunggu sekitar 2 detik untuk memuat halaman web. Kesabaran kita tentu saja tidak meningkat sejak saat itu.
Dan semua orang benci menunggu
Ada banyak sekali tips UX di luar sana untuk mengurangi waktu tunggu yang dirasakan. Sering kali kita tidak dapat meningkatkan kecepatan acara, jadi kita fokus pada cara membuat pengguna merasa waktu berlalu lebih cepat. Umpan balik visual, seperti gambar bilah pemuatan, ada untuk mempersingkat waktu tunggu yang dirasakan.
Dalam sebuah kisah terkenal tentang waktu tunggu lift, sebuah gedung tua di New York menuai banyak keluhan. Para penghuni harus menunggu 1-2 menit sampai lift tiba. Gedung tersebut tidak dapat meng-upgrade lift ke model yang lebih baru dan para penghuni mengancam untuk memutuskan sewa mereka.
Seorang karyawan baru, yang terlatih dalam bidang psikologi, menemukan bahwa masalah sebenarnya bukanlah dua menit waktu yang terbuang, melainkan kebosanan. Dia menyarankan untuk memasang cermin agar para penghuni dapat melihat diri mereka sendiri atau orang lain saat menunggu. Keluhan tentang lift pun berhenti, dan sekarang, sudah menjadi hal yang biasa untuk melihat cermin di lobi lift.
Alih-alih mengambil jalan pintas untuk meningkatkan pengalaman pengguna - seperti umpan balik visual - OpenAI telah meningkatkan pengalaman pada sumbernya. Kecepatan adalah inti dari pengalaman pengguna, dan tidak ada trik yang dapat menandingi kepuasan dari interaksi yang efisien.
Tabungan untuk Semua Orang
Menggunakan model AI baru ini untuk menjalankan aplikasi menjadi lebih murah. Jauh lebih murah.
Menjalankan chatbot AI dalam skala besar bisa jadi mahal. LLM bot Anda didukung oleh menentukan berapa banyak Anda akan membayar untuk setiap interaksi pengguna dalam skala yang lebih besar (setidaknya di Botpress, di mana kami mencocokkan pengeluaran AI 1: 1 dengan biaya LLM ).
Dan penghematan ini tidak hanya untuk pengembang yang menggunakan API. ChatGPT-4o adalah versi gratis terbaru dari LLM, di samping GPT-3.5. Pengguna gratis dapat menggunakan aplikasi ChatGPT tanpa biaya.
Tokenisasi yang lebih baik
Jika Anda berinteraksi dengan model dalam bahasa yang tidak menggunakan alfabet Romawi, GPT-4o akan mengurangi biaya API Anda.
Model baru ini hadir dengan batas penggunaan yang lebih baik. Model ini memberikan lompatan yang signifikan dalam efisiensi tokenisasi, yang sebagian besar terkonsentrasi pada bahasa non-Inggris tertentu.
Model tokenisasi yang baru membutuhkan lebih sedikit token untuk memproses teks masukan. Model ini jauh lebih efisien untuk bahasa logografi (yaitu bahasa yang menggunakan simbol dan karakter, bukan huruf).
Manfaat ini sebagian besar terkonsentrasi pada bahasa yang tidak menggunakan alfabet Romawi. Pengurangan penghematan diperkirakan sebagai berikut:
- Bahasa India, seperti Hindi, Tamil, atau Gujarat, memiliki pengurangan token sebesar 2,9 - 4,4x
- Bahasa Arab memiliki pengurangan token ~ 2x lipat
- Bahasa-bahasa Asia Timur, seperti bahasa Mandarin, Jepang, dan Vietnam memiliki pengurangan token sebesar 1,4 - 1,7x
Menutup kesenjangan digital AI
Era digital telah membawa perpanjangan dari kesenjangan kekayaan yang sudah ada sejak lama dan terdokumentasi dengan baik - kesenjangan digital. Sama seperti akses terhadap kekayaan dan infrastruktur yang kuat hanya dimiliki oleh populasi tertentu, begitu pula akses terhadap AI dan peluang serta manfaat yang menyertainya.
Robert Opp, Chief Digital Officer di United Nations Development Programme (UNDP), menjelaskan bahwa kehadiran platform AI memiliki kemampuan untuk membuat atau menghancurkan metrik pembangunan suatu negara:
Dengan mengurangi separuh biaya GPT-4o dan memperkenalkan tingkat gratis, OpenAI mengambil langkah penting untuk menetralkan salah satu masalah terbesar dalam AI - dan secara langsung mengatasi ketidaksetaraan di benak para pembuat kebijakan dan ekonom.
Langkah PR yang positif untuk AI yang besar lebih diperlukan daripada yang mungkin dipikirkan oleh para penggemar. Seiring dengan semakin hadirnya AI dalam kehidupan kita sehari-hari, para pendukung dan skeptis sama-sama bertanya bagaimana kita dapat menggunakan AI 'untuk kebaikan'.
Menurut PhD AI dan pendidik Louis Bouchard, mendistribusikan akses yang lebih luas ke AI adalah cara kita melakukan hal tersebut: "Membuat AI dapat diakses adalah salah satu cara, jika bukan yang terbaik, untuk menggunakan AI 'demi kebaikan'." Alasannya? Jika kita tidak dapat sepenuhnya mengendalikan dampak positif dan negatif dari teknologi AI - setidaknya di masa-masa awal - kita dapat memastikan akses yang sama terhadap manfaat potensial dari teknologi ini.
Potensi Multimoda yang Diperluas
Cara populer untuk berinteraksi dengan chatbot bisnis adalah melalui teks, tetapi kemampuan multimodal yang ditingkatkan dari model AI baru OpenAImenunjukkan bahwa hal ini mungkin akan berubah di masa mendatang.
Di tahun mendatang, kita mungkin akan melihat gelombang pengembang yang meluncurkan aplikasi baru yang memanfaatkan kemampuan audio, visi, dan video yang baru dapat diakses.
Sebagai contoh, chatbot yang didukung oleh GPT dapat memiliki kemampuan untuk itu:
- Mintalah gambar barang yang mereka kembalikan kepada pelanggan untuk mengidentifikasi produk dan memastikan produk tersebut tidak rusak
- Menyediakan terjemahan audio dalam percakapan waktu nyata yang memperhitungkan dialek wilayah tertentu
- Mengetahui apakah steak Anda sudah matang dari gambarnya di dalam wajan
- Berfungsi sebagai pemandu wisata pribadi tanpa biaya, memberikan konteks sejarah berdasarkan gambar katedral tua, memberikan terjemahan secara real time, dan memberikan tur suara yang disesuaikan yang memungkinkan untuk komunikasi dan pertanyaan bolak-balik
- Memberdayakan aplikasi pembelajaran bahasa yang mendengarkan input audio, dapat memberikan umpan balik tentang pengucapan berdasarkan video gerakan mulut Anda, atau mengajarkan bahasa isyarat melalui gambar dan video
- Memberikan dukungan kesehatan mental yang tidak mendesak dengan menggabungkan kemampuannya untuk menginterpretasikan audio dan video, sehingga memungkinkan terapi bicara berbiaya rendah
Dengan model AI yang dapat menginterpretasikan gambar dan audio, pemahaman kita tentang bagaimana LLMs dapat melayani kita berkembang pesat.
Multimodalitas berarti aksesibilitas
Kami telah melihat fitur multimodal yang disempurnakan digunakan untuk kebaikan sosial. Contoh yang sempurna adalah kemitraanOpenAIdengan Be My Eyes.
Be My Eyes adalah perusahaan rintisan asal Denmark yang menghubungkan pengguna yang memiliki gangguan penglihatan dengan sukarelawan tunanetra. Ketika pengguna membutuhkan bantuan - seperti memilih produk kaleng yang tepat di supermarket atau mengidentifikasi warna kaos - aplikasi ini menghubungkan mereka dengan sukarelawan tunanetra di seluruh dunia melalui video melalui ponsel pintar.
OpenAIKemampuan penglihatan baru ini dapat memberikan pengalaman yang lebih bermanfaat bagi pengguna Be My Eyes. Alih-alih mengandalkan sukarelawan manusia untuk menguraikan gambar atau video secara visual dalam waktu nyata, pengguna tunanetra dapat menyampaikan gambar atau video ke perangkat mereka yang dapat ditanggapi oleh model dengan informasi audio.
OpenAI dan Be My Eyes, yang kini menjadi mitra tepercaya, membuka jalan menuju kemandirian bagi para penyandang tunanetra di seluruh dunia. CEO Be My Eyes, Michael Buckley, menjelaskan dampaknya:
Layanan baru ini akan segera diluncurkan pada musim panas 2024, untuk pertama kalinya. Pengguna akses awal telah melakukan uji coba beta untuk fitur penglihatan, video, dan audio baru dan mendapatkan sambutan hangat. Meskipun dampak AI dapat menimbulkan kekhawatiran bagi mereka yang skeptis, kemitraan ini merupakan tanda yang jelas akan dampak positif yang dapat dibawanya. Memahami kebaikan sosial yang hadir dengan AI yang canggih adalah langkah penting bagi PR-nya.
Bagaimana kami akan menilai model LLM di masa depan?
Ketika para pesaing terus berlomba untuk menjadi yang termurah dan tercepat - untuk menciptakan LLM yang termurah dan tercepat - hal ini menimbulkan pertanyaan: bagaimana kita akan menilai model AI di masa depan?
Pada suatu saat di masa depan, pembuat LLM utama (kemungkinan OpenAI dan Google) akan mencapai titik puncak dalam hal seberapa cepat model mereka dapat berjalan dan seberapa murah mereka dapat menyediakan akses. Setelah kita mencapai kestabilan dalam hal biaya dan kecepatan, bagaimana kita akan memahkotai model yang memimpin pasar?
Apa yang akan menjadi tanda zaman yang baru? Entah itu kepribadian yang tersedia dari model kecerdasan buatan Anda, kemampuan peningkatan video, fitur yang tersedia untuk pengguna gratis, atau metrik baru di luar pemahaman kita saat ini, generasi berikutnya dari LLMs sudah di depan mata.
AI Chatbots Dibuat Mudah
Bagaimana jika chatbot AI Anda secara otomatis disinkronkan dengan setiap pembaruan GPT ?
Botpress telah menyediakan solusi chatbot AI yang dapat disesuaikan sejak 2017, menyediakan alat yang dibutuhkan pengembang untuk membangun chatbot dengan mudah dengan kekuatan LLMs terbaru. Botpress chatbot dapat dilatih dengan sumber pengetahuan khusus - seperti situs web atau katalog produk Anda - dan terintegrasi dengan sistem bisnis secara mulus.
Satu-satunya platform yang berkisar dari tidak ada pengaturan kode hingga kustomisasi dan perluasan tanpa batas, Botpress memungkinkan Anda untuk secara otomatis mendapatkan kekuatan versi GPT terbaru pada chatbot Anda - tidak perlu usaha.
Mulaimembangun hari ini. Ini gratis.
Daftar Isi
Dapatkan informasi terbaru tentang agen AI
Bagikan ini: