- GPT-4o dua kali lebih cepat dan setengah biaya dari GPT-4 Turbo, secara drastis menurunkan harga dan mempercepat waktu respons untuk chatbot AI.
- Model baru ini menghadirkan kemampuan multimodal canggih—termasuk suara, video, terjemahan waktu nyata, dan pengenalan visual—yang membuka peluang penggunaan inovatif untuk chatbot di luar teks saja.
- Peningkatan efisiensi dalam tokenisasi, terutama untuk bahasa dengan alfabet non-Romawi, berarti penghematan biaya yang signifikan untuk penerapan chatbot secara global.
- Peningkatan kecepatan secara langsung meningkatkan pengalaman pengguna, mengurangi waktu tunggu yang biasanya membuat frustrasi pengguna chatbot.
Dua kali lebih cepat dan setengah harga – apa arti GPT-4o untuk chatbot AI?
Setelah pengumuman misterius mereka, OpenAI meluncurkan versi terbaru dari model andalan mereka: GPT-4o.
Model terbaru ini tidak hanya mendapatkan peningkatan kemampuan multimodal yang mencolok. Ia juga lebih cepat dan lebih murah daripada GPT-4 Turbo. Sementara media arus utama banyak membahas kemampuan video dan suara model baru untuk ChatGPT, kecepatan dan biaya baru ini sama pentingnya bagi mereka yang menggunakan GPT untuk mendukung aplikasi mereka.

“Ketersediaan 4o memiliki kekuatan untuk secara signifikan meningkatkan pengalaman pembuat dan pengguna,” kata Patrick Hamelin, lead software engineer di Botpress. “Dampaknya lebih luas dari yang kita kira.”
Mari kita bahas bagaimana model baru ini akan mengubah chatbot AI.
Kemampuan Model
Model andalan baru ini hadir dengan daftar pembaruan dan fitur baru yang menarik: kemampuan suara dan video yang ditingkatkan, terjemahan waktu nyata, kemampuan bahasa yang lebih alami. Ia dapat menganalisis gambar, memahami lebih banyak jenis input audio, membantu meringkas, memfasilitasi terjemahan waktu nyata, dan membuat grafik. Pengguna dapat mengunggah file dan melakukan percakapan suara secara langsung. Bahkan tersedia aplikasi desktopnya.
Dalam serangkaian video peluncurannya, karyawan OpenAI (dan rekan seperti Sal Khan dari Khan Academy) mendemonstrasikan versi terbaru GPT yang mempersiapkan pengguna untuk wawancara kerja, bernyanyi, mengenali emosi manusia melalui ekspresi wajah, menyelesaikan soal matematika tertulis, dan bahkan berinteraksi dengan ChatGPT-4o lain.
Peluncuran ini menggambarkan kenyataan baru di mana model AI mampu menganalisis tulisan di buku catatan anak Anda dan memberikan respons. Ia bisa menjelaskan konsep penjumlahan pecahan untuk pertama kali, mengubah nada dan pendekatan sesuai pemahaman anak Anda – ia bisa melampaui chatbot menjadi tutor pribadi.

Apa arti GPT-4o untuk Chatbot LLM?
Chatbot AI yang berjalan di atas LLM mendapatkan pembaruan setiap kali perusahaan seperti OpenAI memperbarui model mereka. Jika sebuah agen LLM terhubung ke platform pembuat bot seperti Botpress, mereka akan menerima semua manfaat dari model GPT terbaru di chatbot mereka.
Dengan hadirnya GPT-4o, chatbot AI kini dapat memilih untuk berjalan di model canggih ini, mengubah kemampuan, harga, dan kecepatannya. Model baru ini memiliki batas penggunaan 5x lebih tinggi dari GPT-4 Turbo, dengan kemampuan memproses hingga 10 juta token per menit.
Untuk bot yang menggunakan integrasi audio seperti Twilio di Botpress, kini terbuka dunia baru interaksi berbasis suara. Alih-alih terbatas pada pemrosesan audio zaman dulu, chatbot kini selangkah lebih dekat meniru interaksi manusia.
Mungkin yang paling penting adalah biaya yang lebih rendah bagi pengguna berbayar. Menjalankan chatbot dengan kemampuan serupa dengan setengah biaya dapat secara drastis meningkatkan akses dan keterjangkauan di seluruh dunia. Dan pengguna Botpress tidak membayar biaya AI tambahan untuk bot mereka – jadi penghematan ini langsung dirasakan pembuat bot.
Dan dari sisi pengguna, GPT-4o berarti pengalaman pengguna yang jauh lebih baik. Tidak ada yang suka menunggu. Waktu respons yang lebih singkat berarti kepuasan pengguna chatbot AI yang lebih tinggi.

Pengguna Suka Kecepatan
Salah satu prinsip utama adopsi chatbot adalah meningkatkan pengalaman pengguna. Dan apa yang lebih meningkatkan pengalaman pengguna selain memangkas waktu tunggu?
“Pasti akan jadi pengalaman yang lebih baik,” kata Hamelin. “Hal terakhir yang ingin Anda lakukan adalah menunggu seseorang.”
Manusia tidak suka menunggu. Bahkan pada tahun 2003, sebuah studi menemukan bahwa orang hanya mau menunggu sekitar 2 detik untuk memuat halaman web. Kesabaran kita pasti tidak bertambah sejak saat itu.
Dan semua orang benci menunggu
Ada banyak tips UX di luar sana untuk mengurangi waktu tunggu yang dirasakan. Seringkali kita tidak bisa meningkatkan kecepatan proses, jadi kita fokus membuat pengguna merasa waktu berjalan lebih cepat. Umpan balik visual, seperti gambar bar pemuatan, dibuat untuk memperpendek waktu tunggu yang dirasakan.
Dalam kisah terkenal tentang waktu tunggu lift, sebuah gedung tua di New York menerima banyak keluhan. Penghuni harus menunggu 1-2 menit untuk lift datang. Gedung itu tidak bisa memperbarui lift ke model yang lebih baru dan penghuni mengancam akan membatalkan sewa.
Seorang pegawai baru, yang berlatar belakang psikologi, menyadari masalah sebenarnya bukan pada dua menit waktu yang hilang – melainkan kebosanan. Ia menyarankan memasang cermin agar penghuni bisa melihat diri sendiri atau orang lain saat menunggu. Keluhan tentang lift pun hilang, dan kini, cermin di lobi lift menjadi hal yang umum.
Alih-alih mengambil jalan pintas untuk meningkatkan pengalaman pengguna – seperti umpan balik visual – OpenAI meningkatkan pengalaman langsung dari sumbernya. Kecepatan adalah inti dari pengalaman pengguna, dan tidak ada trik yang bisa menandingi kepuasan dari interaksi yang efisien.
Hemat untuk Semua Orang
Menggunakan model AI baru ini untuk menjalankan aplikasi kini menjadi jauh lebih murah.
Menjalankan chatbot AI dalam skala besar bisa jadi mahal. LLM yang digunakan bot Anda menentukan berapa banyak biaya yang harus dibayar untuk setiap interaksi pengguna dalam skala besar (setidaknya di Botpress, di mana pengeluaran AI disesuaikan 1:1 dengan biaya LLM).
Dan penghematan ini bukan hanya untuk pengembang yang menggunakan API. ChatGPT-4o adalah versi gratis terbaru dari LLM, bersama dengan GPT-3.5. Pengguna gratis dapat menggunakan aplikasi ChatGPT tanpa biaya.
Tokenisasi yang Lebih Baik
Jika Anda berinteraksi dengan model ini dalam bahasa yang tidak menggunakan alfabet Romawi, GPT-4o bahkan lebih jauh menurunkan biaya API Anda.

Model baru ini hadir dengan batas penggunaan yang lebih baik. Model ini memberikan lompatan besar dalam efisiensi tokenisasi, terutama untuk bahasa non-Inggris tertentu.
Model tokenisasi baru ini membutuhkan lebih sedikit token untuk memproses teks input. Jauh lebih efisien untuk bahasa logografis (yaitu bahasa yang menggunakan simbol dan karakter, bukan huruf per huruf).
Manfaat ini terutama dirasakan oleh bahasa yang tidak menggunakan alfabet Romawi. Pengurangan penghematan diperkirakan sebagai berikut:
- Bahasa India, seperti Hindi, Tamil, atau Gujarati, mengalami pengurangan token 2,9 – 4,4x
- Bahasa Arab mengalami pengurangan token sekitar 2x
- Bahasa Asia Timur, seperti Tionghoa, Jepang, dan Vietnam mengalami pengurangan token 1,4 – 1,7x
Menutup Kesenjangan Digital AI
Era digital membawa perpanjangan dari kesenjangan kekayaan yang sudah lama ada—kesenjangan digital. Seperti halnya akses terhadap kekayaan dan infrastruktur yang kuat hanya dimiliki sebagian populasi, begitu juga akses ke AI dan peluang serta manfaat yang menyertainya.
Robert Opp, Chief Digital Officer di United Nations Development Programme (UNDP), menjelaskan bahwa kehadiran platform AI dapat menentukan kemajuan atau kemunduran metrik pembangunan suatu negara:

Dengan memangkas biaya GPT-4o dan memperkenalkan paket gratis, OpenAI mengambil langkah penting untuk mengatasi salah satu masalah terbesar dalam AI – dan secara langsung menanggapi ketimpangan yang menjadi perhatian para pembuat kebijakan dan ekonom.
Langkah PR positif untuk AI besar ternyata lebih dibutuhkan daripada yang dibayangkan para penggemar. Seiring AI semakin hadir dalam kehidupan sehari-hari, baik pendukung maupun skeptis bertanya-tanya bagaimana kita bisa memanfaatkan AI untuk kebaikan.

Menurut Louis Bouchard, PhD AI dan pendidik, memperluas akses ke AI adalah cara kita melakukan hal tersebut: “Membuat AI mudah diakses adalah salah satu cara, jika bukan yang terbaik, untuk menggunakan AI demi kebaikan.” Alasannya? Jika kita belum bisa sepenuhnya mengendalikan dampak positif dan negatif teknologi AI – setidaknya di masa awal – kita bisa memastikan akses yang setara terhadap manfaat potensialnya.
Potensi Multimodal yang Diperluas
Cara paling umum berinteraksi dengan chatbot bisnis adalah melalui teks, namun kemampuan multimodal yang ditingkatkan dari model AI baru OpenAI menunjukkan bahwa hal ini bisa berubah ke depannya.
Dalam setahun ke depan, kemungkinan kita akan melihat banyak pengembang meluncurkan aplikasi baru yang memanfaatkan kemampuan audio, visual, dan video yang kini lebih mudah diakses.
Sebagai contoh, chatbot berbasis GPT bisa memiliki kemampuan untuk:
- Meminta pelanggan mengirimkan gambar barang yang ingin dikembalikan untuk mengidentifikasi produk dan memastikan barang tidak rusak
- Memberikan terjemahan audio secara langsung dalam percakapan yang memperhitungkan dialek daerah tertentu
- Menentukan apakah steak sudah matang dari gambar steak di atas wajan
- Berfungsi sebagai pemandu wisata pribadi gratis, memberikan konteks sejarah berdasarkan gambar katedral tua, menerjemahkan secara real time, dan memberikan tur suara yang bisa disesuaikan serta memungkinkan tanya jawab dua arah
- Mendukung aplikasi pembelajaran bahasa yang mendengarkan input audio, memberikan umpan balik pengucapan berdasarkan video gerakan mulut, atau mengajarkan bahasa isyarat melalui gambar dan video
- Memberikan dukungan kesehatan mental non-darurat dengan menggabungkan kemampuan memahami audio dan video, sehingga memungkinkan terapi bicara berbiaya rendah
Dengan model AI yang bisa memahami gambar dan audio, pemahaman kita tentang bagaimana LLM dapat membantu semakin berkembang pesat.
Multimodalitas berarti aksesibilitas
Kita sudah melihat fitur multimodal yang ditingkatkan digunakan untuk kebaikan sosial. Contoh sempurnanya adalah kemitraan OpenAI dengan Be My Eyes.
Be My Eyes adalah start-up asal Denmark yang menghubungkan pengguna tunanetra dengan relawan yang dapat melihat. Saat pengguna membutuhkan bantuan – seperti memilih barang kaleng yang tepat di supermarket atau mengidentifikasi warna kaos – aplikasi ini menghubungkan mereka dengan relawan di seluruh dunia melalui video di ponsel.

Kemampuan visi baru dari OpenAI dapat memberikan pengalaman yang lebih bermanfaat bagi pengguna Be My Eyes. Alih-alih mengandalkan relawan manusia untuk menafsirkan gambar atau video secara langsung, pengguna tunanetra dapat mengirimkan gambar atau video ke perangkat mereka dan model akan merespons dengan informasi audio.
OpenAI dan Be My Eyes, kini menjadi mitra terpercaya, membuka jalan menuju kemandirian yang lebih besar bagi individu tunanetra di seluruh dunia. CEO Be My Eyes, Michael Buckley, menjelaskan dampaknya:

Layanan baru ini akan mulai diluncurkan pada musim panas 2024. Pengguna akses awal telah menguji fitur visi, video, dan audio baru ini dan memberikan ulasan positif. Walaupun dampak AI kadang menimbulkan kekhawatiran bagi sebagian orang, kemitraan ini jelas menunjukkan dampak positif yang bisa dihasilkan. Memahami manfaat sosial dari AI canggih adalah langkah penting untuk reputasinya.
Bagaimana kita akan menilai model LLM di masa depan?
Karena para pesaing terus berlomba menciptakan LLM termurah dan tercepat, muncul pertanyaan: bagaimana kita akan menilai model AI di masa depan?
Pada titik tertentu, para pembuat LLM utama (kemungkinan OpenAI dan Google) akan mencapai batas kecepatan dan biaya akses model mereka. Setelah biaya dan kecepatan stabil, bagaimana kita menentukan model terdepan di pasar?
Apa yang akan menjadi penanda zaman berikutnya? Apakah kepribadian yang tersedia pada model kecerdasan buatan Anda, kemampuan peningkatan video, fitur yang tersedia untuk pengguna gratis, atau metrik baru di luar pemahaman kita saat ini, generasi LLM berikutnya sudah di depan mata.
Chatbot AI Jadi Mudah
Bagaimana jika chatbot AI Anda secara otomatis disinkronkan dengan setiap pembaruan GPT?
Sejak 2017, Botpress telah menyediakan solusi chatbot AI yang dapat disesuaikan, memberikan pengembang alat yang mereka butuhkan untuk membangun chatbot dengan kekuatan LLM terbaru secara mudah. Chatbot Botpress dapat dilatih dengan sumber pengetahuan khusus – seperti situs web atau katalog produk Anda – dan terintegrasi mulus dengan sistem bisnis.
Satu-satunya platform yang menawarkan mulai dari pengaturan tanpa kode hingga kustomisasi dan pengembangan tanpa batas, Botpress memungkinkan Anda otomatis mendapatkan kekuatan GPT versi terbaru pada chatbot Anda – tanpa usaha tambahan.
Mulai membangun hari ini. Gratis.
FAQ
1. Bagaimana cara mengganti chatbot saya ke GPT-4o di Botpress?
Untuk mengganti chatbot Anda ke GPT-4o di Botpress, buka Botpress Studio, masuk ke pengaturan LLM asisten Anda, dan pilih GPT-4o dari daftar model yang tersedia. Perubahan berlaku langsung tanpa perlu mengubah kode.
2. Apakah ada prasyarat untuk menggunakan GPT-4o di dalam platform Botpress (misalnya, SDK, versi API)?
Tidak, tidak ada prasyarat untuk menggunakan GPT-4o di Botpress. Platform ini mengelola semua SDK, pembaruan API, dan dependensi backend secara otomatis, jadi Anda hanya perlu memilih GPT-4o di pengaturan untuk mengaktifkannya.
3. Apakah GPT-4o dapat dioptimalkan atau disesuaikan untuk kebutuhan bisnis tertentu melalui Botpress?
Meskipun GPT-4o tidak bisa dikustomisasi secara tradisional di Botpress, Anda dapat mengatur respons dan perilakunya menggunakan prompt engineering, logika alur kerja, basis pengetahuan, dan variabel. Ini memungkinkan GPT-4o berperilaku sesuai konteks kebutuhan bisnis Anda tanpa perlu melatih ulang model.
4. Apakah ada batasan dalam penggunaan fitur multimodal (suara, visual) di dalam alur kerja Botpress?
Ya, Botpress saat ini mendukung fitur suara melalui integrasi seperti Twilio atau Dialogflow Voice Gateway, namun kemampuan multimodal seperti pemrosesan gambar atau video belum sepenuhnya didukung. Input berbasis visi masih dalam pertimbangan atau memerlukan solusi alternatif.
5. Apakah ada biaya tersembunyi saat menggunakan fitur lanjutan GPT-4o seperti terjemahan waktu nyata atau input visual?
Tidak, tidak ada biaya tersembunyi untuk menggunakan fitur canggih GPT-4o di Botpress. Kecepatan dan efisiensi GPT-4o sudah termasuk dalam paket Botpress Anda, dan biaya LLM ditanggung oleh Botpress – jadi pengguna tidak dikenakan biaya tambahan untuk menggunakan peningkatan GPT-4o.





.webp)
