How do I switch my existing chatbot to GPT-4o on Botpress?

To switch your existing chatbot to GPT-4o on Botpress, go to the Botpress Studio, navigate to your assistant’s LLM settings, and select GPT-4o from the available model dropdown. The change applies instantly without requiring code changes.

Are there prerequisites to using GPT-4o within the Botpress platform (e.g., SDKs, API versions)?

No, there are no prerequisites to using GPT-4o in Botpress. The platform manages all SDKs, API updates, and backend dependencies automatically, so you only need to select GPT-4o in the settings to activate it.

Can GPT-4o be fine-tuned or customized for specific business use cases via Botpress?

While GPT-4o cannot be fine-tuned in the traditional sense within Botpress, you can customize its responses and behavior using prompt engineering, workflow logic, knowledge bases, and variables. This allows GPT-4o to behave contextually for your business needs without retraining the model.

Are there limitations on the use of multimodal features (voice, vision) within Botpress workflows?

Yes, Botpress currently supports voice features through integrations like Twilio or Dialogflow Voice Gateway, but multimodal capabilities like processing images or videos are not fully supported yet. Vision-based input is still under consideration or requires workarounds.

Are there hidden costs to using GPT-4o’s advanced features like real-time translation or vision input?

No, there are no hidden costs to using GPT-4o’s advanced features in Botpress. GPT-4o’s speed and efficiency benefits are included in your existing Botpress plan, and LLM costs are covered by Botpress—so users don’t incur extra fees for using GPT-4o’s enhancements.

Apa Arti GPT-4o untuk Chatbot?

Ditulis oleh

Sarah Chudleigh

Peneliti & Pemimpin Konten AI

Daftar Isi

Langkah 1. judul langkah ditulis di sini seperti yang diharapkan

Ringkasan

GPT-4o dua kali lebih cepat dan setengah biaya dari GPT-4 Turbo, secara drastis menurunkan harga dan mempercepat waktu respons untuk chatbot AI.
Model baru ini menghadirkan kemampuan multimodal canggih—termasuk suara, video, terjemahan waktu nyata, dan pengenalan visual—yang membuka peluang penggunaan inovatif untuk chatbot di luar teks saja.
Peningkatan efisiensi dalam tokenisasi, terutama untuk bahasa dengan alfabet non-Romawi, berarti penghematan biaya yang signifikan untuk penerapan chatbot secara global.
Peningkatan kecepatan secara langsung meningkatkan pengalaman pengguna, mengurangi waktu tunggu yang biasanya membuat frustrasi pengguna chatbot.

Dua kali lebih cepat dan setengah harga – apa arti GPT-4o untuk chatbot AI?

Setelah pengumuman misterius mereka, OpenAI meluncurkan versi terbaru dari model andalan mereka: GPT-4o.

Model terbaru ini tidak hanya mendapatkan peningkatan kemampuan multimodal yang mencolok. Ia juga lebih cepat dan lebih murah daripada GPT-4 Turbo. Sementara media arus utama banyak membahas kemampuan video dan suara model baru untuk ChatGPT, kecepatan dan biaya baru ini sama pentingnya bagi mereka yang menggunakan GPT untuk mendukung aplikasi mereka.

White lettering on an indigo background. A quote from Botpress software engineer lead Patrick Hamelin that reads: "The availability of 4o has the power to significantly improv both the builder and the user experience. The impact is further-reaching than we think."

“Ketersediaan 4o memiliki kekuatan untuk secara signifikan meningkatkan pengalaman pembuat dan pengguna,” kata Patrick Hamelin, lead software engineer di Botpress. “Dampaknya lebih luas dari yang kita kira.”

Mari kita bahas bagaimana model baru ini akan mengubah chatbot AI.

Bangun Chatbot AI

Buat chatbot agentik sesuai kebutuhan

Mulai sekarang

Kemampuan Model

Sambut GPT-4o

Model andalan baru ini hadir dengan daftar pembaruan dan fitur baru yang menarik: kemampuan suara dan video yang ditingkatkan, terjemahan waktu nyata, kemampuan bahasa yang lebih alami. Ia dapat menganalisis gambar, memahami lebih banyak jenis input audio, membantu meringkas, memfasilitasi terjemahan waktu nyata, dan membuat grafik. Pengguna dapat mengunggah file dan melakukan percakapan suara secara langsung. Bahkan tersedia aplikasi desktopnya.

Dalam serangkaian video peluncurannya, karyawan OpenAI (dan rekan seperti Sal Khan dari Khan Academy) mendemonstrasikan versi terbaru GPT yang mempersiapkan pengguna untuk wawancara kerja, bernyanyi, mengenali emosi manusia melalui ekspresi wajah, menyelesaikan soal matematika tertulis, dan bahkan berinteraksi dengan ChatGPT-4o lain.

Peluncuran ini menggambarkan kenyataan baru di mana model AI mampu menganalisis tulisan di buku catatan anak Anda dan memberikan respons. Ia bisa menjelaskan konsep penjumlahan pecahan untuk pertama kali, mengubah nada dan pendekatan sesuai pemahaman anak Anda – ia bisa melampaui chatbot menjadi tutor pribadi.

A video screenshot of a GPT-4o demo video featuring Kan Academy creator Sal Khan and his son. — *Sal Khan, pendiri Khan Academy, dan putranya mendemonstrasikan kemampuan GPT-4o dalam memberikan bimbingan geometri.*

Apa arti GPT-4o untuk Chatbot LLM?

Chatbot AI yang berjalan di atas LLM mendapatkan pembaruan setiap kali perusahaan seperti OpenAI memperbarui model mereka. Jika sebuah agen LLM terhubung ke platform pembuat bot seperti Botpress, mereka akan menerima semua manfaat dari model GPT terbaru di chatbot mereka.

Dengan hadirnya GPT-4o, chatbot AI kini dapat memilih untuk berjalan di model canggih ini, mengubah kemampuan, harga, dan kecepatannya. Model baru ini memiliki batas penggunaan 5x lebih tinggi dari GPT-4 Turbo, dengan kemampuan memproses hingga 10 juta token per menit.

Untuk bot yang menggunakan integrasi audio seperti Twilio di Botpress, kini terbuka dunia baru interaksi berbasis suara. Alih-alih terbatas pada pemrosesan audio zaman dulu, chatbot kini selangkah lebih dekat meniru interaksi manusia.

Mungkin yang paling penting adalah biaya yang lebih rendah bagi pengguna berbayar. Menjalankan chatbot dengan kemampuan serupa dengan setengah biaya dapat secara drastis meningkatkan akses dan keterjangkauan di seluruh dunia. Dan pengguna Botpress tidak membayar biaya AI tambahan untuk bot mereka – jadi penghematan ini langsung dirasakan pembuat bot.

Dan dari sisi pengguna, GPT-4o berarti pengalaman pengguna yang jauh lebih baik. Tidak ada yang suka menunggu. Waktu respons yang lebih singkat berarti kepuasan pengguna chatbot AI yang lebih tinggi.

*Di Botpress studio, pengguna dapat memilih versi GPT yang berbeda untuk bagian-bagian berbeda dari alur kerja bot mereka.*

Pengguna Suka Kecepatan

Salah satu prinsip utama adopsi chatbot adalah meningkatkan pengalaman pengguna. Dan apa yang lebih meningkatkan pengalaman pengguna selain memangkas waktu tunggu?

“Pasti akan jadi pengalaman yang lebih baik,” kata Hamelin. “Hal terakhir yang ingin Anda lakukan adalah menunggu seseorang.”

Manusia tidak suka menunggu. Bahkan pada tahun 2003, sebuah studi menemukan bahwa orang hanya mau menunggu sekitar 2 detik untuk memuat halaman web. Kesabaran kita pasti tidak bertambah sejak saat itu.

Dan semua orang benci menunggu

Ada banyak tips UX di luar sana untuk mengurangi waktu tunggu yang dirasakan. Seringkali kita tidak bisa meningkatkan kecepatan proses, jadi kita fokus membuat pengguna merasa waktu berjalan lebih cepat. Umpan balik visual, seperti gambar bar pemuatan, dibuat untuk memperpendek waktu tunggu yang dirasakan.

Dalam kisah terkenal tentang waktu tunggu lift, sebuah gedung tua di New York menerima banyak keluhan. Penghuni harus menunggu 1-2 menit untuk lift datang. Gedung itu tidak bisa memperbarui lift ke model yang lebih baru dan penghuni mengancam akan membatalkan sewa.

Seorang pegawai baru, yang berlatar belakang psikologi, menyadari masalah sebenarnya bukan pada dua menit waktu yang hilang – melainkan kebosanan. Ia menyarankan memasang cermin agar penghuni bisa melihat diri sendiri atau orang lain saat menunggu. Keluhan tentang lift pun hilang, dan kini, cermin di lobi lift menjadi hal yang umum.

Alih-alih mengambil jalan pintas untuk meningkatkan pengalaman pengguna – seperti umpan balik visual – OpenAI meningkatkan pengalaman langsung dari sumbernya. Kecepatan adalah inti dari pengalaman pengguna, dan tidak ada trik yang bisa menandingi kepuasan dari interaksi yang efisien.

Hemat untuk Semua Orang

Menggunakan model AI baru ini untuk menjalankan aplikasi kini menjadi jauh lebih murah.

Menjalankan chatbot AI dalam skala besar bisa jadi mahal. LLM yang digunakan bot Anda menentukan berapa banyak biaya yang harus dibayar untuk setiap interaksi pengguna dalam skala besar (setidaknya di Botpress, di mana pengeluaran AI disesuaikan 1:1 dengan biaya LLM).

Dan penghematan ini bukan hanya untuk pengembang yang menggunakan API. ChatGPT-4o adalah versi gratis terbaru dari LLM, bersama dengan GPT-3.5. Pengguna gratis dapat menggunakan aplikasi ChatGPT tanpa biaya.

Tokenisasi yang Lebih Baik

Jika Anda berinteraksi dengan model ini dalam bahasa yang tidak menggunakan alfabet Romawi, GPT-4o bahkan lebih jauh menurunkan biaya API Anda.

A visualization of how much more efficient tokenization is with GPT-4o compared to Turbo. Indo-Aryan languages like Hindi and Gujarati have a 2.9-4.4 average tokenization reduction. Arabic has a 2x reduction and East Asian languages like Japanese, Korean, and Chinese have a 1.4-1.x reduction. — *Seberapa lebih efisien tokenisasi GPT-4o? Itu tergantung pada bahasanya.*

Model baru ini hadir dengan batas penggunaan yang lebih baik. Model ini memberikan lompatan besar dalam efisiensi tokenisasi, terutama untuk bahasa non-Inggris tertentu.

Model tokenisasi baru ini membutuhkan lebih sedikit token untuk memproses teks input. Jauh lebih efisien untuk bahasa logografis (yaitu bahasa yang menggunakan simbol dan karakter, bukan huruf per huruf).

Manfaat ini terutama dirasakan oleh bahasa yang tidak menggunakan alfabet Romawi. Pengurangan penghematan diperkirakan sebagai berikut:

Bahasa India, seperti Hindi, Tamil, atau Gujarati, mengalami pengurangan token 2,9 – 4,4x
Bahasa Arab mengalami pengurangan token sekitar 2x
Bahasa Asia Timur, seperti Tionghoa, Jepang, dan Vietnam mengalami pengurangan token 1,4 – 1,7x

Menerapkan Agen AI?

Baca Panduan Implementasi Agen AI dari kami

Baca Sekarang

Menutup Kesenjangan Digital AI

Era digital membawa perpanjangan dari kesenjangan kekayaan yang sudah lama ada—kesenjangan digital. Seperti halnya akses terhadap kekayaan dan infrastruktur yang kuat hanya dimiliki sebagian populasi, begitu juga akses ke AI dan peluang serta manfaat yang menyertainya.

Robert Opp, Chief Digital Officer di United Nations Development Programme (UNDP), menjelaskan bahwa kehadiran platform AI dapat menentukan kemajuan atau kemunduran metrik pembangunan suatu negara:

“Salah satu kekhawatiran besar kami adalah negara-negara yang lebih siap dan terampil dalam platform AI, baik dalam hal pengembangan maupun penggunaan, bisa mengalami proses perkembangan yang jauh lebih cepat, sementara negara-negara yang tidak memiliki keterampilan dan kapasitas akan tertinggal.”

A brightly-decorated stage with four individuals in white armchairs. Opp sits on the far right and speaks into a microphone. — *Robert Opp, Chief Digital Officer di UNDP, berbicara di Global Digital Public Infrastructure Summit di India (2024). Foto dari* *UNDP Digital X*.

Dengan memangkas biaya GPT-4o dan memperkenalkan paket gratis, OpenAI mengambil langkah penting untuk mengatasi salah satu masalah terbesar dalam AI – dan secara langsung menanggapi ketimpangan yang menjadi perhatian para pembuat kebijakan dan ekonom.

Langkah PR positif untuk AI besar ternyata lebih dibutuhkan daripada yang dibayangkan para penggemar. Seiring AI semakin hadir dalam kehidupan sehari-hari, baik pendukung maupun skeptis bertanya-tanya bagaimana kita bisa memanfaatkan AI untuk kebaikan.

White lettering on an indigo background. A quote from AI educator Louis Bouchard reads “Making AI accessible is one way, if not the best, to use AI ‘for good.’”

Menurut Louis Bouchard, PhD AI dan pendidik, memperluas akses ke AI adalah cara kita melakukan hal tersebut: “Membuat AI mudah diakses adalah salah satu cara, jika bukan yang terbaik, untuk menggunakan AI demi kebaikan.” Alasannya? Jika kita belum bisa sepenuhnya mengendalikan dampak positif dan negatif teknologi AI – setidaknya di masa awal – kita bisa memastikan akses yang setara terhadap manfaat potensialnya.

Potensi Multimodal yang Diperluas

Cara paling umum berinteraksi dengan chatbot bisnis adalah melalui teks, namun kemampuan multimodal yang ditingkatkan dari model AI baru OpenAI menunjukkan bahwa hal ini bisa berubah ke depannya.

Dalam setahun ke depan, kemungkinan kita akan melihat banyak pengembang meluncurkan aplikasi baru yang memanfaatkan kemampuan audio, visual, dan video yang kini lebih mudah diakses.

Sebagai contoh, chatbot berbasis GPT bisa memiliki kemampuan untuk:

Meminta pelanggan mengirimkan gambar barang yang ingin dikembalikan untuk mengidentifikasi produk dan memastikan barang tidak rusak
Memberikan terjemahan audio secara langsung dalam percakapan yang memperhitungkan dialek daerah tertentu
Menentukan apakah steak sudah matang dari gambar steak di atas wajan
Berfungsi sebagai pemandu wisata pribadi gratis, memberikan konteks sejarah berdasarkan gambar katedral tua, menerjemahkan secara real time, dan memberikan tur suara yang bisa disesuaikan serta memungkinkan tanya jawab dua arah
Mendukung aplikasi pembelajaran bahasa yang mendengarkan input audio, memberikan umpan balik pengucapan berdasarkan video gerakan mulut, atau mengajarkan bahasa isyarat melalui gambar dan video
Memberikan dukungan kesehatan mental non-darurat dengan menggabungkan kemampuan memahami audio dan video, sehingga memungkinkan terapi bicara berbiaya rendah

Dengan model AI yang bisa memahami gambar dan audio, pemahaman kita tentang bagaimana LLM dapat membantu semakin berkembang pesat.

Multimodalitas berarti aksesibilitas

Kita sudah melihat fitur multimodal yang ditingkatkan digunakan untuk kebaikan sosial. Contoh sempurnanya adalah kemitraan OpenAI dengan Be My Eyes.

Be My Eyes adalah start-up asal Denmark yang menghubungkan pengguna tunanetra dengan relawan yang dapat melihat. Saat pengguna membutuhkan bantuan – seperti memilih barang kaleng yang tepat di supermarket atau mengidentifikasi warna kaos – aplikasi ini menghubungkan mereka dengan relawan di seluruh dunia melalui video di ponsel.

A bright blue announcement for 'Be My AI' that reads 'Rolling out out'. On the right side is an image of a smartphone showing a deserted seaside pathway with an AI-generated description of the picture. — *Pengumuman kemitraan dan produk untuk Be My Eyes x OpenAI.*

Kemampuan visi baru dari OpenAI dapat memberikan pengalaman yang lebih bermanfaat bagi pengguna Be My Eyes. Alih-alih mengandalkan relawan manusia untuk menafsirkan gambar atau video secara langsung, pengguna tunanetra dapat mengirimkan gambar atau video ke perangkat mereka dan model akan merespons dengan informasi audio.

OpenAI dan Be My Eyes, kini menjadi mitra terpercaya, membuka jalan menuju kemandirian yang lebih besar bagi individu tunanetra di seluruh dunia. CEO Be My Eyes, Michael Buckley, menjelaskan dampaknya:

“Dalam waktu singkat sejak kami mengaksesnya, kami telah melihat performa yang tak tertandingi dibandingkan alat pengenalan objek gambar-ke-teks lainnya. Implikasinya bagi aksesibilitas global sangat besar. Dalam waktu dekat, komunitas tunanetra dan penglihatan rendah akan memanfaatkan alat ini tidak hanya untuk berbagai kebutuhan interpretasi visual, tetapi juga untuk tingkat kemandirian yang lebih tinggi dalam hidup mereka.”

Three images of smartphones using Be My Eyes. One focuses on an array of patterned neckties, one features a user holding a bottle of sunscreen to the camera, and one holds the camera to show small, colorful houses. — *Be My Eyes menghubungkan pengguna tunanetra dengan relawan untuk menyelesaikan tugas visual. Foto dari Be My Eyes.*

Aksesibilitas Be My Eyes dengan GPT-4o

Layanan baru ini akan mulai diluncurkan pada musim panas 2024. Pengguna akses awal telah menguji fitur visi, video, dan audio baru ini dan memberikan ulasan positif. Walaupun dampak AI kadang menimbulkan kekhawatiran bagi sebagian orang, kemitraan ini jelas menunjukkan dampak positif yang bisa dihasilkan. Memahami manfaat sosial dari AI canggih adalah langkah penting untuk reputasinya.

Bagaimana kita akan menilai model LLM di masa depan?

Karena para pesaing terus berlomba menciptakan LLM termurah dan tercepat, muncul pertanyaan: bagaimana kita akan menilai model AI di masa depan?

Pada titik tertentu, para pembuat LLM utama (kemungkinan OpenAI dan Google) akan mencapai batas kecepatan dan biaya akses model mereka. Setelah biaya dan kecepatan stabil, bagaimana kita menentukan model terdepan di pasar?

Apa yang akan menjadi penanda zaman berikutnya? Apakah kepribadian yang tersedia pada model kecerdasan buatan Anda, kemampuan peningkatan video, fitur yang tersedia untuk pengguna gratis, atau metrik baru di luar pemahaman kita saat ini, generasi LLM berikutnya sudah di depan mata.

Chatbot AI Jadi Mudah

Bagaimana jika chatbot AI Anda secara otomatis disinkronkan dengan setiap pembaruan GPT?

Sejak 2017, Botpress telah menyediakan solusi chatbot AI yang dapat disesuaikan, memberikan pengembang alat yang mereka butuhkan untuk membangun chatbot dengan kekuatan LLM terbaru secara mudah. Chatbot Botpress dapat dilatih dengan sumber pengetahuan khusus – seperti situs web atau katalog produk Anda – dan terintegrasi mulus dengan sistem bisnis.

Satu-satunya platform yang menawarkan mulai dari pengaturan tanpa kode hingga kustomisasi dan pengembangan tanpa batas, Botpress memungkinkan Anda otomatis mendapatkan kekuatan GPT versi terbaru pada chatbot Anda – tanpa usaha tambahan.

Mulai membangun hari ini. Gratis.

Bangun Chatbot AI

Buat chatbot agentik sesuai kebutuhan

Mulai sekarang

FAQ

1. Bagaimana cara mengganti chatbot saya ke GPT-4o di Botpress?

Untuk mengganti chatbot Anda ke GPT-4o di Botpress, buka Botpress Studio, masuk ke pengaturan LLM asisten Anda, dan pilih GPT-4o dari daftar model yang tersedia. Perubahan berlaku langsung tanpa perlu mengubah kode.

2. Apakah ada prasyarat untuk menggunakan GPT-4o di dalam platform Botpress (misalnya, SDK, versi API)?

Tidak, tidak ada prasyarat untuk menggunakan GPT-4o di Botpress. Platform ini mengelola semua SDK, pembaruan API, dan dependensi backend secara otomatis, jadi Anda hanya perlu memilih GPT-4o di pengaturan untuk mengaktifkannya.

3. Apakah GPT-4o dapat dioptimalkan atau disesuaikan untuk kebutuhan bisnis tertentu melalui Botpress?

Meskipun GPT-4o tidak bisa dikustomisasi secara tradisional di Botpress, Anda dapat mengatur respons dan perilakunya menggunakan prompt engineering, logika alur kerja, basis pengetahuan, dan variabel. Ini memungkinkan GPT-4o berperilaku sesuai konteks kebutuhan bisnis Anda tanpa perlu melatih ulang model.

4. Apakah ada batasan dalam penggunaan fitur multimodal (suara, visual) di dalam alur kerja Botpress?

Ya, Botpress saat ini mendukung fitur suara melalui integrasi seperti Twilio atau Dialogflow Voice Gateway, namun kemampuan multimodal seperti pemrosesan gambar atau video belum sepenuhnya didukung. Input berbasis visi masih dalam pertimbangan atau memerlukan solusi alternatif.

5. Apakah ada biaya tersembunyi saat menggunakan fitur lanjutan GPT-4o seperti terjemahan waktu nyata atau input visual?

Tidak, tidak ada biaya tersembunyi untuk menggunakan fitur canggih GPT-4o di Botpress. Kecepatan dan efisiensi GPT-4o sudah termasuk dalam paket Botpress Anda, dan biaya LLM ditanggung oleh Botpress – jadi pengguna tidak dikenakan biaya tambahan untuk menggunakan peningkatan GPT-4o.