'Chatbot' dalam Bahasa Portugis adalah program yang dapat memahami dan menganalisis percakapan dalam bahasa Portugis. Saat ini, chatbot tersebut dapat menjaga dialog antara manusia dan komputer dengan sangat lancar.

Kemajuan terbaru dalam Pemrosesan Bahasa Alami (NLP) memungkinkan pembuatan chatbot dalam Bahasa Portugis, dengan mempertimbangkan keunikan bahasa. Kemajuan ini menggunakan Pembelajaran Mesin (Machine Learning/ML) untuk memahami tidak hanya struktur bahasa, tetapi juga makna kata dan konteksnya.

Membuat chatbot AI dalam bahasa Portugis

Bahasa Portugis adalah bahasa keenam yang paling banyak digunakan di dunia, setengahnya berada di Brasil, dan meskipun dekat dengan bahasa Latin lainnya, ada dua keunikan utama:

  • Ada banyak kata serupa palsu (false cognates), yaitu kata-kata yang tampak mirip tetapi berbeda makna. Dalam pt_PT, propina berarti pembayaran bulanan, sedangkan dalam pt_BR berarti suap. Bahkan di Brasil, makna kata bisa berbeda: di timur laut negara itu, kata "cabra" digunakan untuk menyebut seorang pria, tetapi di wilayah lain hanya digunakan untuk menyebut hewan.
  • Penggunaan konteks yang intens membuat interpretasi chatbot dalam bahasa Portugis menjadi sangat menantang. Kata "chega" bisa berarti kata kerja ("dia tiba besok") atau permintaan untuk berhenti ("cukup pembicaraannya").

Selain itu, terdapat ungkapan idiomatik yang benar-benar berbeda di antara penutur dari berbagai negara, sehingga terkadang membuat pemahaman menjadi sangat sulit, bahkan untuk satu kalimat.

Apakah keunikan ini membuat pekerjaan chat dalam bahasa Portugis menjadi sulit? Tidak mengherankan, jawabannya adalah ya.

Chatbot dalam Bahasa Portugis: tantangan NLP

Hal di atas menimbulkan tantangan untuk NLP pada chatbot berbahasa Portugis. Langkah pertama untuk setiap algoritma Pemrosesan Bahasa Alami adalah memahami bahasa, yaitu menganalisis kalimat menjadi unit-unit makna kecil, atau "token". Tugas ini disebut "tokenisasi" (sebagai catatan, salah satu ciri khas Portugis Brasil adalah menggunakan kata asing dan 'membrasilkannya'). Jadi, semakin sistematis dan teratur bahasanya, semakin mudah proses tokenisasinya.

Sebelum kita memahami arti kemajuan terbaru NLP, kita perlu memahami bagaimana model pemahaman NLP dibuat.

Di masa lalu

Dalam beberapa hal, memahami bagaimana chatbot dalam Bahasa Portugis (atau bahasa apa pun) dibuat berarti melakukan perjalanan waktu.

Penelitian awal untuk menangani ketidakpastian bahasa dapat ditemukan pada dekade 1940-an, melalui artikel dari neuroanatomis dan psikiater Warren McCulloch dari Massachusetts Institute of Technology, dan matematikawan Walter Pitts dari University of Illinois. Mereka meletakkan dasar teoretis yang memungkinkan John von Neumann menulis “The General and Logical Theory of Automata”, pada akhir 1940-an.

Kemajuan yang memungkinkan komputer memiliki daya pemrosesan semakin besar menjadi pilar lain yang membawa riset NLP dari laboratorium ilmiah ke laboratorium perusahaan dan lembaga pemerintah yang fokus pada penggunaan teknologi baru dalam kehidupan sehari-hari.

Sejarah NLP sendiri secara khusus dimulai pada 1950-an, ketika Alan Turing menerbitkan artikel “Computing Machinery and Intelligence”, yang mengusulkan apa yang kini dikenal sebagai Uji Turing sebagai kriteria kecerdasan.

Namun, sejak akhir 1980-an, terjadi revolusi dalam NLP dengan diperkenalkannya algoritma pembelajaran mesin untuk pemrosesan bahasa. Hal ini didorong oleh peningkatan daya komputasi dan berkurangnya dominasi teori linguistik “chomskyan”, yang dasar teoretisnya menghambat penggunaan korpus linguistik yang mendasari pendekatan pembelajaran mesin pada pemrosesan bahasa. Otomatisasi ini dilakukan dengan membagi kalimat menjadi blok-blok kecil dan menerapkan aturan statistik untuk mengkatalogkan dan mengidentifikasi hubungan antar blok tersebut. Proses ini disebut “tokenisasi”, yang telah dijelaskan di atas.

Namun, pekerjaan men-tokenisasi bahasa membutuhkan banyak intervensi manual dari peneliti NLP. Setiap bahasa harus di-tokenisasi secara independen dan pada dasarnya manual.

Pekerjaan men-tokenisasi bahasa ini sangat sulit untuk robot yang menangani bahasa dengan konteks tinggi, seperti yang bisa Anda bayangkan.

Setelah bahasa di-tokenisasi, algoritma AI dapat diterapkan untuk memahami bahasa, yaitu membangun peta makna tentang bagaimana kata-kata dalam bahasa saling berhubungan.

Tahap pemahaman bahasa ini bisa diotomatisasi jika tokenisasi dapat diandalkan. Namun, masalahnya adalah tokenisasi itu rumit, sehingga bahkan algoritma pemahaman pun harus dikonfigurasi secara manual bersama dengan tokenisasi.

Dan hasil akhirnya tidak memuaskan. Misalnya, tingkat pemahaman Bahasa Portugis dibandingkan dengan Bahasa Inggris tergolong sedang. Tentu saja, selalu ada lebih banyak fokus riset pada Bahasa Inggris daripada Portugis, tetapi kesulitan menangani konteks dalam Bahasa Portugis membuat hasilnya sulit maksimal.

Seperti yang biasa dilakukan peneliti AI, mereka bertanya-tanya apakah tokenisasi itu sendiri bisa dilakukan dengan pembelajaran mesin. Ini akan memungkinkan algoritma tokenisasi dan pemahaman menjadi agnostik terhadap bahasa (tidak tergantung bahasa) dan membuat pelatihan AI dalam bahasa apa pun menjadi jauh lebih cepat dan baik.

Kemajuan terbaru dalam Kecerdasan Buatan

Dan di sinilah inovasi terjadi pada akhir 2018: AI dapat dilatih dalam bahasa Portugis tanpa intervensi manual, sehingga performa NLP menjadi jauh lebih baik.

Platform Multibahasa

Bekerja dengan berbagai bahasa di berbagai platform pasar bisa menjadi tantangan. Beberapa platform mengharuskan chatbot dengan bahasa berbeda dibangun sebagai bot terpisah, yang jelas tidak efisien dari segi skalabilitas dan pemeliharaan.

Oleh karena itu, platform yang baik harus benar-benar mendukung multibahasa dan memungkinkan berbagai terjemahan dari konten yang sama di antarmuka pengguna.

Selain itu, bahasa harus dapat diatur sebagai variabel dalam percakapan, sehingga AI dapat mendeteksi bahasa tersebut secara akurat dan desainer percakapan dapat merancang logika berdasarkan bahasa itu.

Selain fitur khusus bahasa, untuk menciptakan chatbot yang hebat dalam bahasa apa pun, fitur umum dari platform chatbot juga harus unggul. Ada dua kategori fitur yang penting.

  • Yang pertama adalah teknologi pemahaman bahasa alami secara umum (atau, seperti disebutkan di atas, algoritma NLP). Platform yang berkinerja baik tidak hanya akan independen bahasa, tetapi algoritma NLP dasarnya menggunakan teknologi terbaru dan bekerja dengan baik secara keseluruhan. Penting agar platform memiliki fitur terkait NLP, seperti pengisian 'slot' (potongan informasi yang diambil dari konteks untuk membentuk kumpulan data dalam format “kunci/nilai”) dan pencocokan intent yang berorientasi pada konteks dialog.
  • Kategori kedua adalah fungsionalitas umum platform. Platform harus memungkinkan desainer membuat pengalaman chatbot yang sangat memuaskan bagi pengguna akhir dengan mudah, termasuk integrasi yang mudah dengan sistem lama dan pihak ketiga. Jika tidak memiliki fungsionalitas ini atau sulit digunakan, maka tidak relevan apakah platform tersebut berbahasa Portugis atau tidak.

Akhirnya, kualitas pengalaman chatbot yang dibuat untuk pengguna akhir sangat bergantung pada kekuatan alat yang digunakan untuk membuatnya, mulai dari pemahaman bahasa hingga pendekatan antarmuka grafis/teks.

Membangun chatbot terbaik dalam bahasa Portugis

Bahkan dengan platform yang baik, masih ada tantangan dalam membuat chatbot dalam Bahasa Portugis. Jumlah studi dalam Bahasa Portugis di dunia AI masih terbatas, sehingga mendapatkan sumber daya yang tepat untuk proyek bisa cukup sulit.

Walaupun Anda tidak perlu mencari sumber daya untuk menulis algoritma dasar NLP, karena sudah tersedia, menemukan desainer yang kompeten dan memahami perbedaan idiomatik antar kelompok pengguna chatbot Portugis bisa menjadi tantangan. Hal ini sangat relevan untuk Bahasa Portugis, mengingat penggunaan ekspresi idiomatik berbasis konteks yang luas.

Oleh karena itu, penting agar platform chatbot memungkinkan konten dan terjemahan mudah diperbarui dan dikelola oleh non-teknis, karena kemungkinan besar desainer dan pengembang tidak menguasai aspek budaya dari berbagai varian Bahasa Portugis.

Jelas, semakin akuratnya chatbot berkualitas tinggi dalam Bahasa Portugis berarti adopsi teknologi ini akan meningkat dalam beberapa tahun ke depan. Peningkatan adopsi ini akan mengatasi masalah keterbatasan sumber daya dan memungkinkan calon pembeli teknologi mendapatkan gambaran jelas tentang praktik terbaik untuk hasil terbaik.

Ringkasan

Inovasi dalam teknologi NLP tidak hanya berlaku untuk chatbot berbahasa Portugis, tetapi juga aplikasi AI lainnya. Kini kita melihat sistem multifungsi yang menggunakan AI dalam Bahasa Portugis dengan berbagai cara, mulai dari analisis sentimen pada berita dan komentar, hingga merangkum atau menghasilkan teks yang sebelumnya hanya bisa dilakukan manusia. Umumnya, chatbot berbahasa Portugis digunakan sebagai antarmuka pengguna tidak hanya untuk berbagai teknologi AI, tetapi juga membantu pengguna akhir menggunakan sistem lain seperti situs web atau aplikasi web, atau bahkan sebagai penasihat belanja dan/atau pengambilan keputusan.

Tentu saja, meskipun ada lompatan besar dalam kekuatan NLP berbahasa Portugis, hasilnya masih bisa lebih baik. Penelitian terus dilakukan untuk meningkatkan mesin NLP dan pasti akan ada kemajuan baru. Sampai NLP mencapai tingkat manusia, selalu ada pekerjaan yang harus dilakukan.

Langkah berikutnya untuk semua mesin NLP, terlepas dari bahasanya, adalah melakukan pekerjaan yang lebih baik dalam dialog multi-putaran. Ini berarti memungkinkan manusia melakukan percakapan bertahap dengan bot dalam topik terbatas, bukan hanya memberikan perintah atau pertanyaan. Dan langkah selanjutnya untuk platform chatbot adalah memudahkan pembuatan dialog multi-putaran.

Dialog multi-putaran sangat penting untuk antarmuka suara seperti Alexa atau perangkat seperti Google Home.

Walaupun kita telah membahas kemajuan dalam tokenisasi berbasis machine learning dan implikasinya untuk NLP berbahasa Portugis, topik terkait adalah transkripsi ucapan ke teks dalam Bahasa Portugis. Transkripsi ucapan ke teks untuk Bahasa Portugis masih berkembang dibandingkan bahasa lain – meskipun perbedaan performa semakin kecil. Kami berharap kemajuan NLP yang dijelaskan di sini dan yang sedang dilakukan di seluruh dunia akan semakin memperkecil kesenjangan ini di masa mendatang.