RAG memungkinkan organisasi untuk menerapkan AI - dengan risiko yang lebih kecil daripada penggunaan LLM tradisional.
Generasi yang dilengkapi dengan retrieval menjadi lebih populer karena semakin banyak bisnis yang memperkenalkan solusi AI. Chatbot perusahaan awal mengalami kesalahan dan halusinasi yang berisiko.
RAG memungkinkan perusahaan untuk memanfaatkan kekuatan LLMs sambil membumikan output generatif dalam pengetahuan bisnis mereka yang spesifik.
Apa yang dimaksud dengan generasi yang ditambah dengan pengambilan?
Retrieval-augmented generation (RAG) dalam AI adalah teknik yang menggabungkan a) pengambilan informasi eksternal yang relevan dan b) respons yang dihasilkan oleh AI, untuk meningkatkan akurasi dan relevansi.
Alih-alih mengandalkan pembuatan model bahasa yang besar (LLMs), respons dari model RAG diinformasikan oleh basis pengetahuan yang ditentukan oleh pembangun agen AI - seperti halaman web perusahaan atau dokumen kebijakan SDM.
RAG beroperasi dalam dua langkah utama:
1. Pengambilan
Model ini mencari dan mengambil data yang relevan dari sumber yang terstruktur atau tidak terstruktur (misalnya basis data, PDF, file HTML, atau dokumen lainnya). Sumber-sumber ini dapat terstruktur (misalnya tabel) atau tidak terstruktur (misalnya situs web yang disetujui).
2. Generasi
Setelah pengambilan, informasi dimasukkan ke dalam LLM. LLM menggunakan informasi tersebut untuk menghasilkan respons bahasa alami, menggabungkan data yang disetujui dengan kemampuan linguistiknya sendiri untuk menciptakan respons yang akurat, seperti manusia, dan sesuai dengan merek.
Contoh kasus penggunaan RAG
Apa gunanya RAG? RAG memungkinkan organisasi untuk memberikan output yang relevan, informatif, dan akurat.
RAG adalah cara langsung untuk mengurangi risiko keluaran LLM yang tidak akurat atau halusinasi.
Contoh 1: Firma Hukum
Firma hukum dapat menggunakan RAG dalam sistem AI untuk:
- Cari kasus hukum, preseden, dan putusan hukum yang relevan dari basis data dokumen selama penelitian.
- Buat ringkasan kasus dengan mengekstrak fakta-fakta kunci dari berkas perkara dan putusan sebelumnya.
- Secara otomatis memberikan pembaruan peraturan yang relevan kepada karyawan.
Contoh 2: Agen Real Estat
Agen real estat dapat menggunakan RAG dalam sistem AI untuk:
- Merangkum data dari riwayat transaksi properti dan statistik kejahatan di lingkungan sekitar.
- Menjawab pertanyaan hukum tentang transaksi properti dengan mengutip undang-undang dan peraturan properti setempat.
- Sederhanakan proses penilaian dengan mengambil data dari laporan kondisi properti, tren pasar, dan penjualan historis.
Contoh 3: Toko E-Commerce
E-commerce dapat menggunakan RAG dalam sistem AI untuk:
- Kumpulkan informasi produk, spesifikasi, dan ulasan dari basis data perusahaan untuk memberikan rekomendasi produk yang sesuai dengan kebutuhan Anda.
- Ambil riwayat pesanan untuk menghasilkan pengalaman berbelanja yang disesuaikan dengan preferensi pengguna.
- Hasilkan kampanye email yang ditargetkan dengan mengambil data segmentasi pelanggan dan menggabungkannya dengan pola pembelian terkini.
Manfaat RAG
Seperti yang diketahui oleh siapa pun yang pernah bertanya ChatGPT atau Claude tahu, LLMs memiliki pengamanan minimal yang sudah terpasang.
Tanpa pengawasan yang tepat, mereka bisa menghasilkan informasi yang tidak akurat atau bahkan berbahaya, sehingga tidak dapat diandalkan untuk penerapan di dunia nyata.
RAG menawarkan solusi dengan mendasarkan respons pada sumber data tepercaya dan terkini, yang secara signifikan mengurangi risiko ini.
Mencegah halusinasi dan ketidakakuratan
Model bahasa tradisional sering kali menimbulkan halusinasi - tanggapan yang terdengar meyakinkan tetapi sebenarnya tidak benar atau tidak relevan.
RAG mengurangi halusinasi dengan mendasarkan respons pada sumber data yang dapat diandalkan dan sangat relevan.
Langkah pengambilan kembali memastikan model merujuk pada informasi yang akurat dan terkini, yang secara signifikan mengurangi kemungkinan halusinasi dan meningkatkan keandalan.
Mengambil informasi terkini
Meskipun LLMs adalah alat yang ampuh untuk banyak tugas, mereka tidak dapat memberikan informasi yang akurat tentang informasi yang langka atau terbaru - termasuk pengetahuan bisnis yang dipesan lebih dahulu.
Tetapi RAG memungkinkan model untuk mengambil informasi waktu nyata dari sumber apa pun, termasuk situs web, tabel, atau basis data.
Hal ini memastikan bahwa, selama sumber kebenaran diperbarui, model akan merespons dengan informasi terkini.
Berkomunikasi dalam konteks yang kompleks
Kelemahan lain dari penggunaan LLM tradisional adalah hilangnya informasi kontekstual. LLMs kesulitan mempertahankan konteks dalam percakapan yang panjang atau kompleks. Hal ini sering kali menghasilkan tanggapan yang tidak lengkap atau terpecah-pecah.
Tetapi model RAG memungkinkan kesadaran konteks dengan menarik informasi secara langsung dari sumber data yang terkait secara semantik.
Dengan informasi tambahan yang ditujukan secara khusus untuk kebutuhan pengguna - seperti chatbot penjualan yang dilengkapi dengan katalog produk - RAG memungkinkan agen AI untuk berpartisipasi dalam percakapan kontekstual.
Cara kerja RAG, langkah demi langkah
1. Unggah Dokumen
Pertama, pembangun mengunggah dokumen atau file ke perpustakaan agen AI mereka. File tersebut dapat berupa halaman web, PDF, atau format lain yang didukung, yang merupakan bagian dari basis pengetahuan AI.
2. Konversi Dokumen
Karena ada banyak jenis file - PDF, halaman web, dll. - sistem mengonversi file-file ini ke dalam format teks standar, sehingga lebih mudah bagi AI untuk memproses dan mengambil informasi yang relevan.
3. Pemotongan dan Penyimpanan
Dokumen yang dikonversi kemudian dipecah menjadi bagian yang lebih kecil dan mudah dikelola, atau potongan-potongan. Potongan-potongan ini disimpan dalam database, sehingga agen AI dapat secara efisien mencari dan mengambil bagian yang relevan selama kueri.
4. Permintaan Pengguna
Setelah basis pengetahuan disiapkan, pengguna dapat mengajukan pertanyaan kepada agen AI. Pertanyaan tersebut diproses menggunakan pemrosesan bahasa alami (NLP ) untuk memahami apa yang ditanyakan oleh pengguna.
5. Pengambilan Pengetahuan
Agen AI mencari melalui potongan-potongan yang tersimpan, menggunakan algoritme pencarian untuk menemukan informasi yang paling relevan dari dokumen yang diunggah yang dapat menjawab pertanyaan pengguna.
6. Generasi
Terakhir, agen AI akan menghasilkan respons dengan menggabungkan informasi yang diambil dengan kemampuan model bahasanya, membuat jawaban yang koheren dan akurat secara kontekstual berdasarkan kueri dan data yang diambil.
Fitur-fitur lanjutan dari RAG
Jika Anda bukan seorang pengembang, Anda mungkin akan terkejut mengetahui bahwa tidak semua RAG dibuat sama.
Sistem yang berbeda akan membangun model RAG yang berbeda, tergantung pada kebutuhan, kasus penggunaan, atau kemampuan keahlian mereka. Beberapa platform AI akan menawarkan fitur RAG tingkat lanjut t
Pemotongan semantik vs naif
Naive chunking adalah ketika sebuah dokumen dipecah menjadi beberapa bagian dengan ukuran tetap, seperti memotong teks menjadi beberapa bagian yang terdiri dari 500 kata, tanpa memperhatikan makna atau konteksnya.
Di sisi lain, pemotongan semantik memecah dokumen menjadi beberapa bagian yang bermakna berdasarkan kontennya. Pemenggalan ini mempertimbangkan jeda alami, seperti paragraf atau topik, untuk memastikan bahwa setiap bagian berisi informasi yang koheren.
Kutipan wajib
Untuk industri yang mengotomatiskan percakapan berisiko tinggi dengan AI - seperti keuangan atau perawatan kesehatan - kutipan dapat membantu menanamkan kepercayaan pada pengguna saat menerima informasi.
Pengembang dapat menginstruksikan model RAG mereka untuk memberikan kutipan untuk setiap informasi yang dikirim.
Misalnya, jika seorang karyawan meminta informasi kepada chatbot AI tentang tunjangan kesehatan, chatbot dapat merespons dan memberikan tautan ke dokumen tunjangan karyawan yang relevan.
Bangun agen AI Anda sendiri dengan RAG
Kombinasikan kekuatan LLMs terbaru dengan pengetahuan perusahaan Anda yang unik.
Botpress adalah platform chatbot AI yang fleksibel dan dapat dikembangkan tanpa batas. Platform ini memungkinkan pengguna untuk membangun semua jenis agen AI atau chatbot untuk kasus penggunaan apa pun - dan menawarkan sistem RAG yang paling canggih di pasar.
Integrasikan chatbot Anda ke platform atau saluran apa pun, atau pilih dari pustaka integrasi yang telah dibuat sebelumnya. Mulailah dengan tutorial dari saluran YouTube Botpress atau dengan kursus gratis dari Botpress Academy .
Mulai membangun hari ini. Gratis.
Daftar Isi
Dapatkan informasi terbaru tentang agen AI
Bagikan ini: