Meskipun Anda menggunakannya setiap hari, Anda mungkin masih memiliki pertanyaan tentang cara kerja ChatGPT.
Mari kita telusuri lebih dalam di balik layar chatbot AI paling populer di dunia.
Gambaran Umum: Cara Kerja ChatGPT
Jika Anda hanya punya waktu 20 detik, berikut cara kerja ChatGPT:
- Anda mengirim permintaan. 'Tolong tulis sebuah email.'
- ChatGPT memecah masukan menjadi token untuk diproses.
- Ia menggunakan NLP untuk menganalisis masukan dan memahami konteks.
- Ia memprediksi kata berikutnya menggunakan pola yang dipelajari dari data pelatihan.
- Ia memfokuskan perhatian pada bagian paling relevan dari masukan Anda (menggunakan mekanisme attention).
- ChatGPT menghasilkan respons lengkap, kata demi kata, lalu mengirimkannya kembali kepada Anda.
Itulah langkah-langkah dasar bagaimana ChatGPT menerima dan merespons pertanyaan.
Apa arti GPT?
GPT pada ChatGPT adalah singkatan dari ‘generative pre-trained transformer’. Ketiga elemen ini adalah kunci untuk memahami cara kerja ChatGPT.
1. Generatif
ChatGPT adalah model AI generatif—ia dapat menghasilkan teks, kode, gambar, dan suara. Contoh lain AI generatif adalah alat pembuat gambar seperti DALL-E atau generator audio.
2. Pra-Pelatihan
Aspek 'pra-latih' pada ChatGPT membuatnya seolah-olah tahu segalanya di internet. Model GPT dilatih dengan data dalam jumlah besar melalui proses yang disebut 'pembelajaran tanpa pengawasan'.
Sebelum ChatGPT, model AI dibangun dengan pembelajaran terawasi—diberi masukan dan keluaran yang sudah diberi label, lalu diajarkan untuk memetakan satu ke yang lain. Proses ini cukup lambat karena dataset harus dikumpulkan manusia.
Ketika model GPT awal dilatih dengan dataset besar, mereka menyerap pola bahasa dan makna kontekstual dari berbagai sumber.
Inilah sebabnya ChatGPT menjadi chatbot pengetahuan umum—ia sudah dilatih dengan dataset besar sebelum dirilis ke publik.
Pengguna yang ingin melatih mesin GPT lebih lanjut—agar menjadi ahli dalam tugas tertentu, seperti menulis laporan untuk organisasi Anda—dapat menggunakan teknik untuk menyesuaikan LLM.
3. Transformer
Transformer adalah jenis arsitektur jaringan saraf yang diperkenalkan dalam makalah tahun 2017 berjudul "Attention is All You Need" oleh Vaswani dkk. Sebelum transformer, model seperti recurrent neural networks (RNN) dan long short-term memory (LSTM) umum digunakan untuk memproses urutan teks.
RNN dan LSTM membaca masukan teks secara berurutan, seperti manusia. Namun, arsitektur transformer mampu memproses dan mengevaluasi setiap kata dalam kalimat secara bersamaan, sehingga bisa menilai kata mana yang lebih relevan, meskipun berada di tengah atau akhir kalimat. Ini disebut mekanisme self-attention.
Contoh kalimat: “Tikus itu tidak muat di kandang karena terlalu besar.”
Transformer dapat menilai kata ‘tikus’ lebih penting daripada ‘kandang’, dan dengan benar mengidentifikasi bahwa ‘itu’ dalam kalimat tersebut merujuk pada tikus.
Namun, model seperti RNN mungkin mengartikan ‘itu’ sebagai kandang, karena itu adalah kata benda yang terakhir diproses.
Aspek ‘transformer’ memungkinkan ChatGPT memahami konteks dengan lebih baik dan menghasilkan respons yang lebih cerdas dibanding pendahulunya.
Pemrosesan Bahasa Alami
Salah satu hal yang membuat ChatGPT terasa seperti sulap adalah karena ia menggunakan pemrosesan bahasa alami. Ia dapat mengobrol bolak-balik dengan kita karena mampu memproses dan memahami bahasa manusia secara alami.
Apa itu pemrosesan bahasa alami?
Pemrosesan bahasa alami (NLP) adalah cabang kecerdasan buatan yang berfokus pada interaksi antara komputer dan manusia melalui bahasa alami.
Teknologi ini memungkinkan mesin memahami, menafsirkan, dan menghasilkan bahasa manusia dengan cara yang bermakna dan bermanfaat.
NLP vs NLU vs NLG
NLP adalah bidang luas yang mencakup berbagai sub-disiplin, termasuk natural language understanding (NLU) dan natural language generation (NLG).
NLP adalah ranah utama, sedangkan NLU dan NLG adalah bidang khusus di dalamnya. Ini karena pemrosesan bahasa alami harus melibatkan pemahaman, lalu menghasilkan bahasa selama percakapan dua arah.
Bagaimana cara kerja NLP?
NLU memecah bahasa manusia untuk menafsirkan makna dan maksudnya. Berikut langkah-langkah kerjanya:
- Teks diproses terlebih dahulu untuk menghapus elemen yang tidak diperlukan (seperti tanda baca dan kata-kata umum).
- Sistem mengidentifikasi komponen penting seperti entitas, kata kunci, dan frasa dari teks.
- Ia menganalisis struktur kalimat untuk memahami hubungan antar kata dan konsep.
- Model NLU memetakan elemen yang dikenali ke maksud atau tujuan tertentu.
- Mesin NLU menyempurnakan pemahamannya berdasarkan konteks dan riwayat interaksi pengguna.
Sistem memberikan keluaran terstruktur yang dapat memicu tindakan atau respons yang sesuai.
Proses Pelatihan ChatGPT
ChatGPT dilatih melalui dua tahap: pra-pelatihan dan penyempurnaan (fine-tuning).
Pra-pelatihan
Pertama, model AI diekspos pada sejumlah besar data teks—dari buku, situs web, dan file lainnya.
Selama pra-pelatihan, model belajar memprediksi kata berikutnya dalam sebuah kalimat, yang membantunya memahami pola dalam bahasa. Pada dasarnya, model membangun pemahaman statistik tentang bahasa, sehingga dapat menghasilkan teks yang terdengar koheren.
Fine-tuning
Setelah pra-pelatihan, model disempurnakan dengan dataset yang lebih spesifik. Untuk ChatGPT, ini termasuk dataset yang dikurasi khusus untuk percakapan.
Bagian penting dari tahap ini melibatkan Reinforcement Learning from Human Feedback (RLHF), di mana pelatih manusia memberi peringkat pada respons model. Umpan balik ini membantu ChatGPT meningkatkan kemampuannya menghasilkan respons yang tepat, membantu, dan akurat secara kontekstual.
Istilah Kunci ChatGPT
Token
Unit teks (kata atau bagian dari kata) yang diproses oleh model. Masukan dan keluaran ChatGPT diubah menjadi token untuk efisiensi komputasi.
Zero-shot learning
Kemampuan model untuk melakukan tugas yang belum secara khusus dilatih, dengan mengandalkan pengetahuan umumnya.
One-shot learning melibatkan pemberian satu contoh pada model, sedangkan n-shot learning melibatkan pemberian banyak contoh agar model dapat belajar.
Mekanisme attention
Komponen pada model transformer yang memungkinkannya memfokuskan perhatian pada bagian tertentu dari teks masukan saat menghasilkan respons.
Halusinasi
Model AI ‘berhalusinasi’ ketika menghasilkan informasi yang salah atau tidak masuk akal. Halusinasi dapat dikurangi dengan strategi seperti retrieval-augmented generation (RAG).
Penalaran berantai (chain of thought reasoning)
Metode yang membantu model berpikir langkah demi langkah, sehingga meningkatkan kemampuannya menangani permintaan atau tugas yang kompleks.
Beberapa model ChatGPT sudah secara otomatis menggunakan strategi ini—seperti model OpenAI o1 terbaru. Namun Anda bisa meminta versi mana pun untuk melakukan penalaran berantai: cukup minta model menjelaskan alasannya langkah demi langkah.
Pra-pelatihan
Fase awal di mana model dilatih pada dataset besar untuk mempelajari pola bahasa sebelum disempurnakan untuk tugas tertentu.
Fine-tuning
Proses menyempurnakan model pada dataset atau tugas yang lebih sempit untuk meningkatkan performa pada kasus penggunaan tertentu.
Jendela konteks
Batas jumlah teks masukan yang dapat dipertimbangkan model saat menghasilkan respons.
Jendela konteks yang kecil berarti Anda tidak bisa mengirim laporan panjang dan meminta ringkasan—model akan ‘melupakan’ bagian awal dokumen.
Cara Menyesuaikan ChatGPT
Ada beberapa cara untuk menyesuaikan LLM yang kuat, seperti mesin GPT yang mendukung ChatGPT. Menyesuaikan agen LLM Anda sendiri tidak sesulit yang Anda bayangkan.
GPT Kustom
OpenAI memungkinkan penggunanya menyesuaikan GPT sesuai kebutuhan. Anda bisa menginstruksikan GPT kustom untuk membantu Anda mempelajari aturan permainan papan tertentu, mendesain poster band rock metal, atau mengajarkan konsep AI.
Agen AI kustom
Dengan kemajuan teknologi AI, kini mudah (dan gratis) membuat agen AI berbasis LLM sendiri.
Mulai dari pembuat drag-and-drop tanpa kode, hingga ekosistem pemrograman tingkat lanjut, ada platform pembuat AI yang hebat untuk berbagai kebutuhan dan tingkat keahlian.
Membangun agen berbasis LLM sendiri berarti Anda dapat merancang asisten AI khusus yang menjadwalkan rapat Anda dan membuat laporan metrik mingguan. Atau Anda bisa membangun agen AI untuk dukungan pelanggan yang dapat digunakan di WhatsApp. Pilihannya sangat banyak.
Buat Chatbot Berbasis GPT Gratis
ChatGPT adalah chatbot generalis, tetapi Anda bisa memanfaatkan mesin GPT dari OpenAI untuk membangun chatbot AI khusus sesuai kebutuhan Anda.
Manfaatkan kekuatan LLM terbaru dengan chatbot khusus buatan Anda sendiri.
Botpress adalah platform chatbot AI yang fleksibel dan sangat dapat dikembangkan. Pengguna dapat membangun agen AI atau chatbot untuk berbagai kebutuhan.
Integrasikan chatbot Anda ke platform atau saluran apa pun, atau pilih dari pustaka integrasi siap pakai kami. Mulailah dengan tutorial dari channel YouTube Botpress atau kursus gratis dari Botpress Academy.
Mulai membangun hari ini. Gratis.
FAQ
1. Bagaimana ChatGPT dibandingkan dengan chatbot AI lain seperti Google Bard atau Claude?
ChatGPT unggul dalam penalaran terstruktur dan pemrograman, Bard (dari Google) terintegrasi erat dengan pencarian dan data real-time dari Google, sedangkan Claude (dari Anthropic) dirancang untuk keamanan dan konteks memori yang lebih panjang.
2. Apakah ChatGPT dapat memahami dan menghasilkan teks dalam berbagai bahasa dengan sama baiknya?
ChatGPT dapat memahami dan menghasilkan teks dalam banyak bahasa, tetapi kefasihan dan akurasi tertingginya ada pada bahasa Inggris. Meski performanya cukup baik pada bahasa yang banyak digunakan seperti Spanyol, Prancis, atau Jerman, performa bisa menurun pada bahasa yang secara struktural lebih kompleks.
3. Apakah ChatGPT "berpikir" atau "memahami" seperti manusia?
ChatGPT tidak berpikir atau memahami seperti manusia. Ia tidak memiliki kesadaran atau pemahaman sejati. ChatGPT menghasilkan respons dengan memprediksi kata berikutnya yang paling mungkin berdasarkan pola yang dipelajari selama pelatihan, tanpa pemahaman yang sebenarnya.
4. Apakah ChatGPT bias? Bagaimana bias diukur atau diatasi pada LLM?
Ya, ChatGPT dapat menunjukkan bias yang berasal dari data pelatihannya, termasuk bias sosial atau budaya. OpenAI mengurangi bias ini dengan teknik seperti reinforcement learning from human feedback (RLHF), red-teaming, dan pemantauan berkelanjutan, meskipun menghilangkan bias sepenuhnya adalah tantangan.
5. Seberapa sering ChatGPT diperbarui dengan informasi baru?
ChatGPT tidak diperbarui secara real time; pengetahuannya bersifat statis dan didasarkan pada data pelatihan hingga tanggal tertentu. Pembaruan hanya terjadi saat OpenAI merilis versi baru atau melatih ulang model, sehingga ChatGPT mungkin tidak mencerminkan peristiwa terbaru kecuali penjelajahan web diaktifkan pada versi tertentu.







