- Tes Turing adalah metode yang diusulkan oleh Alan Turing untuk melihat apakah mesin dapat meniru percakapan manusia dengan cukup baik sehingga seseorang tidak bisa membedakan apakah mereka sedang berbicara dengan komputer.
- Alih-alih membuktikan bahwa mesin “berpikir” seperti manusia, tes ini memeriksa apakah mesin bisa meniru perilaku manusia secara meyakinkan melalui dialog, kadang menggunakan trik seperti salah ketik atau gaya bicara santai.
- Lolos Tes Turing tidak serta-merta berarti mesin tersebut memiliki kesadaran; itu hanya menunjukkan bahwa mesin bisa meniru percakapan manusia dengan sangat baik, yang memicu perdebatan tentang kecerdasan dan apa arti “berpikir”.
Apa itu tes Turing dan bagaimana cara kerjanya?
Tes Turing adalah sebuah tes AI untuk melihat apakah, melalui percakapan chat, sebuah komputer dapat meyakinkan manusia bahwa dirinya adalah manusia. Seorang manusia diminta menilai apakah “orang” yang dia ajak bicara adalah manusia atau komputer. Jika dia menilai sedang berbicara dengan manusia padahal sebenarnya dengan komputer, maka komputer tersebut telah lulus Tes Turing.
Intinya, ini adalah tes untuk menilai apakah komputer bisa meniru manusia dengan sangat meyakinkan hingga bisa menipu manusia bahwa mereka sedang berbicara dengan manusia. Tentu saja, ada banyak hal yang perlu dibahas tentang tes ini.
Apa tujuan dari tes Turing?
Ini mungkin terdengar seperti pertanyaan aneh karena tujuannya tampak jelas: untuk mengetahui apakah mesin bisa meniru manusia secara meyakinkan dalam percakapan chat. Namun, ada pertimbangan yang lebih dalam.
Apakah kita menguji apakah mesin benar-benar bisa meniru manusia dalam hal pemikiran atau kecerdasan yang mendasar, atau hanya sekadar menipu manusia agar percaya bahwa ia adalah manusia? Ada perbedaan di antara keduanya.
Meniru manusia dalam hal pemikiran atau kecerdasan yang mendasar adalah apa yang biasanya orang pikirkan ketika membahas Tes Turing – bahwa manusia benar-benar tidak bisa membedakan apakah mereka sedang berbicara dengan manusia atau mesin. Namun, sebenarnya bukan begitu cara tes ini awalnya dirancang karena “menipu” manusia diperbolehkan. Misalnya, membuat kesalahan ketik bisa menjadi cara komputer menipu manusia agar percaya bahwa ia adalah manusia, karena mesin biasanya tidak membuat kesalahan ejaan.
Masalah dasarnya adalah tes memiliki aturan dan karenanya pasti memiliki kekurangan. Misalnya, berapa lama Anda berbicara dengan subjek tes itu penting. Lebih mudah meniru manusia selama 5 menit daripada selama seratus jam percakapan. Trik mungkin berhasil dalam versi 5 menit, tapi tidak untuk versi seratus jam.
Apakah penting siapa yang melakukan tes Turing?
Seorang ilmuwan yang terlatih untuk membedakan mesin dan manusia akan jauh lebih sulit untuk ditipu dibandingkan orang biasa tanpa pelatihan – bukan hanya karena kemampuan ilmuwan dalam mengevaluasi jawaban, tapi juga karena mereka tahu pertanyaan apa yang harus diajukan.
Bahkan jika komputer memiliki tingkat “berpikir” dan kecerdasan setara manusia, itu mungkin belum cukup untuk menipu penguji. Sebab, komputer bisa saja terlalu sempurna atau terlalu datar dalam merespons.
Ada juga pertimbangan filosofis seputar Tes Turing, seperti apakah jika komputer mencapai kecerdasan umum setara manusia, itu berarti mesin bisa “berpikir” atau memiliki kesadaran. Ini sebagian adalah pertanyaan yang coba dilewati Alan Turing dengan tes ini. Jika mesin bisa meniru manusia dengan akurat, maka untuk semua tujuan praktis, ia sedang “berpikir”.
Tentu saja, itu tidak berarti mesin tersebut memiliki kesadaran atau berpikir dengan cara yang sama seperti manusia. Faktanya, sudah pasti mesin tidak berpikir seperti manusia. Yang menarik dari pertanyaan ini adalah jika dilihat dari sudut pandang praktis. Pesawat terbang, misalnya. Itulah yang penting. Tidak terlalu menarik jika mereka tidak meniru burung dalam cara terbangnya.
Tes Turing lebih tertarik pada hasil, bukan pada bagaimana hasil itu dicapai.
Hal yang lebih penting adalah Tes Turing umumnya dipahami sebagai gambaran di mana kecerdasan mesin telah mencapai setidaknya tingkat kecerdasan manusia. Hanya sebagian kecil yang benar-benar tertarik pada pertanyaan apakah mesin secara teknis telah lolos Tes Turing, mengingat semua kekurangan yang sudah disebutkan.
Meskipun lolos Tes Turing bisa menjadi pencapaian teknis yang mengesankan, terutama jika tesnya berlangsung lama dan dilakukan oleh orang-orang yang ahli, itu jauh kurang mengesankan dibandingkan mesin yang bisa menipu semua orang, setiap saat. Tentu saja, semakin lama periode tes berlangsung dan semakin tinggi tingkat keahlian penilai, semakin besar kemungkinan kedua skenario ini akan bertemu.
Apakah kita sudah dekat dengan komputer yang bisa lolos tes Turing?
Sekarang setelah Anda memahami apa itu tes ini, pertanyaan berikutnya pasti "apakah kita sudah hampir memiliki komputer yang bisa lolos tes ini?" (yaitu mencapai kecerdasan manusia yang umum). Jawaban singkatnya adalah “Tidak”.
Meskipun ada kemajuan besar dalam Pemrosesan Bahasa Alami yang merupakan kemampuan komputer untuk mengenali maksud di balik satu frasa yang diucapkan (teknologi yang digunakan di semua asisten suara), kita masih sangat jauh dari kecerdasan umum setara manusia.
Ternyata, teknologi saat ini belum terlalu baik dalam hal ambiguitas (memahami makna di balik pernyataan yang ambigu), memori (menggabungkan fakta yang sudah disebutkan ke dalam percakapan saat ini), atau konteks (mempertimbangkan fakta yang tidak disebutkan tapi relevan dengan situasi saat ini). Singkatnya, teknologi saat ini hampir tidak memenuhi apa yang dibutuhkan.
Sebagian masalahnya adalah teknologi AI saat ini perlu belajar dengan menggunakan data dalam jumlah sangat besar. Setiap bidang yang memiliki data berulang dalam jumlah besar sangat cocok untuk penerapan AI, misalnya pengenalan suara dan pemrosesan gambar termasuk mobil otonom.
Keberhasilan dalam NLP didorong oleh fakta bahwa ada hampir tak terbatas data untuk pernyataan dan pertanyaan satu kali tanpa konteks atau memori. Jika saya mengatakan “Saya ingin membeli orange”, dalam banyak kasus itu adalah pernyataan sederhana yang tidak memerlukan informasi tambahan tentang konteks atau memori untuk memahaminya. Maksudnya adalah: “Beli Orange Juice”.
Ketika ada konteks atau memori yang terlibat, ini menambah dimensi. Jika saya berkata ingin “beli jus jeruk” tapi sebelumnya saya sudah bilang bahwa saya adalah seorang trader keuangan yang memperdagangkan jus jeruk, maka Anda harus memahami bahwa dalam konteks ini saya ingin membeli instrumen keuangan yang akan menghasilkan uang jika harga jus jeruk naik.
Jadi sekarang seperti apa data kita? “Beli jus jeruk” bisa berarti: membeli sebotol jus jeruk di toko ATAU jika sebelumnya sudah disebutkan bahwa dia adalah trader keuangan jus jeruk, berarti dia ingin membeli instrumen keuangan yang terkait dengan harga jus jeruk.
Bagaimana jika trader keuangan kita baru saja bilang dia haus, maka maksudnya dia ingin membeli sebotol jus jeruk di toko. Jadi kita tambahkan satu data lagi: ATAU jika sebelumnya sudah disebutkan bahwa dia adalah trader keuangan jus jeruk tapi baru saja bilang dia haus, berarti dia ingin membeli sebotol jus jeruk.
Sebuah perusahaan keuangan akan cepat mengalami masalah jika mereka meluncurkan bot trading yang diyakini pengguna memiliki "kecerdasan" setara manusia.
Apakah lolos tes Turing itu mustahil?
Data percakapan memiliki banyak dimensi, sayangnya. Tak terbatas. Ini berarti algoritma machine learning harus memiliki akses ke dataset dengan data dalam jumlah besar untuk setiap kemungkinan dimensi, dan itu tentu saja mustahil.
Tentu saja, ini tidak berarti lolos Tes Turing itu mustahil. Kita tahu itu mungkin karena kita sudah punya teknologi untuk melakukannya, yaitu otak kita. Sama seperti orang ratusan tahun lalu tahu bahwa terbang itu mungkin dengan mengamati burung terbang.
Masalahnya adalah pendekatan kita terhadap AI dalam hal ini tidak bisa dibangun dengan big data karena big data dengan dimensi yang cukup tidak ada. Terlalu banyak variabel, terlalu banyak dimensi. Bahkan saat ini Google menerima 800 juta pencarian per hari yang belum pernah mereka lihat sebelumnya. Itu memberi gambaran betapa sulitnya pendekatan berbasis data.
Ray Kurtzweil di Google mengikuti pendekatan yang sampai batas tertentu mencoba meniru otak manusia. Ia memperkirakan kita akan mencapai kecerdasan umum dan mampu lolos Tes Turing yang sangat sulit pada tahun 2029.
Prediksinya didasarkan pada asumsi bahwa kemajuan di bidang ini akan bersifat eksponensial, sehingga bahkan kemajuan yang tampak sederhana hari ini sebenarnya jauh lebih signifikan jika kita menganggap kita berada di jalur kemajuan yang eksponensial.
Apakah dia benar atau tidak, kita harus menunggu dan melihat, namun yang jelas, sangat kecil kemungkinannya terobosan besar akan terjadi dalam 10 tahun ke depan.
Apa artinya bagi sebuah mesin untuk melewati Turing Test yang kredibel?
Poin terakhir adalah apa maknanya jika sebuah mesin berhasil melewati Turing Test yang kredibel. Jika mesin tersebut lulus dengan menggunakan pendekatan big data, seperti cara mesin mengalahkan manusia dalam permainan papan, bahkan yang rumit sekalipun, dampaknya tidak akan sebesar jika mesin itu lulus dengan pendekatan replikasi otak.
Pendekatan replikasi otak berarti mesin tersebut kemungkinan lebih dekat dengan cara 'berpikir' seperti yang kita definisikan sebagai manusia. Mesin bisa menafsirkan makna dari contoh yang sangat sedikit seperti manusia, bukan membutuhkan ratusan contoh kasus yang sama untuk memahami makna.
Seperti disebutkan di atas, kemungkinan besar pendekatan 'replikasi otak' yang akan membawa terobosan karena pendekatan big data tidak memungkinkan. Ini berarti mesin akan mencapai kecerdasan umum, tidak hanya dalam percakapan, tetapi juga di berbagai bidang.
Dampak dari hal ini sangat besar karena kemungkinan akan menyebabkan perubahan total dalam masyarakat. Terutama jika mesin mampu meningkatkan dirinya sendiri secara signifikan, yang bisa menyebabkan peningkatan kecerdasan secara eksponensial dalam lingkaran yang terus berkembang dan mengubah kehidupan seperti yang kita kenal.
Interaksi manusia dengan mesin
Jika kita bicara soal hal-hal yang lebih praktis, perlu diingat bahwa meskipun mesin setara dengan manusia, bukan berarti kita akan berinteraksi dengan mereka seperti kita berinteraksi dengan manusia. Ini sama saja dengan manusia. Berinteraksi dengan manusia tidak selalu efisien. Menjelaskan sesuatu kepada rekan kerja lewat telepon bisa jadi melelahkan dan tidak efisien, terutama jika lebih mudah menunjukkan langsung caranya. Andai saja manusia punya antarmuka grafis yang bisa diakses lewat web!
Antarmuka suara (atau berbasis chat) jelas memiliki keterbatasan dalam hal memasukkan atau mengeluarkan informasi. Ada situasi di mana jauh lebih efisien untuk menampilkan informasi secara grafis, atau mengklik antarmuka grafis, daripada menggunakan antarmuka suara. Platform bot karena itu dirancang untuk selalu mengarahkan pengguna kembali ke jalur utama dan tidak membiarkan percakapan menyimpang terlalu jauh.
Maksud saya juga, komputer tidak terbatas seperti manusia dalam hal antarmuka yang dapat digunakan untuk menerima atau memberikan informasi, sehingga percakapan dengan mesin pasti akan melibatkan penggunaan antarmuka yang paling optimal untuk tugas yang sedang dikerjakan.
Meskipun melewati Turing Test akan menjadi tonggak besar dalam interaksi manusia dan komputer, percakapan antara manusia dan komputer sebenarnya tidak akan terbatas hanya pada suara dan teks.
FAQ
Bagaimana Turing Test dibandingkan dengan tolok ukur AI lain, seperti Winograd Schema Challenge atau ARC Challenge?
Turing Test menguji apakah AI bisa meniru percakapan manusia, sedangkan tolok ukur baru seperti Winograd Schema Challenge dan ARC Challenge lebih menekankan pada penalaran, akal sehat, dan pemecahan masalah. Hal-hal yang menunjukkan kecerdasan lebih dalam, bukan sekadar meniru permukaan.
Apakah Turing Test masih dianggap relevan dalam penelitian AI modern, atau ada alternatif yang lebih baik saat ini?
Turing Test masih berguna sebagai eksperimen pemikiran dan tonggak sejarah, tetapi banyak peneliti sekarang menganggapnya sudah ketinggalan zaman. Tes modern lebih fokus pada pengukuran pemahaman, logika, dan kemampuan generalisasi yang sebenarnya.
Bagaimana bias budaya atau bahasa memengaruhi hasil Turing Test?
Ya. AI bisa salah memahami idiom, humor, atau referensi yang terkait dengan budaya atau bahasa tertentu, sehingga lebih mudah dikenali sebagai non-manusia dalam konteks tertentu.
Bagaimana melewati Turing Test akan mendefinisikan ulang apa arti menjadi 'manusia'?
Jika sebuah mesin berhasil melewati Turing Test yang ketat, kita mungkin harus mempertimbangkan ulang apakah 'kemanusiaan' itu soal biologi atau perilaku, dan apa yang sebenarnya membuat cara berpikir kita begitu unik.
Jenis pertanyaan apa yang biasanya paling efektif untuk mengungkap sifat non-manusia pada AI?
Pertanyaan yang mengandalkan konteks, nuansa emosi, atau akal sehat sehari-hari—seperti menafsirkan sarkasme, referensi samar, atau informasi yang saling bertentangan—biasanya paling cepat membongkar sifat non-manusia AI.





.webp)
