- Ujian Turing ialah kaedah yang dicadangkan oleh Alan Turing untuk melihat sama ada mesin boleh meniru perbualan manusia dengan cukup baik sehingga seseorang tidak dapat membezakan sama ada mereka berbual dengan komputer.
- Bukan untuk membuktikan bahawa mesin "berfikir" seperti manusia, ujian ini memeriksa sama ada ia boleh meniru tingkah laku manusia secara meyakinkan melalui dialog, kadang-kadang menggunakan helah seperti kesilapan ejaan atau gaya bahasa santai.
- Lulus Ujian Turing tidak semestinya bermakna mesin itu mempunyai kesedaran; ia hanya menunjukkan ia boleh meniru perbualan manusia dengan meyakinkan, yang mencetuskan perdebatan tentang kecerdasan dan maksud "berfikir."
Apakah ujian Turing dan bagaimana ia berfungsi?
Ujian Turing ialah ujian AI untuk menentukan sama ada, melalui perbualan chat, komputer boleh meyakinkan manusia bahawa ia adalah manusia. Seorang manusia diminta menilai sama ada "individu" yang mereka ajak berbual itu manusia atau komputer. Jika mereka menyangka sedang berbual dengan manusia tetapi sebenarnya dengan komputer, maka komputer itu telah lulus Ujian Turing.
Pada asasnya, ini adalah ujian untuk menilai sama ada komputer boleh meniru manusia dengan cukup meyakinkan sehingga boleh memperdaya manusia supaya percaya mereka berbual dengan manusia. Sudah tentu, terdapat banyak perkara yang boleh dibincangkan mengenai ujian ini.
Apa tujuan ujian Turing?
Ini mungkin kelihatan seperti soalan pelik kerana tujuannya nampak jelas: untuk mengetahui sama ada mesin boleh meniru manusia dengan meyakinkan dalam perbualan chat. Namun, ada pertimbangan yang lebih mendalam.
Adakah kita menguji sama ada mesin benar-benar boleh meniru manusia dari segi pemikiran atau kecerdasan asas, atau sekadar memperdaya manusia supaya percaya ia adalah manusia? Terdapat perbezaan antara kedua-duanya.
Meniru manusia dari segi pemikiran atau kecerdasan asas adalah apa yang biasanya difikirkan orang apabila membincangkan Ujian Turing – iaitu manusia benar-benar tidak dapat membezakan sama ada mereka berbual dengan manusia atau mesin. Namun, ini sebenarnya bukan cara ujian ini direka pada asalnya kerana "memperdaya" manusia dibenarkan. Sebagai contoh, membuat kesilapan ejaan mungkin menjadi cara komputer memperdaya manusia supaya percaya ia adalah manusia kerana mesin tidak akan melakukan kesilapan ejaan.
Masalah asasnya ialah ujian mempunyai peraturan dan oleh itu pasti ada kelemahan. Contohnya, berapa lama anda berbual dengan subjek ujian adalah penting. Lebih mudah meniru manusia dalam masa 5 minit berbanding seratus jam perbualan. Helah mungkin berkesan dalam versi 5 minit tetapi tidak dalam versi seratus jam.
Adakah penting siapa yang menjalankan ujian Turing?
Seorang saintis yang terlatih untuk mengenal pasti mesin berbanding manusia akan jauh lebih sukar untuk diperdaya berbanding orang biasa tanpa latihan – bukan sahaja kerana keupayaan saintis menilai jawapan tetapi juga kerana mereka tahu soalan apa yang perlu ditanya.
Walaupun komputer mempunyai tahap "pemikiran" dan kecerdasan setaraf manusia, itu mungkin masih tidak cukup untuk memperdaya penguji. Ini kerana komputer mungkin terlalu sempurna atau terlalu kurang emosi dalam jawapannya.
Terdapat juga pertimbangan falsafah mengenai Ujian Turing seperti sama ada jika komputer mencapai kecerdasan umum setaraf manusia, adakah itu bermakna mesin boleh "berfikir" atau mempunyai kesedaran. Ini sebahagiannya adalah persoalan yang cuba dielakkan oleh Alan Turing dengan ujian ini. Jika mesin boleh meniru manusia dengan tepat maka dari segi praktikal ia sedang "berfikir".
Sudah tentu, ini tidak bermakna ia mempunyai kesedaran atau berfikir seperti manusia. Malah, sudah pasti ia tidak berfikir seperti manusia. Persoalan sebenar yang menarik ialah apabila dilihat dari sudut praktikal. Kapal terbang boleh terbang, contohnya. Itu yang penting. Kurang menarik jika ia tidak meniru burung dalam cara ia terbang.
Ujian Turing berminat pada hasilnya, bukan pada cara hasil itu dicapai.
Perkara yang lebih penting ialah Ujian Turing biasanya difahami sebagai menggambarkan keadaan di mana kecerdasan mesin telah mencapai sekurang-kurangnya tahap kecerdasan manusia. Hanya sebilangan kecil yang benar-benar berminat sama ada mesin telah lulus Ujian Turing secara teknikal dengan mengambil kira semua kelemahan yang dinyatakan tadi.
Walaupun lulus Ujian Turing boleh menjadi pencapaian teknikal yang mengagumkan, terutamanya jika ujian itu dijalankan dalam tempoh yang lama dan oleh orang yang berpengetahuan, ia jauh kurang mengagumkan berbanding mesin yang boleh memperdaya semua orang, sepanjang masa. Sudah tentu, semakin lama tempoh ujian dijalankan dan semakin tinggi tahap kepakaran penilai, semakin besar kemungkinan kedua-dua senario ini bertemu.
Adakah kita hampir kepada komputer yang berjaya melepasi ujian Turing?
Sekarang anda sudah faham apa itu ujian ini, soalan seterusnya pasti "adakah kita hampir kepada komputer yang boleh melepasi ujian ini?" (iaitu mencapai kecerdasan manusia umum). Jawapan ringkasnya ialah "Tidak".
Walaupun terdapat kemajuan besar dalam Pemprosesan Bahasa Semula Jadi iaitu keupayaan komputer untuk mengenal pasti niat di sebalik satu frasa yang diucapkan (yang merupakan teknologi di sebalik semua pembantu suara), kita masih sangat jauh daripada kecerdasan umum setaraf manusia.
Teknologi semasa ternyata tidak begitu baik dalam menangani kekaburan (memahami maksud di sebalik kenyataan yang samar), memori (menggabungkan fakta yang telah dinyatakan sebelum ini ke dalam perbualan semasa) atau konteks (mengambil kira fakta yang tidak dinyatakan tetapi relevan dengan situasi semasa). Ringkasnya, teknologi semasa masih jauh daripada apa yang diperlukan.
Sebahagian daripada masalahnya ialah teknologi AI semasa perlu belajar menggunakan sejumlah besar data. Mana-mana bidang yang mempunyai data berulang yang banyak sangat sesuai untuk memperkenalkan AI, contohnya pengecaman suara dan pemprosesan imej termasuk kereta pandu sendiri.
Kejayaan dalam NLP didorong oleh fakta bahawa terdapat hampir tiada had data untuk kenyataan dan soalan sekali lalu tanpa konteks atau ingatan. Jika saya berkata "Saya mahu beli jus oren", dalam kebanyakan kes ia adalah kenyataan mudah yang tidak memerlukan maklumat tambahan tentang konteks atau ingatan untuk difahami. Niatnya ialah: “Beli Jus Oren”.
Apabila terdapat konteks atau memori, ini menambah dimensi. Jika saya kata saya mahu “beli jus oren” tetapi sebelum ini saya beritahu anda bahawa saya seorang pedagang kewangan yang berdagang jus oren, maka anda perlu faham bahawa dalam konteks ini saya mahu membeli instrumen kewangan yang akan memberi keuntungan jika harga jus oren naik.
Jadi bagaimana rupa data kita sekarang? “Beli jus oren” bermaksud: membeli sebotol jus oren di kedai ATAU jika sebelum ini telah dinyatakan bahawa mereka adalah pedagang kewangan dalam jus oren, ia bermaksud mereka mahu membeli instrumen kewangan yang berkaitan dengan harga jus oren.
Bagaimana jika pedagang kewangan kita baru sahaja berkata dia dahaga, maka maksudnya dia mahu membeli sebotol jus oren di kedai. Jadi kita tambah satu lagi data: ATAU jika sebelum ini telah dinyatakan bahawa mereka adalah pedagang kewangan dalam jus oren tetapi baru-baru ini menyatakan mereka dahaga, maka maksudnya mereka mahu membeli sebotol jus oren.
Sebuah perusahaan kewangan akan menghadapi masalah besar jika mereka melancarkan bot dagangan yang pengguna percaya mempunyai "kecerdasan" setaraf manusia.
Adakah mustahil untuk melepasi ujian Turing?
Data perbualan mempunyai banyak dimensi, malangnya. Dimensi yang tidak terhingga. Ini bermakna algoritma pembelajaran mesin perlu mempunyai akses kepada set data yang mempunyai sejumlah besar data untuk setiap kemungkinan dimensi, dan itu sudah tentu mustahil.
Ini sudah tentu tidak bermakna lulus Ujian Turing adalah mustahil. Kita tahu ia mungkin kerana kita sudah ada teknologi untuk melakukannya, iaitu otak kita. Sama seperti orang ratusan tahun dahulu tahu bahawa penerbangan itu mungkin dengan memerhatikan burung terbang.
Isunya ialah pendekatan kita terhadap AI dalam hal ini tidak boleh dibina atas data besar kerana data besar dengan dimensi yang mencukupi tidak wujud. Terdapat terlalu banyak pembolehubah, terlalu banyak dimensi. Malah, setiap hari Google menerima 800 juta carian yang tidak pernah dilihat sebelum ini. Itu memberi gambaran betapa sukarnya pendekatan berasaskan data.
Ray Kurtzweil di Google mengikuti pendekatan yang sebahagiannya cuba meniru otak manusia. Beliau menganggarkan bahawa kita akan mencapai kecerdasan umum dan mampu lulus Ujian Turing yang sangat sukar menjelang tahun 2029.
Ramalan beliau berdasarkan anggapan bahawa kemajuan dalam bidang ini akan berkembang secara eksponen dan oleh itu, kemajuan yang kelihatan sederhana hari ini sebenarnya jauh lebih penting jika kita menganggap kita berada di landasan kemajuan eksponen.
Sama ada beliau betul atau tidak, kita perlu tunggu dan lihat, tetapi apa yang jelas ialah sangat tidak mungkin pencapaian besar itu akan berlaku dalam 10 tahun akan datang.
Apakah maksudnya jika sebuah mesin berjaya melepasi ujian Turing yang dipercayai?
Perkara terakhir ialah apa implikasinya jika sebuah mesin berjaya melepasi Ujian Turing yang dipercayai. Jika mesin itu lulus ujian menggunakan pendekatan data besar, seperti cara mesin mengalahkan manusia dalam permainan papan, walaupun yang canggih, kesannya tidak sebesar jika mesin itu lulus menggunakan pendekatan replikasi otak.
Pendekatan replikasi otak bermakna mesin itu mungkin lebih hampir kepada 'berfikir' seperti mana kita takrifkan pemikiran sebagai manusia. Ia boleh mengekstrapolasi makna daripada contoh yang sangat sedikit seperti manusia, dan tidak memerlukan ratusan contoh kes yang sama untuk mengekstrapolasi makna.
Seperti yang disebutkan di atas, lebih berkemungkinan bahawa pendekatan 'replikasi otak' akan membawa kepada kejayaan kerana pendekatan data besar tidak mungkin berlaku. Ini bermakna mesin akan mencapai kecerdasan umum, bukan sekadar dalam perbualan, tetapi dalam pelbagai bidang.
Implikasi perkara ini sangat besar kerana ia boleh membawa kepada perubahan total dalam masyarakat. Ini lebih-lebih lagi jika mesin mampu memperbaiki diri mereka dengan cara yang bermakna, yang boleh menyebabkan peningkatan kecerdasan mereka secara eksponen dalam satu kitaran yang akan mengubah kehidupan seperti yang kita kenal.
Interaksi manusia dengan mesin
Jika kita fokus pada perkara yang lebih biasa, perlu diingat bahawa walaupun mesin setara dengan manusia, itu tidak bermakna kita akan berinteraksi dengan mereka seperti kita berinteraksi dengan manusia. Ini sama juga dengan manusia. Berinteraksi dengan manusia tidak selalu efisien. Menerangkan sesuatu kepada rakan sekerja melalui telefon boleh jadi membosankan dan tidak efisien dalam situasi di mana lebih mudah untuk menunjukkan caranya. Alangkah baiknya jika manusia mempunyai antara muka grafik yang boleh diakses melalui web!
Antara muka suara (atau antara muka berasaskan chat) jelas ada had dari segi memasukkan atau mengeluarkan maklumat. Jelas ada batasan dan situasi di mana lebih efisien untuk menunjukkan maklumat secara grafik, atau klik pada antara muka grafik, berbanding menggunakan antara muka suara. Platform bot oleh itu direka untuk sentiasa cuba membawa pengguna kembali ke laluan utama dan tidak membiarkan perbualan menyimpang.
Maksud saya juga ialah komputer tidak terhad seperti manusia dari segi antara muka yang boleh digunakan untuk menerima atau memberi maklumat, jadi perbualan dengan mesin semestinya akan melibatkan penggunaan antara muka yang paling sesuai untuk tugas tersebut.
Walaupun melepasi Ujian Turing akan menjadi pencapaian besar dalam interaksi manusia / komputer, 'perbualan' sebenar antara manusia dan komputer tidak akan terhad kepada suara dan teks sahaja.
Soalan Lazim
Bagaimana Ujian Turing dibandingkan dengan penanda aras AI lain, seperti Winograd Schema Challenge atau ARC Challenge?
Ujian Turing menguji sama ada AI boleh meniru perbualan manusia, tetapi penanda aras baharu seperti Winograd Schema Challenge dan ARC Challenge lebih menumpukan pada penaakulan, akal budi, dan penyelesaian masalah. Perkara ini mendedahkan kecerdasan yang lebih mendalam berbanding sekadar peniruan di permukaan.
Adakah Ujian Turing masih relevan dalam penyelidikan AI moden, atau ada alternatif yang lebih baik hari ini?
Ujian Turing masih berguna sebagai eksperimen pemikiran dan penanda aras, tetapi ramai penyelidik kini menganggapnya sudah ketinggalan zaman. Ujian moden lebih menumpukan pada pengukuran kefahaman sebenar, logik, dan keupayaan menggeneralisasi.
Bagaimana bias budaya atau bahasa mempengaruhi keputusan Ujian Turing?
Ya. AI boleh salah faham peribahasa, jenaka, atau rujukan yang berkait dengan budaya atau bahasa tertentu, yang menjadikannya lebih mudah dikenali sebagai bukan manusia dalam sesetengah konteks.
Bagaimanakah melepasi Ujian Turing akan mentakrifkan semula maksud menjadi 'manusia'?
Jika sebuah mesin berjaya melepasi Ujian Turing yang ketat, kita mungkin perlu memikirkan semula sama ada keunikan manusia terletak pada biologi atau tingkah laku, dan apa yang sebenarnya menjadikan cara pemikiran kita begitu unik.
Apakah jenis soalan yang paling berkesan untuk mendedahkan sifat bukan manusia dalam AI?
Soalan yang bergantung pada konteks, nuansa emosi, atau logik dunia sebenar—seperti mentafsir sindiran, rujukan samar, atau maklumat yang bercanggah—biasanya paling cepat mendedahkan perbezaan.





.webp)
