Czym jest test Turinga i jak działa?
Test Turinga to test sztucznej inteligencji mający na celu sprawdzenie, czy poprzez rozmowę na czacie komputer może przekonać człowieka, że jest człowiekiem. Człowiek jest proszony o ocenę, czy "osoba", z którą rozmawia, jest człowiekiem czy komputerem. Jeśli oceni, że rozmawia z człowiekiem, ale w rzeczywistości rozmawia z komputerem, komputer zdał test Turinga.
Zasadniczo jest to test mający na celu ocenę, czy komputer może naśladować człowieka tak przekonująco, że może oszukać człowieka, aby myślał, że rozmawia z człowiekiem. Oczywiście jest wiele rzeczy, które należy rozpakować w tym teście.
Jaki jest sens testu Turinga?
Może się to wydawać dziwnym pytaniem, ponieważ cel wydaje się oczywisty: dowiedzieć się, czy maszyna może przekonująco naśladować człowieka w rozmowie na czacie. Istnieją jednak pewne głębsze rozważania.
Czy testujemy, czy maszyna może rzeczywiście naśladować człowieka pod względem podstawowej myśli lub inteligencji, czy tylko oszukać człowieka, że jest człowiekiem? Jest pewna różnica.
Naśladowanie ludzi pod względem podstawowej myśli lub inteligencji jest tym, o czym ludzie zwykle myślą, gdy myślą o teście Turinga - że ludzie naprawdę nie są w stanie odróżnić rozmowy z człowiekiem od rozmowy z maszyną. W rzeczywistości nie był to sposób, w jaki test został początkowo pomyślany, ponieważ "oszukiwanie" ludzi było dozwolone. Na przykład robienie literówek może być dla komputera sposobem na oszukanie człowieka, aby uwierzył, że jest człowiekiem, ponieważ maszyna nigdy nie popełniłaby błędu ortograficznego.
Podstawowy problem polega na tym, że testy rządzą się pewnymi zasadami i dlatego są nieuchronnie wadliwe pod pewnymi względami. Na przykład to, jak długo rozmawiasz z uczestnikiem testu ma znaczenie. Łatwiej jest naśladować człowieka przez 5 minut niż przez sto godzin rozmowy. Sztuczki mogą działać w wersji 5-minutowej, ale nie w wersji stugodzinnej.
Czy ma znaczenie, kto przeprowadza test Turinga?
Naukowiec z przeszkoleniem w zakresie wykrywania maszyn w porównaniu z ludźmi będzie znacznie trudniejszy do oszukania niż ktoś z ulicy bez przeszkolenia - nie tylko ze względu na zdolność naukowca do oceny odpowiedzi, ale także ze względu na wiedzę, jakie pytania zadać.
Nawet jeśli komputer ma poziom "myślenia" i inteligencji na poziomie człowieka, może to nie wystarczyć, aby oszukać testera. Wynika to z faktu, że komputer może być zbyt doskonały lub zbyt nieemocjonalny w swoich reakcjach.
Wokół testu Turinga istnieją nawet rozważania filozoficzne, takie jak to, czy jeśli komputery osiągną uogólnioną inteligencję na poziomie ludzkim, oznaczałoby to, że maszyny mogą "myśleć" lub są świadome. Po części było to pytanie, które Alan Turing próbował ominąć za pomocą tego testu. Jeśli maszyna może dokładnie naśladować człowieka, to pod każdym względem jest "myśląca".
Oczywiście nie oznacza to, że ma świadomość lub że myśli w taki sam sposób, w jaki myśli człowiek. W rzeczywistości jest gwarantowane, że nie myśli w sposób, w jaki myślą ludzie. Prawdziwe zainteresowanie tym pytaniem wynika z praktycznego punktu widzenia. Na przykład samoloty latają. To właśnie jest ważne. Znacznie mniej interesujące jest to, że nie naśladują ptaków w sposobie latania.
Test Turinga interesuje się wynikami, a nie sposobem ich osiągnięcia.
Ważniejszą kwestią jest to, że Test Turinga jest ogólnie rozumiany jako opis stanu rzeczy, w którym inteligencja maszyny osiągnęła co najmniej ludzki poziom inteligencji. Jest to znacznie mniejsza grupa, która jest zainteresowana pytaniem, czy maszyna technicznie przeszła test Turinga, biorąc pod uwagę wszystkie wady opisane powyżej.
Chociaż przejście testu Turinga może być imponującym wyczynem technicznym, zwłaszcza jeśli test jest długotrwały i przeprowadzany przez kompetentnych ludzi, jest to znacznie mniej imponujące niż maszyna, która mogłaby oszukać wszystkich ludzi przez cały czas. Oczywiście im dłuższy okres czasu, w którym test jest przeprowadzany i im wyższy poziom wiedzy oceniających, tym bardziej prawdopodobne jest, że te dwa scenariusze się zbiegną.
Czy jesteśmy blisko komputera, który przejdzie test Turinga?
Teraz, gdy rozumiesz, czym jest test, następne pytanie musi brzmieć: "Czy jesteśmy już blisko tego, by komputer zdał test?". (tj. osiągnięcie uogólnionej ludzkiej inteligencji). Krótka odpowiedź brzmi "nie".
Chociaż poczyniono ogromne postępy w przetwarzaniu języka naturalnego, które jest zdolnością komputera do identyfikowania intencji stojącej za pojedynczą frazą mówioną (która jest technologią napędzającą wszystkich asystentów głosowych), jesteśmy bardzo daleko od uogólnionej inteligencji na poziomie ludzkim.
Okazuje się, że obecna technologia nie radzi sobie zbyt dobrze z dwuznacznością (rozumieniem znaczenia dwuznacznych wypowiedzi), pamięcią (włączaniem wcześniej podanych faktów do bieżącej rozmowy) lub kontekstem (uwzględnianiem faktów, które nie zostały podane, ale są istotne dla bieżącej sytuacji). Krótko mówiąc, obecna technologia jest prawie nigdzie w pobliżu tego, co jest potrzebne.
Częścią problemu jest to, że obecna technologia sztucznej inteligencji musi uczyć się przy użyciu ogromnych ilości danych. Każda dziedzina, w której dostępna jest ogromna ilość powtarzalnych danych, jest gotowa do wprowadzenia sztucznej inteligencji, na przykład rozpoznawanie mowy i przetwarzanie obrazu, w tym autonomiczne samochody.
Sukces w NLP wynika z faktu, że istnieje prawie nieograniczona ilość danych dla jednorazowych stwierdzeń i pytań bez kontekstu lub bez pamięci. Jeśli powiem "Chcę kupić pomarańczę", w większości przypadków jest to proste stwierdzenie, które nie wymaga dodatkowych informacji o kontekście lub pamięci, aby je zrozumieć. Intencją jest: "Kupić sok pomarańczowy".
Gdy w grę wchodzi kontekst lub pamięć, tworzy to wymiarowość. Jeśli powiem, że chcę "kupić sok pomarańczowy", ale wcześniej powiedziałem ci, że jestem inwestorem finansowym, który handluje sokiem pomarańczowym, to musisz zrozumieć, że w tym kontekście chcę kupić instrument finansowy, który zarobi pieniądze, jeśli cena soku pomarańczowego wzrośnie.
Jak teraz wyglądają nasze dane? "Kupić sok pomarańcz owy" oznacza: kupić butelkę soku pomarańczowego w sklepie LUB jeśli dana osoba wcześniej stwierdziła, że jest inwestorem finansowym w sok pomarańczowy, oznacza to, że chce kupić instrument finansowy powiązany z ceną soku pomarańczowego.
A jeśli nasz inwestor finansowy właśnie powiedział, że chce mu się pić, to znaczy, że chce kupić butelkę soku pomarańczowego w sklepie. Dodajemy więc kolejny punkt danych: LUB jeśli wcześniej stwierdził, że jest traderem finansowym w soku pomarańczowym, ale ostatnio stwierdził, że jest spragniony, oznacza to, że chce kupić butelkę soku pomarańczowego.
Przedsiębiorstwo finansowe szybko napotkałoby problemy, gdyby uruchomiło bota handlowego, który według użytkowników posiadałby "inteligencję" na poziomie ludzkim.
Czy zdanie testu Turinga jest niemożliwe?
Dane konwersacji mają niestety wiele wymiarów. Nieskończenie wiele wymiarów. Oznacza to, że algorytmy uczenia maszynowego musiałyby mieć dostęp do zbioru danych, który zawierałby duże ilości danych dla każdego możliwego wymiaru, a to jest oczywiście niemożliwe.
Nie oznacza to oczywiście, że zdanie testu Turinga jest niemożliwe. Wiemy, że jest to możliwe, ponieważ mamy już technologię, która to umożliwia, w naszych mózgach. Podobnie jak setki lat temu ludzie wiedzieli, że lot jest możliwy, obserwując latające ptaki.
Problem polega na tym, że nasze podejście do sztucznej inteligencji nie może być oparte na dużych zbiorach danych, ponieważ duże zbiory danych o wystarczającej wymiarowości nie istnieją. Jest po prostu zbyt wiele zmiennych, zbyt wiele wymiarów. Nawet w tej chwili Google uzyskuje 800 milionów wyszukiwań dziennie, których nigdy wcześniej nie widział. To daje wskazówkę, jak trudne byłoby podejście do danych.
Ray Kurtzweil z Google stosuje podejście, które w pewnym stopniu próbuje odtworzyć ludzki mózg. Oszacował, że do 2029 roku osiągniemy uogólnioną inteligencję i będziemy w stanie przejść bardzo trudny test Turinga.
Jego prognoza opiera się na założeniu, że postęp w tej dziedzinie będzie wykładniczy, a zatem nawet stosunkowo niewielki postęp dzisiaj jest znacznie bardziej znaczący, niż się wydaje, jeśli założymy, że jesteśmy na wykładniczej trajektorii postępu.
Czy ma rację, będziemy musieli poczekać i zobaczyć, ale to, co mówi, to to, że jest bardzo mało prawdopodobne, aby przełom nastąpił w ciągu najbliższych 10 lat.
Co oznaczałoby dla maszyny przejście wiarygodnego testu Turinga?
Ostatnią kwestią jest to, co by to oznaczało, gdyby maszyna zdała wiarygodny test Turinga. Gdyby maszyna zdała test przy użyciu pewnego rodzaju podejścia opartego na dużych zbiorach danych, w podobny sposób, w jaki maszyny pokonują ludzi w grach planszowych, nawet tych wyrafinowanych, implikacje nie byłyby tak duże, jak gdyby maszyna zdała go przy użyciu podejścia opartego na replikacji mózgu.
Podejście polegające na replikacji mózgu oznaczałoby, że maszyna byłaby prawdopodobnie bliższa "myślenia" w sposób, w jaki definiujemy myślenie jako ludzie. Mogłaby ekstrapolować znaczenie z minimalnych przykładów w sposób, w jaki robią to ludzie, zamiast potrzebować setek przykładów dokładnego przypadku, aby ekstrapolować znaczenie.
Jak wspomniano powyżej, bardziej prawdopodobne jest, że podejście "replikacji mózgu" zapewni przełom, ponieważ podejście oparte na dużych zbiorach danych nie jest możliwe. Prawdopodobnie oznaczałoby to, że maszyny osiągnęłyby ogólną inteligencję, nie tylko w rozmowie, ale w wielu dziedzinach.
Implikacji tego nie można przecenić, ponieważ prawdopodobnie doprowadziłoby to do całkowitego zresetowania społeczeństwa. Jest to szczególnie prawdziwe, jeśli maszyny mają zdolność do doskonalenia się w znaczący sposób, co doprowadzi do możliwości wykładniczego wzrostu ich inteligencji w cnotliwym kole, które zmieni życie, jakie znamy.
Interakcja ludzi z maszynami
Trzymając się bardziej przyziemnych spraw, warto pamiętać, że nawet gdyby maszyna była odpowiednikiem człowieka, nie oznacza to, że wchodzilibyśmy z nią w interakcje tak, jak robimy to z ludźmi. Jest to dokładnie to samo, co w przypadku człowieka. Interakcja z ludźmi nie zawsze jest efektywna. Próba wyjaśnienia koledze, jak zrobić coś przez telefon, może być żmudna i nieefektywna w sytuacjach, w których łatwiej byłoby pokazać mu, jak to zrobić. Gdyby tylko ludzie mieli graficzny interfejs dostępny przez Internet!
Interfejsy głosowe (lub interfejsy oparte na czacie) mają wyraźne ograniczenia w zakresie wprowadzania lub wyprowadzania informacji. Oczywiście istnieją ograniczenia i sytuacje, w których znacznie bardziej efektywne jest wyświetlanie informacji graficznie lub klikanie interfejsu graficznego niż korzystanie z interfejsu głosowego. Platformy botów są zatem zaprojektowane tak, aby zawsze próbować sprowadzić użytkownika z powrotem na właściwą ścieżkę i nie pozwolić, aby rozmowa meandrowała.
Chodzi mi również o to, że komputery nie są ograniczone tak jak ludzie pod względem interfejsów, których mogą używać do odbierania lub dostarczania informacji, a zatem rozmowy z maszynami będą koniecznie wymagały użycia optymalnego interfejsu do danego zadania.
Chociaż zdanie testu Turinga byłoby ogromnym kamieniem milowym w zakresie interakcji między człowiekiem a komputerem, rzeczywiste "rozmowy" między człowiekiem a komputerem nie będą ograniczać się tylko do głosu i tekstu.
Spis treści
Bądź na bieżąco z najnowszymi informacjami na temat agentów AI
Udostępnij to na: