Wat is de Turingtest en hoe werkt hij?
DeTuringtest is een AI-test om te zien of een computer in een chatgesprek een mens ervan kan overtuigen dat hij een mens is. Een mens wordt gevraagd om te beoordelen of de "persoon" met wie hij spreekt een mens of een computer is. Als de computer oordeelt dat hij met een mens spreekt, maar in werkelijkheid met een computer, dan heeft de computer de Turingtest doorstaan.
In wezen is het een test om te beoordelen of een computer een mens zo overtuigend kan imiteren dat een mens denkt dat hij met een mens spreekt. Natuurlijk zijn er veel dingen uit te pakken over deze test.
Wat is het nut van de Turingtest?
Dit lijkt misschien een vreemde vraag omdat het punt voor de hand lijkt te liggen: weten of een machine overtuigend een mens kan imiteren in een chatgesprek. Er zijn echter enkele diepere overwegingen.
Testen we of een machine echt een mens kan imiteren in termen van onderliggende gedachten of intelligentie of houden we een mens alleen maar voor de gek dat hij een mens is? Er is een verschil.
Mensen imiteren in termen van onderliggende gedachten of intelligentie is waar mensen meestal aan denken als ze aan de Turing Test denken - dat mensen echt niet in staat zijn om het verschil te zien tussen chatten met een mens of een machine. Dit was eigenlijk niet de manier waarop de test aanvankelijk was opgezet, omdat het "misleiden" van mensen was toegestaan. Het maken van typefouten zou bijvoorbeeld een manier kunnen zijn voor een computer om een mens te laten geloven dat het een mens was, omdat een machine nooit een spelfout zou maken.
Het onderliggende probleem is dat tests regels hebben en daarom onvermijdelijk op sommige punten fouten bevatten. Het maakt bijvoorbeeld uit hoe lang je met de testpersoon praat. Het is makkelijker om een mens na te doen in 5 minuten dan in 100 uur conversatie. Trucs werken misschien in de 5 minuten versie maar niet in de 100 uur versie.
Maakt het uit wie de Turingtest uitvoert?
Een wetenschapper die getraind is in het herkennen van machines versus mensen zal veel moeilijker voor de gek te houden zijn dan iemand van de straat zonder training - niet alleen vanwege het vermogen van de wetenschapper om antwoorden te evalueren, maar ook omdat hij weet welke vragen hij moet stellen.
Zelfs als de computer een niveau van "denken" en intelligentie heeft op het niveau van een mens, kan dat niet genoeg zijn om de tester voor de gek te houden. Dat komt omdat de computer te perfect of te emotieloos kan reageren.
Er zijn zelfs filosofische overwegingen rond de Turing Test, zoals de vraag of als computers een algemene intelligentie van menselijk niveau bereiken, dit zou betekenen dat machines kunnen "denken" of bewust zijn. Dit was deels een vraag die Alan Turing probeerde te omzeilen met deze test. Als een machine nauwkeurig een mens kan imiteren, dan is het in alle opzichten "denkend".
Dat betekent natuurlijk niet dat het bewustzijn heeft of dat het op dezelfde manier denkt als een mens. Het is zelfs gegarandeerd dat het niet denkt op de manier waarop mensen denken. Het echte belang van deze vraag ligt in een praktisch oogpunt. Vliegtuigen vliegen bijvoorbeeld. Dat is wat belangrijk is. Het is veel minder interessant dat ze geen vogels imiteren in de manier waarop ze vliegen.
De Turing Test is geïnteresseerd in de resultaten, niet in de manier waarop de resultaten worden behaald.
Een belangrijker punt is dat de Turing Test in het algemeen wordt opgevat als een beschrijving van een situatie waarin de intelligentie van een machine ten minste het niveau van de menselijke intelligentie heeft bereikt. Het is een veel kleinere groep die geïnteresseerd is in de vraag of een machine technisch gezien geslaagd is voor een Turing Test, rekening houdend met alle gebreken die hierboven beschreven zijn.
Hoewel het slagen voor een Turingtest een indrukwekkende technische prestatie kan zijn, vooral als de test lang duurt en wordt uitgevoerd door mensen met kennis van zaken, is het veel minder indrukwekkend dan een machine die alle mensen altijd voor de gek kan houden. Natuurlijk is het zo dat hoe langer de test duurt en hoe hoger het expertiseniveau van de beoordelaars, hoe waarschijnlijker het is dat deze twee scenario's samenvallen.
Zijn we in de buurt van een computer die de Turingtest doorstaat?
Nu je begrijpt wat de test is, moet de volgende vraag zijn "zijn we al in de buurt van een computer die de test doorstaat?". (d.w.z. het bereiken van gegeneraliseerde menselijke intelligentie). Het korte antwoord is "Nee".
Hoewel er enorme vooruitgang is geboekt in Natural Language Processing, het vermogen van een computer om de intentie achter een enkele gesproken zin te identificeren (dit is de technologie die alle spraakassistenten aanstuurt), zijn we nog ver verwijderd van een algemene intelligentie op menselijk niveau.
Het blijkt dat de huidige technologie niet erg goed is in ambiguïteit (het begrijpen van de betekenis achter dubbelzinnige uitspraken), geheugen (het verwerken van eerder genoemde feiten in het huidige gesprek) of context (het meenemen van feiten die niet genoemd zijn maar wel relevant zijn voor de huidige situatie). Kortom, de huidige technologie voldoet bij lange na niet aan wat nodig is.
Een deel van het probleem is dat de huidige AI-technologie moet leren door gebruik te maken van enorme hoeveelheden gegevens. Elk domein waar een enorme hoeveelheid repetitieve data beschikbaar is, is rijp voor de introductie van AI, bijvoorbeeld spraakherkenning en beeldverwerking, inclusief zelfrijdende auto's.
Succes in NLP wordt gedreven door het feit dat er bijna onbeperkte gegevens zijn voor eenmalige uitspraken en vragen zonder context of geheugen. Als ik zeg "Ik wil sinaasappelsap kopen" is dat in de meeste gevallen een simpele uitspraak die geen extra informatie over context of geheugen nodig heeft om te begrijpen. De bedoeling is: "Sinaasappelsap kopen".
Als er context of geheugen in het spel is, creëert dit dimensionaliteit. Als ik zeg dat ik "sinaasappelsap wil kopen", maar ik heb je eerder verteld dat ik een financiële handelaar ben die handelt in sinaasappelsap, dan moet je begrijpen dat ik in deze context een financieel instrument wil kopen dat geld oplevert als de prijs van sinaasappelsap stijgt.
Hoe zien onze gegevens er nu uit? "Sinaasappelsap kopen" betekent: een fles sinaasappelsap kopen in de winkel OF als hij/zij eerder heeft aangegeven dat hij/zij een financiële handelaar in sinaasappelsap is, betekent dit dat hij/zij een financieel instrument wil kopen dat gekoppeld is aan de prijs van sinaasappelsap.
Wat als onze financiële handelaar net heeft gezegd dat hij dorst heeft, dan bedoelt hij dat hij een fles sinaasappelsap wil kopen in de winkel. Dus voegen we nog een gegevenspunt toe: OF als eerder heeft verklaard dat ze een financiële handelaar in sinaasappelsap zijn, maar ze hebben onlangs verklaard dat ze dorst hebben, dan betekent dit dat ze een fles sinaasappelsap willen kopen.
Een financiële onderneming zou snel in de problemen komen als ze een trading bot lanceerden waarvan gebruikers dachten dat die "intelligentie" op menselijk niveau had.
Is slagen voor de Turingtest onmogelijk?
Gespreksgegevens hebben helaas vele dimensies. Oneindig veel dimensies. Dit betekent dat de algoritmen voor machinaal leren toegang zouden moeten hebben tot een dataset met grote hoeveelheden gegevens voor elke mogelijke dimensie, en dat is natuurlijk onmogelijk.
Dit betekent natuurlijk niet dat het slagen voor de Turingtest onmogelijk is. We weten dat het mogelijk is omdat we de technologie om het te doen al in onze hersenen hebben zitten. Net zoals mensen honderden jaren geleden wisten dat vliegen mogelijk was door vogels te zien vliegen.
Het probleem is dat onze benadering van AI in dit geval niet kan worden gebouwd op big data omdat big data met voldoende dimensionaliteit niet bestaat. Er zijn gewoon te veel variabelen, te veel dimensies. Zelfs op dit moment krijgt Google 800 miljoen zoekopdrachten per dag die het nog nooit eerder heeft gezien. Dat geeft je een idee van hoe moeilijk de data-aanpak zou zijn.
Ray Kurtzweil van Google volgt een aanpak die tot op zekere hoogte het menselijk brein probeert na te bootsen. Hij heeft geschat dat we tegen 2029 een gegeneraliseerde intelligentie zullen hebben en in staat zullen zijn om een zeer moeilijke Turingtest te doorstaan.
Zijn voorspelling is gebaseerd op de aanname dat de vooruitgang op dit gebied exponentieel zal zijn en dat daarom zelfs relatief bescheiden vooruitgang vandaag de dag veel belangrijker is dan het lijkt als je aanneemt dat we ons op een exponentieel traject van vooruitgang bevinden.
Of hij gelijk heeft zullen we moeten afwachten, maar wat het je wel vertelt is dat het hoogst onwaarschijnlijk is dat de doorbraak in de komende 10 jaar zal plaatsvinden.
Wat zou het betekenen voor een machine om te slagen voor een geloofwaardige Turingtest?
Het laatste punt is wat het zou betekenen als een machine zou slagen voor een geloofwaardige Turingtest. Als de machine de test zou doorstaan met behulp van een soort big data aanpak, op een vergelijkbare manier als machines mensen verslaan in bordspellen, zelfs geavanceerde spellen, dan zouden de implicaties niet zo groot zijn als wanneer de machine de test zou doorstaan met behulp van een hersensimulatie aanpak.
De benadering van hersenreplicatie zou betekenen dat de machine waarschijnlijk dichter bij "denken" zou staan op de manier zoals wij denken als mensen definiëren. Het zou betekenis kunnen extrapoleren uit minimale voorbeelden op de manier waarop mensen dat doen, in plaats van honderden voorbeelden van het exacte geval nodig te hebben om betekenis te extrapoleren.
Zoals hierboven vermeld, is het waarschijnlijker dat een "hersenreplicatie"-benadering voor de doorbraak zal zorgen omdat een big data-benadering niet mogelijk is. Dit zou waarschijnlijk betekenen dat machines een algemene intelligentie zouden hebben bereikt, niet alleen in conversatie, maar in meerdere domeinen.
De implicatie hiervan kan niet worden overschat omdat dit waarschijnlijk zou leiden tot een complete reset van de maatschappij. Dit geldt vooral als machines het vermogen hebben om zichzelf op zinvolle manieren te verbeteren, wat zal leiden tot de mogelijkheid van een exponentiële toename van hun intelligentie in een opwaartse spiraal die het leven zoals wij dat kennen zal veranderen.
Menselijke interactie met machines
Om bij de meer alledaagse zaken te blijven, is het goed om in gedachten te houden dat zelfs als een machine het equivalent van een mens zou zijn, dat nog niet betekent dat we er op dezelfde manier mee om zouden gaan als met mensen. Dit is precies hetzelfde als met een mens. Interactie met mensen is niet altijd efficiënt. Aan je collega via de telefoon proberen uit te leggen hoe hij iets moet doen, kan vervelend en inefficiënt zijn in situaties waarin het gemakkelijker zou zijn om hem te laten zien hoe hij het moet doen. Hadden mensen maar een grafische interface op het web!
Spraakinterfaces (of chatgebaseerde interfaces) hebben duidelijk beperkingen wat betreft het invoeren of uitvoeren van informatie. Er zijn duidelijk beperkingen en situaties waarin het veel efficiënter is om informatie grafisch weer te geven, of op een grafische interface te klikken, dan om een spraakinterface te gebruiken. Bot-platforms zijn daarom zo ontworpen dat ze altijd proberen de gebruiker terug te brengen op het gelukkige pad en het gesprek niet laten afdwalen.
Mijn punt is ook dat computers niet beperkt zijn zoals mensen in termen van de interfaces die ze kunnen gebruiken om informatie te ontvangen of te verstrekken en daarom zullen gesprekken met machines noodzakelijkerwijs het gebruik van de optimale interface voor de betreffende taak inhouden.
Hoewel het slagen voor de Turingtest een enorme mijlpaal zou zijn op het gebied van interactie tussen mens en computer, zullen de daadwerkelijke "gesprekken" tussen mens en computer niet beperkt blijven tot alleen spraak en tekst.
Inhoudsopgave
Blijf op de hoogte van het laatste nieuws over AI-agenten
Deel dit op: