Was ist der Turing-Test und wie funktioniert er?
DerTuring-Test ist ein KI-Test, bei dem geprüft wird, ob ein Computer einen Menschen in einem Chat-Gespräch davon überzeugen kann, dass er ein Mensch ist. Ein Mensch wird gebeten, zu beurteilen, ob die "Person", mit der er spricht, ein Mensch oder ein Computer ist. Wenn er der Meinung ist, dass er mit einem Menschen spricht, es sich aber tatsächlich um einen Computer handelt, hat der Computer den Turing-Test bestanden.
Im Wesentlichen handelt es sich um einen Test, bei dem geprüft wird, ob ein Computer einen Menschen so überzeugend imitieren kann, dass er einem Menschen vorgaukelt, er spreche mit einem Menschen. Natürlich gibt es bei diesem Test viele Dinge zu klären.
Was ist der Sinn des Turing-Tests?
Diese Frage mag seltsam anmuten, denn das Ziel liegt auf der Hand: Wir wollen wissen, ob eine Maschine einen Menschen in einem Chatgespräch überzeugend imitieren kann. Es gibt jedoch einige tiefergehende Überlegungen.
Testen wir, ob eine Maschine einen Menschen in Bezug auf das zugrundeliegende Denken oder die Intelligenz wirklich imitieren kann oder ob sie einem Menschen nur vorgaukelt, dass sie ein Mensch ist? Das ist ein Unterschied.
Wenn man an den Turing-Test denkt, denkt man in der Regel an die Nachahmung von Menschen in Bezug auf das zugrundeliegende Denken oder die Intelligenz - dass Menschen wirklich nicht in der Lage sind, einen Unterschied zwischen einem Gespräch mit einem Menschen oder einer Maschine zu erkennen. So war der Test ursprünglich nicht gedacht, denn es war erlaubt, Menschen "auszutricksen". Zum Beispiel könnte ein Computer mit Tippfehlern einen Menschen dazu bringen, ihn für einen Menschen zu halten, da eine Maschine niemals einen Rechtschreibfehler machen würde.
Das eigentliche Problem ist, dass Tests Regeln haben und daher zwangsläufig in gewisser Weise fehlerhaft sind. Es kommt zum Beispiel darauf an, wie lange man mit der Testperson spricht. Es ist leichter, einen Menschen in 5 Minuten zu imitieren als in einem hundertstündigen Gespräch. Tricks funktionieren vielleicht in der 5-Minuten-Version, aber nicht in der Hundert-Stunden-Version.
Ist es wichtig, wer den Turing-Test durchführt?
Ein Wissenschaftler, der darin geschult ist, Maschinen von Menschen zu unterscheiden, wird viel schwerer zu täuschen sein als jemand, der nicht geschult ist - nicht nur wegen seiner Fähigkeit, Antworten zu bewerten, sondern auch, weil er weiß, welche Fragen er stellen muss.
Selbst wenn der Computer über ein "Denkvermögen" und eine Intelligenz auf dem Niveau eines Menschen verfügt, reicht dies möglicherweise nicht aus, um den Prüfer zu täuschen. Das liegt daran, dass der Computer zu perfekt oder zu emotionslos in seinen Antworten sein könnte.
Es gibt sogar philosophische Überlegungen zum Turing-Test, wie z. B. die Frage, ob es bedeutet, dass Maschinen "denken" können oder ein Bewusstsein haben, wenn Computer eine verallgemeinerte menschliche Intelligenz erreichen. Dies war zum Teil eine Frage, die Alan Turing mit diesem Test zu umgehen versuchte. Wenn eine Maschine einen Menschen genau imitieren kann, dann ist sie in jeder Hinsicht "denkend".
Das bedeutet natürlich nicht, dass es ein Bewusstsein hat oder auf dieselbe Weise denkt wie ein Mensch. Es ist sogar garantiert, dass es nicht so denkt, wie der Mensch denkt. Das eigentliche Interesse an dieser Frage liegt in der praktischen Betrachtung. Flugzeuge fliegen zum Beispiel. Das ist das Wichtigste. Es ist viel weniger interessant, dass sie die Vögel in ihrer Flugweise nicht imitieren.
Der Turing-Test ist an den Ergebnissen interessiert, nicht an der Art und Weise, wie die Ergebnisse erzielt werden.
Ein wichtigerer Punkt ist, dass der Turing-Test im Allgemeinen so verstanden wird, dass er einen Zustand beschreibt, in dem die Maschinenintelligenz mindestens das Niveau der menschlichen Intelligenz erreicht hat. Es ist eine viel kleinere Gruppe, die sich für die Frage interessiert, ob eine Maschine einen Turing-Test technisch bestanden hat, wenn man alle oben beschriebenen Mängel berücksichtigt.
Das Bestehen eines Turing-Tests ist zwar eine beeindruckende technische Leistung, vor allem, wenn der Test lange läuft und von sachkundigen Personen durchgeführt wird, aber es ist weit weniger beeindruckend als eine Maschine, die alle Menschen die ganze Zeit über täuschen kann. Je länger der Test läuft und je höher das Fachwissen der Auswerter ist, desto wahrscheinlicher ist es, dass diese beiden Szenarien zusammentreffen.
Sind wir kurz davor, dass ein Computer den Turing-Test besteht?
Da Sie nun wissen, worum es bei dem Test geht, muss die nächste Frage lauten: "Sind wir in der Nähe eines Computers, der den Test besteht?" (d.h. eine verallgemeinerte menschliche Intelligenz zu erreichen). Die kurze Antwort lautet "Nein".
Zwar hat es enorme Fortschritte bei der Verarbeitung natürlicher Sprache gegeben, d. h. bei der Fähigkeit eines Computers, die Absicht hinter einem einzelnen gesprochenen Satz zu erkennen (dies ist die Technologie, die alle Sprachassistenten antreibt), doch sind wir von einer verallgemeinerten Intelligenz auf menschlichem Niveau noch sehr weit entfernt.
Es stellt sich heraus, dass die derzeitige Technologie nicht sehr gut ist, wenn es um Mehrdeutigkeit (Verstehen der Bedeutung hinter zweideutigen Aussagen), Gedächtnis (Einbeziehen von zuvor genannten Fakten in das aktuelle Gespräch) oder Kontext (Berücksichtigung von Fakten, die nicht genannt wurden, aber für die aktuelle Situation relevant sind) geht. Kurz gesagt, die derzeitige Technologie entspricht bei weitem nicht dem, was benötigt wird.
Ein Teil des Problems besteht darin, dass die derzeitige KI-Technologie aus riesigen Datenmengen lernen muss. Jeder Bereich, in dem große Mengen sich wiederholender Daten zur Verfügung stehen, ist reif für die Einführung von KI, z. B. Spracherkennung, Bildverarbeitung und selbstfahrende Autos.
Der Erfolg im NLP beruht auf der Tatsache, dass es nahezu unbegrenzte Daten für einmalige Aussagen und Fragen ohne Kontext und ohne Gedächtnis gibt. Wenn ich sage: "Ich möchte Orangen kaufen", ist das in den meisten Fällen eine einfache Aussage, die keine zusätzlichen Informationen über den Kontext oder das Gedächtnis benötigt, um sie zu verstehen. Die Intention ist: "Orangensaft kaufen".
Wenn ein Kontext oder eine Erinnerung im Spiel ist, schafft dies Dimensionalität. Wenn ich sage, dass ich "Orangensaft kaufen" möchte, ich Ihnen aber vorher gesagt habe, dass ich ein Finanzhändler bin, der mit Orangensaft handelt, dann müssen Sie verstehen, dass ich in diesem Kontext ein Finanzinstrument kaufen möchte, das Geld einbringt, wenn der Preis für Orangensaft steigt.
Wie sehen nun unsere Daten aus? "Orangensaft kaufen" bedeutet: eine Flasche Orangensaft im Laden kaufen ODER, wenn er zuvor angegeben hat, dass er ein Finanzhändler für Orangensaft ist, bedeutet dies, dass er ein Finanzinstrument kaufen möchte, das an den Preis von Orangensaft gebunden ist.
Was ist, wenn unser Finanzhändler gerade gesagt hat, dass er durstig ist, dann meint er, dass er eine Flasche Orangensaft im Laden kaufen möchte. Wir fügen also einen weiteren Datenpunkt hinzu: ODER wenn er zuvor angegeben hat, dass er ein Finanzhändler für Orangensaft ist, aber vor kurzem gesagt hat, dass er durstig ist, bedeutet das, dass er eine Flasche Orangensaft kaufen möchte.
Ein Finanzunternehmen würde schnell in Schwierigkeiten geraten, wenn es einen Handelsroboter auf den Markt bringen würde, von dem die Nutzer glauben, dass er über menschliche "Intelligenz" verfügt.
Ist das Bestehen des Turing-Tests unmöglich?
Gesprächsdaten haben leider viele Dimensionen. Unendlich viele Dimensionen. Das bedeutet, dass die Algorithmen für maschinelles Lernen Zugang zu einem Datensatz haben müssten, der große Datenmengen für jede mögliche Dimension enthält, und das ist natürlich unmöglich.
Das bedeutet natürlich nicht, dass das Bestehen des Turing-Tests unmöglich ist. Wir wissen, dass es möglich ist, weil wir die Technologie dafür bereits in unseren Gehirnen haben. Genauso wie die Menschen vor Hunderten von Jahren wussten, dass Fliegen möglich ist, weil sie Vögel beim Fliegen beobachtet haben.
Das Problem ist, dass unser Ansatz für KI in diesem Bereich nicht auf Big Data aufbauen kann, weil Big Data mit ausreichender Dimensionalität nicht existiert. Es gibt einfach zu viele Variablen, zu viele Dimensionen. Selbst in diesem Moment erhält Google 800 Millionen Suchanfragen pro Tag, die es noch nie zuvor gesehen hat. Das gibt Ihnen einen Hinweis darauf, wie schwierig der Datenansatz wäre.
Ray Kurtzweil von Google verfolgt einen Ansatz, der bis zu einem gewissen Grad versucht, das menschliche Gehirn zu replizieren. Er schätzt, dass wir bis 2029 eine generalisierte Intelligenz erreichen und in der Lage sein werden, einen sehr harten Turing-Test zu bestehen.
Seine Vorhersage basiert auf der Annahme, dass der Fortschritt in diesem Bereich exponentiell verläuft und daher selbst relativ bescheidene Fortschritte heute viel bedeutender sind, als es den Anschein hat, wenn man davon ausgeht, dass wir uns auf einem exponentiellen Weg des Fortschritts befinden.
Ob er Recht hat, werden wir abwarten müssen, aber es ist sehr unwahrscheinlich, dass der Durchbruch in den nächsten 10 Jahren gelingt.
Was würde es für eine Maschine bedeuten, einen glaubwürdigen Turing-Test zu bestehen?
Der letzte Punkt ist, was es bedeuten würde, wenn eine Maschine einen glaubwürdigen Turing-Test bestehen würde. Wenn die Maschine den Test mit Hilfe von Big-Data-Ansätzen bestehen würde, ähnlich wie Maschinen Menschen bei Brettspielen besiegen, selbst bei anspruchsvollen Spielen, wären die Auswirkungen nicht so groß, wie wenn die Maschine den Test mit Hilfe eines Gehirnreplikationsansatzes bestehen würde.
Der Ansatz der Gehirnreplikation würde bedeuten, dass die Maschine wahrscheinlich näher am "Denken" ist, wie wir es als Menschen definieren. Sie könnte die Bedeutung aus minimalen Beispielen extrapolieren, so wie es Menschen tun, anstatt Hunderte von Beispielen für den exakten Fall zu benötigen, um die Bedeutung zu extrapolieren.
Wie bereits erwähnt, ist es wahrscheinlicher, dass ein "Gehirnreplikations"-Ansatz den Durchbruch bringen wird, da ein Big-Data-Ansatz nicht möglich ist. Dies würde wahrscheinlich bedeuten, dass Maschinen eine allgemeine Intelligenz erreicht haben, nicht nur in der Konversation, sondern in mehreren Bereichen.
Die Auswirkungen können gar nicht hoch genug eingeschätzt werden, da dies wahrscheinlich zu einer vollständigen Umstellung der Gesellschaft führen würde. Dies gilt insbesondere dann, wenn Maschinen die Fähigkeit haben, sich selbst auf sinnvolle Weise zu verbessern, was zu einer exponentiellen Steigerung ihrer Intelligenz in einem positiven Kreislauf führen wird, der das Leben, wie wir es kennen, verändern wird.
Menschliche Interaktion mit Maschinen
Bleiben wir bei den alltäglicheren Dingen, so ist zu bedenken, dass, selbst wenn eine Maschine einem Menschen gleichgestellt wäre, dies nicht bedeutet, dass wir mit ihr so interagieren würden, wie wir es mit Menschen tun. Das ist genau dasselbe wie mit einem Menschen. Die Interaktion mit Menschen ist nicht immer effizient. Der Versuch, einem Kollegen am Telefon zu erklären, wie man etwas macht, kann in Situationen, in denen es einfacher wäre, es ihm zu zeigen, mühsam und ineffizient sein. Hätten Menschen doch nur eine grafische Schnittstelle, die über das Internet verfügbar ist!
Sprachschnittstellen (oder Chat-basierte Schnittstellen) haben eindeutig Grenzen, was die Eingabe oder Ausgabe von Informationen angeht. Es gibt eindeutig Grenzen und Situationen, in denen es viel effizienter ist, Informationen grafisch darzustellen oder auf eine grafische Schnittstelle zu klicken, als eine Sprachschnittstelle zu verwenden. Bot-Plattformen sind daher so konzipiert, dass sie immer versuchen, den Benutzer auf den richtigen Weg zurückzubringen und das Gespräch nicht abschweifen zu lassen.
Ich möchte auch darauf hinweisen, dass Computer in Bezug auf die Schnittstellen, die sie für den Empfang oder die Weitergabe von Informationen nutzen können, nicht so eingeschränkt sind wie Menschen, so dass bei Gesprächen mit Maschinen zwangsläufig die für die jeweilige Aufgabe optimale Schnittstelle verwendet wird.
Das Bestehen des Turing-Tests wäre zwar ein großer Meilenstein in Bezug auf die Interaktion zwischen Mensch und Computer, aber die tatsächlichen "Gespräche" zwischen Mensch und Computer werden nicht nur auf Sprache und Text beschränkt sein.
Inhaltsübersicht
Bleiben Sie auf dem Laufenden mit den neuesten Informationen über KI-Agenten
Teilen Sie dies auf: