¿Qué es el test de Turing y cómo funciona?
ElTest de Turing es una prueba de inteligencia artificial para ver si, a través de una conversación por chat, un ordenador puede convencer a un humano de que es humano. Se pide a un humano que juzgue si la "persona" con la que está hablando es un humano o un ordenador. Si cree que está hablando con un ser humano pero en realidad está hablando con un ordenador, el ordenador ha superado la prueba de Turing.
Esencialmente, se trata de una prueba para evaluar si un ordenador puede imitar a un humano de forma tan convincente que pueda engañarle haciéndole creer que está hablando con un humano. Por supuesto, hay muchas cosas que desentrañar sobre esta prueba.
¿Para qué sirve el test de Turing?
Puede parecer una pregunta extraña, ya que el objetivo parece obvio: saber si una máquina puede imitar de forma convincente a un humano en una conversación de chat. Sin embargo, hay algunas consideraciones más profundas.
¿Estamos probando si una máquina puede imitar realmente a un humano en términos de pensamiento o inteligencia subyacentes o simplemente engañar a un humano haciéndole creer que es humano? Hay una diferencia.
Imitar a los humanos en términos de pensamiento subyacente o inteligencia es lo que la gente suele pensar cuando piensa en el Test de Turing: que los humanos son realmente incapaces de distinguir entre charlar con un humano o con una máquina. En realidad, no fue así como se concibió inicialmente la prueba, porque se permitía "engañar" a los humanos. Por ejemplo, cometer errores tipográficos podría ser una forma de que un ordenador engañara a un humano haciéndole creer que era humano, ya que una máquina nunca cometería un error ortográfico.
El problema subyacente es que los tests tienen reglas y, por tanto, son inevitablemente defectuosos en algunos aspectos. Por ejemplo, el tiempo que se habla con el sujeto de la prueba es importante. Es más fácil imitar a un ser humano durante 5 minutos que durante cien horas de conversación. Los trucos pueden funcionar en la versión de 5 minutos, pero no en la de cien horas.
¿Importa quién realiza el test de Turing?
Será mucho más difícil engañar a un científico con formación sobre cómo detectar máquinas frente a humanos que a alguien de la calle sin formación, no sólo por la capacidad del científico para evaluar respuestas, sino también por saber qué preguntas hacer.
Aunque el ordenador tenga un nivel de "pensamiento" e inteligencia a la altura de un ser humano, puede que no sea suficiente para engañar a la persona que realiza la prueba. Esto se debe a que el ordenador podría ser demasiado perfecto o demasiado impasible en sus respuestas.
Existen incluso consideraciones filosóficas en torno al Test de Turing, como si el hecho de que los ordenadores alcancen una inteligencia generalizada de nivel humano significaría que las máquinas pueden "pensar" o son conscientes. Esta era en parte una cuestión que Alan Turing intentaba eludir con esta prueba. Si una máquina puede imitar con precisión a un ser humano, a todos los efectos está "pensando".
Por supuesto, eso no significa que tenga conciencia o que piense del mismo modo que un ser humano. De hecho, está garantizado que no piensa como los humanos. El verdadero interés de esta cuestión reside cuando se ve desde un punto de vista práctico. Los aviones vuelan, por ejemplo. Eso es lo importante. Es mucho menos interesante que no imiten a los pájaros en su forma de volar.
El Test de Turing se interesa por los resultados, no por la forma en que se obtienen.
Un punto más importante es que la Prueba de Turing se entiende generalmente para describir un estado de cosas en el que la inteligencia de la máquina ha alcanzado al menos la inteligencia de nivel humano. Es un grupo mucho más reducido el que se interesa por la cuestión de si una máquina ha superado técnicamente una Prueba de Turing teniendo en cuenta todos los defectos descritos anteriormente.
Aunque superar una prueba de Turing puede ser una proeza técnica impresionante, especialmente si la prueba se realiza durante mucho tiempo y la llevan a cabo personas con conocimientos, es mucho menos impresionante que una máquina que pudiera engañar a todas las personas, todo el tiempo. Por supuesto, cuanto más largo sea el periodo de tiempo durante el que se realiza la prueba y cuanto mayor sea el nivel de conocimientos de los evaluadores, más probable será que converjan estos dos escenarios.
¿Estamos cerca de que un ordenador supere el test de Turing?
Ahora que entiendes en qué consiste la prueba, la siguiente pregunta debe ser "¿estamos cerca de que un ordenador supere la prueba?". (es decir, alcanzar la inteligencia humana generalizada). La respuesta corta es "No".
Aunque se han producido enormes avances en el Procesamiento del Lenguaje Natural, que es la capacidad de un ordenador para identificar la intención detrás de una sola frase hablada (que es la tecnología que impulsa todos los asistentes de voz), estamos muy lejos de una inteligencia generalizada de nivel humano.
Resulta que la tecnología actual no es muy buena en ambigüedad (entender el significado de declaraciones ambiguas), memoria (incorporar hechos previamente declarados a la conversación actual) o contexto (tener en cuenta hechos no declarados pero relevantes para la situación actual). En resumen, la tecnología actual no está ni de lejos a la altura de lo que se necesita.
Parte del problema es que la actual tecnología de IA necesita aprender utilizando enormes cantidades de datos. Cualquier ámbito en el que se disponga de una gran cantidad de datos repetitivos es idóneo para introducir la IA, por ejemplo el reconocimiento de voz y el procesamiento de imágenes, incluidos los coches autoconducidos.
El éxito de la PNL se debe a que existen datos casi ilimitados para afirmaciones y preguntas puntuales sin contexto ni memoria. Si digo "Quiero comprar naranja", en la mayoría de los casos se trata de una afirmación simple que no necesita información adicional sobre el contexto o la memoria para ser comprendida. La intención es: "Comprar zumo de naranja".
Cuando hay contexto o memoria de por medio, se crea dimensionalidad. Si digo que quiero "comprar zumo de naranja", pero antes te he dicho que soy un operador financiero que comercia con zumo de naranja, tienes que entender que en este contexto quiero comprar un instrumento financiero que me hará ganar dinero si sube el precio del zumo de naranja.
¿Qué aspecto tienen ahora nuestros datos? "Comprar zumo de naranja" significa: comprar una botella de zumo de naranja en la tienda O si ha declarado previamente que es un operador financiero de zumo de naranja, significa que quiere comprar un instrumento financiero vinculado al precio del zumo de naranja.
Y si nuestro operador financiero acaba de decir que tiene sed, quiere decir que quiere comprar una botella de zumo de naranja en la tienda. Entonces añadimos otro punto de datos: O si ha declarado previamente que es un comerciante financiero de zumo de naranja pero recientemente ha declarado que tiene sed, significa que quiere comprar una botella de zumo de naranja.
Una empresa financiera se encontraría rápidamente con problemas si lanzara un bot de negociación que los usuarios creyeran que tenía "inteligencia" de nivel humano.
¿Es imposible superar el test de Turing?
Los datos de las conversaciones tienen muchas dimensiones, por desgracia. Infinitas dimensiones. Esto significa que los algoritmos de aprendizaje automático necesitarían tener acceso a un conjunto de datos que tuviera grandes cantidades de datos para cada dimensión posible, y eso, por supuesto, es imposible.
Esto no significa, por supuesto, que superar el Test de Turing sea imposible. Sabemos que es posible porque ya tenemos la tecnología para hacerlo, en nuestros cerebros. Igual que hace cientos de años la gente sabía que volar era posible observando a los pájaros volar.
La cuestión es que nuestro enfoque de la IA no puede basarse en los macrodatos porque no existen macrodatos con la suficiente dimensionalidad. Simplemente hay demasiadas variables, demasiadas dimensiones. Mientras hablamos, Google recibe 800 millones de búsquedas al día que nunca antes había visto. Eso da una idea de lo difícil que sería el enfoque de los datos.
Ray Kurtzweil, de Google, sigue un planteamiento que hasta cierto punto intenta replicar el cerebro humano. Ha calculado que llegaremos a la inteligencia generalizada y seremos capaces de superar un durísimo Test de Turing en 2029.
Su previsión se basa en la suposición de que el progreso en este campo será exponencial y, por tanto, incluso un progreso relativamente modesto hoy es mucho más significativo de lo que parece si se asume que estamos en una trayectoria exponencial de progreso.
Tendremos que esperar para ver si tiene razón, pero lo que sí nos dice es que es muy poco probable que la ruptura se produzca en los próximos 10 años.
¿Qué significaría para una máquina superar una prueba de Turing creíble?
El último punto es qué significaría que una máquina superara una Prueba de Turing creíble. Si la máquina superara la prueba utilizando algún tipo de enfoque de big data, de forma similar a como las máquinas ganan a los humanos en los juegos de mesa, incluso en los más sofisticados, las implicaciones no serían tan grandes como si la máquina la superara utilizando un enfoque de réplica cerebral.
El enfoque de la réplica cerebral significaría que la máquina probablemente estaría más cerca de "pensar" de la forma en que definimos el pensamiento los humanos. Podría extrapolar el significado a partir de ejemplos mínimos del modo en que lo hacen los humanos, en lugar de necesitar cientos de ejemplos del caso exacto para extrapolar el significado.
Como ya se ha mencionado, es más probable que un enfoque de "réplica cerebral" proporcione el gran avance, ya que un enfoque de big data no es posible. Esto significaría probablemente que las máquinas habrían alcanzado una inteligencia general, no solo en conversación, sino en múltiples dominios.
La implicación de esto no puede ser exagerada, ya que probablemente conduciría a un reinicio completo de la sociedad. Esto es especialmente cierto si las máquinas tienen la capacidad de mejorarse a sí mismas de manera significativa, lo que conducirá a la posibilidad de un aumento exponencial de su inteligencia en un círculo virtuoso que cambiará la vida tal y como la conocemos.
Interacción de los humanos con las máquinas
Ciñéndonos a cuestiones más mundanas, conviene tener en cuenta que aunque una máquina fuera el equivalente de un humano, eso no significa que interactuáramos con ella como lo hacemos con los humanos. Ocurre exactamente lo mismo que con un ser humano. Interactuar con humanos no siempre es eficaz. Intentar explicarle a un compañero cómo hacer algo por teléfono puede resultar tedioso e ineficaz en situaciones en las que sería más fácil mostrarle cómo hacerlo. Ojalá los humanos dispusieran de una interfaz gráfica en la web.
Las interfaces de voz (o las interfaces basadas en chat) tienen claramente limitaciones en cuanto a la entrada o salida de información. Está claro que hay limitaciones y situaciones en las que es mucho más eficiente mostrar la información gráficamente, o hacer clic en una interfaz gráfica, que utilizar una interfaz de voz. Por tanto, las plataformas de bots están diseñadas para intentar siempre que el usuario vuelva al camino feliz y no deje que la conversación divague.
Lo que quiero decir también es que los ordenadores no están limitados como los humanos en cuanto a las interfaces que pueden utilizar para recibir o proporcionar información y, por tanto, las conversaciones con máquinas implicarán necesariamente el uso de la interfaz óptima para la tarea en cuestión.
Aunque superar el Test de Turing sería un gran hito en términos de interacción entre humanos y ordenadores, las "conversaciones" reales entre humanos y ordenadores no se limitarán a voz y texto.
Índice
Manténgase al día sobre lo último en agentes de IA
Comparte esto en: