O que é o teste de Turing e como funciona?
OTeste de Turing é um teste de IA para ver se, através de uma conversa de chat, um computador consegue convencer um humano de que é humano. Pede-se a um humano que julgue se a "pessoa" com quem está a falar é um humano ou um computador. Se julgar que está a falar com um humano, mas na realidade está a falar com um computador, o computador passou no Teste de Turing.
Essencialmente, é um teste para avaliar se um computador consegue imitar um humano de forma tão convincente que pode enganar um humano, levando-o a pensar que está a falar com um humano. É claro que há muitas coisas a desvendar sobre este teste.
Qual é o objetivo do teste de Turing?
Esta pergunta pode parecer estranha, uma vez que o objetivo parece óbvio: saber se uma máquina consegue imitar de forma convincente um humano numa conversa de chat. No entanto, há algumas considerações mais profundas.
Estamos a testar se uma máquina pode realmente imitar um humano em termos de pensamento ou inteligência subjacente ou apenas enganar um humano que é humano? Há uma diferença.
Imitar humanos em termos de pensamento ou inteligência subjacente é o que as pessoas normalmente pensam quando pensam no Teste de Turing - que os humanos não são verdadeiramente capazes de distinguir entre conversar com um humano ou com uma máquina. Na verdade, não foi assim que o teste foi inicialmente concebido, porque era permitido "enganar" os humanos. Por exemplo, cometer erros ortográficos pode ser uma forma de um computador enganar um humano, fazendo-o acreditar que é humano, uma vez que uma máquina nunca cometeria um erro ortográfico.
O problema subjacente é que os testes têm regras e, por isso, são inevitavelmente imperfeitos em alguns aspectos. Por exemplo, o tempo que se fala com o objeto de teste é importante. É mais fácil imitar um ser humano ao longo de 5 minutos do que ao longo de cem horas de conversa. Os truques podem funcionar na versão de 5 minutos, mas não na versão de cem horas.
É importante quem faz o teste de Turing?
Um cientista com formação sobre como identificar máquinas versus seres humanos será muito mais difícil de enganar do que alguém da rua sem formação - não só devido à capacidade do cientista para avaliar as respostas, mas também por saber que perguntas fazer.
Mesmo que o computador tenha um nível de "pensamento" e inteligência ao nível de um humano, isso pode não ser suficiente para enganar o examinador. Isto porque o computador pode ser demasiado perfeito ou pouco emotivo nas suas respostas.
Existem mesmo considerações filosóficas em torno do Teste de Turing, tais como a questão de saber se o facto de os computadores atingirem uma inteligência generalizada ao nível humano significaria que as máquinas podem "pensar" ou são conscientes. Esta era, em parte, uma questão que Alan Turing estava a tentar contornar com este teste. Se uma máquina consegue imitar com precisão um ser humano, então, para todos os efeitos, está a "pensar".
Claro que isso não significa que tenha consciência ou que esteja a pensar da mesma forma que um humano. De facto, é garantido que não pensa da mesma forma que os humanos pensam. O verdadeiro interesse desta questão reside no facto de ser vista de um ponto de vista prático. Os aviões voam, por exemplo. É isso que é importante. É muito menos interessante o facto de não imitarem as aves na forma como voam.
O Teste de Turing está interessado nos resultados, não na forma como os resultados são obtidos.
Um ponto mais importante é o facto de o Teste de Turing ser geralmente entendido como descrevendo um estado de coisas em que a inteligência da máquina atingiu pelo menos o nível de inteligência humana. É um grupo muito mais pequeno que está interessado na questão de saber se uma máquina passou tecnicamente num Teste de Turing, tendo em conta todas as falhas descritas acima.
Embora passar num teste de Turing possa ser uma proeza técnica impressionante, especialmente se o teste for de longa duração e realizado por pessoas conhecedoras, é muito menos impressionante do que uma máquina capaz de enganar todas as pessoas, durante todo o tempo. É claro que quanto mais longo for o período de tempo durante o qual o teste é efectuado e quanto maior for o nível de conhecimentos dos avaliadores, mais provável é que estes dois cenários convirjam.
Estamos perto de um computador que passe no teste de Turing?
Agora que compreende o que é o teste, a pergunta seguinte deve ser "estamos perto de um computador que passe no teste? (ou seja, alcançar uma inteligência humana generalizada). A resposta curta é "Não".
Embora tenha havido um enorme progresso no Processamento de Linguagem Natural, que é a capacidade de um computador identificar a intenção por detrás de uma única frase falada (que é a tecnologia que impulsiona todos os assistentes de voz), estamos muito longe de uma inteligência generalizada ao nível humano.
Acontece que a tecnologia atual não é muito boa em termos de ambiguidade (compreender o significado por detrás de afirmações ambíguas), memória (incorporar factos anteriormente declarados na conversa atual) ou contexto (ter em conta factos não declarados mas relevantes para a situação atual). Em suma, a tecnologia atual não está nem perto do que é necessário.
Parte do problema reside no facto de a atual tecnologia de IA necessitar de aprender utilizando grandes quantidades de dados. Qualquer domínio em que exista uma grande quantidade de dados repetitivos é propício à introdução da IA, por exemplo, o reconhecimento da fala e o processamento de imagens, incluindo os automóveis autónomos.
O sucesso da PNL é impulsionado pelo facto de existirem dados quase ilimitados para afirmações e perguntas isoladas, sem contexto ou sem memória. Se eu disser "Quero comprar sumo de laranja" é, na maioria dos casos, uma afirmação simples que não necessita de informação adicional sobre o contexto ou a memória para ser compreendida. A intenção é: "Comprar sumo de laranja".
Quando há contexto ou memória envolvidos, isto cria dimensionalidade. Se eu disser que quero "comprar sumo de laranja", mas já lhe tiver dito que sou um operador financeiro que negoceia sumo de laranja, então tem de compreender que, neste contexto, quero comprar um instrumento financeiro que ganhará dinheiro se o preço do sumo de laranja subir.
Então, como são os nossos dados? "Comprar sumo de laranja" significa: comprar uma garrafa de sumo de laranja na loja OU, se tiver declarado anteriormente que é um operador financeiro de sumo de laranja, significa que pretende comprar um instrumento financeiro ligado ao preço do sumo de laranja.
E se o nosso operador financeiro acabou de dizer que tem sede, então quer dizer que quer comprar uma garrafa de sumo de laranja na loja. Assim, acrescentamos mais um ponto de dados: OU se já declarou anteriormente que é um operador financeiro de sumo de laranja, mas declarou recentemente que tem sede, isso significa que quer comprar uma garrafa de sumo de laranja.
Uma empresa financeira teria rapidamente problemas se lançasse um bot de negociação que os utilizadores acreditassem ter "inteligência" de nível humano.
É impossível passar no teste de Turing?
Infelizmente, os dados das conversas têm muitas dimensões. Dimensões infinitas. Isto significa que os algoritmos de aprendizagem automática teriam de ter acesso a um conjunto de dados com grandes quantidades de dados para cada dimensão possível, o que é obviamente impossível.
Isto não significa, obviamente, que passar no Teste de Turing seja impossível. Sabemos que é possível porque já temos a tecnologia para o fazer, nos nossos cérebros. Tal como as pessoas, há centenas de anos, sabiam que o voo era possível observando os pássaros a voar.
A questão é que a nossa abordagem à IA neste domínio não pode ser construída com base em grandes volumes de dados, porque não existem grandes volumes de dados com dimensionalidade suficiente. Há simplesmente demasiadas variáveis, demasiadas dimensões. Neste preciso momento, o Google recebe 800 milhões de pesquisas por dia que nunca viu antes. Isto dá-nos uma ideia do quão difícil seria a abordagem dos dados.
Ray Kurtzweil, da Google, está a seguir uma abordagem que, em certa medida, tenta replicar o cérebro humano. Ele estima que chegaremos a uma inteligência generalizada e seremos capazes de passar num teste de Turing muito difícil em 2029.
A sua previsão baseia-se no pressuposto de que o progresso neste domínio será exponencial e, por conseguinte, mesmo um progresso relativamente modesto hoje em dia é muito mais significativo do que parece se assumirmos que estamos numa trajetória exponencial de progresso.
Se ele tem razão, teremos de esperar para ver, mas o que ele nos diz é que é altamente improvável que a rutura ocorra nos próximos 10 anos.
O que significaria para uma máquina passar num teste de Turing credível?
A última questão é o que significaria se uma máquina passasse num teste de Turing credível. Se a máquina passasse o teste utilizando algum tipo de abordagem de grandes volumes de dados, de forma semelhante à forma como as máquinas vencem os humanos em jogos de tabuleiro, mesmo sofisticados, as implicações não seriam tão grandes como se a máquina passasse o teste utilizando uma abordagem de replicação do cérebro.
A abordagem de replicação do cérebro significaria que a máquina estaria provavelmente mais próxima de "pensar" da forma como definimos o pensamento como humano. Poderia extrapolar o significado a partir de exemplos mínimos, tal como os humanos fazem, em vez de precisar de centenas de exemplos do caso exato para extrapolar o significado.
Tal como já foi referido, é mais provável que uma abordagem de "replicação do cérebro" seja a solução, uma vez que não é possível uma abordagem de grandes volumes de dados. Isto significaria provavelmente que as máquinas teriam alcançado uma inteligência geral, não apenas na conversação, mas em múltiplos domínios.
As implicações deste facto não podem ser sobrestimadas, uma vez que tal conduziria provavelmente a uma reinicialização completa da sociedade. Isto é especialmente verdade se as máquinas tiverem a capacidade de se aperfeiçoarem de forma significativa, o que levará à possibilidade de um aumento exponencial da sua inteligência, num círculo virtuoso que mudará a vida tal como a conhecemos.
Interação dos seres humanos com as máquinas
Para além das questões mais mundanas, convém ter em conta que, mesmo que uma máquina fosse equivalente a um humano, isso não significa que interagiríamos com ela como fazemos com os humanos. É exatamente o mesmo que com um ser humano. A interação com os humanos nem sempre é eficiente. Tentar explicar a um colega como fazer algo por telefone pode ser aborrecido e ineficaz em situações em que seria mais fácil mostrar-lhe como se faz. Se ao menos os humanos tivessem uma interface gráfica disponível na Web!
As interfaces de voz (ou as interfaces baseadas em conversação) têm claramente limitações em termos de entrada ou saída de informação. É evidente que existem limitações e situações em que é muito mais eficiente mostrar a informação graficamente, ou clicar numa interface gráfica, do que utilizar uma interface de voz. As plataformas de bots são, por isso, concebidas para tentar sempre levar o utilizador de volta ao caminho certo e não deixar que a conversa se perca.
O que quero dizer é que os computadores não estão limitados como os seres humanos em termos das interfaces que podem utilizar para receber ou fornecer informações e, por conseguinte, as conversas com as máquinas implicarão necessariamente a utilização da interface óptima para a tarefa em questão.
Embora passar no Teste de Turing seja um grande marco em termos de interação homem/computador, as verdadeiras "conversas" homem/computador não se limitarão apenas à voz e ao texto.
Índice
Mantenha-se atualizado com as últimas novidades sobre agentes de IA
Partilhar isto em: