Após meses de especulação, a última versão do OpenAI LLM foi lançada - e não se chama GPT-5.
Anteriormente designada por nomes de código enigmáticos e intrigantes como Q* e Strawberry, a mais recente série de modelos acabou por receber a designação OpenAI o1.
A maior atualização do novo modelo do OpenAI é a sua capacidade de raciocínio melhorada. OpenAI explicou que o o1 foi treinado para passar mais tempo a pensar do que os modelos anteriores, aproximando-o da inteligência humana.
O que é OpenAI o1?
OpenAI O o1 é a mais recente série de modelos de línguas grandes lançada pela OpenAI em 12 de setembro de 2024, atualmente composta por dois modelos: o1-preview e o1-mini.
A maior diferença entre o o1 e os modelos anteriores da empresa é o seu raciocínio avançado. Embora ainda não tenha sido lançado na íntegra, os modelos preview e mini já superam o GPT-4o em testes de matemática, ciências e codificação.
OpenAI modelos o1
O lançamento de setembro incluiu dois modelos, o o1-preview e o o1-mini. São os primeiros de uma série de modelos que continuarão a ser lançados à medida que o OpenAI aperfeiçoa o seu novo LLM.
A diferença? O modelo o1-mini é mais pequeno e 80% mais barato do que o modelo de pré-visualização. Foi concebido para tarefas que requerem raciocínio avançado, mas não um conhecimento mais alargado. É perfeitamente adequado para tarefas que envolvem codificação ou matemática.
Quão inteligente é o OpenAI o1?
OpenAI apresentou uma lista de referências STEM que demonstram as capacidades de raciocínio do o1, incluindo:
- Um desempenho semelhante ao dos estudantes de doutoramento nos testes de aferição de física, química e biologia.
- Ficar entre os 500 melhores alunos na qualificação dos EUA para as Olimpíadas de Matemática dos EUA.
- Classificação no percentil 89 no Codeforces, um teste de codificação competitivo.
Pode ler mais sobre as capacidades de raciocínio da o1 em OpenAI's research release.
What is chain of thought reasoning?
The o1 models use chain of thought reasoning, a longer and more thorough way of by breaking down requests.
If the o1 model is given a prompt, it won’t answer immediately - hence the long wait time. Instead, it will reason through each of the steps, carefully considering each piece of information and its implications before deciding on the next course of action. It won't provide an answer until it has thought through the entire series of steps required in the ask.
Em que é que o1 é diferente de GPT-4o?
1) Capacidade de raciocínio
No centro da sua inteligência geral está a nova capacidade de raciocínio da o1. "Talvez as áreas mais importantes de progresso sejam a capacidade de raciocínio", partilhou Altman com Gates. "Neste momento, o GPT-4 só consegue raciocinar de forma extremamente limitada."
O raciocínio é notoriamente difícil. Mesmo para os humanos. E o OpenAI o1 é o primeiro modelo a reivindicá-lo.
Os modelos o1 são capazes de raciocinar em tempo real, em vez de se basearem em dados de pré-treino. É por isso que o novo modelo é melhor em tarefas científicas, matemáticas e de codificação do que os modelos OpenAI anteriores.
2) Mais difícil de desbloquear
Com as preocupações com a segurança a aumentarem à medida que LLMs cresce em popularidade e potência, a segurança tem sido um dos principais focos do mais recente desenvolvimento de OpenAI. A empresa estabeleceu parcerias com os Institutos de Segurança de IA dos EUA e do Reino Unido durante o desenvolvimento da série o1, bem como trabalhou com o governo americano para estabelecer a sua devida diligência.
Como um grande passo em frente, a série o1 é muito mais difícil de desbloquear - contornando as medidas de segurança - do que os modelos anteriores.
Num dos seus testes de jailbreak mais difíceis, o modelo o1-preview obteve 84 pontos em 100, em comparação com os 22 pontos do GPT-4o.
3) Nova convenção de nomes
Embora o seu nome não seja a coisa mais emocionante sobre o novo OpenAI LLM , é uma mudança intencionalmente significativa.
OpenAI O o1 é o primeiro modelo a abandonar a designação "GPT", e isso deve-se ao facto de a empresa afirmar que é a primeira fase de um novo "paradigma de raciocínio", enquanto os modelos mais antigos faziam parte de um "paradigma de pré-treino".
O novo modelo passa o tempo a raciocinar em tempo real, em vez de se basear nos seus dados de pré-treino.
4) Melhor em tarefas de resolução de problemas STEM
Com um melhor raciocínio, surgem melhores capacidades matemáticas.
Foi pedido a o1 e a GPT-4o que realizassem um exame de qualificação para as Olimpíadas Internacionais de Matemática. GPT-4o resolveu 13% dos problemas, enquanto o1 resolveu 83%.
5) Tempo de espera mais longo
O raciocínio em tempo real demora mais tempo do que a referência a dados de treino e a geração de uma resposta. Se fizer uma pergunta para OpenAI o1-preview em comparação com outros modelos, estará a aguardar bastante mais tempo.
No entanto, com a possibilidade de externalizar o raciocínio, é um pequeno preço a pagar. A velocidade dos modelos o1 irá provavelmente melhorar à medida que forem lançados os próximos modelos da série.
Quem pode utilizar a o1?
A partir de 12 de setembro, ChatGPT Plus e os utilizadores da Equipa podem aceder aos modelos o1 em ChatGPT.
OpenAI anunciou que disponibilizará o o1-mini aos utilizadores gratuitos, embora ainda não tenha sido indicada uma data.
Os limites actuais da taxa semanal são de 30 mensagens para 01-preview e 50 para o1-mini, embora aumentem em breve.
Para que é que devo utilizar o o1?
As capacidades de raciocínio melhoradas da o1 são especialmente úteis para resolver problemas complexos em matemática, ciências e programação. Comoexplica OpenAI :
Limitações de OpenAI o1
Como pré-visualização, este modelo ainda não tem todas as capacidades do GPT-4o. Se pretender utilizar um LLM para navegar na Web em busca de informações ou para carregar ficheiros ou imagens, terá de se cingir ao GPT-4o até serem lançados modelos mais recentes do o1.
Como aceder a OpenAI o1
OpenAIAs sugestões de estímulo da o1 foram alteradas em relação aos modelos anteriores, devido ao seu raciocínio melhorado.
Mantenha os avisos simples. É um modelo inteligente e não precisa de tanta orientação como a série GPT-4. Isso significa evitar qualquer cadeia de pensamento - o modelo já está a raciocinar internamente.
Criar agentes de IA com capacidade para GPT
E se o seu agente de IA se sincronizasse automaticamente com cada atualização de OpenAI ?
Botpress é uma plataforma de agentes de IA completamente aberta e extensível. O nosso stack permite que os programadores criem chatbots e agentes de IA com quaisquer capacidades, em qualquer fluxo de trabalho.
A única plataforma que vai desde a configuração de baixo código até à personalização e extensão infinitas, Botpress permite-lhe obter automaticamente o poder da versão mais recente de GPT no seu chatbot - sem necessidade de esforço.
Comece aconstruir hoje. É grátis.
Índice
Mantenha-se atualizado com as últimas novidades sobre chatbots com IA
Partilhar isto em: