Após meses de especulação, o último lançamento de OpenAI'Strawberry LLM foi lançado - e não se chama GPT-5.
Anteriormente designada por nomes de código enigmáticos e intrigantes como Q* e Strawberry, a mais recente série de modelos acabou por receber a designação OpenAI o1.
A maior atualização do novo modelo do OpenAI é a sua capacidade de raciocínio melhorada. OpenAI explicou que o o1 foi treinado para passar mais tempo a pensar do que os modelos anteriores, aproximando-o da inteligência humana.
O que é OpenAI o1?
OpenAI O o1 é a mais recente série de modelos de línguas grandes lançada pela OpenAI em 12 de setembro de 2024, atualmente composta por dois modelos: o1-preview e o1-mini.
A maior diferença entre o o1 e os modelos anteriores da empresa é o seu raciocínio avançado. Embora ainda não tenha sido lançado na íntegra, os modelos preview e mini já superam o GPT-4o em testes de matemática, ciências e codificação.
OpenAI modelos o1
O lançamento de setembro incluiu dois modelos, o o1-preview e o o1-mini. São os primeiros de uma série de modelos que continuarão a ser lançados à medida que o OpenAI aperfeiçoa o seu novo LLM.
A diferença? O modelo o1-mini é mais pequeno e 80% mais barato do que o modelo de pré-visualização. Foi concebido para tarefas que requerem raciocínio avançado, mas não um conhecimento mais alargado. É perfeitamente adequado para tarefas que envolvem codificação ou matemática.
Quão inteligente é o OpenAI o1?
OpenAI apresentou uma lista de referências STEM que demonstram as capacidades de raciocínio do o1, incluindo:
- Um desempenho semelhante ao dos estudantes de doutoramento nos testes de aferição de física, química e biologia.
- Ficar entre os 500 melhores alunos na qualificação dos EUA para as Olimpíadas de Matemática dos EUA.
- Classificação no percentil 89 no Codeforces, um teste de codificação competitivo.
Pode ler mais sobre as capacidades de raciocínio da o1 em OpenAI's research release.
O que é o raciocínio em cadeia de pensamento?
Os modelos o1 utilizam o raciocínio em cadeia, uma forma mais longa e minuciosa de decompor os pedidos.
Se o modelo o1 receber um pedido, não responderá imediatamente - daí o longo tempo de espera. Em vez disso, irá raciocinar através de cada um dos passos, considerando cuidadosamente cada informação e as suas implicações antes de decidir qual o próximo passo a dar. Não dará uma resposta até ter refletido sobre toda a série de passos exigidos na pergunta.
Em que é que o1 é diferente de GPT-4o?
1) Capacidade de raciocínio
No centro da sua inteligência geral está a nova capacidade de raciocínio da o1. "Talvez as áreas mais importantes de progresso sejam a capacidade de raciocínio", partilhou Altman com Gates. "Neste momento, o GPT-4 só consegue raciocinar de forma extremamente limitada."
O raciocínio é notoriamente difícil. Mesmo para os humanos. E o OpenAI o1 é o primeiro modelo a reivindicá-lo.
Os modelos o1 são capazes de raciocinar em tempo real, em vez de se basearem em dados de pré-treino. É por isso que o novo modelo é melhor em tarefas científicas, matemáticas e de codificação do que os modelos OpenAI anteriores.
2) Mais difícil de desbloquear
Com as preocupações com a segurança a aumentarem à medida que LLMs cresce em popularidade e potência, a segurança tem sido um dos principais focos do mais recente desenvolvimento de OpenAI. A empresa estabeleceu parcerias com os Institutos de Segurança de IA dos EUA e do Reino Unido durante o desenvolvimento da série o1, bem como trabalhou com o governo americano para estabelecer a sua devida diligência.
Como um grande passo em frente, a série o1 é muito mais difícil de desbloquear - contornando as medidas de segurança - do que os modelos anteriores.
Num dos seus testes de jailbreak mais difíceis, o modelo o1-preview obteve 84 pontos em 100, em comparação com os 22 pontos do GPT-4o.
3) Nova convenção de nomes
Embora o seu nome não seja a coisa mais emocionante sobre o novo OpenAI LLM , é uma mudança intencionalmente significativa.
OpenAI O o1 é o primeiro modelo a abandonar a designação "GPT", e isso deve-se ao facto de a empresa afirmar que é a primeira fase de um novo "paradigma de raciocínio", enquanto os modelos mais antigos faziam parte de um "paradigma de pré-treino".
O novo modelo passa o tempo a raciocinar em tempo real, em vez de se basear nos seus dados de pré-treino.
4) Melhor em tarefas de resolução de problemas STEM
Com um melhor raciocínio, surgem melhores capacidades matemáticas.
Foi pedido a o1 e a GPT-4o que realizassem um exame de qualificação para as Olimpíadas Internacionais de Matemática. GPT-4o resolveu 13% dos problemas, enquanto o1 resolveu 83%.
5) Tempo de espera mais longo
O raciocínio em tempo real demora mais tempo do que a referência a dados de treino e a geração de uma resposta. Se fizer uma pergunta para OpenAI o1-preview em comparação com outros modelos, estará a aguardar bastante mais tempo.
No entanto, com a possibilidade de externalizar o raciocínio, é um pequeno preço a pagar. A velocidade dos modelos o1 irá provavelmente melhorar à medida que forem lançados os próximos modelos da série.
Quem pode utilizar a o1?
A partir de 12 de setembro, ChatGPT Plus e os utilizadores da Equipa podem aceder aos modelos o1 em ChatGPT.
OpenAI anunciou que disponibilizará o o1-mini aos utilizadores gratuitos, embora ainda não tenha sido indicada uma data.
Os limites actuais da taxa semanal são de 30 mensagens para 01-preview e 50 para o1-mini, embora aumentem em breve.
Para que é que devo utilizar o o1?
As capacidades de raciocínio melhoradas da o1 são especialmente úteis para resolver problemas complexos em matemática, ciências e programação. Comoexplica OpenAI :
Limitações de OpenAI o1
Como pré-visualização, este modelo ainda não tem todas as capacidades do GPT-4o. Se pretender utilizar um LLM para navegar na Web em busca de informações ou para carregar ficheiros ou imagens, terá de se cingir ao GPT-4o até serem lançados modelos mais recentes do o1.
Como aceder a OpenAI o1
OpenAIAs sugestões de estímulo da o1 foram alteradas em relação aos modelos anteriores, devido ao seu raciocínio melhorado.
Mantenha os avisos simples. É um modelo inteligente e não precisa de tanta orientação como a série GPT-4. Isso significa evitar qualquer cadeia de pensamento - o modelo já está a raciocinar internamente.
Criar agentes de IA com capacidade para GPT
E se o seu agente de IA se sincronizasse automaticamente com cada atualização de OpenAI ?
Botpress é uma plataforma de agentes de IA completamente aberta e extensível. O nosso stack permite que os programadores criem chatbots e agentes de IA com quaisquer capacidades, em qualquer fluxo de trabalho.
A única plataforma que vai desde a configuração de baixo código até à personalização e extensão infinitas, Botpress permite-lhe obter automaticamente o poder da versão mais recente de GPT no seu chatbot - sem necessidade de esforço.
Comece aconstruir hoje. É grátis.
Índice
Mantenha-se atualizado com as últimas novidades sobre agentes de IA
Partilhar isto em: