O tão aguardado modelo GPT-5 da OpenAI foi lançado - e chama-se OpenAI o1.
Se estiver interessado em saber mais sobre as versões o1-preview e o1-mini, pode consultar a nossa visão geral do modelo o1 aqui.
O que é GPT-5?
OpenAI O o1 é a mais recente série de modelos de línguas grandes lançada pela OpenAI em 12 de setembro de 2024, atualmente composta por dois modelos: o1-preview e o1-mini.
A maior diferença entre o o1 e os modelos anteriores da empresa é o seu raciocínio em cadeia. Embora ainda não tenha sido lançado na íntegra, os modelos preview e mini já superam o GPT-4o em testes de matemática, ciências e codificação.
O novo modelo é o primeiro do seu género, capaz de raciocinar em tempo real (tal como um humano).
O que significa a sua capacidade de raciocínio para os utilizadores? "É muito bom, materialmente melhor", disse um diretor executivo com acesso avançado.
Qual é a data de lançamento do GPT-5?
OpenAIA mais recente versão do LLM foi lançada ao público a 12 de setembro de 2024. O lançamento incluiu os modelos o1-preview e o1-mini.
Até ao lançamento, as previsões eram muito variadas, estimadas por utilizadores e jornalistas entre o verão de 2024 e o final de 2026.
Quão inteligente é o GPT-5?
OpenAI apresentou uma lista de referências STEM que demonstram as capacidades de raciocínio do o1, incluindo:
- Um desempenho semelhante ao dos estudantes de doutoramento nos testes de aferição de física, química e biologia.
- Ficar entre os 500 melhores alunos na qualificação dos EUA para as Olimpíadas de Matemática dos EUA.
- Classificação no percentil 89 no Codeforces, um teste de codificação competitivo.
Pode ler mais sobre as capacidades de raciocínio da o1 em OpenAI's research release.
Projeto Strawberry
OpenAI O o1 tinha anteriormente o nome de código Strawberry, com uma forte componente de misticismo e intriga. "O funcionamento do Strawberry é um segredo muito bem guardado, mesmo em OpenAI", partilhou uma fonte anónima com a Reuters.
A versão mais pequena desta nova IA foi lançada a 12 de setembro de 2024 como parte de uma atualização de ChatGPT. A versão maior é provavelmente utilizada por OpenAI para gerar dados de treino para a sua LLMs, substituindo potencialmente a necessidade de grandes quantidades de dados do mundo real.
Uma reunião interna de todos os funcionários da OpenAI , a 9 de julho, incluiu uma demonstração do que poderia ser o Projeto Strawberry, que alegadamente apresentava capacidades de raciocínio semelhantes às dos humanos.
Qual é a diferença entre GPT-4 e GPT-5?
OpenAI O CEO Sam Altman acredita que o mundo apenas arranhou a superfície da IA. Na Cimeira Mundial dos Governos, em janeiro de 2024, Altman comparou os modelos actuais de OpenAI aos primeiros tempos dos telemóveis:
Embora seja necessário algum tempo para passar da versão flip phone do GPT para a versão iPhone, o modelo o1 aproxima-nos um pouco mais.
1) Melhoria das capacidades de raciocínio
No centro da sua inteligência geral está a nova capacidade de raciocínio da o1. "Talvez as áreas mais importantes de progresso sejam a capacidade de raciocínio", partilhou Altman com Gates. "Neste momento, o GPT-4 só consegue raciocinar de forma extremamente limitada."
O raciocínio é notoriamente difícil. Mesmo para os humanos. E o OpenAI o1 é o primeiro modelo a reivindicá-lo.
Não faltam utilizadores que publicam as suas GPT-4 falhas no Reddit e no Medium, desde comentários em grupo sobre a sua resolução de problemas a explicações formais sobre as suas capacidades de raciocínio limitadas.
2) Nova convenção de nomes
Embora o seu nome não seja a coisa mais emocionante sobre o novo OpenAI LLM , é uma mudança intencionalmente significativa.
OpenAI O o1 é o primeiro modelo a abandonar a designação "GPT", e isso deve-se ao facto de a empresa afirmar que é a primeira fase de um novo "paradigma de raciocínio", enquanto os modelos mais antigos faziam parte de um "paradigma de pré-treino".
O novo modelo passa o tempo a raciocinar em tempo real, em vez de se basear nos seus dados de pré-treino.
3) Tempo de espera mais longo
O raciocínio em tempo real demora mais tempo do que a referência a dados de treino e a geração de uma resposta. Se fizer uma pergunta para OpenAI o1-preview em comparação com outros modelos, estará a aguardar bastante mais tempo.
No entanto, com a possibilidade de externalizar o raciocínio, é um pequeno preço a pagar. A velocidade dos modelos o1 irá provavelmente melhorar à medida que forem lançados os próximos modelos da série.
4) Janelas de contexto idênticas
Embora muitos tenham especulado um aumento das janelas de conteúdo de GPT-4 para o modelo seguinte, a atual série o1 permanece idêntica à janela de conteúdo de 128.000 de GPT-4o.
As janelas de contexto representam o número de tokens (palavras ou subpalavras) que um modelo pode processar de uma só vez. Uma janela de contexto maior permite ao modelo absorver mais informações do texto de entrada, o que leva a uma maior precisão na sua resposta.
Uma das falhas do GPT-4 tem sido a sua capacidade comparativamente limitada de processar grandes quantidades de texto. Por exemplo, GPT-4 Turbo e GPT-4o têm uma janela de contexto de 128.000 tokens. Mas o modelo Gemini do Google tem uma janela de contexto de até 1 milhão de tokens.
Neste momento, se a sua única preocupação é um modelo de linguagem grande que possa absorver grandes quantidades de informação, o OpenAI LLMs pode não ser a sua melhor escolha. Se tem curiosidade em saber qual o chatbot LLM mais adequado para si, consulte o nosso artigo sobre os melhores chatbots LLM .
Que dados de formação é que o GPT-5 utiliza?
Se houve algum ajuste de contas para a OpenAI na sua ascensão ao topo da indústria, foi a série de processos judiciais sobre a formação completa das modelos.
GPT são treinados em enormes conjuntos de dados retirados da Internet, muitos dos quais protegidos por direitos de autor. Esta utilização não autorizada de dados deu origem a queixas e acções judiciais generalizadas: uma ação judicial do The New York Times, uma ação judicial de uma série de agências noticiosas dos EUA e alegações de que o processo de formação do modelo viola o Regulamento Geral de Proteção de Dados da UE.
Um juiz da Califórnia já indeferiu uma das acções judiciais sobre direitos de autor do OpenAI apresentadas por um grupo de escritores, incluindo as celebridades Sarah Silverman e Ta-Nehisi Coates. Ainda não há sugestões de que o OpenAI e a empresa serão substancialmente impedidos por estas queixas à medida que continuam os testes.
O modelo mais recente foi treinado numa combinação de dados publicamente disponíveis e de dados adquiridos a empresas. OpenAI solicitou uma maior variedade de conjuntos de dados para treinar melhor o modelo.
Também é provável que o1 tenha sido utilizado para criar conjuntos de dados para treinar mais o modelo. OpenAI explicou que o Strawberry seria utilizado para treinar o futuro LLMs.
Quanto custa o GPT-5?
O novo modelo OpenAI o1 pode ser utilizado gratuitamente em ChatGPT, mas com limites estritos por enquanto.
Para utilização da API, o modelo OpenAI o1-preview custa $15 por 1 milhão de tokens de entrada e $60 por 1 milhão de tokens de saída.
O modelo o1-mini custa $3 por 1 milhão de tokens de entrada e $12 por 1 milhão de tokens de saída, o que o torna um modelo muito mais acessível para uso diário.
No entanto, estes modelos são mais dispendiosos do que as opções anteriores do OpenAI. O modelo GPT-4o tem um preço de US$ 5 por 1 milhão de tokens de entrada e US$ 15 por 1 milhão de tokens de saída. O GPT-4o mini tem um preço de $0,150 por 1 milhão de tokens de entrada e $0,6 por 1 milhão de tokens de saída.
Informações de pré-lançamento de OpenAI
Antes do lançamento do o1 (também conhecido anteriormente como Strawberry e Q*), os executivos e especialistas do OpenAI foram deixando cair cada vez mais informações sobre o modelo da próxima geração. Eis um rasto do que a empresa declarou antes do seu lançamento:
- OpenAI O diretor executivo da empresa japonesa anunciou uma data de lançamento para 2024, bem como parcerias entre o novo produto e a Apple, o Spotify e a Coca-Cola.
- O diretor executivo Sam Altman afirmou que o próximo modelo será capaz de processar mensagens de correio eletrónico e detalhes do calendário, e que será mais personalizável.
- A CTO Mira Murati explicou numa entrevista à Dartmouth Engineering que GPT-3 tinha a inteligência de uma criança, GPT-4 era mais semelhante a um aluno inteligente do ensino secundário e que OpenAI o1 tem uma inteligência de nível de doutoramento (em determinadas tarefas).
- O CEO da Microsoft AI, Mustafa Suleyman, partilhou que só em GPT-6, daqui a dois anos, é que os modelos serão capazes de "agir" em ambientes novos.
- A prudência é fundamental: O diretor executivo Sam Altman foi cauteloso quanto à data de lançamento do modelo o1, explicando que a OpenAI tinha "muitas outras coisas importantes para lançar primeiro". Afirmou que a empresa só lançaria o modelo quando tivesse confiança de que o poderia fazer de forma segura e responsável.
- Altman brincou que GPT-5 fará com que GPT-4 pareça "ligeiramente embaraçoso" em comparação, na sua entrevista em Stanford.
- O Instituto de Segurança de IA dos EUA recebeu acesso antecipado ao próximo modelo do OpenAI, para que as duas organizações possam "fazer avançar a ciência das avaliações de IA".
- Terá um conjunto de dados alargado. GPT O modelo -5 foi treinado numa combinação de dados publicamente disponíveis e de dados adquiridos a empresas. OpenAI solicitou uma maior variedade de conjuntos de dados para treinar melhor o modelo.
O futuro da ChatGPT
A próxima geração de modelos linguísticos de grande dimensão irá revolucionar a forma como interagimos com a IA no nosso dia a dia. Na conferência Bloomberg's Tech, oCOO da OpenAI , Brad Lightcap, deu a entender como a empresa planeia revolucionar a interação humano-computador, passando a GPT de um LLM para um modelo com capacidades de agente.
"Será que em 2026 vai haver um engenheiro de prontidão?" disse Lightcap. "Não se faz engenharia imediata ao amigo."
Um modelo mais capaz e personalizado, com mais capacidades multimodais, promete exatamente o que Altman e OpenAI esperam: o inimaginável. O esperado GPT-5 estará um passo mais próximo.
Maior personalização
GPT-O -4 é frequentemente utilizado como uma ferramenta de tamanho único. Mas as futuras iterações tornar-se-ão mais personalizadas. No podcast de Gates, Altman reiterou que a customização e a personalização serão fundamentais para os futuros modelos OpenAI . "As pessoas querem coisas muito diferentes do GPT-4: estilos diferentes, conjuntos de suposições diferentes."
OpenAI já introduziu o GPTs personalizado, que permite aos utilizadores personalizar um GPT para uma tarefa específica, desde ensinar um jogo de tabuleiro a ajudar as crianças a fazer os trabalhos de casa. Embora a personalização não tenha estado na vanguarda do OpenAI o1, espera-se que se torne uma tendência importante no futuro.
Entretanto, pode personalizar um chatbot de IA equipado com o poder de GPT-4o gratuitamente. É o que fazemos melhor. Comece aqui.
Mais multimodal
A multimodalidade tem sido fundamental para as últimas iterações de GPT. OpenAI não mostra sinais de abrandamento.
OpenAI introduziu o GPT-4o em maio de 2024, trazendo consigo capacidades acrescidas de texto, voz e visão. Muito próximo do GPT-4 Turbo, é capaz de participar em conversas naturais, analisar entradas de imagens, descrever imagens e processar áudio complexo.
As alterações na multimodalidade criam enormes mudanças na forma como interagimos com GPT. O fluxo natural da conversação - quando o modelo consegue interpretar com precisão as alterações tonais e seguir padrões de discurso semelhantes aos humanos, como GPT-4o - é um salto gigantesco no processamento de linguagem natural da IA.
E não se trata apenas de voz e texto melhorados. O site OpenAI não se coibiu de dar a conhecer o seu próximo modelo de texto para vídeo, Sora. O modelo de IA foi desenvolvido para imitar movimentos complexos da câmara e criar personagens e cenários detalhados em clips de até 60 segundos.
Se o seu historial de multimodalidade não for suficiente, pode ser lido pelo CEO da OpenAI . Altman confirmou à Gates que o processamento de vídeo, juntamente com o raciocínio, é uma das principais prioridades dos futuros modelos do GPT .
O Poder de GPT, Personalizado
E se o seu chatbot de IA se sincronizasse automaticamente com cada atualização de GPT ?
Botpress fornece soluções de chatbot de IA personalizáveis desde 2017, proporcionando aos programadores as ferramentas de que necessitam para criar facilmente chatbots com o poder da mais recente LLMs. Os chatbots Botpress podem ser treinados em fontes de conhecimento personalizadas - como o seu sítio Web ou catálogo de produtos - e integrar-se perfeitamente nos sistemas empresariais.
A única plataforma que vai desde a configuração sem código até à personalização e extensão infinitas, Botpress permite-lhe obter automaticamente o poder da versão mais recente de GPT no seu chatbot - sem necessidade de esforço.
Comece a construir hoje. É grátis.
Índice
Mantenha-se atualizado com as últimas novidades sobre agentes de IA
Partilhar isto em: