A OpenAI apresentou nesta quinta-feira, 12, um modelo de inteligência artificial generativa que busca responder ao usuário com mais prudência e pensando como um ser humano, no lugar de disparar prontamente seus resultados como uma máquina. Batizada como OpenAI-o1 (se pronuncia ‘O-ONE’) a solução tem como intuito a razoabilidade e a assertividade.
Na prática, uma resposta simples demora três segundos para ser respondida no GPT-4o, o modelo lançado em maio deste ano. Por sua vez, o OpenAI-o1 demora 32 segundos.
Esse modelo é o primeiro de uma série e foca principalmente em apoiar profissionais em questões mais árduas de ciência, matemática e codificação, como profissionais de genética que precisam trabalhar com uma grande gama de dados em sequência.
Testes do OpenAI-o1
Em suas primeiras provas, o algoritmo teve resultados similares a estudantes de pós-doutorado em física, química e biologia. Em uma comparação direta, o OpenAI-o1 acertou 83% das questões das provas de admissão para a Olimpíada Internacional de Matemática contra 13% de assertividade do GPT-4o (modelo mais recente da companhia).
Por sua vez, as habilidades de codificação do modelo mais prudente atingiram 89 de percentil em competições da Codeforces.
Também vale dizer que nos testes de segurança (jailbreak) e cumprimentos das regras da OpenAI sem driblar (bypass), o OpenAI-o1 teve 84 pontos (em uma escala de zero é o mais fraco e 100 o mais forte) contra 22 pontos do GPT-4o.
Disponibilidade
Ainda em versão de pré-uso (preview), o OpenAI-o1 começa a ser liberado nesta quinta-feira para desenvolvedores via API e usuários do ChatGPT (Android, iOS) nas assinaturas Plus e Team. Uma versão reduzida (OpenAI o1-mini) também está disponível para B2C e B2B – essa demora nove segundos para dar uma resposta simples ao usuário.
Aos usuários do app, a diferença é que a versão mais robusta permite 30 mensagens por semana e a menor, 50 mensagens. Usuários do ChatGPT para empresas e para educação receberão o acesso na próxima semana. E em algum momento a companhia deve liberar para os consumidores a versão gratuita do app.
Para desenvolvedores, o uso do o1-mini tem mais tokens por minuto (TPM), 150 milhões x 30 milhões, além de ser 80% mais barato que o OpenAI-o1. Mas, os desenvolvedores precisam ser pagantes no nível (tier) 5 com requisições por minuto (RPM) semanais.
Como é um preview, o OpenAI-o1 ainda não conta com navegação na web e upload de arquivos e imagens para compreensão da IA generativa. Em breve, a companhia quer adicionar essas e outras ferramentas que estão nos modelos anteriores.
Imagem principal: o1 preview entre outros modelos da OpenAI no ChatGPT (divulgação)