Sócios da WideLabs apresentam Amazônia IA para a ministra da Ciência, Tecnologia e Inovação (Crédito: divulgação)
Os grandes modelos de linguagem (LLM, na sigla em inglês) mais conhecidos e seus respectivos bots, como ChatGPT e Claude, foram treinados com bases de dados estrangeiras, a maioria em inglês. Isso pode gerar algumas falhas ou imprecisões nas respostas a perguntas específicas sobre a cultura brasileira. Por isso, a startup nacional WideLabs desenvolveu um LLM brasileiro, o Amazônia IA, construído priorizando bases brasileiras de dados. Também foi criado um bot disponível na web e que leva o mesmo nome do LLM.
“É muito ruim quando tudo que se pergunta sobre o Brasil é respondido sob um ponto de vista de fora. O Brasil perdeu a corrida da Internet. Vamos perder também a corrida da IA? Tivemos atitude, coragem e ambição de criar um LLM brasileiro”, diz Nelson Leoni, CEO e fundador da WideLabs, em conversa com Mobile Time.
O Amazônia IA foi treinado combinando bases de dados públicas do Brasil e do exterior; bases de dados privadas protegidas por direitos autorais, mas cuja autorização de uso foi obtida pela WideLabs; e bases de dados sintéticos. O treinamento aconteceu ao longo de um ano e foi acelerado graças ao uso de processadores e infraestrutura de alta capacidade fornecidos por uma parceria com NVIDIA e Oracle, informa o executivo.
O resultado é uma IA capaz de entender melhor o português, incluindo o variado vocabulário regional, e de responder sobre a cultura brasileira com muito mais propriedade.
Serve de exemplo a pergunta feita pela ministra da Ciência, Tecnologia e Inovação, Luciana Santos, em teste realizado durante a apresentação do Plano Brasileiro de Inteligência Artificial, na semana passada. Ela perguntou ao Amazônia IA como fazer rapadura. O bot respondeu com diferentes receitas, dependo da região do País.
Outro exemplo: se perguntado sobre quem inventou o avião, o Amazônia IA cita Santos Dumont e os irmãos Wright. O ChatGPT, por ter sido treinado com dados estrangeiros, se esquece do inventor brasileiro.
Bot e modelo de negócios
O bot do Amazônia IA já pode ser acessado gratuitamente por qualquer pessoa neste link. Em breve será lançada uma versão premium, para assinantes, com mais funcionalidades.
O LLM, por sua vez, será disponibilizado para desenvolvedores por meio de uma API. O lançamento deve acontecer em setembro. Os preços ainda não foram divulgados.
A expectativa do executivo é de que o Amazônia IA registre 100 milhões de sessões por mês no ano que vem.
Outras vantagens do Amazônia IA
O fato de ser um LLM nacional traz uma série de outras vantagens, a começar pelo fato de seu preço ser em Reais, o que traz melhor previsibilidade para os desenvolvedores, evitando que o custo de um projeto seja afetado negativamente pela variação do câmbio.
Além disso, é um LLM que segue à risca a legislação brasileira, cuja base de dados fica hospedada no País e o processamento também é feito aqui. A operação acontece em dois data centers no Brasil. Por fim, toda a energia utilizada provém de fontes renováveis, afirma Leoni.
“Respeitamos a legislação brasileira. E garantimos que nenhum dado sai para fora do Brasil”, completa.