Os pesquisadores da Meta IA desenvolveram um modelo de inteligência artificial capaz de traduzir 200 línguas, incluindo várias com baixa presença digital, como ayacucho quíchua, aymara central, guarani, crioulo haitiano e papiamento. Somente essas cinco línguas são faladas por mais de 20 milhões de pessoas em 10 países da América Latina.
O modelo é chamado de NLLB-200 e faz parte do projeto NLLB, que significa “no language left behind”, ou “nenhuma língua deixada para trás”. Foi disponibilizado também um banco de dados chamado FLORES-200, com o qual pesquisadores podem medir a performance do modelo de IA. Segundo a Meta, o NLLB-200 apresentou resultados 44% melhores que a versão anterior da empresa. E para algumas línguas africanas e asiáticas chega a ser 77% mais preciso.
Os pesquisadores da Meta realizaram entrevistas com pessoas nativas de locais que falam essas línguas e aprimoraram o modelo para que funcionasse justamente com idiomas com pouco conteúdo disponível online.
Análise
Os avanços de tecnologias de tradução e de processamento de linguagem natural serão cada vez mais fundamentais em novos produtos e serviços digitais, incluindo chatbots, voice bots, metaverso etc. Línguas com uma base massiva de falantes, como inglês, espanhol, árabe e mandarim, oferecem farto material online para a construção de modelos de tradução. O grande desafio é desenvolver ferramentas capazes de traduzir línguas com baixa presença online, mas ainda assim faladas por milhares, às vezes milhões, de pessoas. Um projeto como o NLLB-200, portanto, é de suma importância para a inclusão de mais pessoas a esses novos serviços.