A inteligência artificial é uma das tecnologias estratégicas do Facebook e isso se confirmou nesta quarta-feira, 2, segundo e último dia da F8, conferência para desenvolvedores da empresa, realizada nos EUA. As equipes treinaram um avançado sistema de reconhecimento de imagens a partir de 3,5 bilhões de fotos disponíveis publicamente com 17 mil tags fornecidas pelos próprios usuários e tratadas como rótulos, já que categorizar cada imagem seria inviável. Ao treinar o sistema de visão computacional com uma versão de 1 bilhão de imagens desse conjunto de dados, as equipes atingiram uma pontuação recorde: 85,4% de precisão no ImageNet, uma ferramenta comum de benchmarking. Essa foi a pontuação mais alta no ImageNet até o momento, um aumento de dois pontos percentuais em relação ao modelo anterior de última geração.
Além de possibilitar esse avanço no desempenho de reconhecimento de imagem, essa pesquisa oferece informações importantes sobre como mudar de um treinamento supervisionado para um supervisionado de maneira fraca, onde foram usados rótulos existentes – neste caso, hashtags – em vez de aqueles escolhidos e aplicados especificamente para treinamento de IA. O Facebook planeja abrir o código-fonte das incorporações desses modelos no futuro para desenvolvedores em geral.
Como uma máquina poderia levar mais de um ano para concluir o treinamento do modelo, a empresa desenvolveu uma maneira de distribuir a tarefa para até 336 GPUs, reduzindo o tempo total de treinamento para apenas algumas semanas.
De acordo com a companhia, o Facebook já conseguiu aproveitar esse trabalho para melhorar a capacidade de identificar conteúdo que viola suas políticas.
No futuro, a intenção da empresa é aplicar o trabalho na geração de legendas de áudio de fotos para usuários com deficiência visual.
PyTorch 1.0
O Facebook anunciou aos desenvolvedores uma nova versão do framework de inteligência artificial de código-fonte aberto, o PyTorch 1.0. A tecnologia é um apanhado das ferramentas anteriores – PyTorch, Caffe2 e ONNX – e já está sendo usada em grande escala, incluindo a realização de quase 6 bilhões de traduções de texto por dia para os 48 idiomas mais usados no Facebook. Já em realidade virtual, a ferramenta ajudou a implantar novas pesquisas em produção para fazer os avatares se movimentarem de maneira mais realista.