A Amazon apresentou o Amazon Nova, uma nova geração de modelos de base (Foundation Models – FMs) para inteligência artificial generativa (Gen AI). Esses modelos são multimodais, ou seja, conseguem processar texto, imagens e vídeos como entrada, permitindo aplicações que vão desde a análise de vídeos e gráficos até a geração de conteúdos multimídia de alta qualidade.
Integrados ao Amazon Bedrock, serviço que centraliza modelos de base por meio de uma única API, os novos modelos foram otimizados para suportar tarefas complexas em 200 idiomas. Essa integração garante maior acessibilidade, economia de custos e desempenho superior, tornando os modelos mais atrativos para empresas de diferentes setores.
Os FMs do Amazon Nova foram desenvolvidos com medidas integradas de segurança e transparência. A empresa lançou as AWS AI Service Cards para fornecer informações claras sobre usos, limitações e diretrizes de segurança.
Além de atenderem a diversas áreas, como criação de conteúdos visuais, compreensão de vídeos e personalização de experiências, oferecem suporte a personalização avançada por meio de fine-tuning e distillation. Isso permite que os clientes adaptem os modelos com base em dados proprietários, otimizando a precisão e o desempenho para necessidades específicas.
Destaques dos novos modelos Amazon Nova
Amazon Nova Micro: Modelo somente de texto. Oferece respostas de baixa latência a um custo baixo.
Amazon Nova Lite: Modelo multimodal (texto, imagem e vídeo). Ideal para tarefas rápidas, com custo também reduzido.
Amazon Nova Pro: Modelo multimodal avançado. Combina alta precisão, velocidade e custo-benefício para uma ampla variedade de tarefas.
Amazon Nova Premier: Modelo multimodal mais avançado. Voltado para tarefas complexas de raciocínio e ensino de modelos personalizados. Previsto para o primeiro trimestre de 2025.
Amazon Nova Canvas: Modelo especializado em geração de imagens de alta qualidade.
Amazon Nova Reel: Modelo de última geração para criação de vídeos. Permite transformar uma única imagem em um vídeo dinâmico.
Além do lançamento atual, a Amazon também revelou que, em 2025, introduzirá dois novos modelos da linha Nova: um de conversão de fala para fala, capaz de entender e responder com linguagem natural (interpretando até mesmo sinais não verbais como tom e ritmo), e um modelo multimodal completo (any-to-any), que processará texto, imagens, áudio e vídeo como entradas e saídas.
Para mais informações e detalhes sobre como acessar o novo modelo Amazon Nova, clique aqui.