O ChatGPT usado pelos clientes Plus e Enterprise da OpenAI foi integrado ao DALL-E 3 a partir desta quinta-feira, 19. Esses usuários podem criar imagens a partir do assistente virtual por meio de uma troca de informações pelo chat. É possível solicitar à inteligência artificial refinamentos com uma série de recursos visuais.
O assistente que faz imagens
O DALL-E 3 possui mais recursos visuais que seu antecessor e é capaz de produzir imagens mais nítidas e detalhadas, segundo a OpenAI. O modelo é capaz de renderizar detalhes complexos, incluindo textos, mãos e rostos, e pode suportar proporções de paisagem e retrato.
DALL-E com mais segurança
A OpenAI implementou em seu modelo de imagens um sistema de segurança em várias camadas para limitar o DALL-E 3 de gerar imagens de conteúdos violentos, adulto ou de ódio. As verificações de segurança são executadas nas solicitações do usuário, mas também nas imagens produzidas pela máquina antes de serem exibidas aos usuários.
A OpenAI também tomou medidas para reduzir as chances de o modelo gerar imagens no estilo de artistas vivos, de figuras públicas.
Classificador de proveniência
A empresa também informou que está desenvolvendo uma nova ferramenta interna para identificar se uma imagem foi ou não gerada pelo DALL-E 3. As primeiras avaliações mostram que, quando a imagem não foi modificada, o sistema acertou 99% das vezes se a imagem foi gerada pelo DALL-E 3.
A ferramenta teve mais de 95% de precisão quando a imagem teve edições comuns, como corte, redimensionamento, compactação JPEG ou quando texto ou recortes de imagens reais são sobrepostos em pequenas porções da imagem gerada. O sistema ainda não permite tirar conclusões de que a imagem foi gerada pelo DALL-E, mas o classificador de proveniência, como a OpenAI está chamando, poderá ajudar as pessoas a compreender se o conteúdo áudio ou visual foi gerado por IA.