Google faz outra tentativa de imagens humanas geradas por IA após falha em fevereiro

O mais recente modelo de IA do Google permitirá que as pessoas gerem imagens de formas humanas nos próximos dias. A empresa também planeja incorporar a versão mais recente do Imagen 3, que afirma vir com atualizações para gerar imagens precisas. O recurso estará disponível na versão em inglês para usuários do Gemini Advanced

Na última postagem do blog do Google, Dave Citron, diretor sênior responsável pelo produto Gemini, compartilha detalhes sobre o bot Gemini AI “melhorado”. Citron fala sobre incorporar o Imagen 3 como o modelo de última geração de imagens do Gemini. O modelo está configurado para produzir imagens de pessoas com algumas restrições.

Algumas das restrições incluem o fato de que as fotos não serão fotorrealistas e não permitirão a geração de imagens de rostos conhecidos, menores ou cenas sangrentas de qualquer tipo.

O recurso de geração de imagens humanas processará apenas instruções em inglês e estará disponível para usuários assinantes do Gemini Advanced,

A inteligência artificial Gemini do Google foi criticada em fevereiro

Em fevereiro, o chatbot do Google causou polêmica nas redes sociais ao gerar imagens de pessoas historicamente imprecisas. Também chamado de “IA despertada”, o Google enfrentou reação dos críticos por não ter testado a precisão do produto. O chatbot cometeu erros ao descrever a raça dos soldados alemães e dos pais fundadores da América.

Em resposta à reação negativa, o cofundador do Google, Sergey Brin, também admitiu a inadequação do processo de teste do produto . Como resultado, a ferramenta foi descontinuada até recentemente.

Em uma postagem recente no blog , Dave Citron reflete sobre os acontecimentos de fevereiro. Em sua declaração, ele compartilha que o Gemini é tão suscetível a erros quanto qualquer ferramenta de IA. Ele também disse que o feedback dos primeiros usuários será acompanhado. De acordo com a postagem, “É claro que, como acontece com qualquer ferramenta generativa de IA, nem todas as imagens criadas pelo Gemini serão perfeitas, mas continuaremos a ouvir o feedback dos primeiros usuários à medida que continuamos a melhorar”.

Citron também compartilhou na postagem do blog que o princípio do design empresarial promove a liberdade criativa em todo o processo. Portanto os usuários podem fazer alterações instruindo o chatbot em caso de erros na imagem.