O aplicativo conversacional Gemini, anteriormente conhecido como Bard, suspendeu temporariamente sua função de geração de imagens de pessoas após receber críticas sobre a imprecisão e natureza ofensiva de algumas imagens geradas. A equipe por trás do Gemini reconheceu o erro e agradeceu aos usuários pelo feedback, comprometendo-se a trabalhar em uma versão melhorada da funcionalidade.
O problema surgiu devido a duas questões principais com o modelo de IA Imagen 2, utilizado para a geração de imagens no Gemini. Primeiramente, a tentativa de mostrar uma diversidade de pessoas falhou ao não considerar contextos nos quais uma variedade não seria apropriada. Em segundo lugar, o modelo tornou-se excessivamente cauteloso, evitando responder a alguns prompts que considerou sensíveis, mesmo quando não eram.
Esses problemas levaram a respostas que, em alguns casos, eram excessivamente genéricas ou conservadoras, resultando em imagens imprecisas ou inapropriadas. A equipe do Gemini reconheceu que o aplicativo, embora projetado como uma ferramenta de criatividade e produtividade, pode não ser sempre confiável, especialmente em temas atuais, notícias em desenvolvimento ou assuntos controversos.
Para mitigar esses problemas e melhorar a precisão e a adequação das imagens geradas, o Gemini passará por um processo de teste extensivo antes de reativar a geração de imagens de pessoas. A equipe também enfatizou que, embora o Gemini busque fornecer respostas factuais e possua uma função de verificação dupla para avaliar a veracidade das respostas com base em conteúdos da web, recomenda-se utilizar o Google Search para informações atualizadas e de alta qualidade sobre tópicos atuais.
A equipe do Gemini se comprometeu a continuar tomando medidas sempre que identificar problemas, reconhecendo que a IA é uma tecnologia emergente com grande potencial, mas que ainda enfrenta desafios significativos.
Com informações Google Blog.