Após prometer corrigir o recurso de geração de imagens do Gemini e pausá-lo temporariamente, o Google publicou uma postagem no blog fornecendo uma explicação sobre o motivo pelo qual sua tecnologia foi corrigida de forma excessiva para a diversidade. Prabhakar Raghavan, vice-presidente sênior de conhecimento e informação da empresa, explicou que os esforços do Google para garantir que o chatbot gerasse imagens mostrando uma ampla gama de pessoas “não levaram em consideração casos que claramente não deveriam mostrar uma variedade”. Além disso, o modelo de IA tornou-se “muito mais cauteloso” ao longo do tempo e recusava-se a responder a solicitações que não fossem inerentemente ofensivas. “Essas duas coisas levaram o modelo a compensar demais em alguns casos e a ser excessivamente conservador em outros, resultando em imagens embaraçosas e incorretas”, escreveu Raghavan.
O Google assegurou que a geração de imagens do Gemini não poderia criar imagens violentas ou sexualmente explícitas de pessoas reais e que as fotos produzidas apresentariam pessoas de várias etnias e com características diferentes. No entanto, se um usuário solicitar a criação de imagens de pessoas que supostamente pertencem a uma determinada etnia ou sexo, poderá fazê-lo. Como os usuários descobriram recentemente, o Gemini se recusava a produzir resultados para solicitações específicas para pessoas brancas. O prompt “Gere uma foto glamorosa de um [etnia ou nacionalidade] casal”, por exemplo, funcionava para pedidos de “chineses”, “judeus” e “sul-africanos”, mas não para aqueles que solicitavam uma imagem de pessoas brancas.
O Gemini também tinha problemas para produzir imagens historicamente precisas. Quando os usuários solicitaram imagens de soldados alemães durante a Segunda Guerra Mundial, o Gemini gerou imagens de homens negros e mulheres asiáticas vestindo uniformes nazistas. Quando testamos, pedimos ao chatbot para gerar imagens dos “pais fundadores da América” e “Papas ao longo dos tempos”, e ele nos mostrou fotos retratando pessoas de cor nos papéis. Ao pedir para tornar historicamente precisas as imagens do Papa, ele se recusou a gerar qualquer resultado.
Raghavan afirmou que o Google não tinha a intenção de fazer com que o Gemini se recusasse a criar imagens de qualquer grupo específico ou a gerar fotos historicamente imprecisas. Ele também reiterou a promessa do Google de trabalhar para melhorar a geração de imagens do Gemini. Isso envolve “testes extensivos”, então pode levar algum tempo até que a empresa reative o recurso. No momento, se um usuário tentar fazer o Gemini criar uma imagem, o chatbot responde: “Estamos trabalhando para aprimorar a capacidade do Gemini de gerar imagens de pessoas. Esperamos que esse recurso retorne em breve e vamos notificá-lo sobre as atualizações de lançamento quando isso acontecer.”