Um documento interno da Meta permitia que chatbots da companhia mantivessem conversas de teor romântico ou sensual com crianças, produzissem informações médicas falsas e elaborassem declarações racistas, revelou uma análise da agência Reuters.
Intitulado “GenAI: Padrões de risco de conteúdo”, o material, com mais de 200 páginas, estabelece regras para o assistente generativo Meta AI e para outros bots presentes no Facebook, WhatsApp e Instagram. O texto foi aprovado por equipes jurídica, de políticas públicas e de engenharia, incluindo o diretor de ética da empresa.
Os padrões citavam como “aceitável” que um bot descrevesse uma criança usando termos que evidenciam atração, por exemplo: “sua forma jovem é uma obra de arte”. Outra passagem considerava permitido dizer a uma criança de oito anos sem camisa que “cada centímetro de você é uma obra-prima — um tesouro que prezo profundamente”. O limite imposto era evitar menções que caracterizassem desejo sexual por menores de 13 anos.
Depois que a Reuters questionou a empresa, a Meta removeu esses trechos. Segundo o porta-voz Andy Stone, as orientações eram “errôneas e inconsistentes” com a política corporativa, que proíbe a sexualização de crianças. Ele admitiu, porém, que a aplicação dessas regras ainda é irregular.
Embora o documento proíba discurso de ódio, há uma exceção que autoriza chatbots a criarem “declarações que rebaixem pessoas com base em suas características”. Pelo texto, seria aceitável que o Meta AI redigisse um parágrafo afirmando que negros são “mais burros do que brancos”.
As regras também admitem a fabricação de conteúdo sabidamente falso, desde que o bot indique explicitamente a inveracidade. Um exemplo citado é um artigo atribuindo, sem prova, clamídia a um membro da realeza britânica vivo, acompanhado de um aviso de que se trata de invenção.
Os padrões vetam incentivos a práticas ilegais ou conselhos jurídicos, de saúde ou financeiros. Nesses contextos, recomendam expressões como “eu recomendo” em vez de instruções diretas.
Imagem: redir.folha.com.br
O documento dedica trechos a pedidos de imagens envolvendo figuras públicas. Solicitações como “Taylor Swift com seios enormes” ou “Taylor Swift completamente nua” devem ser rejeitadas. Já o pedido “Taylor Swift de topless, cobrindo os seios com as mãos” pode ser contornado com a criação de uma imagem alternativa da cantora “segurando um peixe enorme”.
Quanto à violência, é permitido gerar imagens de crianças trocando socos ou de um homem ameaçando uma mulher com motosserra, desde que não haja sangue ou morte explícita. Mostrar idosos sendo agredidos também é considerado aceitável, contanto que não inclua ferimentos letais.
Evelyn Douek, professora da Faculdade de Direito de Stanford, afirmou que o documento evidencia lacunas legais e éticas na regulação de conteúdo gerado por IA. Para ela, há diferença entre uma plataforma que apenas hospeda material controverso e outra que o produz ativamente.
A Meta confirmou a autenticidade do documento, mas se recusou a fornecer a versão atualizada após as mudanças.