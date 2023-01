A IA por trás do promissor bot de bate-papo teve que ser treinada para não divulgar conteúdo sexual e violento

O ChatGPT, um chatbot com inteligência artificial que atraiu atenção generalizada por sua geração de texto, foi parcialmente construído usando o trabalho de trabalhadores mal pagos no Quênia, informou a revista TIME. Eles foram contratados para ler trechos de texto explícito e rotulá-los, para que o algoritmo evitasse esse tipo de linguagem.

De acordo com uma exposição publicada na quarta-feira, o desenvolvedor OpenAI contratou uma empresa com sede em São Francisco chamada Sama, especializada em anotar dados para treinamento de IA. O trabalho é feito por humanos em países como Quênia e Uganda, onde os salários são mais baixos do que nos países desenvolvidos.

Três contratos da Sama com a OpenAI foram assinados no final de 2021 e valiam cerca de US$ 200.000, informou a TIME com base em documentos de cobrança. Cerca de três dúzias de trabalhadores no Quênia foram encarregados de ler descrições gráficas de atos, incluindo abuso sexual de crianças, bestialidade, assassinato, suicídio, tortura, automutilação e incesto.

Sua saída, rotulada de acordo com a natureza do conteúdo, foi usada pela OpenAI para treinar sua IA para policiar seu próprio idioma. O ChatGPT gera texto depois de aprender com bilhões de palavras escritas por humanos disponíveis online, incluindo materiais inapropriados.













De acordo com o furo, os trabalhadores no Quênia recebiam um salário líquido entre US$ 1,32 e US$ 2 por hora, dependendo de seu cargo e desempenho. Três deles disseram à TIME que deveriam analisar 150 e 250 passagens de texto, variando de 100 a 1.000 palavras, em um turno de nove horas.

No ano passado, a TIME informou que Sama fez um trabalho semelhante para o Facebook, auxiliando na remoção de conteúdo que violasse as regras da plataforma. Em ambos os casos, a revista disse que algumas pessoas ficaram com “cicatrizes mentais” depois de ler os materiais tóxicos.

No início de 2022, a OpenAI contratou Sama para outro trabalho, que envolvia rotular imagens explícitas para um projeto diferente. Mas, dentro de semanas, o subcontratado desistiu do negócio, aparentemente porque algumas das imagens eram ilegais sob a lei dos Estados Unidos. A OpenAI culpou a falta de comunicação.

No início deste mês, a Sama anunciou que não trabalharia mais com conteúdo confidencial e, em vez disso, se concentraria na anotação de dados para soluções de visão computacional de IA. A TIME observou que, apesar de todo o seu glamour, “A IA geralmente depende de trabalho humano oculto no Sul Global, que muitas vezes pode ser prejudicial e explorador.”