Explicação dos processos judiciais de IA: quem está sendo processado?

Getty Images/iStockphoto

Muitas pessoas acham que é hora de as empresas de IA pagarem pelos almoços gratuitos de dados que tornaram seus sistemas generativos grandes e fortes.

Recentemente, uma série de ações legais exigindo compensação de empresas de IA foi movida nos EUA e na Europa. Os demandantes incluem autores e artistas, que têm expressado consistentemente preocupação com o fato de a IA roubar seu trabalho e produzir derivados medíocres.

Uma carta aberta do Authors Guild – assinada por mais de 8.500 autores, incluindo Margaret Atwood, Dan Brown e Jodi Picoult – insta as empresas de tecnologia responsáveis por aplicações generativas de IA, como ChatGPT e Bard, a cessarem de usar seus trabalhos sem a devida autorização ou compensação. Os autores querem que as empresas paguem pelos dados que recolheram para formação – o “alimento” para os sistemas de IA, refeições intermináveis pelas quais não houve factura.

Os autores também expressam preocupação com o facto de a IA generativa ameaçar a sua profissão ao inundar o mercado com conteúdo escrito por máquina baseado no seu trabalho. Isso foi um problema nos últimos meses, quando a Amazon tomou medidas contra autores de IA que enviavam spam para a lista dos mais vendidos com obras geradas.

Antes da divulgação da carta do Authors Guild, dois autores norte-americanos – Mona Awad e Paul Tremblay – entraram com uma ação judicial contra a OpenAI, alegando que a organização violou a lei de direitos autorais. A ação argumentou que a OpenAI violou a lei de direitos autorais porque o ChatGPT gerou resumos precisos dos trabalhos do autor e, portanto, deve ter sido treinado nos trabalhos dos autores.

Eles não são os únicos. A autora e comediante Sarah Silverman também está processando OpenAI e Meta por reproduzir ilegalmente seu livro de memórias, The Bedwetter, sem permissão. No entanto, esse argumento pode não ser válido em tribunal devido à forma como a IA generativa funciona.

IA generativa é a tecnologia que alimenta o ChatGPT e o Bard. A IA generativa baseada em texto usa algoritmos para prever as próximas palavras prováveis no texto e gera esse texto com base em uma solicitação do usuário. O ChatGPT sabe o que gerar porque foi treinado em um grande corpus de dados disponíveis publicamente na Internet. Ele aprendeu padrões com o treinamento e combina esses padrões com as instruções do usuário.

IAs generativas são geralmente sistemas de IA de caixa preta, o que significa que ninguém – nem mesmo os programadores – entende as etapas exatas que a máquina executa para passar da entrada à saída. A entrada entra, a mágica acontece e a saída sai.

Todas as ferramentas de aprendizado de máquina e IA generativa usam algum tipo de trabalho preexistente.

As pessoas estão processando empresas de IA por direitos autorais. Embora o ChatGPT seja treinado com dados da Internet, ele o faz sem a permissão dos criadores dos dados. Por exemplo, o GPT-3 foi treinado na Wikipedia e no Reddit, entre outras fontes. No entanto, conversas sobre e segmentos de obras protegidas por direitos autorais podem existir no material de treinamento e fornecer aos grandes modelos de linguagem contexto suficiente para resumir com precisão essas obras protegidas por direitos autorais.

Em uma escala maior, as pessoas estão processando porque a IA é uma caixa preta e é impossível saber como ela funciona em um nível granular. O medo é que as pessoas usem a IA para evitar assumir a responsabilidade pelas suas decisões ou pelas coisas que ela produz.

“Se as empresas de IA forem autorizadas a comercializar sistemas de IA que são essencialmente caixas negras, poderão tornar-se os dispositivos finais que justificam os meios”, escreveu Matthew Butterick, um dos advogados por detrás de vários dos processos, no seu blog. “Em breve, não delegaremos decisões aos sistemas de IA porque eles têm melhor desempenho. Em vez disso, delegaremos decisões aos sistemas de IA porque eles podem fazer tudo o que não podemos”.

Numerosos casos foram movidos contra empresas de IA generativa em relação a direitos autorais e uso indevido. Aqui estão algumas das empresas que estão sendo processadas.

Uma ação coletiva foi movida contra essas empresas envolvendo a ferramenta Copilot do GitHub. A ferramenta gera código de forma preditiva com base no que o programador já escreveu. Os demandantes alegam que o Copilot copia e republica o código do GitHub sem cumprir os requisitos da licença de código aberto do GitHub, como não fornecer atribuição. A reclamação também inclui reclamações relacionadas ao uso indevido de dados e informações pessoais pelo GitHub, bem como reclamações de fraude. A reclamação foi apresentada em novembro de 2022. A Microsoft e o GitHub tentaram repetidamente fazer com que o caso fosse arquivado.