Uma fundação holandesa remove um conjunto de dados de treinamento de IA usado ilegalmente

Citando violação de direitos autorais, a organização holandesa BREIN conseguiu remover um grande conjunto de dados linguísticos que estava sendo usado no treinamento de IA.

Num comunicado divulgado na terça-feira, o BREIN explicou que o conjunto de dados incluía 10.000 livros, artigos de notícias e legendas em holandês para filmes e séries de TV obtidos sem permissão.

A lei de IA da UE visa regular as fontes de dados de treinamento

De acordo com o diretor Bastiaan van Ramshorst, não ficou imediatamente claro até que ponto o conjunto de dados poderia ser usado pelas empresas de IA. “É muito difícil saber, mas estamos tentando ser oportunos” para evitar futuros processos judiciais, disse ele.

A lei de IA recentemente proposta pela União Europeia também exigirá que as empresas de IA forneçam acesso ao seu conjunto de dados e à fonte dos dados utilizados para treinar modelos de IA. Outras batalhas legais relacionadas ainda estão em curso nos Estados Unidos. Por exemplo, a OpenAI, apoiada pela Microsoft, está regularmente envolvida em várias questões jurídicas, como a recente com o New York Times.

Diz-se que a Microsoft copiou os trabalhos jornalísticos registrados do demandante, bem como outros trabalhos jornalísticos protegidos por direitos autorais. Em relação à potencial violação, o CEO da empresa teria dito que a empresa possui esses dados.

As alegações sugerem que a Microsoft usou esses materiais protegidos por direitos autorais em produtos de IA, incluindo ChatGPT e Copilot, sem obter licenças. A denúncia acusa especificamente a Microsoft de remover informações significativas dessas obras. Como o nome do autor, o título da obra, a marca d’água de “direitos autorais” e outras restrições.

Na Dinamarca, as medidas antipirataria também produziram resultados substanciais na luta contra a violação dos direitos de autor. No ano passado, um grupo de protecção de direitos de autor com sede na Dinamarca, a Denmark Rights Alliance, solicitou e obteve que o conjunto de dados “Books3” fosse removido da Internet.

O fornecedor do conjunto de dados cumpre a ordem judicial e remove o conteúdo

A pessoa que forneceu o conjunto de dados holandês cumpriu a ordem judicial emitida pelo BREIN. Este acordo resultou na remoção do conjunto de dados do site que anteriormente fornecia o conjunto de dados para download. BREIN recusou-se a revelar a identidade da pessoa envolvida neste caso devido às leis de privacidade holandesas.

A remoção deste conjunto de dados demonstra que os grupos de direitos de autor continuam a lutar pela protecção dos direitos de propriedade intelectual no mundo digital. Para resolver o problema da eliminação em massa de materiais protegidos por direitos autorais, o BREIN recomenda que os detentores de direitos utilizem as reservas previstas na Lei de Direitos Autorais (Artigo 15o.1).