Meta ligt opnieuw onder vuur vanwege de trainingsdata achter zijn AI-model Llama. Grote uitgevers als Elsevier, Hachette Book Group, Macmillan Publishers en McGraw Hill hebben samen met auteur Scott Turow een omvangrijke rechtszaak aangespannen tegen Meta Platforms en topman Mark Zuckerberg. Volgens de aanklacht gebruikte Meta miljoenen illegaal verkregen boeken en artikelen om zijn AI-systemen te trainen.
De
zaak werd maandag ingediend bij de federale rechtbank in New York en vormt een nieuwe escalatie in de juridische strijd rond AI-trainingdata. De uitgevers beschuldigen Meta van grootschalige auteursrechtschendingen, waaronder het downloaden van boeken via torrentsites, het scrapen van internetdata en het reproduceren van beschermd materiaal voor AI-training.
Uitgevers spreken van “massale auteursrechtschending”
De aanklacht telt 65 pagina’s en beschrijft hoe Meta volgens de eisers “miljoenen auteursrechtelijk beschermde werken” zou hebben gekopieerd voor de ontwikkeling van de Llama-modellen. Het gaat onder meer om romans, studieboeken, wetenschappelijke artikelen en educatieve publicaties.
Volgens de uitgevers gebruikte Meta illegale torrents en datasets van piratensites om snel grote hoeveelheden tekst te verzamelen. Daarna zou het bedrijf die data meerdere keren hebben gekopieerd tijdens het trainen van verschillende AI-modellen.
De eisers stellen bovendien dat Meta bewust bestaande licentiemodellen heeft omzeild. In de aanklacht staat dat het concern aanvankelijk gesprekken voerde over officiële licenties voor boeken en publicaties, maar daar later vanaf zag op instructie van Zuckerberg.
Llama centraal in nieuwe AI-copyrightzaak
De rechtszaak richt zich specifiek op Llama, de familie van grote taalmodellen van Meta. Die modellen vormen de basis voor verschillende AI-producten binnen Facebook, Instagram, WhatsApp en Meta AI-assistenten.
Volgens de uitgevers kan Llama teksten genereren die sterk lijken op bestaande boeken, samenvattingen produceren van beschermde werken en zelfs schrijfstijlen van auteurs nabootsen. Daardoor zou het systeem direct concurreren met menselijke schrijvers en uitgevers.
De eisers noemen dat een fundamentele bedreiging voor de uitgeefsector. Ze stellen dat AI-bedrijven profiteren van creatieve werken zonder toestemming of vergoeding aan makers.
Nieuwe druk op AI-industrie
De zaak tegen Meta staat niet op zichzelf. Grote technologiebedrijven krijgen wereldwijd steeds meer juridische druk vanwege de datasets waarmee generatieve AI wordt ontwikkeld. Eerder werden ook OpenAI, Microsoft en Anthropic aangeklaagd door auteurs, artiesten en mediabedrijven.
Toch kan deze nieuwe zaak extra impact hebben. Voor het eerst trekken meerdere grote internationale uitgevers gezamenlijk op tegen een AI-bedrijf van deze omvang. Dat vergroot de politieke en economische druk op de sector.
De aanklacht richt zich bovendien niet alleen op het trainen van AI-modellen, maar ook op de manier waarop Meta data zou hebben verzameld. De uitgevers beschuldigen het bedrijf van distributie via torrents, verwijdering van copyrightinformatie en bewuste omzeiling van licentieconstructies.
Waarom deze zaak belangrijk is voor Nederland
De uitkomst van deze zaak kan ook gevolgen hebben voor Nederlandse uitgevers, onderwijsinstellingen en AI-bedrijven. Veel generatieve AI-modellen gebruiken internationale datasets waarin ook Nederlandstalige boeken, wetenschappelijke publicaties en educatieve content voorkomen.
Nederland werkt ondertussen aan strengere AI-regels via de Europese AI Act en bestaande auteursrechtwetgeving. Europese toezichthouders kijken steeds nadrukkelijker naar transparantie rond trainingsdata en de rechten van makers.
Voor Nederlandse uitgevers ontstaat daardoor een belangrijke vraag: mogen AI-bedrijven auteursrechtelijk beschermd materiaal gebruiken zonder expliciete toestemming of vergoeding?
De rechtszaak tegen Meta kan daar internationaal richting aan geven.
Meta verdedigt gebruik van trainingsdata
Meta heeft eerder aangegeven dat het trainen van AI-modellen onder “fair use” kan vallen binnen het Amerikaanse auteursrecht. Techbedrijven stellen dat AI-systemen patronen leren uit data en geen directe kopieën opslaan van complete boeken.
Critici wijzen er juist op dat moderne AI-systemen steeds beter volledige passages, schrijfstijlen en samenvattingen kunnen reproduceren. Daardoor verschuift het debat van technisch gebruik naar economische impact.
De komende maanden wordt duidelijk hoe agressief de uitgevers hun zaak willen doorzetten en of Meta bereid is tot een schikking of langdurige rechtsstrijd.