Wikipedia luidt alarm om AI-crawlers: 50% meer dataverkeer, eist compensatie

maandag, 07 april 2025 om 21:28

bijgewerkt om dinsdag, 08 april 2025 om 10:01

wikipedia luidt alarm om ai crawlers 50 meer dataverkeer eist compensatie

Wikipedia krijgt het zwaar te verduren door een explosieve toename van AI-verkeer. De Wikimedia Foundation, beheerder van ’s werelds grootste online encyclopedie, waarschuwt dat AI-bots hun systemen overbelasten. In ruim een jaar tijd steeg het dataverkeer met meer dan 50%, voornamelijk veroorzaakt door automatische crawlers van AI-bedrijven die content willen gebruiken voor het trainen van taalmodellen.

De organisatie roept op tot een “eerlijke deal”: als AI-makers Wikipedia massaal gebruiken, moet er ook iets terugvloeien naar de bron. Deze discussie raakt ook Nederland, waar Wikipedia een essentieel kennisplatform is voor miljoenen mensen. Dat meldt o.a TechPulse.

AI-crawlers overspoelen Wikipedia: wat is er aan de hand?

Bots razen door artikelen, inclusief vergeten pagina’s

Sinds begin 2024 ziet Wikimedia een ongekende toename in geautomatiseerd verkeer. AI-bedrijven laten hun bots op grootschalige wijze Wikipedia doorzoeken om data te verzamelen voor modeltraining.

Verkeer is met 50% gestegen door AI-crawlers
Zelfs obscure artikelen worden massaal bezocht
Menselijke gebruikers ervaren soms vertraging bij piekmomenten
Voorbeeld: bij het overlijden van Jimmy Carter concurreerden bots met echte bezoekers om bandbreedte

Volgens schattingen is 65% van het intensieve verkeer inmiddels afkomstig van bots. Dit leidt niet alleen tot hogere kosten, maar ook tot zorgen over stabiliteit. Wikimedia’s technische teams moeten voortdurend ingrijpen om de site beschikbaar te houden.

Wikimedia: “AI-bedrijven moeten bijdragen”

Wikimedia is grotendeels afhankelijk van donaties. De forse kostenstijging door AI-verkeer maakt het huidige model kwetsbaar. In een recente analyse noemt de organisatie het gebruik van Wikipedia door AI-bedrijven “onhoudbaar zonder compensatie”.

De kernvraag: moeten AI-firma’s betalen voor het gebruik van publieke content?

Waarom dit belangrijk is voor Nederland

Beschikbaarheid van vrije kennis in gevaar

Nederland is een van de grootste gebruikers van Wikipedia per hoofd van de bevolking. Het platform speelt een cruciale rol in:

Onderwijs: scholieren en studenten gebruiken Wikipedia dagelijks
Media: journalisten controleren feiten
Burgers: snel en betrouwbaar toegang tot kennis

Als AI-crawlers Wikipedia vertragen of duurder maken, raakt dat iedereen die rekent op vrije informatie. Tijdens belangrijke gebeurtenissen kan overbelasting zelfs leiden tot tijdelijke onbereikbaarheid.

Eerlijke data-deals en wetgeving

De discussie raakt aan bredere thema’s zoals:

Auteursrecht en eerlijke vergoeding: moet contentgebruik door AI betaald worden?
Privacybescherming: wat als bots ook gevoelige pagina’s of gebruikersbijdragen lezen?
EU-beleid: Nederland was al koploper in regelgeving rond techbedrijven en nieuwsgebruik. Deze situatie vraagt om vergelijkbare actie.

Ook andere Nederlandse organisaties – zoals uitgevers, digitale archieven en contentmakers – volgen deze discussie nauwlettend. Wikipedia is slechts het topje van de data-ijsberg.

Internationale reacties en juridische discussie

AI-bedrijven pleiten voor "fair use", Europa wil "fair pay"

In de VS lobbyen bedrijven als OpenAI, Google en Meta voor ruimere fair use-regels, zodat zij vrijelijk bestaande content mogen gebruiken om AI te trainen. Zij willen dat zelfs auteursrechtelijk beschermd werk valt onder deze uitzonderingen.

In Europa klinkt juist een tegenbeweging:

Auteurs en uitgevers eisen dat AI-modellen toestemming vragen of betalen
De EU AI Act geeft nog geen volledige bescherming, maar gedragscodes staan op stapel
Wikimedia’s oproep tot compensatie sluit hierbij aan: data mag niet gratis zijn als er commerciële waarde uit wordt gehaald

In landen als Australië en Canada zijn al afspraken gemaakt waarbij techbedrijven moeten betalen voor het gebruik van nieuwscontent. Een soortgelijk model zou ook kunnen gelden voor Wikipedia.

Wikipedia staat model voor bredere discussie

Wikimedia is niet de enige organisatie die zich zorgen maakt. Ook andere platforms, zoals Stack Overflow, overwegen maatregelen. Kunstenaars en schrijvers zijn juridische procedures begonnen tegen AI-bedrijven vanwege ongeoorloofd gebruik van hun werk.

De digitale commons – publieke informatiebronnen die voor iedereen toegankelijk zijn – dreigen uitgeput te raken door onbeperkte scraping. Zonder duidelijke afspraken is het risico groot dat deze bronnen onder hun eigen succes bezwijken.

Conclusie: tijd voor herijking van het AI-data-ecosysteem

De oproep van Wikimedia is helder: wie waarde haalt uit publieke data, moet ook bijdragen aan het behoud ervan. Nederland en Europa hebben de kans om hier het voortouw te nemen met slimme, rechtvaardige regelgeving.

Zonder ingrijpen dreigt Wikipedia – en bij uitbreiding de vrije kennis online – slachtoffer te worden van haar eigen succes in het AI-tijdperk. De vraag is niet óf er regels moeten komen, maar hoe snel en hoe eerlijk ze vorm krijgen.

Robin HeesterOprichter

Robin Heester is mede-oprichter van AI Wereld en heeft door de jaren heen meerdere websites, nieuwsbrieven en magazines opgericht. Hij schrijft over technologie, innovatie en de maatschappelijke impact van nieuwe digitale ontwikkelingen.

Ethiek en AI Wikipedia

Vorig artikel

OpenAI lanceert GPT-5 later dan verwacht

Volgend artikel

Cloudflare verlaagt drempel om AI-agents te bouwen en te implementeren

Plaats reactie