AI bedrijf Anthropic beschuldigd van agressieve data scraping

zondag, 28 juli 2024 om 12:00

hollywood acteurs vechten tegen generatieve ai staking in de wereld van gaming

Het kunstmatige intelligentie (AI) bedrijf Anthropic, dat als een geduchte concurrent van OpenAI wordt beschouwd, ziet zich geconfronteerd met beschuldigingen naarmate zijn populariteit groeit. Het bedrijf zou zich schuldig maken aan het agressief schrapen van data van websites zoals Freelancer.com en iFixit.com om hun AI modellen te trainen. Deze praktijk wordt gezien als een schending van de gebruiksvoorwaarden van de getroffen websites.

Volgens Matt Barrie, CEO van Freelancer.com, ontving zijn website 3,5 miljoen bezoeken van een Anthropic webcrawler binnen vier uur, wat aanzienlijk meer is dan andere AI crawlers. iFixit.com meldde vergelijkbare problemen met 1 miljoen hits in 24 uur, wat leidde tot verstoringen en alarmen. Deze websites gebruikten het protocol ‘robots.txt’ om webcrawlers te reguleren, maar deze regels werken op vrijwillige basis en werden door Anthropic genegeerd, volgens de getroffen partijen.

Reactie Anthropic

Het schrapen van data door AI crawlers heeft aanzienlijke kosten veroorzaakt voor websites, waaronder verhoogde bandbreedtekosten en verstoringen van de dienstverlening. Dit gedrag wordt als onbeleefd internetgedrag beschouwd en kan leiden tot een algemene terugslag tegen AI crawlers.

Anthropic heeft verklaard de zaak te onderzoeken en dat ze de verzoeken van uitgevers respecteren. Ze streven ernaar hun crawlers niet opdringerig of storend te laten zijn. Desondanks roept hun aanpak ethische vragen op over de impact op websites en hun gebruikers.

Ethische overwegingen

De toename van dataverzameling door AI crawlers is het resultaat van de wedloop in de AI industrie om steeds geavanceerdere modellen te ontwikkelen. Bedrijven zoals OpenAI hebben samenwerkingsverbanden gesloten met uitgevers om toegang tot data te krijgen, terwijl Anthropic dergelijke partnerschappen nog niet heeft aangekondigd.

Anthropic probeert zich te positioneren als een verantwoordelijke speler in de AI industrie, met als doel de ontwikkeling van geavanceerde AI voor het langetermijnvoordeel van de mensheid. Echter, hun dataverzameling praktijken roepen vragen op over de balans tussen technologische vooruitgang en ethische verantwoordelijkheid.