Professoren bouwden een eigen bedrijf met AI werknemers, dit was het resultaat

maandag, 28 april 2025 om 10:00

swarm van openai lichtgewicht framework voor ai agenten

Met de opkomst van kunstmatige intelligentie (AI), neemt ook de angst steeds meer toe dat de technologie al onze banen gaat overnemen. Professoren van de Carnegie Mellon University wilden deze zorg aan de kaak stellen en bouwden daarom een nepbedrijf. De werknemers? Allemaal AI-agenten.

Experiment toont zwakte van AI

Stel je voor, een compleet softwarebedrijf, volledig bemand door AI-agenten van grote namen als Google, OpenAI, Anthropic en Meta. Dat is precies wat onderzoekers van de universiteit deden met TheAgentCompany.

De digitale werknemers kregen serieuze functies: software engineer, projectmanager en zelfs financieel analist. Hun dagelijkse bezigheden? Bestanden ordenen, virtuele kantoren verkennen en prestatiebeoordelingen schrijven alsof hun digitale leven ervan afhing.

Klinkt indrukwekkend? Nou, in de praktijk viel het flink tegen. De resultaten waren namelijk allesbehalve rooskleurig. De best presterende AI, Claude 3.5 Sonnet van Anthropic, wist nog niet eens een kwart van de taken succesvol af te ronden, slechts 24%! En Google's Gemini 2.0 Flash? Die haalde nog maar 11,4% van de opdrachten. De echte verliezer was Amazon's Nova Pro v1, die amper 1,7% van zijn werk wist af te maken.

Wat ging er mis?

De onderzoekers concludeerden dat AI-agenten in het nepbedrijf kampten met een schrijnend gebrek aan gezond verstand en beperkte sociale vaardigheden zorgden voor problemen. Soms probeerden de agenten zelfs taken 'op te lossen' door gebruikersnamen aan te passen, wat leidde tot nog grotere chaos.

Het belangrijkste inzicht uit deze proef is dat AI-technologie vandaag de dag meer lijkt op een slimme aanvulling op je telefoon dan op een entiteit die zelfstandig kan denken. Hoewel AI bepaalde kleine taken best aardig kan uitvoeren, zijn echte menselijke vaardigheden, zoals creativiteit, empathie en een probleemoplossend denkvermogen, nog lang niet te vervangen.

Kortom: de technologie is voorlopig simpelweg niet klaar om de complexe, menselijke wereld echt te begrijpen of over te nemen. Maar wie weet? Misschien staan we over een paar jaar wél versteld van wat AI allemaal kan.