Nieuwe AI op basis van brein simulatie verslaat ChatGPT en Claude

zaterdag, 30 augustus 2025 om 12:00

bijgewerkt om maandag, 01 september 2025 om 8:38

Wetenschappers uit Singapore hebben een opvallende nieuwe kunstmatige intelligentie ontwikkeld: het zogenaamde hierarchical reasoning model (HRM). Zo werd gedeeld op Live Science. Dit model is geïnspireerd op de manier waarop het menselijk brein informatie verwerkt en blijkt aanzienlijk beter te presteren op lastige redeneertesten dan bekende grote taalmodellen zoals ChatGPT, Claude en DeepSeek in een recent onderzoek.

Klein model met grote prestaties

Waar ChatGPT en vergelijkbare modellen miljarden tot zelfs triljoenen parameters gebruiken, heeft HRM er slechts 27 miljoen nodig. Bovendien werd het getraind op slechts 1.000 voorbeelden, wat een fractie is van de enorme datasets die normaal gesproken worden ingezet. Daarmee is HRM dus een stuk efficienter.

Toch scoorde HRM op de beruchte ARC-AGI benchmark opvallend hoog. In ARC-AGI-1 haalde het model een score van 40,3%, vergeleken met 34,5% voor OpenAI’s o3-mini-high, 21,2% voor Claude 3.7 en slechts 15,8% voor DeepSeek R1. Ook in de moeilijkere ARC-AGI-2 test kwam HRM met 5% boven de rest uit, terwijl de concurrentie bleef steken op 3% of lager.

Nieuw AI model kan redeneren als een mens

In tegenstelling tot de chain-of-thought techniek die veel LLMs gebruiken, werkt HRM met twee aparte modules. Een module richt zich op langzame, abstracte planning, terwijl de andere snelle, gedetailleerde berekeningen uitvoert. Het model combineert die twee via korte denk-bursts, waarbij het stap voor stap zijn antwoord verfijnd. Dankzij deze aanpak wist HRM complexe problemen bijna foutloos op te lossen, zoals Sudoku puzzels en doolhof optimalisaties, taken waar de meeste taalmodellen vaak juist moeite mee hebben.

Toch is er een kanttekening. De studie waarin HRM wordt gepresenteerd is nog niet peer-reviewed. Bovendien gaven de organisatoren van de ARC-AGI benchmark aan dat de opvallende resultaten waarschijnlijk meer te maken hebben met de verfijnde trainingsmethode dan met de architectuur zelf. Of HRM echt een doorbraak betekent, moet dus nog blijken in herhaalde tests.