De finale van een opvallend AI
schaaktoernooi is beslist,
OpenAI’s o3 model
won van Elon Musk’s
Grok 4. Geen klassieke schaakcomputers of gespecialiseerde engines, maar algemene AI modellen die normaal gesproken teksten samenvatten, code schrijven en vragen beantwoorden. Juist daarom was het toernooi zo interessant om te volgen je zag de modellen denken, fouten maken en zich herpakken, net als mensen.
Grote AI modellen aanwezig op schaaktoernooi
Het toernooi duurde drie dagen en werd georganiseerd op Google’s Kaggle platform. Acht grote AI modellen deden mee, afkomstig van onder meer
OpenAI, xAI, Google, Anthropic en enkele Chinese ontwikkelaars. Het format was simpel en fair. Elk model kreeg dezelfde tijd, dezelfde regels, en geen ruimte voor geheime trucjes. Zo kon het publiek goed zien hoe de modellen beslissingen namen onder druk.
Ster van de show was o3, dat het hele toernooi ongeslagen bleef. Daarachter eindigde Google’s Gemini keurig als derde, na een winst op een ander model van OpenAI.
Grok 4 leek lang favoriet, maar in de finale ging het mis. Commentatoren noemden het spel “blunderend” en “onherkenbaar”. Meest pijnlijk waren de momenten waarop Grok herhaaldelijk zijn dame weggaf, het sterkste stuk in schaken.
Musk temperde vooraf de verwachtingen door te zeggen dat xAI weinig tijd had gestoken in schaak vaardigheid. Dat is op zichzelf een eerlijk punt. Toch laat de uitslag wel iets zien: o3 combineerde rekenkracht met degelijke principes, terwijl Grok 4 in cruciale momenten de controle verloor. En bij schaken, zeker onder toernooi stress, kosten kleine misstappen ineens heel veel.
Schaken al langer in gebruik als AI proef
Waarom dit boeit? Schaken en Go worden al jaren gebruikt als proef voor redeneervermogen en strategie in AI. Denk aan de jaren “90, toen IBM’s Deep Blue schaak wereldkampioen Garry Kasparov versloeg. Dat was een mijlpaal in computer intelligentie. Dit toernooi is anders van aard, want de deelnemers zijn geen pure schaakmachines maar generalisten. Toch geeft het een leuke, laagdrempelige blik op hoe ver algemene AI inmiddels is.