DeepMind AI overtreft top wiskundigen op Wiskunde Olympiade

zaterdag, 08 februari 2025 om 10:00

In de wereld van kunstmatige intelligentie (AI) is het geen dag saai. Dit keer is het DeepMind’s AlphaGeometry2 dat indrukwekkende perstaties laat zien. Dit geavanceerde AI systeem zet een enorme stap voorwaarts en lost nu wiskundeproblemen op hoog niveau op. Zo verslaat het goudmedaillewinnaars in de prestigieuze Internationale Wiskunde Olympiade (IMO).

Het is duidelijk, AI wordt steeds slimmer en komt dichter bij menselijke topprestaties komt. Met de prestaties heeft Google’s DeepMind de lat opnieuw hoger gelegd. Waar de eerste versie, AlphaGeometry, al indruk maakte door op zilverniveau te presteren, gaat zijn opvolger nog een flinke stap verder.

De nieuwste versie van AlphaGeometry is slimmer dan ooit. DeepMind’s AlphaGeometry2 laat vooral in meetkunde zien waar AI toe in staat is. Hier draait het om inzicht, logisch redeneren en het leveren van wiskundige bewijzen. Het systeem weet uitstekend geometrische objecten te verplaatsen en complexe vergelijkingen op te lossen.

Met zijn inzichten wist het systeem maar liefst 84% van alle meetkundeproblemen uit de afgelopen 25 jaar van de IMO correct te beantwoorden. Ter vergelijking: zijn voorganger kwam niet verder dan 54%. Een gigantische sprong vooruit die laat zien hoe snel AI zich ontwikkelt.

Hoewel teams uit India en China vorig jaar ook AI systemen ontwikkelden die goudmedaille niveau bereikten, presteerde DeepMind’s oplossing over een veel breder scala aan problemen. Toch komt het systeem niet in aanmerking voor de prestigieuze AI Mathematical Olympiad Prize van $5 miljoen, omdat het niet open-source is.

Wat maakt AlphaGeometry2 zo krachtig?

Een van de meest indrukwekkende upgrades in DeepMind’s AlphaGeometry2 is de integratie van Gemini, Google’s geavanceerde taalmodel. Hierdoor begrijpt de AI wiskundige taal niet alleen beter, maar kan hij ook zelf foutloze bewijzen opstellen.

Daarnaast pakt deze verbetering een groot AI probleem aan: ‘hallucinaties’, oftewel het verzinnen van foutieve of onlogische antwoorden. Met Gemini aan boord is AlphaGeometry2 niet alleen slimmer, maar ook een stuk betrouwbaarder.

Wat brengt de toekomst?

Ondanks deze doorbraak zijn er nog wiskunde onderdelen waar AlphaGeometry2 beter in moet worden. Zo moet de AI zich verder ontwikkelen om wiskundige problemen met ongelijkheden en niet-lineaire vergelijkingen op te lossen. Toch lijkt het slechts een kwestie van tijd voordat AI net zo goed, of zelfs beter, wordt dan de allerbeste menselijke wiskundigen. De volgende grote test? De IMO van juli 2025 in Australië.