SimpelQA

SimpleQA bestaat uit meer dan 4.300 vragen, die zijn ontworpen om uitdagend te zijn voor de huidige geavanceerde AI-modellen zoals GPT-4 en Claude 3.5. Het benchmark streeft ernaar AI-modellen te verbeteren in het "weten wat ze weten". Vragen variëren in onderwerp van wetenschap en politiek tot entertainment, wat zorgt voor een divers en representatief testkader.

Populair nieuws

Net binnen