Nieuw AI-model van Nvidia verslaat GPT-4o in benchmarks: kleiner maar krachtiger

donderdag, 17 oktober 2024 om 23:01

Nvidia heeft een nieuw open-source AI-model gelanceerd dat beter presteert dan toonaangevende modellen zoals GPT-4o en Claude-3. Het model, Llama-3.1-Nemotron-70B-Instruct, is een verfijnde versie van Meta’s open-source Llama-70B en behaalt indrukwekkende scores in benchmarktests op de Chatbot Arena.

Nvidia's verfijning van Meta’s Llama-model

Het nieuwe model, Llama-3.1-Nemotron-70B, is een aangepaste versie van Meta's Llama-70B, een open-source AI-model dat door ontwikkelaars wereldwijd wordt gebruikt als basis voor eigen AI-toepassingen. Nvidia heeft deze versie geoptimaliseerd door gebruik te maken van geavanceerde datasets, fijnafstemming en zijn krachtige AI-hardware. Dit heeft geleid tot een AI die volgens Nvidia beter "behulpzaam" is dan modellen zoals OpenAI’s ChatGPT en Anthropic’s Claude-3.

Uitstekende prestaties in benchmarks

Volgens Nvidia heeft Llama-3.1-Nemotron-70B een score van 85 behaald in de “Hard” test van de Chatbot Arena Leaderboards, een benchmarkplatform waar AI-modellen worden vergeleken. Deze score plaatst het model boven GPT-4o en Claude-3, hoewel het nog niet officieel op de ranglijsten is opgenomen. Als de score klopt, zou dit model de huidige toonaangevende AI’s overtreffen in bruikbaarheid en effectiviteit.

NVIDIA AI Developer

@NVIDIAAIDev

·Follow

Our Llama-3.1-Nemotron-70B-Instruct model is a leading model on the 🏆 Arena Hard benchmark (85) from @lmarena_ai. Arena Hard uses a data pipeline to build high-quality benchmarks from live data in Chatbot Arena, and is known for its predictive ability of Chatbot Arena Elo

Watch on X

4:32 PM · Oct 15, 2024

500

Read 30 replies

Efficiëntie ondanks minder parameters

Een opmerkelijk detail is dat het Llama-3.1-Nemotron-70B model werkt met 70 miljard parameters, wat relatief bescheiden is in vergelijking met GPT-4o, dat naar schatting meer dan 1 biljoen parameters heeft. Dit laat zien dat Nvidia in staat is om een krachtiger model te leveren met minder rekenkracht door efficiënte verfijning en betere afstemming op de trainingsdata. Hierdoor kan het model vergelijkbare, zo niet betere, prestaties leveren dan AI's die veel groter zijn.

Nvidia verstevigt zijn positie in de AI-industrie

Met de lancering van dit model verstevigt Nvidia zijn positie in de AI-industrie. Het bedrijf staat al bekend om zijn GPU's die essentieel zijn voor het trainen van AI-modellen, en nu toont het aan dat het ook op softwaregebied een sterke concurrent is. Door gebruik te maken van Meta's open-source technologie en daarbovenop hun eigen verfijningen toe te passen, is Nvidia erin geslaagd een toonaangevend AI-model te ontwikkelen dat de concurrentie met de grootste namen in de industrie kan aangaan.

De introductie van Llama-3.1-Nemotron-70B benadrukt Nvidia’s ambitie om voorop te blijven lopen in de AI-race. Hoewel Meta's Llama-405B, een grotere versie met 405 miljard parameters, nog niet is meegenomen in de vergelijkingen, zet Nvidia met deze ontwikkeling een duidelijke stap in de richting van efficiëntere en effectievere AI-oplossingen.

Robin HeesterOprichter

Robin Heester is mede-oprichter van AI Wereld en heeft door de jaren heen meerdere websites, nieuwsbrieven en magazines opgericht. Hij schrijft over technologie, innovatie en de maatschappelijke impact van nieuwe digitale ontwikkelingen.