OpenAI lanceert o3-mini voor ChatGPT

Nieuws
vrijdag, 31 januari 2025 om 23:31
openai lanceert o3 mini voor chatgpt

OpenAI heeft vandaag o3-mini gelanceerd, een geavanceerd maar kostenefficiënt AI-model dat sterke prestaties levert in wiskunde, wetenschap en codering. Dit model, dat de opvolger is van o1-mini, biedt hogere rekencapaciteiten, snellere prestaties en lagere kosten. Het is per direct beschikbaar via de ChatGPT-interface en de API voor ontwikkelaars.

Belangrijkste verbeteringen in OpenAI o3-mini

De o3-mini is ontworpen als een krachtig en snel reasoning-model dat geoptimaliseerd is voor technische taken. Het introduceert belangrijke verbeteringen ten opzichte van o1-mini, waaronder:

  • Sterkere prestaties in wiskunde en wetenschap, met nauwkeurigere en complexere analyses bij het oplossen van technische problemen.
  • Drie niveaus van redeneerkracht: ontwikkelaars kunnen kiezen tussen laag, medium en hoog om snelheid en nauwkeurigheid te optimaliseren.
  • Snellere reactietijden, tot 24% sneller dan o1-mini, met een gemiddelde responstijd van 7,7 seconden.
  • Uitgebreide ondersteuning voor ontwikkelaars, waaronder function calling, gestructureerde output en ontwikkelaarsberichten.
  • Hogere limieten voor ChatGPT-gebruikers: ChatGPT Plus- en Team-gebruikers kunnen nu 150 berichten per dag versturen, een verdriedubbeling ten opzichte van o1-mini.

Met deze verbeteringen zet OpenAI een grote stap in de ontwikkeling van betaalbare AI met geavanceerd redeneervermogen, specifiek voor toepassingen in wetenschap en technologie. Dat meldt OpenAI op hun website.

Hoe presteert o3-mini in benchmarks?

Uit testen blijkt dat OpenAI o3-mini op meerdere AI-benchmarks beter presteert dan zijn voorganger:

  • Wiskundige redenering (AIME 2024): o3-mini (hoog) behaalt 83,6% accuraatheid, ver boven eerdere versies.
  • PhD-niveau wetenschappelijke vragen (GPQA Diamond): o3-mini (hoog) bereikt 77,0% accuraatheid, een aanzienlijke verbetering ten opzichte van eerdere modellen.
  • Competitief programmeren (Codeforces): o3-mini (hoog) haalt 2073 Elo, waarmee het oudere modellen overtreft.
  • Softwareontwikkeling (SWE-bench Verified): o3-mini (hoog) behaalt 48,9% accuraatheid, de hoogste score tot nu toe in deze test.

Opvallend is dat o3-mini in veel gevallen zelfs beter presteert dan OpenAI o1 bij wiskunde- en coderingstaken, terwijl het minder rekenkracht vereist en sneller reageert.

OpenAI o3-mini in ChatGPT en API

Vanaf vandaag kunnen ChatGPT Plus-, Team- en Pro-gebruikers direct gebruik maken van OpenAI o3-mini. Enterprise-klanten krijgen volgende week toegang.

Voor ontwikkelaars wordt het model uitgerold via de Chat Completions API, Assistants API en Batch API. Gebruikers van gratis accounts kunnen o3-mini testen via de ‘Reason’-functie in de ChatGPT-interface. Dit is de eerste keer dat een reasoning-model beschikbaar wordt gesteld aan gratis gebruikers.

Veiligheid en betrouwbaarheid

OpenAI heeft o3-mini voorzien van geavanceerde veiligheidsmaatregelen om het model beter bestand te maken tegen misbruik en ongewenste output. Dit is bereikt door:

  • Deliberatieve afstemming, waarbij het model leert om eerst na te denken over menselijke veiligheidsnormen voordat het antwoordt.
  • Uitgebreide tests met externe veiligheidsexperts om kwetsbaarheden in het model op te sporen en te verhelpen.
  • Verbeterde detectie en preventie van jailbreaks en ongewenste antwoorden, waardoor het model beter presteert dan GPT-4o op dit gebied.

Volgens OpenAI heeft o3-mini in interne veiligheidstests beter gescoord dan eerdere modellen, terwijl de prestaties op kennis- en redeneertaken behouden blijven.

Toekomstplannen

Met de lancering van o3-mini zet OpenAI een nieuwe stap in de ontwikkeling van betaalbare, krachtige AI. Het model biedt verbeterde prestaties voor STEM-vraagstukken en programmeertaken, terwijl het tegelijkertijd toegankelijker wordt gemaakt voor een breder publiek.

OpenAI blijft werken aan verdere optimalisatie van redeneer- en zoekcapaciteiten. Zo wordt momenteel geëxperimenteerd met een geïntegreerde zoekfunctie waarmee o3-mini actuele informatie kan vinden en bronnen kan tonen. Dit is een vroege prototypeversie en zal in de toekomst verder worden ontwikkeld.

Met de focus op efficiëntie, veiligheid en intelligentie blijft OpenAI werken aan AI-modellen die zowel toegankelijk als krachtig zijn.

Populair nieuws