Anthropic kondigt nieuw model aan: Claude Haiku komt nog deze maand uit

dinsdag, 22 oktober 2024 om 19:02

claude kondigt nieuw model aan haiku komt nog in oktober uit

Anthropic heeft twee nieuwe AI-modellen gelanceerd: een verbeterde versie van Claude 3.5 Sonnet en een gloednieuw model, Claude 3.5 Haiku. Claude 3.5 Sonnet biedt aanzienlijke verbeteringen, met name op het gebied van codering, terwijl Claude 3.5 Haiku vergelijkbare prestaties levert als zijn voorganger Claude 3 Opus, tegen dezelfde kosten en snelheid.

Daarnaast introduceert Anthropic een nieuwe experimentele functie: computernavigatie, waarmee AI het gebruik van een computer kan simuleren door schermen te bekijken, knoppen te klikken en tekst in te voeren. Deze functie is nu in publieke beta beschikbaar voor ontwikkelaars.

Betere prestaties voor programmeren

Claude 3.5 Sonnet, dat vanaf vandaag beschikbaar is, heeft aanzienlijke vooruitgang geboekt in coderingstaken en het gebruik van tools, zoals blijkt uit benchmarks. Zo verbeterde het model zijn prestaties op de SWE-bench Verified (coderingstest) van 33,4% naar 49,0%, en overtrof daarmee concurrenten zoals OpenAI’s o1-preview.

Deze verbeteringen zijn beschikbaar tegen dezelfde kosten en snelheid als het vorige model, wat het aantrekkelijk maakt voor bedrijven zoals GitLab en Cognition, die positieve resultaten melden op het gebied van codering en probleemoplossing. Dat meldt Anthropic in een blogpost.

Claude 3.5 Haiku: snelheid en betaalbaarheid

Claude 3.5 Haiku, dat later deze maand wordt vrijgegeven, biedt een balans tussen snelheid en betaalbaarheid, terwijl het op verschillende benchmarks zelfs beter scoort dan de Claude 3 Opus.

Dit maakt het een geschikte keuze voor toepassingen zoals gepersonaliseerde ervaringen en dataverwerking. Met verbeterde instructievolging en nauwkeurigheid in het gebruik van tools, biedt dit model een scala aan mogelijkheden voor ontwikkelaars.

Innovatie in computernavigatie

Een van de meest baanbrekende functies die Anthropic vandaag heeft geïntroduceerd, is de mogelijkheid voor Claude 3.5 Sonnet om computers te gebruiken op een manier die vergelijkbaar is met mensen. Ontwikkelaars kunnen nu Claude instrueren om handelingen uit te voeren zoals het openen van programma’s, klikken op knoppen en invullen van formulieren.

Deze functie is nog in een experimenteel stadium en kent beperkingen, zoals fouten bij het scrollen of slepen. Toch biedt het veelbelovende mogelijkheden voor automatisering van repetitieve taken en complexe workflows.

Reeds enkele bedrijven zoals Replit en The Browser Company experimenteren met deze functie. Replit gebruikt het bijvoorbeeld om apps te evalueren tijdens de ontwikkelingsfase, wat mogelijk wordt gemaakt door Claude’s vermogen om meerdere stappen te zetten in complexe processen.

Veiligheid en toekomstige ontwikkelingen

Anthropic heeft benadrukt dat de computernavigatiefunctie nog in ontwikkeling is en mogelijk risico’s met zich meebrengt, zoals misbruik voor spam of fraude. Om dit te voorkomen, zijn er nieuwe beveiligingsmaatregelen ontwikkeld, waaronder classifiers die schadelijk gebruik kunnen detecteren. Verdere verbeteringen worden de komende maanden verwacht, waarbij ontwikkelaars worden aangemoedigd om de functie voorzichtig te gebruiken.

Met deze lanceringen zet Anthropic een belangrijke stap in de richting van geavanceerdere AI-toepassingen die niet alleen taken kunnen uitvoeren, maar ook zelfstandige beslissingen kunnen nemen in een digitale omgeving. Ontwikkelaars kunnen nu de beta-functies van Claude 3.5 Sonnet en de komende Claude 3.5 Haiku testen via platforms zoals Amazon Bedrock en Google Cloud’s Vertex AI.