Het Canadese techbedrijf
Cohere heeft een nieuwe familie meertalige kunstmatige-intelligentiemodellen gepresenteerd onder de naam Tiny Aya. Deze modellen zijn open-weight, wat betekent dat de onderliggende code vrij beschikbaar is voor ontwikkelaars om te gebruiken en aan te passen. Ze kunnen op gewone hardware draaien zonder constante internetverbinding.
Lees daarover meer via TechCrunch.
Wat de Tiny Aya-modellen zijn
De Tiny Aya-familie bestaat uit meerdere varianten van kunstmatige-intelligentiemodellen die samen meer dan zeventig talen ondersteunen. Het basis-model heeft ongeveer 3,35 miljard parameters, een maat voor de complexiteit van een AI-model. Cohere heeft verschillende regionale versies ontwikkeld die zijn toegespitst op taalgebieden zoals Afrika, Zuid-Azië en Europa en Azië-Pacific.
Deze taalondersteuning omvat belangrijke Zuid-Aziatische talen zoals Bengaals, Hindi, Punjabi, Urdu, Gujarati, Tamil, Telugu en Marathi, maar ook honderden andere talen wereldwijd. Door deze brede taalbasis zijn de modellen bedoeld om AI-toepassingen toegankelijker te maken voor gemeenschappen die vaak ondervertegenwoordigd zijn in digitale technologieën.
Offline gebruik en toegankelijkheid
Een belangrijk kenmerk van Tiny Aya-modellen is dat ze geschikt zijn voor lokaal gebruik op devices zoals laptops en andere gewone computers. Dit betekent dat ontwikkelaars en onderzoekers toepassingen kunnen bouwen die werken zonder permanente internetverbinding. Deze offline-vriendelijke aanpak is vooral relevant in gebieden waar internettoegang onbetrouwbaar of duur kan zijn.
Het feit dat de modellen open-weight zijn en vrij te downloaden op platformen zoals HuggingFace, Kaggle en Ollama maakt ze aantrekkelijk voor een breed publiek. Dit geeft ontwikkelaars de vrijheid om de modellen te gebruiken in eigen toepassingen en eventueel verder te verfijnen.
Doelgroepen en toepassingen
De nieuwe Tiny Aya-modellen zijn ontworpen met het oog op ontwikkelaars die AI-toepassingen maken voor diverse taalgemeenschappen. Dit kan variëren van vertaalhulpmiddelen tot educatieve apps en andere toepassingen die taalbegrip en taalproductie vereisen. Omdat de modellen ook op apparaten offline kunnen werken, zijn ze geschikt voor toepassingen in het onderwijs, lokale zakelijke tools en in gebieden met beperkte toegang tot snelle netwerken.
Door de open-source aard van de modellen kunnen universiteiten, startups en onafhankelijke onderzoekers experimenteren met de technologie zonder de hoge kosten die vaak gepaard gaan met commerciële AI-modellen. Dit kan innovaties stimuleren in regio’s en sectoren die traditioneel minder toegang hebben tot geavanceerde AI-technologie.
Context binnen de AI-wereld
De introductie van Tiny Aya past in een bredere trend binnen de AI-sector waarin bedrijven en onderzoeksorganisaties proberen taaldiversiteit en toegankelijkheid te verbeteren. Veel bestaande grote taalmodellen richten zich vooral op Engels of andere dominante talen, waardoor spraakgebruikers van andere talen achterblijven. Open-source initiatieven zoals deze Tiny Aya-modellen proberen die kloof te verkleinen door brede taalondersteuning mogelijk te maken met relatief lichte computermiddelen.
Vooral in landen met een grote taalkundige diversiteit zoals India en andere delen van Azië en Afrika kan het beschikbaar hebben van AI-technologie in de eigen taal de adoptie van nieuwe digitale middelen versnellen. Het gebruik van open modellen kan ook de afhankelijkheid van commerciële cloud-gebaseerde AI-diensten verminderen, wat zowel kosten als technische barrières verlaagt.
Beschikbaarheid en verdere stappen
De Tiny Aya-modellen zijn nu beschikbaar voor ontwikkelaars via diverse platforms waar AI-modellen gedeeld worden. Cohere heeft aangekondigd dat het ook datasets en technische documentatie zal vrijgeven om anderen te helpen de modellen te gebruiken en te evalueren.