Meta heeft een gigantische stap gezet in de wereld van kunstmatige intelligentie. Het bedrijf presenteerde het Omnilingual Automatic Speech Recognition-model (ASR): een revolutionair systeem dat gesproken taal kan herkennen en transcriberen in meer dan 1.600 talen. Volgens Meta is dit het meest meertalige spraakherkenningsmodel ooit ontwikkeld.
Het
vertalen van gesprekken en geschreven tekst is een van de taken waar je veel AI in terugziet.
Het project is
open-source en kan door iedereen gebruikt en verbeterd worden. De
GitHub vind je hier.
Meta wil alle talen ter wereld digitaal vastleggen
Tijdens de officiële presentatie legde Meta’s AI-team uit dat dit project een “wereldwijde inspanning” is om zowel veelgebruikte als bedreigde talen te digitaliseren. Het bedrijf werkte samen met moedertaalsprekers van meer dan 360 gemeenschappen om geluidsfragmenten te verzamelen en zo de dataset te verrijken.
Volgens Meta is het merendeel van deze talen “ondervertegenwoordigd” in bestaande AI-systemen. In veel gevallen levert het Omnilingual-model zelfs de eerste automatische spraakherkenning ooit voor deze talen.
“Ons doel is om elk mens een stem te geven, ongeacht de taal die ze spreken,” verklaarde een Meta-onderzoeker. “We willen voorkomen dat unieke talen verloren gaan.”
Doorbraak voor kleine en bedreigde talen
De technologie achter Omnilingual ASR lost een hardnekkig probleem op: het grote verschil in beschikbare data tussen dominante talen zoals Engels of Spaans, en minderheidstalen met weinig digitale bronnen. Meta ontwikkelde daarom nieuwe technieken om ongebalanceerde datasets te corrigeren, waardoor het model accuraat blijft, zelfs bij talen met minimale trainingsdata.
Bovendien beschikt het systeem over een zogenaamde “zero-shot”-mogelijkheid. Dat betekent dat het model ook talen kan herkennen en transcriberen die het nooit eerder heeft gehoord, enkel op basis van enkele voorbeeldzinnen.
Open source en gemeenschapsgedreven
Meta stelt het model open source beschikbaar, zodat onderzoekers, ontwikkelaars en lokale gemeenschappen het kunnen aanpassen aan hun eigen taal en context. Het bedrijf benadrukt dat samenwerking essentieel is om zijn ultieme doel te bereiken: “omnilingualiteit”, een wereld waarin elke taal digitaal ondersteund wordt, of er nu miljoenen of slechts één spreker zijn.
Impact op AI en taalbehoud
Het project kan grote gevolgen hebben voor zowel spraakassistenten als vertaaltechnologie, maar ook voor het behoud van cultureel erfgoed. Door bedreigde talen vast te leggen in digitale vorm, draagt Meta bij aan de bescherming van taalkundige diversiteit wereldwijd.
Hoewel critici zich afvragen hoe Meta de data gebruikt en beveiligt, is de lancering van Omnilingual ASR onmiskenbaar een mijlpaal. De inzet van AI voor taalbehoud zou wel eens een van de positiefste toepassingen van kunstmatige intelligentie tot nu toe kunnen zijn.