Microsoft heeft zijn eerste volledig eigen AI modellen
gelanceerd. Het gaat om MAI-Voice-1 en MAI-1-preview, die vooral bedoeld zijn om consumenten nieuwe manieren van interactie met
Copilot te bieden, het grootste AI model van Microsoft dat boven op de modellen van OpenAI werkt. Daarmee geeft de techgigant een duidelijk signaal dat het niet alleen afhankelijk wil blijven van
OpenAI, maar zelf ook stevig inzet op AI innovatie.
Microsofts razendsnelle stem generator
Het meest opvallende model is MAI-Voice-1. Dit systeem kan in minder dan een seconde een volledige minuut aan audio produceren, en dat op slechts een enkele GPU. Dat klinkt technisch, maar het komt er simpelweg op neer dat je in no-time een natuurlijke stem kunt laten genereren met relatief weinig rekenkracht.
Microsoft gebruikt dit model al in hun AI tool genaamd Copilot Daily, waar een AI stem het nieuws van de dag kan voorlezen. Daarnaast kan de stem ook ingezet worden om podcast achtige gesprekken te creëren die ingewikkelde onderwerpen op een begrijpelijke manier uitleggen. Handig dus voor gebruikers die snel complexe informatie tot zich willen nemen.
Tekstmodel van Microsoft nog in testfase
Naast MAI-Voice-1 presenteerde Microsoft dus ook het MAI-1-preview model. Dit model is getraind op ongeveer 15.000 Nvidia H100 GPU’s en richt zich vooral op tekst- en instructie gebaseerde antwoorden, vergelijkbaar met het bekende ChatGPT.
Volgens Mustafa Suleyman, het hoofd van Microsoft AI, is de focus duidelijk gericht op consumenten. “Wij bouwen deze modellen om dagelijkse gebruikerservaringen te verbeteren, niet om bedrijven te bedienen,” legt hij uit. De bedoeling is dat MAI-1-preview straks een aanvulling wordt op Copilot.
Microsoft ziet de toekomst duidelijk in een mix van verschillende, gespecialiseerde AI modellen die samen uiteenlopende taken en gebruikersbehoeften ondersteunen in plaats van een model die de hele markt domineert. Met de introductie van MAI-Voice-1 en MAI-1-preview lijkt die visie alvast een stuk dichterbij gekomen.