Veel mensen herinneren zich de film Her uit 2013, waarin een man verliefd wordt op de stem van zijn besturingssysteem. Hoewel moderne AI-stemmen zoals ChatGPT’s Advanced Voice Mode of Gemini Live al opmerkelijk menselijk klinken, blijft het vaak duidelijk dat je met een machine praat. Toch wordt die grens steeds vager.
In februari 2025 bracht het bedrijf Sesame een nieuwe AI op de markt die ontworpen is voor levensechte gesprekken: het Conversational Speech Model (CSM). Deze tool, getraind op meer dan een miljoen uur aan gespreksdata (gelijk aan 114 jaar praten), belooft een nieuwe standaard in menselijke interactie met machines. Dit artikel gaat in op hoe Sesame AI werkt, waarin het zich onderscheidt, en wat de voor- en nadelen zijn van deze technologie.
Sesame AI is een volledig geïntegreerd Conversational Speech Model (CSM) dat ontworpen is om gesprekken te voeren die emotioneel realistisch aanvoelen. Waar tools als GPT Voice Mode en Gemini Live modulair zijn — met losse onderdelen voor luisteren, interpreteren en spreken — werkt Sesame als een vloeiend geheel waarin alles tegelijk gebeurt.
Het doel: een gesprekservaring bieden die niet opgelezen klinkt, maar beleefd voelt.
Maya en Miles: je eerste gesprekspartners
Op de website van Sesame kunnen gebruikers een demo starten met Maya of Miles, de twee stemmen van het model. Zonder account kun je een gesprek voeren van vier minuten; met account loopt dit op tot dertig minuten.
Op dit moment spreken Maya en Miles alleen Engels, maar Sesame heeft aangekondigd het systeem binnenkort te trainen op meer dan twintig talen, mogelijk ook Nederlands.
Akoestiek + Semantiek = Realisme
Sesame AI dankt zijn overtuigingskracht aan de combinatie van akoestische en semantische verwerking.
- Akoestisch: Herkent intonatie, pauzes, emotionele lading, zuchten, twijfel, en ritme.
- Semantisch: Begrijpt de inhoud, context, implicaties en eerdere uitspraken binnen een gesprek.
De AI is getraind op de biologie van menselijke spraak: van stembandtrillingen tot stemkleur. De toonhoogte, het tempo en de ritmiek passen zich dynamisch aan het onderwerp aan. Daardoor voelt een gesprek natuurlijk en menselijk aan.
Belangrijk om te vermelden is dat Maya en Miles geen toegang hebben tot internet. Ze kunnen enkel praten over onderwerpen waarop ze getraind zijn, tot het moment van lancering. Je kunt dus geen actuele informatie of nieuws met ze bespreken.
Voor wie is deze AI bedoeld?
Sesame AI is niet ontworpen als een simpele voice assistant die taken uitvoert. Het doel is een gesprekspartner bieden — een digitale metgezel die kan luisteren, reageren en reflecteren op een manier die minder “vlak” en afstandelijk is dan traditionele AI-stemmen.
Volgens Sesame:
“A personal companion. An ever-present brilliant friend and conversationalist, keeping you informed and organized, helping you be a better version of yourself.”
Mogelijke toepassingen
Sesame AI kan op verschillende manieren worden ingezet:
- Persoonlijk gezelschap: Voor mensen in sociaal isolement of met een beperking in sociale interactie.
- Onderwijs: Als AI-assistent die zich aanpast aan de leerstijl van leerlingen.
- Training en coaching: Voor rollenspellen of als hulpmiddel bij therapie.
- Audioproductie: Als stemacteur in luisterboeken of media.
- Klantenservice en telemarketing: Een empathische en geduldige stem voor klantcontact.
- Misbruik: Bijvoorbeeld voor voice phishing, waarbij stemmen worden gebruikt om anderen te misleiden.
De technologie heeft dus maatschappelijk waardevolle toepassingen, maar ook potentiële risico’s.
Ethiek en menselijke vervanging
Sesame AI gaat verder dan alleen het uitvoeren van opdrachten. Omdat deze technologie emotioneel verbindt, ontstaan er ook nieuwe ethische vragen:
- Hoe waarborg je een gezonde balans tussen menselijk en machinaal contact?
- Kan AI vriendschap of nabijheid vervangen?
- Wanneer wordt een hulpmiddel een substituut voor menselijk contact?
Hoewel de tool fascineert door zijn menselijkheid, roept het ook vragen op over onze relatie met technologie — en hoe ver we daarin willen gaan.