Chipgigant
Nvidia gaat samenwerken met de Britse startup Ineffable Intelligence om een nieuwe generatie AI-systemen te ontwikkelen die zelfstandig leren door ervaring. Dat maakten beide bedrijven woensdag bekend. Volgens
CNBC richt de startup zich niet op traditionele taalmodellen, maar op reinforcement learning, een AI-methode waarbij systemen leren via trial-and-error in plaats van menselijke data te kopiëren.
De startup werd eind 2025 opgericht door AI-onderzoeker David Silver, voormalig leider van het reinforcement learning-team van
Google DeepMind en mede-architect achter AlphaGo en AlphaZero. Silver haalde in april al een opvallende seedfinanciering van 1,1 miljard dollar op tegen een waardering van 5,1 miljard dollar. Onder de investeerders bevinden zich Sequoia Capital, Lightspeed, Nvidia, Google en DST Global.
Nvidia ziet reinforcement learning als volgende AI-fase
Volgens Nvidia-CEO Jensen Huang ligt de volgende grote doorbraak in AI bij systemen die continu leren van nieuwe ervaringen. Hij noemt deze systemen “superlearners”.
“The next frontier of AI is superlearners — systems that learn continuously from experience,” zei Huang in een verklaring van Nvidia.
De samenwerking draait om het bouwen van infrastructuur voor grootschalige reinforcement learning. Daarbij gaan engineers van beide bedrijven gezamenlijk werken aan trainingssystemen die AI-agenten zelfstandig nieuwe kennis laten ontwikkelen. De infrastructuur draait op Nvidia’s Grace Blackwell-chips en het nieuwe Vera Rubin-platform.
Dat is strategisch belangrijk voor Nvidia. Het bedrijf probeert zijn dominante positie in AI-hardware verder uit te bouwen nu AI-labs steeds grotere hoeveelheden rekenkracht nodig hebben voor experimenten richting kunstmatige algemene intelligentie, ook wel AGI genoemd.
Wat maakt reinforcement learning anders?
Reinforcement learning verschilt fundamenteel van de aanpak achter huidige grote taalmodellen zoals ChatGPT of Gemini. Waar taalmodellen vooral worden getraind op enorme hoeveelheden menselijke tekst, leren reinforcement learning-systemen via interactie en feedback uit hun omgeving.
David Silver stelt dat de huidige generatie AI grotendeels afhankelijk blijft van menselijke kennis. Volgens hem moet de volgende stap bestaan uit systemen die zelf nieuwe kennis ontdekken.
“Researchers have largely solved the easier problem of AI: how to build systems that know all the things humans already know,” zei Silver. “But now we need to solve the harder problem of AI: how to build systems that discover new knowledge for themselves.”
Silver geldt als een van de belangrijkste onderzoekers binnen reinforcement learning. Hij speelde een centrale rol bij AlphaGo, het AI-systeem dat in 2016 wereldkampioen Go Lee Sedol versloeg. Dat moment wordt nog steeds gezien als een van de grootste doorbraken in moderne AI.
Nieuwe golf van miljardendeals rond ex-DeepMind-onderzoekers
Ineffable Intelligence is onderdeel van een bredere trend waarbij topwetenschappers van grote AI-labs vertrekken om eigen startups op te richten. Investeerders pompen momenteel miljarden dollars in deze nieuwe generatie AI-labs.
Volgens de Financial Times en Bloomberg behoren deze zogenaamde “neolabs” inmiddels tot de meest kapitaalintensieve startups ter wereld.
Ook andere voormalige onderzoekers van OpenAI, Anthropic, Meta en xAI haalden recent honderden miljoenen op voor nieuwe AI-projecten. De markt verwacht dat juist kleine, gespecialiseerde onderzoeksteams sneller radicale AI-doorbraken kunnen realiseren dan grote Big Tech-organisaties.
Opvallend is dat veel van deze startups zich steeds minder richten op standaard large language models en juist zoeken naar alternatieve AI-architecturen. Reinforcement learning, simulatieomgevingen en autonome AI-agenten krijgen daardoor opnieuw veel aandacht binnen de sector.
Waarom dit belangrijk is
De samenwerking tussen Nvidia en Ineffable Intelligence laat zien dat de AI-industrie mogelijk een nieuwe technologische fase ingaat. Grote taalmodellen domineren momenteel de markt, maar steeds meer onderzoekers twijfelen of die aanpak voldoende is om echt autonome AI-systemen te bouwen.
Mocht reinforcement learning opnieuw centraal komen te staan, dan kan dat grote gevolgen hebben voor de infrastructuurmarkt, chipontwikkeling en toekomstige AI-modellen. Vooral Nvidia profiteert daarvan, omdat dergelijke systemen extreem veel gespecialiseerde hardware vereisen.
Daarnaast vergroot de deal de positie van Londen als internationaal centrum voor geavanceerd AI-onderzoek. Veel voormalige DeepMind-onderzoekers blijven namelijk actief in het Britse AI-ecosysteem, ondanks de toenemende concurrentie vanuit Silicon Valley.