Apple werkt al jaren stilletjes aan kunstmatige intelligentie, maar af en toe komt er een onderzoek voorbij dat laat zien hoe groot de ambities werkelijk zijn. Dit keer draait het niet om een nieuwe
iPhone-functie of een flashy demo, maar om iets anders. Een
AI-model dat meerdere taken tegelijk aankan en daarmee laat zien hoe
Apple de toekomst van beeld-AI voor zich ziet. Wat dat precies betekent, wordt pas duidelijk als je iets dieper kijkt.
Wat maakt Apple’s UniGen-1.5 anders
De kern van het verhaal zit in UniGen-1.5, een
nieuw AI-model van Apple dat beelden kan begrijpen, genereren en bewerken binnen één enkel systeem. Waar veel andere AI-oplossingen nog werken met losse modellen voor analyse, beeldcreatie en bewerking, kiest Apple bewust voor één geïntegreerd geheel. Dat model bouwt voort op UniGen, dat in 2025 werd gepresenteerd als een gecombineerd beeld- en taalmodel.
De grootste vernieuwing zit in beeldbewerking. UniGen-1.5 is getraind om veel beter om te gaan met bewerking instructies, vooral wanneer die complex of subtiel zijn. Denk aan kleine veranderingen in sfeer, stijl of details, zonder dat het hele beeld op de schop gaat. Om dat voor elkaar te krijgen introduceert Apple een extra training stap met de naam Edit Instruction Alignment. Daarbij leert de AI eerst in woorden te beschrijven hoe het eindresultaat eruit moet zien, voordat het beeld daadwerkelijk wordt aangepast. Die tussenstap zorgt ervoor dat het model beter begrijpt wat de bedoeling is.
Daarna volgt reinforcement learning, waarbij UniGen-1.5 wordt bijgestuurd met een gedeeld beloningssysteem. Opvallend, want beeldgeneratie en beeldbewerking verschillen vaak sterk van elkaar. Toch kiest Apple ervoor om beide taken met dezelfde “beloningen” te trainen, wat volgens de onderzoekers zorgt voor consistentere resultaten.
Apple’s UniGen model geeft sterke resultaten
In tests presteert UniGen-1.5 minstens zo goed als, en soms beter dan, meerdere open en commerciële AI-modellen. Het scoort hoog op benchmarks voor beeldkwaliteit, instructie-opvolging en multimodale prestaties. Vooral bij tekst-naar-beeld en beeldbewerking laat het model sterke resultaten zien.
Toch is Apple ook eerlijk over de beperkingen. Het correct weergeven van tekst in afbeeldingen blijft lastig en tijdens bewerkingen kan de identiteit van objecten of dieren soms veranderen. Volgens Apple is dat geen eindpunt, maar juist een signaal waar verdere verbeteringen nodig zijn. UniGen-1.5 laat vooral zien waar Apple naartoe wil: minder losse AI-tools en meer slimme, alles-in-één systemen.