Hobbyist ontdekt het toevoegen van aangepaste lettertypes in AI gegenereerde beelden

woensdag, 28 augustus 2024 om 12:00

In de wereld van kunstmatige intelligentie (AI) beeldgeneratie is recent een opmerkelijke doorbraak gerealiseerd, door niemand minder dan een hobbyist, bekend onder de naam Vadim Fedenko. Hij ontdekte dat het nieuwe Flux AI model in staat is om nauwkeurig aangepaste lettertypen weer te geven binnen gegenereerde beelden. Dit is een opmerkelijke prestatie, aangezien eerdere AI modellen zoals Stable Diffusion alleen al moeite hebben om tekst correct weer te geven.

Fedenko maakte zijn ontdekking mogelijk door het gebruik van LoRA (Low-Rank Adaptation), een techniek die in 2021 werd geïntroduceerd. LoRA stelt gebruikers in staat om AI modellen te verrijken met nieuwe concepten en stijlen door deze te trainen met specifieke voorbeelddata. Waar LoRA eerder vooral werd toegepast voor het toevoegen van unieke kunststijlen en personages aan AI beelden, wordt de technologie nu ook succesvol ingezet om aangepaste lettertypen te integreren.

Wat is Flux?

Het Flux model is anders dan andere beeldgeneratie modellen. Het onderscheidt zich door zijn open-source karakter en de mogelijkheid om lokaal te draaien, mits je een krachtige grafische kaart hebt. Het maakt het echter toegankelijk voor hobbyisten en ontwikkelaars die willen experimenteren met het Flux model, zoals het toevoegen van aangepaste lettertypes aan hun AI creaties, in het geval van Fedenko. Hoewel Flux nog niet perfect is en soms fouten maakt bij het weergeven van tekst, is het op dit moment het meest geavanceerde model op dit gebied.

Google lanceert nieuw beeldgeneratie model

De concurrentie onder de beeldgeneratie modellen is enorm. Veel bedrijven, waaronder Google, proberen het beste model te realiseren. Het technologiebedrijf introduceerde onlangs zijn nieuwste model op dit gebied, Imagen 3, dat is gebaseerd op geavanceerde "latent diffusion" technologie. Imagen 3 is ontwikkeld met een sterke focus op veiligheid en ethische overwegingen. Het model bevat ingebouwde maatregelen om het genereren van schadelijke of controversiële inhoud te beperken.