Nvidia zet weer nieuwe stappen in de wereld van
kunstmatige intelligentie (AI). Zo is het met zijn geavanceerde
AI tool Fugatto mogelijk om unieke geluiden en muziek te creëren, zo liet het techbedrijf weten in
een officiële blog. Volgens Nvidia kan het systeem zelfs geluiden genereren die nog nooit eerder zijn gehoord, zoals een trompet die miauwt of een sax die blaft.
Met Fugatto kunnen gebruikers muziek en geluidseffecten creëeren op basis van eenvoudige tekstinstructies, vergelijkbaar met hoe tools zoals DALL-E en MidJourney werken voor beeldgeneratie. Een voorbeeld dat Nvidia in zijn blog deelde, was: "Creëer een sax die blaft en elektronische muziek combineert met honden die blaffen." Fugatto slaagde er vervolgens in om deze abstracte opdracht om te zetten in een geluidscompositie die zowaar aansloot bij de beschreven prompt.
Naast het creëren van geluiden, biedt Fugatto ook mogelijkheden om muziek en spraak te bewerken. Zo kan het stemtonen aanpassen, accenten veranderen en zang of instrumenten in een nummer isoleren. Daarnaast kan de tool melodieën wijzigen door bijvoorbeeld een piano te vervangen door een operazanger, of extra instrumenten toevoegen om een nummer verder te verrijken
Wat Fugatto daarnaast uniek maakt, is de manier waarop het volledig nieuwe geluiden kan ontwikkelen. Dit onderscheidt de tool van andere AI audioproducten, zoals die van OpenAI en Adobe, die vaak bestaande geluiden variëren. Nvidia's AI is getraind met miljoenen audiofragmenten, waaronder een bibliotheek van de BBC, en kan taken uitvoeren zonder aanvullende data.
Lancering?
Hoewel Fugatto grote beloftes doet, is er nog geen informatie over wanneer de tool beschikbaar wordt. Nvidia en andere bedrijven staan daarnaast onder druk vanwege zorgen over copyright, zoals het gebruik van ondertitels van YouTube video's voor trainingsdoeleinden. Daarnaast worden sommige AI muziektools al geconfronteerd met rechtszaken van grote platenlabels, wat ervoor kan zorgen dat de lancering van Fugatto langer op zich laat wachten.