O počítačové generování zvuků, tónů a hlasu se zajímám poměrně intenzivně už dlouhá léta, ale na existenci Udia mne pořádně upozornilo až jedno video na YouTube. Šlo o písničku Love Is Made Of Roses, od známé zpěvačky Sandry, jen jsem ji doposud neznal. Nezpívala ji totiž Sandra Ann Lauer, známá hudební ikona 80. let, a vlastně ani nikdo jiný. Tedy, hlas a výslovnost by Sandře odpovídaly, ale ten zvláštní doprovod, někde na pomezí Enyi, Visage a Desireless, mi tam úplně neseděl. Struktura songu také nedržela úplně pohromadě, ale osmdesátky to rozhodně byly a poslouchatelné to bylo vlastně také. A tak mne to začalo zajímat.
Zmíněný song má na svědomí program. Přesněji jeho frontend na webovém portálu Udio, což je Audio bez A, zato s AI. Stránky udio.com, kde si může generování písničky na základě textového popisu zkusit doslova každý a zdarma, ožily teprve 10. dubna. Jde o betaverzi generativního AI modelu hlasu a doprovodu, pocházejícího od tvůrců googlího DeepMind v čele s Davidem Dingem, ale už v této podobě umožnuje produkt například právě generování deep fake videí s hlasy známých interpretů a další zajímavosti.
Zkuste si to sami
Textový prompt sice obsahuje stále se zpřísňující copyrightové filtry, které přímé reference se jmény interpretů rovnou blokují, a generování samotné v uplynulých hodinách nahradila nově přidaná otravná captcha, ale stránky stále fungují. Pomocí funkce remix tak lze stále vytvářet další písničkový materiál na základě již hotových pokusů a toto omezení tak obcházet.
Tak jsem si s Udiem začal hrát také. Jeden z prvních pokusů, po zhruba dvaceti iteracích, protože dobrých padesát procent nabízených variant zavrhnete rovnou, dopadl takto. Líbil se mi ten syntetický, novovlnně šlapající spodek, ženský silně chordifikovaný vokál, houkající synthlead v refrénu a trošku mi to celé připomnělo známý virál Synthpop’s Alive od Maisona Vague. Úryvek jsem si dal na VFacebook s krátkým textem a zakrátko už se u mne v komentářích začala obejvovat další díla, kde si autoři s pokusy a omyly v sestavování písničky dali daleko více práce, jako třeba Honza Machálek.
A tak jsem zkusil rovnou něco ostřejšího, nějaký symfonický metal. Místo textu vložil jednoduchou politickou básničku, co mne zrovna v dané chvíli napadla, a v podstatě z ní na první dobrou získal použitelný úsek pro další úpravy. Kdyby měl tenhle nástroj přímý přístup ke generujícím direktivám, pracovalo by se s ním daleko lépe, ale asi chápu důvody, proč tomu tak není.
Vubec se mi to nelíbí…. ten hlas je děsnej…..