Generatívny a procedurálny zvuk
Procedurálny zvuk v zásade predstavuje vzdialené synonymum na adaptívny zvuk, kde však treba rozlišovať medzi transformatívnym zvukom a generatívnymi algoritmami. Transformatívny zvuk v podstate pripomína adaptívnu hudbu v takej podobe, ako ju už mnoho rokov poznáme. Môže predstavovať napríklad viacero variácií na jednu hudobnú frázu, v ktorých sa však menia jednotlivé tóny alebo inštrumenty, či dlhšie časti hudby – tie menia svoje usporiadanie na základe parametrov ovplyvňovaných hráčom. Naopak, generatívne algoritmy vytvárajú jednotlivé menšie časti hudby či zvuku v reálnom čase, a teda sú mierne náročnejšie na výkon procesoru a na samotné kódovanie, pretože dáta musia prúdiť do takéhoto systému spätne zo samotnej hry. Definície týchto pojmov nie sú však doteraz veľmi presné a veľmi často záleží na tom, kto o nich píše a v rámci akého projektu sa využívali, prípadne či využívajú v reálnom čase nejaký typ digitálnej syntézy. Príklady trochu modernejšieho využitia generatívnej hudby predstavujú hry ako Creatures 3 (Creature Labs, 1999), v ktorej boli nahrávané jednotlivé hudobné časti vo veľmi krátkych formách (separátne tóny alebo akordy) a tie počas hrania spájal herný algoritmus na základe toho, s akou „príšerou“ bol hráč práve v interakcii. Podobne bol veľmi invenčným spôsobom vytvorený soundtrack na hru Spore (Maxis, 2008). Brian Eno a Cliff Martinez do nej skomponovali hudbu tak, že vytvorili veľké množstvo krátkych hudobných samplov, ktoré opäť v reálnom čase spájal dokopy herný algoritmus. Hudba bola vytvorená vo vizuálnom programovacom rozhraní Pure Data a obsahovala množstvo pravidiel, na základe ktorých bola zložená. Jednotlivé časti zvukov napríklad nemohli miešať viacero hudobných stupníc dokopy a tak ďalej. V rámci novších hier je generatívna adaptívna hudba využitá napríklad v Thief 4 (Eidos-Montréal, 2014) a množstvo zvukových elementov je napríklad generovaných v spomínanej vesmírnej No Man´s Sky, kde sa generuje nielen hudba (na základe toho, kde sa hráč nachádza, aký typ planéty navštívil atď.), ale zároveň aj zvuky a hlasy mimozemských zvierat. Hoci by sa mohlo zdať, že takýto spôsob vytvárania zvukov a hudby na digitálne hry predstavuje jej budúcnosť, nie je to vždy pravda.
Na jednej strane treba brať do úvahy, že len málo herných titulov naozaj potrebuje generovanú alebo adaptívnu hudbu. Ďalší nedoriešený problém spočíva v tom, že na rozdiel od MIDI sa s reálnym surovým zvukom (napríklad vo formáte wav) stále pracuje o trochu ťažšie a programovanie plynulého adaptívneho zvuku musí dodržiavať dôležité pravidlá – inak bude vývojár riskovať, že hráč namiesto imerzie bude vyrušovaný napríklad tým, že prechod do alternatívnej hudobnej slučky (variácie) nie je plynulý a podobne. Zvukoví dizajnéri ešte aj v súčasnosti musia využívať rôzne taktiky a triky, ako takéto prechody zakryť – jedným z nich sú už spomínané jednoduché „stingery“, teda kratšie zvuky či hudobné útvary, ktoré znejú presne vtedy, keď má začať iná variácia. Keď z pokojnej exploratívnej hudby prechádzame napríklad do bojovej, často je tento prechod sprevádzaný zvukovým efektom – úder činelov skombinovaný so zvukom vyťahovania meča, vokálny prvok otvárajúci bojovú verziu hudby a pod. Vďaka takému stingeru môže hudba prejsť na ďalšiu variáciu aj mimo rytmu/úderu/taktu a hráča to nebude rušiť. Pri generatívnej hudbe pozostávajúcej z veľkého množstva menších hudobných útvarov zase treba veľmi dobre zvážiť logiku, na základe ktorej bude takáto hudba vytváraná a k akým parametrom bude pridelená. Zároveň je potrebná znalosť hudobnej teórie (napr., ktoré tóny alebo škály spolu môžeme kombinovať a ktoré by zneli disharmonicky), nehovoriac o tom, že inak bude komplexnú generatívnu hudbu zvládať súčasná herná konzola či počítač a inak handheld s menším výkonom. Podobne treba uvažovať aj v kontexte žánra – je pravdepodobné, že epická fantasy adventúra bude skôr vyžadovať klasicky skomponovanú (a mierne lineárnejšiu) hudbu, naopak, akčná sci-fi strieľačka s abstraktnou a neustále sa pohybujúcou a meniacou sa grafikou oveľa lepšie využije generatívny elektronický soundtrack.
Jedným zo spôsobov, ako sa ku zvuku v digitálnych hrách pristupuje v posledných rokoch čoraz viac, je aj takzvaná granulárna syntéza. Vo všeobecnosti je tento typ syntézy založený na tom, že ako vstup môže byť využitý akýkoľvek zvuk. Ten je potom prehrávaný špecifickým spôsobom, pri ktorom engine (alebo plugin) prehráva malé zvukové vzorky (kúsočky/čiastočky) – tie môžu byť minimálne, trvajú iba zopár milisekúnd, ale aj oveľa dlhšie. Pointou je, že takéto vzorky/kúsky – nazývané granule (z angl. grains) – sa prehrávajú veľmi rýchlo za sebou. Pritom je možné nastaviť množstvo variantov parametrov, ktoré výsledný zvuk menia. Tieto parametre môžu predstavovať napríklad počet vzoriek (granúl) prehrávaných v reálnom čase, ich meniacu sa intenzitu, randomizáciu miesta/času zvuku, z ktorého sú prehrávané, prípadne ich ADSR (teda to, či jednotlivé kúsky začnú hrať ostro, alebo majú jemný nábeh (fade-in), resp., ako dlho doznievajú atď.). Výhodou je, že reprodukovaný zvuk nikdy nie je rovnaký. Takto je možné vytvoriť napríklad z jednej nahrávky vetra nekonečne dlhý zvuk, či z krátkej nahrávky rieky nekonečne dlhú rieku – samozrejme, pri správnom nastavení parametrov.
Modernou verziou takéhoto systému prehrávania a vytvárania zvuku je takzvaná data-driven granulárna syntéza, teda postup, v rámci ktorého sú jednotlivé dáta v reálnom čase extrahované a prerátavané priamo v engine hry. Napríklad pri vytváraní dažďa stačí krátka nahrávka (aj 10 sekúnd). Naprogramovaný skript či program dokáže analyzovať túto nahrávku a rozoznáva jednotlivé kvapky vody (resp. takzvané tranzienty), dopadajúce na zem. Z týchto kvapiek potom vytvára spomínané „zrná“ (grains) a pomocou randomizácie množstva prvkov dokáže z desaťsekundovej nahrávky vytvoriť nekonečný dážď. Značnou výhodou takéhoto spôsobu je to, že sa v reálnom čase môže meniť napríklad počet kvapiek dopadajúcich na zem (stovky na slabší dážď, tisícky na silný dážď). Z nahrávky sa zároveň extrahuje šum primiešavajúci sa do výsledného zvuku, čím sa vytvára veľmi realistický zvuk, prispôsobujúci sa stavu (situácii) v konkrétnej digitálnej hre. Pomocou takéhoto postupu je možné vytvárať napríklad zvuky tekutín (voda, láva) alebo randomizované zvuky – ruchy rôznych predmetov, pády, kolízie a i. Takýchto príkladov by sme našli viac.
Podobné metódy tvorby zvuku v digitálnych hrách sa začali vo väčšej miere využívať v rámci poslednej dekády a množstvo technológií je v tomto kontexte stále na začiatku. Naznačujeme tým, že vo zvukovom dizajne a v hudobnej zložke digitálnych hier zaznamenávame neustály pokrok. Čím ďalej, tým vyšší výkon herných konzol a počítačov umožňuje tvorbu čoraz komplexnejších systémov a realistických simulácií zvuku, nehovoriac o posunoch v ozvučovaní obsahu v spojitosti VR, AR (rozšírená realita), prichádzajúci nový špecifický virtuálny priestor (metaverse), ktorého zvuková identita sa stále iba formuje. V rámci tejto knihy nie je priestor na to, aby sme všetky podobné fenomény zachytili. V súčasnosti už prebieha životný cyklus deviatej generácie herných konzol (PlayStation 5, Xbox Series S/X), ponúkajúcich Dolby Atmos a výkon o triedu vyšší, ako mali ich predchodcovia. Priemerný súčasný počítač v našej domácnosti je schopný vytvoriť kompletnú hru s dokonalými textúrami a adaptívnym priestorovým audiom.
Zvukový dizajn ako taký prechádza neustálou transformáciou a prakticky neobmedzené technologické možnosti prinášajú prekvapivé výsledky. Mnohí herní vývojári napríklad radšej založia auditívnu stránku svojich titulov na emotívnom alebo psychologickom pôsobení a hyperrealistické stvárnenie odmietajú. Za všetky tituly spomeňme napríklad Limbo alebo Inside (Playdead, 2010/2016), Darkwood (Acid Wizard Studio, 2017), Amnesia: The Dark Descent (Frictional Games, 2010) či Perception (The Deep End Games, 2017).
Obr. 34: Hra Perception
Herné audio postupne „dobieha“ vizuálnu stránku, ktorá bola počas histórie uprednostňovaná. S príchodom konzol Nintendo Wii či PlayStation 4 sa napríklad začali malé reproduktory zabudovávať priamo do ovládačov – zvuk tak vykročil ešte bližšie k hráčovi, rozširujúc úroveň imerzie a možností funkcií zvuku. Mnohé hry zároveň začali využívať mikrofóny ako extenzie herného sveta. Tituly survival
hororu ako Alien: Isolation (Creative Assembly, 2014), Stifled (Gattai Games, 2018) alebo Escape the Ayuwoki (Deadlycrow Games, 2019) používajú mikrofónový vstup ako reálny zvukový zdroj, na ktorý reagujú herné monštrá. V hre Stifled sa dokonca mikrofón používa na takzvanú echolokáciu (podobne ako vo vyššie spomínanom Perception), ktorá pomocou zvukových vĺn vytvorených hráčovým hlasom zobrazuje kontúry priestoru, resp. level dizajnu. Dá sa teda povedať, že hráč sa stáva jednou zo súčastí zvukového dizajnu. Rovnako adaptívna hudba dorástla do svojej dospelej podoby a hry ako Portal 2 (Valve Corporation, 2011) alebo Auditorium (Cipher Prime, 2008) ju využívajú ako plnohodnotný herný prvok. Digitálne hry sa dokonca dostali do fázy, keď živý hudobný koncert môžeme zažiť priamo vo svete nejednej MMORPG.
Zvukový dizajn ako disciplína dávno prerástol svet digitálnych hier či filmov. V súčasnosti sa napríklad uvažuje o tom, že nastávajúce elektrické autá budú mať zabudovaný vlastný engine vytvárajúci dokonalú imitáciu motora, čo vodičom bude poskytovať zvukovú spätnú väzbu (rovnako ako by sme to očakávali v hre). Generatívna hudba nás už niekoľko rokov obklopuje na miestach, kde by sme to vôbec nečakali (obchodné centrá, letiská a podobne). Ako sa začali šíriť vizuálne „deepfakes“ ľudských tvári, tak sa v súčasnosti vyvíjajú algoritmy, ktoré dokážu dokonale imitovať konkrétny ľudský hlas (napr. celebrity alebo politika). Vývoj teda napreduje neustále ďalej a je veľmi pravdepodobné, že množstvo nových technológií, ktoré budú dokonale klamať naše uši a zrak, nás ešte len čaká.