Audiovizuálne aspekty digitálnych hier

Tomáš Farkaš - Michal Kabát

Predhovor

V rukách držíte učebnicu, ktorej ambíciou je vytvoriť základy na uchopenie audiovizuálnych aspektov digitálnych hier. Kniha spája primárne dve línie – jedna sa zaoberá vizuálnou stránkou a tá druhá zvukovými aspektmi hier. Text je koncipovaný tak, aby odrážal chronologický vývoj jednotlivých technológií prítomných pri rôznych kľúčových momentoch v dejinách digitálnych hier. Hoci táto éra nie je dlhšia ako niekoľko dekád, predpoklady na jej vznik hľadajú obe obsahové línie (aj auditívna, aj vizuálna) oveľa skôr. Vytvárajú tým prehľadný text, v ktorom čitateľ môže postupne sledovať evolúciu jedného z fenoménov dnešnej doby.

Časť textu, venujúca sa auditívnym prvkom, sleduje predpoklady na vznik technológií vedúcich k súčasnému stavu, pri ktorom digitálne hry dosiahli realistickú súhru obrazu a zvuku. Exkurzia sa začína obdobím pred takzvanou érou nemých hier, v rámci ktorého autor skúma rôzne mechanické automaty a ich auditívne prvky, pokračuje obdobím, v ktorom sa herné konzoly a počítače dostali takmer do každej
domácnosti, a siaha až do dneška, keď je adaptívny či priestorový zvuk štandardom presahujúcim zvukový dizajn digitálnych hier. Text sa nevenuje len hardvérovým prvkom dôležitým pri vývoji audia (zvukové čipy, programovateľné zvukové generátory, zvukové karty či syntetizátory), ale aj rôznym míľnikom v oblasti softvéru a iných digitálnych technológií (MIDI, rôzne typy syntéz alebo enginov).

Podobne aj línia zaoberajúca sa vizuálnymi aspektmi digitálnych hier hľadá súvislosti s ich vývojom ešte skôr. Poskytuje náhľad do rôznych technológií a herných prístrojov bez displejov či obrazoviek a neskôr prechádza k prvým elektrickým zariadeniam využívajúcim primitívne svetelné signály. Rovnako rozoberá mnohé prvky vedúce až k súčasnému stavu – rozličné typy obrazoviek a spôsoby vykresľovania, rôzne typy animácií, 2D a 3D grafiky, ale aj elementy dôležité pri pochopení procesov prebiehajúcich pri renderovaní pomocou grafických kariet. 

V tejto knihe, pochopiteľne, nie sú spomenuté úplne všetky audiovizuálne technológie či prvky, ktoré sú dôležité pri vývoji digitálnych hier. Zvuková časť detailne mapuje vývoj približne po takzvanú šiestu generáciu herných konzol a začiatky 21. storočia, keď sa herné audio presunulo do digitálnych strižní či do midlvéru v počítačoch. Avšak nevenuje sa takmer vôbec napríklad prenosným zariadeniam (tzv. handheld konzolám).Rovnako v línii textu, zaoberajúcej sa vizuálnymi aspektmi, je selekcia tém prispôsobená dôležitosti v rámci hernej histórie a nesústredí sa na zachytenie úplne všetkých existujúcich technológií.

Je potrebné dodať, že množstvo procesov a technológií z minulosti vedúcich k súčasnému stavu, vznikalo paralelne a na rôznych miestach. Aj kvôli tomu sa nie vždy dá jednoznačne ísť po časovej osi bez toho, aby sme sa nemuseli vracať kúsok späť. Napriek tomu sa štruktúra textu snaží byť chronologická a množstvom obsiahnutých informácií tak vytvoriť predpoklad na to, aby podnietila v čitateľovi potrebu vyhľadávať ďalšie informácie. Tých je nepochybne obrovské množstvo, pretože tvorba digitálnych hier sa počas úvodných dekád rozbehla takmer geometrickým tempom. Knihu teda treba brať hlavne ako vstupnú bránu do tejto problematiky.

Mechanické a elektronické hry

Hry boli z veľkej časti postavené na audiovizuálnom zážitku oveľa skôr, než prišli slúchadlá a obrazovky. Napriek tomu, že táto učebnica je zameraná na digitálne hry, úvod do vizuálnej časti sa nezaobíde bez opisu herných elementov, ktorých podobu neurčoval zdroj videosignálu, aký poznáme dnes. 

Predtým, než existovali akékoľvek obrazovky, ľudia pri výrobe herných zariadení využívali fyzické objekty, ktoré boli manipulované vnútorným mechanizmom tak, aby reagovali na aktivitu hráča. Tieto princípy nadväzujú na svet mechanických hier a hračiek, ktorých história siaha stáročia do minulosti. Sústredíme sa preto až na tie, ktorých fungovanie je určované prostredníctvom audio/video signálu, ktorý definuje pojem videohry, zaužívaný v literatúre na pomenovanie hier a herných zariadení fungujúcich na digitálnom princípe jednotiek a núl, resp. zapnutia a vypnutia obvodu. Nevyhneme sa však celkom histórii predchádzajúcej vynálezu a vývoju televíznej obrazovky, ktorá sa na desaťročia stala štandardom vizuálnej prezentácie herných prostredí. Pred jej príchodom sa ľudia pokúšali vytvárať zariadenia, ktorých primárnym účelom bola zábava. Nie všetky je možné definovať ako hry, ale svoje miesto v postupnom zdokonaľovaní herných systémov si určite zaslúžia.

Ukážkovým príkladom prepojenia objektov a prístroja, ktorý ovláda ich pohyb, by mohol byť legendárny Mechanický Turek, zostrojený v 18. storočí bratislavským vynálezcom J. W. Kempelenom. Dochované záznamy hovoria o tom, že medzi rokmi 1770 a 1854 (kým nezhorel pri požiari) precestoval svet a predviedol svoje schopnosti napríklad proti Napoleonovi alebo Benjaminovi Franklinovi (obaja prehrali). Ťažko však hovoriť o schopnostiach, keďže Mechanický Turek nebol skutočný šachový automat schopný hrať proti človeku, ale obyčajný podfuk (pardon – ilúzia), pri ktorom ťahy Turka určoval človek ukrytý v zariadení. Mieru imerzie, potenciál na produkciu zábavy a podiel na popularizácii herných zariadení mu však  nemožno uprieť.

image.png

Obr. 1: Mechanický Turek

Ak chceme rozprávať o zvuku v digitálnych hrách, je potrebné vnímať, akým spôsobom auditívne elementy na ľudí pôsobili ešte predtým, než vznikali prvé takéto hry. Mnohé z konceptov, neskôr sa objavujúcich v prvých digitálnych hrách, majú svoje korene v mechanických hrách z 19. storočia. Jednou z nich bola Bagatelle, drevená stolová hra, po ktorej sa pohybovala drevená guľôčka. Úlohou bolo dostať ju do malých jamiek na konci stola, chránených drevenými kolíkmi – vzdialene pripomínala biliard. Jej ďalší vývoj bol špecifický kovovými prvkami a zmenou mechaniky vystreľovania guľky. Hra napokon zmutovala do podoby, ktorú dnes poznáme ako Pinball. Spoločnosť Ballyhoo ju prezentovala prvýkrát v roku 1931 a po niekoľkých rokoch v nej začali pribúdať rôzne zvončeky a bzučiaky. Jednoduché zazvonenia či cinknutia jednak vytvárali hlasitú a uspokojivú odozvu a jednak lákali okolitých ľudí. V ďalších rokoch vývoja to boli práve rôzne variácie elektrických zvončekov a iných zvukov, vytvárajúce špecifickú atmosféru arkádových herní.

Zvuk bol ešte dôležitejší v jednom z prvých herných automatov na mince Mills Liberty Bell z roku 1907 – bol vylepšenou verziou pôvodného stroja z roku 1895, zostaveného Charlesom Feyom. Takýmto strojom sa zvyklo hovoriť aj „jednoruký bandita“ pravdepodobne kvôli veľkej železnej páke na bočnej strane zariadenia. Po vhodení mince sa roztočili valce a ak sa zastavili na troch rovnakých symboloch, hráč vyhral príslušný počet centov späť. Výhra bola sprevádzaná špecifickým zvonením, ktoré umocňovalo dobrý pocit z úspechu, a v kombinácii so zvukom padajúcich mincí to bolo lákadlo pre ľudí naokolo. Niektoré zdroje uvádzajú, že toto zvonenie možno považovať za skutočne prvý herný zvuk. Neskôr boli do automatov implementované aj zvuky „takmer úspechu“, čo v hráčoch vyvolávalo potrebu hrať ďalej. Neskorší vývoj herných automatov sa zameral na takéto zvuky ako na dôležitú zložku, ktorá bola aktívna aj vtedy, keď sa práve nikto nehral. Funkcia zvukov bola jasná – doslovné vábenie a priťahovanie ľudí. S tým súvisí aj hlasitosť a nápaditosť zvukov. Keď neskôr vznikali prvé herne s radmi automatov vedľa seba, bol väčší predpoklad, že človek hodí mincu do takého, ktorý ho priláka hlasitejším vábením.

V období na prelome 19. a 20. storočia sa objavili prvé filmy. Nie náhodou sa digitálne hry často z rôznych perspektív porovnávajú práve s týmto médiom. Existuje mnoho paralel vo vývoji týchto odvetví: obe si prešli svojím nemým obdobím, obe sú spojením obrazu, pohybu a zvuku. Hoci na prvý pohľad vidíme mnoho podobností, je to práve len ten „prvý pohľad“, čo má potenciál vytvoriť medzi filmom a hrami prepojenia.

Auditívna stránka kinematografie spočiatku neexistovala – vo filmoch nebolo počuť v dôsledku obmedzených technologických možností žiadne zo zvukov, na ktoré sme zvyknutí teraz, z čoho aj vychádza zaužívaný termín nemý film. Niektorí teoretici považujú za prvý zvuk kinematografie zvuk premietačky a štandardné ponímanie nemého filmu svojím spôsobom odmietajú. Pri prvých premietaniach filmov okrem mechanického zvuku bolo počuť viacero ďalších zvukov: komentátori ešte pred prvým využitím medzititulkov často nahrádzali „hluché“ dialógy a vysvetľovali dej. Zároveň už v počiatkoch boli filmy sprevádzané hudbou (živou alebo reprodukovanou). V neposlednom rade bol dôležitý zvuk samotného publika – ovácie, komentáre, ale aj obyčajný šuchot vydávaný pri sedení či státí.  O takzvanej nemej ére možno hovoriť aj pri digitálnych hrách. Zvykne sa uvádzať od roku 1940 až po 1970. Je pravda, že prvé pokusy na poli digitálnych hier existovali iba vo vizuálnej podobe. Namiesto režisérov a kameramanov môžeme hovoriť zväčša o programátoroch. Tí mali možnosť využívať obrovské počítače na univerzitách, čo je vlastne jeden z dôvodov, pre ktorý pravdepodobne nikdy nebudeme vedieť o veľkom množstve hier naprogramovaných v tomto období. Študenti ich nerobili na komerčnej báze a svoje výtvory nechceli verejne prezentovať, keďže ich často vytvárali v podstate nelegálne bez vedomia univerzity. Môžeme si však predstaviť, aké reakcie vyvolávali. Presne ako pri filme – prvým zvukom digitálnych hier boli reakcie a pohyby samotných hráčov.

V tomto bode sú paralely medzi filmom a hrami zrejmé – divák, resp. hráč sú v kontexte zvuku veľmi podstatným faktorom. Je však dôležité podotknúť, že ak túto myšlienku konfrontujeme s pojmom interaktivity (teda s jedným z najdôležitejších prvkov, ktoré odlišujú hry od ostatných médií), paralely sa končia. Hráč je súčasťou rovnako diegetickej, ako aj extradiegetickej aktivity. Má vedomú interakciu s rozhraním hry (diegetická aktivita), ale zároveň fyzickú odozvu v prostredí, kde sa práve hrá (extradiegetická aktivita). Napriek tomu, že častým cieľom herných vývojárov je vytvoriť dokonale imerzný zážitok, telo hráča od tohto procesu nemôžeme oddeliť – hráč je totiž primárnym „spúšťačom“ zvukových efektov prostredníctvom ovládača. V tejto súvislosti treba spomenúť azda najväčší rozdiel medzi filmovým a herným zvukom: audio v digitálnych hrách je totiž nelineárne. Na rozdiel od filmu bol prvým auditívnym elementom digitálnych hier krátky zvuk, nie hudba. To bolo dané technologickými, resp. hardvérovými obmedzeniami. O hudbe sa aj po skončení nemej éry digitálnych hier nedalo nejaký čas rozprávať, keďže zvuky museli vytvárať samotní programátori. V čase vzniku hry Spacewar! (1962) mal počítač iba taký výkon, že síce mohol vytvoriť niekoľko jednoduchých pípnutí a tónov, ale nebol schopný ich produkovať spolu s obrazom. Prvá oficiálna herná konzola (Magnavox Odyssey z roku 1972) bola rovnako nemá. Neexistovali ešte dedikované zvukové čipy a zvuky sa mohli vytvárať iba pomocou elektrických obvodov či vpisovaním priamo do kódu, pričom jednotlivé znaky predstavovali konkrétne tóny. Zaujímavá je aj rýchlosť vývoja filmu a hier do podoby, keď boli schopné plnohodnotne prezentovať synchronizovaný obraz a zvuk. 

Ak berieme do úvahy, že prvé filmové pokusy vznikali koncom 19. storočia a za prvý zvukový film sa považuje Jazz Singer (1927), filmu to trvalo okolo 40 rokov. Na príchod prvých hier so zvukovými efektmi však hráči až tak dlho čakať nemuseli.

 

image.png

Obr. 2: Nimatron (vľavo), Nimrod (hore), Bertie the Brain (dole)

Z hľadiska historického vývoja hernej grafiky je podstatnejšie obdobie, keď už ľudia bežne používali elektrické zariadenia najčastejšie v podobe svetelných prvkov. Pekným príkladom je atrakcia Bertie Brain, ktorá umožňovala hrať piškvorky (po anglicky tic-tac-toe) prostredníctvom automatu, ktorý na základe vstupov hráča a počítača podsvietil špecifické výrezy v hracej ploche tak, aby sa na jednotlivých poliach zobrazoval znak X alebo O. Použitie vopred definovaných tvarov umožnilo využiť výkon na kalkuláciu ťahov a procesor prakticky ovládal len zapnutie a vypnutie svetelných elementov. Ide o prvý príklad úspešného prepojenia   elektrinou  ovládaného zariadenia a herných mechaník. Tento prototyp bol využitý na kanadskú národnú výstavu, ktorá sa konala v Toronte v roku 1950. 

Ak hovoríme o elektronických zariadeniach, ktoré predchádzali ére obrazoviek, musíme spomenúť aj elektromechanické zariadenie Nimrod, vyvinuté firmou Ferranti a prezentované verejnosti na Festivale v Británii v roku 1951. Tento počítač navrhnutý Johnom Makepeaceom Bennettom a Raymondom Stuartom-Williamsom umožňoval hrať matematickú hru Nim, založenú na striedavom uberaní zvoleného počtu objektov (pôvodne zápaliek) z plochy tak , aby oponentovi ostal v závere buď posledný objekt, alebo neostal žiadny. Cieľom ani nebolo pobaviť publikum, ako skôr demonštrovať výpočtové schopnosti umelej inteligencie, ktorá v spomalenom režime ukazovala, ako sa rozhoduje o ďalšom ťahu. 

Autori tvrdia, že bol inšpirovaný zariadením Nimatron, ktoré bolo vystavené na svetovom veľtrhu v New Yorku v roku 1940. Vážilo tonu a bolo realizáciou návrhu Edwarda Condona. Nimatron nekalkuloval ťahy na matematických princípoch, ale namiesto najlepšieho možného ťahu vždy sledoval jednu z dvanástich vopred definovaných postupností. Obe zariadenia ukazovali progres hry prostredníctvom rozsvietenia a zhasnutia jednoduchých žiaroviek.

Prvky detailnej statickej grafiky, ktoré je možné zobraziť alebo skryť, využívali neskôr mnohé zariadenia s LCD (liquid crystal) displejmi. Tieto zariadenia disponovali statickým súborom všetkých vizuálnych elementov, ktoré sa v jednotlivých momentoch zobrazovali na displeji, teda rozsvietením alebo zhasnutím. Na rovnakom technologickom princípe fungovali tzv. digitálne hodinky v 80. a 90. rokoch, ktorých čísla pozostávali zo segmentov s touto vlastnosťou. V socialistických krajinách bývalého východného bloku boli najskôr populárne kópie hier Nintendo Game & Watch v podobe legendárnych hier No počkaj! Neskôr v 90. rokoch rôzne varianty hry Tetris, ktoré sa svojím vzhľadom snažili napodobňovať značkové elektronické prenosné zariadenia (handheld), predovšetkým Nintendo Game Boy. Popularite sa tiež tešilo LCD zariadenie, v ktorom „žilo“ virtuálne zvieratko Tamagoči (názov vznikol spojením japonských slov vajce a hodinky), a jeho varianty. Tie podobne ako Tetris využívali kombináciu statických ikon a displeja pozostávajúceho z čiernych štvorcov, ktoré vytvárali kontrast so svetlým (a niekedy aj s podsvieteným) pozadím. Vzhľadom na to, že technicky ani oveľa neskôr nepresahovali možnosti iných technológií spomíname ich iba tu.

Cathode Ray Tube

Zobrazovanie pohyblivého obrazu prostredníctvom statických prvkov ešte v histórii hier zažiarilo v podobe farebných vákuových fluorescenčných obrazoviek (vacuum fluerescent display, VFD). Hry si však dlhodobo obľúbili vákuové obrazovky, ktoré boli väčšie a dokázali zobrazovať realistický detailný pohyb už v dvadsiatych rokoch 20. storočia v podobe televízie. 

Obrazovky prvých televíznych prijímačov vytvárali obrazce na sietnici ľudského oka prostredníctvom rýchlo sa pohybujúceho lúča elektrónov generovaných katódou, ktoré sú smerované magnetickými poľami na rôzne miesta obrazovky (odtiaľ názov katódová trubica, z angl. cathode ray tube, skrátene CRT). Predná plocha obrazovky je na vnútornej strane pokrytá fosforom a lúč prenikajúci jemnou mriežkou umiestnenou medzi lúčom a obrazovkou rozsvecuje časti, ktoré zasiahne. Jeho rýchly pohyb po obrazovke, spôsobený zmenou napätia v cievkach vychyľujúcich lúč, pôsobí takto dojmom plynule sa pohybujúceho obrazu. 

Lúč pri svojej púti naprieč obrazovkou skenuje jej povrch po riadkoch v rýchlom slede a zanecháva na sietnici oka obraz, ktorý je prepísaný ďalším skôr, než ľudský mozog postrehne, že už práve zmizol. Ide o podobný efekt, aký predtým využívalo kino, no paradoxne záznamy sa na obrazovkách televízorov zobrazovali až podstatne neskôr. Prvé roky televízneho vysielania boli iba priamym živým prenosom špecifickej svetelnej scény. Tá bola snímaná svetlo-citlivými plochami snímačov v kamere, ktoré odovzdávali informáciu o intenzite svetla v danom bode, a tá bola následne prevedená do podoby signálu, prenesená k divákovi domov a replikovaná na obrazovke televízora skenujúcim lúčom. Pritom oči diváka zaznamenali podobné hodnoty svetelnej intenzity, aké sa nachádzali pred kamerou, a tak v jeho mysli vytvárali reálny pohyblivý obraz.  Okrem tohto spôsobu vykresľovania obrazu, pri ktorom lúč sleduje stále rovnaký vzor CRT umožňuje voľný pohyb lúča, ktorý je daný len jeho smerom a rýchlosťou. Na tomto princípe fungovali preedovšetkým osciloskopové obrazovky slúžiace k vizualizácii kriviek pri výpočtoch a meraniach.

 

image.png

Obr. 3: Vzduchoprázdna trubica, ktorá je jadrom CRT obrazovky

Myšlienka vytvárať obraz inak ako prostredníctvom snímania kamerou bola spočiatku len predmetom armádnych a vedeckých projektov alebo umeleckých experimentov. Netrvalo však dlho a ľudia našli množstvo spôsobov, akými na obrazovkách, ktoré predstavovali modulárny systém zobrazovania na základe videosignálu definujúceho intenzitu, postupne získavali čoraz detailnejšiu sieť svetelných bodov. Formálne za celkom prvý pokus využitia elektrickej energie na zobrazenie grafických prvkov hry považujeme nerealizovaný prototyp zariadenia Cathode Ray Tube Amusement Device z roku 1947. Dokumentácia k prototypu detailne opisuje možnosť využitia CRT obrazovky na hranie hry, v ktorej mal hráč ovládať trajektóriu lúča strieľajúceho do objektov umiestnených na obrazovke v podobe priesvitnej fólie. 

Spočiatku sa obrazovky produkujúce iný ako kamerový obraz používali predovšetkým v osciloskopoch, teda v zariadeniach určených na vizualizáciu priebehu meraní a výpočtov v armádnom a vedeckom výskume. Prvé herné zariadenia využívajúce túto technológiu preto neboli určené na spotrebný trh. Ich výkon vyžadoval počítače, ktoré zaberali niekoľko štvorcových metrov priestoru, z čoho vyplýva aj ich slovenské označenie – sálové počítače. 

Rané pokusy o zobrazenie rôznych objektov na počítači Whirlwind I siahajú až do roku 1949, keď bol v Massachusettskom technologickom inštitúte demonštrovaný algoritmus zobrazujúci trajektóriu skákajúcej loptičky prezentovanej svetelným lúčom. Tento však zatiaľ nemožno považovať za hru, keďže neobsahoval žiadnu interakciu. Existujú zmienky o tom, že existovala verzia, ktorá umožňovala kontrolovať trajektóriu lopty tak, aby trafila otvor v určitej vzdialenosti, ale tieto ostávajú dodnes nepodložené dôkazmi.

Za prvý neúspešný pokus možno považovať implementáciu hry Draughts (u nás známej ako Dáma) na počítač Pilot ACE, ktorú naprogramoval Christopher Strachey ešte v roku 1951. Jej komplexnosť, ktorá bola výrazne vyššia než pri hre piškvorky, presiahla pamäťové limity tohto zariadenia a bola úspešne spustená až o rok neskôr na počítači Manchester MK1, resp. na jeho komerčnej verzii Ferranti MK1, dostupnej na Manchesterskej univerzite. Tento počítač okrem vedeckých výpočtov dokázal hrať tiež šach proti ľudskému oponentovi, ale bez využitia obrazovky. Strachey na tento počítač vytvoril rôzne programy schopné tvoriť hudbu alebo milostné listy a napokon v lete 1952 vytvoril funkčnú verziu svojej hry. Hráč v nej mohol hrať na prvej úrovni obťažnosti dámu proti počítaču, pričom mal k dispozícii možnosť niekoľkokrát vrátiť ťah. Po vyhranom kole počítač zahral jednoduchú verziu britskej hymny, ktorou je skladba God Save The Queen (Boh, zachráň kráľovnú). 

Z roku 1952 pochádza ešte iná hráčom ovládaná hra Naughts & Crosses (neskôr známa ako OXO), ktorá občas býva tiež označovaná za prvú videohru. Jej program umožňoval hrať piškvorky prostredníctvom vysvietenia bodov na 35 × 16-bodovom poli zobrazenom na jednom z troch osciloskopov. Hra vznikla na univerzite v Cambridge ako súčasť záverečnej práce A. S. Douglasa (publikovanej na jar 1953). Demonštrovala schopnosti zariadenia uchovávať dáta v dočasnej pamäti. Hráč zadával číslo poľa, do ktorého chcel umiestniť svoju značku, pomocou vytáčajúceho ciferníka s číslami 1 až 9.  

Napriek tomu, že ani jedna z týchto hier neobsahovala žiadny plynulý pohyb, historicky predstavujú vôbec prvé úspešné pokusy o zobrazenie herných elementov prostredníctvom malej obrazovky na princípe vektorového smerovania svetelného lúča. Pritom zároveň demonštrujú možnosti vykresľovania obrazcov v rámci mriežky, ktorá sa trochu neskôr stala štandardom počítačovej grafiky. 

Prvá hra zobrazovaná na katódovej trubici, ktorá zobrazovala pohyb objektov po obrazovke, bola Tennis for Two z roku 1958, vyvinutá zo zariadenia určeného na vizualizáciu balistických dráh rakiet. Hru navrhol americký fyzik William Higinbotham spolu s technikom Robertom Dvorakom. Svetelný lúč pri tejto hre plynulo vykresľoval iba pohyb lopty, ktorú na koncoch odrážali hráči. Obaja scénu videli z jedného bočného pohľadu obsahujúceho plochu, od ktorej sa lopta odrážala pri dopade, a sieť, cez ktorú ju bolo potrebné odraziť. Hráči ovládali hru otáčaním potenciometra určujúceho uhol odrazu lopty a stláčaním tlačidla na odpal. Zariadenie následne generovalo dráhu letu, ktorú vykreslilo pohybom svetelného lúča po obrazovke. Výhru alebo prehru vyhodnocovali samotní hráči, keďže hra neposkytovala žiadny oznam o výhre alebo získaných bodoch.

Druhým významný pokusom o vytvorenie hry s priamym ovládaním kmitajúceho lúča bola už spomínaná hra Spacewar!, ktorá vznikla na pôde MIT (v Massachusettskom technologickom inštitúte). Bola vytvorená na počítač PDP-1 a dostala sa v rôznych obmenách na viacero škôl a vedeckých pracovísk. Dočkala sa aj arkádového spracovania v podobe samostatne stojaceho zariadenia. Vzhľadom na svoju náročnosť však nemala komerčný úspech. Ten prišiel až s vydaním hry Pong (1972) spoločnosťou Atari, ktorá vytvorila samostatne stojaci automat s obrazovkou a dvoma otočnými ovládačmi. Celkový dizajn tejto arkády definoval základné vizuálne prvky, ktoré sú typické pre statické arkádové automaty.  

Princíp vektorového zobrazenia neskôr aplikovalo domáce herné zariadenie Vectorex v roku 1982 tiež bez väčšieho komerčného úspechu. Využívalo zabudovanú obrazovku, ktorá bola zmenšeninou arkádovej verzie. Obrazovky „kresliace“ rýchlym pohybom svetelného lúča po fosforovej vrstve sa nazývajú tiež vektorové obrazovky a fungujú na princípe náhodného skenovania (random scan). Sú schopné zobrazovať veľmi jasný a ostrý obraz, ktorý sa vďaka analógovej povahe ovládania cievok vychyľujúcich katódový lúč pohybuje veľmi plynulo. Plné využitie obrazoviek pri hrách nastáva až s rozšírením mriežkového spôsobu zobrazenia (tzv. raster scan), ktoré čiastočne umožnila už analógová televízia. Tá však oddeľovala presne iba riadky, po ktorých prechádzal lúč, pričom horizontálne jednotlivé body na obrazovke aktivoval lúč podľa vstupného signálu.

Plné možnosti rastrového skenovania priniesol až digitálny signál, ktorý bol schopný navigovať aktivitu katódového lúča po pravidelnej mriežke na základe súradníc. Rastrové skenovanie funguje na opakujúcej sa ceste lúča po riadkoch, v ktorých sú pred fosforovú vrstvu umiestnené mriežky s otvormi. Pri prechode nimi lúč svetla mení intenzitu na základe prichádzajúceho signálu. Vďaka efektu zotrvačnosti vnemu na sietnici ľudského oka (podobne ako pri premietaní obrazu z filmového pásu) pri dostatočnej rýchlosti skenovania divák vníma jednotlivé snímky ako súvislý obraz. Obrazovky založené na tomto princípe sa stali štandardom na zobrazovanie hier na arkádových automatoch, na televíznych obrazovkách domácich konzol aj na monitoroch počítačov.  

 

image.png

Obr. 4: Priesvitná fólia vytvárajúca herný kontext pre svetelné body (Magnavox Odyssey)

Túto éru odštartoval Pong. Krátko po arkádovej verzii vyšiel aj ako domáca konzola. Konzola umožňovala dokonca niekoľko druhov hier, v ktorých hráč ovládal svetelné body na obrazovke. Išlo v zásade o komerčné prevedenie prototypu The Brown Box od Ralpha Baera z roku 1967. Na trh sa dostal v roku 1972 pod obchodným názvom Magnavox Odysseyčím odštartoval tzv. prvú generáciu herných konzol. Toto zariadenie umne využívalo tiež tlačenú grafiku aplikovanú na domáci televízor prostredníctvom priesvitných fólií, po ktorých sa pohybovali jednoduché svetelné obrazce vysielané obrazovkou. Tento trik umožňoval prostredníctvom ovládačov, ale aj svetelnej pištole hrať množstvo rôznych hier, hoci stále išlo len o pohyb jednoduchých svetelných štvorcov. Hernú súpravu dopĺňali rôzne ďalšie doplnky ako karty či hrací plán na ruletu.

Jedinou hrou, ktorú bolo možné hrať bez použitia akýchkoľvek prídavkov, bol práve klasický simulátor stolného tenisu, v ktorom hráč ovládal svoju pozíciu otočnými ovládačmi. Hra napriek existencii predchodcov ako Tennis for Two alebo Spacewar! býva často označovaná za prvú digitálnu hru. Táto simulácia stolného tenisu nielenže spĺňa všetky kritériá digitálnej hry, ale zároveň je aj jednoducho a všeobecne rozpoznateľná. Po obrazovke sa pohybuje jeden svetelný bod, ktorý si medzi sebou odrážajú dvaja súperi, pričom v pozadí možno počuť zvuky, ktoré dovtedy bežne vydávali radarové detektory. Vizuálna aj zvuková stránka tejto hry využíva úplné minimum na to, aby sa hráč mohol naplno ponoriť do herného zážitku. 

V nasledujúcich rokoch po celom svete vznikali ďalšie a ďalšie zariadenia umožňujúce hrať túto hru a jej varianty. Výnimkou nebolo ani Československo, kde po komplikovanom vývoji napokon v roku 1982 Tesla Piešťany priniesla na trh prvú (aj poslednú) komerčne predávanú hernú konzolu postavenú z vlastných súčiastok pod názvom XD 8001. Jej tvorcami boli Jozef Ondrejka a Ján Hladík, ktorí prišli s nápadom zostrojiť na toto zariadenie vlastné integrované obvody, vyrábané pod označením MAS 601, 602 a 603.

Toto herné zariadenie však prišlo pomerne neskoro a jeho výroba bola drahá, čo spôsobilo, že množstvo ľudí sa rozhodlo konzolu si zostrojiť doma s použitím zahraničných verzií integrovaných obvodov (TMS1965NL, resp. AY-3-8500), ktorých zapojenie bolo (napriek ich oficiálnej nedostupnosti) publikované populárnym časopisom Amatérske rádio už v roku 1978. 

Po domácky vyrobené zariadenia (z angl. homebrew, z čes. domodělky) však možno považovať za špecifickú formu herného zážitku, keďže vznikali v rukách amatérov zo súčiastok a s vybavením, ktoré mali k dispozícii doma alebo v zamestnaní, či v škole. Dizajn výsledných výrobkov okrem estetiky zariadenia ovplyvňoval aj ich funkciu najmä v spôsobe vyhotovenia ovládačov. Obsah hry však ostával fixne definovaný použitým obvodom. 

Spomínaný procesor AY-3-8500 a jeho klony umožňovali okrem hrania Pongu tiež aktivovať rôzne modifikácie vykresľovania základných vizuálnych elementov a podmienok získavania bodov, pričom jednotlivé varianty mali fungovať ako zjednodušená simulácia iných športových hier. Československá súprava integrovaných obvodov od Tesly umožňovala hrať Pelotu, Tenis, Tenis proti stene a Futbal. 

Výroba konzol, ktoré obsahovali špecificky určený hardware na každú hru, sa však neoplatila nielen v Československu. Viacero spoločností začalo vyvíjať zariadenia ovládané mikroprocesorom, ktoré boli schopné spracovať program z nosiča podobne ako predtým sálové počítače, pričom ten sa mohol v pamäti obmieňať. Špecifický hardvare pre každú hru naďalej využívali väčšinou už len arkádové automaty. 

Koniec éry nemých hier

V novembri 1971 bola v bare s názvom Dutch Goose kúsok od Stanfordovej univerzity nainštalovaná prvá arkádová hra na mince so zvukom. Jej názov bol Computer Space a tvorcom bol Nolan Bushnell, ktorý takto vytvoril svoju vlastnú verziu vyššie spomínanej Spacewar! Pozostávala z čiernobielej CRT obrazovky a farebného futuristického rámu. Hra mala v podstate iba zopár zvukov – zvuky motorov a rakiet, zatáčania, výstrelov a explózií. Aj napriek tomu boli auditívne elementy vo vtedajšom období natoľko dôležité, že to bol jeden z ťahákov na reklamných letákoch. Na dnešné pomery zvuková kulisa tejto hry vyznieva kakofonicky: zvuk motorov a rakiet znie takmer neustále a pripomína skôr nižšie frekvencie bieleho šumu, otáčanie lode je zas podložené rytmickým pípaním, ktoré by sme mohli prirovnať k bežnému zvuku U. I. v modernom sci-fi. Podstatné však je, že všetky zvuky boli dokonale synchrónne a vytvárali tak potrebnú spätnú reakciu pri zásahu nepriateľa. Hra sa u študentov stretla s veľmi pozitívnym ohlasom, ale napriek očakávanému úspechu sa mimo univerzitnej pôdy tomuto automatu až tak nedarilo. Čiastočne za neúspech mohlo komplikovanejšie ovládanie využívajúce zvlášť tlačidlá na rotáciu vľavo a vpravo, ako aj na strieľanie a akceleráciu.

Prvým skutočným arkádovým hitom so zvukom bola stále známa, vyššie spomínaná hra Pong. Tvorcom bol opäť tím ľudí okolo Bushnella (v roku 1972 spolu s Tedom Dabneyom založili spomínanú spoločnosť Atari). Hlavným tvorcom bol Allan Alcorn. Podľa Bushnellových pokynov sa hra vylepšila o rôzne uhly odrazov loptičky od hráča, pridalo sa zobrazenie skóre a tri zvukové efekty: zvuk odrazenia loptičky od hráča, zvuk odrazenia od mantinelu a zvuk prehry, spúšťajúci sa, keď loptička prešla mimo obrazovky. Tieto zvuky boli vytvorené tak, že z malého reproduktora sa zaviedli uzemňovacie káble priamo do obvodov na doske. Zvuky boli vytvorené sčasti náhodou. Pôvodné návrhy Bushnella a Dabneyho obsahovali reálnejšie zvuky (ovácie publika pri skórovaní, „boo“ pokrik pri prehre atď.). Keďže však Alcorn nemal vedomosti, ako treba zvuky vytvoriť, ale ani dostatok súčiastok, vyskúšal prepojiť súčiastky tohto automatu so synchronizačným generátorom tónov, a tak nájsť najvhodnejšie frekvencie – našiel ich tak priamo v stroji. Po veľkom úspechu tohto automatu sa v Atari rozhodli, že vytvoria hru aj vo verzii domácej konzoly. Keď sa z Pongu stal celosvetový hit, bolo už nemysliteľné urobiť krok späť a vyrábať hry bez zvuku. Hoci dve spomínané hry sú podľa všetkých zdrojov skutočne prvými digitálnymi hrami so zvukom, považujeme za potrebné spomenúť ešte jednu. V roku 1969 spoločnosť Sega vytvorila arkádový automat s názvom Missile. Technicky nešlo o digitálnu, ale o elektromechanickú hru využívajúcu premietanie vopred nahratých slučkových sekvencií filmu (tzv. full motion video-game). Hráč pomocou joysticku ovládal a čiastočne mohol smerovať odpaľovanie rakety na stíhačky letiace oproti. Pri zásahu bolo zároveň počuť výbuch – môžeme teda hovoriť tiež o synchronizovanom zvuku. Za zmienku taktiež stojí elektronická hra Simon, ktorá bola na trh uvedená v roku 1978. Hoci túto hru nemôžeme považovať za digitálnu, mala svoj vlastný kód a ovplyvnila množstvo neskorších hier. Jej koncept je založený na prehrávaní sérií tónov a farebných svetiel, ktoré musí hráč v správnom poradí tlačidlami zopakovať. Kombinácie sú pri správnom stláčaní čoraz dlhšie, rýchlejšie a komplikovanejšie. Túto hru (resp. hračku) možno považovať za predchodcu prenosných konzol do ruky (z angl. handheld consoles) a zároveň prvú audio hru.

image.png

Obr. 5: Hra Simon

Ďalší vývoj hier bol v znamení arkádových automatov. Väčšina týchto strojov na mince si stále zachovávala zvuk ako jedno zo svojich hlavných lákadiel. Často bol do nich totiž zabudovaný elektronický zvuk, ktorý mal funkciu pútača (napríklad v ďalších hrách od Atari – Barrel Pong, 1972; Gotcha, 1973). Kvalitatívne sa však zvuk líšil od automatu k automatu, keďže zvukové obvody sa v týchto rokoch od seba výrazne odlišovali. Hlavné bolo to, aby zvuky boli dostatočne hlasité, čo zvyšovalo šance, že hráč si vyberie konkrétny automat. Problém spôsoboval aj fakt, že zvuk bolo stále ťažké naprogramovať a tvorca hry sa musel rozhodnúť, nakoľko bude zvuk znieť dobre a nakoľko sa musí jeho podiel zmenšiť, aby sa zmestil do dostupnej pamäte. 

V roku 1975 firma Taito vydala hru Gun Fight, ktorú možno považovať za prvú arkádovú hru s hudbou. Taito v nej využila krátky úryvok zo skladby Fryderyka (Frédérica) Chopina, ktorý zaznel vždy, keď jeden z hráčov zomrel. Zaujímavé je takisto, že Gun Fight bola prvá arkádová hra so stereo zvukom – ten sa prehrával zľava alebo sprava podľa toho, ktorý z hráčov dostal zásah. Takýto formát v arkádových automatoch nebol populárny a častejšie sa začal využívať až v ére domácich konzol s príchodom Amigy 1 000. Ďalší príklad hry so stereo zvukom z tohto obdobia môžeme vidieť v Death Race (1976). Rovnako v roku 1975 vyšla prvá hra so zvukom na domácej konzole – Atari Pong.

Hoci Gun Fight využil krátky úsek hudby, až hra Space Invaders (Taito, 1978) napovedala, ako bude vyzerať budúcnosť hier s kontinuálnou nediegetickou hudbou. Tá pozostávala z originálnej, ale primitívnej štvortónovej slučky, predstavujúcej pochod mimozemšťanov. Ako hra pokračovala, táto slučka sa neustále zrýchľovala, čiže vo veľmi vzdialenom zmysle pripomínala adaptívnu hudbu. Zrýchľovaním zároveň zvyšovala napätie hráča. Podobný koncept zrýchľovania tempa využila aj hra Asteroids (Atari, 1979) a spolu so Space Invaders tak predstavujú prvé dva tituly s primitívnou hudbou počas hrania (hoci Asteroids využíval len dva tóny). Ďalšia z hier s hudbou v pozadí bola hra Sheriff od spoločnosti Nintendo (1979, mimochodom, ide o neoficiálne pokračovanie Gun Fight). Jednoduchosť využitých tónov spočívala v tom, že hudba sa mohla vytvárať iba pomocou kombinovania tranzistorov, kondenzátorov a odporu, prípadne vpisovaním jednotiek a núl priamo do procesora. V tejto časti sme zámerne použili slovné spojenie primitívna hudba, pretože prvá digitálna hra s kontinuálnou melodickou hudbou bola až Rally X z roku 1980 (Namco/Midway). Pozostávala zo slučky šiestich taktov, kde sa striedala rovnaká melódia vždy dvakrát za sebou a následne sa transponovala o pár tónov nižšie.

Znaky a symboly

Herná grafika postavená na technológiách manipulácie svetelných lúčov či obrazoviek a jej história je opísaná v predchádzajúcej kapitole. Doteraz sme sa však nevenovali vývoju zobrazovania ďalšieho dôležitého grafického prvku, a to spôsobom zobrazovania textu. Konkrétne ide o spôsob zobrazovania textu prostredníctvom tzv. ďalekopisu, resp. ďalekotlače (z angl. teleprinter), teda písacieho zariadenia (stroja) prispôsobeného tak, aby poskytovalo používateľské rozhranie na odosielanie zadaných údajov do počítača a na tlač odpovede, t. j. na tlač výstupov vtedy veľkých sálových počítačov. Aj toto médium sa pomerne rýchlo dostalo do pozornosti tvorcov hier a vzniklo viacero titulov, ktoré bolo možné hrať prostredníctvom tohto vstupno-výstupného zariadenia. Hry v textovej podobe boli jedným z prvých prirodzených spôsobov programovania digitálnych hier, keďže spočiatku väčšina počítačov nedisponovala grafickým rozhraním. Z tohto dôvodu aj po rozšírení obrazoviek ostala tvorba hier s využitím textových znakov jedným zo spôsobov vizualizácie digitálnych hier. Napríklad aj tak, že počítače nedisponovali displejom, ale terminálom, ktorý jednotlivé riadky textu s obsahom hry tlačil na papier. Špeciálne miesto v ich histórii má hra The Summerian Game (1964), ktorá text dopĺňala externým zdrojom projektovaných obrazov a hlasového sprievodu. Napriek tomu, že ide o strategickú hru s manažmentom zdrojov, býva považovaná aj za prvú hru s príbehom, ktorá zároveň obsahuje vzdelávacie prvky. Vytvorila ju učiteľka Mabel Addis v spolupráci s Williamom McKayom. 

Medzi ďalšie hry fungujúce na princípe terminálov prepojených sieťou patria stratégia Oregon Trail (1971), určená študentom na pochopenie problematiky osídľovania Ameriky, prvá hra na hrdinov Dungeon (1975) s mechanikami z Dungeon & Dragons a tiež nimi ovplyvnená prvá hra s dobrodružným námetom (adventúra) Colossal Cave Adventure (1976). Medzi inštitúciami a školami disponujúcimi terminálmi prepojenými sieťou boli tiež populárne hry pre viacerých hráčov pričom najznámejšou je MUD (Multi User Dungeon, 1978), ktorá odštartovala samostatný žáner online hrania. Vizuálne zaujímavou bola tiež sci-fi hra Star Trek (1971), v ktorej hráči príkazmi ovládali vesmírnu loď USS Enterprise (prezentovanú znakmi -E-) na poli 8 × 8 bodov proti flotile Klingonov (prezentovanú symbolmi *).

Mikropočítače, ktoré boli zmenšenou verziou sálových počítačov, výrazne ovplyvnili spôsob generovania videosignálu precíznou kalkuláciou fixne definovaných bodov na obrazovke a s možnosťou pripravovať vopred grafiku v programe a ukladať ju v dočasnej pamäti spolu s ďalšími výpočtami potrebnými na zobrazovanie zložitejšej grafiky. Prvé osobné počítače vymenili tlačové terminály za obrazovky. Ešte stále však boli optimalizované predovšetkým na zobrazovanie znakov, a preto aj prvé hry na ne boli takmer výhradne textové.

Za prvú komerčne predávanú textovú hru býva považovaná hra Adventureland (1978), ktorá bola určená na 8-bitové mikropočítače. Podobne ako v Collosal Cave Adventure hráč ovládal postavu textovými príkazmi, ktorých výsledok sa zobrazoval v hornej tretine obrazovky. Text na obrazovke opisoval, čo hráč vidí a kam môže ísť. Tento žáner sa stal vďaka priamočiarosti programovania pomerne rozšíreným aj u amatérskych tvorcov. S istým časovým posunom sa mikropočítače rozšírili aj v krajinách bývalého východného bloku a niekoľko podobných hier menšieho rozsahu vzniklo aj v Československu. V tomto období už výkon a pamäť domácich počítačov umožňovali aj využitie jednoduchých grafických elementov, pričom text ostal nosnou mechanikou rozprávania príbehu a ovládania postavy.

image.png

Obr. 6: Ukážka z hry Rogue využívajúca znakovú sadu pre vytvorenie grafických elementov.

Medzi prvé hry, ktoré zobrazovali pozíciu a pohyb hráča textovými prvkami nad rámec strohých dialógov a štatistík, patrí počítačová hra Rogue z roku 1980, ktorá vytvorila nový žáner hier tzv. rogue-like. Princíp hry opäť vychádzal zo systémov hier na hrdinov, pričom využíval elementy rozprávania príbehu, vplyvu náhody a pohybu po mape, ktorej vizualizácia bola vytvorená prostredníctvom abecedy a špeciálnych znakov. Ich rozsah sa postupne zväčšil s rozšírením znakového súboru nad rámec písmen a znakov, ktoré poskytovali „stavebné bloky“ na zostavovanie grafických rozhraní, napr. ako okraje tabuliek, výplne, šípky a jednoduché tvary. Rogue technicky stále patrí do oblasti textových hier, keďže využíva primárne znaky a symboly, spolu však presahujú textotvornú úroveň a stávajú sa grafickými elementmi. 

8-bitový zvuk

Prvou hernou konzolou so zvukom bola Atari 2600. Na rozdiel od všetkých predchádzajúcich prístrojov sa v nej prvýkrát objavil dedikovaný hardware na zvuk. Konzola mala iba dva zvukové kanály: jeden generoval šum (noise) a druhý štvorcovú zvukovú vlnu (pulse wave). Prehrávať naraz sa teda dali iba dva zvuky. Šumový kanál bol napríklad schopný vytvárať dnes už ikonické zvuky explózií a vďaka tomu, že pulzná zvuková vlna mohla v podstate meniť výšku, mohli byť vytvorené aj primitívne zvuky motorov (napríklad v závodnej hre Enduro od Activision z roku 1983) alebo výstrelov (Combat od Atari, 1977).

V tomto čase sa už zvukom a primitívnou hudbou v hrách mohla začať vytvárať atmosféra, hoci vzhľadom na technologické nedostatky ešte stále prevládal zvuk nad hudbou. Okolo roku 1980 začali tvorcovia arkád častejšie do obvodových dosiek implementovať zvukové čipy určené špecificky na prácu s audiom. Nazývali sa PSG – programovateľné zvukové generátory.

Programovateľný zvukový generátor je zvukový čip vytvárajúci audio signály pomocou jednej alebo viacerých základných zvukových vĺn, resp. oscilátorov, využívajúc takzvanú subtraktívnu syntézu (o tej píšeme neskôr). To všetko sa deje na základe vstupu používateľa. Špecifiká takýchto zvukov sú väčšinou umiestnené priamo v kóde a sú spojené so spúšťaním oscilátorov. Tieto predstavujú elektrické signály, ktoré vytvárajú (alebo syntetizujú) zvukovú vlnu určitého tvaru, špecifickú tým, že jej tvar sa opakuje. 

Niektoré čipy boli schopné vytvárať zvuky samy o sebe len za pomoci jedného oscilátora, ale často boli využívané v pároch ako takzvané generátory. Neraz boli takéto zvukové vlny kombinované s ďalším kanálom generujúcim iba čistý šum (šumový kanál, noise channel). Zvuky hudobných nástrojov v skorých digitálnych hrách boli zvyčajne vytvárané kombináciou jednoduchej zvukovej vlny a generátoru takzvanej zvukovej obálky (envelope). 

Zvuková obálka je nástroj, ktorý doslovne tvaruje dynamický priebeh zvuku od jeho začiatku v čase a jej podoba sa najčastejšie zobrazuje ako jednoduchá krivka pozostávajúca z niekoľkých častí. Zvyčajne sa tvar krivky spája so základnými vlastnosťami zvuku (amplitúda, teda hlasitosť/intenzita, frekvencia alebo výška). Spomínané časti krivky predstavujú nábeh (attack), útlm (decay), trvanie (sustain) a uvoľňovanie (release), teda ADSR. 

image.png

Obr. 7: ADSR

Nábeh (attack) predstavuje čas, ktorý zvuku trvá, kým začne znieť, teda od úplného ticha hneď po stlačení klávesy alebo akéhokoľvek vstupu (napríklad tlačidlo na ovládači) až po stanovenú maximálnu hlasitosť. Útlm (decay) určuje čas toho, ako sa hlasitosť daného zvuku znižuje po nasledujúcu hodnotu trvania. Trvanie (sustain) je úroveň zvuku, ktorá ostáva nemenná počas trvajúceho držania klávesy alebo spustenia akéhokoľvek vstupu, až pokým klávesu nepustíme, resp. vstup neuvoľníme. Uvoľňovanie (release) predstavuje čas, ktorý zvuku trvá, kým od poslednej hodnoty neprejde do úplného ticha, resp. zastavenia.

Niektoré zvukové čipy mali vo zvukovej obálke aj hodnotu „hold“. Tá predstavovala trvanie, počas ktorého sa úroveň zvuku držala na jeho maximálnej hodnote. Tu treba dodať, že kým hodnoty attack, decay a release označujú primárne čas, sustain je v prvom rade úroveň hlasitosti. Zároveň treba dodať, že tieto hodnoty nemusia byť prezentované iba lineárnymi (teda rovnými) krivkami, ale napríklad aj logaritmickými (tie môžu mať oblý tvar). Zvolený typ krivky, resp. zvukovej obálky možno na prvý pohľad znie ako technický detail, ale je to práve táto obálka, ktorá značne odlišuje od seba rôzne zvuky a ich využitie a ktorá dokáže aj z obyčajného statického bieleho šumu vytvoriť rôznorodé nástroje. V hrách na prelome 70. a 80. rokov sa napríklad veľmi často používal trik s bielym šumom tak, že hodnota attack bola minimálna, ako aj hodnota decay a sustain. Release mal jemnú krivku „dojazdu“, čo vo výsledku vytvorilo z bieleho šumu jednoduchý a hlavne presvedčivý činel, čiže rytmický prvok hudby. 

Túto techniku používajú zvukoví dizajnéri dodnes a na hĺbkový syntetizátorový zvukový dizajn sa využívajú práve kombinácie kriviek filtrujúcich a modulujúcich rôzne aspekty zvuku – pomocou šumu však boli v minulosti často tvorené perkusné prvky vo všeobecnosti. Keď sa podobná stratégia aplikuje napríklad na vyššie položenú sínusovú zvukovú vlnu, vytvoríme tým klasický/typický laserový výstrel. 

Tvar zvukovej obálky okrem intenzity a dynamiky zvuku v čase mohol byť neskôr aplikovaný aj na frekvencie a výšku zvuku. Znamená to, že pomocou podobne zvolenej krivky je možné pomocou bieleho šumu vytvoriť napríklad primitívny zvukový efekt explózie. Zvuková obálka upravujúca hlasitosť bude mierne predĺžená a frekvenciu a výšku zvuku dynamicky upravíme tak, že od istého bodu začnú klesať. Jedna postupne odfiltruje výšky a tá druhá spôsobí, že zvuk bude na konci hlbší. Samozrejme, v prvých zvukových čipoch bol dojem klesajúcej melódie, resp. výšky vytváraný primárne veľmi krátkymi a rýchlo za sebou prehrávanými tónmi, ktoré na stupnici postupovali nadol.

Dôležitým elementom ovplyvňujúcim výslednú kvalitu a farbu zvuku, produkovanú PSG, bol výber zvukovej vlny generovanej oscilátorom. V prvých zvukových čipoch sa väčšinou využívala kombinácia základných zvukových vĺn a šumu. Opisované vlny sú rozlišované ako sínusová, štvorcová, trojuholníková a pílová.

V začiatkoch sa najčastejšie využívala štvorcová zvuková vlna – hranatý tvar jej amplitúdy spôsobuje, že má najmenšie rozlíšenie, a tým zaberá najmenej pamäte, pretože jej vlna v podstate prezentuje „vypnutie a zapnutie“ zvuku. Väčšina retro zvukov, ktoré máme doteraz v pamäti z éry prvej, resp. druhej generácie konzol, bola generovaná práve pomocou štvorcovej zvukovej vlny. Keď sa prehrávali nižšie tóny, takáto vlna sa často používala na vytvorenie basových zvukov. Je dostatočne výrazná aj vďaka viacerým harmóniám vytvárajúcim bohatší zvuk. 

Vo všeobecnosti je štvorcová vlna typ pulzovej vlny – šírka pulzu je kontrolovaná separátnym parametrom (pulse width) a manipulácia s ním môže dodať zvuku metalický, resp. nazálny charakter. Z tohto faktu napríklad neskôr ťažilo NES (Nintendo Entertainment System) a Game Boy.

image.pngObr. 8: Typy zvukových vĺn

Ak chce zvukový dizajnér napríklad vytvoriť zvuk imitujúci flautu pomocou jednoduchých oscilátorov, musí využiť buď sínusovú, alebo trojuholníkovú vlnu, alebo ich kombináciu (pokiaľ mu to zvukový hardware umožňuje). Naopak, ak potrebuje vytvoriť agresívnejší zvuk (motor, raketu, alebo bodavý zvuk), využije štvorcovú alebo pílovú vlnu. V niektorých čipoch sa taktiež využíval prvok LFO (low frequency oscillator), pomocou ktorého sa dalo vyrobiť takzvané vibrato (pulzujúca/rytmická zmena výšky tónu). 

LFO sa prvýkrát objavilo v syntetizátoroch 60. rokov a predstavovalo v podstate ďalší oscilátor, ktorý ale pracoval na podstatne nižšej frekvencii a ktorý pomocou rôznych vĺn mohol ovplyvňovať (modulovať) kvalitu hlavného oscilátora. Najčastejšie sa využíval na tvorbu tremola (rytmické modulovanie hlasitosti) alebo kolísavého efektu (wobble effect), spopularizovaného predovšetkým hudobným žánrom dubstep – ten bol tvorený rytmickou moduláciou filtra/ekvalizéra.

Mnohé z PSG vytvorila firma Texas Instruments alebo General Instruments, ale niektoré spoločnosti (Atari či Commodore) vyrábali svoje vlastné zvukové čipy. V týchto kúskoch hardvéru sa potom používali rôzne typy takzvaných syntéz, teda rôznych spôsobov, ako sa generoval samotný zvuk. PSG sa začal do spotrebiteľskej elektroniky inštalovať koncom 70. rokov, keď vznikalo viacero nárokov na zvuk v domácich konzolách a arkádach aj v prvých osobných počítačoch. Je potrebné dodať, že väčšina PSG obsahovala iba kanály s pulzovými vlnami a šumom. Drahšie čipy potom kombinovali aj iné typy syntéz. Iba čipy NES APU a Commodore SID mali implementované navyše aj trojuholníkové vlny, čo im umožňovalo produkovať prirodzenejšie basové frekvencie.

Problémom zvukových čipov súvisel aj s tým, že pôvodné arkádové verzie hier (napríklad Frogger alebo Space Invaders) mali svoje vlastné komponenty generujúce zvuk. Keď potom hráč spustil porty týchto hier napríklad na konzole Atari 2600, ktorá obsahovala zvukový čip TIA (Television Interface Adaptor – využíval iba dva kanály, oba obsahovali buď pulznú vlnu, alebo šum), zneli jednoducho inak, pretože sa celý zvuk musel od nuly prerobiť. Rovnako to bolo na konzole Mattel Intellivision s čipom AY38914. Odlišnosti medzi čipmi boli dané zároveň takzvaným registrom tónov, resp. rozdeľovačom frekvencií, ktoré určovali rozsah reprodukovateľných nôt. Čoskoro začalo byť štandardom implementovanie viac ako jedného zvukového čipu v rámci jedného herného systému – čipy sa navyše väčšinou využívali na komplexnejšie zvukové efekty. Pravdepodobne najrozšírenejším bol čip od spoločnosti General Instruments zo série AY-3 (jeho rôzne variácie mali za sebou ešte ďalšie štyri čísla), ktorý mal tri kanály (v každom mohol kombinovať buď pulznú vlnu, alebo šum) a SN76489 čip spoločnosti Texas Instruments, ktorý mal tri kanály vyhradené na pulzné vlny a jeden separátny kanál na šum. Pri takýchto PSG treba dodať, že ich technické vlastnosti sa odlišovali rôznymi detailmi: každý z kanálov mal obmedzený počet úrovní hlasitosti (teda nie plynule sa meniacu hlasitosť), rozsah frekvencií a podobne. Keď sa postupne začali využívať dodatočné čipy vyhradené hlavne na hudbu, znamenalo to, že hudba už nemusela byť prerušovaná zvukovými efektmi, ale mohla hrať nepretržite.

Na začiatku 80. rokov sa začali využívať aj takzvané speech čipy, teda komponenty, ktoré dokázali generovať primitívne zvukové efekty ľudskej reči. Medzi hry využívajúce takéto prvky patrí napríklad Star Wars (1983, Atari), Discs of Tron (1983, Midway) alebo Vanguard (1981, TOSE). Pri hre Vanguard treba spomenúť, že to bola prvá hra, v ktorej sa využila licencovaná hudba (jedna skladba z filmu Flash Gordon a druhá zo Star Trek: The Motion Picture). Licencovaná hudba už bola predtým zložená iným skladateľom a vydavateľ hry musel získať práva na to, aby ju vôbec mohol použiť. V súčasnosti je typickým príkladom séria GTA. Hre Journey (1983, Midway) patrí prvenstvo vo využití licencovanej hudby priamo v spolupráci s rovnomennou skupinou.
PSG neboli jediné kúsky hardvéru, generujúce zvuk. Zhruba v polovici arkádových hier sa stále využívali aj takzvané DAC konvertory, teda súčiastky, ktoré menili, resp. znovu vytvárali zvukovú vlnu z binárneho (digitálneho) kódu na analógový prúd. DAC mali rozdielnu bitovú hĺbku a vzorkovaciu frekvenciu. Čím vyššie boli hodnoty týchto zložiek, tým bol kvalitnejší reprodukovaný zvuk – avšak tým však rástla aj veľkosť, ktorú zaberal v pamäti.  V kontexte digitálneho zvuku definujeme bitovú hĺbku hlavne ako mieru dynamického rozsahu zvuku v decibeloch (dB). Zvuk (reálny analógový signál) sa mení na digitálny, pričom do zvukovej vlny sa umelo pridáva takmer nepočuteľný náhodný šum – ten je počuť až pri nižších hodnotách (8 bitov alebo 4 bity). To vnímame ako „zníženú kvalitu zvuku“ (v mnohých starších digitálnych hrách bolo tento šum aj reálne počuť). Šum sa pri nahrávaní pridáva na „vyhladenie“ digitálnej podoby zvukovej amplitúdy a spája sa s pojmom dithering. V kontexte zvukových procesorov zároveň bity predstavujú hodnotu toho, koľko dát môže hlavný procesor počítača prehrávať, resp. manipulovať naraz. Vzorkovacia frekvencia sa udáva v kilohertzoch (kHz) a predstavuje hodnotu toho, koľkokrát za jednu sekundu nahrávacie zariadenie meria/sampluje nahrávaný zvuk. Táto hodnota zároveň určuje frekvenčné rozpätie zvuku – štandardná vzorkovacia frekvencia 44,1 kHz približne odráža frekvenčné spektrum podobné počuteľnému spektru ľudských uší. Pri nižších vzorkovacích frekvenciách (napríklad 22 kHz a menej) v dôsledku procesu digitalizácie zvuku prídeme o časť spektra vysokých frekvencií, tzn., čím nižšia hodnota bude, tým viac vysokých a neskôr stredných frekvencií sa nám stratí.

Väčšina DAC konvertorov pracuje vďaka takzvanej PCM modulácii (pulse code modulation), teda konvertovaniu analógového zvukového signálu do digitálneho. Keďže táto metóda spracovania zvuku spôsobovala vyššie spomenutý problém s vyžadovaným väčšieho priestoru pri vyššej kvalite, pochopiteľne, že väčšina starších hier využívala iba krátke, kvalitatívne zredukované zvuky. Existuje ešte ďalšia verzia tejto metódy – ADPCM (adaptívna PCM), ktorá využíva kompresiu, a tým redukuje počet bitov na vzorku. Pri nižších frekvenciách tento spôsob v minulosti nevytváral nežiaduce artefakty, ale pri vysokých mohol spôsobovať skreslenie. Niektoré z ADPCM čipov sa využívali na efekty ľudského hlasu.

Z predošlých kapitol sa dá vyčítať, že jeden z problémov, ktoré museli riešiť tvorcovia hier na prelome 70. a 80. rokov, bol priestor – objem dát rástol, ak chceli mať kvalitnejší zvuk. To bolo v kontraste s tým, aký priestor vtedajšie technológie reálne ponúkali. Slučkovanie (looping), teda opakovanie jednej sekvencie zvuku či hudby plynule za sebou sa využívalo už v niektorých z prvých hier (spomínaných vyššie). Umožňovalo to využiť kratšie sekvencie zvukov, a tým šetriť priestor. Túto estetickú rovinu zvuku však oveľa viac cítiť približne od roku 1983, resp. 1984, keď bola na trhu konzola ColecoVision. Tá využívala vyššie spomínaný PSG čip SN76489 a množstvo hier práve na nej využívalo slučky. Za všetky spomenieme napríklad hru Gyruss (Konami, 1983). Vo svojej arkádovej verzii táto hra obsahovala až päť zvukových čipov na spracovanie zvukov, využívala stereo zvuk a zaujímavosťou je, že hudba bola remixom elektronickej verzie Tokáty a fúgy D mol od J. S. Bacha. Podobne sa začali slučkové hudobné podkresy (podmazy) presadzovať v hrách vydaných na konzolu Nintendo Entertainment System (1983). V tej sa využíval čip Ricoh 2A03 (resp. Ricoh 2A07 vo verzii PAL). Mal 5 mono zvukových kanálov: dva obsahovali variabilnú pulznú vlnu (so šestnástimi úrovňami hlasitosti a s možnosťou ohýbať výšku tónov – tzv. pitch bending), tretí kanál obsahoval trojuholníkovú zvukovú vlnu (s fixnou hlasitosťou a možnosťou ohýbať výšku), štvrtý kanál obsahoval biely šum. V piatom kanáli bol dodatočne využitý 7-bitový DPCM (diferenciálna PCM) prvok, schopný prehrať akýkoľvek zvuk obmedzený veľkosťou 16 384 bytov. Jeden z pulzných kanálov mal zároveň funkciu automatizovaného zvýraznenia špecifického frekvenčného pásma (frequency sweep), využívanú pri rôznych zvukových efektoch sci-fi. Väčšina najstarších hier síce využívala jedno až dvojtaktové slučky (často sa menili tým, že sa tóny transponovali vyššie či nižšie), ale s pribúdajúcimi hrami ich dĺžka rástla.

Pochopiteľne, že nie všetky hry potrebovali slučkovú hudbu – napríklad v hre Frogger (1981, Konami) sa hudba dynamicky prispôsobovala podľa toho, kde sa hráč nachádzal, a hra obsahovala približne 11 herných melódií. Tie sa medzi sebou prepínali ostrými strihmi a keďže maximálny čas, počas ktorého mohol hráč doraziť na ďalšie miesto (alebo zomrieť), bol zhruba 30 sekúnd, hudba sa slučkovať nemusela.

V tomto čase stále išlo iba o primitívne slučkovanie jednoduchých tónov bez sofistikovanejších prechodov medzi komplexnejšími melódiami. Rovnako by sme ťažko hľadali klasický hudobný postup, kde sa striedajú verše s refrénom a podobne – väčšinou išlo o striedanie maximálne osemtaktových slučiek. Výhodou ale bolo to, že časti melódií sa mohli využívať v rôznych častiach hry. Dlhšie slučky boli hlavne v hrách, kde hráči mohli stráviť v rôznych úrovniach dlhší čas. V súbojoch s bossmi boli zase častejšie kratšie a akčnejšie sekvencie. Komplexnejší prístup sa naplno uplatnil až neskôr s príchodom technológie MIDI, prípadne iMUSE, ktoré rozoberáme neskôr.

Sprajty, pohyb a 2.5D

Systém, akým programy a hry označovali vopred definované súbory pixelov, prezentujúce jednotlivé písmená a znaky, síce zďaleka neposkytoval dostatočnú mieru detailu pri zobrazovaní herných elementov, no zároveň miera technologického pokroku v 80. rokoch 20. storočia stále neumožňovala ich programovanie spôsobom, aby bolo možné prepočítať a zobraziť v dostatočnej rýchlosti každý jednotlivý pixel rastra. Takýto spôsob by totiž vyžadoval množstvo pamäte, ktoré herný hardvér ani osobné počítače neobsahovali. 

Kompromisné riešenie preto väčšinou bolo, že detailná grafika sa využívala predovšetkým v úvodných predeloch a v záverečných obrazoch alebo v podobe statických súčastí obrazu. Dynamické alebo hráčom ovládané elementy boli uložené v pamäti, odkiaľ ich program vyvolal spôsobom podobným pri generovaní znakov. Jednotlivé elementy boli uložené vo forme mriežky, ktorá obsahovala prvky scény, objektu, postavy alebo ich súčasti. Vymenované elementy sú označované za sprajty (z angl. sprite). Ich rozlíšenia a farebné palety sa líšili medzi jednotlivými zariadeniami a časom umožňovali čoraz väčší rozsah a detail. 

image.png

Obr. 9: Časti postavy a hernej scény hry Super Mario Bros v operačnej pamäti NES

Predtým, než sa sprajty usídlili v operačnej pamäti, kde bolo možné podľa potreby nahrávať a mazať, existovala detailnejšia rastrová grafika predovšetkým na arkádových automatoch, kde každý kus obsahoval špecifický hardvér na danú hru. Daný hardvér pozostával z plošných spojov osadených integrovanými obvodmi, v ktorých boli napevno uložené jednotlivé súčasti kódu a grafických elementov. V tomto prípade hovoríme o tzv. hardvérových kódovaných sprajtoch. Ich celkový počet a rozlíšenie boli výrazne limitované výrobnou cenou týchto zariadení a vývojári boli nútení hľadať rôzne kreatívne spôsoby, akými by sa mohla využiť táto kapacita a ako priniesť čo najpútavejší vizuálny zážitok.Medzi najčastejšie triky patrilo vytváranie povrchov z opakujúcich sa vzorov, viacnásobné využívanie rovnakých sprajtov na rôzne objekty s využitím odlišnej farebnej palety, prípadne aplikovanie jednoduchých transformácií, akou je otočenie alebo zrkadlenie. 

Druhým výrazne rozšíreným spôsobom zobrazenia hernej scény bol pohľad zboku, ktorý rovnako mohol zachytávať statickú scénu, ale častejšie sa využíval v tzv. side-scrolleroch, ktoré postupne odhaľovali herné prostredie pri vertikálnom a horizontálnom pohybe hráča. Jeho plynulosť závisela od technologickej úrovne herného zariadenia. Okrem arkádových zariadení ho podporovali počítače aj 8-bitové konzoly od Atari a Nintenda. 

Neskoršie 16-bitové konzoly od Nintenda a Segy priniesli tzv. parallax-scrolling (paralaxa/odchýlka vzhľadom na pozadie), pričom sa na pozadí hernej scény pohybovali rôznymi rýchlosťami viaceré vrstvy a vytvárali efekt hĺbky, pričom vrstva, na ktorej bola postava hráča, sa počas hry väčšinou nemenila.

Tretí rozmer priestoru v zmysle pohybu scénou prinieslo až tzv. axonometrické zobrazenie, ktoré dvojrozmerne simulovalo trojrozmerný pohľad. Umožňovalo nazerať na scénu z uhlov, ktoré evokovali trojrozmernosť prostredia, pričom pohyb postavy v princípe naďalej ostával dvojrozmerný. Okrem tohto spôsobu zobrazenia herného prostredia existujú rôzne ďalšie techniky, ktorými hry evokujú trojrozmernosť priestoru pri zobrazovaní dvojrozmerných grafických elementov. Súhrnne sa označujú pojmom 2.5D

História pokusov o napodobnenie 3D zobrazenia siaha ešte hlboko do obdobia textových a klasických 2D hier. Napríklad letecký bojový simulátor Interceptor (1975) od autora Space Invaders (1977) evokoval let pohybovaním sprajtov prezentujúcich nepriateľské lietadlá a ich škálovaním (menením veľkosti vzhľadom na pomyselnú vzdialenosť od hráča) alebo postupným zmenšovaním terénu v diaľke pri závodnej hre Night Rider (1977).  

Pri herných konzolách sa na vyvolanie pocitu pohybu v tretej dimenzii používala technika deformácie textúry, prezentujúcej spodnú plochu, ktorá simulovala zobrazenie perspektívy zužujúcej sa smerom od hráča, pričom uňho vyvolávala pocit, že sa nachádza a rotuje pod objektmi a postavami a nie za nimi. Tento efekt vo veľkej miere využívali hry určené na Super Nintendo Entertaining System (SNES), ktorého grafický procesor obsahoval rutinu Mode7, umožňujúcu tieto transformácie. Za najznámejšiu hru, ktorá ho využívala na simuláciu trojrozmerného prostredia, možno považovať Super Mario Kart (1992).

Z technologického pohľadu pod definíciu 2.5D hier patria aj hry, ktoré bývajú považované za ikonické tituly žánru first-person shooter, u nás tzv. strieľačiek z pohľadu prvej osoby, ako napríklad Wolfenstein 3D (1992), Doom (1996) alebo Duke Nukem 3D (1996) a ďalšie hry vytvorené v Build Engine. Hoci v nich hráč chodí po naklonených rovinách, používa výťahy alebo skáče, neustále sa pohybuje po ploche, ktorá pri pohľade zhora obsahuje len jednu vrstvu a existuje v dvoch rozmeroch. 

Hry umožňujúce pohyb priestorom z vlastnej perspektívy ako Catacomb 3D (1991), z ktorého sa neskôr vyvinul engine na hru Wolfenstein 3D alebo hra Ultima Underworld (1992), vytvárali ilúziu trojrozmernosti bez výpočtu trojrozmerných objektov s použitím metódy sledovania pomocou lúča nazývanej „raycasting“. Tá umožňuje postupné a rýchle vykresľovanie scény pomocou vysielania pomyselného lúča v dvojrozmernej mape z pohľadu hráča smerom dopredu. Len čo lúč narazí na nejakú prekážku, zistí jej typ a vykreslí z nej pruh v požadovanej škále, ktorú prezentuje vzdialenosť „vortexu“ (bodu, v ktorom sa stretajú). 

Takto postupne hráčom identifikuje všetky reálne viditeľné plochy, pričom neplytvá výkonom na výpočet a generovanie priestoru, ktorý hráč aktuálne nevidí. Efektivita postupu umožňuje skenovanie obrazu dostatočne rýchlo na vnímanie plynulého pohybu aj  na prvých počítačoch, ktoré nedisponovali samostatnými grafickými procesormi a pamäťami. 

Limitom technológie je, že steny, dvere a ďalšie takto generované súčasti musia byť ploché a vertikálne. Týmto spôsobom je možné vykresliť jednoduché steny tvoriace dizajn (mapu) levelu. Ostatné statické alebo animované objekty a charaktery v scéne boli vytvorené na vertikálnej ploche. Pri pohybe sa tieto elementy, ktoré sú vyspelejšou verziou už spomínaných sprajtov, otáčali za hráčom, aby nebola odhalená ich dvojrozmerná podstata. Pri pohybe do strany alebo od hráča zobrazovali animácie postavy zachytávajúce bočný alebo zadný pohľad, no vždy na tej istej ploche otočenej k hráčovi. Tento efekt sa označuje ako billboarding.

Zvukové čipy

Keď sa v domácnostiach rozšírili konzoly druhej generácie, domáce počítače ešte so zvukom takmer nepracovali. Na prelome rokov 1981 a 1982 bol v nich zabudovaný iba takzvaný PC speaker,  ktorý využíval len jednu štvorcovú zvukovú vlnu bez možnosti meniť hlasitosť. Niektorí tvorcovia hier však aj s takýmto systémom dokázali vytvoriť hudbu (napríklad Alley Cat z roku 1984 od spoločnosti IBM). Domáce konzoly v tom čase stále tak trochu bojovali s technologickými nedostatkami – porty arkádových verzií hier zneli odlišne a niektoré zvuky sa napríklad často museli úplne vynechať. Problém bol zároveň v ladení – čip TIA, využívaný v Atari 2600, bol charakteristický tým, že oba kanály boli naladené rozdielne. To znamenalo, že napríklad basové tóny nie vždy dobre ladili s vysokými tónmi. Konkurenčné konzoly sa snažili prinášať vylepšenia – domáca konzola Intellivision mala napríklad modulárny dizajn umožňujúci pripojiť hudobné klávesy a ďalší zvukový čip (využíval sa AY-3-8914), čo vytváralo možnosť pracovať so šiestimi kanálmi naraz.

Okolo roku 1983 registrujeme takzvaný pád herného priemyslu. Ten neskôr pomohla poopraviť vyššie spomínaná konzola NES. Na tejto konzole sa prvýkrát objavili doteraz slávne mená Mario a Zelda v hrách Super Mario Bros (1985, Nintendo) a Legend of Zelda (1986, Nintendo). Prvá zo spomínaných hier vo svojej ikonickej hudbe (prvá úroveň) využila štvortaktové sekcie s menšími variáciami a plná slučka trvala menej ako minútu. Japonská verzia (FamiCom – Family Computer) mala možnosť rozšíriť zvuky pomocou  prídavných čipov (niektoré v podobe prídavného hardvéru a niektoré boli priamo súčasťou kartridže s hrami). Do hernej konzoly Nintendo MMC5 boli napríklad pridané navyše dva kanály s pulzovou vlnou a jeden kanál s 8-bitovými PCM samplami, do Nintendo FDS bola pridaná 64-kroková prispôsobiteľná zvuková vlna, do Konami VRC6 bolo pridaných navyše 6 kanálov (tri boli rovnaké ako v originálnom čipe Ricoh, dva so štvorcovými vlnami a jeden s pílovou vlnou), do VRC7 bolo okrem šiestich kanálov pridaných aj 16 fixne nakódovaných nástrojov (zvon, gitara, flauta, klarinet, vibrafón a i.), do Namco 163 bolo pridaných 8 extra kanálov, do Sunsoft S5B extra tri kanály atď. Zaujímavé je, že sa v tom období ešte nedalo hovoriť o mixovaní zvuku, zvuky sa jednoducho prehrávali jeden cez druhý tak, ako to umožňoval hardvér a samotná hrateľnosť – neraz sa stávalo, že sa navzájom prebíjali.

Japonská verzia konzoly Famicom mala zároveň na svojom druhom ovládači zabudovaný mikrofón, ktorý niektoré hry využívali ako dodatočný ovládací prvok. Jeho pôvodnou funkciou bolo využiť túto konzolu ako karaoke, avšak mnohé hry tento prvok využili ako zásadnú hernú mechaniku. V 2D top-down strieľačke Raid on Bungeling Bay (Will Wright, 1985) hráč mal možnosť pomocou mikrofónu privolať v hre pomoc. V japonskej verzii Legend of Zelda – Hyrule Fantasy bol pre zmenu nepriateľ s názvom „Pols Voice“, ktorého hráč mohol zabiť hlasným zakričaním alebo fúknutím do toho mikrofónu (rovnaký nepriateľ sa neskôr objavoval aj v ďalších dieloch a verziách hry a vždy bol nejakým spôsobom spojený so zvukom alebo hudbou). V hre Kid Icarus (v originále Hikari Šinva – Palutena no Kagami, Nintendo/Tose, 1987) mohli hráči pri návšteve obchodu stlačiť tlačidlo „A“ a keď do mikrofónu rozprávali či kričali/fúkali, mohli s obchodníkom zjednávať cenu na minimum. 

V súvislosti s konzolou NES treba spomenúť aj ovládač s názvom Konami LaserScope,  ktorý bol pôvodne vyrobený na hru Laser Invasion (Konami, 1991). Bola to variácia na takzvané „light gun“, teda ovládače v podobe svetelných zbraní pripojených ku konzole. Pomocou nich mohol hráč mieriť na CRT obrazovku, tzn. doslovne mieriť na nepriateľov či vesmírne lode a strieľať. LaserScope bol zo zvukového hľadiska zaujímavý tým, že bol spracovaný ako „headset“ (zostava so slúchadlami a mikrofónom). Hráč mal pred očami laserový zameriavač a strieľanie aktivoval vlastným hlasom. Samozrejme, že mikrofón nerozoznával konkrétne slová, ale skôr intenzitu hlasu. Hráč mal takýmto spôsobom rozšírený zážitok, pretože napríklad pomocou hlasitého pokynu „fire!“ mohol reálne strieľať.

Vráťme sa však naspäť k osobným počítačom. Ich výhodou oproti konzolám bolo to, že používali štandardizované protokoly a komponenty. Znamenalo to, že rozliční výrobcovia mohli vyrábať jednotlivé produkty, ktoré bolo možné do nich zakomponovať (vsunúť). Ale mikroprocesory boli zamerané úplne inak ako na prácu so zvukom a úlohu práce so zvukom po pár rokoch prebrali prídavné zvukové karty. Firma IBM, vtedy hlavný výrobca počítačov, mala záujem ich lepšie prispôsobiť domácim používateľom. V roku 1984 teda uzrel svetlo sveta počítač IBM PCjr – upravená verzia ich pôvodného PC. Okrem disketovej mechaniky mal aj samostatný port na špeciálne ROM kartridž. Fungovalo to tak, že po vložení sa počítač sám reštartoval a nabootoval odznova všetko z vloženej kartridže – takýmto spôsobom mohli PC začať používať aj deti.  PCjr    využíval    zvukový    čip Texas Instruments SN76496 s tromi štvorcovými vlnami a s jedným šumovým kanálom. Podobný čip sa využíval v niektorých arkádových automatoch. To výrobcom v oblasti počítačového priemyslu napovedalo, že musí brať na vedomie rozširujúcu sa popularitu digitálnych hier. IBM najalo firmu Sierra On-Line so špecifickým zadaním – vytvoriť hru, ktorá by nový počítač predviedla v čo najlepšom svetle. Sierra predtým už pracovala na viacerých PC hrách (žánrovo to boli textové a grafické adventúry). V roku 1984 vznikol prvý diel série King´s Quest, prvá 3D adventúra a neskôr pomocou jej enginu vznikali ďalšie populárne hry (Space Quest, Leisure Suit Larry a iné). Séria King´s Quest je zaujímavá aj z iného dôvodu. Hudbu zo štvrtého pokračovania (King´s Quest IV: The Perils of Rosella z roku 1988) zložil známy hollywoodsky skladateľ William Goldstein. Tento titul bol v histórii prvou hrou na počítače, ktorý využil filmového skladateľa, a ako jeden z prvých podporoval zvukovú kartu. Ken Williams, ktorý so svojou manželkou Robertou Williamsovou založil Sierra On-Line, mal dohodnutú spoluprácu s firmami Roland a AdLib, vytvárajúcimi prvé vyspelejšie zvukové karty s technológiou MIDI do počítačov. Spolupráca s filmovým skladateľom bola teda logickým krokom. O rok neskôr k soundtracku do hry Space Quest III pozvali bubeníka Boba Siebenberga zo skupiny Supertramp. Za prvú hru s plnohodnotným soundtrackom (teda s originálnou hudbou na každú úroveň zvlášť) však možno považovať Marble Madness (1984, Atari). Mimochodom, King´s Quest IV bola zároveň pravdepodobne úplne prvá hra so ženskou hlavnou hrdinkou.

Spoločnosť IBM nebola jediná na trhu. Do pozornosti sa dostávala aj firma Apple Computer. Tvorca počítača Apple II bol Steve Wozniak, ktorý na Atari vytvoril arkádovú hru Breakout (1976). V programovacom jazyku BASIC vytváral jej počítačovú verziu a do počítača pridal aj reproduktor. Neskoršie verzie tohto počítača mali vylepšený zvuk a podobne ako pri PC existovala možnosť rozšíriť ich o prídavné zvukové zariadenia. Firma Sweet Micro Systems od roku 1981 vyrábala produkty na tvorbu hudby a zvukových efektov, ako aj hlasové čipy. V roku 1983 vydala zvukovú kartu Mockingboard – tá umožňovala programátorom vytvárať komplexné zvuky bez toho, aby zaťažovala procesor. Bola dostupná vo viacerých verziách a mohla byť zapojená do niekoľkých variácií počítača Apple II. Na generovanie zvuku využívala vtedy populárne čipy AY-3-8910 a v niektorých verziách obsahovala aj hlasový čip (napríklad Votrax SC-01). Zaujímavosťou je, že táto zvuková karta mohla byť zapojená tak do zabudovaného reproduktoru priamo v počítači, ako aj do externých reproduktorov (nastavenie je dnes štandardné). Niektoré hry či softvéry dokonca podporovali viac ako jednu takúto zvukovú kartu. Napríklad hra Ultima V (1988, Origin Systems) podporovala až dve, čo dokopy vytváralo možnosť využívať až dvanásť kanálov zvuku (reálne využívala osem). Existovala aj verzia na IBM PC, ale tá podporovala iba jediný softvér – Bank Street Music Writer, teda program na komponovanie hudby. Ešte predtým firma ALF, známa počítačovými syntetizátormi na vytváranie hudby, vyrobila kartu Music Card MC16 (pôvodne ALF´s Apple Music Synthesizer), prvé zvukové prídavné zariadenie na Apple II, ktoré malo svoj vlastný softvér na komponovanie hudby. Bol to pravdepodobne prvý program na Apple, využívajúci GUI (grafické rozhranie). Táto karta sa začala predávať v roku 1979. Neskôr prišli aj ďalšie prídavné zvukové zariadenia a softvéry (napríklad ALF Music Card MC1, American Micro Products Juke Box Synthesizer, Applied Engineering Super Music Synthesizer, Phasor, Alpha Syntauri a i.).

image.png

Obr. 10: Zvukový čip SID

Spoločnosť Commodore bola najväčšou konkurenciou Apple. Jej počítač Commodore 64 (začal sa predávať v roku 1982) bol od začiatku prezentovaný ako zariadenie pre hráčov. Mal zabudovaný čip s názvom SID (Sound Interface Device), vytvorený Robertom Yannesom v roku 1981. Oproti predošlým PSG čipom každý z tónov mohol využívať viacero typov zvukových vĺn (pílovú, trojuholníkovú, variabilnú pulznú, šumovú), tóny mohli byť modulované rôznymi analógovými filtrami a tromi kruhovými modulátormi (ring modulator), pričom obsahoval ADSR na každý kanál zvlášť. Pôsobil tak ako plnohodnotný syntetizátor (obsahoval totiž súčiastky, ktoré boli v reálnych analógových syntetizátoroch, ako napríklad Mini Moog alebo Roland Jupiter 8) a pre mnohých mladých programátorov a hudobných skladateľov bol vstupnou bránou do sveta komponovania hudby. Obsahoval dokonca modulátor náhodných hodnôt, využitý napríklad v hre Times of Lore (1988, MicroProse) tak, že skladby v tejto hre náhodne prehrávali rôzne sekvencie. Hudba preto zaberala veľmi málo miesta.

image.png

Obr. 11: Mikropočítač Commodore 64

V mnohých hrách sa zároveň začali objavovať oveľa plynulejšie prechody medzi jednotlivými úrovňami (napríklad hra Lazy Jones od spoločnosti Terminal Software z roku 1984), pretože zvukový čip dokázal po prechode do inej scény plynule dohrať predošlý takt a napojiť ho na ďalší, ktorý už bol priradený inej miestnosti. SID mnohí považujú za jeden z najlepších čipov 8-bitovej éry a bol dôležitým prvkom aj pri zrode takzvanej „demoscény“ a hudobného žánru chiptune (čipová hudba). Pri komponovaní hudby do hier mohli skladatelia zachádzať do oveľa väčších detailov. Pomocou modulácie šírky pulzu alebo dynamického využívania filtrov vytvárali v hudbe pohyb a oveľa pestrejšie farby tónov (jasná, temná, tlmená, ostrá a i.). Takýto prístup je cítiť v hrách ako Parallax (1986, Sensible Software) alebo Wizball (1987, Sensible Software, v oboch prípadoch bol autorom hudby Martin Galway). Treba si uvedomiť, že v tom čase ešte stále museli skladatelia hudbu programovať. Niektorí skladatelia doteraz využívajú pri tvorbe hudby Commodore 64. Okolo roku 2000 napríklad vznikol Prophet64, špeciálny kartridž obsahujúci softvérové rozšírenie počítača Commodore 64. To z neho vytvorilo plnohodnotný monofónny syntetizátor a sekvencer.

S 80. rokmi je spojený aj počítač ZX Spectrum, vyrábaný spoločnosťou Sinclair. V Anglicku mal pôsobiť ako konkurencia Commodoru, hoci zo zvukovej perspektívy nebol ani zďaleka taký pokrokový. Prvý model vyrábaný v roku 1982 mal podobne ako počítač od IBM iba PC speaker a vydával iba zvuky pípania. Rozšírené zvukové vlastnosti mal až ZX Spectrum 128K z roku 1985, ktorý využíval klasický čip AY-3-8912, produkujúci trojkanálový zvuk. Tento počítač nemal vlastný reproduktor, ale zvuky vychádzali priamo z reproduktorov na TV. Firmám Commodore a Sinclair sa v 80. rokoch snažila konkurovať aj firma Amstrad, ktorá predtým obchodovala s lacnými hi-fi produktmi do domácností. Prvý domáci počítač tejto spoločnosti bol Amstrad CPC 464. Mal vstup na joystick, kazetovú mechaniku, vlastný monitor a bol kompatibilný s mnohými hrami na Commodore, ZX Spectrum a podobne. Jeho zvuk bol však generovaný rovnakým čipom ako Spectrum, teda AY-3-8912. Mal zároveň zabudovaný reproduktor s vlastným ovládaním hlasitosti. Neskoršie verzie mali štandardný jack (typ konektoru) na slúchadlá alebo externé reproduktory.

Postupne sa do popredia dostávali domáce konzoly. Z pohľadu estetických a technických obmedzení bol zvuk viac-menej na rovnakej úrovni. Technické obmedzenia však paradoxne v mnohých prípadoch vytvárali podmienky na to, aby vznikali originálne hry a koncepty. Podobne to bolo aj so slučkovaním: na jednej strane to bol logický krok pri vytváraní hernej hudby a prechodov medzi jednotlivými lokáciami, na druhej strane nutnosť spôsobená snahou o šetrenie miesta, ktoré na herných zariadeniach zaberal zvuk a hudba. Práca s technológiou sa zdokonaľovala: zvuk a hudba zo starších hier bola neporovnateľná s neskoršími hrami, hoci využívali tie isté zvukové čipy. Ďalšia evolúcia domácich herných konzol a počítačov spôsobila okrem iného aj to, že arkádové automaty začali strácať dych – hráči jednoducho už nemali toľko dôvodov chodiť do herní, pretože všetko, čo potrebovali, mali doma.

Rotoskopia

Snaha docieliť čo najrealistickejšie zobrazenie prostredia a charakterov siaha ešte do obdobia pred rozšírením detailnej trojrozmernej grafiky a súvisí s postupmi, ktoré na vytváranie súčastí scény využívali priamy transfer vizuálnych podkladov získaných v reálnom svete. Existuje hneď niekoľko spôsobov, akým tvorcovia hier digitalizovali realitu. Jedným z nich je prevod fotografií, ktoré slúžili ako súčasti množstva hier už od ranej 8-bitovej éry. Napríklad Artworx Strip Poker (1982) alebo Samantha Fox Strip Poker (1986) obsahovali digitalizované fotografie populárnej speváčky. Miera skreslenia spôsobená nízkym rozlíšením a farebnosťou mala síce ďaleko k detailnosti fotografie, no proporčne a svetelne takto vytvorené grafiky aj tak vyzerali oveľa realistickejšie než digitálne kresby z tohto obdobia. 

Neskôr sa hry pokúsili preniesť do digitálneho prostredia aj zaznamenaný pohyb vo forme transferu jednotlivých fáz pohybu do plynulej animácie. Tento princíp nazývaný rotoskopia predtým dlhé roky využívali animované filmy, v ktorých kresliči kopírovali polohy tela z políčok filmového pásu do požadovaného vizuálneho štýlu a následne ich umiestňovali na statické pozadie filmov. Najznámejšími príkladmi sú filmy Snehulienka a sedem trpaslíkov (1937), Popoluška (1950) alebo Pán prsteňov (1978). 

Princíp animácie tvorenej rotoskopiou naplno vyžila arkádová hra Dragon´s Lair (1983), ktorá pozostávala z animovaných pasáží uložených vo forme videa na laserovom disku. Vizuálna prepracovanosť tejto hry však, žiaľ, bola kompromisom na úkor hrateľnosti a interaktivity, keďže hra bola skôr interaktívnym filmom (o nich si povieme ešte neskôr). Medzi plnohodnotné hry, ktoré rotoskopiu využili pri tvorbe prirodzene sa pohybujúcich postáv, patria napríklad Karateka (1984) Prince of Persia (1989), Another World (1991), Flashback (1992) alebo hra Mortal Kombat (1992), ktorá sa práve vzhľadom na realistickosť zobrazeného násilia stala predmetom jedného z prvých súdnych sporov súvisiacich s digitálnymi hrami.

image.png

Obr. 12: Rotoskopické podklady animácie z hry Prince of Persia

16-bitový zvuk

Jedným z podstatných faktorov ovplyvňujúcich zvuk v takzvanej 16-bitovej ére bolo rozšírené využívanie FM syntézy, teda frekvenčnej modulácie, ďalšieho zo spôsobov generovania zvuku. Jeho podstatou je proces, pri ktorom je frekvencia a výška jednej zvukovej vlny modulovaná oscilovaním iného zvukového signálu, resp. zvukovej vlny, čím sa vytvárajú veľké možnosti v zafarbení zvuku. Technológiu ako takú vynašiel už okolo roku 1968 John Chowning, ale spopularizovala ju až spoločnosť Yamaha. Tá začala FM syntézu aplikovať vo svojich syntetizátoroch – najslávnejším z nich bol typ Yamaha DX7 z roku 1983. Využíval polyfóniu 16 zvukov a mal 32 algoritmov generujúcich zvuk, z ktorých každý mal iné nastavenia vstavaných šiestich sínusových operátorov. Tento syntetizátor bol zvlášť populárny medzi hudobníkmi a populárna hudba 80. rokov je do veľkej miery ovplyvnená jeho zvukom. Pracovali s ním napríklad A-ha, Whitney Houston či Phil Collins. Producent a skladateľ Brian Eno dokázal zo zložitých a hĺbkovo nastaviteľných možností tohto syntetizátora vyťažiť viac než len podklady popových piesní a jeho zvuk bol jeden z prvkov, ktoré následne ovplyvňovali hudobný žáner ambient.

Relatívnou výhodou FM syntézy je fakt, že tento proces je v teórii schopný napodobniť takmer akýkoľvek zvuk alebo hudobný nástroj. V realite to občas vyzeralo skôr naopak – nástroje sa podobali, ale zneli veľmi umelo. To ale nebránilo priemyslu prispôsobiť sa. Yamaha čoskoro začala súčiastky upravovať a vyrábať ich zmenšené verzie. Tie sa v priebehu krátkeho času dostali do množstva zariadení – počnúc detskými hračkami až po herné konzoly či zvukové karty. Vo väčšine týchto prístrojov sa využíval čip s názvom Yamaha YM2151 (známy aj ako OPM). Mal osem zvukových kanálov a štyri operátory. V hernom priemysle sa prvýkrát využil v arkádovom automate s hrou (už vyššie spomínanou) Marble Madness, neskôr v automatoch Sega, Konami, Capcom alebo Namco. V týchto strojoch sa ale FM čipy často kombinovali s PCM moduláciou a hlasovými čipmi.

Jedna z prvých významných herných konzol z tejto éry bola Sega Genesis (resp. Mega Drive, ako sa nazývala mimo Spojených štátov Amerických). Spoločnosť Sega mala najväčší úspech s arkádovými automatmi a v konzolovej verzii jednoducho prispôsobila technológie, ktoré dovtedy využívala. Konzola kombinovala čip PSG (SN76489, teda tri zvukové kanály plus jeden šumový), slúžiaci na niektoré hudobné časti a zvukové efekty, ako aj novší čip s FM moduláciou od Yamahy (YM 2612). Ten mal šesťkanálový stereo zvuk a jeden PCM samplovací kanál. Kombinácia týchto dvoch prvkov spôsobila, že zvuk Segy bol oveľa komplexnejší, ako napríklad zvuk konzoly Nintendo. 

Pravdepodobne najznámejšou hrou na túto konzolu bol Sonic the Hedgehog (1991). Aj keď sa hudba dala komponovať stále iba manuálnym programovaním, pri tomto titule vznikla (podobne ako pri Super Mario Bros) doteraz rozpoznateľná a ikonická hudba, ako aj zvukové efekty. Efekt zdvihnutia jedného z množstva prsteňov, ktoré zbiera Sonic, je zámerne dosť podobný zvuku mince, ktorú zbiera Super Mario – aj napriek tomu sú oba tieto zvuky zreteľne odlišné a originálne. 

Ďalší evolučný krok v konzole Sega Genesis predstavoval spomínaný PCM samplovací kanál navyše. Krátke zvukové efekty a útržky hlasov začali byť oveľa realistickejšie vďaka zlepšujúcej sa technológii samplovania. To predstavovalo využívanie útržkov reálnych zvukov, ktoré mohli byť následne prehrávané späť. Tento postup mal korene už v takzvanej musique concrète (konkrétnej hudby) v 40. rokoch 20. storočia, keď sa začalo experimentovať so strihaním a slučkovaním magnetickej pásky. Samplovanie, ako ho poznáme dnes, sa však začalo využívať až v 70. rokoch. Koncom tejto dekády spoločnosť Fairlight vytvorila digitálny syntetizátor a sampler v jednom s názvom Fairlight CMI. Hoci v dôsledku obmedzenej pamäti dokázal nahrávať zvuky iba do maximálnej vzorkovacej frekvencie 24 kHz a zhruba v dĺžke jednej sekundy, ale aj tak mal veľký vplyv na hudbu. Pointa samplovania spočíva v tom, že takto zdigitalizovaný zvuk/tón je možné vytvárať na celej klávesnici, čomu sa prispôsobuje aj jeho výška a dĺžka (v tom období sa ešte nevyužívala možnosť zachovať výšku zvuku pri jeho skracovaní alebo naťahovaní). To znamená, že čím sa vyššie tóny hrali na klávesnici, tým boli zvuky kratšie, a naopak.

Samplovanie sa vo všeobecnosti spája hlavne so žánrom hip-hop. V 80. rokoch totiž tento žáner začal využívať samplované inštrumenty a beaty z iných skladieb. Syntetizátor Fairlight spopularizoval napríklad aj Peter Gabriel, ktorý vo veľkom využíval vo svojom treťom albume (Peter Gabriel, 1980) a zároveň experimentoval s terénnymi nahrávkami (rozbíjanie skla, údery železnou tyčou a i.), 

Táto technológia do herného priemyslu vošla zhruba v rovnakom období. Už sme spomínali hru Vanguard z roku 1981, ktorá využívala jednoduché útržky slov. Podľa všetkého prvou hrou, ktorá využívala samplované zvuky namiesto tónových generátorov, bola taktiež spomínaná Rally-X. Prvou hrou, ktorá využila digitalizovaný hlas, bola arkádová strieľačka Stratavox z roku 1980 od spoločnosti Taito.

V roku 1985 (resp. 1986) spoločnosť Commodore vypustila do obehu Commodore Amiga 1000, teda nástupcu Commodore 64. Tento počítač sa využíval ako multimediálne zariadenie. Z hľadiska zvuku išlo v podstate o štvorkanálový sampler. Využíval štyri 8-bitové PCM kanály skombinované ako dva stereo kanály (dva vľavo a dva vpravo). Maximálna vzorkovacia frekvencia zvuku bola 28 kHz, čo predstavovalo o čosi vyššiu kvalitu ako syntetizátor Fairlight CMI. O dva roky neskôr nasledovala lacnejšia (a aj vďaka tomu oveľa predávanejšia) verzia Amiga 500 s rovnakými zvukovými vlastnosťami. Na rozdiel od Amiga 1000 bola prezentovaná ako herné zariadenie rovnako, ako aj predošlý počítač Commodore 64, čo z nej urobilo opäť veľmi populárny herný stroj.

Amiga 1000 je dôležitá aj kvôli tomu, že priťahovala hudobných skladateľov  (aj amatérskych). Vo veľkej miere sa začali vyrábať takzvané „trackery“, teda programy určené na komponovanie hudby. Mali špecifické grafické rozhranie, ktoré neskôr ovplyvnilo mnohé iné vyspelejšie softvéry a sekvencery (podobné zvislé zobrazenie má vo svojom „session view“ napríklad jeden z najpopulárnejších DAW, v súčasnosti Ableton Live). Boli založené na zvislom zobrazení viacerých zvukových stôp. V každej z nich sa nachádzali riadky, do ktorých sa mohli zapisovať rôzne informácie – ktorý zvuk prehrať, jeho hlasitosť, dĺžka, výška a podobne. 

image.png

Obr. 13: The Ultimate Sound Tracker

Prvým z takýchto programov bol Ultimate SoundTracker, naprogramovaný Karstenom Obarskim a vydaný v roku 1987. Pôvodne bol vyvíjaný ako nástroj na prácu so zvukom do hier. Jeho neskoršie verzie boli prístupnejšie pre širšiu verejnosť – skupina programátorov The Jungle Command vytvorila program Soundtracker II a v roku 1989 švédski programátori Pex Tufvesson a Anders Berkeman vypustili takzvaný NoiseTracker, ktorý umožňoval využitie až 32 nástrojov a lepšiu prácu s jednotlivými kanálmi. Výhodou takéhoto skladania hudby bolo to, že pomocou príkazov, resp. nôt v jednotlivých riadkoch sa spúšťali rovnaké sample/inštrumenty. Skomponovaná hudba sa potom dala uložiť na obyčajnú disketu. Takto uložený zvuk však nemal rovnaké vlastnosti ako napríklad mp3 alebo wav, ktoré rozoznávame dnes. Súbor z trackera bol v podstate súborom inštrukcií, ktoré zvuky a ako hrať. Na Amige takto vznikol formát súborov MOD. Prvá verzia podporovala iba štyri kanály (v čase, keď sa využíval Ultimate SoundTracker) a pätnásť nástrojov. Neskoršie verzie využívané v množstve ďalších programov boli rozšírené na 32 kanálov a viac ako dvojnásobok inštrumentov. Keďže hudba v takomto formáte nepotrebovala veľa kapacity počítačového procesora (sample boli uložené vo forme umožňujúcej ich okamžité prehratie), množstvo hier tento formát využívalo na sprievodnú hudbu.

Aj keď sa počítače Amiga prestali vyrábať, ostal tento formát živý. Osvojila si ho už vyššie spomínaná demoscéna a veľmi často ho využívali tvorcovia nezávislých hier. Svoje uplatnenie si našiel aj v žánri chiptune. Trackery sa z Amigy presunuli aj do ďalších systémov. Vlastné trackery mal operačný systém DOS na počítačoch IBM, kam sa postupne presunula veľká časť tvorcov hudby (hlavne potom, čo sa začali vyrábať vyspelejšie zvukové karty). Medzi trackery DOS patrí ScreamTracker 3 (1994) alebo FastTracker 2 (1994). Neskôr trackery pokračovali aj na operačných systémoch Windows – populárny bol OpenMPT (1997), Renoise (2002), BeRoTracker, SunVox či ProTrekkr.

V čase najväčšej popularity trackerov sa bežne dali zohnať špecializované zvukové samplery (napríklad Stereo Master, Techno Sound a i.). V takomto balení bola okrem diskety so softvérom aj špeciálna redukcia na jeden z portov Amigy, ktorý mal na sebe konektor v podobe klasického jacku. Do tohto vstupu mohol byť zapojený akýkoľvek hudobný zdroj typu gramofón, CD prehrávač alebo hračkárske klávesy (ak mali audio výstup). Pomocou softvéru si tak používateľ mohol nahrať (samplovať) a vystrihnúť zvuky z akejkoľvek hudby. Takto nahratý zvuk však mohol mať iba pár sekúnd (na viac pamäť nestačila) a musel sa uložiť na separátnu disketu. To však ľuďom nebránilo samplovať obrovské množstvo zvukov a vytvárať tak špecifický elektronický zvuk 90. rokov.

Trackery boli natoľko významné, že nimi zloženú hudbu môžeme počuť aj v známejších hrách. FastTracker 2 bol využitý pri tvorbe hudby do 2D strieľačky Stargunner (1996, Apogee Software), spoločnosť Epic Games využila rovnaký softvér pri skladaní hudby do 3D FPS Unreal (1998) a neskôr do multiplayerového Unreal Tournament (1999). Veľmi známy je príklad MOD hudby v kultovej hre Star Control 2: Ur-Quan Masters (1992, Toys for Bob/Accolade), ktorú zložilo až osem rôznych skladateľov na základe súťaže vyhlásenej vývojármi aj medzi používateľmi Amigy. Formát MOD však vo všeobecnosti nebol veľmi rozšírený. V tomto čase sa totiž dostával do popredia aj formát MIDI, o ktorom píšeme neskôr.

Rýchlosť a detail

Pixel je označenie jedného svetelného bodu na obrazovke. Farebné pixely sú väčšinou kombináciou troch malých bodov v červenej, modrej a zelenej farbe, ktoré svietia rôznou intenzitou a určujú výsledný odtieň a jas daného bodu. Sieť pixelov sa nazýva raster a jeho celkovú podobu definuje prichádzajúci videosignál, ktorý určuje, aké hodnoty majú mať jednotlivé pixely pri aktuálnom obraze. Ten sa mení v intenzite, ktorá sa postupom času zvyšovala, aby bolo možné vnímať úplne plynulý pohyb. Filmový projektor na vnímanie plynulého pohybu striedal obrázky rýchlosťou 24 snímok za sekundu (frames per second, fps). 

V kompetitívnych hrách, kde je dôležité okamžite reagovať, sa vyššia rýchlosť zobrazovania snímok (framerate) považuje za kompetitívnu výhodu. Dnes sú monitory schopné zobrazovať snímky rýchlosťou 144, 288 za sekundu aj viac, pričom pred rozvojom kompetitívneho hrania zvyčajne postačovala obnovovacia rýchlosť 60 snímok za sekundu, ktorú zaviedli televízne prijímače a ktorá vychádza z kmitočtu striedavého prúdu v elektrickej sieti. Pri zobrazovacích zariadeniach sa tento údaj uvádza často v hertzoch (Hz), pričom toto číslo predstavuje maximálnu schopnosť obnovovania obrazu. Reálny počet zobrazených fps závisí od signálu, ktorý produkuje grafický procesor s limitovaným výkonom, a tiež oneskorenie, s akým monitor generuje prijatý signál (tzv. delay time). 

Ak majú nastavenia hry vyššie požiadavky, než aké dokáže zabezpečiť hardvér, dochádza k tzv. sekaniu, pri ktorom je vynechaná časť snímok, ktorých absencia viditeľne narušuje plynulosť vnímaného pohybu. V určitej miere to býva pre ľudské oko znesiteľné, no pri prekročení tejto miery negatívne ovplyvňuje kvalitu herného zážitku. Pri kompetitívnych hrách môže takéto sekanie predstavovať pre hráča značnú nevýhodu. 

image.png

Obr. 14: Porovnanie štandardizovaných zobrazovacích rozlíšení a ich stranových pomerov

Ploché televízory, ktoré sme spomínali ako nástupcov CRT, fungujú na princípe podsvietených tekutých kryštálov (Liquid Crystal Display, LCD), neskôr nahradených mikroskopickými diódami (Light-Emiting Diode, LED). Ako sa jednotlivé elementy zmenšovali, zvyšovala sa ich hustota (Dot per inch, DPI) a rozlíšenie pri zachovaní alebo zmenšení rozmerov obrazovky (napríklad na mobilné telefóny alebo VR headsety).

Rastúci počet zobrazovaných pixelov a zrýchlenie zobrazovacej frekvencie vytvárali postupne čoraz väčšie nároky na operačný výkon, a preto postupne vznikali časti počítačov dedikované generovaniu grafiky. V súčasnosti pri herných počítačoch schopných dosiahnuť najdetailnejšiu grafiku rozhoduje predovšetkým výkon grafického procesora. Ten je zvyčajne umiestnený ako samostatná karta v zostave, ktorá často disponuje aj vlastným chladením. Tento trend začal byť badateľný hlavne s príchodom trojrozmernej grafiky, pri ktorej dokázala grafická karta kalkulovať s rôznymi efektmi, čím výrazne uľahčovala prácu hlavného procesora. 

V počiatkoch herných zariadení bol hardvér často špecificky vytváraný tak, aby čo najefektívnejšie využil dobové technologické obmedzenia. Príkladom sú herné arkády, ktoré obsahovali rozsiahle plošné spoje na každú hru, pričom spoločné mali len napájanie a prepojenie vstupných a výstupných signálov. S rozšírením domácich konzol a počítačov vyvstala potreba využívania jednotnej techniky na spúšťanie rozličných hier, a tak začali vznikať štandardy, ktoré definovali limity pre vývojárov týchto hier. V období pred vznikom a rozšírením grafických kariet tieto limity definovali mikroprocesory. Ich hlavný rozmach možno datovať do obdobia 80. rokov, keď vznikli masovo rozšírené modely Intel 8008 (a jeho kópie), resp. jeho lacnejší nasledovníci MOS 6502 a Zilog Z80. Tieto procesory poháňali napríklad Atari 2600, Nintendo Entertainment System (NES), Commodore 64 a mnohé arkádové hry. Iným významným radom boli procesory Motorola 68xxx, použité v konzolách Sega Genesis a Mega Drive.

Tieto mikroprocesory boli schopné spracovať výpočty na zobrazenie grafického výstupu v základných farbách s rozlíšením definovaným televíznym prijímačom, vychádzajúcim z parametrov formátu TV vysielania, ktoré bolo optimalizované na určitý počet riadkov signálu (720 × 480 formátu NTSC pre USA a Japonsko, resp. 720 × 576 vo formáte PAL pre zvyšok sveta). Toto rozlíšenie využívali všetky zariadenia, ktoré sa pripájali k zobrazovacím zariadeniam prostredníctvom frekvenčne modulovaného video signálu. Ten bol privádzaný jednoduchým koaxiálnym káblom z antény podobne ako televízny signál (hru bolo potrebné naladiť na špecifickej frekvencii podobne ako televízny kanál) a neskôr prostredníctvom kompozitného videosignálu a separátneho audio signálu cez RCA alebo multifunkčné SCART konektory.

Zobrazovanie detailnejšieho obrazu priniesli až počítačové monitory s prepojením, v ktorom boli samostatne definované informácie jednotlivých farebných kanálov v kombinácii s údajmi o svetelnosti obrazu. V ranej histórii vývoja osobných počítačov boli jednotlivé súčasti štandardne dostupné vo forme rozširujúcich kariet, z ktorých bolo možné poskladať počítač s požadovanou funkcionalitou. Prvé samostatné grafické karty, ktoré umožňovali vykresľovať vizuálne elementy nad rámec textových znakov, boli jednofarebné karty MDA (Monochrome Display Adapter) a farebné karty CGA (Color Graphic Adapter). Rozšírenejšie funkcie priniesol v roku 1984 systém EGA (Enhanced Graphic Adapter) spolu aj s novým radom počítačov IBM AT. Grafické karty už boli schopné vykresľovať 16 farieb z fixne definovanej palety a zároveň sa rozšírila pamäť (64 – 256 kB, oproti 4 kB pri CGA). 

Ďalším vývojovým krokom bola architektúra VGA (Video Graphic Array), ktorá bola od roku 1987 súčasťou počítačov IBM PS/2. Monitory sa k nej pripájali štandardizovaným 15-pinovým D-SUB konektorom prenášajúcim obraz bez zvuku, ktorý sa masovo využíval až do príchodu konektorov DVI a HDMI. Karty boli schopné zobraziť 262 144 (18-bit) farieb, pričom štandardne operovali len s paletou 16, resp. 256 farieb pri rozlíšení 640 × 480, resp. 320 × 240 pixelov. 

Štandard VGA sa na dlhé roky stal povinným minimom vo všetkých osobných počítačoch, pričom rozlíšenie a farebná hĺbka postupne narastala. To viedlo ešte v roku 1988 k definovaniu ďalšieho všeobecne rozšíreného formátu Super VGA (SVGA) s maximálnym rozlíšením 800 × 600 pixelov a XGA s rozlíšením 1024 × 768. Všetky spomínané rozlíšenia sú optimalizované na zobrazovanie grafiky na monitoroch s pomerom strán 4 : 3, ktorý bol štandardom všetkých CRT, ale aj prvých monitorov LCD. Dnes sa tieto rozlíšenia často súhrnne označujú za SD (Standard definition) v kontraste k neskorším širokouhlým formátom HD (High definition), ktorých pomer strán je najčastejšie 16 : 9.

DSP a Wavetable syntéza

Po úspechu Sega Genesis sa do konkurenčného boja dostala opäť aj spoločnosť Nintendo. V roku 1990 bol v Japonsku spustený predaj konzoly Super Famicon a v roku 1991 predaj u nás oveľa známejšej verzie SNES (Super Nintendo Entertainment System). Táto konzola využívala iba jediný zvukový čip s názvom S-SMP, produkovaný spoločnosťou Sony. Zaujímavosťou je, že fungoval nezávisle od všetkých ostatných systémov v konzole. V tomto čipe sa nachádzal separátny 8-bitový procesor (Sony SPC-700), 16-bitový digitálny signálový procesor (DSP, ktorý sa správal v podstate ako syntetizátor wavetable), 16-bitový prevodník DAC a 64 kB pamäte typu SRAM (static random-access memory). Bol schopný produkovať 8-kanálový stereo zvuk, využíval 8-bitové zvukové sample, ale predovšetkým pomocou jednotky DSP mohol pridávať niekoľko typov audio efektov. Hoci konzola SNES bola po zvukovej stránke technologicky vyspelejšia, jej zvukový a hudobný štýl paradoxne často pripomínal skôr klasickejší zvuk, tzn. evokujúci 8-bitovú éru. Napriek tomu veľa hier vzniklo na túto konzolu, využívajúcich mená slávnych hercov, a teda aj hudbu z ich natočených filmov. Len meno Sylvester Stallone evokuje hneď niekoľko titulov vydaných na túto konzolu – Cliff Hanger (Sony, 1993), Demolition Man (Acclaim, 1995) alebo Judge Dredd (Acclaim, 1995). Zároveň sa výraznejšie začali využívať modernejšie postupy s adaptívnou hudbou. V hre Super Mario World (Nintendo, 1990) sa napríklad hudba dynamicky prispôsobuje na základe toho, ako sa Mario pohybuje. Keď vyskočí na Yoshiho chrbát, do sprievodnej melódie sa plynule pridá ďalšia vrstva (rytmická perkusia) a pôsobí ako prirodzená súčasť pôvodnej skladby. Tento proces pripomína takzvanú vertikálnu orchestráciu, teda jeden zo spôsobov, ako sa herní hudobní skladatelia vyrovnávajú s adaptívnou hudbou. V Super Mario World je zároveň zreteľne počuť využívanie DSP procesora – keď Mario skočí cez rúru do niektorej z podzemných lokalít, všetky zvuky (skákanie, zbieranie mincí) majú aplikovaný dozvuk (reverb), simulujúci ozvenu v jaskyni/kanáli. Mnohé z hier začali taktiež využívať kompozičné postupy pripomínajúce skôr filmovú hudbu (napríklad dodnes neuveriteľne obľúbený Chrono Trigger či Final Fantasy II a III od spoločnosti Square) a hlasové efekty boli na vysokej úrovni (napríklad v hre Super Punch-Out z roku 1994).

image.png

 Obr. 15: Vizualizácia zvukovej vlny pomocou wavetable syntézy v programe Ableton Live 10

Napriek tomu, že sme v úvode do 16-bitovej éry začali konzolou Sega Genesis, treba spomenúť, že úplne prvou 16-bitovou konzolou bola PC Engine od spoločnosti NEC Home Electronics, neskôr známa hlavne pod názvom TurboGrafx-16. Jej predaj sa začal v roku 1987 a hoci v Japonsku veľmi úspešne konkurovala Super Famicomu, vo zvyšku sveta sa jej nedarilo. Jej zvukový hardvér bol zabudovaný priamo do jednotky CPU s názvom HuC6280 a obsahoval jeden zvukový čip PSG a dva 5-bitové stereo moduly PCM, ktoré ale mohli v kombinácii prehrávať 10-bitové sample PCM. Podobne ako Super Nintendo, aj tento čip využíval na generovanie zvukov syntézu wavetable (tej sa venujeme nižšie). Obsahoval šesť zvukových kanálov generujúcich tvar zvukových vĺn, kontrolujúcich ich frekvencie a intenzitu. Posledné dva kanály boli pripojené ku generátoru bieleho šumu a jeden z nich mohol zároveň pôsobiť ako LFO. Zaujímavé je, že na túto konzolu bolo vyrobené veľké množstvo prídavných zariadení. Jedno z nich bolo CD-ROM2, čo z TurboGrafx-16 urobilo prvú konzolu umožňujúcu prehrávať dáta z CD už v roku 1988. Podobné prídavné zariadenie (Sega CD, resp. Mega CD) bolo napríklad predávané ku konzole Sega Genesis od roku 1991.

V roku 1990 sa začala v Japonsku predávať ešte jedna konzola – Neo Geo AES od spoločnosti SNK Corporation. Táto spoločnosť bola známa predovšetkým pre svoje arkádové automaty a konzola Neo Geo AES bola v podstate ich zmenšenou verziou. Hovorí sa o nej ako o „najznámejšej konzole, ktorú takmer nikdy nikto nevlastnil“. Problém spočíval v tom, že bola oproti ostatným veľmi drahá a samotné kartridže s hrami taktiež. Výsledkom bolo, že aj zmenšenú verziu Neo Geo sme namiesto domácností mohli nájsť skôr v špecializovaných obchodoch, hoteloch a podobne. Aj napriek tomu však treba dodať, že na rozdiel od konkurenčných konzol mala značne pokročilú grafiku a zvuk. Mala zabudovaný pätnásťkanálový zvukový čip Yamaha YM 2610, štyri súbežné FM kanály so štyrmi operátormi v každom z nich, tri čipy PSG, jeden programovateľný šumový kanál, sedem kanálov PCM, jeden kanál LFO a špeciálnu pamäť Sound ROM a Work ROM, určenú iba na zvuk. Už len na základe týchto zvukových špecifikácií sa dá sledovať značný rozdiel oproti konkurencii. Paradoxné je, že aj napriek relatívnej nedostupnosti tohto systému to bola 16-bitová konzola, ktorá mala najdlhšiu životnosť a niektoré z jej hier sú doteraz považované za klasiku (napríklad Metal Slug, Magician Lord, Samurai Showdown, Blazing Star alebo
Garou: Mark Of The Wolves).

Medzi pokrokové postupy, ktoré sa rozšírili v ére 16-bitových herných zariadení, patrí využívanie digitálnych signálových procesorov (DSP) a ďalší druh syntézy na generovanie zvuku – wavetable.

image.png

Obr. 16: Kompresor Izotope Neutron 3

Táto syntéza sa začala využívať prvýkrát v 16-bitových konzolách, ale v hudbe sa do popredia dostávala v 70. rokoch 20. storočia. Vo svojich syntetizátoroch ju vo väčšej miere implementovala spoločnosť PPG (Palm Products GmbH) a prvý syntetizátor využívajúci túto technológiu bol Wavecomputer 360 z roku 1980. Spopularizovala ju ale až jeho ďalšia verzia Wave 2 z roku 1981 – obsahovala analógové krivky, oscilátory LFO, filtre a digitálne wavetable oscilátory. Výhodou bolo, že oproti tradičným syntetizátorom Wave 2 ponúkal 64 voliteľných zvukových vĺn, ktoré mali až 30 variácií. Znamená to, že pri každom oscilátore bolo možné zvuk generovať až pomocou 1 920 zvukových vĺn. Rovnako ako syntetizátor DX7, tak aj túto technológiu okamžite začali využívať hudobníci. Na začiatku to boli hlavne nemeckí Tangerine Dream, ale neskôr aj popové hviezdy ako David Bowie, Depeche Mode, Jean-Michel Jarre, Tears For Fears, Gary Numan, Ultravox či Steve Wonder. Moderným prvkom tohto zariadenia bola výmena klasických tlačidiel a ťahacích potenciometrov za kontrolný panel s LCD displejom a otočnými potenciometrami, ktoré dnes vídame na každom takomto zariadení alebo na MIDI kontroléri. 

Ďalšou veľkou firmou využívajúcu túto technológiu bola spoločnosť Waldorf. Popri konkurenčnom súboji 16-bitových domácich konzol sa na rozmedzí 80. a 90. rokov nenápadne – ale o to významnejšie – vyvíjala nová generácia zvukových kariet do počítačov. V tomto čase bolo stále pomerne náročné skladať hudbu a zvuky do digitálnych hier, pretože existovalo veľké množstvo typov zvukových čipov, rôznych zvukových syntéz a separátnych technologických prvkov. Tie musel skladateľ všetky študovať a poznať. Ešte vždy sa stávalo, že rôzne konzoly reprodukovali zvuk rôznym spôsobom – inými slovami, tvorba audia do hier nebola štandardizovaná.

Prvá populárna a rozšírená zvuková karta na počítače sa volala AdLib (s celým názvom AdLib Music Synthesizer Card) z roku 1987. Prvá hra s podporou tejto karty bola už predtým spomínaná King´s Quest IV od Sierra Online. Karta využívala čip Yamaha YM 3812 a generovala 11-kanálový zvuk na princípe FM syntézy. Spolu s kartou dostali používatelia aj softvérový MIDI sekvencer Visual Composer na skladanie hudby a program Instrument Maker, využívajúci FM syntézu na tvorbu zvukov a nástrojov. Skoršia verzia mala zabudovaný zvukový výstup v podobe ¼-palcového jack konektora, určeného pre hudobníkov. Ďalšia verzia tejto karty z roku 1990 však už začala využívať dnes úplne štandardný 3,5 mm mono jack. V roku 1992 spoločnosť vydala svoju poslednú zvukovú kartu AdLib Gold 1000 s možnosťou pripojenia priestorového efektu (surround effect). V tom čase sa však na scénu dostala spoločnosť Creative Technology, resp. Creative Labs, ktorá konkurenciu doslova prevalcovala.

Na prelome rokov 1987 a 1988 sa na trhu objavila zvuková karta Creative Music System, zakrátko premenovaná na Game Blaster. Na rozdiel od karty AdLib mala 12 kanálov a stereo výstup, ale využívala dva staršie PSG čipy s názvom Philips SAA1099, a preto produkovala v podstate iba štvorcové vlny a biely šum. Skutočný úspech firma Creative zaznamenala až s kartou Sound Blaster v roku 1989. Na produkovanie zvuku využívala rovnakú technológiu ako konkurenčná AdLib (11-kanálový FM zvuk a čip Yamaha YM 3812), avšak navyše mala mikrokontrolér (malý čip), umožňujúci prehrávať 8-bitové digitálne sample a ADPCM formát. Množstvo hier takúto konfiguráciu využívalo tak, že pomocou FM syntézy sa vytvárala hudba a pomocou digitálnych samplov zase zvukové efekty – kvôli tomu, že hudba zaberala v takomto formáte oveľa menej. Na tejto zvukovej karte sa taktiež prvýkrát samostatne objavil vstup typu game port – ten sa využíval na pripojenie joysticku. Aj tu je vidno, že karta Sound Blaster (ako aj Game Blaster) sa vyvíjala s dôrazom na herný aspekt. Úspech a eventuálnu kontrolu trhu potom karte Sound Blaster zabezpečila aj oveľa nižšia cena a zároveň plná kompatibilita s kartou AdLib. To znamenalo, že všetky hry, ktoré sa vyvíjali na AdLib, fungovali aj na karte Sound Blaster. Pred spustením hry sa zvyklo na obrazovke počítača otvoriť okno, v ktorom si používateľ mohol vybrať z viacerých možností, resp. názvov zvukových kariet. Podľa toho následne hra reprodukovala zvuk. Na výber bolo často aj 4-5 možností (žiadny zvuk, základný PC speaker, Tandy 1000, AdLib, Sound Blaster a i.).

V roku 1992 vydala spoločnosť Advanced Gravis Computer Technology zvukovú kartu Gravis UltraSound. Bola to jedna z prvých kariet s wavetable syntézou, a teda mala možnosť prehrávať realistické zvuky. Ako jedna z prvých tiež mala 16-bitový a 44,1 kHz stereo zvuk, čo predstavuje štandardnú CD kvalitu. Používala proprietárny čip GF1, ktorý podporoval aj formáty MOD a MIDI. Namiesto pamäti ROM zvuky nahrával do pamäte RAM (random access memory). Paradoxne však tento čip nepodporoval FM syntézu, takže nebol kompatibilný s množstvom súdobých hier. Aj preto táto kvalitná zvuková karta ostala využívaná hlavne hudobníkmi, ktorí skladali hudbu vo formáte MIDI pod operačným systémom Windows.

Roland MT-32 od firmy Roland sa začal predávať v roku 1987 a predstavoval v podstate 32-kanálový MIDI syntetizátor. Pôvodne bol prezentovaný ako prístroj určený pre hudobníkov, avšak jeho kompatibilita a pripojiteľnosť k počítačom z neho neskôr vytvorila štandard na tvorbu počítačovej hudby. Využíval wavetable syntézu v kombinácii so subtraktívnou syntézou. 

image.png

Obr. 17: Zvuková karta Roland MT-32

Subtraktívna syntéza predstavuje formu vytvárania zvuku na základe filtrov – na zvukové vlny je aplikovaný jeden alebo viacero filtrov, čiže ekvalizérov, ktoré zvýrazňujú, resp. utlmujú niektoré z frekvencií. MT-32 mal zabudovanú knižnicu s vlastnými zvukmi a digitálny dozvuk. Už viackrát spomínaná hra King´s Quest IV využívala naplno tieto kvality a neskôr k nej pribudli aj ďalšie (za všetky napríklad Police Quest, Space Quest III, Prince of Persia, 7th Guest, Beneath a Steel Sky, Mortal Kombat, Dragonsphere, Jurassic Park, Master of Orion, mnohé hry zo série Might and Magic alebo Monkey Island 2, o ktorej ešte budeme písať). Cena Rolandu však bola vzhľadom na konkurenciu niekoľkonásobná. Aj to spôsobilo, že zariadenie MT-32 neskôr ostalo hlavne v domácnostiach takzvaných „hi-end“ hráčov, teda takých, ktorí si potrpeli na kvalitu zariadení bez ohľadu na ich cenu. MT-32 využívali na prehrávanie hudby a zvukovú kartu Sound Blaster na reprodukovanie zvukových efektov. Zvukové karty na počítače sa rozvíjali aj v integrovaných zariadeniach. V 90. rokoch 20. storočia začali výrobcovia domácich počítačov inštalovať vstavané zvukové čipy s audio kodekmi (na kódovanie či dekódovanie zvuku), zabudované priamo do základných dosiek. Množstvo z nich využívalo štandardný audio kodek AC´97 od spoločnosti Intel. Začiatkom 21. storočia sa na základných doskách začali objavovať vstavané plnohodnotné zvukové karty, postupne s vylepšeným HD audio štandardom, taktiež od Intelu. 

Vráťme sa však k opakovanému pojmu MIDI. Ten je dôležitý aj kvôli tomu, že v 80. rokoch bolo stále veľmi komplikované skladať hudbu do digitálnych hier. Zvukové karty a rôzne typy zvukových čipov v konzolách spôsobovali, že neexistoval jednotný systém či spôsob, ktorým by sa dalo pracovať v rámci viacerých platforiem alebo zariadení. To znamenalo, že rovnaký súbor znel vždy rozdielne na rôznych zariadeniach. Na priemernej MIDI kompatibilnej karte znela rovnaká skladba jednoducho a jednotlivé zvuky pôsobili zredukovane. Keď sa napríklad na počítači so zvukovou kartou AdLib spustila hra Doom (1993, id Software), v hudbe sme rozoznávali melódie a rytmus, ale jednotlivé nástroje neboli príliš identifikovateľné a pripomínali skôr štvorcové vlny upravené subtraktívnou syntézou. Ak sa rovnaká hra spustila so systémom Roland MT-32, zrazu sme rozoznávali metalové bicie a gitary.

image.png

Obr. 18: Rôzne typy zvukových kariet pre PC

MIDI v predĺženej forme znamená Musical Instrument Data Interface. Predstavuje univerzálny protokol, ktorý umožňuje prenos digitálnych dát a spôsob na uľahčenie komunikácie medzi rôznymi syntetizátormi a počítačmi. Bol uvedený v roku 1983 a jeho zmyslom bolo hlavne vytvoriť lepšie podmienky na komunikáciu viacerých zariadení vo zvukovom štúdiu, keďže každá firma vyrábala iné typy rozhraní a technológií. V podstate ide o posielanie, resp. výmenu dát, ktoré neprezentujú zvuky, ale skôr inštrukcie k tomu, kedy, ako dlho a s akou intenzitou či výškou treba prehrávať konkrétne zvuky (podobne ako vyššie rozoberaný formát MOD). Každá jedna MIDI nota obsahuje iba tieto informácie a všetko ostatné záleží už iba na tom, s akým zariadením práve pracujeme. Znamená to zároveň extrémne malú veľkosť súborov, čo bolo dôležité vzhľadom na to, že väčšina  hier sa šírila iba na diskete či kartridži s veľmi obmedzenou kapacitou. Prvá zvuková karta do počítačov, schopná pracovať s formátom MIDI, bola Roland MPU-401 z roku 1984. Odvtedy sa MIDI začalo využívať postupne vo všetkých značkách domácich počítačov. Uvedený problém s rozdielnou kvalitou prehrávaných zvukov však spôsobil, že MIDI nie vždy znelo dobre. Na herných konzolách tento problém v takej miere neexistoval, pretože tie využívali rovnaký hardvér. Na počítačoch však mohla rovnaká hra znieť inak od domácnosti k domácnosti.

V roku 1991 spoločnosť Roland prvýkrát prezentovala štandard General MIDI (GM), ktorý čiastočne tento problém riešil (avšak nie na úrovni reprodukovanej kvality zvuku). Problém predošlej verzie MIDI spôsoboval, že skomponovaná skladba v tomto formáte mohla na jednom zariadení v istom momente prehrávať zvuk piana a na druhom napríklad flauty. GM túto otázku vyriešil tak, že štandardizoval presný počet a poradie inštrumentov. Obsahuje banku 128 zvukov a k nim má priradené špecifické číslo. Všetky zariadenia využívajúce tento štandard zároveň musia mať polyfóniu 24 hlasov (resp. zvukov). Súvisí to zároveň aj s ladením zvukov (spomeňme si na problémy s ladením zvukov pri skladaní hudby na starších čipoch PSG). GM stanovoval aj to, že notu stredné C prehráva MIDI nota č. 69 pri štandardnom ladení 440 Hz. Extenzívnejšie využívanie tohto protokolu vyriešilo aj opakovane zmieňovaný problém s komponovaním hudby – skladatelia sa mohli konečne lepšie sústrediť na klasické komponovanie pomocou kláves na rozdiel od predošlých rokov, keď museli v prvom rade vedieť programovať. Keďže prevládal názor, že 128 inštrumentov je nedostatočný počet, po čase sa General MIDI rozšírilo o ďalšie extenzie. Už v roku 1991 vznikol spätne kompatibilný štandard GS (General Standard). Ten rozširoval pôvodný GM o ďalších 98 tonálnych nástrojov, 15 perkusií, 8 typov bicích a tri audio efekty. Yamaha v roku 1994 prišla s rozšírením XG (Extended General MIDI). Počet inštrumentov zvýšila až na 480, pridala 11 druhov bicích a hlavne umožnila oveľa jemnejšie ovládanie rôznych parametrov, vďaka čomu hudobní skladatelia mohli dosiahnuť v skladbách väčšiu realistickosť a detaily. Hoci obe tieto rozšírenia sú spätne kompatibilné s General MIDI, navzájom kompatibilné nie sú. MIDI sa vylepšovalo a rozširovalo ešte viackrát a hoci ho neskôr vystriedali zvukové karty a čipy, pracujúce s reálnymi zvukmi a samplami, využíva sa doteraz.

V súčasnom kontexte môžeme o MIDI hovoriť v rámci DAW (zvukových a hudobných softvérov) ako o spôsobe vytvárania komplexných hudobných kompozícií pomocou digitálnych inštrumentov. VSTi pluginy a samplery dokážu nahradiť v podstate hocijaký inštrument a pomocou zápisu v MIDI editore – tak môžeme na jednom počítači s externou USB zvukovou kartou skomponovať celú symfóniu. MIDI v takomto prípade slúži rovnako – určuje kedy, ako a aký nástroj má hrať. Moderné inštrumenty sú vysoko realistické a jednotlivé nástroje sa nahrávajú väčšinou v profesionálnych štúdiách. Tie kvalitnejšie dokonca s takým dôrazom na detail, že napríklad jedna klávesa klavíra je nahraná v mnohých variáciách intenzity, s možnosťou zapnutia či vypnutia sustain pedálu (ktorý slúži na predĺženie dozvuku tónov) a  podobne. Samozrejme, tu už nemožno hovoriť o  zaberaní malého miesta na disku. Z hľadiska digitálnych hier je to dôležité, pretože hudba sa neskôr začala skladať takmer výlučne pomocou DAW – technológia totiž stále umožňuje jednoduché slučkovanie a v kombinácii s programami tzv. middleware potom vznikajú komplexné adaptívne kompozície. V spojitosti so slučkovaním treba spomenúť aj jeden z technologicky najvýznamnejších programov vytvorených v kombinácii s MIDI – iMUSE.

Hudobný systém iMUSE (interactive Music Streaming Engine) vznikol okolo roku 1991 v spoločnosti LucasArts19. Išlo o doplnok k  ich vlastnému hernému enginu SCUMM (Script Creation Utility for Maniac Man-sion). Pôvodne vznikol z  dôvodu vývoja adventúry Maniac Mansion z roku 1987, následne ho ale v spoločnosti LucasArts začali využívať aj na ďalšie hry (Loom, Day of the Tentacle, Full Throttle, The Dig, hry zo série Indiana Jones a  mnohé iné). iMUSE navrhli hudobní skladatelia Michael Land a  Peter McConnell v  čase, keď vznikala v  LucasArts hra Monkey Island 2: LeChuck´s Revenge (1991). Chceli vytvoriť hudbu, ktorá by lepšie dokresľovala atmosféru a  reagovala na udalosti v  hre. Vychádzali z problému nelineárnosti tohto média – tvorca hry vie, čo sa stane, ale málokedy dokáže predvídať, kedy sa to stane. Rôzne zvukové a hudobné javy v hre (napríklad prechody, tranzície do iných miestností či úrovní) boli často odstrihnuté ostro, nie veľmi esteticky, čo znižovalo imerziu. 

iMUSE tento problém riešil pomocou integrácie sekvencií MIDI, obohatených o  špecifické značky (resp. markery) v rámci kompozície. Tieto body predstavovali ukazovatele „smeru“, ktorým sa hudba mala uberať, pretože neustále snímali stav rôznych parametrov v rámci herného sveta. Keď hráč napríklad klikol na prechod do novej lokácie, hudba bez prerušenia pokračovala ďalej k  najbližšiemu bodu tranzície. Ten trval vždy maximálne 4 sekundy. Systém zvládol aj rýchle striedanie lokácií.

Polygóny a 3D grafika

Väčšina hier, ktoré zobrazovali trojrozmerný svet, využívala rôzne spôsoby práce s dvojrozmernými prvkami, ale už v ére sálových počítačov existovali pokusy o generovanie skutočných 3D modelov. Spočiatku boli pre obmedzenosť svojho výkonu zobrazované len ako tzv. wireframe („drôtený rám“ – typ modelu), ktorý zobrazoval spojnice medzi jednotlivými bodmi kalkulovanými v trojrozmernom priestore. 

Medzi prvé hry disponujúce týmto grafickým zobrazením patrí experimentálny projekt NASA s názvom Maze War (1973), ktorý možno považovať za prvú strieľačku z prvej osoby, a projekt vesmírneho simulátora Spasim (1974), ktorý umožňoval cestovať virtuálnym vesmírom súčasne až 32 hráčom.  Na základe jeho kódu boli neskôr tiež vytvorené hry Airfight (letecký bojový simulátor) a Panther (tankový simulátor). Rozšírenosť pokusov o trojrozmerné zobrazenie v bojových simulátoroch zrejme súvisí s faktom, že veľká časť inovatívnych technologických riešení pochádza z armádneho prostredia (pozri tiež spomínaný Tennis for Two), v ktorom sú virtuálne simulácie dodnes predmetom vysokého záujmu a taktiež poháňajú vývoj zariadení na virtuálnu realitu.

Za prvý úspešný pokus o zobrazenie skutočne trojrozmerných objektov priamo na herné zariadenia možno považovať tankový simulátor Battlezone (1980) od Atari (simultánne vyvíjaný pre armádu pod názvom Bradley Trainer), ktorého pôvodný arkádový automat napodobňoval pohľad cez prirodzene obmedzený výrez periskopu. Medzi ďalšie prelomové arkádové hry využívajúce trojrozmernú vektorovú grafiku patria Tempest (1981) a I, Robot (1984), ktoré na Atari vytvoril Dave Theurer.

Druhá menovaná hra bola vôbec prvou hrou poskytujúcou pohľad z tretej osoby s pohybom kamery a zároveň zobrazovala pomyselné plochy medzi vektormi, vyplnené farbou. Tieto viditeľné plochy prepájajúce tri body, z ktorých pozostávajú trojrozmerné modely, sa nazývajú polygóny. Sústava prepojených polygónov, vytvárajúca trojrozmerný objekt, sa označuje za polygónovú sieť (po anglicky mesh). Ďalšie arkádové hry využívajúce úspešne tento spôsob zobrazenia boli závodné simulátory Hard Drivin’ (1989), Winning Run (1989), Virtual Racing (1992), Ridge Racer (1993) alebo Cyber Sled (1993), fungujúce vďaka obvodom System 21 „Polygonizer“, ktoré spolu vyvíjali spoločnosti Atari a Namco.  

image.png

Obr. 19: Polygónový model hráča v hre Virtua Fighter

Vyfarbovanie plôch jednotlivých polygónov rôznymi farbami sa nazýva renderovanie (vykresľovanie). Algoritmus pri ňom určuje, ktoré pixely v dvojrozmernej ploche zobrazenej monitorom ešte patria do daného polygónu a ktoré už nie. Tento spôsob však pri rôznych uhloch, ktoré nekopírujú postupnosť pixelov v mriežke monitora, vytvára na okrajoch polygónov schodovité, resp. zúbkované útvary, ktoré sú obzvlášť viditeľné pri nižšom rozlíšení generujúcom väčšie pixely. Na zjemnenie týchto prechodov vzniklo niekoľko postupov súhrnne nazývaných anti-aliasing (zarovnávanie hrán). Ich aplikáciou sa na miestach, kde polygóny „zdieľajú“ pixely, vypočítava farba, ktorá sa nachádza na škále medzi farbami susediacich plôch. V dôsledku pomerne vysokej náročnosti pri ich digitálnom vykresľovaní (vektorové hry dokázali čiastočne fungovať aj na analógových postupoch a arkádové automaty obsahovali obvody špecificky vytvorené na dané hry) sa dostali hry obsahujúce komplexnejšie objekty vytvorené polygónmi do prostredia domácich herných zariadení až podstatne neskôr. Za prvé úspešné pokusy možno považovať hry Star Fox (1993) herného systému SNES so samostatným grafickým čipom SuperFX a Virtua Fighter (1994) na konzolu SEGA Saturn, ktorá tiež obsahovala samostatný procesor na vykresľovanie grafiky.  Niektoré hry využívali okrem modelov kalkulovaných v reálnom čase aj vopred renderované trojrozmerné animácie (tzv. pre-renderovanie), ktoré boli prevedené do podoby dvojrozmerných sprajtov. Takýto proces animácie bol pre samotných vývojárov veľmi zdĺhavý a náročný. Ikonická hra, ktorá pracovala práve so zobrazením trojrozmerných objektov v dvojrozmerných svetoch, je hra Donkey Kong Country (1994). Jej vzor nasledovali mnohé ďalšie „skákačky“ ako Toy Story (1995) či Sonic 3D Blast (1996), alebo bojové hry Killer Instinct (1994) a Rise of the Robots (1994). Napriek tomu, že v jednotlivých situáciách obraz pôsobil dojmom, že obsahuje trojrozmerné modely, išlo stále o dvojrozmerné modely pohybujúce sa v dvojrozmernom priestore. Ďalšie rozšírené využitie prerenderovania sa objavilo v tzv. cut-scénach, ktorých priebeh neovládal hráč. Vznikali formou animácie, ktorá nezaťažovala procesor výpočtom geometrie, iba zobrazovala dvojrozmerný záznam jeho výsledkov. Obrázky z týchto častí hry sa často používali pri propagácii hier, čo niekedy vyvolávalo mylnú predstavu o tom, ako vyzerá prostredie danej hry pri jej hraní. 

Širšie osvojenie interaktívnej polygonálnej 3D grafiky priniesli až konzoly piatej generácie ako Nintendo 64, Sega Saturn a najmä Sony Playstation, a to v hrách ako Super Mario 64 (1996), Crash Bandicoot (1996) či Tomb Raider (1996), ktoré boli vítaným vykročením zo sveta arkádových hier „side-scroller“ a „on-rail shooter“. Táto generácia herných zariadení priniesla prvýkrát polygónové objekty, na ktoré boli aplikované bitmapové obrazce tvoriace povrch objektu (tzv. textúry), a zväčšenie operačnej pamäte aj kapacity nosičov (príchod CD-ROM), ktoré ich umožňovali naplno využiť.Aj keď sa našli hry s dynamickým osvetlením scény v reálnom čase, ktoré generovalo na ich povrchoch tiene, resp. upravovalo ich svetelnosť, väčšinou boli tiene ručne aplikované priamo v textúre v podobe tmavších častí a pri pohybe scénou sa nemenili. Špecifickou vlastnosťou 3D hier na konzolu Sony PlayStation bol výpočet umiestnenia bodov, z ktorých pozostávali objekty zaokrúhľované na celé pixely. Ten spôsoboval poskakovanie a vlnenie textúrovaných polygónov. Výsledná podoba (zrejme nezámerne) vytvárala dojem vyššieho detailu a akejsi väčšej živosti povrchov bez dodatočných nárokov na výkon. 

Ďalším technologickým limitom, ktorý sa prejavoval pri renderovaní zložitejších scén, bolo prelínanie okrajov objektov. Na správne vykreslenie scény je potrebné, aby všetky objekty obsahovali informáciu o hĺbke ich umiestnenia v scéne. Tá definuje, ktoré časti objektov nemajú byť vykreslené, ak ich prekrýva iný objekt umiestnený bližšie k pohľadu hráča. Technika ich neustáleho prepočítavania sa nazýva z-buffering. Jej absencia na konzolách piatej generácie nechávala určenie poradia polygónov, ktoré sa prekrývali, na programátoroch. Z toho dôvodu občas prichádzalo k ich nesprávnemu zoradeniu, čo v určitých okamihoch spôsobovalo prekrytie polygónov. 

Optické disky

So striedaním generácií konzol sa postupne začal meniť aj prístup ku zvuku. Éra arkádových automatov v 90. rokoch doznievala. Hoci prvá 32-bitová arkáda NARC prišla už v roku 1988, väčšina arkád na zvuk využívala starú a lacnú technológiu, ktorá už nemohla konkurovať vlne zvukových kariet a novším generáciám domácich herných konzol. Jedným z najdôležitejších technologických prelomov v 90. rokoch 20. storočia bolo masové rozšírenie CD.

image.png

 Obr. 20: Optický disk, predchodca CD

Vývoj média CD má korene ešte v 50. a 60. rokoch minulého storočia. Už v roku 1958 David Gregg vynašiel optický disk, ktorý si neskôr patentoval ako Videodisk. V roku 1965 potom James Russell prišiel s myšlienkou, že dáta môžu byť zachované digitálne pri použití lasera. V roku 1973 mal pripravený funkčný prototyp, ktorý si všimli viaceré spoločnosti – napríklad Sony a Phillips. Kompaktný disk, teda CD (compact disc) bol predstavený v roku 1981, keď sa obe spoločnosti rozhodli tento formát komercializovať a štandardizovať. 

Prvé CD mohli obsahovať iba hudobné dáta. Toto médium využívalo štandardizovaný zvukový formát, opisovaný od roku 1980 v takzvaných štandardoch Rainbow Books. Séria týchto kníh obsahovala všetky technické špecifikácie týkajúce sa média CD (teda maximálny počet skladieb, sektorov atď.) a svoj názov dostala jednoducho kvôli farbe väzby. Prvá z nich - Red Book - definovala zvukový formát, ako aj všetky ostatné aspekty tohto média. Tento formát je štandardom zvukového CD dodnes. Zvuk musí mať vzorkovaciu frekvenciu 44,1 kHz a 16-bitovú hĺbku. V takejto kvalite sa na bežný disk zmestí okolo 80 minút hudby. Pojem RedBook audio sa doteraz používa na špecifikáciu tejto kvality zvuku. Ostatné knihy opisovali technické špecifikácie ďalších vývojových stupňov kompaktného disku. V žltej knihe sa napríklad opisuje CD-ROM, ktorý bol veľmi dôležitý v ére 32-bitových herných zariadení. Medzi ostatné typy CD patria kombinované (môžu obsahovať audio aj iné dáta), prepisovacie alebo CD s dvojitou hustotou, ktoré mali dvojnásobnú kapacitu (ale tie už vytlačili z trhu DVD disky s ešte väčšou kapacitou).

Hoci sa 32-bitová éra spája hlavne s 90. rokmi, prvé hry na CD-ROM vyšli ešte v roku 1988 na už spomínanú 16-bitovú konzolu TurboGrafx-16. Prvá z nich bola Fighting Street, port populárnej bojovej hry Street Fighter spoločnosti Capcom. V tejto podobe hra verne pripomínala originálnu arkádovú verziu. Zvuky sa až príliš podobali – hlasy bojovníkov zneli rovnako ako v pôvodnej verzii, boli monotónne s veľmi nízkou kvalitou vzorkovacej frekvencie a často takmer nepočuteľné. Hudba v tejto verzii však už využívala oveľa realistickejší formát CD. Druhou hrou bol simulátor „randenia“ (dating simulator) No Ri Ko (Alfa System/Hudson). So zvukom narábal trochu sofistikovanejšie – všetky hlasy a dialógy sú narozprávané v plnej kvalite. Zvukové dáta sú uložené ako Red Book audio. To znamená, že ak CD s týmito hrami vložíme do obyčajného CD prehrávača, môžeme všetky dialógy počúvať ako jednotlivé skladby. No Ri Ko je podľa všetkého úplne prvá hra na domáce konzoly, kde herci narozprávali všetky dialógy.

Prvá hra na CD-ROM do počítačov Manhole (Cyan, 1988/1989) bola prerobená verzia pôvodne na disketách distribuovanej čiernobielej adventúry. V prvej CD verzii obsahovala minimum hudby a nekvalitne spracované dialógové linky. Až neskoršie verzie mali aj hudbu, zvukové efekty a podobne.

image.png

Obr. 21: Čítacie zariadenie na CD pre počítače

Vzhľadom na kompletnosť využívania CD média ako nového formátu treba spomenúť aj dve herné kompilácie, ktoré z istého pohľadu prišli ešte skôr ako Manhole. Prvá z nich je The CD Games Pack od Codemasters z roku 1989. Balenie obsahovalo kazetu, CD a špeciálny kábel – pôvodne bola totiž táto kompilácia určená na počítače ZX Spectrum a Commodore 64. Dáta hier boli stále uložené na kazetách (ktoré Spectrum využívalo ako alternatívu kartridže). CD obsahovalo dáta v podobe zvukových stôp – pomocou kábla sa prepojil štandardný prehrávač hudby s konzolou tak, že druhý koniec kábla šiel do vstupu na joystick. Hry sa tak načítali oveľa rýchlejšie a na prehrávači hudby bolo treba zvoliť to číslo skladby, ktoré bolo priradené ku konkrétnej hre. Keďže ZX Spectrum fungovalo na princípe dekódovania zvukovej stopy a jej prekonvertovania späť na dáta, na CD sa zmestilo viac ako 30 jednoduchých hier. V rovnakom roku spoločnosť Rainbow Arts vydala na CD kolekciu 10 hier na Commodore 64, tie sa podobne zapájali do CD prehrávača a druhý koniec kábla do kazetového portu na počítači. Okrem hier tu bolo aj 7 skladieb z rôznych iných hier, uložených ako klasické Red Book audio.

Skutočné využitie však technológia CD-ROM nadobudla až v 90. rokoch. Jedna z prvých počítačových hier, ktoré vyšli exkluzívne iba na CD, bola interaktívna puzzle adventúra 7th Guest (Trilobyte/Virgin Interactive, 1993). Hudba bola nahrávaná naživo reálnymi hudobníkmi a obsahovala orchestrálny soundtrack. Práve 7th Guest je pravdepodobne prvou počítačovou hrou na CD, ktorá využila takýto typ hudby. Na druhom disku bola dokonca dlhá skladba, ktorá sa dala prehrávať v normálnom CD prehrávači. Zvukoví dizajnéri mali zároveň voľnejšiu ruku, pretože táto technológia sa už nemusela spoliehať na nejaký typ syntézy – zvuky mohli byť reálne nahrané kvalitnými mikrofónmi a využité ako zvukové časti/úryvky priamo v hre. V rovnakom roku vyšla hra Dark Wizard (Sega) na konzolu Sega CD. S najväčšou pravdepodobnosťou ju možno považovať za prvú hru na domáce konzoly, ktorá využíva orchestrálnu hudbu. Bojové pasáže s orchestrálnymi časťami striedali iné pasáže, počas ktorých hrala jednoduchšia hudba využívajúca staršiu technológiu. 

Je dôležité povedať, že sa iba ťažko zisťuje, ktorá hra a ktorá konzola mala aké prvenstvo. Našli by sme aj ďalšie hry, ktoré do nejakej miery kombinovali orchestrálne a digitálne prvky. V roku 1992 napríklad na počítače FM Towns PC vyšiel port známeho vesmírneho simulátora Wing Commander (Origin), využívajúci veľkolepú hudbu počas súbojov. Verzia na konzolu Sega CD obsahovala navyše reálne hlasy hercov a hráčova postava dokonca dostala prezývku, aby ju NPC charaktery mohli oslovovať. Podobne hra Cotton: Fantastic Night Dreams (Success, 1991) obsahovala realistickú rockovú hudbu. 

Ak by sme pokračovali v téme orchestrálnej hudby, museli by sme opäť uviesť hru, spomínanú v kapitolách o FMV a rotoskopickom obraze. Hra Dragon´s Lair (Rick Dyer/Don Bluth, Cinematronics) sa prvýkrát objavila v arkádovej verzii a vďaka laserovému disku, na ktorom bola uložená, mala na vtedajšie pomery vysoko vyvinutú grafickú a zvukovú stránku. Z dnešného pohľadu by sme ju mohli označiť skôr za interaktívny film s obmedzenou interaktivitou (hráč mohol iba vo vybraných chvíľach postavu ovládať štyrmi smermi a jedna klávesa bola vyhradená na útok). Z disku sa prehrávali rôzne vopred animované sekvencie podľa toho, ako hráč reagoval na výzvy na obrazovke. Tie možno považovať za predchodcu „quick time eventov“. Dragon´s Lair je teda zrejme prvá hra, ktorá obsahovala plnohodnotnú orchestrálnu hudbu – ešte pred érou CD-ROM. Skomponoval ju skladateľ a zvukový dizajnér Christopher L. Stone, ktorý vytvoril hudbu nielen do množstva filmov, ale aj do iných digitálnych hier.

CD médiá mali aj svoje nevýhody. Napriek tomu, že sa na ne zmestilo oveľa väčšie množstvo dát ako na klasické kartridže, rýchlosť načítavania týchto dát bola oveľa nižšia a neexistovala možnosť rýchleho načítavania v reálnom čase. To znamenalo, že hry sa museli spoliehať hlavne na veľkosť pamäte RAM. S tým súvisel aj dôležitý fakt – hoci zvuky a hudba sa mohli nahrávať v štúdiovej kvalite, v hrách mohli byť iba spustené a prehrané. Kým napríklad hudba vo formáte MIDI mohla mať množstvo variácií a adaptívne a plynulo reagovať na rôzne parametre hry, skladba vo formáte Red Book audio sa jednoducho iba prehrala. Neexistoval ešte spôsob, ako aj takto nahratú hudbu realizovať v podobe adaptívneho audia, rýchlo a bezproblémov reagujúceho na dianie na obrazovke.

Za prvú 32-bitovú domácu konzolu sa považuje FM Towns Marty od spoločnosti Fujitsu. Začala sa predávať v roku 1993 a bola viazaná iba na japonský trh. Prezentovala sa ako konzolová verzia počítača FM Towns a zároveň bola spätne kompatibilná s hrami na tento počítač. Mala zabudovaný CD-ROM, ktorý dokázal prehrávať aj audio CD a disketovú mechaniku. Integrovala aj vstup na externý mikrofón, čiže sa dala použiť ako karaoké (takmer 10 rokov po konzole NES s jej mikrofónom v ovládači). FM Towns Marty na zvuk využívala 6-kanálový čip Yamaha YM2612 s FM syntézou, 8-kanálový Ricoh RF5c68 s 10-bitovým PCM zvukom a vzorkovacou frekvenciou 19,6 kHz a CD-DA (compact disk digital audio) mechaniku s PCM zvukom a 44,1kHz/16-bit kvalitou. Hoci množstvo hier vytvorených alebo portovaných na túto konzolu bolo na vysokej úrovni (napríklad Splatterhouse, Raiden alebo Turbo Outrun), pre vysokú cenu FM Towns Marty nemala veľký úspech.

Podobne skončila aj ďalšia konzola z roku 1993 – Atari Jaguar. Technicky sa dala považovať za 64-bitovú, keďže obsahovala až dva 32-bitové čipy. Hoci dva čipy umožňovali pomerne veľký výkon na grafickej úrovni, po zvukovej stránke konzola veľa vymožeností neponúkala. Jeden z dvoch čipov mal pridané funkcie DSP, ktoré ale väčšina hier na túto konzolu naplno nevyužívala. Mala stereo zvuk, využívala syntézu wavetable a syntézu modulácie amplitúdy (AM syntézu) a 16-bitový DAC prevodník CD kvality. Syntézy však existovali iba na softvérovej úrovni, konzola neobsahovala žiadne dedikované zvukové čipy alebo oscilátory.

V roku 1995 bolo vydané prídavné zariadenie s názvom Jaguar CD so zabudovanou technológiou VLM (virtual light machine), ktorá dokázala pomocou spektrálneho analyzátora vytvárať vizuálny feedback reagujúci na vložené audio CD. Počas oficiálnej životnosti konzoly však na ňu vyšlo na CD iba 11 hier. Medzi najzaujímavejšie patrí port Tempest 2000 (Llamasoft, 1994), ktorej pôvodne vo formáte MOD vytvorený „techno soundtrack“ sa dal kúpiť aj na CD, strieľačka z prvej osoby Alien vs Predator (Rebellion Developments, 1994) so zvukmi z originálnych filmov o votrelcoch, ako aj akčná strieľačka Battlemorph (Attention to Detail, 1995).

V roku 1993 vyšla ešte herná konzola 3DO Interactive Multiplayer. Pre vysokú cenu a malý počet hier sa zaradila medzi menej úspešné. Mala 16-bitový stereo zvuk CD kvality a vlastný 20-bitový DSP procesor. Veľká časť hier na túto konzolu obsahovala dlhé FMV (full motion video) sekvencie a mnoho z nich svoj „kultový“ status získalo hlavne kvôli otáznej kvalite (napr. napodobenina Mortal Kombat Way of the Warrior). 

Najrozšírenejšími konzolami tejto éry boli Sega Saturn, Nintendo 64 a jedna z doteraz najznámejších konzol, prvá PlayStation. Sega Saturn vyšla v Japonsku v roku 1994, v USA a Európe o rok neskôr. Vnútri konzoly sa ukrývala duálna jednotka s ôsmimi procesormi. Dva z nich boli určené na spracovávanie audia. Konzola využívala zvukový čip Yamaha YMF292, nazývaný aj SCSP (Saturn Custom Sound Processor). Využíval 32 zvukových generátorov (resp. kanálov) s CD kvalitou, ktoré pracovali s FM syntézou alebo digitálnym PCM audio. Zvuk odtiaľ smeroval do jednotky DSP, obsahujúcej 16 zvukových efektov. Z technologického hľadiska bol najväčšou nevýhodou tejto konzoly malý objem pamäte RAM a neschopnosť dekomprimovať audio (transformovať zhustené dáta do pôvodného tvaru) v reálnom čase. Zvuky museli byť do pamäte zapisované nekomprimované, preto zvuky do mnohých hier boli implementované už pri zredukovanej kvalite (napríklad na vzorkovaciu frekvenciu 22 kHz). Zredukovaná vzorkovacia frekvencia má však v hernom audiu schopnosť vzbudiť príjemnú nostalgiu.

Na Sege Saturn vynikali 2D vesmírne strieľačky (napríklad Radiant Silvergun od spoločnosti Treasure z roku 1998), resp. 2D akčné hry (Guardian Heroes z roku 1996 tiež od Treasure), bojové hry (napr. Street Fighter Alpha 3 od Capcomu z roku 1998) či RPG (napr. Shining Force 3 od spoločnosti Camelot Software Planning, 1997 alebo Albert Odyssey: Legend of Eldean od Sunsoftu z roku 1996). Grafický výkon konzoly však dôkladne prezentovali aj početné hry, ktoré už kompletne využívali 3D modely. Medzi bojovými hrami si populárny status vytvoril Virtua Fighter (Sega AM2, 1994), k obľúbeným akčným hrám na konzole Saturn sa radí Burning Rangers (Sonic Team, 1998) či lietacia akčná arkáda Night into Dreams (Sonic Team, 1996). V roku 1994 sa zároveň na trhu objavila prvá variácia hernej konzoly Sony PlayStation (v Európe a USA o rok neskôr). Vnútri mala vlastný zvukový čip Sony SPU (Sound Processing Unit) so 16-bitovou kvalitou, ktorý využíval formát ADPCM. Podporovaných bolo 24 kanálov – osem z nich bolo rezervovaných na zvukové efekty a zvyšných 16 na hudbu. Vzorkovacia frekvencia bola v CD kvalite (teda 44,1 kHz). 

Zároveň bolo možné v reálnom čase využívať efekty, ako napríklad zmeny v krivke ADSR, dozvuk na každom z kanálov, moduláciu výšky či slučkovanie. Hoci táto konzola pravdepodobne v najväčšej miere využívala výhody CD-ROM a priam stelesňuje prechod z éry kartridží a malej pamäte do éry CD-ROM, mala zároveň podporu formátu MIDI. Na audio bolo vyhradených 512 kB pamäte DRAM.

Na PlayStation vzniklo mnoho doteraz kultových hier. Využívali ponúkanú kapacitu a veľká časť herných CD-ROM sa dala prehrávať aj ako klasické audio CD. V štandardnom prehrávači sme teda mohli počuť skladby z hier. Niektoré hry dokonca umožňovali počas hrania otvoriť CD mechaniku a vymeniť samotnú hru (ktorá stále bežala) za iné originálne audio CD, nahrádzajúce takto herný soundtrack. Niekedy boli hry až zaplavené hudbou, ktorá v tomto období paradoxne opäť dominovala nad zvukom. Keď sa napríklad pozrieme na hru Final Fantasy Tactics (Square, 1997), všimneme si, že najvýraznejšia je práve realistická hudba. Zvukové efekty sú v kontraste s ňou iba minimalistické, pripomínajú éru starších digitálnych hier a jednoduchých syntéz. Pravdepodobne najznámejšou hrou na PlayStation 1 je RPG Final Fantasy VII (Square, 1997). Pôvodne mala byť vyvíjaná na Nintendo 64, avšak vývojári sa v dôsledku obmedzeniam hardvéru rozhodli, že ju vytvoria na PlayStation. Hra bola jednoducho príliš „veľká“ a jej kvalitu nechceli „orezávať“. Originálna verzia pozostávala až z troch CD. Je paradoxné, že ako jedna z mála hier na PlayStation stále využívala formát MIDI. Hudobný skladateľ Nobuo Uematsu tak dosiahol, že hudba bola stále dynamická a menila sa bez dlhšieho načítavania. Keďže možnosti hry zahŕňali náhodné súboje a súvisiace rýchle zmeny obrazoviek, je to logické.

PlayStation bola zároveň konzolou, pri ktorej sa začalo herné audio transformovať do novej podoby. Priestor dostali aj dovtedy neštandardné žánre, ako napríklad hudobné, resp. rytmické hry – jedna z prvých výrazných bola PaRappa the Rapper od spoločnosti NanaOn-Sha z roku 1996. V roku 1999 rovnaká firma vydala hru Vib-Ribbon, ktorej úrovne sa generovali podľa toho, aké audio CD sa vložilo do mechaniky (hráč mohol generovať levely na základe vlastnej hudby). Originálna PlayStation (model SCPH-1001) je doteraz v takzvaných „audiofilných“ kruhoch považovaná za veľmi kvalitnú alternatívu do CD prehrávačov. Jej zvukový hardvér a kvalita reprodukcie hudobných CD podľa mnohých zvukových entuziastov mnohonásobne prevyšuje drahšie špecializované CD prehrávače kombinované so zosilňovačmi. Tento príklad je iba jeden z mnohých, ktoré dokazujú, že digitálne hry a súvisiace technológie ovplyvňovali oveľa väčšiu časť spoločnosti, ako sa mohlo zdať na prvý pohľad.

image.png

Obr. 22: Vib-Ribbon

Treťou dôležitou konzolou tejto éry bolo Nintendo 64. Na trhu sa konzola objavila dva roky po PlayStation, teda v roku 1996. Na rozdiel od väčšiny konzol piatej generácie Nintendo neprešlo na technológiu CD-ROM, ale ostalo pri kartidži. Na druhej strane, aj keď je táto konzola zaraďovaná medzi 32-bitové stroje, tento krok preskočila a využívala až 64-bitovú technológiu. Audio aj grafiku zabezpečoval jeden spoločný čip Reality Coprocessor. Okrem grafiky bol schopný produkovať 16-bitový stereo zvuk a jeho vzorkovacia frekvencia siahala až do 48 kHz. Najväčšou nevýhodou a výhodou v jednom bolo práve nevyužívanie CD-ROM ako nosičov hier. Na kartridž sa jednoducho nezmestilo tak veľa dát a Nintendo 64 sa muselo spoliehať na starší systém MIDI. 

V porovnaní s konkurenciou (hlavne s PlayStation) sa môže hudba javiť ako menej kvalitná – MIDI v tomto čase nemohlo dosiahnuť kvalitu reálnych a v štúdiu nahratých hudobných nástrojov, ktoré boli vo veľkej miere využívané v rozpínajúcom sa svete CD-ROM. Výhoda bola v tom, že hudba a zvuky mohli byť dokonale dynamické a adaptívne. Kým veľká časť hier na PlayStation prehrávala dookola piesne z CD, Nintendo 64 dokázalo v reálnom čase dynamicky hudbu prispôsobovať a meniť podľa potreby. Využívalo na to aj väčší objem pamäte RAM. Kým PlayStation mala iba 2 MB tejto pamäte (a z toho polovica bola vyhradená na grafické operácie), Nintendo 64 spolu s využitím takzvaného Extension Paku (1998) malo z pôvodných 4 MB RAM až 8, čo predstavovalo podstatný posun v rýchlosti.

Pri používaní MIDI sa hudba mohla komponovať podobne komplexným spôsobom, aký sme opisovali pri systéme iMuse – jednotlivé skladby obsahovali rôzne časti/miesta, v ktorých sa mohli meniť, plynule prechádzať do iných sekvencií, spúšťať alebo vypínať stopy navyše a podobne. Takže pri charakteristike zvukových schopností Nintenda 64 síce nemôžeme hovoriť o dokonalej štúdiovej kvalite zvukov, ale niektoré hry posúvali hranice toho, ako môže adaptívna hudba znieť. Hry ako The Legend of Zelda: Ocarina of Time (Nintendo EAD, 1998) alebo Banjo-Kazooie (Rare, 1998) napríklad využívajú plynulé prechody v hudbe v momentoch, keď hráč prechádza rôznymi zónami alebo narazí na nepriateľov. Vertikálna orchestrácia v rámci jednej skladby umožňuje plynulo meniť nástroje. V druhej z uvedených je dokonca svet hudby v každej úrovni odlíšený podľa toho, či hlavný hrdina pláva alebo nepláva pod vodou. V hre Ocarina of Time sa zase hráč učí hrať melódie na ovládači, ktorý má tlačidlá rozmiestnené podobne ako samotná okarína, ale s joystickom dokáže v reálnom čase tóny meniť a ohýbať ich výšku. V FPS strieľačke Perfect Dark (Rare, 2000) sa menilo tempo hudby na základe toho, v akej úrovni a s akým počtom nepriateľov sa hráč nachádzal; v závodnej arkáde Diddy Kong Racing (Rare, 1997) sa tempo a variácia hudby plynule zmenili v záverečnom kole pretekov (rovnako aj v závodnej Waverace z roku 1996). V akčnej sci-fi z prostredia Star Wars Rogue Squadron (Factor 5, 1998) sa hudba dynamicky a plynule v rámci jednej skladby menila podľa toho, či bol hráč v boji, alebo letel bez nepriateľov v okolí. Samozrejme, nemožno tvrdiť, že adaptívna hudba na PlayStation neexistovala. Ako to však býva, technológia bola dominantnejšia a diktovala smer – ak vývojári mohli na CD umiestniť hudbu štúdiovej kvality, väčšinou tak urobili. 

Grafické akcelerátory

Podobne ako dnes, tak ani v minulosti nebol najrozhodujúcejším aspektom počet farieb alebo rozlíšenie, ale celková plynulosť zobrazenia, o ktorú sa s príchodom trojrozmernej grafiky v 90. rokoch starali dedikované grafické karty (Graphics Processing Unit, GPU), medzi ktorými bola na trhu značná rivalita. Víťazne z tohto súboja vyšli značky NVIDIA a ATI/AMD, ktoré postupne porazili alebo pohltili všetku konkurenciu a vytvorili na trhu stav obmedzenej konkurencie, tzv. oligopol. Obe značky sa neustále predbiehali v pomere výkonu a ceny, pričom z dlhodobého hľadiska NVIDIA väčšinou prinášala vyšší výkon a AMD zasa nižšiu cenu.

Medzi najznámejšie a najrozšírenejšie karty možno chronologicky radiť Nvidia Riva TNT2, GeForce 256, 3Dfx Voodoo3, Matrox G400 a ATI Rage 128. Ich hlavným prínosom bolo rozšírenie schopností počítača o hardvérovú akceleráciu procesov súvisiacich s generovaním zložitejšej 3D grafiky, ako napr. práca s vysokým množstvom polygónov, aplikácia textúr na objekty a dynamické generovanie svetiel a tieňov. Karty pritom podporovali najčastejšie niektorú z vopred definovaných knižníc ako DirectX, alebo OpenGL, pričom na jej funkcie sa odvolávali tvorcovia hier. 

V súčasnosti grafické karty plnia prakticky rovnaký účel, avšak ich výkon a pamäť sa zlepšovali spoločne s ďalším technologickým vývojom. Umožnili tak rozvoj nových postupov na generovanie vysoko detailnej a plynulej hernej grafiky. Za výrazný medzník  možno považovať uvedenie metódy ray-tracing (sledovanie lúčov). Táto metóda, ktorá prostredníctvom automatizovaných výpočtov vlastností svetelných lúčov pomocou umelej inteligencie napodobňuje spôsob, akým sa svetlo odráža a láme v skutočnom svete, umožňuje realistické vykresľovanie objektov a umožňuje generovať obraz v optimálnom rozlíšení a následne ho škálovať (upscaling – zvyšovanie rozlíšenia obrazu) na potreby zariadení s vyšším zobrazovacím rozlíšením. Dopyt po čoraz výkonnejších grafických kartách časom výrazne znížil dôležitosť ostatných komponentov počítačových zostáv, keďže obsahovali vlastný procesor aj pamäť. 

Samotné grafické karty tak často niekoľkonásobne presahovali výkon základnej dosky, v ktorej boli inštalované. Dodnes ide o komponent, ktorý výrazne ovplyvňuje finančnú hodnotu celých zostáv, obzvlášť tých, ktoré sú určené na spracovanie veľkého množstva dát (napr. pri ťažbe kryptomien) alebo práve na hranie.

Spočiatku na domácich počítačoch generoval grafiku hlavný procesor počítača s využitím jeho operačnej pamäte. Jeho limity  nútili tvorcov podobne ako pri konzolových hrách ku kombinácii dvojrozmerných elementov a 3D modelov, ako napríklad v hre Alone In The Dark (1992), ktorá vykresľovala trojrozmerné postavy v statickom bitmapovom prostredí. A naopak, vesmírny simulátor Descent (1994) prinášal plynulý pohyb v šiestich stupňoch slobody s použitím statickej grafiky kokpitu a riadiacich panelov, ktoré zaberali takmer polovicu viditeľnej plochy. S príchodom vyspelejších grafických kariet a procesorov upravených špecificky na generovanie grafiky začali vznikať hry obsahujúce čoraz viac polygónov, ktoré boli pokryté textúrami a tieňované svetelnými zdrojmi. Prví, ktorí naplno využili potenciál tejto technológie, sú tvorcovia hry Quake (1996) zo spoločnosti id Software. Vďaka predchádzajúcim skúsenostiam z ich masovo úspešných hier Wolfenstein a Doom, postavených na enginoch id Tech 0 a id Tech 1, posunuli možnosti trojrozmerného pohybu ešte o krok ďalej. Hra umožňovala pohyb vo všetkých smeroch a levely obsahovali viaceré poschodia a objekty, po ktorých sa hráč mohol pohybovať. Zdrojový kód na Quake bol jeden z prvých, ktoré naplno využívali potenciál grafických kariet. Najskôr to bol špecifický grafický akcelerátor Rendition’s Vérité 1000 (VQuake z decembra 1996) a neskôr všetky karty kompatibilné s rozhraním OpenGL (GLQuake z januára roku 1997). Vďaka rozhodnutiu autora kódu Johna Carmacka zverejniť zdrojový kód a celkovej otvorenosti voči modifikáciám sa stal herný engine s kódovým označením id Tech 2  východiskom vývoja množstva ďalších verzií a pokračovaní tejto hry. Z historického hľadiska existovali príklady opätovného využitia častí kódu ako základu na tvorbu nových hier, no nikdy nie v takom rozsahu. Modifikácie jeho zdrojového kódu slúžili na vývoj desiatok hier ako Hexen II (1997), Soldier of Fortune (2000) alebo Call of Duty (2003) a separátneho herného enginu GoldSrc (neskôr Source) od Valve, ktorý bol použitý ako základ desiatok úspešných hier od Half Life (1998) po Apex Legends (2019).

image.png

 Obr. 23: Prostredie hry Quake

Kľúčom k jeho úspechu bola optimalizácia, vďaka ktorej dokázal bežať plynulo a rýchlo  na menej výkonných zostavách. Umožňoval ju predovšetkým systém BSP (Binary Space Partitioning), ktorý kalkuloval výpočet len tých objektov, ktoré mal hráč šancu vidieť v nasledujúcich okamihoch. Rovnako tak sa používal systém svetelnej mapy, ktorý šetril výpočtovú kapacitu potrebnú na generovanie tieňov. Quake mal tiež oproti Doomu silnejších a odolnejších nepriateľov v menšom počte, čím šetril počet vykreslených polygónov.

Medzi ďalšie spôsoby, akými sa v hrách pokúšali optimalizovať nároky na výkon pri zachovaní estetických kvalít vizuálnej stránky hry, patria techniky slúžiace k obmedzeniu detailov scény, ktoré nie je možné dostatočne vnímať. Tieto buď limitujú počet objektov, ktoré sú viditeľné v závislosti od vzdialenosti od hráča (level-of-detail alebo LOD), alebo ovplyvňujú detailnosť textúry, ktorá je na ne aplikovaná (mip-mapping) v rôznej vzdialenosti.  Špecifickým postupom znižujúcim počet polygónov je tiež tzv. texture-baking. Ide o proces, pri ktorom sa prenášajú textúry renderované z modelu s vysokým počtom polygónov na zjednodušený model toho istého objektu. 

Prakticky ide stále o ten istý princíp využitia vysokého výkonu na vygenerovanie detailného obrazu, jeho nasnímanie a aplikáciu v prostredí, ktoré je následne možné renderovať s nižšími požiadavkami na výkon. Rozširuje sa tak technika aplikácie statických tieňov, o čom sme hovorili pri konzolách piatej generácie.

Vplyv na náročnosť vykreslenia scény môže mať tiež priestor, ktorý zaberá renderovaná scéna. Ten je možné čiastočne zmenšiť prekrytím grafickými prvkami používateľského rozhrania (Graphic User Interface, teda GUI) alebo zmenšením uhla zorného poľa (Field Of View – FOV). Tieto techniky sa využívali najmä v minulosti, dnes už výrazne neovplyvňujú plynulosť zobrazenia na monitore (zostávajú však dôležité napríklad pri zariadeniach na virtuálnu realitu, ktoré majú limitovaný výkon a vysoké požiadavky na detailnosť a plynulosť zobrazenia). Domáce počítače dovoľovali rýchlejší nárast množstva zobrazených polygónov, ktoré sú dôležité na detailnejšie zobrazenie objektov a tiež poskytujú možnosť pokrývať jednotlivé plochy bitmapovými textúrami. 

Primárny rozdiel oproti konzolám piatej generácie a grafike generovanej hlavným procesorom počítačov  predstavovala možnosť dynamického renderovania obrazu s využitím tzv. shaderov. Postupy, ktoré využívajú, vyvinul filmový priemysel pri renderovaní počítačovo animovaných filmov a efektov (kľúčovú rolu vo vývoji zohralo štúdio Pixar), no s využitím cenovo nedostupného hardvéru a tempom, ktoré nebolo využiteľné v interaktívnych médiách, keďže renderovanie každej statickej snímky trvalo desiatky hodín. 

Shadery sú procesy, ktoré vykonáva GPU pred vykreslením scény. Ovplyvňujú, ako bude vyzerať trojrozmerný objekt na konci procesu, ktorý pozostáva z viacerých krokov, súhrnne označovaných za rendering pipeline (vykresľovací reťazec). Rôzne postupy, ktoré sú na objekt aplikované, sú spísané v knižniciach, s ktorými je možné pracovať bez nutnosti vždy znova programovať celý proces. Najpoužívanejšie sú DirectX (Microsoft), OpenGL (šírená pod voľnou licenciou) a jej následník Vulkan.

image.png

Obr. 24: Príklady aplikácie rôznych shaderov v procese renderovania modelu

Grafické karty spočiatku podporovali len tzv. pixel-shading, teda zmenu atribútov jednotlivých pixelov, napríklad aplikovaním normálovej mapy určujúcej, ktoré časti textúry majú byť zobrazené svetlejšie a ktoré tmavšie na vytvorenie efektu hĺbky a detailov na rovnej ploche. Využitie 2D shaderov pri tvorbe hier (okrem iného) umožňuje vytvárať rôznu štylizáciu scén, ktorá je aplikovaná na všetky objekty. 

Týmto spôsobom je možné vytvoriť napríklad dojem komiksovej kresby prostredníctvom cel-shadingu (nižší počet farieb, tmavé okraje). Neskôr sa do možností grafických kariet pridal vertex-shading, ktorý je schopný automaticky manipulovať s existujúcimi bodmi polygonálneho objektu (napr. pri generovaní pohybu vodnej hladiny) alebo geometry-shading, ktorý dokáže vytvárať alebo odstraňovať body modelu (napríklad prostredníctvom teselácie, ktorá rozdeľuje polygóny na menšie). Jednotlivé shadery boli napokon v roku 2006 integrované do spoločného štandardu označovaného Unified Shader Model.

32 a 64-bitový zvuk

V čase najväčšieho rozmachu herných konzol piatej generácie sa diali veľké zmeny aj v osobných počítačoch. Spoločnosť Creative už mala za sebou výrobu tretej generácie zvukovej karty Sound Blaster. Sound Blaster 16 bol na trhu už v roku 1992, využíval wavetable syntézu a 16-bitové audio CD kvality. V roku 1994 predstavila štvrtú generáciu, ktorej dominovala karta Sound Blaster AWE32 a jej variácie. AWE32 bola spätne kompatibilná so svojimi predchodcami, mala 16-bitovú hĺbku a 44,1 kHz vzorkovaciu frekvenciu (teda CD kvalitu), v reálnom čase zvládala kompresiu aj dekompresiu zvuku a navyše využívala čip Yamaha OPL3 s FM syntézou. Bola kompatibilná s MIDI (mala preň vyhradenú vlastnú zvukovú sekciu so syntetizátorom E-mu), mala vlastnú pamäť RAM a ROM a využívala syntézu založenú na samplovaní. Jej výhoda spočívala najmä v tom, že realistické zvuky mohla produkovať bez pomoci špeciálnych oscilátorov alebo zvukových vĺn – využívala nahrávky reálnych inštrumentov (na reprodukciu takéhoto zvuku potrebovala oveľa menší výkon). Procesor na tejto karte zároveň dokázal produkovať v reálnom čase rôzne audio efekty.

Podstatným vývojovým prvkom vo svete PC bol hlavne príchod operačného systému Windows 95 od spoločnosti Microsoft v roku 1995. Podobne ako väčšina herných konzol, aj tento systém mal vlastnú niekoľkosekundovú zvučku pri spustení (zložil ju v tejto knihe už spomínaný Brian Eno, ironicky však na počítači Macintosh). Najdôležitejší však bol príchod rozhrania DirectX, ktoré vzniklo práve vďaka Windows 95. V predchádzajúcom operačnom systéme MS-DOS vznikalo množstvo populárnych hier. Tvorba alebo portovanie hier priamo na Windows 95 však stagnovali. Windows vývojárom neposkytoval dostatočne vhodné prostriedky, na ktoré boli zvyknutí pod MS-DOS, a zároveň sa obávali problémov s kompatibilitou. 

Vďaka tomu sa vytvoril tím ľudí, ktorí mali za úlohu tento problém odstrániť. V septembri 1995 bola implementovaná prvá verzia rozhrania DirectX, ktoré počnúc Windowsom 95 umožňovalo využívať a pracovať s multimédiami na vyššej úrovni a jednoduchším spôsobom. V zásade išlo o zvýšenie rýchlosti, ktorou navzájom komunikovali zvuk a grafika, ako aj o vytvorenie lepšieho naviazania hardvéru na softvér. Zmeny zasiahli aj MIDI – jedna zo súčastí DirectX bola aj DirectMusic. Tento prvok vylepšil pôvodné MIDI a poskytoval mu po novom možnosť využívať kvalitnú wavetable syntézu a nahrávky.

Na prilákanie väčšieho počtu vývojárov na tvorbu hier pod novým operačným systémom sa v Microsofte rozhodli osloviť nám už známeho Johna Carmacka z id Software. Ich akčné FPS Doom (1993) a Doom 2 z roku 1994 boli hrateľné iba pod starším MS-DOS. Ponuka bola založená na vytvorení portu oboch hier do systému Windows 95 zadarmo a s tým, že iD Software si zachová všetky práva. Cormack súhlasil a v auguste 1996 bola vydaná prvá oficiálna hra bežiaca pod
DirectX – Doom 95. Od pôvodnej verzie sa líšila napríklad tým, že neprehrávala originálne MIDI súbory, ale využívala formát MUS (upravený MIDI formát s trochu menšou veľkosťou súborov) a podporovala väčší počet zvukových kanálov.

S príchodom DirectX prišli aj novšie možnosti v reprodukcii zvuku. Prvá zvuková karta, ktorá umožňovala využitie surroundu (teda priestorového zvuku) na počítačoch, bola Diamond Monster Sound z roku 1997. Mala vlastný zabudovaný procesor, ktorý sa staral o všetky operácie spojené so zvukom. Zároveň podporovala ako prvá súčasti DirectX, založené na hardvérovej akcelerácii (DirectSound a DirectSound3D). Napriek množstvu pozitívnych vlastností mala aj zopár negatívnych – kompatibilita so starším operačným systémom MS-DOS bola na veľmi zlej úrovni a hry, ktoré sa primárne vyvíjali na tento systém, dokázali využívať vlastnosti Monster Soundu iba vo Windows 95 DOS boxe. 

90. roky predstavovali veľký posun vo viacerých rovinách. S príchodom silnejších herných konzol a výkonnejších procesorov v počítačoch sa herní vývojári čoraz častejšie sústreďovali na čo najlepšiu vizuálnu prezentáciu hier. S tým súvisel aj príchod trojdimenzionálnej grafiky a diskusie o tom, koľko polygónov je dostatočne veľa, aby sa grafika hry dala považovať za dobrú. Futuristická pretekárska hra Wipeout (Psygnosis, 1995), ktorá vyšla pôvodne iba na PlayStation a MS-DOS, bola vysoko hodnotená za skvelú grafiku a výborný elektronický soundtrack. Jej obrazová frekvencia (framerate) sa však pohybovala v rozmedzí cca 30 snímok za sekundu (resp. iba 25 snímok za sekundu, ak išlo o európsku verziu PlayStation v režime PAL), čo by v dnešnej dobe mohlo byť považované za veľké negatívum. Na konzole Nintendo 64 vyšla podobná futuristická závodná hra v roku 1998. Išlo o F-Zero X (Nintendo EAD), teda pokračovanie predošlej hry F-Zero z roku 1990. Nintendo vytvorilo hru, ktorá mala až 60 snímok za sekundu, a to aj vtedy, keď proti hráčovi súťažilo ďalších 29 počítačom kontrolovaných pretekárov. Hoci z vizuálnej stránky hra nedosahovala také detaily ako predtým Wipeout, avšak práve vďaka menšiemu počtu vyobrazovaných polygónov dosiahla veľmi vysoké hodnotenia od kritikov, ako aj od hráčov. Na tomto príklade možno vidieť, že digitálne hry vkročili do novej éry – hoci konzoly a domáce počítače neboli ani zďaleka také výkonné, ako boli ich nástupcovia len o niekoľko rokov neskôr. Vývojári sa vďaka čoraz výkonnejším systémom dostali do fázy, v ktorej sa môžu ocitnúť aj tí dnešní. Technické limitácie hardvéru už neboli jedinou premennou ovplyvňujúcou hru, ale do procesu tvorby sa dostávali aj otázky hrateľnosti či imerzie.

S príchodom trojdimenzionálnej grafiky sa objavili nové výzvy aj pre zvukových dizajnérov. Keďže drvivá väčšina hier dovtedy existovala iba v 2D podobe, priestor ako taký nebol takmer vôbec témou.  Počas 80.  rokov síce niektoré hry trojdimenzionálny priestor chceli vykresliť, ale išlo iba o takzvané  pseudo-3D hry (to sa týka napríklad aj prvých dielov série Wing Commander). Aj tie z dnešného pohľadu najprimitívnejšie 3D hry narazili na nové prekážky. Vo Wolfenstein 3D vidíme trojdimenzionálny priestor. Ako sa ale vyrovnať so zvukom nepriateľov? Bude hra reflektovať intenzitou zvuku ich vzdialenosť a pozíciu? Bude ich počuť aj za rohom? 

Niektoré odpovede na podobné otázky poskytol až neskorší Doom – pri Wolftenstein 3D totiž technológia stále umožňovala prehrávať iba minimálny počet zvukov naraz (aj preto sa pri spomienke na túto hru vybavuje hlavne hudba a občasné „zaštekanie“ nepriateľov). V Doom už boli niektoré zvuky reálne priradené k postavám nepriateľov a hráč mohol pomocou zvuku odhadnúť ich typ, vzdialenosť či približné umiestnenie v priestore. Rovnako mali nepriatelia špecifický zvuk na útok, zranenie a smrť.

Nové výzvy prinášali aj 3D hry z pohľadu tretej osoby. Hráč mohol zrazu ovládať kameru, s čím prišlo množstvo dovtedy neexistujúcich postupov. Hlavná postava bola reálne ukotvená v priestore a hráč zrazu nevnímal len jednoduchú líniu pred sebou, ale aj nad a pod sebou. Diegetický priestor v digitálnych hrách sa v tomto momente definitívne odlíšil od jeho náprotivku vo filme. Diegetický zvuk v kontexte filmu je totiž zvuk, ktorý vychádza z obrazu, resp. scény, ale v prípade digitálnych hier vychádza z úrovne, v ktorej sa hráč práve nachádza. Keď sa nachádzame v 3D hre v jednej miestnosti s nepriateľom a kameru od neho otočíme na opačnú stranu, je jeho zvuk ešte diegetický? Je diegetický zvuk vták v lese, ktorého nevidíme, pretože herný engine by musel príliš komplikovane renderovať každý objekt, na ktorý odkazuje zvuková atmosféra? Bude zvuk, ktorý je umiestnený na úrovni s hráčom, reagovať na rotáciu kamery, resp. bude umiestnený presne tam, kde by ho počul herný charakter? Keď si kladieme takéto otázky, je zrejmé, prečo sa výrobcovia snažili vyvinúť technológie schopné priniesť do herného sveta priestorový zvukový zážitok. Keď porovnáme grafiku Doom 2 z roku 1994 s grafikami o pár rokov mladších 3D hier, akou je vyššie spomínaná hra Quake alebo Turok: Dinosaur Hunter (Iguana Entertainment, 1997), je zrejmé, že technologický posun si vyžadoval aj zvuk.

Ďalšou neľahkou úlohou, s ktorou sa zvukoví dizajnéri a skladatelia hernej hudby museli popasovať, bol presun väčšiny herného sveta na médiá CD-ROM. Ako sme už predtým načrtli, keďže väčšina hudby uloženej na CD-ROM-och bola vo formáte CD audio, hry už neumožňovali jednoduchú prácu s adaptívnym zvukom a plynulými prechodmi medzi rôznymi variáciami skladieb. Skladatelia museli „odhadovať“, koľko približne priemernému hráčovi bude trvať, kým prejde nejakú časť hry a na základe toho vytvoriť skladbu s určitou časovou dĺžkou. Rovnako museli premýšľať nad tým, či sa skladba skončí a začne od začiatku, či bude slučkovaná, či sa po nejakom počte prehraní vypne a podobne. To však viedlo aj k ďalším zmenám v hernom audiu. Oveľa významnejšie miesto začali mať atmosféry. V jednej z najpopulárnejších puzzle adventúr z 90. rokov Myst (Cyan, 1993) napríklad pôvodne nemala byť žiadna hudba. Na mnohých miestach v hre to aj počuť – hráča sprevádza iba minimalistický zvuk prostredia, v ktorom sa nachádza, vytvorený tak, aby zbytočne nerušil premýšľanie nad hádankami. Podobne je to aj v akčnej adventúre Tomb Raider (Core Design, 1996) – tá hudbu využíva iba na veľmi špecifických miestach, prípadne pri vyriešení nejakej hádanky. Väčšinu herného času počuť kontinuálne atmosférické zvuky pozadia, zvuky akcií a hlasové prejavy hlavnej hrdinky Lary. Takmer vo všetkých predchádzajúcich konzolách a počítačoch bola práve hudba v hrách nepretržitá a kontinuálna. Keď však hardvér začal umožňovať približovanie sa k reálnosti (a paradoxne, aj keď začal klásť nové limitácie), zrazu sa v hrách čoraz častejšie objavovali realistické atmosféry a s dokonalými zvukovými slučkami, často nahrádzajúcimi
soundtrack.

image.png

Obr. 25: Reproduktory sa postupne stali neoddeliteľnou súčasťou počítačových zostáv

Na základe týchto a iných podobných príkladov je zrejmé, že počas 90. rokov sa zvuk do digitálnych hier intenzívne vyvíjal, pričom k jeho funkcii, podielu v hrách a rôznym formám vznikalo mnoho rôznorodých prístupov. Aj vďaka technológii CD-ROM sa herný priemysel začal v istom ohľade približovať k filmovému. Zážitok pri hraní smeroval k čoraz väčšej imerzii a hudba, ktorú vytvorili v profesionálnych štúdiách a uložili vo vysokej kvalite, v mnohých prípadoch pripomínala kinematografické zážitky. Realita nebola vždy taká „ružová“ – kvalitný priestorový zvuk v zmysle korektne zapojených reproduktorov (minimálne štyroch) má málokto aj v súčasnosti a výkonné slúchadlá boli v tej ére ešte stále málo dostupné. Zároveň sa mnohé žánre ešte iba „hľadali“ a pod. –2D hry sa vyvinuli do vrcholnej podoby až počas štvrtej generácie konzol, tá piata ešte len smerovala k tomu, aby 3D priestor vykresľovala správne. Koncom 90. rokov už na dvere klopala šiesta generácia konzol a výkonnejšie počítače so zvukovými kartami a hlavne s novými spôsobmi, ako pracovať so zvukom.

Hoci sa za zlatú éru arkád považujú hlavne 70. a 80. roky, mnohí hráči považujú práve príchod šiestej generácie (resp. roky na prelome milénia) za najlepšiu éru hier. Argumentov by nebolo málo. Práve z tejto generácie pochádza doteraz najpredávanejšia konzola všetkých čias – PlayStation 2. Popularita tejto éry vyplýva aj z toho, že marketing už neoslovoval len hráčov. Hry sa dostávali do skutočného mainstreamu a mnohé z konzol (napríklad aj PS2) boli prezentované inak ako herné zariadenia. Významným posunom bol aj začiatok využívania DVD médií, na ktoré sa zmestilo niekoľkonásobne viac dát ako na klasický CD-ROM (približne 4,7 GB). Počas 90. rokov boli zároveň na vzostupe softvéry typu DAW (Digital Audio Workstation), ktoré neskôr kompletne zmenili spôsoby vytvárania zvuku a hudby do digitálnych hier.

Za prvú konzolu 6. generácie možno považovať Sega Dreamcast. Na trh prišla v rokoch 1998 – 1999 a bola to v podstate jediná konzola z tejto éry, ktorej výkon bol ešte prezentovaný v bitoch. Ostatné konzoly pri uvedení stavili skôr na výkon procesorov, počet polygónov, ktoré mohli vykresliť v reálnom čase, či na ich maximálne rozlíšenie. Pre spoločnosť Sega išlo o poslednú hernú konzolu a na rozdiel od ostatných súdobých konzol sa jej výroba ukončila len tri roky nato. Hoci sa jej komerčný úspech nedá porovnať s vtedajšou konkurenciou, je to jediná konzola, na ktorú sa (neoficiálne) nové hry vyvíjajú až dodnes. Mnohí považujú Dreamcast za jedinú konzolu tejto generácie, ktorej cieľovou skupinou boli typickí hráči. V jej vnútri sa nachádzal zvukový procesor Yamaha AICA s 32-bitovým jadrom, schopným generovať 64-kanálový zvuk pomocou modulácie PCM alebo ADPCM. Na audio mala vyhradené 2 MB pamäte RAM, využívala systém DSP na produkovanie audio efektov v reálnom čase a podporovala surround a 3D zvuk na systémy domáceho kina. Ako jediná konzola tejto generácie nevyužívala médium DVD, ale svoj vlastný disk typu GD-ROM, ten mohol obsahovať iba okolo 1 GB dát. Keďže táto konzola bola prvá, ktorá umožnila plnohodnotné hranie online (a dokonca bola úplne prvá ponúkajúca DLC obsah), logicky prišla aj potreba komunikovať s ostatnými hráčmi. Sega sa s tým vyrovnala svojským spôsobom – ovládač na Dreamcast mal na sebe dva špeciálne sloty, do ktorých sa dali zasunúť rôzne prídavné komponenty. Najvyužívanejším bol takzvaný VMU (Visual Memory Unit) – ten slúžil ako pamäťová karta a zároveň ako miniatúrna hra sama osebe (mal niekoľko tlačidiel a malý displej, niektoré hry ho využívali aj na zobrazovanie života hráča v reálnom čase). Ďalším prídavným komponentom bol plnohodnotný mikrofón. Niekoľko online hier ho používalo na online voice-chat. S najväčšou pravdepodobnosťou ide o úplne prvú konzolu v histórii, ponúkajúcu takúto funkciu. Avšak možnosť komunikovať online ako prví dostali hráči vlastniaci domáci počítač so zvukovou kartou. V roku 1995 napríklad v akčnej hre MechWarrior 2: 31st Century Combat (Activision) mohli využiť takzvaný VoIP (Voice over Internet Protocol) systém.

Možnosť komunikovať pomocou hlasu online na Sega Dreamcast využívala napríklad akčná sci-fi hra Alien Front Online (Wow Entertainment, 2001) alebo raritný experiment Planet Ring (Sega, 2000), spoločenská hra skombinovaná so sociálnou sieťou (hráč si musel vytvoriť vlastný profil atď.). Pozoruhodným spôsobom využívala tento mikrofón aj hra SeaMan (Vivarium Jellyvision, 1999). Išlo o simulátor „domáceho miláčika“, o ktorého sa hráč stará od narodenia – pripomína rybu s ľudskou tvárou. Hráč môže s týmto tvorom komunikovať pomocou mikrofónu a ten mu ľudským hlasom odpovedá. Aby toho nebolo málo, v hre ako hlavný rozprávač účinkuje Leonard Nimoy, známy ako Spock zo sci-fi Star Trek, čo ešte viac poukazuje na fakt, že herný priemysel sa pomaly, ale isto dostával do centra popkultúry. Sega neskôr k svojej konzole vydala ešte ďalšie zariadenie (pripojiteľné do slotu na ovládači) s názvom Dreameye, jednoduchú kameru snímajúcu hráča. Spolu s ňou dodávala zároveň prvý herný headset (slúchadlá s mikrofónom). Na Dreamcast vyšlo aj niekoľko hier, ktoré by sa dali zaradiť do žánru hudobných alebo rytmických. 

image.png

Obr. 26: Mikrofón pre Sega Dreamcast s hrou Seaman

Space Channel 5 (Sega AM9, 1999) bola hudobná tanečná hra využívajúca tanec ako „bojový prostriedok“. Úrovne pozostávali z tanečných súbojov – nepriatelia v podobe tancujúcich mimozemšťanov vyzývali hráča k tomu, aby po nich opakoval rytmické sekvencie pomocou ovládača (napríklad up-up-down-shoot atď.). Keď sa tieto sekvencie podarilo zadať v presnom rytme, hráčova postava nepriateľov unavila alebo rytmicky strieľala. Hudba reagovala na rytmus rovnako adaptívne a zaujímavé bolo, že táto hra využívala kombináciu hudby v CD kvalite s MIDI samplami. Cameo (t. j. výstup postavy, ktorú vo videohre reprezentuje celebrita) v Space Channel 5 mal aj spevák Michael Jackson ako jedna z tancujúcich NPC postáv. V roku 2001 vyšla hra Rez (United Game Artists) – išlo o akčné sci-fi, kde hráč lietal v abstraktnom 3D priestore a strieľal na rôzne lietajúce objekty okolo seba. Hudba bola plne adaptívna, tzn. prispôsobovala sa jednak rýchlosťou podľa toho, ako sa hráčovi darilo, a podľa úrovne, v ktorej sa práve nachádzal, a jednak rytmicky, t. j., že každý výstrel či zásah, či zničenie nepriateľa sa dokonale prispôsoboval rytmu. 

Pri troche fantázie by sme v tejto hre mohli vidieť inšpiráciu na dnes populárnu rytmickú hru na platforme Oculus VR Beat Saber (Beat Games, 2019). Na hru Rez bol špeciálne vyvinutý veľmi špecifický ovládač, ktorý sa na trh dostal začiatkom roka 2002. Išlo o takzvaný Trance Vibrator, ktorý mal jedinú funkciu: vibrovať/pulzovať v rytme s hudbou. Mnohí hráči (hlavne hráčky) sa ani netajili tým, že tento objekt pri hraní umiestnili skôr pod seba ako do svojich rúk – vynaliezavosti sa medze nekládli. Za zmienku stojí aj akčná hra Jet Set Radio (Smilebit/BlitWorks, 2000). Hráč ovláda člena gangu na kolieskových korčuliach, sprejujúceho grafity po Tokiu. Inšpiráciu hra hľadala v tituloch ako PaRappa the Rapper a tematicky dokonca vo filme Fight Club (Klub bitkárov, réžia David Fincher, 1999). Soundtrack Jet Set Radio je doteraz vysoko cenený, obsahuje prvky abstraktného hip-hopu, J-popu, acid jazzu a elektronickej hudby. V roku 2012 bol dokonca oficiálne vydaný na iTunes – v rovnakom roku vyšiel aj HD remaster hry na ďalších platformách.

image.png

Obr. 27: Ovládač Trance Vibrator pre hru Rez

Konzola Sony PlayStation 2 (PS2) bola na trh uvedená v roku 2000. Počas životnosti tejto konzoly vyšlo na nej vyše 4 000 hier a jej produkcia sa skončila až v roku 2013, teda ešte dlho potom, čo na trhu bojovali o priazeň hráčov konzoly siedmej generácie. Ako sme naznačili na začiatku kapitoly, PS2 bola spočiatku prezentovaná zároveň ako domáce multimediálne zariadenie. Jej najväčšou zbraňou bol zabudovaný prehrávač DVD, ktorý sa dal v kombinácii s televízorom plnohodnotne využiť ako prehrávač filmov. Jej počiatočná cena bola dokonca nižšia, akú mali niektoré samostatné DVD prehrávače. To znamenalo, že mnoho ľudí si ju kupovalo nielen ako herné zariadenie (nadväzujúc na úspech PS1 mnoho audiofilov, kupujúcich si konzolu ako CD prehrávač).

PS2 využívala 5.1 Dolby Surround zvuk, zahŕňajúci Dolby Digital, DTS a Dolby Pro Logic II. DTS a Dolby Digital sa primárne využívali pri prehrávaní videa a animácií, nie počas hrania hry. Dolby Pro Logic II sa už ale využíval počas hrania hry.  Ide o stereo systém, v rámci ktorého je v jednotlivých kanáloch reprodukovaného zvuku (v ľavom a pravom) zakódovaný signál navyše. Teda obsahuje ďalšie zvukové kanály – zadný ľavý/pravý a stredný. Ak ale zvuk z konzoly nie je zapojený do špecifického AV prijímača ako Pro Logic (teda zariadenia, ktoré dokáže takýto zvuk rozoznávať), potom výsledný zvuk bude znieť ako bežné stereo. V PS2 bol (opäť) jej vlastný separátny zvukový procesor typu IPO (input/output procesor) obsahujúci čip SPU2, pozostávajúci z dvoch procesorov schopných produkovať 48 kanálov zvuku pri vzorkovacej frekvencii 48 kHz. PS2 mala vyhradené 2 MB pamäte RAM na zvuky, vďaka čomu mohla využívať dlhšie slučky, ale aj kontinuálnu hudbu zároveň s kontinuálnymi atmosférami vo formáte stereo alebo surround. Mohla pracovať s PCM, ale aj ADPCM formátom zvuku. V skutočnosti to z nej robilo konzolu, ktorá mohla zastúpiť domácu zábavu nielen hráčom. Podobne ako Dreamcast, tak aj PS2 prišla s riešením, ako hrať online. Rozšírenie Network Adapter sa dalo pripojiť do zadnej časti konzoly (podobne ako pevný disk). Keďže na zariadení boli aj USB porty, dal sa pripojiť headset s mikrofónom.

Na PS2 vyšlo množstvo titulov, ktoré posúvali limity herného zážitku, ale aj zvuku. Herný priemysel sa výrazne prepájal s hudobným. Licencovaná hudba sa stala prakticky štandardom a takmer výlučne sa využívala v populárnych hrách ako Grand Theft Auto 3 (DMA Design/Rockstar, 2001), Grand Turismo 3 a 4 (Polyphony Digital, 2001/2004), Need For Speed: Underground (EA Black Box, 2003) či Burnout 3: Takedown (Criterion Games, 2004). PS2 spopularizovala aj ďalšie, doteraz veľmi známe herné série, osobitne pracujúce so zvukom.

V roku 2005 vyšiel prvý diel série Guitar Hero (Harmonix). Išlo o hudobnú rytmickú hru so špeciálnym ovládačom v tvare malej gitary. Na ňom hráč simuluje pomocou tlačidiel hranie hudby (jednotlivé noty aj akordy a predĺžené tóny) podľa vizualizácie z obrazovky. Tóny presne reagujú na rytmus konkrétnej skladby. Soundtrack obsahoval skladby od známych rockových skupín vrátane Black Sabbath, Deep Purple, The Ramones a podobne. Hra vznikla podľa úspešnej arkádovej rytmickej série Guitar Freaks (Benami/Konami, 1999). 

Podobne bola upravená na PlayStation 2 portovaná DrumMania (Bemani/Konami, 1999), ktorá simulovala hru na bicie cez kontrolér pripomínajúci elektronické bicie. Takýchto hier by sme našli oveľa viac, pretože boli extrémne populárne. V roku 2001, resp. 2003 Harmonix napríklad vydal akčnú rytmickú hru Frequency a neskôr pokračovanie Amplitude, kde hráč strieľal z vesmírnej lode na tvary prezentujúce noty, ale aj celé hudobné frázy/takty a týmto spôsobom postupne odomykal skladby. V jednom z ďalších režimov mohol ukladať noty na rôzne miesta, vytvárajúc tak unikátnu kompozíciu. Loď sa pohybovala po rôznych paralelných dráhach, ktoré prezentovali hudobné stopy (na jednej boli bicie, na druhej basa, na tretej syntetizátor atď.). Pôvodne bolo možné túto hru hrať aj proti živým hráčom pomocou online pripojenia. Jedným z najpopulárnejších hudobných titulov na PS2 bol DDRMAX: Dance Dance Revolution (KCET/Konami, 2002). Využíva opäť špeciálny ovládač v podobe tanečnej podložky „dance pad“, na ktorej hráč musí skákať na správne symboly presne podľa toho, čo vidí na obrazovke.

Samozrejme, PlayStation 2 nebola známa iba pre rytmické a hudobné hry. Objavilo sa na nej mnoho titulov, ktoré predstavovali úplne nové žánre, ale aj hry, ktoré existujúce žánre posúvali ďalej. Vyšlo aj množstvo hier, prostredníctvom ktorých ich tvorcovia predkladali argumenty do diskusie o tom, či hry možno považovať za umenie. Jedným z takých titulov bol napríklad Shadow of the Colossus (Japan Studio/Team Ico, 2005). Žánrovo sa väčšinou zaraďuje medzi akčné adventúry. Už pri úvodných titulkoch je jasné, že hra sa snaží kinematografickým spôsobom vplývať na emócie recipienta – hlavne pomocou melancholickej, ťaživej hudby. Hráč sa pohybuje v rozľahlom otvorenom svete a hľadá gigantické stvorenia (titana, kolosa). Počas skúmania sveta hráč počuje iba dupot kopýt svojho koňa, pohyby svojej postavy a ambientné zvuky okolia (čo umocňuje pocit samoty). Hudba sa objavuje väčšinou až vtedy, keď sa hráč dostáva do oblasti, kde sa vyskytuje kolos. Spočiatku iba predznamenáva, čo hráča čaká, a vytvára napätie pred hlavným súbojom. 

Hoci je hudba v dokonalej štúdiovej kvalite a pripomína symfonickú skladbu, dynamicky reaguje na akcie hráča – na kolosa (titana) sa väčšinou najskôr nejakým spôsobom treba dostať/vyšplhať a hudba sa z dramatickej mení na oslavnejšiu v momente, keď sa hráčovi darí vyšplhať k slabým miestam kolosa. O to paradoxnejšie je, keď pri porážke kolosa počuť hudbu smutnú, čo u hráča vzbudzuje pocit ľútosti alebo viny – jednou z tém, ktoré táto hra reflektuje, je smrť. Hudba sa tu vo veľkej miere už využíva ako plnohodnotný naratívny prostriedok. Za zmienku stojí aj zvukový dizajn tohto titulu. Entita menom Dormin je dabovaná až dvomi ľuďmi, mužom a ženou, preto jej hlas znie abstraktne a navyše rozpráva vymyslenou rečou. S týmto prvkom vývojársky tím pracoval do takých detailov, že si možno všimnúť, ako ženský element z hlasu Dormina ku koncu hry ustupuje (čo otvára veľký priestor na interpretáciu záveru).

V roku 2001v Japonsku a o rok neskôr vo zvyšku sveta prišla na trh herná konzola Nintendo GameCube. Oproti PS2 využívala médiá s názvom Game Disc, ktoré svojou veľkosťou (máme na mysli aj fyzickú, aj veľkosť dát) zodpovedali takzvaným mini DVD. To znamená, že sa na jeden disk zmestilo 1,4 GB dát, čo je približne trikrát menej ako na štandardné DVD. V histórii Nintenda to však bola prvá konzola, ktorá nevyužívala kartridž. Okrem silného hlavného procesora vyrobeného spoločnosťou IBM využívala 24 MB pamäte RAM na hlavné úkony a ďalších 16 MB pamäte A-RAM na ostatné elementy zahŕňajúce aj zvukové operácie. Ako pri PS2, tak aj na tejto konzole sa zvuk pri kvalite 48 kHz/16-bit (a vo formáte PCM alebo ADPCM) vyrábal separátne pomocou DSP procesora. Ten mohol pri spracovaní až 64-kanálového zvuku pridávať dodatočné efekty (chorus, ozvenu, dozvuk atď.). Konzola bola zároveň schopná vytvárať priestorový zvuk.

Obrovský rozdiel medzi tým, ako sa dala vytvárať hudba alebo zvukové efekty na GameCube a na ostatných konzolách, spočíval v tom, že Nintendo vytvorilo svoj vlastný implementačný nástroj s názvom MusyX. Znamenalo to, že vytvorené zvuky sa jednoducho odovzdali vývojárovi, resp. programátorovi a ten zabezpečil ich implementovanie. Tento softvér bol predzvesťou práce s takzvaným middleware (o tom ešte bude reč). MusyX poskytoval možnosť upraviť panoramatické umiestnenie zvukov v priestore, sekvencie interaktívnej hudby, úpravu efektov, náhodný výber zvukov, jednoduché slučkovanie a podobne. Zvukový dizajnér alebo skladateľ bol plne zodpovedný za to, ako a kedy hrali zvuky. Predtým (a vlastne aj potom) zvukoví dizajnéri či skladatelia museli väčšinou pracovať so súborom vývojárskych nástrojov s tzv. software development kit, resp. dev-kit, SDK. Ide o modifikované verzie konzol či hardvéru, ktoré sú upravené zvlášť na to, aby sa mohli ďalej vyvíjať, ale ich vlastnosti nie sú dostupné verejnosti. Dev-kit je väčšinou veľmi nákladný a často jeho cena predstavuje viac ako desaťnásobok ceny bežnej konzoly.

GameCube mala – podobne ako ostatné konzoly – rôzne prídavné zariadenia či ovládače a zopár z nich súviselo aj so zvukom. Pravdepodobne najznámejšie boli DK Bongos (DK je skratka pre Donkey Konga), teda doslovne bongá, na ktoré sa dalo bubnovať rukami. Tento ovládač snímal zvuk zvlášť na ľavom a zvlášť na pravom bongu (plus úder na obe naraz) a snímal zároveň tlesknutie rukami tesne nad nimi pomocou zabudovaného mikrofónu. Bongá boli špeciálne vyvinuté na hry Donkey Konga 1, 2 a 3 (Namco, 2003 – 2005) a zároveň na plošinovku (platformer) Donkey Kong Jungle Beat (Nintendo EAD Tokyo, 2004). Séria Donkey Konga svojím konceptom výrazne pripomínala iné hudobné/rytmické hry, ako Guitar Hero a podobne. 

image.png

Obr. 28: Ovládač DK Bongos pre hru Donkey Konga

Ďalším zaujímavým zariadením bol mikrofón pre GameCube. Zapájal sa do jedného zo slotov pamäťovej karty a používal sa namiesto ovládača. Na snímanie hlasu využíval softvér s názvom ScanSoft, ktorý bol integrovaný priamo do konkrétnych hier. Mikrofón napokon využívalo iba zopár hier – Mario Party 6 a 7 (Hudson Soft,  2004 – 2005), Karaoke Revolution Party (Harmonix/Blitz Games, 2005), Chibi-Robo! (Skip Ltd./Bandai, 2005), Odama (Vivarium, 2006) a Densetsu no Quiz Ou Ketteisen (Hudson Soft, 2005). Do mikrofónu hráči diktovali povely a hra na základe nich (väčšinou) reagovala. Odama predstavovala mix medzi taktickou stratégiou a pinballom, v ktorom hráč nielenže odrážal loptičku a likvidoval nepriateľské budovy, ale pomocou mikrofónu zadával príkazy svojej mini armáde. Mario Party zase obsahovala množstvo rôznych minihier – hráč zadával jednoduché slovné príkazy podľa toho, ktorú z nich hral („laser, bombs, fire“, rôzne čísla a podobne). Jedna z hier na GameCube bola neskôr vydaná ako audio CD, resp. ako prerozprávaný príbeh odohrávajúci sa pred udalosťami v hre. Išlo o akčnú RPG hru Tales of Symphonia (Namco Tales Studio, 2003), ktorá v roku 2007 vyšla ako Drama CD: Tales of Symphonia (A Long Time Ago)

Xbox (posledná zo šiestej generácie konzol) predstavoval zároveň prvý krok spoločnosti Microsoft vo svete herných konzol. Na trh prišiel koncom roka 2001. Hoci nebolo pravdepodobné, že ohrozí dominanciu PlayStation 2, vytvoril si odvtedy masovú fanúšikovskú základňu a v súčasnosti je jedným z dominantných hráčov na trhu. Prvý Xbox mal najsilnejší hardvér zo všetkých konzol tejto éry. V jeho vnútri boli primárne počítačové komponenty – procesor Pentium III, grafika vyvíjaná spoločnosťou Nvidia, pamäť, akú by sme našli v PC atď. Využíval 64 MB pamäte DDR SDRAM, mechaniku DVD a ako prvá konzola v histórii mal od začiatku zabudovaný pevný disk s veľkosťou 8 GB. Zvukové operácie mal na starosti unikátny procesor MCP (Media Communications Processor) so štyrmi nezávislými pod-procesormi. Tie riadili zvlášť audio kanály (voice processor), kódovanie zvuku (encode processor), globálne operácie (global processor) a prvotný transfer zvukových dát (setup engine). Kanálový a globálny procesor majú funkciu DSP. Prvý spomínaný dokázal spracovávať 256-kanálový zvuk pri vzorkovacej frekvencii 48 kHz, z týchto kanálov mohlo byť 64 využitých pri vytváraní 3D efektov a priestorového zvuku. Procesor mal navyše jednopásmový ekvalizér, ktorý dokázal v reálnom čase ovplyvňovať filtrovanie zvukov – napríklad pri vytváraní efektu oklúzie (hlas spoza steny). Druhý spomínaný procesor (globálny) bol primárne určený na spracovávanie audio efektov v reálnom čase (ozvena, skreslenie, flanger, kompresor atď.). Finálny zvuk spracovával a mixoval kódovací procesor, ten zvuk z konzoly posielal von v podobe sterea alebo multikanálového priestorového zvuku.

Keďže Xbox vyvinul Microsoft, dokázal naplno využívať všetky schopnosti DirectX (v tom čase už verziu 8), a teda aj DirectSound 3D. V reálnom čase dekódoval priestorový zvuk (pri 5.1 rozmiestnení reproduktorov – teda ľavý, pravý a stredný kanál, zadný ľavý a pravý; tiež basový reproduktor tzv. subwoofer) a implementáciu zvukov a hudby zvládal na vyššej úrovni. Pomocou nástroja DirectMusic API a jeho skriptov mohla komunikácia medzi programátormi hier a zvukovými dizajnérmi a hudobnými skladateľmi prebiehať plynulejšie – v skripte skladateľ napríklad videl informácie o tom, koľko nepriateľov čaká na hráča v ďalšej miestnosti  a podľa toho mohol prispôsobiť intenzitu a dramatickosť hudby v tejto hernej lokácii. Aj vďaka takýmto technológiám bol Xbox prvou konzolou, ktorá v hrách plnohodnotne využívala možnosti umiestňovania zvuku v priestore aj v reálnom čase, teda nielen v animáciách a filmoch ako predtým PlayStation 2. Vzhľadom na doterajší text to môže znieť ako štandardná technologická informácia, ale implementácia priestorového zvuku v reálnom čase bola pre mnohých zvukových dizajnérov a skladateľov akýmsi „svätým grálom“.

Aj Xbox priniesol svoj vlastný online systém (Xbox Live), ktorý fungoval do roku 2010. V rámci modelu takzvaného „Live Starter Kit” bol spolu s konzolou dodávaný aj Xbox Communicator, čiže slúchadlá s mikrofónom na zabezpečenie hlasového chatu počas online hrania. Jedna z najúspešnejších hier, ktorá pôvodne vyšla exkluzívne na systém Xbox, bola akčná sci-fi FPS Halo: Combat Evolved (Bungie, 2001). Nielenže naplno využila hardvérové možností konzoly (rozvinutá grafika, dokonca možnosť rozdeliť obrazovku na 4 časti a hrať proti  sebe vo štvorici, možnosť jazdiť v hre na bojových vozidlách atď.), ale aj po zvukovej stránke sa správala moderne. Audio tím sa napríklad rozhodol, že hudba nebude hrať  stále. 

image.png

Obr. 29: XBox Communicator

Vyniknúť dostali zvuky pozadia a interaktívne zvuky (zbrane, explózie a podobne), čo vytvorilo z tejto hry oveľa atmosférickejšiu záležitosť. Napriek tomu, že systém Halo nepracoval s MIDI, zvukové elementy boli od začiatku tvorené ako dynamické. Základnou jednotkou bol stále surový zvuk – engine hry však reagoval na tzv. „soundtags“ (zvukové tagy), teda niečo ako zvukové markery obsahujúce odkazy na viacero zvukových súborov a inštrukcií. V rámci týchto tagov (označených prvkov) boli zároveň obsiahnuté permutácie, teda rôzne variácie možností skladania daných zvukov dokopy alebo za sebou a tiež v rámci ich náhodného výberu. Existovalo napríklad 20 variácií krokov na tráve a iných povrchoch, rovnako variácie nečakaných výbuchov a podobne. Ten istý princíp sa uplatnil aj pri prehrávaní hudby. Soundtag obsahoval viacero hudobných slučiek spolu s informáciami o tom, ako často, resp., s akou pravdepodobnosťou majú jednotlivé časti hrať. Skladateľ zároveň úzko spolupracoval s level dizajnérmi a vedel vopred o dôležitých udalostiach, čakajúcich na hráča. Hudba v takom prípade reagovala dynamicky: engine umožňoval striedať slučky, postupné stišovanie hudby do úplného útlmu (fade-out) v situácii, keď hráč príliš dlho trávil čas na jednom mieste a nepostupoval ďalej, prehrávať alternatívne verzie rôznych častí hudby pri rôznych situáciách, využívať krátke hudobné útvary (stingers) v momentoch, keď hráča chceli tvorcovia vystrašiť atď. Hra tiež rátala s tým, že každý hráč sa do rôznych dôležitých situácií môže dostať v rozdielnom čase. To znamená, že pre pomalšieho hráča bude hudba budujúca napätie hrať dlhšie, naopak, rýchly a skúsený hráč bude počuť takzvaný „build-up“ iba pár sekúnd a hra hneď prepne na hlavný motív. V hernom priestore boli rozmiestňované aj rôzne náhodné zvuky okolia (nezneli zakaždým a intenzita alebo výška zvuku nebola nikdy rovnaká). Zvukový dizajn v tejto hre vytváral aj niekoľko úrovní deštrukcie – keď hráč rozstrieľal alebo zničil nejaký materiál (napríklad sklo), engine sa snažil sumarizovať množstvo deštrukcie a podľa toho priraďoval kódovaný zvukový súbor (soundtags). Ak bolo zničené niečo malé, engine prehral soundtags 1, keď však hráč spôsobil obrovskú explóziu a deštrukciu, spustil sa soundtags 3, kde už zvuk obklopil hráča zo všetkých strán a intenzitou bol niekoľkonásobne silnejší ako predchádzajúce úrovne. Takýto spôsob práce so zvukom v podstate predznamenáva to, ako sa s dynamickým zvukovým dizajnom pracuje v súčasnosti, hoci hovoríme o hre z roku 2001. 

Na konzole Xbox bolo možné „ripovať“ (teda konvertovať) klasické audio CD do digitálnej podoby (podporovaný bol aj formát mp3). Súbory sa uložili na špeciálne miesto na disku, z ktorého dokázali niektoré hry následne tieto skladby čítať. Napríklad v Grand Theft Auto 3 sa takto dal naladiť špeciálny rádiový kanál v autách, ktorý hráčovi umožnil počúvať vlastnú hudbu. To, akým spôsobom fungovalo audio na konzole Xbox, mierne odrážalo technologický pokrok na počítačoch. Na prelome milénia spoločnosť Creative ponúkala zvukové karty SoundBlaster Live! (od roku 1998) a jej konkurent Diamond Multimedia ponúkal kartu Diamond Monster Sound MX300. V tomto čase ešte na domácich počítačoch neexistovali hry, ktoré by podporovali skutočný 5.1 Dolby Digital zvuk – podobne ako na konzolách množstvo hier využívalo surround sound. Jednou z prvých PC hier podporujúcich priestorový zvuk, bola Actua Golf 2 (Gremlin Interactive, 1997). 

Priestorový zvuk reprodukoval najmä zvuky prírodných elementov (rieka, jazero, občasné zvuky vtákov a podobne). Ďalšie hry už boli skôr akčné, ako napríklad FPS Aliens Versus Predator (Rebellion Developments, 1999), rok nato akčná adventúra American McGee´s Alice (Rogue Entertainment, 2000) a množstvo iných. Spoločnosť Creative bola známa hlavne tým, že počnúc kartou SoundBlaster Live začala využívať technológiu EAX (Enviromental Audio Extensions). Išlo o knižnicu rozšírení rozhrania DirectSound 3D, ktorej účelom bolo štandardizovať priestorový zvuk v operačnom systéme Windows.

Nešlo však o vnímanie priestorového zvuku v pravom zmysle slova, EAX dokázala hlavne v reálnom čase produkovať pomocou DSP rôzne audio efekty namiesto hlavného procesoru počítača (aj preto sa o tejto funkcii niekedy hovorilo ako o „hardvérovej akcelerácii“). Tieto efekty mali prirodzenejšie simulovať priestor v hrách – ozveny, dozvuky, rôzne filtrovanie zvuku a podobne. Technológiu EAX využilo množstvo hier – medzi najznámejšie patria FPS Half-Life (Valve, 1998) alebo hra Splinter Cell (Ubi Soft Montreal, 2002). Pri hraní týchto titulov môže hráč naozaj intenzívne vnímať atmosférické stvárnenie niektorých úrovní, rôzne zvukové elementy (explózie, streľba) majú výrazný dozvuk (reverb) medzi skalnatými stenami či v miestnostiach s holými stenami a podobne. V hre Splinter Cell vyniká ticho, precízne spracovanie atmosfér a možnosť lokalizovať nepriateľov pomocou zvuku. S ďalšími verziami technológie EAX prichádzali aj ďalšie vylepšenia – väčší počet kanálov, ktoré dokázala zvuková karta spracovať naraz, komplexnejšie efekty oklúzie, ale aj špecifickejšie prvky, ako dozvuk (reverb) berúci do úvahy typ materiálu či dokonca efekty EAX používané v reálnom čase na mikrofónový vstup počítača. 

Nie vždy však využitie tejto technológie bolo vnímané pozitívne. V hrách typu Call of Duty 2 (Infinity Ward, 2005) či Quake 4 (Raven Software, 2005) síce mnohým hráčom vyhovovalo pri využití slúchadiel množstvo efektov a snaha hry realistickejšie umiestňovať zvuky v priestore, ale iní mali pocit, že audio efekty sú prehnané a oklúzia či filtrovanie zvukov ich vytŕhali z imerzie. Práve v Call of Duty 2 už bola možnosť zapnúť aj 5.1 priestorový zvuk, keďže s príchodom ďalších generácií zvukových kariet sa už stal štandardom. Pár rokov po SB Live! sa objavili na trhu karty ako Sound Blaster Audigy alebo X-Fi, ktoré už ponúkali dokonca 7.1 Dolby Digital priestorový zvuk a veľké možnosti na tvorbu hudby na PC doma.

EAX nebola jediná technológia na počítačoch, ktorá sa snažila simulovať environmentálne a priestorové efekty v hrách. Koncom 90. rokov pracovala na nových technológiách aj spoločnosť Aureal Semiconductor, úspešne konkurujúca spoločnosti Creative. Dôležité boli hlavne A3D (Aureal 3-Dimensional) a Vortex. Vortex predstavoval čipset zabudovaný do zvukových kariet. Jeho úlohou bola akcelerácia technológie A3D – tá pracovala s 3D audiom v slúchadlách, ale aj v stereo reproduktoroch či systémoch so štyrmi reproduktormi. Využívala funkciu HRTF (head-related transfer functions), teda funkciu simulujúcu a prerátavajúcu odrazy zvuku v priestore tak, ako ich počuje človek vďaka tomu, že do každého ucha prichádza zvuk z iného uhla a s miernym oneskorením. Technológia A3D bola pôvodne vyvinutá pre jeden z projektov NASA (Virtual Environment Workstation Project). Jedna z najpopulárnejších zvukových kariet, ktorá túto technológiu využívala, bola práve vyššie spomínaná Diamond Monster Sound MX300. Využívala čip Aureal Vortex 2 so vzorkovacou frekvenciou 48 kHz (hoci pri trojdimenzionálnom audiu využívala 44 kHz) a možnosťou mixovať až 320 nôt MIDI naraz. Naplno využívala technológiu DirectSound 3D a A3D. Podstatný rozdiel medzi touto kartou a konkurenčnými kartami od Creative s využitím EAX spočíval v tom, že A3D prepočítavala efekty environmentu v reálnom čase. 

Zvuk ovplyvňovali také činitele, ako napríklad veľkosť miestnosti, materiál stien, množstvo kobercov či nábytku, ale aj také detaily ako to, či sa zdroj zvuku nachádzal pod hladinou vody. Pomocou funkcie HRTF mal teda hráč veľmi realistický zážitok – hlavne pri využití slúchadiel alebo štyroch reproduktorov, keď nepriateľov či iné zvuky naozaj mohol počuť zreteľne za sebou. Táto technológia dokázala dokonca simulovať Dopplerov jav (teda zvukový efekt, ktorý vydáva objekt, ktorý prejde okolo nás – najjednoduchší príklad je auto na ceste – keď prejde okolo nás, zvuk sa mení a okrem intenzity zvuku klesá aj jeho výška). A3D bolo využívané v množstve hier (ako v spomínanom Half-Life, tak aj v FPS Unreal od Epic MegaGames z roku 1998 alebo v hre Thief: Dark Project od Looking Glass Studios z rovnakého roku), čiže sa dalo jednoducho porovnávať s EAX. 

Technológia Vortex 2 vyhrala svojho času viacero ocenení a konkrétne karta MX300 mala vďaka svojej kvalite mimoriadny úspech u hráčov aj u audiofilov. Hoci sa o technológii A3D doteraz hovorí ako o jednej z najlepších na trojdimenzionálny zvuk, na začiatku nového milénia sa vytratila. Spoločnosť Creative totiž zažalovala Aureal Semiconductor, a hoci spor vyhrala práve druhá strana, náklady na súdne spory spôsobili jej bankrot. Z hľadiska zvukového pokroku ide o negatívnu okolnosť, pretože ukážky spracovania priestorového zvuku technológiou A3D (či už v slúchadlách, alebo v reproduktoroch) aj po vyše 20 rokoch znejú fascinujúco. V nasledujúcich rokoch sa audio posúvalo ďalej rôznymi smermi. S príchodom operačného systému Windows Vista v roku 2007 napríklad prestali byť podporované funkcie DirectSound 3D. 

Výkonné interné zvukové karty v počítačoch v nasledujúcej dekáde postupne začali striedať externé zariadenia a to, na čo bol niekedy potrebný ďalší kúsok hardvéru, sa postupne začalo objavovať integrované do základných dosiek. Externé zvukové zariadenia, ako napríklad tie, ktoré vyrábala spoločnosť M-Audio už okolo roku 2005 (napríklad Fast Track Pro), mali viacero vstupov na mikrofóny či nástroje, množstvo výstupov (analógové aj digitálne) a do počítača sa pripájali jednoducho pomocou USB rozhrania. Takéto karty pomocou novších typov ovládačov (ako napríklad ASIO) vykonávali v PC všetky úkony spojené so zvukom. 

Pozoruhodný rozmach zaznamenali DAW (Digital Audio Workstation), teda softvéry umožňujúce jednoducho vytvárať na počítačoch hudbu a zvukový dizajn. Medzi najpopulárnejšie patria doteraz Cubase, Ableton Live, Reaper či ProTools (hoci ten sa spája hlavne s filmovým priemyslom). Firma Steinberg, zodpovedná za vývoj softvéru Cubase, vytvorila už v roku 1996 technológiu VST (Virtual Studio Technology), ktorú o niekoľko rokov zadarmo poskytla aj ostatným spoločnostiam, čím vytvorila novodobý štandard v používaní digitálnych nástrojov. Takzvané VST pluginy existovali v podobe audio efektov, ale aj zvukových inštrumentov schopných dokonale imitovať v podstate akýkoľvek nástroj (od digitálnych syntetizátorov cez klavír, gitaru až po rôzne raritné nástroje). 

image.png

Obr. 30: Projekt v programe Reaper

Komponovanie hudby na vysokej úrovni a vytváranie zvukových efektov tak začalo byť dostupné v podstate pre každého, kto vlastnil počítač (samozrejme, aj spoločnosť Apple mala vlastný DAW v podobe Logic Pro). Keďže jednou z hlavných vlastností DAW je jednoduchá a rýchla práca s MIDI, netrvalo dlho a adaptívna hudba a dynamický zvuk sa začali posúvať rýchlo vpred. Novodobé digitálne inštrumenty a knižnice mohli bez problémov zastúpiť celý orchester. Aby toho nebolo málo, do povedomia sa začali dostávať ďalšie softvéry – napr. zvukový midlvér.

Realistické zobrazenie

Plné využitie shaderov, slúžiaceho na riadenie jednotlivých častí  grafickej karty, umožňoval aj engine id Tech 3, avšak postupne mu začal konkurovať ďalší herný engine s názvom Unreal, ktorý vznikol pri vývoji rovnomennej hry z roku 1998. Jeho tvorca Tim Sweeney a spoluzakladateľ spoločnosti Epic Games sa rozhodol svoj engine poskytovať ďalším vývojárom prostredníctvom licencie, ktorej súčasťou bola pomoc s implementáciou do jednotlivých hier. Vďaka tomu vzniklo okrem kultového multiplayerového pokračovania Unreal Tournament aj množstvo ďalších známych hier od Deus Ex (2000) cez sériu Gears Of War (2006), Mass Effect (2007) až po PlayerUnknown’s Battlegrounds (2017), Fortnite (2017) či Valorant (2019).

V hernom priemysle postupne vznikli aj ďalšie herné enginy, no väčšina z nich bola buď určená pre nezávislých vývojárov a nedosahovala kvality prémiových AAA hier (napr. Godot či Game Maker), alebo nebola verejne dostupná a slúžila len na interný vývoj špecifických titulov (napr. Cry Engine, REDEngine alebo Frostbite). Výnimku tvorí jedine engine Unity, ktorý vznikol v snahe otvoriť možnosti herného vývoja pre čo najviac ľudí. Jeho využitie na vývoj hier bolo podobne ako pri Unreal Engine bezplatné, pričom k spoplatneniu došlo až v momente, keď sa vyvíjala hra schopná zarábať peniaze. V snahe o dosiahnutie maximálne realistickej a detailnej grafiky umožnili herné enginy podporu procesov, ktoré simulujú fyziku svetla v reálnom svete. Ide predovšetkým o dynamické svetlo renderované prostredníctvom technológie HDR a Raytracing.

High Dynamic Range umožňuje renderovanie s použitím niekoľkých úrovní svetelnosti, ktoré sú skombinované tak, aby bola scéna rovnomerne nasvecovaná. Ide o techniku prevzatú z fotografie, pri ktorej sa využíva na kombináciu viacerých stupňov expozície rovnakej snímky. Pritom preexponované snímky dopĺňajú detaily v tmavých častiach a naopak, podexponované snímky poskytujú detaily, ktoré zanikli vo svetlejších častiach. Touto funkciou dnes disponujú priamo aj niektoré monitory a televízory.

Raytracing imituje vlastnosti skutočného svetla prostredníctvom výpočtu dráhy každého svetelného lúča emitovaného v rámci scény aj so všetkými odrazmi od jednotlivých plôch. Tento hardvérovo náročný proces, dovtedy využívaný len filmovým priemyslom, umožňuje vytvárať realisticky osvetlené prostredie v reálnom čase s použitím kompatibilných grafických kariet.

Systémy organickej simulácie svetla v kombinácii s dostatočným množstvom polygónov, fotorealistickými textúrami a vierohodnou animáciou modelov dokážu vytvoriť virtuálne scény, ktoré sú pre ľudské oko takmer na nerozoznanie od reality. Pokrok vyššie vymenovaných grafických prvkov sa dá pozorovať napríklad v rámci žánru simulačných hier, ktoré sa snažia virtuálne sprostredkovať zážitok z prirodzených ľudských aktivít, akými je napríklad hranie športov. Zápas vo virtuálnom futbalovom simulátore dokáže vierohodne napodobniť jeho priebeh vďaka replikovaniu postupov televíznych prenosov. Napriek tomu však ešte vždy existuje určitá hranica, za ktorou akokoľvek dokonalá prezentácia človeka vzbudzuje pocit určitej neprirodzenosti. Tento fenomén nazývaný uncanny valley súvisí s mierou sympatie voči prezentácii ľudského tela a tváre a nastáva, keď realistickosť zobrazenia prekročí identifikovateľnú hranicu „umelosti“ objektu a začína mať črty reálneho človeka. Nedosiahne však plnú uveriteľnosť a ostáva na hranici reálneho človeka a jeho podoby, ktorá však nenavodzuje dojem skutočného života. Zobrazenie človeka má mŕtvolný vzhľad alebo ako zombie, a to aj napriek snahe, aby jeho stvárnenie vyzeralo živo. Podobný dojem vyvolávajú tiež antropomorfné sochy, bábiky, figuríny alebo roboti.  

image.png

Obr. 31: Rôzne reprezentácie človeka na škále podobnosti a familiárnosti

V médiách, ktoré predchádzali počítačovo generovanej grafike, pomyselnú priepasť uveriteľnosti dokázali prekonať obrazy človeka, vytvorené záznamom reality. V statickom obraze fotografiou a v pohyblivej podobe prostredníctvom filmu. Virtuálny priestor tieto elementy skombinoval, no projektuje ich na prázdne trojrozmerné objekty, ktoré vznikli umelo, teda ľudskou činnosťou alebo využitím rôznych foriem umelej inteligencie. Nato, aby vznikla vizuálna prezentácia človeka, ktorá pôsobí reálne, je potrebné ho stvárňovať a zaznamenávať v trojrozmernom priestore, ktorý by prezentoval dané veličiny zobrazenia hmotných objektov. 

Takýto postup predpokladá nie polygónový, ale volumetrický model (objemový), ktorý rozdeľuje trojrozmerný priestor na osem rovnakých podpriestorov – kociek (niečo ako trojrozmerný raster) a ktorý definuje vlastnosti objektov v bodoch, teda reprezentuje ich virtuálne vlastnosti ako povrch, objemovú hmotnosť a i. Statické viacrozmerné objekty je možné zaznamenať prostredníctvom fotogrametrie, ktorá sa v minulosti využívala hlavne pri mapovaní terénu, no dnes dokáže zaznamenať aj najdrobnejšie detaily objektov a priestorov. Na pohyblivé záznamy slúži videogrametria produkujúca volumetrické video, prostredníctvom ktorého je možné vytvárať záznam, v ktorom sa kamera pohybuje okolo nasnímaných objektov. Tak môžu v budúcnosti vznikať interaktívne filmy alebo ekvivalenty FMV hier, ktoré konceptuálne rieši napríklad projekt VVV z kanadskej vysokej školy – Ontario College of Art & Design.

Interaktívna volumetria umožňujúca generovanie alebo manipuláciu jednotlivých bodov, častíc, tzv. voxelov (voxel je objemová častica). Prvýkrát bola použitá pri tvorbe terénov prostredníctvom enginu Voxel Space v sériách vojenských simulátorov Comanche (od 1992) a Delta Force (1998). Podobným spôsobom ju k tvorbe herného prostredia využili aj ďalšie hry ako Crysis (2007) a No Man´s Sky (2016). Špecifické využitie volumetrie priniesla hra Blade Runner (1997), ktorá s jej pomocou generovala aj postavy, no neumožňovala ich priame ovládanie. Existuje tiež množstvo hier, ktoré využívali volumetrické objekty v kombinácii s polygónovým herným svetom, ako napr. Blood (1997) a Shadow Warrior (1997).

Za skutočné využitie volumetrie pri znázornení objemu možno považovať hru Minecraft (2011), ktorá napriek (alebo vďaka) tomu, že zobrazuje len jednoduché polygonálne obrazce kociek, z ktorých pozostáva herný svet, uchováva údaje o ich pozícii v podobe voxelov. Vďaka tomu je možné jej prostredie preskúmavať získavaním údajov o jednotlivých bodoch, ktoré odhaľujú pozíciu a vzhľad ďalších kociek, ale tiež ich pridávaním do priestoru. Omnoho detailnejšou (aj keď stále výrazne kockatou) hrou, ktorá umožňuje deštrukciu podrobnejších volumetrických objektov je Teardown (2022).

Grafické karty sú však stále primárne orientované na renderovanie polygónov a voxely podporujú len svetelné efekty a tzv. volumetrickú hmlu v engine Unreal (od UE4), ktorá vytvára realistickú atmosféru v hrách S.T.A.L.K.E.R. (2009), Red Dead Redemption II (2018) alebo Control (2019). Vysoká náročnosť na prepočet všetkých bodov pri bežnom výkone herných počítačov a konzol výrazne obmedzuje možnosti využitia volumetrie pri generovaní  komplexnejších objektov alebo pri kalkulácii ich pohybu a transformácie. Napriek tomu sa objavujú pokusy o jej implementáciu v nižšom rozlíšení, ako napríklad v hre Cloudpunk (2020) alebo v pripravovanej hre Hytale, inšpirovanej edukačnou hrou Minecraft. 

Je pravdepodobné, že technológie umožňujúce prenos obrazu, ktorý v reálnom čase renderuje výkonný hardvér prostredníctvom online služby v podobe videa (tzv. cloudové hranie – na diaľku), vytvoria priestor na ďalší rozvoj v tejto oblasti technológií. Obzvlášť prínosný môže byť najmä pri zariadeniach na virtuálnu realitu, ktoré môžu slúžiť len na zobrazovanie signálu, čo zníži nároky na ich výkon, alebo potrebu pripojenia na dedikovanú grafickú kartu. Druhou oblasťou, v ktorej volumetria zohráva kľúčovú úlohu, sú priestorové hologramy. Tie súvisia s ďalším fenoménom, ktorý prináša priestorový obraz prostredníctvom individuálnej stimulácie pravého a ľavého oka.

Ľudský mozog vníma hĺbku priestoru vďaka tomu, že každé oko poskytuje pohľad z mierne odlišného uhla. Rozdiel medzi nimi spôsobuje trojrozmerné vnímanie objektov a posudzovanie ich vzdialeností. Doteraz spomenuté spôsoby zobrazovania hier prostredníctvom obrazoviek pritom generujú iba jeden plochý, resp. mierne zahnutý obraz bez ohľadu na to, či sa hráč pohybuje v dvoj alebo trojrozmernom svete. Tento nedostatok plošného zobrazovania pritom dokážu ľudia čiastočne odstrániť už vyše 100 rokov vďaka princípu známemu ako stereografia. Stereografický obraz replikuje vnímanie reality z dvoch mierne posunutých bodov a každému oku ukazuje mierne iný statický alebo pohyblivý obraz. Túto metódu využívali na prelome 19. a 20. storočia jednoduché nástroje, do ktorých sa upevňovali stereografické fotografie tak, aby sa pohľad očí sústredil na dve rozličné miesta. Človek je schopný naučiť sa týmto spôsobom pozerať aj prostredníctvom vlastnej vôle špecifickým smerovaným očí, teda „škúlením“. Väčšina ľudí však potrebuje k prirodzenému pocitu z takto projektovaného obrazu okuliare oddeľujúce tieto dva obrazy. 

Odlíšenie obrazov je možné docieliť buď mechanicky, alebo posunom farebného spektra. Využitím okuliarov s farebným filtrom mozog dostáva prostredníctvom očí dva obrazy, pričom každé oko spracováva obraz vo farbe na opačnej strane spektra. Týmto spôsobom sa v minulosti spracúvali najmä komiksy a filmy. V súvislosti s hrami existovalo viacero pokusov s vytvorením separátnych obrazoviek na každé oko, pričom sú na oči prenášané dva plnohodnotné obrazy s pozmeneným uhlom. Za zariadenie, ktorému sa to úspešne podarilo, možno považovať automat s názvom Sensorama, ktorý okrem pohyblivého trojrozmerného obrazu dopĺňal zážitok o vibrácie, čuchové vnemy a vplyvy počasia, ako napríklad vetra. Podobne ako ani pri zariadeniach na sledovanie statických fotografií alebo filmov, tak ani v prípade automatu Sensorama pohyb hlavy priamo neovplyvňoval podobu premietaného obrazu a nereflektoval zmenu uhla v závislosti od polohy očí.  Túto vlastnosť pomenúva koncept stupňov slobody pohybu, tzn., v akej miere virtuálne zobrazované stereoskopické obrazy interagujú s pohybom človeka v reálnom priestore. Filmy a fotografie, ktoré by aj pokrývali 360° zorného poľa, stále budú rovnakým, vopred vygenerovaným obrazom, ktorý sa nebude meniť v závislosti od pohybu diváka. Ten môže pohybom hlavy sledovať ich rôzne časti, ktoré by boli inak mimo jeho zorného poľa. Ak by používateľ napríklad sedel a zrazu by sa postavil zo stoličky, pomyselná kamera by sa tiež zdvihla spolu s ním a preniesla by prostredie o niečo vyššie – namiesto toho, aby poskytla pohľad posunutý dohora. Pri zariadení Sensorama alebo aj pri pozeraní 360° videa na modernom headsete hovoríme o využití troch stupňov slobody. Skutočný pocit imerzie, pre ktorý sa už desaťročia ľudia pokúšajú zostrojiť čoraz prepracovanejší hardvér, však prináša až 6DoF, teda šesť stupňov slobody, ktoré umožňujú nazerať na virtuálne prostredie z uhla kopírujúceho pozíciu očí používateľa. 

image.png

Obr. 32: Ukážky z dobovej tlače zachytávajúce zariadenia pre zobrazovanie stereoskopického obrazu

Prvé zariadenie, ktoré dokázalo niečo také sprostredkovať, bol The Sword of Damocles (1968) Ivana Sutherlanda, založený na jeho štúdii Ultimate Display (1965). Zariadenie bolo postavené na robustnej laboratórnej konštrukcii, ktorá sofistikovanými prepojeniami zrkadiel prenášala počítačom generovaný pohľad na obrysy trojrozmerných objektov, pričom zohľadňovala uhol pohľadu v závislosti od pohybu hlavy.

V priebehu studenej vojny väčšinu vývoja a výskumu okolo zariadení na zobrazovanie virtuálnej reality prevzali firmy spolupracujúce s armádou, ktoré postupne technológiu vyvinuli do podoby, v akej ju prezentoval napríklad Virtual Environment Workstation Project (VIEW, 1989), projekt NASA na tréning kozmonautov. Komerčný rozmach nadobudli zariadenia so zabudovanými obrazovkami pre obe oči najmä v 90. rokoch. Neboli ešte pripravené na domáce hranie, ale ukazovali svoje možnosti v atrakciách zábavných parkov, kde ich využitie šlo nad rámec simulačných hier. Technológia virtuálnej a rozšírenej reality si v zmysle Gartnerovej krivky (opisujúcej priebeh osvojenia nových technológií) prešla počiatočnou fázou veľkého mediálneho záujmu aj neprimeraných očakávaní na prelome tisícročia. Prežila aj fázu sklamania, keď sa na trh dostali viaceré zariadenia, ktoré nespĺňali predstavu publika. S príchodom generácie, na začiatku ktorej bol úspešný používateľmi financovaný start-up Oculus, však postupne nastáva obdobie produktivity, ktoré už síce nie je natoľko mediálne zaujímavé, ale približuje virtuálnu realitu masovému osvojeniu. 

Je možné predpokladať, že čoskoro na dnešné zobrazovacie zariadenia budeme pozerať tak, ako sa dnes pozeráme na katódové trubice. Tomu však musí predchádzať zmena vnímania HMD (head mounted dosplay) zo samostatnej technológie na bežné zobrazovacie zariadnie na úrovni monitora. Napomôcť tomu môže technológia snímania pohybu oka umožňujúca generovať vo vysokom rozlíšení len oblasť, ktorú oko vníma ako ostrú. Takýto objem dát je jednodušie generovať mimo zariadenia a posielať vo forme digitálneho videosignálu prostredníctvom siete. Absencia potreby dedikovaného zariadenia s dostatočným výkonom pre každý monitor výrazne zníži celkové náklady na ich používanie.

Midlvér

V predchádzajúcich kapitolách sme si ukázali, že niektoré hry svojím adaptívnym a dynamickým zvukom naznačovali, kam sa bude audio uberať v budúcnosti. Ak by sme urobili naozaj hĺbkový prieskum, ako sa s implementáciou zvukov popasovali rôzne hry počas posledných dekád, prišli by sme na to, že niektoré z nich predbehli vývoj aj o viac ako dvadsať rokov. Prvá hra s generatívnym soundtrackom napríklad vznikla už v roku 1987 – išlo o hru Otocky (ASCII Corporation), vydanú pre Family Computer Disk System (rozšírenie konzoly NES). V nej hráč mohol okolo seba v ôsmich smeroch „strieľať“ loptu, ktorá brala rôzne bonusy. Hra bola sprevádzaná jednoduchým rytmom a hudobné noty s dokonalou kvantizáciou produkoval práve hráč v momente, keď stláčal tlačidlá na ovládači. V takom prípade nikto nepočul rovnakú hudbu, resp. rovnaké rozloženie tónov. 

Pár rokov predtým v hre Moondust (Creative Software, 1982) na počítači Commodore 64 mohol hráč počuť abstraktný soundtrack, ktorý sa v reálnom čase menil podľa toho, ako dokázal úroveň pokryť takzvaným „mesačným džúsom“. Rovnako ako v prípade konzoly Xbox a hlavne hry Halo: Combat Evolved postupy využité pri tvorbe zvukového dizajnu fungovali neskôr aj v rámci softvérov nazývaných midlvér, ktoré sa naplno začali využívať v prvej dekáde nového milénia a dnes sú už štandardom.

Pojem midlvér sa dá vysvetliť všeobecne ako softvér, ktorý vytvára niečo ako most medzi rôznymi ďalšími programami. V prípade zvukového dizajnu a hudby ide o zvukový midlvér, teda nástroj poskytujúci obrovské množstvo možností, ako so zvukom narábať nelineárnym spôsobom pri implementovaní do hier. Najjednoduchším príkladom takéhoto využitia je to, keď sa hra vyvíja napríklad v engine Unreal alebo Unity, ale implementácia zvukov sa vytvára práve vo zvukovom softvéri midlvér – teda v ďalšom programe, ktorého súčasti sú zakomponované do konkrétneho projektu v Unreal/Unity. Medzi najznámejšie softvéry tohto typu patria FMOD od spoločnosti Firelight Technologies a Wwise od spoločnosti Audiokinetic. Často sa využívajú aj ďalšie, ako napríklad Criware ADX2 alebo Elias Studio. FMOD ako systém, ktorý bolo možné integrovať do digitálnych hier, existoval už koncom 90. rokov minulého storočia (jeho prvé vydanie bolo už v roku 1995). Oproti tomu prvá komerčná verzia Wwise bola vydaná až v roku 2006. 

image.png

Obr. 33: Prostredie projektu programu Wwise

Prvé verzie FMOD vyzerali inak ako tá dnešná – išlo skôr o rôzne API (application programming interface), čiže rozhrania na programovanie aplikácií. Počas nasledujúcich rokov sa však oba softvéry vyvinuli na používateľsky prístupné aplikácie umožňujúce zvukovému dizajnérovi oveľa väčšiu kontrolu nad tým, ako budú zvuky vyznievať v tej-ktorej hre, s akým výsledným efektom. Hlavne v prípade FMOD a jeho dnešnej podoby FMOD Studio ide o softvér, ktorý v mnohom pripomína bežný DAW (horizontálne rozloženie stôp, automatizačné krivky a pod.).Systém práce v takýchto programoch sa ale líši od práce v klasickom DAW. Namiesto jednotlivých zvukov či hudobnej kompozície sa vytvárajú takzvané eventy, udalosti, ktoré predstavujú komplexnú sústavu príkazov a parametrov. Najjednoduchší príklad takéhoto eventu sú kroky – pomocou jedného z nástrojov (v prípade FMOD je to napríklad „Multi Instrument“) do prvku predstavujúceho kroky avatara vložíme trebárs desať jednotlivých zvukov kroku. Inštrument ich pri každom „privolaní“ (to musí byť implementované v hernom engine pri pohybe nôh hlavnej postavy) bude prehrávať náhodne. Na každý z týchto zvukov môže byť zároveň aplikovaná ďalšia úroveň náhodnosti zvukov napríklad v tom, že za každým prehratím zvuku sa mierne zmení jeho intenzita či výška. To vo výsledku spôsobí, že hráč nikdy nebude počuť rovnaký krok – presne tak, ako nikdy nepočujeme rovnaké zvuky v realite. Niektorí zvukoví dizajnéri idú až do takých detailov, že jednotlivé kroky ešte zvlášť rozdelia na dopad špičky a päty, čím spôsobia, že kombinácií jednotlivých krokov v samotnej hre je prakticky nekonečno. Oveľa komplexnejším spôsobom než v minulosti sa v rámci takýchto midlvérov pracuje aj s adaptívnym zvukom, resp. s hudbou. Využíva sa na to automatizácia – automatizačné krivky priradené ku konkrétnemu parametru (tých môže byť oveľa viac naraz), ktorý následne rozoznáva herný engine. Takýmto spôsobom je možné napríklad vytvoriť vertikálne orchestrovanú hudobnú skladbu, kde jednotlivé stopy budú pozostávať z niekoľkých variácií (iné nástroje, variácie na melódiu atď.). 

V rámci midlvérov jednoducho nastavíme číselný parameter (predstavujúci hodnoty napríklad od 0 po 1) tak, že napríklad od hodnoty 0 až po 0,24 bude hrať iba jednoduchý rytmus a všetky ostatné stopy zostanú stíšené. Ak parameter prejde na hodnoty od 0,25 do 0,49, pridá sa k nemu jednoduchá melódia v ďalšej stope, od 0,50 do 0,74 sa pridajú ďalšie nástroje či rytmus navyše a od 0,75 po 1 bude hrať intenzívnejšia, dramatická variácia s ďalšími nástrojmi či motívmi navyše. Tento parameter potom premietneme do enginu typu Unreal alebo Unity, kde k nemu buď pomocou kódu, alebo techniky tzv. blueprint priradíme čokoľvek, čo potrebujeme – napríklad umiestnenie hráča v rámci mapy, časť dňa práve v hre, úroveň hráčovho života, rýchlosť motora vozidla, vzdialenosť nepriateľa, fázu súboja či úroveň priblíženia na bojové pole v strategickej hre. Výhodou takéhoto vytvárania zvukov (resp. eventov a parametrov) je, že zvukový dizajnér či skladateľ už nemusí byť zároveň programátorom. Stačí, ak vopred ráta s dynamickým zvukom či adaptívnou hudbou, a tak od začiatku pristupuje aj k jeho tvoreniu. Výhodou práce v midlvéri sú aj rôzne vlastné pluginy využívané na komplexné zvukové elementy. V rámci FMOD je napríklad možné použiť jeho vlastný systém na dynamickú úpravu počasia v hrách alebo dedikovaný systém na vytváranie zvukov áut. Vo Wwise pre zmenu nájdeme komplexný generátor nekonečných variácií mávnutí mečom a rôznych prechodových zvukov alebo granulárny syntetizátor používaný pri časticových efektoch, 3D atmosférach a rôznych sci-fi elementoch v rámci UI.

Generatívny a procedurálny zvuk

Procedurálny zvuk v zásade predstavuje vzdialené synonymum na adaptívny zvuk, kde však treba rozlišovať medzi transformatívnym zvukomgeneratívnymi algoritmami. Transformatívny zvuk v podstate pripomína adaptívnu hudbu v takej podobe, ako ju už mnoho rokov poznáme. Môže predstavovať napríklad viacero variácií na jednu hudobnú frázu, v ktorých sa však menia jednotlivé tóny alebo inštrumenty, či dlhšie časti hudby – tie menia svoje usporiadanie na základe parametrov ovplyvňovaných hráčom. Naopak, generatívne algoritmy vytvárajú jednotlivé menšie časti hudby či zvuku v reálnom čase, a teda sú mierne náročnejšie na výkon procesoru a na samotné kódovanie, pretože dáta musia prúdiť do takéhoto systému spätne zo samotnej hry. Definície týchto pojmov nie sú však doteraz veľmi presné a veľmi často záleží na tom, kto o nich píše a v rámci akého projektu sa využívali, prípadne či využívajú v reálnom čase nejaký typ digitálnej syntézy. Príklady trochu modernejšieho využitia generatívnej hudby predstavujú hry ako Creatures 3 (Creature Labs, 1999), v ktorej boli nahrávané jednotlivé hudobné časti vo veľmi krátkych formách (separátne tóny alebo akordy) a tie počas hrania spájal herný algoritmus na základe toho, s akou „príšerou“ bol hráč práve v interakcii. Podobne bol veľmi invenčným spôsobom vytvorený soundtrack na hru Spore (Maxis, 2008). Brian Eno a Cliff Martinez do nej skomponovali hudbu tak, že vytvorili veľké množstvo krátkych hudobných samplov, ktoré opäť v reálnom čase spájal dokopy herný algoritmus. Hudba bola vytvorená vo vizuálnom programovacom rozhraní Pure Data a obsahovala množstvo pravidiel, na základe ktorých bola zložená. Jednotlivé časti zvukov napríklad nemohli miešať viacero hudobných stupníc dokopy a tak ďalej. V rámci novších hier je generatívna adaptívna hudba využitá napríklad v Thief 4 (Eidos-Montréal, 2014) a množstvo zvukových elementov je napríklad generovaných v spomínanej vesmírnej No Man´s Sky, kde sa generuje nielen hudba (na základe toho, kde sa hráč nachádza, aký typ planéty navštívil atď.), ale zároveň aj zvuky a hlasy mimozemských zvierat. Hoci by sa mohlo zdať, že takýto spôsob vytvárania zvukov a hudby na digitálne hry predstavuje jej budúcnosť, nie je to vždy pravda. 

Na jednej strane treba brať do úvahy, že len málo herných titulov naozaj potrebuje generovanú alebo adaptívnu hudbu. Ďalší nedoriešený problém spočíva v tom, že na rozdiel od MIDI sa s reálnym surovým zvukom (napríklad vo formáte wav) stále pracuje o trochu ťažšie a programovanie plynulého adaptívneho zvuku musí dodržiavať dôležité pravidlá – inak bude vývojár riskovať, že hráč namiesto imerzie bude vyrušovaný napríklad tým, že prechod do alternatívnej hudobnej slučky (variácie) nie je plynulý a podobne. Zvukoví dizajnéri ešte aj v súčasnosti musia využívať rôzne taktiky a triky, ako takéto prechody zakryť – jedným z nich sú už spomínané jednoduché „stingery“, teda kratšie zvuky či hudobné útvary, ktoré znejú presne vtedy, keď má začať iná variácia. Keď z pokojnej exploratívnej hudby prechádzame napríklad do bojovej, často je tento prechod sprevádzaný zvukovým efektom – úder činelov skombinovaný so zvukom vyťahovania meča, vokálny prvok otvárajúci bojovú verziu hudby a pod. Vďaka takému stingeru môže hudba prejsť na ďalšiu variáciu aj mimo rytmu/úderu/taktu a hráča to nebude rušiť. Pri generatívnej hudbe pozostávajúcej z veľkého množstva menších hudobných útvarov zase treba veľmi dobre zvážiť logiku, na základe ktorej bude takáto hudba vytváraná a k akým parametrom bude pridelená. Zároveň je potrebná znalosť hudobnej teórie (napr., ktoré tóny alebo škály spolu môžeme kombinovať a ktoré by zneli disharmonicky), nehovoriac o tom, že inak bude komplexnú generatívnu hudbu zvládať súčasná herná konzola či počítač a inak handheld s menším výkonom. Podobne treba uvažovať aj v kontexte žánra – je pravdepodobné, že epická fantasy adventúra bude skôr vyžadovať klasicky skomponovanú (a mierne lineárnejšiu) hudbu, naopak, akčná sci-fi strieľačka s abstraktnou a neustále sa pohybujúcou a meniacou sa grafikou oveľa lepšie využije generatívny elektronický soundtrack. 

Jedným zo spôsobov, ako sa ku zvuku v digitálnych hrách pristupuje v posledných rokoch čoraz viac, je aj takzvaná granulárna syntéza. Vo všeobecnosti je tento typ syntézy založený na tom, že ako vstup môže byť využitý akýkoľvek zvuk. Ten je potom prehrávaný špecifickým spôsobom, pri ktorom engine (alebo plugin) prehráva malé zvukové vzorky (kúsočky/čiastočky) – tie môžu byť minimálne, trvajú iba zopár milisekúnd, ale aj oveľa dlhšie. Pointou je, že takéto vzorky/kúsky – nazývané granule (z angl. grains) – sa prehrávajú veľmi rýchlo za sebou. Pritom je možné nastaviť množstvo variantov parametrov, ktoré výsledný zvuk menia. Tieto parametre môžu predstavovať napríklad počet vzoriek (granúl) prehrávaných v reálnom čase, ich meniacu sa intenzitu, randomizáciu miesta/času zvuku, z ktorého sú prehrávané, prípadne ich ADSR (teda to, či jednotlivé kúsky začnú hrať ostro, alebo majú jemný nábeh (fade-in), resp., ako dlho doznievajú atď.). Výhodou je, že reprodukovaný zvuk nikdy nie je rovnaký. Takto je možné vytvoriť napríklad z jednej nahrávky vetra nekonečne dlhý zvuk, či z krátkej nahrávky rieky nekonečne dlhú rieku – samozrejme, pri správnom nastavení parametrov.

Modernou verziou takéhoto systému prehrávania a vytvárania zvuku je takzvaná data-driven granulárna syntéza, teda postup, v rámci ktorého sú jednotlivé dáta v reálnom čase extrahované a prerátavané priamo v engine hry. Napríklad pri vytváraní dažďa stačí krátka nahrávka (aj 10 sekúnd). Naprogramovaný skript či program dokáže analyzovať túto nahrávku a rozoznáva jednotlivé kvapky vody (resp. takzvané tranzienty), dopadajúce na zem. Z týchto kvapiek potom vytvára spomínané „zrná“ (grains) a pomocou randomizácie množstva prvkov dokáže z desaťsekundovej nahrávky vytvoriť nekonečný dážď. Značnou výhodou takéhoto spôsobu je to, že sa v reálnom čase môže meniť napríklad počet kvapiek dopadajúcich na zem (stovky na slabší dážď, tisícky na silný dážď). Z nahrávky sa zároveň extrahuje šum primiešavajúci sa do výsledného zvuku,  čím sa vytvára veľmi realistický zvuk, prispôsobujúci sa stavu (situácii) v konkrétnej digitálnej hre. Pomocou takéhoto postupu je možné vytvárať napríklad zvuky tekutín (voda, láva) alebo randomizované zvuky – ruchy rôznych predmetov, pády, kolízie a i. Takýchto príkladov by sme našli viac.

Podobné metódy tvorby zvuku v digitálnych hrách sa začali vo väčšej miere využívať v rámci poslednej dekády a množstvo technológií je v tomto kontexte stále na začiatku. Naznačujeme tým, že vo zvukovom dizajne a v hudobnej zložke digitálnych hier zaznamenávame neustály pokrok. Čím ďalej, tým vyšší výkon herných konzol a počítačov umožňuje tvorbu čoraz komplexnejších systémov a realistických simulácií zvuku, nehovoriac o posunoch v ozvučovaní obsahu v spojitosti VR, AR (rozšírená realita), prichádzajúci nový špecifický virtuálny priestor (metaverse), ktorého zvuková identita sa stále iba formuje. V rámci tejto knihy nie je priestor na to, aby sme všetky podobné fenomény zachytili. V súčasnosti už prebieha životný cyklus deviatej generácie herných konzol (PlayStation 5, Xbox Series S/X), ponúkajúcich Dolby Atmos a výkon o triedu vyšší, ako mali ich predchodcovia. Priemerný súčasný počítač v našej domácnosti je schopný vytvoriť kompletnú hru s dokonalými textúrami a adaptívnym priestorovým audiom. 

Zvukový dizajn ako taký prechádza neustálou transformáciou a prakticky neobmedzené technologické možnosti prinášajú prekvapivé výsledky. Mnohí herní vývojári napríklad radšej založia auditívnu stránku svojich titulov na emotívnom alebo psychologickom pôsobení a hyperrealistické stvárnenie odmietajú. Za všetky tituly spomeňme napríklad Limbo alebo Inside (Playdead, 2010/2016), Darkwood (Acid Wizard Studio, 2017), Amnesia: The Dark Descent (Frictional Games, 2010) či Perception (The Deep End Games, 2017).

image.png

Obr. 34: Hra Perception

Herné audio postupne „dobieha“ vizuálnu stránku, ktorá bola počas histórie uprednostňovaná. S príchodom konzol Nintendo Wii či PlayStation 4 sa napríklad začali malé reproduktory zabudovávať priamo do ovládačov – zvuk tak vykročil ešte bližšie k hráčovi, rozširujúc úroveň imerzie a možností funkcií zvuku. Mnohé hry zároveň začali využívať mikrofóny ako extenzie herného sveta. Tituly survival

hororu ako Alien: Isolation (Creative Assembly, 2014), Stifled (Gattai Games, 2018) alebo Escape the Ayuwoki (Deadlycrow Games, 2019) používajú mikrofónový vstup ako reálny zvukový zdroj, na ktorý reagujú herné monštrá. V hre Stifled sa dokonca mikrofón používa na takzvanú echolokáciu (podobne ako vo vyššie spomínanom Perception), ktorá pomocou zvukových vĺn vytvorených hráčovým hlasom zobrazuje kontúry priestoru, resp. level dizajnu. Dá sa teda povedať, že hráč sa stáva jednou zo súčastí zvukového dizajnu. Rovnako adaptívna hudba dorástla do svojej dospelej podoby a hry ako Portal 2 (Valve Corporation, 2011) alebo Auditorium (Cipher Prime, 2008) ju využívajú ako plnohodnotný herný prvok. Digitálne hry sa dokonca dostali do fázy, keď živý hudobný koncert môžeme zažiť priamo vo svete nejednej MMORPG.

Zvukový dizajn ako disciplína dávno prerástol svet digitálnych hier či filmov. V súčasnosti sa napríklad uvažuje o tom, že nastávajúce elektrické autá budú mať zabudovaný vlastný engine vytvárajúci dokonalú imitáciu motora, čo vodičom bude poskytovať zvukovú spätnú väzbu (rovnako ako by sme to očakávali v hre). Generatívna hudba nás už niekoľko rokov obklopuje na miestach, kde by sme to vôbec nečakali (obchodné centrá, letiská a podobne). Ako sa začali šíriť vizuálne „deepfakes“ ľudských tvári, tak sa v súčasnosti vyvíjajú algoritmy, ktoré dokážu dokonale imitovať konkrétny ľudský hlas (napr. celebrity alebo politika). Vývoj teda napreduje neustále ďalej a je veľmi pravdepodobné, že množstvo nových technológií, ktoré budú dokonale klamať naše uši a zrak, nás ešte len čaká. 

Odporúčaná literátúra (obraz)

3D Graphics Rendering Cookbook - Sergey Kosarevsky & Viktor Latypov - ISBN 1838986197

A Brief History of Graphics - Ahoy, 2015  (videoesej) - youtube.com/watch?v=QyjyWUrHsFc

Art of Videogames - Grant Tavinor, 2009 - ISBN 1405187883

Brief History Of Video Games - Rich Stanton, 2019 - ISBN 1472143817

Computing: A Concise History - Paul E. Ceruzzi, 2012 - ISBN 9780262517676 

Modern Graphics Programming Primer - Hans de Ruiter, 2019 - ISBN 1794529454

Realita virtuálna - Lucia Mendelová, 2019 - ISBN 9788089916795

Replay: The History of Video Game - Tristan Donovan, 2010 - ISBN 0956507204

The First Video Game - Ahoy, 2019 (videoesej) - youtube.com/watch?v=uHQ4WCU1WQc

Video Games: A Graphic History - Tulien Sean & David Buisán, 2021 - ISBN 1541581504

Odporúčaná literátúra (zvuk)

Before the Crash: Early Video Game History - J. P. Wolf, 2012 - ISBN 978-0814334508

Complete Guide to Game Audio - Aaron Marks, 2017 - ISBN 978-1138795389

From Pac-Man to Pop Music: Interactive Audio in Games and New Media  - Karen Collins, 2008 - ISBN 978-0754662112

Game Development Essentials: Game Audio - Aaron Marks - Jeannie Novak, 2008 - ISBN 978-1428318069

Game Sound: An Introduction to the History, Theory, and Practice of Video Game Music and Sound Design - Karen Collins, 2008 - ISBN 978-0-262-03378-7

Leading With Sound: Proactive Sound Practices in Video Game Development - Rob Bridgett, 2021 - ISBN 978-0367535872

Predtým, ako nahráte svoj prvý zvuk - Tomáš Farkaš, 2021 - ISBN 978-80-8105-905-6

Principles of Game Audio and Sound Design - Jean-Luc Sinclair, 2020 - ISBN 978-1-138-73896-6

The Cambridge Companion to Video Game Music - Melanie Fritsch & Tim Summers, 2021 - ISBN 978-1-108-47302-6

The Game Audio Strategy Guide - Gina Zdanowicz & Spencer Bambrick, 2019 - ISBN 978-1138498341

Zdroje použitých obrázkov

1 en.wikipedia.org/wiki/Mechanical_Turk

2 daily.jstor.org/the-nimatron/  wired.com/2010/06/replay/  en.wikipedia.org/wiki/Bertie_the_Brain

3 easytechjunkie.com/what-is-a-cathode-ray-tube.htm

4 hackaday.com/2017/09/14/retrotectacular-a-video-game-odyssey/

5 en.wikipedia.org/wiki/Simon_(game)

6 stikeys.co/tutorials/sound-envelopes-shape-your-sound-using-adsr/

7 majicdesigns.github.io/MD_SN76489/page_a_d_s_r.html

8 en.wikipedia.org/wiki/Waveform

9 atelier-betoux.com/1-3-nes-gfx-storage/

10 spectrum.ieee.org/chip-hall-of-fame-mos-technology-6581

11 americanhistory.si.edu/collections/search/object/nmah_334636

12 gameanim.com/2014/01/07/prince-persia-rotoscopy/

13 musictech.com/guides/essential-guide/history-of-trackers/

14 thtsearch.com/content/Display_resolution/

15 musicradar.com/how-to/how-to-use-ableton-live-10s-wavetable-synth

16 Vlastné spracovanie, pracovné prostredie programu 

17 synth-studio.com/blog/synthesizers/roland-mt-32/

18 en.wikipedia.org/wiki/Sound_card

19 arcadeclub.co.uk/games/virtua-fighter/

20 flickr.com/photos/oskay/9373547904

21 en.wikipedia.org/wiki/Optical_disc_drive

22 gamesyouloved.com/game-genre/consoles/sony/playstation/vib-ribbon/

23 youtube.com/watch?v=mCPnPUSOLsE

24 materialpublic.imd.ufrn.br/curso/disciplina/5/1/9/4

25 deviantart.com/shenanigan87/art/Windows-95-812794743

26 cartridgecorner.blog/2017/02/12/seaman-dreamcast-wtf-games/

27 thesun.co.uk/news/2568281/gamings-first-sex-toy-is-already-15-years-old/

28 videogameartarchive.com/post/690344467263275008/bongo-controller-donkey-konga-gamecube

29 archive.org/details/XBOX_Communicator_2003_Microsoft

30 Vlastné spracovanie, pracovné prostredie programu 

31 en.wikipedia.org/wiki/Uncanny_valley

32 api.semanticscholar.org/CorpusID:203696889

33 Vlastné spracovanie, pracovné prostredie programu 

34 adventuregamers.com/screenshots/view/32027/72980