Stopařův průvodce digitálním zvukem - 4. díl

Odpovědět
jindrich
Příspěvky: 53
Registrován: 01 úno 2013 19:12

Stopařův průvodce digitálním zvukem - 4. díl

Příspěvek od jindrich »

Hlasitost signálu a její zneužívání.
8. 3. 2013

Problematika hlasitosti signálu je mnohem komplexnější, než by se na první pohled mohlo zdát. Ve světě digitálního audia jsou sice měřáky přítomny na každém kroku, ale moc nám nepomohou. Valná většina z nich totiž měří špičkovou hodnotu signálu a primárně slouží ke kontrole, že nepřekračujeme maximální úroveň daného zařízení a nedochází ke zkreslení. Takové měření nám ale dává jen skutečně velmi velmi omezenou informaci o tom, jak hlasitě bude signál vnímán a mezi dvěma signály se shodnou úrovní špiček může být značná odlišnost.
Obrázek
Rozdílnost vlastností signálu se stejně velkou špičkou.

Jak lze hlasitost měřit?
VU-metr
Zkratka VU znamená „Volume Unit“, jednotku hlasitosti. Jedná se o standard zavedený Americkou akustickou společností (ASA) v roce 1942 pro využití v telefonii a rádiovém vysílání. Měření má přesně danou a záměrně poměrně pomalou reakci. Díky tomu ignoruje špičky a spíše sleduje průměrné hodnoty. Takové zobrazení odpovídá mnohem více hlasitosti signálu.

V dobách převážně analogového záznamu celkem jasně určovalo optimální hodnotu hlasitosti za předpokladu, že bylo celé zapojení správně kalibrováno z hlediska úrovní. Zvukař si tak při práci mohl ověřit, že se pohybuje v optimální úrovni hlasitosti a celkem se nezajímal o špičkovou úroveň. Analogový řetězec stejně špičky svojí nelineárností neustále změkčoval, a to včetně samotného záznamového zařízení. Výsledkem byla určitá přirozenost a rozmanitost signálu. Schopnost pracovat optimálně s VU metrem ovšem vyžadovala cvik, správnou práci s hlasitostí poslechu a dobrou znalost pracovního prostředí.

Energie signálu
Často používanou metodou alespoň částečného vyhodnocení hlasitosti je sledování energie signálu, resp. jeho efektivní hodnoty. Tento postup vychází se základního faktu závislosti vjemu hlasitosti na zmiňovaných veličinách a ne na velikosti špičkových hodnot. Rozdíl efektivní a špičkové hodnoty nám ukazuje vnitřní dynamiku signálu. V angličtině je označován jako „Peak-to-RMS Ratio“ nebo také „Crest Factor“. Mnoho měřicích plug-inů ho přímo zobrazuje, ať už formou sloupcového ukazatele nebo pouze číselně. Problém je ovšem v dosažení skutečně jasně daného čísla, které by charakterizovalo daný zvuk a bylo by využitelné pro další práci, třeba pro kontrolu hlasitosti při vysílání.

V literatuře a na Internetu lze najít velké množství doporučení, jaký odstup špiček k efektivní hodnotě je vhodný pro různé aplikace. Jedná se o závislost na typu materiálu, ale často jsou doporučení i poměrně detailní v závislosti např. na konkrétním hudebním žánru. Těmito hodnotami popisuje přístup k dynamice signálu a hlasitosti i Bob Katz v legendární knize Mastering Audio: The Art and the Science (Focal Press, 2003, 2.vydání 2007). Problém je, že dosažení těchto hodnot je poměrně těžké ověřit, protože jsme odkázáni pouze na krátkodobé měření. Můžeme jen provést nastavení hodnoty odstupu špička - efektivní hodnota do určité hladiny a pak ji tam v rámci možností udržet. Různé měřicí nástroje navíc generují různé výsledky v závislosti na parametrech měření (zejména průměrování, délka analyzovaných segmentů atp.). Některé nástroje dokonce ani neuvádějí číselnou hodnotu (např. Digirack PhaseScope obsažený v Pro Tools). Jsme tedy odkázáni pouze na vágní sledování pohybu ukazatele. Je tedy zřejmé, že ačkoli nám může takové měření dát určitou orientační vědomost o stavu vnitřní dynamiky signálu, nelze ho brát jako parametr pro celkové hodnocení materiálu a rozhodně ho tak nelze využít pro účely standardizace hlasitosti, např. ve vysílacím řetězci.
Obrázek
Vyhodnocování efektivní hodnoty signálu různými nástroji.

Válka hlasitostí
Tento termín, angl. „Loudness War“, charakterizuje stav, který eskaloval právě s nástupem digitální techniky a nových možností úpravy signálu. Vysvětluje, proč mnoho komerčních (i těch teoreticky špičkových) nahrávek zní naprosto příšerně, jakmile se je pokusíme přehrát na lepším poslechovém zařízení než jsou reproduktory notebooku nebo malá pecková sluchátka.

Příčina 1. - Syndrom Jukebox
Ačkoli se jeví válka hlasitostí jako současný problém, jehož zhoršování v posledních několika letech výrazně zrychlilo, je podle mnohých třeba hledat prvotní příčinu podstatně dříve v historii. Jukebox, čili přehrávač desek umístěný v barech a různých jiných podnicích, za vhozenou minci přehrál platícím zvolenou skladbu. Tyto původně samozřejmě mechanické stroje obsahovaly gramofonové desky a v době své největší slávy byly jedním z hlavních kolbišť, kde se utkávaly nahrávky různých společností. Vzhledem k tomu, že ovládání hlasitosti bylo zapečetěno, znamenala větší úroveň hlasitosti signálu nahrávky vyšší výslednou hlasitost přehrávání. Když vezmeme v potaz fyziologickou akustiku, křivky stejné hlasitosti a jejich vliv na barvu vnímaného hudebního signálu o vyšší hlasitosti, získávaly hlasitější nahrávky výhodu, jelikož se neškoleným uším mohly zdát jako kvalitnější, mající více basů a vyšších kmitočtů, pronikavější zvuk atp. Tento fakt byl vzat nahrávacími společnostmi jako možnost zvýšit prodeje a popularitu svých produktů, pokud to budou právě ony, které z jukeboxu budou hrát nejhlasitěji. Došlo k naprosté dogmatizaci a o tomto faktu nikdo z pracovníků marketingových oddělení a producentů ani dnes nepochybuje. Lze nalézt mnoho historek o „muži v obleku z nahrávací společnosti“, který byl přítomen u finálních úprav nahrávky a z pozice „toho, kdo to platí“ trval na tom, že nahrávka musí být co nejvíce hlasitá.

Příčina 2. - Standardizace špiček
Nástup digitální techniky do zvukové praxe znamenal onen zásadní rozdíl v podobě naprosto jasně stanoveného stropu rozsahu signálu, hodnotě 0 dBFS odpovídající maximálnímu možnému číslu, které lze v zrovna využívaném formátu zapsat jako hodnotu amplitudy signálu. Díky tomu se pozornost zvukových mistrů a měřicí přístroje přeorientovaly na měření špičkových hodnot signálu a došlo k odklonu od měření pomocí VU metru. Prvotně šlo o snahu signál dobře modulovat, aby byl využit dostatečně velký počet hladin a bylo dosaženo co největšího odstupu signálu od kvantizačního šumu a zároveň nedošlo k přebuzení překročením maximální možné hodnoty.

S rozvojem digitálního zpracování zvukového signálu, zejména rozšířením limitérů s tzv. look-ahead funkcí a navíc s využitím číselného rozlišení s plovoucí řádovou čárkou, se starost o nepřekročení maximální špičky omezila prakticky jen na nahrávání. Při tvorbě výstupních produktů se v běžné praxi rozšířila až určitá bezstarostnost spolu s využitím limitérů k cílenému ořezání špiček a tím zvýšení průměrné hodnoty signálu, což znamená i zvýšení hlasitosti. Téměř všechny signály, jež nalezneme v televizi, rozhlase, na internetu a překvapivě i na CD, mají maximální dosaženou hodnotu signálu rovnou hodnotě maximální, ba co víc, dosahují jí prakticky neustále. Je totiž tak snadné dát se svést tím, že díky zmiňovaným limitérům se není třeba příliš zabývat výstupní úrovní a že se při kombinaci s kompresorem dá do výstupního řetězce poslat téměř libovolná úroveň a ono se to už postará...
Obrázek
Srovnání středně a silně limitovaného signálu.

Příčina 3. - Neochota otočit knoflíkem regulujícím hlasitost poslechu
Vzhledem k již zmiňovaným faktům z fyziologické akustiky je pochopitelné, že posluchači při shodné výstupní úrovni dvou signálů mohou z hlediska zvuku považovat za pro ně zajímavější či lepší ten, který má vyšší energii čili hlasitost. Zároveň je ale až zarážející fakt, který zná z praxe nejeden zvukař, že si posluchači i stěžují, když je nějaký signál příliš potichu, jen proto, že jsou zvyklí, že při dané poloze knoflíku regulujícího výstupní úroveň zesilovače hraje něco jiného víc nahlas. Zdá se, že otočit oním knoflíkem tak, aby dosáhli požadované úrovně poslechu, je pro ně nemyslitelné, rovnou si stěžují na „špatný zvuk“.

Příčina 4. - Signály s příliš velkým dynamickým rozsahem
Myslím ale, že by bylo vhodné doplnit mezi příčiny ještě extrémisty z opačného tábora. To, co bychom mohli nazvat dynamickým purismem, totiž přináší dle mého názoru více škody než užitku. Ponechání původní dynamiky totiž často znamená naprosté nezohlednění cílového média a přehrávacího systému. S tímto přístupem se lze setkat např. u rozhlasové hry Koule vydané na CD (vydal Radioservis) nebo u nahrávek vážné hudby. Problematické nahrávky často mají takový dynamický rozsah, že jejich nerušený poslech může probíhat pouze v přísně kontrolovaných podmínkách s kvalitním širokopásmovým reprodukčním systémem a dostatečným potlačením vnějšího hluku. K tomu ovšem dochází pouze v omezeném množství případů a zejména u rozhlasových her (jako je zmiňovaná Koule) lze očekávat spíše konzumní reprodukci v obývacím pokoji. V takovou chvíli není příjemné, když se zmiňovaná rozhlasová hra chová, jako kdyby posluchači někdo střídavě šeptal a křičel přímo do ucha. Nelze se potom divit posluchačům, kteří nemají žádnou znalost zvukové techniky a principů práce se zvukem, že takovou nahrávku odmítají a preferují tu, která je slyšet stále stejně a jejíž obsah je dobře srozumitelný, nebo takovou, která bude dobře poslouchatelná i v jejich autě. Často tak sáhnou po překomprimovaných nahrávkách a vytváří se v nich naopak ona zmiňovaná neochota otočit knoflíkem hlasitosti, čili raději akceptují produkty války hlasitostí.

Důsledek 1. - Technicky poškozené nahrávky
Již před pár lety (nelze a není ani potřeba stanovovat přesné datum) došlo nadužívání dynamických úprav tak daleko, že nahrávky vydávané velkými vydavatelstvími byly tak strašně „přezpracovány“, až se jejich poslech stal nepříjemným. Z pohledu zvukového profesionála se zdá, že příslušná hudba byla velmi dobře napsána, zaranžována, zahrána, nahrána a smíchána. Pak přichází problematická fáze masteringu, resp. zásahu osoby prodejně-marketingového typu, která z pozice zástupce vydavatelství začne ovlivňovat proces. Toto ovlivňování se dá charakterizovat jako „udělejte to ještě hlasitější“ nebo „udělejte to hlasité jako“. Tvůrce snadno podlehne pocitu, že je vše v pořádku, že tvoří zdravý signál a současně dostupné prostředky jsou zkrátka tak kvalitní, že dokáží téměř zázraky. Často se totiž nechá zmást tím, že „to prostě zní líp“, ačkoli je signál často jen hlasitější a při srovnávání se signálem před zpracováním s kompenzováním rozdílu hlasitostí je jasně slyšet, jak se signál zhoršil. Často tak vznikají signály, které jsou naopak velmi v nepořádku, dochází u nich k naprosto nadměrnému dosahování maximálních hodnot, které mohou znamenat zkreslení na výstupu D/A převodníku (již probírané mezivzorkové zkreslení), o ztrátě tranzientů a vnitřní i vnější dynamiky ani nemluvě.

Klasickými příznaky jsou např. bicí, které zní někde utopené pod zbytkem a nemají vůbec žádný důraz, nebo refrény s bohatším aranžmá, které nemají kam vyrůst a často znějí spíš méně zajímavě než sloky. Výsledkem jsou nahrávky, které sice znějí docela obstojně z mobilního telefonu položeného na stole před námi, ale při reprodukci i na podprůměrné soustavě reproduktorů je vjem dle mého názoru velmi nekvalitní. Chybějící vnitřní dynamika, ztráta tranzientů a působivosti jsou jen první fází, u současných nahrávek je totiž jasně patrné zkreslení, artefakty plynoucí z používání dynamických procesorů nad jejich možnosti a unavující pocit při poslechu takového signálu. Klasickým příkladem jsou třeba poslední nahrávky skupiny Metallica.

Důsledek 2. - Nerovnoměrná hlasitost ve vysílání
Všichni známe klasický problém mocného zvýšení hlasitosti při nástupu reklamního bloku. V praxi se totiž úroveň hlasitosti mezi jednotlivými pořady doteď prakticky neřeší, veškeré standardy vycházejí pouze ze špičkové úrovně. Jediné, na co se tedy dbá, je nepřekročení maximální úrovně před vysílacím procesorem a ponechání určité dynamické rezervy pro jeho práci. V televizním vysílání je špička stanovena většinou na -9 dBFS, v rozhlase např. na -6 dBFS. Při překročení těchto úrovní dochází k tvrdému ořezu, aby bylo zajištěno, že špička neprojde do vysílače, kde by mohla znamenat překročení maximálního výkonu. Tím ale standardizování končí. Výsledek známe často z každodenního života. Reklamy jsou natolik překomprimované, že i při poslechu z běžné televize mohou být otravně hlasité ve srovnání se sledovaným pořadem.

Řešení
V současné době se ale situace obrací k lepšímu. Mezinárodní telekomunikační unie (ITU) a Evropská vysílací unie (EBU) konečně vyvinuly a začaly šířit standard měření a z něj vycházející normu hlasitosti pořadů. Byla zavedena nová jednotka LU - Loudness Unit a tři metody měření, okamžitá, krátkodobá a celková hlasitost. Zatímco první dvě jsou orientační pro využití při tvorbě zvukových signálů, celková hlasitost dává každému pořadu určité razítko. Všechny pořady by měly mít optimální hlasitost -23 LUFS, vztaženo vůči maximální hodnotě rozsahu. Sledován je i dynamický rozsah, který by měl odpovídat typu pořadu. Zároveň je změněn standard měření špiček na tzv. TruePeak, který hlídá i mezivzorkové zkreslení. Pokud vše půjde jak má, všechny zmiňované problémy zmizí. Pokud totiž nějaký signál bude mít hlasitost vyšší než je stanovená norma, bude jednoduchým snížením úrovně „srovnán do latě“. Ztráta kvality spojená se získáním hlasitosti navíc přetrvá, vyšší hlasitost zmizí, nebude tedy důvod se do toho pouštět. Problém je tak snad vyřešen...
Obrázek
Měřicí nástroj podle nových norem od firmy Waves.

Příště
V příštím dílu seriálu se budeme zabývat digitálními rozhraními a synchronizací.

Jindřich Kravařík


Další díly seriálu
1. díl - ./recenze/stoparuv-pruvodce-digitalnim- ... 18487.html
2. díl - ./recenze/stoparuv-pruvodce-digitalnim- ... 18556.html
3. díl - ./recenze/stoparuv-pruvodce-digitalnim- ... 18718.html
5. díl - ./recenze/stoparuv-pruvodce-digitalnim- ... 19337.html
6. díl - ./recenze/stoparuv-pruvodce-digitalnim- ... 19447.html
PROFIL AUTORA: Ing. MgA. Jindřich Kravařík
Vystudoval ČVUT FEL se zaměřením na digitální zpracování signálů a tvorbu VST plug-inů a obor Zvuková tvorba na HAMU. Věnuje se převážně studiové práci, sound designu a tvorbě hudby pro video projekty - v rámci audiovizuálního MERGE studia a zvukového a nahrávacího studia Sype Studios. Šest let se též věnoval dabingu ve studiu Barrandov. V současné době občas vymění studiové prostředí za čerstvý vzduch nebo jiné klimatizované prostory při live práci v divadle Archa a s Cirkem La Putyka.

Odpovědět