Popis MP3, Encoder LAME

Filetyp MP3 vychází, jak je zřejmé, z MPEG-3. Jednou jsem se pohádal v hospodě s nějakým idiotem, tvrdil totiž, že formát MPEG-3 prostě neexistuje a že zná akorát MPEG-1, 2 a 4. Mám pocit, že nikdy neviděl žádný film v MPEG-3, MPEG-1 je notoricky známý hlavně pro VIDEO CD, MPEG-2 se uplatnil hlavně v DVD formátu a MPEG-4 především jako streamový formát, protože vyniká až brutální kompresí a hodí se k přenosu po internetu. MPEG-3 byl vyvíjen v podstatě jako MPEG-2, který pracuje v plném rozlišení PAL/NTSC normy a datovým tokem do 10000 b/s. MPEG-2 tedy v průměru přenese asi 1.08 MB za sekundu, ale samozřejmě se jedná o proměnný tok. MPEG-3 měl přinést (skutečně ale funguje) daleko vyšší rozlišení. Pokud se někdy dočkáme digitální televize a nebude vymyšleno něco jiného, určitě bude formát MPEG-3 použit. Podle některých zdrojů vyžaduje tok asi 40000 b/s, což je darda a podle mého názoru je to zbytečné. Nicméně se notoricky známý institut rozhodl využít zvukovou část komprese a uvedl ji v praxi. Později skutečně nazval tento formát MPEG-Layer III, zkráceně MP3.

Základem všech MPEGů a komprese vůbec je komprimovat opakující se data. U obrazu je celkem jasné, že pokud se pozadí nehne, bude komprimováno na maximum. Je to dobře vidět při komprimaci s náhledem. Encoder načte snímek, načte další, vrátí se na první a porovná, co se změnilo. Co zůstalo stejné, není potřeba a zopakuje se to v dalším snímku v podstatě stejně. Pokud sledujte MPEGy na celé obrazovce, je to vidět hlavně tehdy, když se pozadí rozpohybuje. Tady záleží na encoderu, jak zvládne pohyb. Mnoho freewarovým a levných encoderů to moc dobře neumí. Výsledek jde potom do kostek, přelevání barev a nejhorším případě se začne obraz trhat. Tohle dekodér (přehrávač) neovlivní. Pokud si přehrávate filmy z VIDEO CD, určitě jste si toho všimly. Dnes toho už moc není, dříve se takto distribuovalo především erotické povzbuzení. Hlavně VIDEO CD je určitě horší než dobrá VHS-ka, nicméně je to digitální záznam. Pro encoder je také důležité nastavení datového toku a rozlišení, což bohužel v případě Video CD dost dobře nelze. Proto přišel formát Super VIDEO CD, který převzal téměř rozlišení DVD a pokud nemáte obří obrazovku, tak to téměř nepoznáte o DVD filmu. SVCD není žádný standart, ovšem spousta domácích DVD přehrávačů ho detekuje a přehraje. Hodláte-li si tedy zálohovat DVD na několik CD, máte dobrou volbu. Ta samozřejmě lehne zlevněním DVD vypalovaček a médií (jestli ovšem dřív nelehne DVD formát, protože formátů už je až nějak moc). Tím jsem snad dostatečně nastínil, že nejdůležitějším prvkem je začátek - vhodný způsob komprimace. Oko příliš neošálíte (oko vidí, oko není ...) - já poznám v televizi i DVCAM-ovej drop-out, což normální člověk neregistruje.

Se zvukem je trošičku jinak. Ouško oblafnete, že se tomu nedá věřit !!! Uznávám, že existují audiofilové, kteří poznají posunutý dělící kmitočet u reprobeden za půl milionu, Ti skutečně poznají i sebelepší udělanou MP3-ku. Osobně to poznám taky, protože vyšší a nižší kmitočty (frekvence hajtek a bassdrumu) jsou základem komprese MP3. Zkrátka je to ořezané, místy to až trhá uši. Důkazem budiž grafické znázornění. Vývoj zvukové komprese se zakládá na tzv. fyziologickém grafu zvukového vnímání. Komprese je založena na faktu, že 99% lidí neslyší nízké a vysoké frekvence, a pokud jsou potemnělé, tak už vůbec nikdo. Důležitým prvkem jsou opět opakující se data, což v případě stereo záznamu je porovnávání levého a pravého kanálu, který se u většiny frekvencí shoduje. To, že uši vnímají panaromatické efekty, jsou údajně pouze úzké frekvenční rozptyly. Tím se tedy dá ušetřit v průměru 40% !!! datového délky. Mezi další stupně patří neshopnost ucha rozpoznat zvukový chaos, ze své praxe uvedu např. začátek taktu, kdy v jednom okamžiku zní bassdrum (kopák, šlapák), basová linka, cymbal (činel), smyčce a další nástroje. V podstatě slyšíte zašumnělou ránu, která může trvat i více než jednu sekundu. Dalším faktem je šíření zvukových frekvencí. Signál na frekvenci 1 kHz slyšíte široko daleko (vzdálené sousedovo rádio ohlašuje celou hodinu), ale jinak ani nevíte, že někdo 100 metrů od Vás má cokoliv, i nahlas puštěné. Nízké kmitočty se šíří tunelovým efektem, takže na volné prostranství rychle slábnou, MP3 navíc ignoruje opravdu ty nejnižší frekvence, které by dokázaly zbourat město. Podobný případ je u vysokých frekvencí, nad 16 kHz málokdo vnímá, MP3 v tomto případě bere v úvahu jenom nejvyšší amplituty signálu a zbytek opakuje. Nejnižší stupeň komprese se tedy nachází někde mezi 400 a 4000 kHz, kde je lidská řeč, zpěv, kytary, piano, trubky atd.

Komprese MP3 tedy staví hlavně na kvalitním enkodéru, datovém toku a vstupním signálu. Starší enkodéry se vyznačovaly přílišným ořezáváním vysokých kmitočtů (podobně jako Dolby C) a kromě toho, že se to nedalo poslouchat, ještě úplně dokázaly odříznout závěrečný FADE OUT, pokud byl delší a plynulý. Na tomto základě také vznikl formát WMA, který vychytal mouchy starších MP3 enkodérů a i při toku 64 kb/s zní až neuvěřitelně dobře (Sorry, holt se Billovi něco drobet povedlo ...). Zveřejněním fyziologického grafu však pomohlo vývoji lepších enkodérů MP3. Mimochodem, komu z Vás vadí 8-bitový zvuk a max. 28 kHz, co leze z převodníků Amigy. Svoji roli opět hraje datový tok, který bývá v průměru na 128 kb/s, pro hluché postačí 64 kb/s, pro slyšící 256 kb/s.

A proč vlastně MP3 ??? Pravděpodobně se rozšířil kvůli internetu, přenášet 5 MB je přeco jenom snesitelnější než 50 MB. Ale zkrátka je tady. Finanční efekt pro posluchače to určitě nemá žádný, pro uživatele počítačů asi ano, ikdyž vypálit si Audio CD je otázka pár desítek korun a několika minut. Akorát že v případě pálení Audio CD vám možná porostou doma morové sloupy. Výhody vidím v desetinásobném množství hudby na jednu placku, kdo nemá počítadlo, nechť si pořídí MP3 přehrávač. Na druhou stranu na tom krachují vydavatelství, manažeři, hlavně muzikanti a autoři hudby. Já jenom, že dobrej synťák stojí pořád sto litrů a skuteční profíci nemají jenom jeden. Kolik stojí vybavení studií, co ten strávený čas a všechno ostatní. Takže pokud nejste chlapci z Luneticu (tj. miláčci adolescetních holčiček), jako muzikant dneska moc nevyděláte. Proto se vždycky Olympic rozpadne, pak zase udělají comeback, koncertní turné a desku. A lidi si to koupí, jdou na koncert atd. Taky si koupíte novou Amigu ??? Možná časem, hmmm. Ale jak si koupí kámoš, máte jí taky. Psychologie !!!

A nyní se konečně dostáváme asi k tomu hlavnímu. Přehrávače MP3 souborů snad nemusím ani jmenovat, jednak je součástí instalace OS 3.9 a na aminetu je jich taky dost. Nebudu se ani rozepisovat o grabování AudioTracků z CD. Věnujme se situaci, že mám na disku zvukové soubory a chci z nich udělat kvalitní MP3. Moc toho na výběr není, ale to co je, je úplně přesně to. Neuvěřitelně početná skupina vývojářů dala dohromady enkóder LAME a díky GNU licenci můžete enkóder ještě vylepšovat (je-li co vylepšovat). LAME je dostupný snad pro všechny operační systémy a pro Amigu (to je rozdíl, všimli jste si ... a pro Amigu!) lze stáhnout z Aminetu anebo z webu http://www.mp3dev.org. LAME rovná se Lame Ain´t an MP3 Encoder. Dosahuje naprosto nejlepších výsledků při kompresi v toku 128 kb/s. Umožňuje také vyšší proměnné toky včetně 256 kb/s (až 320 kb/s) a samozřejmě i nižší. MP3 umí také zpětně převádět. Vyžaduje údajně procesor minimálně 68040 anebo PowerPC. Kromě tohoto můžete vytvářet vlastní ID3 tagy, pokud to považujete za nutné. Upozorňuji, že LAME přijímá zvuk ve formátu WAV/44100/16bit/stereo. Jiné formáty a jiné typy rozlišení jako RAW PCM - přepínač -r a pro stereo přepínač -m.

Následující řádky popisují některé možné příkazové syntaxe LAME:

(cesta)soubor.wav (cesta)soubor.mp3 (běžný stupeň komprese s tokem 128 kb/s)

-h (cesta)soubor.wav (cesta)soubor.mp3 (kvalitnější komprese s tokem 128 kb/s)

-m s (cesta)soubor.wav (cesta)soubor.mp3 (rychlá a horší komprese pod 128 kb/s)

Existuje samozřejmě řada dalších možností, při kterých můžeme snížit frekvenci a datový tok pokud je to nutné (vše je popsáno v dokumentaci). Možností je celá řada, ale myslím, že uvedené budou asi nejčastější. Dále můžete komprimovat do formátu MPEG-Layer I a II či převádět oba typy do MPEG-Layer III a naopak. Troufám si napsat, že nic lepšího asi nenajdete. Také zpětný převod do původního formátu proběhl bez potíží, s mírnou ztrátou na kvalitě.

Testoval jsem pouze pod Amithlonem, takže uvádět tabulky časů výpočtů by asi nebylo relevantní, protože to v podstatě počítá emulátor (a hlavně Intel, sorry). Každopádně to šlo velice rychle a výsledky jsou perfektní. Jak to bude vypadat na 68040/40 račte vyzkoušet. Verze PowerPC občas zatuhla na konci výpočtu, ale to bych na program nesváděl (spíš lehlo něco jiného - jak je u mě zvykem). Takže směle koprimujte.

Ni.Q