MP3

MPEG-1 alebo MPEG-2 Audio Layer III,[4] najviac známy ako MP3 je patentovaný dekódovací formát stratovej kompresie digitálneho zvuku, založený na kompresnom algoritme definovanom skupinou MPEG (Motion Picture Experts Group). Je bežným zvukovým formátom pre streaming alebo ukladanie zvuku a takisto je de facto štandardom digitálnej zvukovej kompresie na prenos a prehrávanie hudby vo väčšine digitálnych hudobných prehrávačov.

MPEG-1 alebo MPEG-2 Audio Layer III
Prípona súboru.mp3[1]
Typ internetového médiaaudio/mpeg,[2] audio/MPA,[3] audio/mpa-robust[4]
TvorcaMoving Picture Experts Group
Prvá verzia1993[5]
Typ formátuKompresný zvukový formát, zvukový súborový formát
Štandard(y)ISO/IEC 11172-3,[5]
ISO/IEC 13818-3[6]

MP3 súbor, ktorý je vytvorený s konštantnou bitovou rýchlosťou 128 kbit/s zaberá približne len jedenástinu toho, ako súbor rovnakého zvuku uložený v bezstratovom zvukovom formáte (zvyčajne pre CD vo formáte Waveform Audio File Format (WAV)). MP3 súbor je možné vytvoriť s vyššou alebo nižšou bitovou rýchlosťou, z čoho vyplýva aj vyššia alebo horšia kvalita. 128 kbit/s predstavuje stupeň kompresie, pri ktorej laik zvyčajne nerozpozná rozdiel či ide o komprimovaný formát mp3 alebo súbor uložený bez strát.

Jedným z najobľúbenejších a najpoužívanejších kodekov mp3 je LAME, ktorý je dostupný bezplatne.

Po uplynutí posledných ochranných patentov v Spojených štátoch v máji 2017 vývojári (Fraunhofer a Technicolor (predtým Thomson) ukončili licencovanie mp3[7] (v Európe bol MP3 od roku 2012 bez ochranných patentov). Teraz je čiastočne voľným štandardom. [8]

História

Bol vyvinutý v roku 1991 a vydaný ako súčasť štandardu ISO/IEC 11172-3 (MPEG-1 Part 3) v roku 1993. Rozšírenia o nižšie dátové toky a vzorkovacie frekvencie boli vydané ako súčasť štandardu ISO/IEC 13818-3 (MPEG-2 Part 3) v roku 1995.

O vývoj formátu MP3 sa zaslúžil nemecký vedec Karlheinz Brandenburg, riaditeľ pobočky Frauenhoferovho ústavu pre mediálnu komunikáciu v Erlangene, a jeho vedecký tím v snahe vytvoriť dátovo menej náročný štandard vhodný pre použitie pre digitálne rozhlasové vysielanie DAB.

Bitová rýchlosť

Ako štandard pre MPEG-1 Audio Layer III sú špecifikované tieto bitové rýchlosti (ang. bitrate): 32, 40, 48, 56, 64, 80, 96, 112, 128, 160, 192, 224, 256 a 320 kbit/s, s dostupnými vzorkovacími frekvenciami 32, 44,1 a 48 kHz.[9]

MPEG-2 Audio Layer III má prípustné bitové rýchlosti 8, 16, 24, 32, 40, 48, 56, 64, 80, 96, 112, 128, 144, 160 kbit/s pri vzorkovacích frekvenciách 16, 22,05 a 24 kHz.

MPEG-2.5 Audio Layer III má obmedzené bitové rýchlosti 8, 16, 24, 32, 40, 48, 56 a 64 kbit/s pri vzorkovacích frekvenciách 8, 11,025, a 12 kHz.

Neštandardné bitové rýchlosti až do 640 kbit/s je možné dosiahnuť kodekom LAME, avšak viacero MP3 prehrávačov nedokážu tieto súbory prehrať. Podľa štandardu ISO sú dekodery schopné prehrať súbory s bitovou rýchlosťou do 320 kbit/s.[10]

MPEG Audio Layer III
dostupné bitové rýchlosti (kbit/s)[11][12][9][13][14]
MPEG-1
Audio Layer III
MPEG-2
Audio Layer III
MPEG-2.5
Audio Layer III
- 8 8
- 16 16
- 24 24
32 32 32
40 40 40
48 48 48
56 56 56
64 64 64
80 80
96 96
112 112
128 128
144 144
160 160
192 - -
224 - -
256 - -
320 - -
Podporované vzorkovacie frekvencie
zvukového formátu MPEG[11][12][9][13]
MPEG-1
Audio Layer III
MPEG-2
Audio Layer III
MPEG-2.5
Audio Layer III
- - 8000 Hz
- - 11025 Hz
- - 12000 Hz
- 16000 Hz -
- 22050 Hz -
- 24000 Hz -
32000 Hz - -
44100 Hz - -
48000 Hz - -

CBR a VBR

CBR - konštantná (constant) bitová rýchlosť - nech už je signál akýkoľvek, stále bude zakódovaný pomocou konštantného počtu bitov: Pôvodné vyjadrenia o kvalite zrovnateľnej s audio CD už pri 128 kbps sa ukázali ako mierne prehnané a často je používaný vyššia rýchlosť.[15]

VBR - premenlivá (variable) bitová rýchlosť umožňuje podľa potreby meniť bitový tok v závislosti na kódovanom signále. Pokiaľ je napríklad na začiatku alebo na konci skladby ticho, bitová rýchlosť sa automaticky zníži podľa vopred daných kritérií a to umožní mierne zmenšenie výslednej veľkosti zakódovaného súboru. Nevýhodou však je, že VBR nie je podporovaný niektorými prenosnými prehrávačmi.[15]

Počet kvantizačných úrovní

Pretože sa digitálny signál zvyčajne spracováva na zariadeniach (obsahujúcich analógovo-digitálny prevodník alebo digitálno-analógový prevodník) pracujúcich v dvojkovej číselnej sústave, bývajú počty kvantizačných úrovní rovné N-tej mocnine čísla 2, pričom pôvodný signál potom možno vyjadriť v N bitoch.

N = 16 bitov (2 byty) alebo tzv. CD kvalita používa zvyčajná spotrebná audio elektroniku (vrátane MP3 prehrávačov) a umožňuje rozlíšiť 216 teda 65 536 úrovní a teoreticky je odstup signálu od kvantizačného šumu 96 dB. Dávnejšie sa ešte pri zázname zvuku na počítačoch z dôvodov malej kapacity záznamových zariadení používala 8 bitová kvantizacia (telefónna kvalita),. Naopak, v štúdiovom spracovaní sa dnes používa 20 alebo 24 bitov (16 777 216 úrovní) kvantizácia (DVD - 5.1 kanál).

Stereo mód[15]

  • Joint stereo - pri tomto móde sa vychádza z predpokladu, že väčšinou je i pri stereo zázname obsah ľavého L a pravého R kanálu veľmi podobný a preto sa L a R kanály prevedú na stredový M=L+R a postranný S=L-R. Pri enkódovani sa potom viac bitov pridelí tomu stredovému, ktorý obsahuje dôležitejšie informácie. To umožňuje efektívne vylepšiť kvalitu kompresie. Pri prehrávaní sú potom spätne dopočítané pôvodné obsahy ľavého a pravého kanála. Všeobecne platí zásada, že joint stereo je vhodné použiť pri nízkych bitových rýchlostiach .
  • Stereo - enkodér pracujúci v tomto móde nevyužíva možných podobností medzi ľavým a pravým kanálom. Môže však prideliť jednému z kanálov viac bitov z celkového bitového toku a to v prípade, že druhý kanál obsahuje napríklad ticho alebo menej náročný signál z hľadiska kódovania.
  • Dual - každý kanál je kódovaný úplne samostatne a každému je pridelená presne polovina bitov. Použitie nachádza napríklad v jazykových aplikáciách (v jednom kanály angličtina, v druhom slovenčina).
  • Mono - mono záznam obsahuje iba polovicu informácie a preto mu stačí polovičný bitrate ako stereu (dual).

ID3 a ďalšie tagy

"Tag" vo zvukovom súborovom formáte je jeho časť, ktorá obsahuje metadáta, ako sú názov skladby, meno interpreta skladby, žáner skladby, album, číslo skladby a ďalšie informácie o obsahu súboru. Od roku 2010 sú najrozšírenejšími tagovými formátmi ID3v1 a ID3v2 a nedávno uvedený formát APEv2. Tieto tagy sú normálne vložené buď na začiatku alebo na konci súboru MP3, ale oddelene od zvukových dát.

Softvéry na prehrávanie alebo úpravu často obsahujú aj funkciu na úpravu tagov, avšak existuje aj viacero samostatných aplikácií na úpravu tagov (tag editor) ako napríklad TagScanner určených iba na tento účel.

Psychoakustika

MP3 sa snaží odstrániť redundanciu zvukového signálu na základe psychoakustického modelu. Teda zo vstupného signálu sa odoberú informácie, ktoré človek nepočuje, alebo si ich neuvedomuje. Využíva sa princíp časového a frekvenčného maskovania. Kompresia zvuku podľa štandardu MPEG-1 obsahuje 3 vrstvy, ktoré sa líšia kvalitou a obtiažnosťou implementácie.

Referencie

  1. Happy Birthday MP3! [online]. Fraunhofer IIS, 12. júl 2005, [cit. 2010-07-18]. Dostupné online.
  2. The audio/mpeg Media Type — RFC 3003 [online]. IETF, November 2000, [cit. 2009-12-07]. Dostupné online.
  3. MIME Type Registration of RTP Payload Formats — RFC 3555 [online]. IETF, Júl 2003, [cit. 2009-12-07]. Dostupné online.
  4. A More Loss-Tolerant RTP Payload Format for MP3 Audio — RFC 5219 [online]. IETF, Február 2008, [cit. 2009-12-07]. Dostupné online.
  5. ISO/IEC 11172-3:1993 – Information technology — Coding of moving pictures and associated audio for digital storage media at up to about 1,5 Mbit/s — Part 3: Audio [online]. ISO, [cit. 2010-07-14]. Dostupné online.
  6. ISO/IEC 13818-3:1995 – Information technology — Generic coding of moving pictures and associated audio information — Part 3: Audio [online]. ISO, [cit. 2010-07-14]. Dostupné online.
  7. MP3 ist offiziell tot: Fraunhofer hat die Lizenzierung eingestellt. CURVED. Dostupné online [cit. 2018-11-28]. (po nemecky)
  8. Alive and Kicking – mp3 Software, Patents and Licenses | Fraunhofer Audio Blog. Fraunhofer Audio Blog, 2017-05-18. Dostupné online [cit. 2018-11-28]. (po anglicky)
  9. SUPUROVIC, Predrag. MPEG Audio Frame Header [online]. 22. december 1999, [cit. 2009-05-29]. Dostupné online.
  10. BOUVIGNE, Gabriel. freeformat at 640 kbit/s and foobar2000, possibilities? [online]. 28. november 2006, [cit. 2007-03-17]. Dostupné online.
  11. ISO. CD 11172-3 - CODING OF MOVING PICTURES AND ASSOCIATED AUDIO FOR DIGITAL STORAGE MEDIA AT UP TO ABOUT 1.5 MBIT/s Part 3 AUDIO [DOC]. neuron2.net, November 1991, [cit. 2010-07-17]. Dostupné online.
  12. MP3 technical details (MPEG-2 and MPEG-2.5) [online]. Fraunhofer IIS. Dostupné online.
  13. ISO/IEC 13818-3:1994(E) - Information Technology - Generic Coding of Moving Pictures and Associated Audio: Audio [ZIP]. [Cit. 2010-08-04]. Dostupné online.
  14. Guide to command line options (in CVS) [online]. [Cit. 2010-08-04]. Dostupné online.
  15. ANSAMBL - format MP3 [online]. ansambl.szm.com, [cit. 2018-11-28]. Dostupné online.

Pozri aj

Iné projekty

  • Commons ponúka multimediálne súbory na tému MP3

Externé odkazy

Programy na konvertovanie
Iné

Zdroj

Tento článok je čiastočný alebo úplný preklad článku MP3 na anglickej Wikipédii.

This article is issued from Wikipedia. The text is licensed under Creative Commons - Attribution - Sharealike. Additional terms may apply for the media files.