[Guide] Audio Format - Part I : Pengertian Umum
Pengertian Umum
Audio Format
Audio format dapat berarti medium tempat penyimpanan data audio dan musik dalam bentuk fisik (E.g. Audio CD) dan format rekaman sebuah konten audio.
Dalam dunia Sains Komputer, audio format jg dapat disebut audio file format, yg berarti sebuah tempat dan bentuk penyimpanan data digital audio pada sistem komputer.
Secara garis besar, audio format terbagi menjadi 3, yaitu uncompressed format, lossless compressed format dan lossy compressed format.
Uncompressed Audio Format
Uncompressed audio format adalah sebuah format audio tanpa kompresi, yg berarti dapat menyimpan audio dengan tetap mempertahankan keutuhan setiap bit dan sample rate dari sumber ia dihasilkan. Sebagai contoh, sebuah file uncompressed yg dihasilkan dari proses rip sebuah audio cd jg mempunyai spesifikasi yg sama dengan source-nya (2 channel PCM, 44kHz sample rate dan 16 bit depth). Selain dipilih untuk rip CD, format uncompressed jg lazim digunakan sebagai output format dari proses recording di software DAW (Digital Audio Workstation).
WAV (Windows) & AIFF (Mac OS) adalah contoh file format yg digunakan untuk menyimpan uncompressed PCM audio. Tanpa kompresi, maka wajar bila file WAV dan AIFF memiliki ukuran yg lebih besar dari compressed format. Selain itu, walaupun men-support metadata, informasi audio di WAV dan AIFF hanya dapat ditulis dan dikenali oleh player tertentu, seperti contohnya foobar2000 untuk WAV dan iTunes untuk AIFF.
Lossless Compressed Audio Format
Lossless compressed audio format, atau cukup disebut lossless format, adalah sebuah format audio yg dapat menyimpan data dengan size yg lebih kecil dari uncompressed format, namun dengan kualitas yg identik.
Lossless audio dihasilkan dari sebuah proses kompresi lossless, yg berarti proses pemampatan dengan cara mempertahankan data yg benar2 terpakai dan membuang data yg tidak diperlukan (dikenal dengan sebutan statistical redudancy).
Secara teori, lossless audio memiliki ukuran 55% - 65% dari ukuran uncompressed, namun angka ini bisa lebih rendah atau lebih tinggi, tergantung dari banyak dan kompleksnya data yg di-encode dari sumbernya.
Beberapa contoh lossless format adalah : FLAC, Monkey's Audio, WMA Lossless, Apple Lossless dan WavPack.
Lossy Compressed Audio Format
Lossy format dihasilkan dari proses lossy compression dengan tingkat kompresi yg lebih tinggi dari lossless, yg berarti pada proses kompresinya terjadi penghapusan data demi menekan ukuran file menjadi lebih rendah. Ini berbanding terbalik dengan pengertian lossless compression, dimana tidak ada degradasi kualitas pada output file.
Secara teori, tujuan utama lossy compression adalah membuang informasi pada audio yg tidak terlalu dapat terdengar oleh telinga (metode Psychoacoustics), namun pada prakteknya, akan ada noticeable differences antara lossy dengan lossless dan uncompressed format, terutama jika dikomparasikan pada high-end sound system.
Tingkat kompresi pada lossy dibagi menjadi beberapa level, dengan bitrate yg menjadi patokan utamanya. Semakin tinggi bitrate yg dipilih, semakin rendah tingkat loss of quality yg dihasilkan, vice versa.
Tingkat kompresi pada lossy dibagi menjadi beberapa level, dengan bitrate yg menjadi patokan utamanya. Semakin tinggi bitrate yg dipilih, semakin rendah tingkat loss of quality yg dihasilkan, vice versa.
MPEG Audio Layer III (file format mp3), Advanced Audio Coding (.m4a), Windows Media Audio (.wma), Musepack (.mpc) dan Vorbis (.ogg) adalah beberapa contoh lossy format yg populer saat ini.
Red Book
Red Book adalah format standar pada Audio CD (CDDA atau Compact Disc Digital Audio). Red Book menspesifikasikan properties sebuah CD, dari hal dasar seperti jumlah track maksimal (99) & durasi maksimal (79,8 menit), bentuk encoding digital audio pada CD (2 channel 16-bit LPCM dengan 44,1 KHz sample rate) sampai hal2 'advanced' seperti modulation system dan fitur error correction (CIRC).
Codec
Codec adalah sebuah program yg melakukan proses encoding dan decoding kepada sebuah signal atau data. Audio codec pada fungsi encode berguna untuk mengkompresi signal / data audio untuk kemudian disimpan pada file format tertentu, sementara pada fungsi decode berguna untuk 'membaca' file format untuk editing atau playback.
Audio codec berbeda dengan audio file format, dimana audio file format adalah tempat dan bentuk penyimpanan sebuah data audio, sementara codec adalah program yg berperan dalam melakukan proses read atau write kepada format tersebut.
Sample Rate
Sample Rate / Sampling Rate / Sampling Frequency mendefinisikan banyaknya sample -proses konversi continuous signal (analog) menjadi discrete signal (digital)- pada audio dalam satu detik dengan satuan Hertz (Hz). Sesuai Nyquist–Shannon sampling theorem, walaupun range frequency manusia berkisar antara 20Hz - 20kHz, angka sample rate diharuskan bernilai lebih dari 2 kali lipat dari maksimum frequency yg diproses agar signal dapat direkonstruksi secara sempurna.
44,1 kHz sample rate lazim digunakan untuk CD dan audio format umum di komputer, sementara angka lebih tinggi digunakan pada professional recording equipment (48kHz) dan media DVD & Blu-ray (48kHz, 96kHz atau 192kHz).
Bit Depth
Bit Depth menerangkan banyaknya jumlah bit data pada sebuah sample, dikenal juga dengan sebutan bit/sample. Sebuah audio cd atau audio format dalam komputer biasanya memiliki 16-bit data per sample, sementara 20 / 24 bit/sample umum digunakan untuk konten audio di DVD & Blu-ray.
Bit Rate
Bit rate adalah informasi jumlah data yg disimpan pada satuan waktu tertentu (biasanya detik). Pada uncompressed format, bit rate dapat dihitung dengan mengalikan sample rate, bit depth dan banyaknya channel (mono / stereo / surround), contohnya pada sebuah audio cd (2 channel 16-bit LPCM dengan 44,1 KHz sample rate) maka bitrate yg dimiliki adalah 1,411 kbps. Perhitungan ini tidak berlaku untuk compressed format, yg menggunakan algoritma kompresi dengan skema/preset yg berbeda antar 1 dengan lainnya.
Pada lossy format, jenis bit rate dapat dibagi menjadi 3 :
Constant Bit Rate (CBR), target bit rate yg konstan (sama) di sebuah file format. Tingkat CBR dapat dipilih pada proses encoding format tertentu, E.g. CBR 320kbps, 256kbps atau 128kbps di format mp3.
Variable Bit Rate (VBR), target bit rate rata-rata yg dipilih pada preset level tertentu dan ditentukan dengan simbol -V (VBR mp3) atau -Q (AAC & Ogg Vorbis). Contohnya encoding mp3 dengan preset -V1 akan menargetkan angka bitrate ~225 kbps, yg berarti bitrate dapat bervariasi (lebih tinggi atau rendah) dari 225 kbps, sesuai data yg di-encode.
Average Bit Rate (ABR), 'jalan tengah' dari CBR & VBR pada format mp3. Pengguna dapat bebas memilih target bitrate yg diinginkan antara 8 s/d 320 kbps dan encoder akan sedapat mungkin menghasilkan bitrate yg ditargetkan. Contohnya preset ABR 200kbps mungkin saja menghasilkan bitrate yg lebih tinggi atau lebih rendah dari angka 200 kbps.
Transcode
Pengertian umum dari transcode adalah proses konversi (convert) antar compressed format (lossless atau lossy) menjadi format lainnya. Istiliah transcode dapat diaplikasikan pada proses konversi :
Lossless to lossless
Konversi antar format lossless, bersifat istilah lossless transcoding, dimana tidak ada degradasi kualitas pada prosesnya.
Transcode jenis ini biasanya dilakukan untuk beralih ke format lossless lainnya yg mempunyai fitur berbeda dengan format sebelumnya. Contoh mudahnya men-transcode APE menjadi FLAC agar dapat diputar di portable music player.
Lossless to lossy
Konversi format lossless menjadi lossy, dan termasuk kategori lossy transcoding yg berarti ada degradasi kualitas sesuai kriteria output formatnya (lossy).
Biasa digunakan untuk menghemat space yg digunakan atau untuk kemudian ditransfer ke portable device yg tidak mendukung lossless untuk playback.
Lossy to lossless
Konversi lossy menjadi lossless. walau bersifat lossless, proses ini tidak dianjurkan karena akan menghasilkan output file sebesar ukuran lossless namun dengan kualitas lossy (dikenal dengan istilah 'fake lossless').
Anggapan salah jika format lossy akan terdengar lebih baik jika di-transcode menjadi lossless, jawabannya tidak, karena informasi file yg hilang pada lossy tidak akan kembali walaupun kembali di-transcode ke lossless.
Lossy to lossy
Konversi antar format lossy, bersifat lossy yg berarti ada degradasi kualitas walaupun di-transcode menjadi format & bitrate yg sama.
Gap
Gap adalah jeda pada sebuah track dalam sebuah CD yg pada umumnya berdurasi 2 detik, dengan atau tanpa audio (silence). Gap dapat dibagi menjadi Pregap (jeda sebelum track) dan Postgap (jeda setelah track). Pregap selalu digunakan sebelum track pertama sebuah audio cd (berdurasi 2 detik), bahkan di beberapa album digunakan untuk menyimpan hidden track yg hanya bisa dideteksi CD player tertentu (HTAO atau Hidden Track One Audio).
Sebagai perbandingan, gap tidak digunakan dalam kasus dimana beberapa atau bahkan semua track diharuskan menyambung satu sama lain untuk memberikan kesan "continuous" antar track, contohnya pada album dengan format live performance atau concept album (gapless playback).
Gap dapat dideteksi oleh software ripper sebelum proses rip dimulai dan user dapat memilih untuk mengacuhkan gap atau menambahkan durasi gap pada track sebelum atau sesudahnya. Jika gap terdeteksi, umumnya opsi yg dipilih adalah menambahkan durasi pada track sebelum gap.
ReplayGain
ReplayGain (RG) adalah sebuak teknik yg bertujuan menciptakan tingkat suara (loudness level) yg setara, yaitu 89dB. RG dapat diaplikasikan pada tingkat lagu (Track Gain) atau album (Album Gain) agar terjadi kesetaraan tingkat suara di dalam sebuah album. Informasi hasil scanning RG dapat disimpan di metadata (atau header) sebuah format, atau diaplikasikan secara permanen di tingkat audio. Keunggulan penyimpanan RG di metadata adalah suatu saat dapat dihapus untuk mengembalikan loudness level ke aslinya, berbeda dengan pengaplikasian di tingkat audio, yg bersifat permanen (tidak bisa di-undo).
Anda dapat men-scan RG pada sebuah track atau album dengan menggunakan foobar2000, Winamp atau Media Monkey. Perlu diperhatikan bahwa practically, RG dapat membuat sebuah audio dengan volume yg terdengar 'normal' menjadi lebih kecil, atau pada kasus lain, membuat audio yg terdengar kecil menjadi lebih keras dengan juga menghasilkan distorsi.
Metadata & Tag
Metadata pada file multimedia berarti sebuah data yg berisi informasi untuk sebuah file tertentu. Metadata pada audio file dapat menyimpan Tag, yaitu data yg berisi informasi artist, title, artwork, etc. pada suatu audio file.
Jenis Tag bisa berbeda-beda, tergantung pada format yg digunakan. Beberapa contohnya adalah ID3 untuk Mp3, APE untuk Monkey's Audio dan WavPack dan Vorbis Comment untuk Vorbis dan FLAC.
Cue Sheet
Cue sheet (atau Cue) adalah sebuah file yg berisi informasi lengkap sebuah file audio, terutama hasil rip dari CD. Sebuah file cue dapat berisi informasi umum seperti artist, title, track number, album, tahun rilis dan informasi teknikal seperti durasi, gap, pre-emphasis (pada CD tertentu), Disc ID (CDDB) dan Sound Recording ID (ISRC). File cue dapat dibuat oleh software CD ripper sebagai pelengkap dari file yg dibuat sebelumnya.
File cue dapat berguna pada proses playback dan burning untuk sebuah file image (hasil rip album yg disimpan dalam 1 file). dengan cue, file image dapat 'dipecah' oleh player dan software burning tertentu menjadi per track lengkap dengan informasi lainnya yg disimpan didalam cue tersebut.
ABX
ABX atau ABX Blind Test adalah salah satu metode double-blind test untuk membandingkan 2 file audio dan mengidentifikasi perbedaan antar keduanya. ABX tester akan menempatkan kedua file secara acak pada sample A dan sample B dan menempatkan salah satu file di sample X. Pendengar selanjutnya dapat memutar sample A, B dan X secara bergantian dan harus mengidentifikasi sample X adalah file audio dari sample A atau B.
Hasil dalam beberapa tes dapat dihitung dengan score atau persentase tebakan benar. Contoh score adalah "5/6" yg berarti 5 tebakan benar dalam 6 kali tes, sementara contoh persentase tebakan benar adalah "50%" (1 tebakan benar dalam 1 tes), 25% (2 tebakan benar dalam 2 tes), 50% (2 tebakan benar dalam 3 tes) dan seterusnya.
Anda dapat menggunakan ABX Test sederhana dengan menggunakan foobar2000 (dengan komponen ABX Comparator). Proses tes sedikit berbeda karena menggunakan lebih banyak sample, yaitu A, B, X & Y dan anda dapat memilih 1 dari 2 opsi setiap tesnya, X is A, Y is B atau Y is A, X is B.
Leave a Comment