kompresi audio dengan format mp3

Kompresi Audio MP3

dengan Teknik

Auditory Masking

SEJARAH MP3Moving Picture Experts Group Audio Layer-3 / Mp3

pertama kali muncul pada pertengahan tahun 1987.

Ketika itu, IIS (sebuah lembaga penelitian)-beserta

Thomson Multimedia memegang hak paten mp3-

melakukan kerja sama dengan University of

Erlangen dalam mengembangkan sebuah proyek

yang meneliti suatu formula matematis yang

memotong file digital audio tanpa harus kehilangan

sejumlah bagian atau informasi penting yang ada di

dalamnya

Keberadaan mp3 menjadi sangat terkenal pada

pertengahan tahun 1998, Shawn Fanning-

pemuda berumur 18 tahun di San Mateo,

California-beserta temannya, Sean Perker,

mendirikan perusahaan NAPSTER yang bergerak

dalam bidang internet. Perusahaan itu

menciptakan suatu perangkat lunak yang

memungkinkan jutaan orang di seluruh dunia

untuk saling bertukar rekaman musik melalui

komputer yang terhubung jaringan internet.

Tujuan daripada kompresi audio Untuk mengurangi/memperkecil kapasitas

memori; Mengurangi bandwidth( perbedaan antara

frekuensi terendah dan frekuensi tertinggi dalam rentang tertentu);

Sinyal suara ditejemahkan mirip dengan

sinyal aslinya.

Hasil kompresi dimaksimalkan sekecil

mungkin dari file sebelum dikompresi.

http://id.wikipedia.org/wiki/Frekuensi

Pembagian Frekuensi Suara:

Infrasound 0Hz – 20 Hz Pendengaran manusia 20Hz – 20 KHz

Ultrasound 20KHz – 1 GHz

Hypersound 1GHz – 10 THz

Mpeg Audio Layer 3 (mp3)

Metode kompresi dengan lossy compression. Sering digunakan di internet karena ukurannya yang

cukup kecil dibandingkan ukuran file audio lain. Distandarisasi pada tahun 1991 dengan format

sebagai ISO-MPEG Audio Layer-3. Kompresi dilakukan dengan menghilangkan bagian-

bagian bunyi yang kurang berguna bagi pendengaran manusia.

Kompresi mp3 untuk stereo dengan kualitas 128 bits dan 44100 Hz biasanya akan menghasilkan file berukuran 11-12 MB (44100 x 128 x 2=11.289.6000 bit/11MB)untuk file stereo, tetapi unsur panjang pendeknya lagu juga akan berpengaruh.

Mengapa Ukuran file MP3 dapat diperkecil ?

Hal ini karena beberapa karakteristik dari MP3 memanfaatkan kelemahan pendengaran manusia.

Yang kemudian kami bahas dengan teknik

Auditory Masking Effect

Tugas Multimedia – Widya Dharma TI 2012

Auditory Masking

Effect

Agung Moses C.SatriaJonatan

Auditory Masking yaitu ketidakmampuan manusia untuk

mendengarkan suara pada frekuensi tertentu dengan

amplitudo tertentu, dimana pada frekuensi didekatnya

terdapat suara dengan amplitudo yang lebih tinggi,

sehingga suara dengan frekuensi yang lebih rendah sulit

atau bahkan tidak terdengar.

Contohnya :

kita dapat mendengar nafas seseorang dalam ruangan

sunyi, namun jika dimainkan sebuah lagu dengan volume

tertentu maka nafas jadi tak terdengar.

Pengerti

an

MP3 memakai pengodean Pulse Code Modulation (

PCM) yaitu proses mengubah sinyal analog menjadi

sinyal digital. Dikembangkan oleh Karlheinz

Brandenburg.

Dengan tujuan mengurangi jumlah bit yang

diperlukan menggunakan

model psychoacoustic untuk menghilangkan

komponen-komponen suara yang tidak terdengar oleh

manusia.

http://id.wikipedia.org/w/index.php?title=Pulse_Code_Modulation&action=edit&redlink=1

http://id.wikipedia.org/w/index.php?title=PCM&action=edit&redlink=1

http://id.wikipedia.org/wiki/Bit

Kompresi yang dilakukan oleh mp3 , tidak

mempertahankan bentuk asli dari sinyal input.

Melainkan yang dilakukan adalah menghilangkan

suara-suara yang keberadaannya kurang/tidak

signifikan bagi sistem pendengaran manusia.

Maka Auditory Masking itu sendiri melakukan filter

dengan menghilangkan frekuensi rendah yang tidak

mampu terdengar oleh pendengaran manusia.

Dihilangkan agar dapat menyesuaikan pendengaran

manusia.

Proses yang dilakukan adalah menggunakan model

dari sistem pendengaran manusia. Dimana

Auditory akan menentukan frekuensi yang akan

diolah dan dikategorikan suara/audio yang dapat

didengar pendengaran manusia.

Setelah itu sinyal hasil yang memiliki domain

waktu dibagi menjadi blok-blok dan ditransformasi

menjadi domain frekuensi untuk diproses

selanjutnya.

Kemudian model dari sistem pendengaran manusia

dibandingkan dengan sinyal input dan dilakukan proses

pemfilteran yang menghasilkan sinyal dengan range frekuensi

yang signifikan bagi sistem pendengaran manusia.

Proses diatas adalah proses konvolusi dua sinyal yaitu sinyal

input(analog) dan sinyal model sistem pendengaran

manusia(yang telah difilter).

Langkah terakhir adalah kuantisasi data, dimana data yang

terkumpul setelah pemfilteran akan dikumpulkan menjadi satu

keluaran dan dilakukan pengkodean dengan hasil akhir file

audio dengan format MP3.

Proses pengkompresian mp3 dapat

menghasilkan keluaran suara yang

hampir setara dengan aslinya hal ini

disebabkan oleh kelemahan dari

sistem pendengaran manusia yang

dapat dimanfaatkan.

Proses Kompres File MP3

Blok pertama yang dilihat adalah blok Filter Bank. Filter Bank menggunakan solusi hibrid untuk MP3 yang

mengkombinasikan sebuah bank filter polifase dan sebuah Modified Discrete Cosine Transform (MDCT). Bank filter polifase adalah pemisahan awal audio stream menjadi frekuensi sub-band yang berjarak sama.Dengan sampel ini,frekuensi inti dipilih dan kemudian digunakan untuk kompresi.

MDCT digunakan pada 32 sub-band dari bank filter.Setiap jarak sub-band dilebarkan untuk bertumpang tindih dengan sub-band tetangga.Sampel baru diproses melalui MDCT dan ditambah dengan fungsi inversnya untuk membatalkan setiap kesalahan pada MDCT.Proses pembatalan ini dinamakan time domain aliasing cancellation.

Sampel hasil dilewatkan ke porsi dari encoder joint stereo coding. Joint stereo coding adalah dimana informasi yang berlebihan dan tidak penting dibuang dari bit stream.

Joint stereo Terkadang dual channel stereo mengirimkan informasi yang sama. Dengan menggunakan joint stereo, informasi yang sama ini cukup ditempatkan dalam salah satu channel saja dan ditambah dengan informasi tertentu. Dengan teknik ini bitrate dapat diperkecil.

Huffman

kompresi audio dengan format mp3

Education

dengan sampelini

hz pendengaran manusia

pembagian frekuensi

bits dan

mdct digunakan pada

subband dari bank filter

distandarisasi pada

diatas adalah