kompresi audio dengan format mp3
DESCRIPTION
fugas kuliah Widya Dharma Pontianak 2012TRANSCRIPT
Kompresi Audio MP3
dengan Teknik
Auditory Masking
SEJARAH MP3Moving Picture Experts Group Audio Layer-3 / Mp3
pertama kali muncul pada pertengahan tahun 1987.
Ketika itu, IIS (sebuah lembaga penelitian)-beserta
Thomson Multimedia memegang hak paten mp3-
melakukan kerja sama dengan University of
Erlangen dalam mengembangkan sebuah proyek
yang meneliti suatu formula matematis yang
memotong file digital audio tanpa harus kehilangan
sejumlah bagian atau informasi penting yang ada di
dalamnya
Keberadaan mp3 menjadi sangat terkenal pada
pertengahan tahun 1998, Shawn Fanning-
pemuda berumur 18 tahun di San Mateo,
California-beserta temannya, Sean Perker,
mendirikan perusahaan NAPSTER yang bergerak
dalam bidang internet. Perusahaan itu
menciptakan suatu perangkat lunak yang
memungkinkan jutaan orang di seluruh dunia
untuk saling bertukar rekaman musik melalui
komputer yang terhubung jaringan internet.
Tujuan daripada kompresi audio Untuk mengurangi/memperkecil kapasitas
memori; Mengurangi bandwidth( perbedaan antara
frekuensi terendah dan frekuensi tertinggi dalam rentang tertentu);
Sinyal suara ditejemahkan mirip dengan
sinyal aslinya.
Hasil kompresi dimaksimalkan sekecil
mungkin dari file sebelum dikompresi.
Pembagian Frekuensi Suara:
Infrasound 0Hz – 20 Hz Pendengaran manusia 20Hz – 20 KHz
Ultrasound 20KHz – 1 GHz
Hypersound 1GHz – 10 THz
Mpeg Audio Layer 3 (mp3)
Metode kompresi dengan lossy compression. Sering digunakan di internet karena ukurannya yang
cukup kecil dibandingkan ukuran file audio lain. Distandarisasi pada tahun 1991 dengan format
sebagai ISO-MPEG Audio Layer-3. Kompresi dilakukan dengan menghilangkan bagian-
bagian bunyi yang kurang berguna bagi pendengaran manusia.
Kompresi mp3 untuk stereo dengan kualitas 128 bits dan 44100 Hz biasanya akan menghasilkan file berukuran 11-12 MB (44100 x 128 x 2=11.289.6000 bit/11MB)untuk file stereo, tetapi unsur panjang pendeknya lagu juga akan berpengaruh.
Mengapa Ukuran file MP3 dapat diperkecil ?
Hal ini karena beberapa karakteristik dari MP3 memanfaatkan kelemahan pendengaran manusia.
Yang kemudian kami bahas dengan teknik
Auditory Masking Effect
Tugas Multimedia – Widya Dharma TI 2012
Auditory Masking
Effect
Agung Moses C.SatriaJonatan
Auditory Masking yaitu ketidakmampuan manusia untuk
mendengarkan suara pada frekuensi tertentu dengan
amplitudo tertentu, dimana pada frekuensi didekatnya
terdapat suara dengan amplitudo yang lebih tinggi,
sehingga suara dengan frekuensi yang lebih rendah sulit
atau bahkan tidak terdengar.
Contohnya :
kita dapat mendengar nafas seseorang dalam ruangan
sunyi, namun jika dimainkan sebuah lagu dengan volume
tertentu maka nafas jadi tak terdengar.
Pengerti
an
MP3 memakai pengodean Pulse Code Modulation (
PCM) yaitu proses mengubah sinyal analog menjadi
sinyal digital. Dikembangkan oleh Karlheinz
Brandenburg.
Dengan tujuan mengurangi jumlah bit yang
diperlukan menggunakan
model psychoacoustic untuk menghilangkan
komponen-komponen suara yang tidak terdengar oleh
manusia.
Kompresi yang dilakukan oleh mp3 , tidak
mempertahankan bentuk asli dari sinyal input.
Melainkan yang dilakukan adalah menghilangkan
suara-suara yang keberadaannya kurang/tidak
signifikan bagi sistem pendengaran manusia.
Maka Auditory Masking itu sendiri melakukan filter
dengan menghilangkan frekuensi rendah yang tidak
mampu terdengar oleh pendengaran manusia.
Dihilangkan agar dapat menyesuaikan pendengaran
manusia.
Proses yang dilakukan adalah menggunakan model
dari sistem pendengaran manusia. Dimana
Auditory akan menentukan frekuensi yang akan
diolah dan dikategorikan suara/audio yang dapat
didengar pendengaran manusia.
Setelah itu sinyal hasil yang memiliki domain
waktu dibagi menjadi blok-blok dan ditransformasi
menjadi domain frekuensi untuk diproses
selanjutnya.
Kemudian model dari sistem pendengaran manusia
dibandingkan dengan sinyal input dan dilakukan proses
pemfilteran yang menghasilkan sinyal dengan range frekuensi
yang signifikan bagi sistem pendengaran manusia.
Proses diatas adalah proses konvolusi dua sinyal yaitu sinyal
input(analog) dan sinyal model sistem pendengaran
manusia(yang telah difilter).
Langkah terakhir adalah kuantisasi data, dimana data yang
terkumpul setelah pemfilteran akan dikumpulkan menjadi satu
keluaran dan dilakukan pengkodean dengan hasil akhir file
audio dengan format MP3.
Proses pengkompresian mp3 dapat
menghasilkan keluaran suara yang
hampir setara dengan aslinya hal ini
disebabkan oleh kelemahan dari
sistem pendengaran manusia yang
dapat dimanfaatkan.
Proses Kompres File MP3
Blok pertama yang dilihat adalah blok Filter Bank. Filter Bank menggunakan solusi hibrid untuk MP3 yang
mengkombinasikan sebuah bank filter polifase dan sebuah Modified Discrete Cosine Transform (MDCT). Bank filter polifase adalah pemisahan awal audio stream menjadi frekuensi sub-band yang berjarak sama.Dengan sampel ini,frekuensi inti dipilih dan kemudian digunakan untuk kompresi.
MDCT digunakan pada 32 sub-band dari bank filter.Setiap jarak sub-band dilebarkan untuk bertumpang tindih dengan sub-band tetangga.Sampel baru diproses melalui MDCT dan ditambah dengan fungsi inversnya untuk membatalkan setiap kesalahan pada MDCT.Proses pembatalan ini dinamakan time domain aliasing cancellation.
Sampel hasil dilewatkan ke porsi dari encoder joint stereo coding. Joint stereo coding adalah dimana informasi yang berlebihan dan tidak penting dibuang dari bit stream.
Joint stereo Terkadang dual channel stereo mengirimkan informasi yang sama. Dengan menggunakan joint stereo, informasi yang sama ini cukup ditempatkan dalam salah satu channel saja dan ditambah dengan informasi tertentu. Dengan teknik ini bitrate dapat diperkecil.
Huffman