[integració digital de continguts] pràctica 1: Àudio digital

Upload: jordi-llonch

Post on 03-Apr-2018

221 views

Category:

Documents


0 download

TRANSCRIPT

  • 7/28/2019 [Integraci digital de continguts] Prctica 1: udio digital

    1/17

    Jordi Llonch Esteve | CC BY-NC-SA

    udio digitalINTEGRACI DIGITAL DE CONTINGUTS: PRCTICA 1

  • 7/28/2019 [Integraci digital de continguts] Prctica 1: udio digital

    2/17

    INTEGRACI DIGITAL DE CONTINGUTS PRCTICA 1: udio digital

    JORDI LLONCH ESTEVE CC BY-NC-SA PGINA 1/16

    ndex

    Exercici 1............................................................................................................................................... 2

    Exercici 2 .............................................................................................................................................. 6Exercici 3 .............................................................................................................................................. 9

    Exercici 4 ............................................................................................................................................. 10

    Bibliografia i altres recursos ........................................................................................................... 16

  • 7/28/2019 [Integraci digital de continguts] Prctica 1: udio digital

    3/17

    INTEGRACI DIGITAL DE CONTINGUTS PRCTICA 1: udio digital

    JORDI LLONCH ESTEVE CC BY-NC-SA PGINA 2/16

    Exercici 1

    Grcies a lanlisi espectral dels sons podem extreure molta informaci

    com l'ample de banda, les freqncies ms destacades, etc. En el fitxer

    1.zip hi ha una gravaci que cont les vocals (aeiou.au).

    1.1 Dividiu el fitxer en els diferents fragments que es corresponen les

    vocals, i feu una anlisi espectral de cada una. Feu una captura de

    lespectrograma per adjuntar-la a la resposta i indiqueu-ne les

    freqncies principals i qualsevol informaci que creieu que s necessria

    per identificar-les.

    Anlisi de freqncia i espectrograma de la vocal /a/

    A partir de la grfica obtinguda amb lanlisi de freqncia, trobem que aquestavocal /a/ t la seva freqncia fonamental als 118 Hz. A continuaci, detectemuna srie dharmnics en diferents zones de lespectre freqencial, el primer delsquals se situa prop dels 250 Hz, el segon als 400 Hz... I aix fins els 15 kHz, on elsenyal sesvaeix.

    La vocal /a/ acumula un gran nombre dharmnics en el rang de 118 1500 Hz,desprs produeix una vall fins els 3 kHz, on torna a agrupar harmnics fins els4,5 kHz i, finalment, disposa de petits matisos a 6 i 8 kHz.

  • 7/28/2019 [Integraci digital de continguts] Prctica 1: udio digital

    4/17

    INTEGRACI DIGITAL DE CONTINGUTS PRCTICA 1: udio digital

    JORDI LLONCH ESTEVE CC BY-NC-SA PGINA 3/16

    Anlisi de freqncia i espectrograma de la vocal /e/

    Aquesta vocal /e/ t la seva freqncia fonamental als 130 Hz i els seusharmnics sassemblen molt als de la vocal /a/, tot i que en t molts msdistributs per tot lespectre amb una nica vall profunda entre els 5 i 6 kHz.

    Anlisi de freqncia i espectrograma de la vocal /i/

    La vocal /i/ estudiada t la seva freqncia fonamental a 150 Hz i la forma irepetici dels harmnics es diferencia de les vocals /a/ i /e/ per disposar dunaprofunda vall entre els 500 i els 2000 Hz. Aquesta vocal es caracteritza peragrupar la seva majoria dharmnics entre els 2 i els 10 kHz.

  • 7/28/2019 [Integraci digital de continguts] Prctica 1: udio digital

    5/17

    INTEGRACI DIGITAL DE CONTINGUTS PRCTICA 1: udio digital

    JORDI LLONCH ESTEVE CC BY-NC-SA PGINA 4/16

    Anlisi de freqncia i espectrograma de la vocal /o/

    Igual que la vocal /e/, la vocal /o/ t la seva freqncia fonamental als 130 Hz,per es diferencia della perqu els seus harmnics estan distributs de formaespaiada i constant a lespectre i t valls pronunciades entre 1 i 2 kHz, entre 3 i 4kHz i al voltant dels 5 kHz.

    Anlisi de freqncia i espectrograma de la vocal /u/

    Per concloure, la vocal /u/ s la ms diferent de totes. Tot i tenir una freqnciafonamental de 150 Hz, igual que la /i/, els seus harmnics estan separats entre sper moltes valls i sagrupen al voltant d1 kHz, on el senyal sesvaeix.

  • 7/28/2019 [Integraci digital de continguts] Prctica 1: udio digital

    6/17

    INTEGRACI DIGITAL DE CONTINGUTS PRCTICA 1: udio digital

    JORDI LLONCH ESTEVE CC BY-NC-SA PGINA 5/16

    1.2 A partir de l'espectrograma del fitxer "aeiou.jpg" que es correspon a

    una seqncia de vocals, intenteu identificar els diferents fragments que

    es corresponen a les diferents vocals i identifiqueu-les. Apunteu les vocals

    sota de cada fragment on es corresponen i indiqueu els elementscaracterstics que heu utilitzat per arribar a aquesta soluci.

    I U A O O E U A I U E U

    Partint de les conclusions obtingudes a lapartat anterior, per a resoldre aquestapartat hem comparat les freqncies fonamentals i els harmnics de la imatgede lespectrograma superior amb les imatges dels espectrogrames generats per acada vocal individual.

    Per una banda, les vocals /i/ i /u/ tenen la seva freqncia fonamental als 150 Hz,per la posici dels seus harmnics sn completament diferents i, per tant, snfora fcils de distingir. Per altra banda, /a/, /e/ i /o/ tamb tenen les sevesfreqncies fonamentals fora properes (118, 130 i 130, respectivament), per elsseus harmnics no es diferencien tant com els d/i/ i /u/, cosa que fa que la sevacorrecta diferenciaci sigui mica ms complicada.

  • 7/28/2019 [Integraci digital de continguts] Prctica 1: udio digital

    7/17

    INTEGRACI DIGITAL DE CONTINGUTS PRCTICA 1: udio digital

    JORDI LLONCH ESTEVE CC BY-NC-SA PGINA 6/16

    Exercici 2

    Un dels parmetres ms crtics per poder digitalitzar qualsevol tipus de

    senyal sense prdues s la freqncia de mostreig. Amb aquest exercici

    intentarem mostrar perqu sempre lhem de tindre en compte.

    2.1 Graveu-vos dient una frase concreta i analitzeu-la per saber quina s la

    freqncia de mostreig mnima que podreu utilitzar per gravar-la.

    Adjunteu les captures per tal de mostrar com heu obtingut el valor de

    freqncia mnima.

    La frase de prova que hem gravat t una freqncia de mostreig de 44.100 Hz.Amb aix hem aconseguit una qualitat equivalent a la dun CD de msica, queofereix una resoluci de so molt elevada. La imatge segent mostra la forma

    dona i lespectrograma daquesta frase:

    Si mirem lescala de lespectrograma, veiem que lample de banda daquestaprova dudio se situa en 18 kHz, un valor que cobreix tot lespectre defreqncies utilitzades per la veu humana, per aix la qualitat s tan alta.

    A partir de la prova original, nhem generat un altre disminuint la freqncia demostreig a 16.000 Hz, reduint la quantitat de mostres per segon de loriginal en

    2,75 vegades. La imatge segent mostra lespectrograma daquest nou clip udio:

  • 7/28/2019 [Integraci digital de continguts] Prctica 1: udio digital

    8/17

    INTEGRACI DIGITAL DE CONTINGUTS PRCTICA 1: udio digital

    JORDI LLONCH ESTEVE CC BY-NC-SA PGINA 7/16

    Si el comparem amb el clip de 44.100 Hz, veiem que lescala de lespectrogramanoms arriba als 8 kHz, envers els 18 kHz als que arriba laltre arxiu. Aix vol dirque lample de banda daquesta prova dudio se situa, en 8 kHz.

    Tot i haver disminut lample de banda, la qualitat dudio resultant romangaireb intacta, i s la reducci ms baixa que podem fer abans que esprodueixin prdues dinformaci al clip dudio.

    Per a demostrar-ho analticament apliquem el teorema del mostreig icomprovem com es compleix amb exactitud:

    2.2 Utilitzant la mateixa frase, baixeu la freqncia de mostreig per

    utilitzar-ne una el ms propera possible a la mnima que heu calculat.

    Encara es pot reproduir correctament sense distorsions?

    La freqncia de mostreig ms propera possible a 16.000 Hz per sota della s lade 11.025 Hz. En reproduir el clip dudio amb aquesta nova freqncia podemapreciar que el so ha sofert una prdua dinformaci i posseeix distorsions, jaque la veu sona amb un efecte enllaunat.

    Si analitzem el seu espectrograma podem comprovar de manera analtica el quesom capaos descoltar amb la prpia oda.

    En aquest nou cas, veiem que lescala de lespectrograma ha tornat a disminuir iara cobreix noms fins als 5 kHz, cosa que significa que shan eliminat moltsharmnics que aportaven caracterstiques de timbre tpiques de la meva veu.

  • 7/28/2019 [Integraci digital de continguts] Prctica 1: udio digital

    9/17

    INTEGRACI DIGITAL DE CONTINGUTS PRCTICA 1: udio digital

    JORDI LLONCH ESTEVE CC BY-NC-SA PGINA 8/16

    2.3 Aneu baixant la freqncia fins que es comenci a sentir malament. A

    partir de quina freqncia heu detectat que realment es perdia qualitat?

    Compareu lespectre de la senyal amb loriginal per veuren les

    diferncies.

    La freqncia ms baixa a partir de la qual si es baixa ms es perd realmentqualitat s la de 8.000 Hz. Amb aquesta saconsegueix un ample de banda de 3,4kHz, que proporciona informaci suficient per a que la veu humana siguicomprensible.

    Les dues imatges segents sn els espectrogrames del clip dudio original a44.100 Hz i el del nou a 8.000 Hz. Tot i estar en escales logartmiques i, per tant,no representar les escales verticals de la mateixa manera, es pot comprovar com

    la versi de 8 kHz cont la mateixa informaci que loriginal, per noms fins elsprimers 3,4 kHz.

    Prova dudio original amb freqncia de mostreig de 44.100 Hz

    Prova dudio amb freqncia de mostreig de 8.000 Hz

  • 7/28/2019 [Integraci digital de continguts] Prctica 1: udio digital

    10/17

    INTEGRACI DIGITAL DE CONTINGUTS PRCTICA 1: udio digital

    JORDI LLONCH ESTEVE CC BY-NC-SA PGINA 9/16

    Exercici 3

    Tot i que cada vegada tenim la sensaci que Internet disposa de ms

    ample de banda, hi ha moltes aplicacions on ens interessa enviar el

    mnim dinformaci possible. Per exemple, si utilitzem programes de veu

    sobre IP per parlar amb els amics (per exemple Skype), el fet d utilitzar

    menys ample de banda ens permet tindre ms converses simultnies.

    3.1 A partir de la vostra gravaci anterior, ajusteu els parmetres que

    cregueu necessaris per a obtenir una versi que ocupi el mnim espai

    sense que es perdi una qualitat apreciable del so. Expliqueu els passos

    que heu utilitzat per a aconseguir-ho i perqu els heu triat. Indiqueu la

    mida original del fitxer i el del final.

    Partint dels resultats obtinguts en lexercici anterior, els parmetres escollits pera dur a terme aquesta codificaci sn:

    Cdec MP3: s un format de compressi amb prdues que descompon unsenyal utilitzant filtres per als diversos canals que es mostregen icodifiquen de manera independent respectant la sensibilitat de lodahumana a les diferents freqncies i rangs dinmics de cada canal.

    Quantificaci de 16 bits per mostra: permet 65.536 (216) nivells desenyal diferents sense comprometre en gran mesura la qualitat del so.

    Freqncia de mostreig de 16.000 Hz: s la freqncia ms baixa quecompleix el teorema del mostreig sense prdua dudio perceptible perloda humana.

    Apliquem aquestes caracterstiques al panell dexportaci dAdobe Auditionobrint el fitxer de la gravaci original i clicant aArchivo > Exportar > Archivo...

    La mida del fitxer original s de 543,4 kB, mentre que la del comprimit, 13,2 kB.Aix doncs, hem aconseguit reduir la mida del nou arxiu 41 vegades sense unaprdua de qualitat perceptible per loda humana.

  • 7/28/2019 [Integraci digital de continguts] Prctica 1: udio digital

    11/17

    INTEGRACI DIGITAL DE CONTINGUTS PRCTICA 1: udio digital

    JORDI LLONCH ESTEVE CC BY-NC-SA PGINA 10/16

    Exercici 4

    Els filtres sn unes eines que shan utilitzat sempre per tal de modificar

    ludio, per exemple per netejar-lo o aconseguir que un instrument

    musical tingui ms presncia.

    4.1 Genereu un senyal dudio que contingui 3 tons purs: 200Hz, 500Hz i

    1000Hz. Adjunteu lanlisi espectral indicant les 3 freqncies.

    Espectrograma del senyal dudio de 200, 500 i 1000 Hz

    Anlisi freqencial del senyal dudio de 200, 500 i 1000 Hz

    200 Hz500 Hz

    1000 Hz

    200 Hz

    500 Hz

    1000 Hz

  • 7/28/2019 [Integraci digital de continguts] Prctica 1: udio digital

    12/17

    INTEGRACI DIGITAL DE CONTINGUTS PRCTICA 1: udio digital

    JORDI LLONCH ESTEVE CC BY-NC-SA PGINA 11/16

    4.2 A partir d'aquest so, utilitzeu diferents filtres per a aconseguir els

    segents resultats. Realitzeu una captura del resultat indicant com lheu

    obtingut: tipus de filtre i els valors de com lheu ajustat:

    4.2.1 Eliminar els 500 Hz.

    Per a eliminar el to de 500 Hz hem redut en 60 dB la freqncia 500 Hz alequalitzador grfic, dos cops, amb la qual cosa aconseguim una reducci deldoble i eliminem tot rastre possible daquest to.

    Reducci dels 500 Hz a lequalitzador grfic

    Anlisi freqencial desprs deliminar el to de 500 Hz dos cops

  • 7/28/2019 [Integraci digital de continguts] Prctica 1: udio digital

    13/17

    INTEGRACI DIGITAL DE CONTINGUTS PRCTICA 1: udio digital

    JORDI LLONCH ESTEVE CC BY-NC-SA PGINA 12/16

    4.2.2 Eliminar tot menys els 200 Hz.

    En aquest cas, tenim dues possibilitats: aplicar un filtre de pas alt per sobre de lafreqncia dels 200 Hz o eliminar el tons de 500 Hz i 1000 Hz a l equalitzadorgrfic. Hem escollit reduir en 60 dB les freqncies de 500 i 1000 Hz alequalitzador grfic, dos cops tamb, per eliminar tot rastre possible daqueststons i aconseguir un to 200 Hz el ms pur possible.

    Reducci dels 500 i 1000 Hz a lequalitzador grfic

    Anlisi freqencial desprs deliminar els tons de 500 i 1000 Hz dos cops

  • 7/28/2019 [Integraci digital de continguts] Prctica 1: udio digital

    14/17

    INTEGRACI DIGITAL DE CONTINGUTS PRCTICA 1: udio digital

    JORDI LLONCH ESTEVE CC BY-NC-SA PGINA 13/16

    4.2.3 Eliminar tot menys els 500 Hz.

    En aquest cas tornem a tenir dues opcions: aplicar un filtre de pas de banda persobre i per sota dels 500 Hz o utilitzar lequalitzador grfic. En tractar-se dun soamb noms 3 tons purs hem escollit eliminar el tons de 200 Hz i 500 Hz reduinten 60 dB les seves freqncies a lequalitzador grfic, dos cops tamb, pereliminar tot rastre possible daquests tons i aconseguir un to de 500 Hz el mspur possible.

    Reducci dels 200 i 1000 Hz a lequalitzador grfic

    Anlisi freqencial desprs deliminar els tons de 200 i 1000 Hz dos cops

  • 7/28/2019 [Integraci digital de continguts] Prctica 1: udio digital

    15/17

    INTEGRACI DIGITAL DE CONTINGUTS PRCTICA 1: udio digital

    JORDI LLONCH ESTEVE CC BY-NC-SA PGINA 14/16

    4.2.4 Desplaar els 500 Hz a 750 Hz sense modificar els altres dos.

    Una de les formes possibles de dur a terme aquesta tasca s eliminant el to de500 Hz i generant-ne un altre a 750 Hz mitjanant lequalitzador grfic.

    udio original

    Eliminaci del to de 500 Hz

    Addici del to de 750 Hz

  • 7/28/2019 [Integraci digital de continguts] Prctica 1: udio digital

    16/17

    INTEGRACI DIGITAL DE CONTINGUTS PRCTICA 1: udio digital

    JORDI LLONCH ESTEVE CC BY-NC-SA PGINA 15/16

    4.2.5 Reduir lamplitud dels 1000 Hz a la meitat.

    Per al clcul del nombre de decibels requerits per a disminuir lamplitud dels1000 Hz a la meitat sutilitza una escala logartmica. Els nivells de decibels (LDB)sn proporcionals al logaritme (base 10) de la relaci de lamplitud (a) a un nivellde referencia (a0). El decibel, doncs, es defineix com:

    ( )

    Daquesta equaci en podem treure que un increment o reducci en lamplitudper un factor de dos equival a un increment o reducci de 6.02 decibels. Aixdoncs, per a reduir lamplitud dels to de 1000 Hz a la meitat hem utilitzatlequalitzador grfic per a disminuir en 6,02 dB la seva freqncia.

    Reducci de 6 dB als 1000 Hz a lequalitzador grfic

  • 7/28/2019 [Integraci digital de continguts] Prctica 1: udio digital

    17/17

    INTEGRACI DIGITAL DE CONTINGUTS PRCTICA 1: udio digital

    JORDI LLONCH ESTEVE CC BY-NC-SA PGINA 16/16

    Bibliografia i altres recursos

    Bonet Peitx, Xavier. Casas Torres, Llogari. Melenchn Maldonado, Javier.

    Tarrs Ruiz, Francesc (2012). Integraci digital de continguts. FUOC.

    Wikipedia. Decibel. http://en.wikipedia.org/wiki/Decibel [data de consulta:abril 2013]

    Wikipedia. Vowel.http://en.wikipedia.org/wiki/Vowel [data de consulta: abril2013]

    Help Adobe. Adobe Audition.http://helpx.adobe.com/es/audition/topics.html[data de consulta: abril 2013]

    La imatge de la portada s dAlec Dhuse (CC BY 3.0) i el logotip de la UOC spropietat de la Universitat Oberta de Catalunya. La resta dimatges sn decreaci prpia i sacullen a la mateixa llicncia que aquest document.

    http://en.wikipedia.org/wiki/Decibelhttp://en.wikipedia.org/wiki/Decibelhttp://en.wikipedia.org/wiki/Vowelhttp://en.wikipedia.org/wiki/Vowelhttp://en.wikipedia.org/wiki/Vowelhttp://helpx.adobe.com/es/audition/topics.htmlhttp://helpx.adobe.com/es/audition/topics.htmlhttp://helpx.adobe.com/es/audition/topics.htmlhttp://helpx.adobe.com/es/audition/topics.htmlhttp://en.wikipedia.org/wiki/Vowelhttp://en.wikipedia.org/wiki/Decibel