formatos de audio
DESCRIPTION
Formatos de AudioTRANSCRIPT
Formatos de audio
Enrique Alexandre (@e_alexandre)
¿Con o sin pérdidas?
• Codificadores con pérdidas (mp3, aac, wma, etc.):
• Utilizan modelos perceptuales para eliminar la información irrelevante.
• Es imposible reconstruir exactamente la señal original a partir de la codificada.
• Codificadores sin pérdidas (.flac, .alac, .ape, etc.):
• Se limitan a eliminar la información redundante.
• Se puede reconstruir de forma exacta la señal original a partir de la codificada.
ATC
ATC-ABS PXFMOCF
ATAC ASPECMUSICAM
Layer I, Layer II Layer III
ATRAC PASC
AC-3
TWIN-VQ
PAC
ASC
MPEG-2 AAC
MPEG-4 AUDIO
1977
1992
1994
1995
1997
1999
Análisis tiempo/frecuencia
Análisis psicoacústico
Cuantificación y codificación
Asignación de bits
Codificación entrópica
MUX
Estructura genérica de un codificador de audio
La familia MPEG
MPEG-1MPEG-2 BCMPEG-2 NBC (AAC)MPEG-4
ISO/IEC MPEG-1
• Estándar “semi-abierto”:
• Partes normativas e informativas.
• Uno o dos canales:
• Un solo canal monofónico
• Dos canales monofónicos independientes
• Dos canales stereo
• Joint-stereo
• Frecuencias de muestreo: 32 kHz (broadcast), 44.1 kHz (consumer) y 48 kHz (professional).
• Bitrates: 32-192 kbps (mono) y 64-384 kbps (stereo).
ISO/IEC MPEG-1
• Tres capas independientes con distintas complejidades:
• Capa I:
• Proporciona transparencia a 384 kbps.
• Complejidad media-baja.
• Aplicaciones: Philips Digital Compact Cassette (DCC).
• Capa II:
• Proporciona transparencia a 256 kbps.
• Complejidad media.
• Aplicaciones: DAB, DVB, radiodifusión
ISO/IEC MPEG-1
• Capa III (mp3)
• Proporciona transparencia a 192 kbps.
• Complejidad alta.
• Aplicaciones: ISDN (RDSI), Internet.
Nuevas variantes
• mp3PRO
• Proporciona el doble de rendimiento que el mp3
• Compatible hacia atrás con mp3
• mp3HD
• Codificador sin pérdidas compatible hacia atrás con mp3
mp3: Licencias
Codificación estéreo
• Objetivo: aprovechar las posibles redundancias (parecido) entre los dos canales de audio.
• Herramientas disponibles en el modo Joint Stereo:
• Mid/Side Stereo (M/S): Se transmite suma y diferencia en lugar de los canales originales.
• Intensity Stereo: Se transmite la energía y la panorámica. Funciona a altas frecuencias (>3kHz).
ISO/IEC MPEG-2 BC
• Ampliación compatible hacia atrás con MPEG-1.
• Características añadidas:
• Frecuencias de muestreo mitad (24, 22.05 y 16 kHz) para aplicaciones con menor ancho de banda.
• Codificación multicanal (5.1).
• Existe un MPEG-2.5, formato propietario del Fraunhofer, que permite frecuencias de muestreo inferiores (8, 11.025 y 12 kHz).
ISO/IEC MPEG-2 NBC / AAC
• Nuevo esquema, no compatible con los anteriores, que proporciona mejor rendimiento de codificación.
• Tres modos de operación:
• LC (Low Complexity)
• Main Profile
• SSR (Scalable Sampling Rate)
• Proporciona transparencia a 128 kbps (stereo) y 320 kbps (5.1)
• Aplicaciones comerciales:
• Apple iTunes, Sony PSP, Operadoras móviles (Movistar, Orange, etc,), DRM (Digital Radio Mondiale), DVB, etc.
Variante: HE-AAC ó aacPlus
• La misma idea que el mp3PRO
• Buena calidad de sonido estéreo a 48 kbps
ISO/IEC MPEG-4
• No es un nuevo esquema de codificación en sí, sino un conjunto de codificadores ya existentes unificados bajo un mismo estándar.
• Un fichero MPEG-4 puede contener audio, video, audio sintético, etc.
• Extensiones .mp4, .m4a y .3gp
Otros codificadores
Ogg VorbisMusepackOtros
Ogg Vorbis
• Codificador de audio libre
• Proporciona una calidad muy parecida a un MPEG-2 AAC
• Soporta frecuencias de muestreo desde 8kHz hasta 192 kHz
• Soporta desde 1 canal hasta 255
Musepack
• Codec basado en MPEG-1 Capa II
• Pensado para proporcionar muy alta calidad de audio a tasas binarias elevadas
• Extensión: .mpc
Otros codecs propietarios
• Windows Media Audio (WMA)
• Free Lossless Audio Codec (FLAC)
• RealAudio
Resumen: codificadores con pérdidas
Formato Año Gratis Bitrate Canales Latencia
mp3 1993 No 8-320 kbps 2 > 100ms
AAC 1997 No 8-529 kbps 48 20-405ms
AC-3 1992 No 32-640kbps 6 40.6 ms
Musepack 1997 Si 3-1300 kbps 8 ?
Vorbis 2000 Si Variable 255 > 100ms
WMA 1999 Si (Windows) 8-768 kbps 2 > 100ms
Resumen: codificadores sin pérdidas
Formato Velocidad Compresión Híbrido (c/ pérdidas)
Código abierto Multicanal
Wavpack Muy rápido 58% Si Sí Sí
ALAC Rápido 58.5% No Sí (decod) Sí
FLAC Muy rápido 58.7% No Sí Sí
Monkey’s Rápido 55.5% No Sí Sí
• Formatos estándar
• .aif: AIFF, Audio Interchange File Format
• .wav: Waveform Audio
• . bwf: Broadcast wave (extensión al .wav)
• .raw: Raw audio file (Como un .wav pero sin cabecera)
Diccionario de extensiones
Diccionario de extensiones
• Codificadores con pérdidas:
• .mp3: MPEG-1 Capa III
• .mp4: MPEG-4 (audio y/o video)
• .m4a: MPEG-4 audio
• .m4p: Ficheros del iTunes con DRM
• .m4v, .mp4v, .cmp, .divx, .xvid: MPEG-4 Video
• .3gp, .3g2: MPEG-4 en móviles
• .wma: Windows Media Audio
• .ogg: Ogg Vorbis
Diccionario de extensiones
• Codificadores sin pérdidas
• .flac: FLAC, Free Lossless Audio Coder
• .m4a: Apple Lossless audio coder
Sonido surround
• Un poco de historia:
• El sonido surround lleva utilizándose desde los años 30 (3 canales frontales para el cine, desarrollados por Bell Labs)
• En 1941 se añadieron los canales traseros, para la película Fantasía de Walt Disney. Era el sistema de sonido Fantasound, también utilizado para el Cinemascope de la Fox.
• En los 60 el sistema Dolby Surround se convirtió en el estándar de facto, con 4 canales.
• En los 70 se creo el sistema Quad, para música, que acabó desapareciendo por falta de compatibilidad.
Ventajas del surround
• El sonido es más claro
• No hay un sweet spot
• La posición de los altavoces no es tan crítica
• Más posibilidades para la mezcla
Dolby AC-3
• Creado en 1991 para la película “Batman returns”.
• Es un codificador pensado desde el principio para la industria del cine (audio multicanal), que acabó adaptándose para aplicaciones domésticas (home theater)
• Es el estándar para la televisión de alta definición en EEUU y DVD-Video
• Velocidades binarias soportadas: desde 32 hasta 640kbps
• Frecuencias de muestreo: 32, 44.1 y 28 kHz
Dolby AC-3
• Principales características
• Protección de copyright
• Marcas de tiempo
• Down-mixing
• Identificadores de los idiomas
• Múltiples tramas auxiliares
• Control del margen dinámico
Tecnologías Dolby (consumo)
Codificación sin pérdidas, hasta 8 canales 24bits/96kHz
Codificación con pérdidas, hasta 7.1 canales a 6 Mbps
Codificación con pérdidas, hasta 6.1 canales
Codificación con pérdidas, hasta 5.1 canales
Tecnologías Dolby (consumo)
Versión para consumo del Dolby analógico
Codificador MPEG-2/4 AAC
Codificador sin pérdidas para el DVD-Audio
Sistema analógico matricial para 5.1
Igual que el pro logic II pero hasta 7.1
Añade canales frontales en altura
Tecnologías Dolby
Blu-rayBlu-ray DVDDVD
Codec Canales Bitrate Canales Bitrate
5 . 1 640 kbps 5 . 1 448 kbps
7 . 1 1.7 Mbps
8 18 Mbps
Tecnologías Dolby (cine)
Audio analógico para cines
Codificación con pérdidas. Igual que el de consumo.
Extensión a 7.1
Sistema de imagen 3D
Añade un canal trasero central al 5.1
Un canal por altavoz en el cine
Tecnologías DTS (consumo)
Codificación sin pérdidas, hasta 7.1 canales
Codificación con pérdidas, hasta 5.1 canales
Equivalente al Prologic II de Dolby
Extensión del Neural Surround hasta 11.1
SDDS
• Es una tecnología exclusiva para salas de cine
• Ofrece hasta 8 canales de sonido
• La información se graba en los bordes externos de la película
Dolby AC-3
Dolby AC-3
Dolby AC-3
Dolby AC-3, DTS y SDDS
• Pueden existir fallos de sincronismo
• El ratio de compresión es menor que en AC-3
• Se suele coincidir en que es el formato más fiel al sonido del master
• La instalación es más barata
Ventajas e inconvenientes de DTS
Ventajas e inconvenientes de Dolby AC-3
• Usa un ratio de codificación elevado
• Puede haber problemas con los cambios de rollo, aunque se puede evitar
• Es el formato más extendido
• El audio va sobre la película para evitar problemas de sincronismo
Ventajas e inconvenientes de SDDS
• Tiene el ratio de codificación más bajo de todos (creo)
• Proporciona 8 canales de sonido, aunque no hay demasiados cines que soporten esto
• Está muy ligado a Sony y sus estudios (Columbia, Tristar, etc.)
• Es el sistema más caro de instalar
THX
• Es un sistema de certificación de la calidad creado en 1983 para asegurar que la película “El retorno del Jedi” se escuchase igual en los mejores cines.
• THX viene de Tomlinson Holman’s eXperiment.
• THX impone unos requisitos muy estrictos para los cines:
• Suelo flotante
• Paredes tratadas acústicamente
• Pantalla perforada
• Ruido de fondo NC-30
• Ángulo de visión
• Calidad de la imagen
Altavoces frontales empotrados
Aislamiento entre salas
Control de la reverberación
Posición de la pantalla
Proyección de la película
THX
• Criterios de certificación para cines:
• Ruido de fondo (NC-30)
• Aislamiento acústico
• Reverberación
• Ángulo de visión
• Calidad de la imagen
• Equipamiento
• Instalación de los equipos
¿Cómo coloco los altavoces en casa? Estéreo
¿Cómo coloco los altavoces en casa? Estéreo
Colocación de los altavoces
5.1 7.1
Colocación de los altavoces
Dolby True HD Ordenador