par samuel bovÉe et julien brisseau 1. les origines de la vidéo le codage analogique la...
TRANSCRIPT
Par Samuel BOVÉE et Julien BRISSEAU
1
Les origines de la vidéo Le codage analogique La compression numérique Les standards de compression Implémentation et utilisation
de la compression Edition vidéo Conclusion
2
3
Technique simple et ancestrale : la diffusion de 24 images par seconde (24Hz) sur pellicule
Pour éviter le scintillement : on double ou triple le nombre d’image par duplication=> fréquence de 48Hz / 72Hz
4
5
L’utilisation la plus notable de la vidéo analogique a été la télévision
Plusieurs formats de codage de la vidéo :◦ SECAM◦ PAL◦ NTSC
6
7
Invention française brevetée en 1956 par Henri de France
Première diffusion sur France2 en 1967 25 images / secondes 625 lignes Codage couleur en YDbDr Modulation par fréquence Coupure prévue en 2012 !!!
8
Y = 0.299R + 0.587G + 0.114B Db = − 0.450R − 0.883G + 1.333B Dr = − 1.333R + 1.116G + 0.217B
9
Norme NTSC SECAM (L) PAL
Année d’apparition 1953 1961 1963
Nombre de lignes 525 625 625
Fréquence Horizontale
17,734 kHz 15,625 kHz 15,625 kHz
Fréquence Verticale 60 Hz 50 Hz 50 Hz
Bande passante vidéo
4,2 MHz 5 MHz 5 MHz
Porteuse son 4,5 MHz 5,5 MHz 5,5 MHz
10
11
Apparition de la vidéo numérique vers la fin des années 70.Raisons :permet de corriger et d’améliorer les vidéos, de les manipuler et de leurs ajouter des effetsPermet l’interfaçage avec l’informatique émergentePermet la détection et la correction d’erreur
12
Image en haute définition : ◦ résolution => 1280*720 pixels◦ affichage progressif ◦ 24 images par secondes ◦ 16 millions de couleurs (3 octets / pixels)
soit :◦ (1280*720)*24*3*8 = 530841600 bit/s = 530 Mbit/s = 63 Mo/s◦ ou en d’autre termes : 450Go pour un film de 2H
=> Débit trop important, même de nos jours !
13
Compressions sans pertes (lossless) :◦ Exemple : Huffyuv, basé sur JPEG-LS et utilise
Huffman◦ Gain possible : 50%Intéressant, mais pas suffisant pour les
applications courantes Compression avec pertes :
◦ Majoritairement utilisé dans de nombreux domaines
14
Deux façon de faire :◦ Redondance spatiale : compresser les images
indépendamment les unes des autres.ex : MJPEG
◦ Redondance temporelle : analyser les images qui se suivent : elles sont souvent très identiques !
15
Image N Image N+1 Image N+2
Différence entre image N et N+1
Différence entre image N+1 et N+2
16
D'une image à l'autre, la quantité de nouvelles informations est disparate
Mais la plupart du temps, elle est très faible On catégorise alors les images en 3 types :
I-FrameP-FrameB-Frame
17
◦ Compressées indépendamment de leur contexte
◦ Autorisent un accès aléatoire◦ Compressée avec perte, même principe que
le JPEG
18
– Codées par rapport à l’images I ou P-frames précédentes
– Utilisent la compensation de mouvement– 30 à 40% de gain sur I-frame– Propagent les erreurs
19
20
– image déduite d’une image I ou P-frames précédentes ET suivante en faisant la moyenne des changement
– Offre le meilleur taux de compression : 50% de gain sur P-frame
– Ne propage pas les erreurs
21
Un ensemble d’image dépendante les unes des autres au sein de la vidéo est appelé un GOP (Group Of Picture)
22
23
Séquence vidéo (Video Sequence)◦ Commence par une en-tête, contient des groupes d’images,
s’achève par un code de fin Groupe d'images (Group of Pictures)
◦ Contient un index permettant un accès aléatoire Image (Picture)
◦ De trois types : I, B, P. Tranche (Slice)
◦ Macroblocs ordonnés de gauche à droite, puis de haut en bas. En cas d’erreur dans la tranche, le décodeur passe à la suivante. Plus il y a de tranches, meilleur est le traitement des erreurs, mais fait perdre de la place.
Macroblocs (Macroblocks)◦ C'est une matrice rectangulaire de dimension 2 et constituée de
blocs. Blocs (Block)
◦ C'est un ensemble des valeurs de luminance et chrominance de 8 lignes de 8 pixels.
24
25
Deux grands consortiums◦ MPEG (Moving Picture Experts Group).
Domaine d’expertise : la compression, la décompression, le traitement et le codage de la vidéo, de l’audio et de leur combinaison
◦ UIT-T (Union internationale des télécommunications) : chargée de la réglementation et de la planification des télécommunications dans le monde
26
Sortie en 1993 352x288 pixels à 25 images par seconde en
(PAL/SECAM) débit de 1,2 à 1,5 Mbit/s (utilisable par un
CD-ROM) Qualité équivalente à celle de la VHS
27
Composé de cinq parties :
Synchronisation et multiplexage de la partie audio et vidéo (MPEG-1 Program Stream).
Codec de compression pour des signaux vidéo non-entrelacés.
Codec de compression pour des signaux audio. La norme définit 3 niveaux de complexités : ◦ MP1 ou MPEG-1 Part 3 Layer 1◦ MP2 ou MPEG-1 Part 3 Layer 2◦ MP3 ou MPEG-1 Part 3 Layer 3
Procédure pour les tests de conformité Implémentation logicielle de référence pour les 3 premières
parties
28
Extension de MPEG-1 Norme constituée de 9 parties ! Objectif d’obtenir des débits plus importants
◦ SD-TV (Télévision standard) : débit entre 2 et 15 Mbit/s
◦ HD-TV (Télévision haute définition) : débit entre 15 et 30 M/Bits
Gain en qualité
29
Améliore la précision des mouvements des vecteurs
Redondance d’erreur étendue Précision de la DCT définissable Meilleurs prédictions des macro blocks Qualité extensible (différents niveau de
qualité au sein d’une même vidéo) Apparition des profils et niveaux
30
Permettent de réduire la complexité des décodeurs selon le type d’application qu‘ils concernent.
Un profil représente un ensemble d’outils communs à plusieurs applications, en fait une structure particulière de MPEG2
Un niveau définit la qualité de la vidéo pour chaque profil.
31
32
Standardisé en 1996 Développé pour les lignes à très bas débits,
pour des applications de visiophonie Puis pour la visioconférence
33
Apparition en 1998 Actuellement 23 parties permettant l’interfaçage
avec les nouvelles applications multimédias :◦ le téléchargement◦ le streaming sur Internet◦ le multimédia sur mobile◦ la radio numérique◦ les jeux vidéos◦ les supports haute définition
Meilleur rendu que MPEG-2◦ la taille des macro-blocs de 8*8 , 16*8 ou 16*16.◦ Meilleur précision des vecteurs de mouvement
Deux profils majoritairement utilisés :◦ Simple Profile (SP)◦ Advanced Simple Profile (ASP)
34
Extension de la norme MPEG-4 (ajout partie 10) en 2003 H.264 compresse plus efficacement que les autres
normes =>débit divisible par deux par rapport au MPEG-2 à
qualité égale
Multiples améliorations de la compensation de mouvement
Ajout d’un codage arithmétique CABAC (codage entropique)◦ excellents résultats◦ grande complexité◦ non disponible dans les profils baseline et extended
La numérotation des images permet la création de sous-séquences
35
36
37
38
39
40
Par exemple avisynth : éditeur vidéo entièrement contrôlé par des
scripts !!! grande variété de fonctions de traitement et
d'édition - via des filtres - sur un flux vidéo fonctions comme le trim, le crop, le
désentrelacement, le téléciné inverse, des corrections de couleur, des redimensionnements, du denoising (débruitage)…
41
Le futur : Scalable Video Coding (SVC)
Des questions ?
42