carte - representations temps - frequences ensieta

190
ENSIETA, BREST FRANCE CENTRE DE RECHERCHE "EXTRACTION ET EXPLOITATION DE L'INFORMATION EN ENVIRONNEMENTS INCERTAINS R R E E P P R R E E S S E E N N T T A A T T I I O O N N S S T T E E M MP P S S - - F F R R E E Q Q U U E E N N C C E E E E T T T T E E M M P P S S - - E E C C H H E E L L L L E E André QUINQUIS. Cornel IOANA - Janvier, 2002 -

Upload: florentin01

Post on 01-Jul-2015

290 views

Category:

Documents


3 download

TRANSCRIPT

Page 1: carte - representations temps - frequences ENSIETA

ENSIETA, BREST

FRANCE

CENTRE DE RECHERCHE "EXTRACTION ET EXPLOITATION DE L'INFORMATION EN ENVIRONNEMENTS INCERTAINS

RRREEEPPPRRREEESSSEEENNNTTTAAATTTIIIOOONNNSSS TTTEEEMMMPPPSSS---FFFRRREEEQQQUUUEEENNNCCCEEE EEETTT TTTEEEMMMPPPSSS---EEECCCHHHEEELLLLLLEEE

André QUINQUIS. Cornel IOANA - Janvier, 2002 -

Page 2: carte - representations temps - frequences ENSIETA

SOMMAIRE

1 Introduction……………………………………………………………... 1 1.1. La notion de signal………………………………………………………………..1 1.2. Structure d'une chaîne de traitement……………………………………………1 1.3. Place de la discipline "Analyse temps-fréquence" ……………………………...2 1.4. Organisation de cet ouvrage……………………………………………………...3

2 Rappels mathématiques.…………………...……………………………5

2.1. Les concepts de base……………………………………………………………...5

2.1.1. La norme et le produit scalaire ………………………………………………………...5 2.1.2. Les espaces de Hilbert……………...…………………………………………………...6 2.1.3. Rappel sur la théorie des opérateurs linéaires ..………………………………………...7 2.1.4. Bases des fonctions dans un espace de Hilbert …………………………………………8

2.2. La représentation du signal……………………………………………………...9

2.2.1. La décomposition atomique……………………………………………………….……9 2.2.2. Les bases orthonormales ……….……………………………………………………...9 2.2.3. Les bases de Riesz ……………………………………………………….…………….10 2.2.4. La théorie des cadres ………………………………………………………………….11 2.2.5. La procédure d'orthogonalisation de Gramm-Smidt ………………………………...12

2.3. Rappel sur la théorie des matrices…..………………………………………….13 2.3.1. Notion de déterminant……………………………………………….…………….…..14 2.3.2. Vecteurs et valeurs propres………………………………………….…………….…..15 2.3.3. Matrices spéciales…………..……………………………………….…………….…...16 2.3.4. Propriétés de dérivation des matrices……………………………….…………….…..16

2.4. Rappel sur les variables et signaux aléatoires...……………………………….17 2.4.1. Variable aléatoire réelle et rappels………………………………….…………….…..17 2.4.2. Processus aléatoires………………………………………………….…………….….20

2.5. Conclusions……………………………………...……………………………….23

Exercices et problèmes ………………………………………………………………………24

3 Généralités sur les signaux non-stationnaires.…………………...…...27

3.1. Méthodes de base pour le traitement des signaux stationnaires..…………….27 3.1.1. Les structures temporelles et fréquentielles………………………….…………….….27 3.1.2. Eléments d'analyse spectrale………………...……………………….…………….….28

3.2. Le concept de signal non-stationnaire…………………………....…………….34

3.2.1. Définition de la non-stationnarité……………………...…………….…………….….34 3.2.2. Mesures de non-stationnarité……………...…………….…………….……………....35

Page 3: carte - representations temps - frequences ENSIETA

3.3. Modèles et approches non-stationnaires………………………....…………….40

3.3.1. Approche adaptative………………….………………...…………….…………….….40 3.3.2. Approche évolutive……...…………….………………...…………….…………….….40 3.3.3. Stationnarité par morceaux…………..………………...…………….…………….….41 3.3.4. Modèle à coefficients aléatoires………...……………...…………….…………….….41 3.3.5. Représentations temps-fréquence et/ou temps-échelle……………....…………….….41

3.4. Limitations de la transformée de Fourier….…………………....………….….42

Exercices et problèmes ………………………………………………………………………44

4 Représentations temps-fréquence linéaires.…. .……………….…..…46

4.1. Transformée de Fourier à court terme. Spectrogramme……....………….….46 4.1.1. Définitions………………….………………...……………………….…………….….46 4.1.2. Propriétés générales de la TFCT et du spectrogramme……………..…………….….47 4.1.3. Le pavage temps-fréquence généré par le spectrogramme………….…………….….50 4.1.4. Considérations sur la discrétisation du spectrogramme…………….…………….….51 4.1.5. Conclusion………...……….………………...……………………….…………….….51

4.2. La transformée de Gabor…………………………………...…....………….….52

4.2.1. Définition………….……….………………...……………………….…………….….52 4.2.2. Implémentation de la transformée de Gabor………….……….………………...…….52

4.2.3. Sélection optimale de l'ensemble dual des fonctions……..………….…………….….55 4.2.4. Conclusions……….……….………………...……………………….…………….…..57

4.3. La transformée ondelettes continue……………………...…....………….…....57

4.3.1. La notion d'ondelette. Exemples…………...……………..………….…………….….52 4.3.2. La transformée ondelettes continue directe……………..………….…………….…...61 4.3.3. La transformée ondelettes continue inverse……………..………….…………….…...61 4.3.4. La discrétisation de la transformée ondelettes continue……..…….…………….…...64 4.3.5. Le scalogramme. Comparaison entre la TFCT et la TOC………....…………….…...65 4.3.6. La transformée ondelettes supracomplete……..………..………….…………….…...66

Exercices et problèmes ………………………………………………………………………68

5 Analyse multirésolution et paquets d'ondelettes.…....……………….70

5.1. Analyse multirésolution……....……………………………………………...….70

5.1.1. Définition et propriétés de l'analyse multirésolution…….………….…………….….70 5.1.2. Les classes de bases ondelettes……………………………………….…………….….74

5.2. Les ondelettes et les bancs de filtres………………………………………...….82

5.2.1. La transformation ondelettes rapide……………………...………….…………….….82 5.2.2. Les bancs de filtres à reconstruction parfaite………….....………….…………….….87

5.3. Ondelettes biorthogonales…………………………………………………...….90

5.3.1. Ondelettes biorthgonales splines………….……………...………….…………….…..92 5.3.2. Pseudo-coiflets…………………………….……………...………….…………….…..93

Page 4: carte - representations temps - frequences ENSIETA

5.4. Analyse en paquets d'ondelettes …………………………………………...….94 5.4.1. Préliminaires……...……………………….……………...………….…………….….94 5.4.2. La notion d'arbre de décomposition……...………………………....…………….…..95 5.4.3. Sélection de la meilleure base…………….……………...………….…………….…..97 5.4.4. La reconstruction du signal………...…….……………...………….…………….…101 5.4.5. Exemples d'application……..…………….……………...………….…………….….102 5.4.6. Décomposition en paquets d'ondelette 2D……………...………….…………….…..104

5.5. Analyse en paquets d'ondelettes invariante en temps……………………...106

5.5.1. Préliminaires……...……………………….……………...………….…………….…106 5.5.2. La librairie de paquets d'ondelettes invariante en temps……...…………………….106 5.5.3. Sélection de la meilleure base…………….……………...………….……………….108 5.5.4. Comparaison entre la décomposition en paquets d'ondelette classique et celle invariante en temps………………………………………………………………………….110 5.5.5. La décomposition en paquets d'ondelettes invariante en temps 2D………..……….111 Exercices et problèmes ……………………………………………………………………..113

6 Représentations temps-fréquence bilinéaires…..…....……………...116

6.1. La transformée de Wigner-Ville…………………………………………….116

6.1.1. Définition………….……….………………......……………………….…………….116 6.1.2. Propriétés générales de la distribution de Wigner-Ville……...……….…………….118 6.1.3. Les termes d'interférence générés par la DWV………….……….………………....122 6.1.4. La DWV discrète….……….………………......……………………….…………….124 6.1.5. L'implémentation de la DWV discrète….……….………………......……………….126

6.2. La transformée de Pseudo Wigner-Ville……………………………………128

6.2.1. Définition………….……….………………......……………………….…………….128 6.2.2. Comparaison entre la distribution de pseudo Wigner-Ville et le spectrogramme….128 6.2.3. La distribution de pseudo Wigner-Ville lisée………………………….…………….129 6.2.4. Implémentation de la PWVL……..………......……………………….……………..132

6.3. La classe de Cohen………………………………………………...…………133

6.3.1. La fonction d'ambiguïté………….………........……………………….…………….133 6.3.2. La définition de la classe de Cohen……….......……………………….…………….137 6.3.3. Les membres de base de la classe de Cohen……….......……………………….……139 6.3.4. Conclusion……………………………...….......……………………….…………….147

6.4. Le noyau gaussien adaptatif……………………………………...…………148

Exercices et problèmes ……………………………………………………………………..154

7 Représentations temps-fréquence modernes…..…....……………...157

7.1. Motivations……………………..…………………………………………….157 7.2. Le principe des décompositions temps-fréquence adaptatives……………158

Page 5: carte - representations temps - frequences ENSIETA

7.3. La distribution de Wigner-Ville modifiée……………………..……………159 7.4. Le dictionnaire adaptatif chirplets à 4 paramètres…………...……………161

7.4.1. Expression mathématique des fonctions chirplet……..……………….…………….162 7.4.2. La RTFA obtenue à partir de DAC4…………………..……………….…………….162

7.5. Résultats exprerimentaux…………………………….………...……………166 7.6. Conclusion. Perspectives……..……………………….………...……………169

ANNEXE 1. Implémentation des décompositions en paquets d'ondelettes……………………….171

Page 6: carte - representations temps - frequences ENSIETA

1. Introduction

ENSIETA, Janvier 2002Centre de Recherche "Extraction et Exploitation de l'Information en Environnements Incertains"

1

1INTRODUCTION

1.1. La notion de signal

Par définition, un signal est le support physique d'une information. Il s'agit d'une notion tout àfait générale que l'on peut rencontrer dans des domaines aussi variés que l'électricité, l'électronique,l'acoustique, l'optique, la mécanique, l'astronomie, la biologie, l'économie etc. En fait, on évoquera unsignal lors qu'il y a mesure et/ou transmission d'information d'une source vers un destinataire.

Traiter un signal, c'est essentiellement en extraire l'information que l'on juge utile, la mettre enforme pour mieux l'analyser, la transmettre ou la stocker, l’épurer de parasites éventuels.

1.2. Structure d'une chaîne de traitement

Le signal matérialise le transfert d'une information. On peut alors distinguer un certain nombred'opérations ou de situations qui sont communes à toute chaîne de traitement. On peut en tout premierlieu distinguer les opérations :§ Le pré-traitement qui est essentiellement relatif à la prise d'information elle-même, aux capteurs

et à leurs propriétés;§ Le traitement proprement dit qui constitue le cœur de ce qu'on appelle le traitement du signal;§ Le post-traitement qui inclut les actions (on parle alors plutôt d'automatique) ou des méthodes

symboliques ou de contexte (vision, intelligence artificielle etc…).

D'une manière assez générale, on peut résumer une chaîne de traitement du signal par leschéma suivant :

Figure 1.1. Le schéma général d'une chaîne de traitement

Ce schéma met en jeu plusieurs espaces et des applications entre ces espaces. Les espaces sontceux :§ Des états : c'est là que se trouve l'information utile;§ Des signaux : ce sont eux qui matérialisent les états possibles;§ Des observables : ce sont les seules grandeurs disponibles pour l'utilisateur;§ Des décisions : c'est là que se matérialisent les opérations relatives aux signaux;§ Des représentations : elles permettent de changer la façon dont on regarde un signal et peuvent

soit aider à l'analyse seule, soit constituer un détour utile pour construire une décision.

Représentations

Etats Signaux Observables

Décisions

Page 7: carte - representations temps - frequences ENSIETA

1. Introduction

ENSIETA, Janvier 2002Centre de Recherche "Extraction et Exploitation de l'Information en Environnements Incertains"

2

Les liens qui unissent ces différents espaces correspondent à des opérations de§ Codage entre états et signaux;§ Transmission (au sens large) entre signaux observables et décisions (l'espace des décision étant

supposé isomorphe à l'espace des états).

Nous pouvons donc formuler une problématique générale du traitement du signal de la façonsuivante :

Il est clair qu'un tel objectif nécessite d’expliciter ce que l'on entend par "meilleure" et par "aumieux". Il faudra donc définir des critères qu'il s'agira d'optimiser. Par ailleurs, l'objectif ne pourraêtre atteint que si un certain nombre d'informations (a priori) supplémentaires sont disponibles.Celles-ci pourront concerner :− La nature ou les états d'un système;− Le type de codage;− Les informations relatives au canal de transmission et au bruit d'observation, etc.

Ceci étant supposé, le schéma décrit ci-dessus permet d'englober la majorité des tâchesessentielles auxquelles est confronté le traitement du signal :- La détection : l'espace des états est alors discret (voire binaire) et le problème posé est de savoir

si une observation donnée correspond au signal utile mélangé du bruit ou à un bruit seul;- L'analyse et l'estimation des paramètres : il s'agit cette fois, et toujours à partir d'une observation

imparfaite, de caractériser un signal par un jeu de paramètres qui le définite;- Le filtrage : Il s'agit d'estimer un signal dans son ensemble et non par l'intermediaire d'un petit

nombre de paramètres caractéristiques.

Ces tâches élémentaires apparaissent souvent couplées, les problèmes réels faisantfréquemment intervenir simultanément des opérations de filtrage et/ou de détection-estimation. Onpeut aussi citer quelques exemples d'application pour lesquels le traitement du signal estprépondérant:§ Le traitement de la parole : analyse, synthèse, codage, transmission, reconnaissance, commande

vocale;§ L'audio (compact disc) et la vidéo (TVHD) numériques;§ Les télécommunications : téléphone, radio-mobile, vidéo-mobile, vidéo-conférence;§ Le radar et le sonar (passif ou actif);§ Le control non-destructif (par ultrasons ou par courrant de Foucault);§ L'astronomie : imagerie optique et radio, interférométrie, optique adaptative;§ La physique : turbulence, géophysique (interne et externe), sismique;§ L'automobile et les industries mécaniques : diagnostic vibratoire;§ Le nucléaire : surveillance et détection précoce d'incidents;§ L'imagerie satellitale.

1.3. Place de la discipline "Analyse temps-fréquence"

De par ses objectifs, le traitement du signal est clairement à une situation carrefour. Il est eneffet en contact étroit avec ses champs d'applications (mentionnés ci-dessus) dans lesquels il puise sesmotivations et pour lesquels il élabore la spécificité de ses solutions. Il repose par ailleurs sur desoutils mathématiques (comme l'analyse harmonique, l'algèbre linéaire ou les statistiques) qui lui sont

Il s'agit d'élaborer la meilleure règle de décision, c'est-à-dire celle qui, à partirdes seules données observables, permet de caractériser au mieux une information utilevéhiculée par un signal

Page 8: carte - representations temps - frequences ENSIETA

1. Introduction

ENSIETA, Janvier 2002Centre de Recherche "Extraction et Exploitation de l'Information en Environnements Incertains"

3

essentiels. Il est enfin un passage obligé pour des tâches comme la classification ou la reconnaissancedes formes.

Le traitement du signal est cependant une discipline autonome ; son originalité reposant d'unepart sur l'universalité de son langage et d'autre part sur l'enrichissement qu'elle a en retour par rapportaux disciplines qui la nourrissent (développement d'algorithmes en mathématiques appliquées,affinement de mesures en physique etc…).

La plupart des signaux réels sont de nature non-stationnaire (cette notion sera détaillée dans lechapitre 3) et la difficulté de traiter ce type de signaux réside dans le fait que l'information portée parces signaux peut être utile ou nuisible. Par exemple, lors de la transmission d'un signal, la modulationen fréquence ou en amplitude, donc la non-stationnarité - qui de ce point de vue constitue enélément positif, sert à porter l'information utile. Mais, si un problème quelconque perturbe cettemodulation, alors l'information portée est en partie nuisible. Par conséquent, il faut trouver uneméthode pour récupère l'information utile, tout en sachant que les méthodes "classique" sont conçuespour des signaux stationnaires. De ce point de vue, le caractère non-stationnaire devient un facteurnégatif dans le contexte de traitement de ce signal.

Les méthodes d'analyse temps-fréquence constituent la solution pour résoudre cetteambiguïté. En conclusion, on peut dire que, dans le cadre général du traitement du signal, lesméthodes temps-fréquence sont les outils les plus aptes à traiter des signaux, dans un environnementnon-stationnaire.

1.4. Organisation de cet ouvrage

Ce travail a pour principal objectif la familiarisation des ingenieurs avec la problématique desreprésentations temps-fréquence qui constituent, comme on a déjà vu, l'outil de base pour letraitement des signaux dans un environnement non-stationnaire. Pour atteindre cet objectif, cetouvrage est structuré en quatre parties principales.

La première est dédiée aux rappels mathématiques et aborde les points suivants :- La définition des notions mathématiques de base, directement liées à la problématique de

traitement du signal;- La particularisation de ces notions dans le cadre de la représentation des signaux et l'introduction

des opérateurs qui peuvent être développés dans les espaces des signaux introduits;- Les éléments de la théorie des matrices qui constituent la forme optimale (du point de vue

implémentation des algorithmes) pour la représentation des signaux ;- Les notions de base sur les variables et les signaux aléatoires qui sont indispensables lorsqu'on

travaille dans un environnement bruité.

La deuxième partie, "Généralités sur les signaux non-stationnaires", est structurée en cinqsections :- dans la première section, on présente brièvement les méthodes de base pour l'analyse des signaux

stationnaires, en insistant sur les méthodes d'analyse spectrale;- dans la deuxième section on définit le concept de "non-stationnarité" et on exemplifie cette notion

à partir de quelques situation pratiques;- dans la troisième section on présente les mesures les plus usuelles de la non-stationnarité;- la quatrième section aborde la présentation des méthodes mono-dimensionnelles pour la

modélisation des signaux non-stationnaires;- La fin de cette partie, la section 5, à partir des limitations des méthodes présentées ci-dessus et des

limites de la transformée de Fourier, permet de justifier l'intérêt des représentations temps-fréquence.

Le troisième chapitre, "Les représentations temps-fréquence linéaires", est structuré endeux parties. Dans la première on aborde la problématique des RTFs issues par le fenêtrage de la

Page 9: carte - representations temps - frequences ENSIETA

1. Introduction

ENSIETA, Janvier 2002Centre de Recherche "Extraction et Exploitation de l'Information en Environnements Incertains"

4

transformé de Fourier, qui représente, de point de vue historique, les premières méthodes temps-fréquence. On va voir que le fonctionnement de ces méthodes est limité par le principe deHeisenberg, et, par conséquence, on va insister sur la transformée de Gabor, qui représente le meilleurcompromis temps-fréquence.

Dans l'autre partie, même s'il s'agit d'un décalage historique important entre ces deuxapproches, on s'appuie sur les représentations temps-échelles : la transformée en ondelettes et sesdérivées. A la fin de ce chapitre on mettra en évidence les limitations des méthodes linéaires actuelleset, on présentera les perspectives qui peuvent être envisagée.

Enfin, le dernier chapitre concerne "Les représentations temps-fréquence bilinéaires", et,notamment, celles qui appartiennent à la classe de Cohen. Après la présentation détaillée de tous lesaspects importants liés de ces outils, on étudie quelques méthodes pour l'amélioration desperformances de celles-ci.

Les exemples qui serviront de support pour les explications afférentes sont obtenus par dessimulations réalisées sous Matlab, en utilisant le "Didacticiel", qui est un produit conçu par le"Laboratoire de Traitement du Signal" de l'ENSIETA.

Tous les chapitres s’achévent par une série d’"Exercices et de Problèmes". Ils constituent unmoyen efficace pour la compréhension des notions on présentées et donnant des exemples suggestifssur la signification physique de ces notions.

Page 10: carte - representations temps - frequences ENSIETA

2. Rappels mathématiques

ENSIETA, Janvier 2002Centre de Recherche "Extraction et Exploitation de l'Information en Environnements Incertains"

5

2RAPPELS MATHEMATIQUES

Dans ce chapitre nous allons présenter les notions mathématiques de base qui seront utiliséesau cours de ce travail. Le but est de réaliser un rappel sur les concepts mathématiques sur lesquels estbasée la théorie des représentations temps-fréquence; pour des détails envisageant l'entièreproblématique, les démonstrations des théorèmes et propriétés etc, le lecteur est invité de consulterles références bibliographiques données à la fin du chapitre.

2.1. Les concepts de base

Ce paragraphe expose les éléments mathématiques basiques qui sont utilisés pourl'introduction des notions suivantes. On note par H un espace linéaire (ou vectoriel), associé à unproduit scalaire.

2.1.1. La norme et le produit scalaire [1]

Une norme • est une application +→ RH (où R+ représente l'ensemble des nombre réels)

qui associe à chaque élément f ∈ H une quantité positive réel f . Pour x, y∈ H et a∈ C, une normedoit satisfaire les propriétés suivantes:

1. Positivité : 00et0 =⇔=≥ xxx

2. Multiplication par un scalaire : xaax ⋅=

3. L'inégalité du triangle : yxyx +≤+ .

Par définition, le produit scalaire ••, est une application CHH →× qui satisfaite lesconditions:1. zybzxazbyax ,,, +=+ ,

2. *

,, xyyx =

3. 2

, xxx =pour tout (x, y, z) ∈ H3 et (a, b)∈ C2.

Si 0, =yx on dit que les vecteurs x et y sont orthogonaux.Une conséquence de ces propriétés est que le produit scalaire satisfait l'inégalité de Cauchy-

Schwarz:yxyx ⋅≤, (2.1)

La notion de convergence en H [1]

Cette notion, directement liée au concept de norme, permet de définir tous les espacesmathématiques utilisés en traitement du signal. Si on considère xn ∈ H une séquence définie en H on

Page 11: carte - representations temps - frequences ENSIETA

2. Rappels mathématiques

ENSIETA, Janvier 2002Centre de Recherche "Extraction et Exploitation de l'Information en Environnements Incertains"

6

dit que xn converge vers x si 0→− Hnxx quand n→ ∞. On peut également écrire x=limxn et si

limxn ∈ H pour toutes les séquences xn alors on dit que H est un espace fermé.Par définition, une séquence xn est une séquence de Cauchy si 0,,0 →∀→− nmxx Hmn .

Si toutes les séquences Cauchy convergent en H on dit que H est espace complet. Les espaces desvecteurs normés complets sont appelés des espaces Banach. Les espaces de Banach qui admettent unproduit scalaire sont appelés les espaces de Hilbert. 2.1.2. Les espaces de Hilbert [2]

Les espacés de Hilbert sont les espaces les plus intéressants en traitement du signal. D'unemanière intuitive, la notion d'espace de Hilbert peut être vue comme la généralisation de l'espaceEuclidien tri-dimensionel, par l'extension des concepts suivants: la distance (norme) et l'angle(produit scalaire). Mathématiquement, l'espace de Hilbert H est un espace vectoriel complet, norméqui est associé à un produit scalaire.

Les espaces de Hilbert particuliers et leurs significations physiques sont, par exemple :

A. L'espace des fonctions absolument intégrables

L1(R) représente l'espace des signaux absolument intégrables, dans lequel la norme d'unélément f∈ L1(R) est définie par :

( )∫∞

∞−

∆∞<= dttff (2.2)

Pour les fonctions f∈ L1(R) on peut définir la transformée de Fourier (TF) selon:

( ) ( ) dtetff tj∫∞

∞−

−= πγγ 2ˆ (2.3)

B. L'espace des fonctions à énergie finie

L2(R) représente l'espace des signaux à l'énergie finie, dans lequel la norme d'un élément f∈L2(R) est définie par :

( ) ∞<

= ∫

∞−

∆2/1

2 dttff (2.4)

Dans le cadre du traitement du signal, le carré de la norme peut être vue comme l'énergie dusignal.

Dans cet espace, le produit scalaire de deux fonctions f, g ∈ L2(R) est défini par :

( ) ( )∫∞

∞−

= dttgtfgf *, (2.5)

C. L'espace des fonctions à énergie finie périodiques

Parfois, il est souhaitable d'utiliser une T-périodisation d'un signal f, ( )∑ + nTtf . Parsimplification, on effectue seulement l'analyse du signal dans l'intervalle [-T/2,T/2]. Dès lors, leconcept de l'énergie finie peut être étendue pour les signaux périodiques, en analysant le signal sur

Page 12: carte - representations temps - frequences ENSIETA

2. Rappels mathématiques

ENSIETA, Janvier 2002Centre de Recherche "Extraction et Exploitation de l'Information en Environnements Incertains"

7

cette seule période. On peut aussi définir l'espace L2(-T/2,T/2) des fonctions à énergie finie sur [-T/2,T/2]. Dans cet espace, la norme d'un signal f∈ L2(-T/2,T/2) est défini par :

( ) ∞<

= ∫

∆2/12/

2/

2T

T

dttff (2.6)

D. L'espace des fonctions concentrées en temps et en fréquence

TF(R) représente l'espace des signaux à énergie finie décroissant plus rapidement en temps (eten fréquence) que la fonction 1/t (1/γ).

( ) ( ) ( ) ( ) ( ) ( ) ( ) 0,,1ˆ1:)( 112 >∞<+<+<∈= +−+−∆εγγ εε CpourCfettCtfRLfRTF (2.7)

E. L'espace des séquences d'énergie finie

l2(Z) est l'espace de séquences numériques d'énergie finie définies sur l'ensemble des nombresentiers. La norme d'un élément c∈ l2(Z) vaut :

( ) ∞<= ∑∆ 2/122

ncc (2.8)

et le produit scalaire de c, d ∈ l2(Z) vaut ∑= nn dcdc *, .Ces espaces peuvent être particularisés pour des valeurs finies de l'indice de sommation et en

définisant ainsi les espaces l2(J).

F. L'espace des fonctions de bande limitée (l'espace de Paley et Wiener)

Les espaces des signaux à bande limitée (introduis par Paley and Wiener, [2]) sont les espacesde fonctions à un support compact (limité et fermé) dans le domaine fréquentiel. Pour Ω>0, l'espacePWΩ est défini selon:

( ) ( ) [ ] ΩΩ−⊆∈=∆

Ω ,ˆsuppremum:2 fRLfPW (2.9)

2.1.3. Rappel sur la théorie des opérateurs linéaires [3]

Par définition, un opérateur linéaire est une application T qui transforme un espace Hilbert H1

dans un autre espace H2. On dit que T ∈ B(H1,H2), où B(.,.) est l'espace de Banach des opérateurslinéaires. La norme d'un élément T∈ B(H1,H2) est définie par :

∞<=∈

1

2

1

supH

H

Hx x

TxT (2.10)

Les opérateurs que généralement il est souhaitable de les avoir verifiées sont :

1. Le noyau d'un opérateur T∈ B(H1,H2) est la fonction f∈ H1 pour laquelle Tf=0.2. T est une application injective si Tf=Tg si et seulement si f=g.3. T est une application surjective si T(H1)=H2 (quelque soit l'élément de H1 il existe un élément

associé par T , défini en H2.4. T est une application bijective si elle est injective et surjective.

Page 13: carte - representations temps - frequences ENSIETA

2. Rappels mathématiques

ENSIETA, Janvier 2002Centre de Recherche "Extraction et Exploitation de l'Information en Environnements Incertains"

8

5. T admet un opérateur invers T-1:H2→H1 si T est bijective. Dans ce cas, l'opérateur inverse estdéfini par T-1g=f si g=Tf.

6. T est continue si xn → x implique Txn → Tx.7. L'adjoint de T est l'opérateur identité T*: H2 → H1 qui satisfait la condition

1

*

2,,

HH gTfgTf = . T est auto-adjointe si T*=T.

8. T est un isomorphisme topologique si T est bijective, T∈ B(H1,H2) et T-1∈ B(H2,H1).9. T est une isométrie si

12,1 HH fTfHf =∈∀ .

10. T est un opérateur unitaire s'il est linéaire, bijectif et isométrique. Si T est unitaire, alors T-1=T*.

Par la suite, on présente les opérateurs unitaires largement utilisés en traitement du signal. Ondonne les expressions de ces opérateurs pour une fonction arbitraire f∈L2(R) et a, b et s≠0 - desnombre réels.

1. L'opérateur de translation ( ) ( ) ( )( ) ( )atftfRLRL aa −=→∆

ττ ,: 22 (2.11)

2. L'opérateur de modulation ( ) ( ) ( )( ) ( )tfetfeRLRLe btjbb

π222 ,:∆=→ (2.12)

3. L'opérateur de dilatation ( ) ( ) ( )( ) ( )stfstfDRLRLD ss2/122 ,:

∆=→ (2.13)

Dans les applications pratiques il est souhaitable de travailler avec des opérateurs unitaires,car ceci nous assure la conservation de l'énergie dans le domaine transformé.

2.1.4. Bases des fonctions dans un espace de Hilbert [1,2]

On suppose une séquence des fonctions Hn ⊆φ . Dans la section suivante on décrit lesconcepts plus importants qui sont associés à la représentation d'un signal quelconque comme unecombinaison linéaire de ces fonctions.

1. Par définition, l'envergure linéaire, envφn, de l'ensemble des fonctions φn est la suite de toutesles fonctions générées par la combinaison linéaire des fonctions φn:

∈∈= ∑=

ZNCccenv n

N

nnnn ,:

1φφ (2.14)

2. φn est dense dans H si Henv n =_________

φ , où l'expression _________

nenv φ contient les limites de la forme

∑=∞→

N

1nnn

Nclim φ .

3. φn est complète dans H si ∀n, 0,f n =φ si et seulement si f=0.

4. φn est orthonormale dans H si nmnmnm ,,,, δφφ =∀ .

5. φn est une base de Schauder (ou simplement une base) pour H si pour chaque f∈ H il existe uneséquence unique cn∈ C pour laquelle ∑= nncf φ .

6. Un ensemble orthonormal φn représente une base orthonormale pour H si pour chaque f∈ H ilexiste une séquence unique cn∈ C pour laquelle ∑= nncf φ . Dans ce cas, on peut égalementécrire f :

Page 14: carte - representations temps - frequences ENSIETA

2. Rappels mathématiques

ENSIETA, Janvier 2002Centre de Recherche "Extraction et Exploitation de l'Information en Environnements Incertains"

9

∑=n

nnff φφ, (2.15)

et

∑=n

nff22 ,φ (Egalité de Parseval) (2.16)

7. Une base φn est une base de Riesz pour H si elle est liée à une base orthonormale par unisomorphisme topologique T : H→ H, φn= Ten, avec en - base orthonormale pour H.

8. Supposant une autre séquence ψn en H, ψn et φn sont bi-orthogonales si nmnm ,, δφψ = .

Un ensemble important de fonctions pour le traitement du signal est constitué par lesexponentielles harmoniques complexes ej2πnt. En effet, toute la théorie de Fourier est batie sur ladécomposition d'un signal dans cette base.

2.2. La représentation du signal

Une idée dominante et utile en mathématique est que les fonctions (les signaux, dans notrecontexte) peuvent être décomposées en série de fonctions atomiques élémentaires.

∑= )(tcf nnφ (2.17)

La théorie de la problématique des décompositions (2.17), supposent initialement le cas desfonctions φn orthogonales et, par la suite, le cas plus général de la décomposition du signal sur descadres ("frames" ) mathématiques.

2.2.1. La décomposition atomique [4]

Le but principal de la décomposition atomique est de représenter un signal quelconque f parune combinaison linéaire de fonctions atomiques φn. La seule contrainte imposée à l'ensemble φnest qu'il « représente » tout l'espace H et, donc, quel que soit le signal f , il pourra toujours êtreexprimé comme une combinaison linéaire de φn. Plus spécifiquement, l'ensemble φn doit formerun cadre pour H.

Etant donné un signal f∈H et un cadre φn, les séquences ( ) fcc n= qui satisfentl'équation (2.17) peuvent être générées par l'opérateur de représentation associé L du signal f.L'opérateur de représentation L représente l'outil mathématique de base pour la discrétisation et ilpeut être défini par :

( ) nff

ZlHL

φ,

: 2

a→

(2.18)

2.2.2. Les bases orthonormales

La problématique de la représentation d'un signal sur une base orthonormale est reductricepour certaines applications. Une base orthonormale n'est intéressante que grâce à l'unicité del'ensemble des coefficients, mais aussi du fait que les coefficients de projection quantifientdirectement la contribution de chaque fonction de base sur la structure du signal. Le fait que φn

Page 15: carte - representations temps - frequences ENSIETA

2. Rappels mathématiques

ENSIETA, Janvier 2002Centre de Recherche "Extraction et Exploitation de l'Information en Environnements Incertains"

10

forme une base orthonormale (BON) pour H implique que c=Lf représente le choix unique descoefficients qui satisfont (2.17) pour une fonction f ∈ H donnée.

En synthèse, une séquence orthonormale des fonctions Hn ⊆φ est une base orthonormalepour H si pour chaque f ∈ H il existe une sequence unique cn ∈ H telle que la relation (2.17) soitverifiée.

Les relations de Parseval et de Plancherel

Soit f, g ∈ H et φn une base orhtonormale. On note par L(H) le domaine de L défini par :

( ) HfLfHL ∈=∆

: (2.19)

− La relation de Plancherel pour une BON de H s’exprime par :

( )222 , HLnH Lfff == ∑ φ (2.20)

− La relation de Parseval pour une BON de H s’exprime par :

( )HLnn LgLfgfgf ,,,, * == ∑ φφ (2.21)

La reconstruction

Etant donnée une représentation orthonormale Lf d'un signal f ∈ H, la reconstruction de f àpartir de Lf est donnée par la relation suivante:

∑== nnfLfLf φφ,*(2.22)

Ainsi, l'opérateur de représentation de L, associé à une base orthonormale, est un opérateurunitaire :

Hn ILLHpourBON =⇒− *φ (2.23)

2.2.3. Les bases de Riesz

Une base de Riesz est une généralisation d'une base orthonormale dans le cas où lesconditions de norme unitaire et de l'orthogonalité des éléments de la base sont relaxées. En effet, laparticularité dominante d'une base de Riesz φn est le fait qu'elle est liée à une base orthnormale parun isomorphisme topologique T : H → H tel que φn=Tun, où un est une BON pour H. Parl'inversabilité de T, il existe une autre base ψn pour H avec laquelle φn est bi-orthogonale :

nmmn ,, δψφ = . Dans ce cas, on dit que ψn et la base duale de φn.

Une base de Riesz est donc une base obtenue à partir d'une base orthonormale, parl'application d'un isomorphisme topologique.

La reconstruction à partir d'une base de Riesz est établie par le théorème suivant.

Theoreme 2.1.

Si L est un opérateur de représentation et T est un isomorphisme topologique associé à unebase de Riesz φn de H, alors:

Page 16: carte - representations temps - frequences ENSIETA

2. Rappels mathématiques

ENSIETA, Janvier 2002Centre de Recherche "Extraction et Exploitation de l'Information en Environnements Incertains"

11

( ) ( )LfLTTfHf *1*,−

=∈∀ (2.24)

La demonstration de ce théorème fait objet d’un exercice en fin de chapitre.

2.2.4. La théorie des cadres ("frames") [5]

a. Par définition ([5]), une séquence Hn ⊆φ est un cadre ("frame") pour H s'il existe deuxlimites A,B>0 telles que

222 ,, fBffAHfZn

n∑∈

≤≤∈∀ φ (2.25)

b. L'opérateur-cadre du cadre Hn ⊆φ est une fonction S : H → H définie par nnfSf φφ∑= ,c. Un cadre est étroit ("tight") si A=B;d. Un cadre de H est nommé exact si l'ensemble obtenu par l'élimination d'un de ces éléments reste uncadre pour H.

La propriété de base induite de la définition (2.25) et que l'énergie de la représentation dusignal dans ce cadre est bornée par l'énergie du signal de départ pondérée par deux constantes. Dansla section "Exercice et Problèmes" on présente quelques cadres particuliers, souvent utilisés entraitement du signal.

La reconstruction du signal à partir d'un cadre est donnée par la relation suivante:

( ) ( ) ( )tRttfBA

tf fn

nn ++

= ∑ φφ,2

)( (2.26)

Ce résultat est basé sur quelques propriétés des cadres [2,5], exprimées dans le théorèmesuivant.

Théorème 2.2.

(a) Si Hn ⊆φ est un cadre avec les limites A, B alors S est un isomorphisme topologique qui

admet l'inverse S-1 ; de plus, nS φ1− est aussi un cadre avec les limites B-1 et A-1 et:

∑∑ −− ==∈∀n

nnn

nn SfSffHf φφφφ 11 ,,, (2.27)

(b) Soit Hn ⊆φ , soit L : F → l2(Z) défini par nfLf φ,= . Si φn est un cadre alors S=L*L,où L* est l'adjoint de L. (la demonstration de ce théorème est donnée en [5])

Dans l'expression (2.26), le terme Rf(t) représente le résidu issu de la représentationredondante du signal dans le cadre supposé. L'avantage de la représentation dans un cadre tient du faitque l'énergie de ce terme est borné par l'énergie du signal [5] :

Page 17: carte - representations temps - frequences ENSIETA

2. Rappels mathématiques

ENSIETA, Janvier 2002Centre de Recherche "Extraction et Exploitation de l'Information en Environnements Incertains"

12

( ) ( )∫∫∞

∞−

∞− +−≤ dttf

ABABdttR f

22(2.28)

On observe clairement que l'importance de résidu est réduite lorsque B-A tend vers 0.Néanmoins, il existe des situations où il souhaitable que ce terme soit important, puisuq'il apporte uncertain degré de redondance, propriété souhaitée dans des applications comme la classification dessignaux (voir le paragraphe sur la transformation en ondelettes supra-complète). Il s'agit alors d'uncompromis concernant le choix de A et B, qui peut être résolu par l'utilisation de la matrice decorrélation du cadre.

Théorème 2.3.

Etant donné un cadre φn pour l'espace Hilbert H , la matrice de corrélation de ce cadre R apour expression :

( ) ( )nmnmRR φφ ,, ==∆

(2.29)

(Voir [2] pour la demonstration)

Dans le cas pratique, cette matrice n'est pas inversible, ce qui contraient à définir la pseudo-inverse. Il existe plusieurs façons de définir cette matrice. Le théorème suivant décrit une de cesméthodes.

Théorème 2.4.

Soit R la matrice de corrélation d'un cadre (R ∈ B(H1,H2) ). Alors l'application R+ : H2 → H1

définie par

RxyxR −=∈

+

2Hyargmin (2.30)

est la pseudo-inverse de R.

Dans ces conditions, il est possible de déterminer les meilleures limites du cadre qui nousassurent, à la fois, un résidu d'énergie réduite et un degré de redondance satisfaisant. Ces valeurs sontdonnées par le théorème suivant.

Théorème 2.5. (Les meilleures limites d'un cadre)

Soit φn un cadre pour l'espace de Hilbert H avec les meilleures limites A et B du cadre, et lamatrice de corrélation du cadre, R. Ces deux notions sont liées entre elles par les relations :

RBRA ==−+ ;

1(2.31)

(Voir également [2] pour la demonstration de ce théorème)

2.2.5. La procédure d'orthogonalisation de Gramm-Schmidt [1]

Cette procédure permet d'obtenir, à partir d'un ensemble de fonctions linéairementindépendantes sur H, φn, un ensemble orthonormal de fonctions de base, ϕn. L'expression de cesfonctions orthonormales vaut:

Page 18: carte - representations temps - frequences ENSIETA

2. Rappels mathématiques

ENSIETA, Janvier 2002Centre de Recherche "Extraction et Exploitation de l'Information en Environnements Incertains"

13

( ) ( )( )tvtv

ti

ii =ϕ (2.32)

où les fonctions vi(t) ont pour l'expression :

( ) ( ) ( ) ( )∑=

+++ −==i

kkikii tttvttv

111111 ,)(, ϕφϕφφ (2.33)

Pour plus de détails concernant la proposition d'orthogonalisation par la méthode de Gramm-Schmidt, voir la référence [6].

2.3. Rappel sur la théorie des matrices [7]

La justification de la nécessité de ce rappel réside dans le fait que, pour l'implémentationdiscrète des méthodes qui seront présentées dans cet ouvrage il est souvent indiqué d'utiliser la formematricielle des opérateurs temps-fréquence et, pour une exploitation optimale, on peut envisagerl'utilisation des propriétés matricielles.

Par définition, une matrice est un tableau constitué de m lignes et n colonnes

( ) ( )

===×

mnmm

n

n

ijnmij

aaa

aaaaaa

aaA

LLMMLL

21

22221

11211

(2.34)

où les aij sont des scalaires. Alors la transposée AT de A est la matrice dans laquelle la valeur en i,j estaji.

Par la suite, on définit les opérations de base associées aux matrices. Soit A=(aij), B = (bij)deux matrices m × n, c ∈ C . On définiti) la somme de deux matrices : (A+B) = (aij+bij)ii) le produit d'une matrice et d'un scalaire : cA = (caij)

Par ailleurs, le produit de deux matrices A=(aij)mx n et B=(bij) n x k est défini par la matriceC=(cij)m x k :

∑=

=n

jiij bac1υ

υυ (2.35)

Les propriétés de base du produit matriciel sont présentées dans le théorème suivant.

Théorème 2.6.(Propriétés du produit matriciel)

i) Le produit de matrice n'est pas commutatif. ii) Loi associative : (AB)C = A(BC) iii) Loi distributive : A(B+C) = AB + BC iv) AI = IA =A (I est la matrice identité) v) (AB)T = BT AT

La demonstration de ce théorème est laissée comme exercice aux lecteurs.

Page 19: carte - representations temps - frequences ENSIETA

2. Rappels mathématiques

ENSIETA, Janvier 2002Centre de Recherche "Extraction et Exploitation de l'Information en Environnements Incertains"

14

Par définition, la matrice carrée A est dite inversible, s'il existe une matrice B avec lapropriété :

A B = B A = I (2.36)

Une telle matrice B est unique. On appelle B l'inverse de A et on la note A-1.

2.3.1. Notion de déterminant

Définition (Permutation)Soit n ∈ N

i) Une fonction bijective nn ,..,2,1,..,2,1: →σ est appelée une permutation sur lesentiers de 1 à n.

ii) Sn décrit l'ensemble ndenpermutatioSn ,...,2,1: σσ= .

iii) On décrit σ ∈ Sn par

( ) ( ) ( )( )nn

nσσσ

σσσσ LL

L2121

21=

= (2.37)

iv) On dit que σ est pair ou impair selon s'il existe un nombre pair ou impair de couples (i,k)pour lesquels i>k, mais où i précède k par la transformation σ.

v) Le signe ou la parité de σ ∈ Sn est défini par

( ) ( ) ( )( )∏≤<≤

−=nji

jisignsign1

σσσ (2.38)

Définition (Déterminant)

Soit A=(aij)nxn une matrice carrée. Le nombre

( )∑∈

∆⋅⋅=

nnS

naasignAσ

σσσ …11det (2.39)

est appelé déterminant de A.

Les propriétés du déterminant sont presentées dans le théorème suivant.

Théorème 2.7.(Propriétés du déterminant)

Soit A une matrice carrée n x n , I la matrice identité. Alors :

i) det(A)=det(AT) ii) det(I)=1 iii) det(a1,…,ak,…,al,…,an)= - det(a1,…,al,…,ak,…,an) iv) det(a1,…,λak,,…,an)= λdet(a1,…,ak,…,an) v) det(a1,…,a'

k,+a"k,…,an)= det(a1,…,a'

k, ,…,an)+ det(a1,…,a"k,…,an)

vi) Le déterminant est une fonction multiplicative, pour toutes les matrices n x n A et B on a

Page 20: carte - representations temps - frequences ENSIETA

2. Rappels mathématiques

ENSIETA, Janvier 2002Centre de Recherche "Extraction et Exploitation de l'Information en Environnements Incertains"

15

det(AB)=det(A)det(B) (2.40)

Définition (Mineur, Cofacteur)

Soit A une matrice carrée n x n. Mij décrit la sous-matrice carrée (n-1 x n-1) de A obtenue eneffaçant la i-ème ligne et la j-ème colonne.i) det(Mij) est appelé mineur de l'élément aij de A.

ii) ( ) ( )ijji

ij MA det1 +−= est appelé le cofacteur de aij.

A partir de ces notions, on peut définir la matrice adjointe de A par la transposée de la matricedes cofacteurs des éléments aij de A, notée adjA. En [7], il est montré que l'adjointe de la matrice A(notée également avec A*) satisfait la propriété :

AA*=A*A=det(A)*I (2.41)

Comme corollaire à cette propriété, on peut écrire l'inverse de la matrice A selon :

( )*1

det1

AA

A =−(2.42)

qui existe si et seulement si detA≠0.

Une application importante de la théorie des matrices est la résolution des systèmesd'équations linéaires [7]. Le résultat suivant est très important dans ce contexte lorsqu'il fournit uneméthode élégante pour la résolution de ce système.

Théorème 2.8. (Règle de Cramer)

Soit A une matrice n x n telle que detA≠0. Alors le système suivant Ax=b, ∀ b∈ Rn a uneunique solution donnée par x=A-1b, i. e.

( )nkkk aabaaA

x ,...,,,,...,detdet

1111 +−= (2.43)

2.3.2. Vecteurs et valeurs propres

Un scalaire λ est une valeur propre de A si et seulement s'il existe x≠0 :

0; ≠= xxAx λ (2.44)

x est appelé vecteur propre de A de valeur propre λ. Le scalaire λ est appelé valeur propre associée àx.

Théorème 2.9. (Le calcul de vecteurs et valeurs propres)

Soit A une matrice n x n. i) λ est une valeur propre de A si et seulement si det(λI-A)=0. ii) Si λ est une valeur propre de A, alors toute solution x≠0 de (λI-Ax)=0 est un vecteur propreassocié.

L'expression det(λI-A) est appelé le polynôme caractéristique de A.

Page 21: carte - representations temps - frequences ENSIETA

2. Rappels mathématiques

ENSIETA, Janvier 2002Centre de Recherche "Extraction et Exploitation de l'Information en Environnements Incertains"

16

Dans les application pratiques on a souvent l'intérêt d'avoir une matrice diagonale, due àl'exploitation légère d'une telle matrice. Par définition, une matrice est diagonalisable si et seulements'il existe une matrice invertible P n x n telle que P-1AP soit une matrice diagonale.

Théorème 2.10. (Condition pour la diagonalisabilité)

Soit A une matrice avec les valeurs propres λ1,λ2,…,λn. S'il existe un ensemble indépendantx1,x2,…,xn de vecteurs propres, alors A est diagonalisable. Si xi est un vecteur propre associé à λi, et P=(x1,x2,…,xn), alors P est inversible et diagonalise A.

Une autre propriété importante de l'ensemble des valeurs propres d'une matrice est celled'indépendance des vecteurs propres associés lorsque les valeurs qui composent cet ensemble sontdistincts.

2.3.3. Matrices spéciales

Quelques matrices spéciales sont largement utilisées en traitement du signal.

1. A est dite orthogonale si AAT=ATA=I. Autrement, A est orthogonale si et seulement si les vecteurslignes de A sont orthonormaux.

2. A est symétrique si A=AT.3. A est une matrice hermitienne si A=AH (H est l'opérateur hermitien : aij=a*

ji). Pour les matricesréelles la condition pour qu'elle soit hermitienne est équivalente à la symétrie de cette matrice.Dans le cas complexe, A est hermitienne si et seulement si xHAx est réel, quel qu'en soit x -complexe.

4. Une matrice A avec la forme suivante est dite tridiagonale :

=

nn

n

abb

abba

A

1

1

21

11

0

0

LOOM

MOL

5. Une matrice A est dite de Toeplitz si elle a des diagonales constantes : aij ne dépend que de (i-j).6. Une matrice A est dite unitaire si AHA=I. Pour les matrice réelles, cette notions est équivalente à

celle d'orthonormalité. Une matrice est orthonormale si et seulement si ses colonnes sontorthormales.

Pour plus de détails concernant la théorie des matrices, voir la référence [7].

2.3.4. Propriétés de derivation des matrices

Dans les application on est souvent confronté avec des problems d’optimisation (basésprincipalement sur de methodes de gradient) ou de resolution des systèmes d’équations linéaires ouquadratiques. Ainsi, les formules de dérivation suivantes nous permettent de faciliter les algorithmescorrespondents :

Page 22: carte - representations temps - frequences ENSIETA

2. Rappels mathématiques

ENSIETA, Janvier 2002Centre de Recherche "Extraction et Exploitation de l'Information en Environnements Incertains"

17

AxxAxx

bx

xb

T

T

2=∂

=∂

(2.45)

avec l’hypothese de symmetrie de la matrice A.

2.4. Rappels sur les variables et signaux aléatoires [8]

Dans la nature, les signaux sont toujours perturbés, soit à cause de sourcesenvironnementalles, soit à cause du facteur humain. Par conséquence, ces signaux ont un caractèrealéatoire, et, leur traitement sera plus performant lorsqu'on possèdera des informations sur la naturede la perturbation. C'est la raison pour laquelle on présente brièvement les notions de base concernantles signaux aléatoires; ceci permettra d'aborder toutes les applications pratiques où l'existence du bruitdoit être prise en compte.

2.4.1. Variable aléatoire réelle et rappels

Une variable aléatoire (v.a) réelle est une application X de l'espace des épreuves Ω dans R.On appelle fonction de répartition ou de distribution de la variable aléatoire X, la fonction

d'une variable F xx ( ) définie par :

F x P X xX ( ) = ( )≤ (2.46)

Cette fonction possède les propriétés suivantes :a) FX est une fonction croissante bornée et continue avec P X x( ) ≤ continue à droiteb) P a X b F b F aX X( = ( ) - ( )≤ ≤ )c) ( ) = , ( ) =lim lim

xX

xXF x F x

→∞ →∞1 0

La densité de probabilité (ddp) représente la répartition des probabilités en fonction desréalisations. Elle vérifie les propriétés suivantes :

• F x F u duX X( ) - ( ) = fX

-

x

−∞

∞∫ ( ) (2.47)

• F u duX ( ) = fX

-

+∞ =

∫ ( ) 1 (2.48)

• P a X b u du F b F a

a

b

X X[ ] ( ) ( ) ( )≤ ≤ = = −∫ fX (2.49)

Du fait de la continuité de f xX ( ) , les inégalités faisant intervenir la v.a. X peuvent êtreindifféremment prises au sens strict ou au sens large. On peut enfin écrire au second ordre près :P x X x dx f x dxX[ ] ( )≤ ≤ + = .

Moments d'une v.a.

On appelle moment d'ordre n de la variable X, la quantité E X n( ) . On appelle moment centré

d'ordre n de X, la quantité ( )( )E X E Xn

.

Page 23: carte - representations temps - frequences ENSIETA

2. Rappels mathématiques

ENSIETA, Janvier 2002Centre de Recherche "Extraction et Exploitation de l'Information en Environnements Incertains"

18

Par définition, la variance d'une v.a. est le moment centré d'ordre 2. On peut donner lesexpressions de la variance dans le cas d'une v.a. continue.

Var X x E X f x dxX( ) ( ( )) ( )= −∞

∫-

+2 (2.50)

La quantité σ X Var X= ( ) est une caractéristique de dispersion de la v.a. X autour de samoyenne E(X). σ X s’appelle l'écart type de la v.a X. D'une manière générale, on dit queX E X- ( ) est la variable centrée correspondant à X. La variance permet d'écrire la très importanteinégalité de Bienaymé Tchebycheff :

PX E X

ttx

−≥

<

( )σ

12 (2.51)

L'interprétation de cette inégalité est simple : σ X est une mesure probabiliste de la dispersion de Xautour de sa valeur moyenne E X( ) .

1ère fonction caractéristiqueOn appelle fonction caractéristique (ou première fonction caractéristique) la fonction :

ϕXjuXu E e( ) = (2.52)

Cette fonction caractéristique existe toujours pour toute valeur de u. Dans le cas où X est unev.a. continue, ϕ X u( ) est directement liée à la transformée de Fourier de f xX ( ) , notée TFX (. ) .

[ ]E e TFjuXX

u= − 2π (2.53)

Vecteurs aléatoires

A un vecteur aléatoire à n dimensions, on peut faire correspondre n variables dites marginales.La connaissance de la fonction de distribution du vecteur entraîne la connaissance des n v.a

marginales ; en général la réciproque n'est pas vraie.Un cas très important correspond à l'indépendance des événements. On dit que les n v.a.

x x xn1 2, , L sont indépendantes dans leur ensemble si :

f x x f x f x f xX n x x x nn( , ... ) = ( ) . ( ) ... ( )1 1 21 2

(2.54)

L'indépendance des n v.a. entraîne alors l'indépendance de x1 et de x2 .En se limitant à l'étude de vecteurs aléatoires à deux dimensions que l'on notera ( , )X Y , on

suppose le vecteur aléatoire ( , )X Y continu, c'est-à-dire qu'il existe une densité de probabilité :

f x yF x y

x yXYXY( , )

( , )=

∂∂ ∂

2(2.55)

P x X x dx y Y y dy f x y dxdyXY[ ] ( , )≤ ≤ + ≤ ≤ + =et (2.56)

Les moments mrs se définissent par la relation suivante :

m E X Y x y f x y dx dyrsr s r s

XY= =−∞

+∞

∫∫ ( , ) (2.57)

Les moments les plus importants sont les moments d'ordre 1:

Page 24: carte - representations temps - frequences ENSIETA

2. Rappels mathématiques

ENSIETA, Janvier 2002Centre de Recherche "Extraction et Exploitation de l'Information en Environnements Incertains"

19

m E X x f x y dx dyXY10 = =−∞

+∞

∫ ( , ) =−∞

+∞

∫ x f x dxX ( ) (2.58)

m E Y y f y dyY01 = =−∞

+∞

∫ ( ) (2.59)

Il existe, ensuite trois moments d'ordre deux non centrés et trois moments centrés.

m E X x f x y dx dyXY202 2= =

−∞

+∞

−∞

+∞

∫∫ ( , ) =−∞

+∞

∫ x f x dxX2 ( ) (2.60)

m E Y y f y dyY022 2= =

−∞

+∞

∫ ( ) (2.61)

m E XY xy f x y dx dyXY11 = =−∞

+∞

−∞

+∞

∫∫ ( , ) (2.62)

L'inégalité de Schwarz lie ces trois moments.

m m m E XY E X E Y112

02 202 2 2≤ ⇔ ≤ (2.63)

µ ' ( ) ( )11 10 01 11 10 01= − − = − ⋅E X m Y m m m m = −E XY E X E Y (2.64)

µ '11 est appelé la covariance de ( , )X Y .On peut remarquer l'analogie entre moments centrés d'ordre deux et produit scalaire. Les

dernières inégalités permettent alors de définir le coefficient de corrélation.

ρσ σ

( , )cov ( , )

X YX Y

X Y= (2.65)

Ce nombre comme un cosinus est compris entre +1 et -1.Dans le cas où Y est une fonction affine de X c'est-à-dire que Y a X b= + , on montre que :

si > =si > = -1

a X Ya X Y

0 10

ρρ

( , )( , )

(2.66)

Quand ρ( , )X Y = 0 on dit que les v.a. X et Y sont non corrélées. L'indépendance est unecondition suffisante de non corrélation; ce n'est pas une condition nécessaire, on peut donc avoir :E X Y E X E Y( , ) = ( ) ( ) sans que X et Y soient indépendantes.

Convergence vers la loi - Théorème de la limite centraleQuand on possède n v.a. Xk de même loi discrète ou continue, indépendantes et possédant des

moments du 1er et 2nd ordre, on montre que la v.a.

X nn

X E XX

k kk

n

k

( ) ( ( ))= −=

∑1

(2.67)

a sa fonction caractéristique qui tend vers la fonction caractéristique de la v.a. centrée normale.Ce théorème permet de comprendre pourquoi le caractère aléatoire gaussien est le plus

répandu physiquement. En effet, souvent une grandeur aléatoire observée est la somme d'un trèsgrand nombre de v.a. faibles de loi quelconque mais identique.

Page 25: carte - representations temps - frequences ENSIETA

2. Rappels mathématiques

ENSIETA, Janvier 2002Centre de Recherche "Extraction et Exploitation de l'Information en Environnements Incertains"

20

2.4.2. Processus aléatoires

Stationnarité stricte et d'ordre 2La stationnarité est une propriété qui traduit l'invariance d'un système par translation de

l'origine des temps. Comme une fonction aléatoire est définie par ses propriétés statistiques et donc saloi temporelle, la stationnarité au sens strict se traduit par les égalités :

f x x x t t f x x t t t tX n n X n n ( , , , , , , ) = ( , , , + , + )1 2 1 1 1 0 0L L L L , (2.68)

Ceci peut se traduire par :

f x x x t t f x x t t t tX n n X n n ( , , , , , , ) = ( , , 0, - , - )1 2 1 1 2 1 1L L L L , (2.69)

En particulier :f x t f x f xX X X ( , ) = ( , = ( ) 0) indépendante du temps (2.70)

f x x t t f x x t t f x x t tX X X( , , , ( , ,0, - ( , , avec -1 2 1 2 1 2 2 1 1 2 2 1) ) )= = =τ τ (2.71)

Dans la distribution du 2nd ordre d'un processus aléatoire stationnaire seul intervient l'écartentre les deux instants d'observation.

La stationnarité d'ordre deux, dite encore stationnarité au sens large ou encore stationnaritéfaible est la stationnarité pour les moments d'ordre 1 et 2. Elle se traduit par :

( )E X t m t m m t( ) = ( ) = , 0 =1 1 1 ∀ (2.72)

E X t X t m t t( ) ( )1 2 11 1 2= ( ), τ τ = − (2.72)

La stationnarité au sens large n'implique pas la stationnarité stricte. Seuls les processusaléatoires entièrement définis par la caractérisation d'ordre deux sont obligatoirement stationnaires ausens strict, s'ils le sont au sens large. C'est le cas en particulier pour les processus gaussiens.

Ergodicité

Pour un processus stationnaire, l'ergodicité d'une moyenne entraîne l'égalité des moyennescorrespondantes d'ensemble et temporelle. C'est-à-dire que l'on pourra écrire.

X E X= (2.73)

Ceci a une interprétation physique intéressante. En effet, pour accéder à la moyenned'ensemble, seule caractéristique de la théorie, il est possible de travailler sur une réalisationquelconque du processus, c'est-à-dire encore qu'une réalisation quelconque est alors représentative duprocessus complet pour le calcul de cette moyenne. L'ergodisme est à rapprocher de la loi des grandsnombres. En effet si x x xn1 2, , ,L L est une suite infinie de v.a. de même loi et indépendantes, alors:

E Xn

X E Xn

ii

n

i=

=

→∞=∑lim

1

1

(2.74)

La moyenne probabilité E X est remplacée par la moyenne arithmétique (temporelle).Deux ergodicités sont particulièrement intéressantes pour les processus stationnaires d'ordre

deux ; l'ergodicité de l'espérance mathématique et l'ergodicité de la covariance.

Page 26: carte - representations temps - frequences ENSIETA

2. Rappels mathématiques

ENSIETA, Janvier 2002Centre de Recherche "Extraction et Exploitation de l'Information en Environnements Incertains"

21

m E X t x f x t dxT

x t dtXT T

T1

00 0

012

= = =−∞

+∞

→∞ −∫ ∫( ) ( , ) lim ( ) (2.75)

et m t t x x f x x t t dx dxX11 1 2 1 2 1 2( , ) ( , , , )− = −−∞

+∞

−∞

+∞

∫∫τ τ (2.76)

= = −→∞ −∫ΓXX

T T

T

Tx t x t dt( ) lim ( ) ( )*τ τ

0 0

012 0

(2.77)

ΓXX ( )τ est la fonction d'autocorrélation du processus x(t). Elle est un outil majeur de l'étudedes processus stationnaires d'ordre deux ergodiques. Ses propriétés sont directement liées à celle de lafonction covariance dont elle est issue. Pour l'exploiter, on choisit en général de centrer le processus,ce qui est particulièrement simple du fait de la stationnarité (il suffit de retrancher à x(t), m1 qui estune constante)

Propriétés caractéristiques des processus stationnaires d'ordre deux• La fonction d'autocorrélation est maximale en 0 : Γ ΓX X( ) ( )τ ≤ 0 .

• La fonction d'autocorrélation est hermitienne. Γ ΓX X* ( ) ( )− ≤τ τ En particulier si x(t) est réel,

ΓX ( )τ est réelle et paire.

• En général, on a lim ( )τ

τ→∞

= =ΓX m E X2 2. Cela veut dire que pour τ assez grand, les

v.a. X(t) et X t t*( - ) tendent à être décorrélées.• La densité spectrale de puissance est la transformée de Fourier de la fonction

d'autocorrélation :

γ ν τ τ τπ ντX X X

jTF e d( ) ( ) ( )= = −

−∞

+∞

∫Γ Γ 2 (2.78)

• La densité spectrale est une fonction réelle, positive non nulle. Si X(t) est réel, γ νX ( ) estpaire. Par ailleurs, γ νX ( ) étant réelle, on en déduit que ΓX ( )τ est réelle et paire et donc :

γ ν τ π ντ τX X d( ) ( ) cos=−∞

+∞

∫ Γ 2 (2.79)

Processus gaussiensUn processus aléatoire est dit gaussien si quelle que soit la suite des instants t tn1, , L et quel

que soit n, la variable aléatoire à n dimensions ( ( ) - - - ( ) )X t X tn1 est gaussienne.Nous rappelons qu'une variable aléatoire réelle de dimension n est gaussienne si sa densité de

probabilité est donnée par :

p x xC

X M C X Mn nt( , , )

( ) (det )exp ( ) ( )/ /1 2 1 2

11

2

12

L = − − −

π(2.80)

où :- X désigne le vecteur colonne de composantes : x xn1, ,L ,

-M désigne le vecteur moyenne de composantes : m = E X (t ) , , m = E X (t )1 1 n nL ,

- C désigne la matrice de covariance d'éléments cij définie par : c E X t X t m mij i j i j = ( ) ( ) - .

Nous notons que C est une matrice hermitienne : c cij ji = * .

Les processus aléatoires gaussiens jouent un rôle fondamental en pratique. La loi de Gausss'introduit en effet naturellement dans de nombreux phénomènes physiques qui se présententmacroscopiquement comme la somme de phénomènes physiques décorrélés (théorème central limite).Un exemple important est donné par le bruit thermique. Ce bruit provient des fluctuations dues à

Page 27: carte - representations temps - frequences ENSIETA

2. Rappels mathématiques

ENSIETA, Janvier 2002Centre de Recherche "Extraction et Exploitation de l'Information en Environnements Incertains"

22

l'agitation thermique des particules élémentaires de tout système physique (fluctuations de tensionaux bornes d'une résistance). Par ailleurs les calculs se simplifient très souvent grâce à l'hypothèsegaussienne. En particulier les propriétés suivantes sont établies :

a) Un processus aléatoire gaussien est défini entièrement par la donnée des moments dupremier et du second ordre. En effet le vecteur moyenne M ainsi que la matrice decovariance C qui interviennent dans la loi temporelle peuvent être calculés pour toutessuites t tn1, , L à partir des fonctions m (t) X et ΓX 1 2 (t , t ) . Il vient :

M m t m ttX X n = ( ( ), , ( ))1 L (2.81)

C t t m t m tij X i j i j = ( , , ) - ( ) ( )Γ (2.82)

b) Un processus aléatoire gaussien stationnaire au sens large est stationnaire au sens strict,puisque la loi temporelle est complètement caractérisée par ses deux premiers moments.D'autre part toutes les composantes du vecteur moyenne sont égales. Enfin la matrice decovariance prend une forme très particulière appelée matrice de Toeplitz, dans laquelle lesvaleurs qui interviennent dans les lignes parallèles à la diagonale principale sont égales.

c) La décorrélation entraîne l'indépendance.d) Il est aisé de montrer que toute combinaison linéaire finie de v.a. gaussiennes

indépendantes est gaussienne. Nous admettrons la propriété fondamentale que le caractèregaussien se conserve dans toute transformation linéaire et donc par conséquent par filtragelinéaire.

e) Dans la modélisation des signaux aléatoires, nous rencontrons souvent de pair le caractèreblanc et le caractère gaussien. Insistons sur le fait qu'il n'y a pas d'implication entre cesdeux propriétés.

f) Enfin, énonçons, sans démonstration, un résultat pratique important sur les v.a. gaussiennes.Soient quatre v.a. X1, X2, X3, X4, gaussiennes et centrées, nous avons alors :

E X X X i j ki j k ( ) = ( , , ) ( , , , )0 1 2 3 4∀ ∈et E X X X X E X X E X X E X X E X X E X X E X X( ) = ( ) ( ) + ( ) ( ) + ( ) ( )1 2 3 4 1 2 3 4 1 3 2 4 1 4 2 3 .

Processus blancOn appelle bruit blanc, un processus aléatoire b(t) dont le spectre de puissance est constant sur

toutes les fréquences.On en déduit alors que sa fonction d'autocorrélation Γbb( )τ est :

Γbb bTFN

( ) ( ( )) ( )τ γ ν δ τ= =−1 02

(2.83)

Rapport signal/bruitTout signal noyé dans du bruit b(t) s'écrira classiquement sous la forme de la somme de deux

signaux :

r t s t b t( ) = ( ) + ( ) (2.84)

Le rapport signal à bruit permet de chiffrer si le bruit est "important" par rapport au signal ouvice-versa.

Il peut être défini comme le rapport entre la puissance moyenne du signal sur la puissancemoyenne du bruit.

RP

Psignal

bruit= (2.85)

Page 28: carte - representations temps - frequences ENSIETA

2. Rappels mathématiques

ENSIETA, Janvier 2002Centre de Recherche "Extraction et Exploitation de l'Information en Environnements Incertains"

23

2.5. Conclusions

Ce chapitre a eu comme but le rappel des principales notions mathématiques utilisées entraitement du signal et, particulièrement, dans le domaine des représentations temps-fréquence. Lapremière section a été dédiée aux concepts mathématique de base, comme celles de norme, produitscalaire, espaces etc. Après on a défini les plus utilisés espaces en traitement du signal et, lesopérations associées aux ceux-ci, en insistant sur les opérateurs unitaires.

Ensuite, on a présenté succinctement quelques rappels sur la théorie des matrices, quireprésentent, en effet, l'outil de base pour la discrétisation des outils temps-fréquence qui serontprésentés par la suite.

Finalement, on a fait un petit rappel sur la théorie des variables et signaux aléatoires. Laconnaissance de ces notions est imposée par la nature des signaux réels, qui sont toujours bruités, cequ'en les rendre un caractère aléatoire, impossible à aborder dans un contexte 100% déterministe.

Toutes les notions introduites au cours cette première section ont été adaptées pour lareprésentation du signal, d'une manière attractive de point de vue mathématique.

Les exercices et les problèmes proposés à la fin de ce chapitre ont deux buts majeurs : toutd'abord, ils constitueront un moyen efficace pour la compréhension des notions qu'on vient deprésenter et, le second, est de donner des exemples suggestifs sur la signification physique de cesnotions.

Références

[1] A. Poularikas (Editor-in-Chief) - "The transforms and applications handbook", CRC Press & IEEE Press, ISBN0849383420, 1996[2] A. Theolis – “Computational Signal Processing with Wavelet ”, Birkhauser Press, Boston, 1998[3] I. Gohberg, S. Goldberg - "Basic Operator Theory", Birkhauser Press, Boston, 1980[4] S. Mallat – “A Wavelet Tour of signal processing”, Academic Press, 1998.[5] R. Duffin, S. Schaeffer - "A class of nonharmonic Fourier series", Trans. Amer. Math. Soc., 72:341-366, 1952.[6] A. Papoulis - "Signal Analysis", New York, NY. McGraw-Hill, 1977.[7] G.H. Golub, C. Van Loan - "Matrix Computations", The John Hopkins University Press, ISBN 0-8018-5414-8, 1996[8] M. Charbit - "Eléments de théorie du signal : les signaux aléatoires", Ellipses, 1990

Page 29: carte - representations temps - frequences ENSIETA

2. Rappels mathématiques

ENSIETA, Janvier 2002Centre de Recherche "Extraction et Exploitation de l'Information en Environnements Incertains"

24

EXERCISES ET PROBLEMES

1. (Norme) En utilisant les propriétés de la norme (paragraphe 2.1.1.), démontrer la loi duparallélogramme :

( )x y x y x y+ + − ≤ +2 2 2 2

2

2. (Théorie des opérateurs) Soit ( )a R f L R∈ ∈, 2 . Prouver les relations suivantes :

a. ( )τ a af e f^

;= −

) b. ( )e f fa a

^;= τ

) c. ( )D f D fa a

^;= −1

)

3. (Théorie des opérateurs) Soit ( )f g L R, ∈ 2

a. Ecriver la convolution ( )( ) ( ) ( )f g t f x g t x dx* = −−∞

∫ en terme de produit scalaire et l’opérateur de

translation ;b. En utilisant la relation de Parseval et l’expression obtenue antérieurement, montrer que

( )f g f g*^

= ⋅) )

4. (Les espaces de Hilbert) Soit l’espace de Hilbert l2(J) ; J=1,2. Un opérateur ( ) ( )T l J l J: 2 2→peut être écrit comme :

Ta bc d

a b c d C=

∈; , , ,

a. Calculer T ;b. Trouver les conditions qui doivent être imposées sur a,b, c, d pour que :

i) ( ) ( )( )T B l J l J∈ 2 2, ;ii) T soit unitaire ;iii) T=T* .

5. (Bases Orthonormales) Soit l’ensemble des fonctions exponentielles complexes ( ) e nk N/ n=0,…,N-1 et k=0,…, N-1.

a. Quel est l’espace d’appartenance de cet ensemble ?b. Montrer que cet ensemble est orthogonal.c. Quel terme faudrait-il rajouté pour que l’ensemble soit orthonormal ?d. Quelle est-elle l’utilisation la plus connue de cet ensemble ?

6. (Base orthonormales) Soit φn n

N

=

0

1 une base orthonormale pour l2(0,1,…,N-1). Si

U l N l N: ( , , ... , ) ( , ,... , )2 20 1 1 0 1 1− → − est un opérateur unitaire alors l’ensemble U n n

=

0

1 est

une base orthonromale pour l2(0,1,…,N-1).

7. (Bases de Riesz) Donnez la preuve du théorème 2.1.

8. (Théorie des cadres) Prouver qu’une base orthonormale pour H est un cadre étroit et exact pourH. Quelle est l’expression des limites du cadre dans ce cas ?

9. (Théorie des cadres) Prouver que l’union de N bases orthonormales pour H constitue un cadreétroit et non-exact pour H.

Page 30: carte - representations temps - frequences ENSIETA

2. Rappels mathématiques

ENSIETA, Janvier 2002Centre de Recherche "Extraction et Exploitation de l'Information en Environnements Incertains"

25

10. (Théorie des cadres) Soit un une base orthonormale. Montrer que l’ensemble anun , où anest une séquence des scalaires qui satisfaite 0 2< ≤ ≤ < ∞A a Bn , est un cadre non-étroit et exactpour H.

11. (Bases orthonormales) Soit une fonction φ définie selon :

( ) ( )φ πγ γπγt e dj t= ⋅−∫ cos / 2 2

1

1

Prouver que :a. τ φn est une séquence orthonormale en L2(R)

b. τ φn n’est pas une base orthonromale en L2(R)

12. (Processus d’orthogonalisation de Gramm-Smidt)

On considère le cas de transmission d'un signal MDP4 (modulation discrète de phase à quatreétats) :

( ) ( ) ( ) 4,3,2,1;2

12cos 00 ∈

−++= kktftAhtsk

πϕπ

où h(t) est la fonction porte :

( ) [ ] ∈

=sinon,0

,0,1 Ttth

a) Déterminer la dimension minimale de la base orthonormale nécessaire pour représenter un signalMDP4.

b) Déterminer, à partir de l'expression d'un signal MDP4 et en utilisant le processusd’orthogonalisation de Gramm-Smidt, la forme des fonctions qui compose la base orthonormalede dimension minimale.

13. (Théorie des matrices) Donner la demonstration pour le théorème 2.6.

14. (Théorie des matrices) Soit A=(aij)n x n une matrice symétrique avec les valeurs propres distinctes(λ1,λ2,… λn). Soit Q une matrice orthogonale qui diagonalise A. Alors le changement de

coordonnées x=Qy transforme ∑=

n

jijiij xxa

1, en ∑

=

n

iii y

1

2λ .

15. (Théorie des matrices) Considérons l'équation

041

134542 212221

21 =−++++ xxxxxx

a) En mettant

=

2

1

xx

x trouvez les matrices A et B telles que

041

=−+ xbAxx TT

b) Déterminer les valeurs et les vecteurs propres de A.c) Donner l'expression de la matrice Q qui diagonalise A.d) Que obtient-on par la transformation des coordonnées y=Qx? Représentation graphique

Page 31: carte - representations temps - frequences ENSIETA

2. Rappels mathématiques

ENSIETA, Janvier 2002Centre de Recherche "Extraction et Exploitation de l'Information en Environnements Incertains"

26

16. (Théorie des matrices) On considère la transformée de Fourier discrète (TFD) d'une séquence x(n)donner par l'expression suivante :

[ ] ( ) 1,...,0;21

0−==

−−

=

∑ NkenxkX Nkn

jN

n

π

a) Ecrire cette expression sous forme matricielle X=Fx.b) Calculer les matrices J=F*F=F2 et K=F*F*F*F=F4.c) Compte tenu de ces résultats, calculez les valeurs propres de F. Quelle observation peut-on faire

sur la structure de l'ensembles des vecteurs propres de F?

17. (Variable aléatoires - exemples de densités de probabilité - d.d.p.)

a) Dans le cas continu, une v.a. est dite à d.d.p uniforme si sa d.d.p f xX ( ) est constante dansl'intervalle [ ]a b, . On en déduit :

( )f xb a

a x b

X =−

≤ ≤

1

0

ailleurs

Calculer E[X], Var[X], σX pour cette distribution.b) La v.a. X est une variable continue suivant une loi de Gauss si:

f x eX

x m

( )( )

=− −

1

2 22

2

2

πσσ

Calculer E[X], Var[X], σX pour cette distribution.

18. (Variables aléatoires) Supposons ( )1,0~ NX (X est une variable aléatoires de loi gaussiennecentrée et de variance unité). Trouver la densité de probabilité fY(y) de la variable aléatoire Y=g(X)si :

(a) ( ) xxg = ; (b) ( ) ( )xuexg x−=

19. (Stationnarité au second ordre) On considère le signal aléatoire ( ) ( )ϕω +⋅= tatx cos où a estune variable aléatoire de moyenne ma, de variance σ 2

a , ω est une constante et ϕ est une variablealéatoire uniformément répartie sur [0,2π] et supposée indépendant de a.

a) Calculer la valeur moyenne de x(t).b) Calculer la fonction d'autocorrélation ( )τγ −ttxx , de x(t). x(t) est-il stationnaire au sens large ?

20. (Stationnarité et ergodicité d'un processus aléatoire) On considère le signal aléatoire( ) ( )ϕω +⋅= tatx cos où a et ω sont des constantes et ϕ est une variable aléatoire de fonction

caractéristique ( ) [ ]ujeEu ϕφ = .a) Montrer que x(t) est stationnaire au sens large si et seulement si φ(1)=0 et φ(2)=0.b) On suppose dans ce qui suite que et ϕ est une variable aléatoire uniformément répartie sur [0,2π]i. Montrer que x(t) est stationnaire au sens large.ii. Déterminer la loi de probabilité de x(t).iii. Calculer la fonction d'autocorrelation de x(t).iv. x(t) est-il ergodique relativement à la fonction d'autocorrelation

Page 32: carte - representations temps - frequences ENSIETA

3. Généralités sur les signaux non-stationnaires

ENSIETA, Janvier 2002Centre de Recherche "Extraction et Exploitation de l'Information en Environnements Incertains"

27

3GENERALITES SUR LES SIGNAUX NON-STATIONNAIRES

3.1. Méthodes de base pour le traitement des signaux stationnaires

Lorsqu’il s’agit de traiter des signaux stationnaires, les outils disponibles sont en faitnombreux et de nature assez disparate. Ceci est dû à la multiplicité des types de signauxsusceptibles d’exister dans la nature. Chaque outil est le plus souvent adapté à une situation et estintroduit de manière ad hoc. Cette disparité rend difficile la mise en œuvre et les comparaisonsentre les approches. La difficulté est accrue par le fait que les buts poursuivis peuvent êtrerelativement différents.

Sans prétendre couvrir tous les cas, il peut être utile de distinguer deux grandes famillesd’outils :

1) les outils de représentation qui permettent de comprendre la structure d’un signal, de larelier à des paramètres physiques, d’ajouter de l’information à l’a priori que l’on peut avoir,ou de valider cet a priori ;

2) les outils de décision qui permettent d’agir (par exemple sur un processus) d’aprèsl’observation d’un signal représentatif d’une grandeur physique ou de l’état d’un système.

Il est clair que ces deux points de vue sont complémentaires : une meilleure représentationd’un phénomène pouvant, par exemple, servir à mieux choisir les descripteurs sur lesquels sebasera une décision.

Plutôt que de présenter une classification exhaustive de ces méthodes (se reporter à [11],[12]), on choisira ici de rappeler les principales structures. On présente tout d'abord les outils dereprésentation temporelle et fréquentielle, et, par la suite, on s'appuyera sur les méthodes d'analysespectrale.

3.1.1. Les structures temporelles et fréquentielles

Comme affirmé dans le chapitre précédent, un signal peut être vu comme une fonction dutemps. La représentation graphique de cette fonction donne toute l'information nécessaire pourl'analyse et l'exploitation de celle-ci. Cette représentation graphique est similaire à lareprésentation temporelle du signal : toute l'information portée par le signal pourrait être récupéréegrâce à une représentation temporelles. Par exemple, un signal numérique MDA-NRZ (modulationnumérique d'amplitude - non-retour à zéro) a la représentation temporelle suivante :

Figure 3.1. Représentation temporelle d'un signal

Néanmoins, il y a un grande nombre de raisons (le bruit existant dans les canaux, larécupération du signal dont on est intéressé dans le mélange des signaux environnementaux, etc)pour lesquelles ces structures ne sont utilisées que dans la phase finale d'un processus de traitement

Temps

Am

plitu

de

-U

U Message :10110001

Page 33: carte - representations temps - frequences ENSIETA

3. Généralités sur les signaux non-stationnaires

ENSIETA, Janvier 2002Centre de Recherche "Extraction et Exploitation de l'Information en Environnements Incertains"

28

du signal, notamment dans celle de l'exploitation de l'information portée par le signal de base. Parconséquent, la représentation temporelle n'est utilisée qu’en la combinant avec les structuresfréquentielles, basées sur la transformée de Fourier (expression 2.3.). Malheureusement, si latransformée de Fourier continue (TFC) n'a pas en soi d'inconvénient particulier, les versions quidoivent être utilisées dans la réalité conduisent parfois à de grandes difficultés (surtout quand il s'agitd'un système numérique de traitement, ce qu'il en est de plus en plus le cas). Deux contraintesempêchent l'utilisation de la TFC classique [3]: l'échantillonnage du signal et la limitation de sadurée. La solution consiste en l'utilisation des approches discrètes et, par la suite, on s'appuiera sur lesméthodes d'analyse spectrale qui représentent l’une des techniques les plus courantes de traitementdes signaux.

3.1.2. Eléments d'analyse spectrale [4]

L’analyse spectrale expérimentale est un outil d’investigation irremplaçable dans denombreux domaines. Les instruments de mesure autonomes effectuant cette opération sont appelésanalyseurs de spectres. Les techniques usuelles d’analyse spectrale se rattachent à deux classesprincipales :

• les techniques directes (filtrage sélectif, méthode du périodogramme);• les méthodes indirectes (méthodes du corrélogramme, méthodes paramétriques, ...).L’analyse spectrale expérimentale diffère du modèle théorique pour la raison principale que

l’observation du signal n’est faite que pendant une durée limitée (nombre fini d’échantillons dans lecas numérique). Ceci nous contraint alors à définir la notion d’estimateur. En effet cette densité,définie par transformation de Fourier de la fonction d’autocorrélation devra en pratique être calculéeà partir d’observations à durée limitée.

Ø Principes de base, propriétés des estimateurs

Soit a un paramètre caractérisant un processus stochastique et â une estimation fondée sur laconnaissance de N observations x(i).

$a F x x N= ( ( )... ( - ))0 1 (3.1)

On définit alors :- le biais d’un estimateur par la quantité

B a E a = - ( )$ (3.2)- la variance par la quantité

[ ] var $ $ ( $)[ ] = a E a E a− 2(3.3)

Une faible variance indique une faible dispersion des estimations autour de E(â). Unestimateur converge lorsque le biais et la variance tendent vers zéro si le nombre d’observations Ntend vers l’infini (caractéristiques asymptotiques de l’estimateur). Par exemple, la fonctiond’autocorrélation admet classiquement deux estimées :

a) $ ( )Γ0 k = 1

N k− x i x i kN N

i

N k

( ) ( )+=

− −

∑0

1

, k N< − 1 (3.4)

Il est évident que cet estimateur est sans biais et on montre de plus qu’il est asymptotiquementà variance nulle.

b) $ ( )Γ1 k = 1

0

1

Nx i x i k

i

N k

N N=

− −

∑ +( ) ( ) , k N< − 1 (3.5)

soit : $ ( )Γ1 kN k

N=

− $ ( )Γ0 k (3.6)

Page 34: carte - representations temps - frequences ENSIETA

3. Généralités sur les signaux non-stationnaires

ENSIETA, Janvier 2002Centre de Recherche "Extraction et Exploitation de l'Information en Environnements Incertains"

29

d’où : E ( $ ( )) ( )Γ Γ1 1kkN

k= −

(3.7)

Cet estimateur présente donc un biais, qui décroît lorsque N →∞ .Lorsque k N<< les estimateurs sont équivalents, par contre lorsque k se rapproche de N le

premier estimateur voit sa variance croître considérablement.Le second estimateur présente donc moins de risque, ce qui peut paraître paradoxal.

Ø Estimation de la densité spectrale de puissance (DSP)

a) Le périodogramme

Choisissons pour estimateur de la D.S.P. la transformée de Fourier de Γ∧

1( ) :k soit

$ ( ) $ ( )( )

γ πv k ek N

Njkv= ⋅

= −

−−∑Γ1

1

12 (3.8)

On démontre alors que :

$ ( ) ( )γ vN

X vN=1 2 avec X v x k eN N

k

Njkv( ) ( )=

=

−−∑

0

12π (3.9)

Cet estimateur (simple, encore appelé périodogramme) peut être calculé directement enélevant au carré la T.F. de la séquence observée que l’on peut calculer par des algorithmes de T.F.R.,ce qui montre tout l’intérêt de cette approche.

En réalité cet estimateur est bien décevant car biaisé et la variance de l’erreur spectrale nedécroît pas avec la durée d’observation N. Quelle que soit cette durée, la variance de cet estimateurreste proportionnelle au carré du spectre cherché.

b) L’estimateur moyenné

En divisant l’horizon N en K segments de longueur M, on définit les séquences élémentairesx kM

i( ) ( ) par :

x k x iM kMi

M( ) ( ) ( )= + ,0≤ ≤ −i K 1 , 0 ≤ ≤ −k M 1 (3.10)

On peut alors construire pour chacune des séquences élémentaires une estimation de la D.S.P.,soit :

$ ( ) ( )( ) ( )γ iMiv

MX v=

1 2 où X v x k eM

iMi jkv( ) ( )( ) ( )= ∑ −2π (3.11)

et on effectue la moyenne :

γ γ∧

=

= ∑mi

i

K

vK

v( ) $ ( )( )1

0

1

(3.12)

En supposant que les échantillons successifs x Mi( ) (k) ne sont pas corrélés (c’est à dire que M

est supérieur à la mémoire du processus générateur) on constate toujours la présence d’un biais,correspondant à l’application d’une fenêtre triangulaire fictive sur la fonction d’autocorrélation,tandis que la variance est divisée par K. Toutefois, du fait de la fenêtre triangulaire, nous avons

dégradé la résolution fréquentielle d’un rapport KNM

= , ce qui montre, pour N fixé, le compromis

résolution-variance qu’il s’agit d’affronter.

Page 35: carte - representations temps - frequences ENSIETA

3. Généralités sur les signaux non-stationnaires

ENSIETA, Janvier 2002Centre de Recherche "Extraction et Exploitation de l'Information en Environnements Incertains"

30

c) L’estimateur modifié (estimateur de Welch)

On reprend la procédure précédente, en appliquant cette fois une fenêtre de pondération (autreque rectangulaire) sur les données de longueur M. Les nouvelles sections s’écrivent :

x k w k x kMi

M wi( ) ( )( ). ( ) ( )= (3.13)

et l’on calcule : γ υ∧

==

∑wwi

i

K

K

X v

M( )

( )( )1

0

1 2

(3.14)

On comprend l’intérêt d’un tel estimateur, car s’il ne réduit ni la variance, ni le biais, parrapport à l’estimateur moyenné et même s’il détériore la résolution il peut réduire, selon la fenêtrechoisie, les effets de lobes secondaires générés par une D.S.P. présentant une dynamique importante.

La formule d’estimation γ∧

w v( ) doit être corrigée, car, par l’application de la fenêtre w kM ( ) ,

nous avons modifié la puissance moyenne de la tranche x kMi( )( ) . Il convient d’appliquer un terme

correcteur égal à 1 2

0

1

Mw kM

k

M

=

∑ ( ). D’où l’estimateur modifié, tenant compte du facteur de puissance :

γ∧

w v( ) =M

w kMk

M2

0

1

( )=

∑1K

X v

M

wi( )( )

∑2

(3.15)

On notera que ce filtrage introduit une perte en résolution fréquentielle d’autant plusimportante que K est grand, ce qui nous ramène au compromis variance-résolution cité précédemment

Une variante de la procédure de Welch consiste à faire se recouvrir les tranches successives.Les tranches ne sont évidemment plus non corrélées (même lorsqu’il s’agit d’un bruit blanc) et legain espéré en variance n’est plus de 2K pour un recouvrement de 50%.

d) Le corrélogramme

Cette méthode consiste à estimer l’autocorrélation sur un horizon − +M M, puis à enprendre la transformée de Fourier. Soit :

[ ] [ ] [ ]Γ∧

= +=

− −

∑M

i

N k

kN

x i x i k1

0

1

, 0 ≤ ≤k M (3.16)

[ ]$ ( ) $γ πM M

M

Mjkvv k e=

−∑Γ 2 (3.17)

ou bien, par TFD : [ ] [ ]$ $γπ

M MM

M jknMn k e=

−+∑Γ

22 1 (3.18)

La différence par rapport au périodogramme provient du fait que l’on choisit M<<N(typiquement M<N/10).

Page 36: carte - representations temps - frequences ENSIETA

3. Généralités sur les signaux non-stationnaires

ENSIETA, Janvier 2002Centre de Recherche "Extraction et Exploitation de l'Information en Environnements Incertains"

31

Cela revient à dire que l’on ne conserve, dans la séquence [ ]Γ∧

M k , que les points qui sont

raisonnablement bien moyennés. On détériore ainsi la résolution spectrale de l’estimateur γ∧

M v( )

(effet de la fenêtre implicite d’horizon [ ]− +M M, sur Γ∧

M ), tandis que l’on améliore la variance parrapport au périodogramme.

L’application d’une fenêtre supplémentaire adéquate sur [ ]Γ∧

M k est souhaitable tant pouréviter les effets des lobes latéraux de la fenêtre implicite évoquée précédemment que pour garantir le

caractère positif de γ∧

M v( ).

Ø L’analyse spectrale paramétrique

Le but de ces méthodes développées est de s’affranchir du calcul de la transformée de Fourierde la fonction d’autocorrélation qui par définition estime la densité spectrale de puissance d’un signal.Cette contrainte impose une forte limite en résolution fréquentielle qui devient gênante lorsqu’il estnécessaire d’analyser des signaux de courte durée.

a) Le modèle ARMA pour les processus aléatoires

Soit un système linéaire, invariant, stable, décrit par une transmittance rationnelle en z:

A zz z

z zm

m

nn( )

...

...=

+ + +

+ +

− −

− −

α α α

β β0 1

1

111

(3.19)

et dont l’entrée est constituée par une séquence de nombre non corrélés (c’est à dire un bruit blancdiscret) de variance σ2.

On sait alors que : γ σ( ) ( ) ( ) ( )x z A z A z= −1 2 (3.20)

et : γ γα α α

β βσπ

π π

π π( )( ) ( )...

...x x z e

jvm

jmv

jnvn

jmvv ze e

e ejv= =

+ +

+ +=

− −

− −20 1

2 2

12 2

22

1(3.21)

On peut comprendre ce filtrage comme un modèle générateur de signaux aléatoires dont ladensité spectrale en z est rationnelle. Ce processus peut être décrit par l’équation aux différences :

x k x k x k n b k b k mn m( ) ( ).... ( ) ( )... ( )= − − − − + + −β β α α1 01 (3.22)

qui admet deux simplifications lorsque :

• β α αi mi x k b k b k m= ∀ = + −0 0alors ( ) ( )... ( ) (3.23)

Ce modèle, dit tous zéros, est noté M.A. (Moving Average) et correspond à un filtrage (filtreRIF ou transverse) d’un bruit blanc.

• α β β αi ni x k x k x k n b k= ∀ > = − − − − +0 0 11 0alors ( ) ( )... ( ) ( ) (3.24)

b(k)A(z)

x(k)

Page 37: carte - representations temps - frequences ENSIETA

3. Généralités sur les signaux non-stationnaires

ENSIETA, Janvier 2002Centre de Recherche "Extraction et Exploitation de l'Information en Environnements Incertains"

32

Ce modèle, dit tous pôles, est noté A.R. (Auto Régressif). L’équation générale décrit alors unprocessus appelé ARMA. Toutefois, le modèle AR est le plus important d’un point de vue pratiquecar il indique comment un signal à l’instant k dépend de manière linéaire d’un passé fini, plus unterme entièrement nouveau, non corrélé avec le passé et souvent appelé innovation.

L’équation de Yule Walker s’écrit :

Γ Γx i x

n

p p i( ) ( )= − −∑β1

, pour p>0 (3.25)

On vérifie aisément que pour p = 0 on obtient :

Γ Γx i x

n

i( ) ( )01

= − −∑β + σ2 (3.26)

L’équation indique qu’à partir d’un rang supérieur à l’ordre du numérateur du modèle ARMA,il existe une récurrence sur les termes de la séquence d’autocorrélation. Cette récurrence est définiepar les seuls coefficients du dénominateur.

b) L’estimation des paramètres du modèle ARUn tel signal est décrit par l’équation :

x k i x k i b ki

n

( ) ( ) ( )= − − +=

∑ β1

(3.27)

où b(k) est un bruit blanc de variance σ2 .Sous forme matricielle, l’équation de Yule Walker s’écrit :

Γ Γ ΓΓ Γ Γ

Γ Γ

( ) ( ) ( )( ) ( ) ( ( ))

( ) ( )

0 11 0 1

0

1

0

0

1

2− −− −

=

L…

M M O M… …

M M

nn

n n

β

β

σ

(3.28)

soit : [ ]Γ .1

0

σ

=

(3.29)

La matrice [ ]Γ est symétrique et a une structure de Toeplitz (voir la section 2.4.).

En supposant les n+1 valeurs de Γ intervenant dans cette matrice connues à l’avance, alors la

détermination les modèles inconnus du modèle AR, (c’est à dire les β σi et 2 ) ne pose pas dedifficultés.

Une solution récursive particulièrement efficace donnée à ce problème est connue sous le nomd’algorithme de Levinson-Durbin. Outre son efficacité, cet algorithme permet de déterminer l’ordreadéquat du modèle AR, ce qui est bien utile lorsque celui-ci n’est pas connu a priori.

Il convient de remarquer que pour identifier un modèle AR d’ordre 10 il est nécessaire etsuffisant de connaître les 11 valeurs successives de l’autocorrélation soit Γ Γ Γx x x( ), ( ) ( )0 1 10L .Le modèle AR ainsi identifié fournit ensuite une estimation de la DSP dans laquelle le compromisvariance-résolution ne se pose plus... tandis que l’estimation directe de la DSP par transformation deFourier des données Γ Γ Γx x x( ), ( ) ( )0 1 10L conduirait à une bien médiocre résolution.

En réalité on ne dispose pas des Γx i( ) a priori et nous devons les estimer par les estimateursdécrits au § 2, ce qui suppose l’acquisition d’un nombre d’observations bien plus grand que l’ordre dumodèle AR.

Page 38: carte - representations temps - frequences ENSIETA

3. Généralités sur les signaux non-stationnaires

ENSIETA, Janvier 2002Centre de Recherche "Extraction et Exploitation de l'Information en Environnements Incertains"

33

L’algorithme de Levinson met en évidence le fait que l’erreur de prédiction est une fonctionnon croissante de l’ordre qui ne possède pas à proprement parler de minimum absolu permettant desélectionner un ordre optimal qui serait associé à la plus petite erreur de tous les modèles possibles.

Un choix courant est le critère dit FPE (Final Prediction Error) d’Akaike qui s’écrit :

FPE pN pN p

p pp

N p( ) ( ) ( )=

+−

= +−

σ σ2 2 2(3.30)

AIC p NLn p p( ) ( )= +σ2 2 (3.31)

On vérifie d’ailleurs que les deux critères tendent à être équivalents pour de grandes taillesd’échantillons puisque l’on obtient alors :

( )AIC p N Ln FPE p( ) ( )= ⋅ (3.32)

En fait, si le processus analysé n’est pas strictement AR, il est formellement représentable parun modèle AR d’ordre infini et le minimum de la puissance d’erreur est rejeté à l’infini. Il en est demême si l’identification est conduite à partir d’estimées des valeurs de la corrélation, ce qui estpratiquement toujours le cas. Dans ce dernier cas, lorsqu’on travaille sur une séquence d’échantillonsde taille finie N, on est en fait confronté à un compromis biais-variance. En effet, plus l’ordreaugmente, plus la puissance d’erreur diminue et plus la fréquence prédite se rapproche de laréalisation observée (diminution du biais). Cependant, augmenter l’ordre du modèle conduit dans lemême temps à utiliser des valeurs de la fonction de corrélation pour des retards de plus en plusgrands, et donc de moins en moins bien estimées puisqu’elles le sont sur de moins en moinsd’échantillons (augmentation de la variance).

c) Modélisation moyenne mobile MADans ce cas, la densité spectrale est représentée uniquement par des zéros :

x k b j e k jj

M

( ) ( ) ( )= −=∑

0

(3.33)

où e(k) est un bruit blanc discret de variance σ2 , de moyenne nulle.γ σx z B z B z( ) ( ) ( )= −2 1 (3.34)

où : B z b j z j

j

M

( ) ( )= −

=∑

0

(3.35)

Les coefficients b(i) sont reliés aux corrélations par une relation de convolution non linéairedifficile à résoudre. En effet :

Γx k E x i x k i∧

= +( ) ( ) ( ) (3.36)

Γx j

M k

kb j b k j k M

k M

=

=+ =

>

∑( )( ) ( ) , , ,

,0

0

0

L(3.37)

Pour calculer les b(j), il suffit alors de connaître une estimée de Γx k( ) pour k M= 0, ,L .Néanmoins, dans le cas, où l’on ne s’intéresse qu’au spectre, il est inutile de faire le calcul,

puisque la transformation de Fourier de la fonction d’autocorrélation nous donne directement cespectre.

Par contre, si l’on cherche la valeur des coefficients b(i), le problème est plus complexe.

Page 39: carte - representations temps - frequences ENSIETA

3. Généralités sur les signaux non-stationnaires

ENSIETA, Janvier 2002Centre de Recherche "Extraction et Exploitation de l'Information en Environnements Incertains"

34

Une solution consiste à rechercher une modélisation autorégressive d’ordre très élevé etensuite à calculer le filtre inverse (donc un modèle MA) qui minimise l’erreur quadratique due àl’ordre fini du filtre.

Un modèle MA est en fait un modèle AR d’ordre infini. En effet un zéro de la densitéspectrale peut toujours être approché par une série de pôles. Ceci provient de l’identité.

a m b i a m i mk

( ) ( ) ( ) ( )+ − ==

∑ δ1

(3.38)

Comme le nombre de coefficients b(i) est en réalité fini, il s’ensuit une erreur dans lamodélisation. On a donc :

a m b i a m i e mp pi

M

( ) ( ) ( ) ( )+ − ==∑

1

(3.39)

Il s’agit alors de minimiser E e m2( ) . Le problème revient formellement à résoudre les

équations de Yule-Walker en remplaçant les x(i) par les a(i).Pour calculer les valeurs b(i), on applique donc deux fois l’algorithme de Levinson, d’abord

sur les données x(i), ensuite sur les coefficients a(i) obtenus par la première modélisation.

Ø Autres méthodes d’analyse spectrale

Il existe de nombreuses autres méthodes d’analyse spectrale dites paramétriques qui de parleurs hyothèses ne reposent pas sur la modélisation du signal.

Certaines méthodes font une hypothèse de type raies spectrales plus bruit pour l’observation(Pisarenko, goniomètre ou MUSIC, décomposition en valeurs propres ou singulières, ...). La méthodede Prony est une extension de cette idée à un cas non-stationnaire : des sinusoïdes amorties dans unbruit additif. A la frontière entre paramétrique et non paramétrique se trouve la méthode de Capon,parfois faussement appelée méthode du maximum de vraisemblance. Fondée sur un filtrage sélectifen fréquence du signal, elle s’interprète comme la succession d’une transformation de Fourier, d’unequadration et d’un moyennage. Son pouvoir de résolution dépend du rapport signal sur bruit :similaire à celui des méthodes de Fourier lorsqu’il est faible, on retrouve les performances dugoniomètre à fort rapport signal sur bruit.

La qualité d’une analyse spectrale ne peut être mesurée que pour une application spécifique.Une conséquence fondamentale est qu’il n’y a pas d’estimateur spectral optimal. L’optimalité dépendde l’application particulière considérée ainsi que de l’information a priori donnée sur la forme duspectre.

3.2. Le concept de signal non-stationnaire

3.2.1. Définition de la non-stationnarité

Un signal non-stationnaire se définit par opposition à un signal stationnaire pour lequel toutesses propriétés statistiques sont invariantes au cours de temps. Dans le contexte déterministe, onappelle signal non-stationnaire un signal dont le contenu fréquentiel change dans le temps. Il suffitqu'une seule propriété statistique ou un seul composant fréquentiel soit variable dans le temps pourque l'on puisse parler de signal non-stationnaire. Si, par exemple, dans un signal il y a une dérived'une fréquence au cours du temps ou un saut de moyenne temporelle, alors il s'agit d'un signal non-stationnaire.

Plus rigoureusement, un signal déterministe est stationnaire s'il peut être écrit comme unesomme discrète de sinusoïdes :

Page 40: carte - representations temps - frequences ENSIETA

3. Généralités sur les signaux non-stationnaires

ENSIETA, Janvier 2002Centre de Recherche "Extraction et Exploitation de l'Information en Environnements Incertains"

35

( ) ( )

( ) ( )[ ] complexe signal unpour

réel signal unpour

kkNk

k

kkNk

k

tjAtx

tAtx

φπυ

φπυ

+=

+=

2exp

2cos

(3.40)

Pour un signal mono-composante, une condition qu'il soit stationnaire est que sa fréquenceinstantanée (notion qui sera introduite par la suite) et l'amplitude instantanée soient invariante entemps.

Dans le cas aléatoire, un signal aléatoire peut être défini par la méthode présentée dans lasection 2.4.2.

La classe des signaux non stationnaires comprend une grande variété de signaux. Leparagraphe suivant vous en présente quelques exemples.

§ Les signaux transitoires, i.e., lorsqu'on est pas encore parvenu à un régime permanent (par ex.dans une voiture, phase d'accélération avant d'atteindre une vitesse stable),

§ Les signaux de rupture, i.e., les modifications brutales et intempestives d'amplitude (par ex. :dans une voiture, panne de moteur, coup de frein brutal).

Par ailleurs, toutes les modulations d'un signal représentent des signaux non-stationnaires, car,dans ce cas, un des paramètres est variable au cours du temps. La figure suivante illustre l'exempled'une modulation discrète en fréquence (MDF) et d'un "bump" gaussien.

Figure 3.2. Signaux non-stationnaires : MDF et une gaussienne

D’autre exemples sont disponibles dans [5].

3.2.2. Mesures de non-stationnarité

Ayant un signal non-stationnaire, au moins deux questions intéressantes se posent : quelle estla nature des non-stationnarités contenues dans ce signal ? Et quel est le moyen de quantifier ces non-stationnarités? Une mesure de non-stationnarité devrait permettre de répondre à ces questions,d'autant plus qu'une mesure correcte permettra une classification des différents types de non-stationnarités.

Les mesures existantes nous renseignent, d'une manière assez "vague", sur quelques types denon-stationnarités. Elles ne donnent pas une bonne quantification des différentes non-stationnarités.

A. Degré de non-stationnarité

Plaçons nous dans le cadre du filtrage adaptatif, dans un contexte non-stationnaire, etconsidérons le modèle linéaire suivant [4] :

( ) ( ) ( ) ( )( ) ( ) ( )

+−=+=

twtttvttty T

1θθθϕ

(3.41)

Page 41: carte - representations temps - frequences ENSIETA

3. Généralités sur les signaux non-stationnaires

ENSIETA, Janvier 2002Centre de Recherche "Extraction et Exploitation de l'Information en Environnements Incertains"

36

avec R1(t)=cov(v(t)) et R2(t)=cov(w(t)) et où y(t) est le signal étudié, v(t) un bruit blanc, w(t) un bruitblanc gaussien, θ(t) est le vecteur des paramètres et ϕ(t) est le vecteur d'observation.

Si on suppose que le vrai vecteur des paramètres est θ* , l'erreur à l'instant t est donnée par :

( ) ( ) ( ) ( ) ( )( ) ( ) ( )( ) ( )( ) ( )

( ) ( ) ( )tvtbtetvtt

tttvttytyteT

TT

+=+−=

=−+=−=

θθϕ

θϕθϕ*

(3.42)

donc le bruit de sortie e(t)à l'instant t est égal à la somme du bruit de variation du modèle b(t) et decelui d'observation v(t). Ceci nous mène à définir un degré de non-stationnarité qui est fonction dutemps : la vitesse de non-stationnarité s'apprécie en comparant à 1 le degré de non-stationnarité :

( ) ( )( )tPtP

tdv

b= (3.43)

Les variations lentes sont celles pour lesquelles, en permanence, d(t)<<1.(Pb(t) est lapuissance de p et Pv(t) puissance de v).

La relation (3.43) met en évidence la relativité des non-stationnarités, c'est-à-dire que ces non-stationnarités ne sont pas lentes ou rapides dans l'absolu, mais seulement par rapport au bruit v(t) quientâche la mesure de la sortie du modèle.

Pour exemplifier ce principe qui vient d’être présenté, on suppose un signal généré à partird'un modèle d'ordre 4, simulant deux résonances. Celles-ci subissent des changements brusques aucours de temps.

Figure 3.3. Signal non-stationnaire généré à partir d'un modèle d'ordre 4

Sur la figure suivante, on présente le degré de non-stationnarité (3.43), calculé en utilisant unfiltre de Kalman, ainsi que le bruit de variation b(t).

Figure 3.4. Le degré de non-stationnarité et le bruit de variation

Même si le bruit de variation b(t) est partout faible, sauf aux environs du premier changement,nous remarquons que le degré de non-stationnarité (figure 3.4.a) reste inférieur à 1, malgré les deuxchangements brusques qui interviennent aux échantillons numéros 300 et 600. Ceci explique lescapacités modestes que possède ce test de non-stationnarité.

a. Le degré de non-stationnarité b. Le bruit de variation b(t)

Page 42: carte - representations temps - frequences ENSIETA

3. Généralités sur les signaux non-stationnaires

ENSIETA, Janvier 2002Centre de Recherche "Extraction et Exploitation de l'Information en Environnements Incertains"

37

B. Test de corrélation

Le principe de cette mesure que nous introduisons est basé sur la comparaison, à l'instantcourant, du vecteur de paramètre du modèle AR à l'instant présent avec celui de l'instant passé. Cettecomparaison est faite à l'aide de la mesure du coefficient d'intercorrélation entre le vecteur deparamètres du modèle AR à deux instants successifs. Pour mieux quantifier le moindre changementdes coefficients du modèle AR, nous nous intéressons au calcul du déterminant de la matriced'intercorrélation. Cette matrice est formée des coefficients d'intercorrélation entre le vecteur deparamètres du modèle AR à deux instants successifs.

Pour comparer deux vecteurs de n données réelles, u(t) et v(t), on considère le scalaire a quiminimise la fonction coût suivante :

( ) ( ) ( )[ ]∑ −==

t

nnaunvtV

1

2 (3.44)

En annulant la dérivée de V(t) par rapport à a, on obtient :

( ) ( )

( )[ ]∑

∑=

=

=t

n

t

n

nu

nvnua

1

2

1 (3.45)

Le minimum Vmin(t) de la fonction de coût s'écrit alors :

( ) ( )[ ] ( )[ ]∑−==

t

nuv nvtctV

1

22min 1 (3.46)

avec ( )( ) ( )

( )[ ] ( )[ ]∑∑

∑=

==

=t

n

t

n

t

nuv

nvnu

nvnutc

1

2

1

2

1 (3.47). La quantité cuv(t) est appelée le coefficient

d'intercorrélation et il mesure le degré de similitude entre les deux vecteurs de données.Il est clair, en raison des relations (3.45) et (3.47), que le coefficient d'intercorrélation est tel

que ( ) 1≤tcuv . Il est dit normalisé.Lors de la recherche d'un modèle adaptatif en contexte non-stationnaire, le modèle change au

cours de temps. Pour le cas d'un modèle AR, et pour se forger une idée sur le degré de variation dumodèle entre deux instants successifs, nous calculons le coefficient d'intercorrélation normalisé, àl'instant t entre les vecteurs de paramètres du modèle AR aux instants t et t-1. Si le modèle resteinchangé entre ces deux instants, la valeur absolue de l'intercorrélation des deux vecteurs deparamètres du modèle vaut 1; dans le cas contraire, cette valeur absolue est inférieure à 1. Ensuite,nous formons la matrice contenant les quatre coefficients cuu(t), cuv(t), cvu(t) et cvv(t) sous la formesuivante :

( ) ( ) ( )( ) ( )

=

tctctctc

tCvvvu

uvuu(3.48)

Cette matrice contient des informations d'autocorrélation de chacun des deux vecteurs ainsique l'intercorrélation entre ces vecteurs à l'instant courant t. Si rien ne change au cours de temps, ledéterminant de cette matrice est nul puisque les deux vecteurs u(t) et v(t) sont identiques. Le moindrechangement entre u(t) et v(t) se traduit par une intercorrélation différente de 1, en valeur absolue, et,donc, ce changement se répercute sur la valeur de ce déterminant.

Pour justifier cette méthode, nous sommes partis du fait que pour un modèle AR, le vecteurdes paramètres représente les coefficients du filtre dont la réponse impulsionnelle est caractérisée parce vecteur des paramètres; et que deux vecteurs identiques donneront les mêmes réponsesimpulsionnelles.

Page 43: carte - representations temps - frequences ENSIETA

3. Généralités sur les signaux non-stationnaires

ENSIETA, Janvier 2002Centre de Recherche "Extraction et Exploitation de l'Information en Environnements Incertains"

38

Sur la figure suivante on présente la valeur, au cours de temps, du déterminant de la matrice Cpour le signal donnée sur la figure 3.3. Nous pouvons bien distinguer les deux pics dans le voisinagedes échantillons 300 et 600.

Figure 3.5. Valeur de det(C) pour chaque échantillon

Comparée au test du degré de non-stationnarité, pour le même signal et en utilisant le mêmealgorithme adaptatif et les mêmes conditions d'expérimentation, cette méthode se révèle plus apte àdétecter et à localiser ce type de non-stationnarités.

C. Fréquence instantanée

La notion de stationnarité est bien définie pour les processus aléatoires. Dans le cas dessignaux certains, une notion apparentée existe, qui est en fait liée à une idée de régime permanent etde stabilité d'une fréquence au cous du temps. Sa définition nécessite de recourir au concept de signalanalytique qui s'appuie lui-même sur une transformation spécifique : la transformation de Hilbert. Pardéfinition, celle-ci est donnée par la formule :

( ) ( )∫

−=

∞−du

utux

vptxHπ1

(3.49)

où l'intégrale doit être prise au sens de la valeur principale de Cauchy.

La réponse impulsionnelle d'un filtre de Hilbert est la fonction tπ

1, d'où on déduit que son

gain complexe vaut -j*sgn(v). Le résultat en est qu'un signal monochromatique cos(2πν0t) voit son

spectre ( ) ( )[ ]0021

υυδυυδ ++− transformé en ( ) ( )[ ]0021

υυδυυδ +−−j

qui est le spectre de

sin(2πν0t). Le filtre de Hilbert agit ainsi comme un déphaseur pur de 2π

(filtre en quadrature).

Ceci permet de définir de manière canonique des notions comme celles d'amplitude ou defréquence instantanée(s) d'un signal modulé. Considérons en effet le signal monochromatique

( ) ( )tatx 02cos πυ= avec la représentation complexe ( ) tjx aetz 02πυ= dans laquelle la composante

imaginaire est en quadrature avec la partie réelle :

( ) ( ) ( ) ( ) tzRéHtaHtatz xx === 00 2cos2sinIm πυπυ (3.50)

L'intérêt de cette représentation est de fournir des indications relatives à l'amplitude et à lavitesse de rotation (pulsation) du vecteur tournant de manière unique grâce respectivement au moduleet à la phase :

( )

( ) tzdtd

tza

x

x

⋅=

=

πυ

21

;

0

(3.51)

Page 44: carte - representations temps - frequences ENSIETA

3. Généralités sur les signaux non-stationnaires

ENSIETA, Janvier 2002Centre de Recherche "Extraction et Exploitation de l'Information en Environnements Incertains"

39

Intuitivement, lorsqu'un signal est modulé, c'est-à-dire lorsque son amplitude et sa fréquencesont réputées varier au cours du temps, on pourrait être tenté de généraliser le cas monochromatiqueen remplaçant a*cos(2πν0t) par ( ) ( ) ( )ttatx ϕcos= . Ceci ne constitue cependant pas unereprésentation admissible d'un signal quelconque. Pour s'en convaincre, il suffit d'introduire une

fonction arbitraire b(t) telle que 0<b(t)<1; en a alors tout aussi bien ( ) ( )( )

( ) ( )ttbtbta

tx ϕcos= que l'on

peut écrire :

( ) ( ) ( ) ( ) ( )( )

( ) ( ) ( )( )( )

=

==

ttbttbta

tattatx

ϕϕϕ

cosarccos avec cos

'

''' (3.52)

Une solution à ce problème consiste à généraliser, non pas directement la définition d'uneonde monochromatique, mais la façon dont on peut déduire ses caractéristiques d'une représentationcomplexe convenable. Ainsi, si on part du modèle du vecteur tournant en le rendant dépendant dutemps et si on impose que ce modèle complexe satisfasse à des relations de quadrature entre partiesréelle et imaginaire, la solution consiste à « complexer » un signal réel x(t) en lui adjoignant unepartie imaginaire égale à son signal en quadrature :

( ) ( ) ( ) txjHtxtz x += (3.53)

Le signal résultant est dit analytique . Ainsi défini, il admet une écriture unique en termes demodule et de phase et il devient possible de définir les notions d'amplitude et de fréquenceinstantanées par :

( )

( ) tzdtd

tza

xt

x

⋅=

=

πυ

21

;(3.54)

D'un point de vue spectral, le signal analytique est relié au signal réel dont il est issu par :

( ) ( ) ( )υυυ XuZ x 2= (3.55)

Ceci revient à supprimer les fréquences négatives du spectre original, ce qui diminue en rienl'information puisque, pour un signal x(t) ∈ R, on a la relation ( ) ( )υυ *XX =− .

Si, par structure, la partie réelle d'un signal analytique ( ) ( ) ( )tjetatz ϕ= s'écrit naturellement( ) ( ) ( )( )ttatzRé ϕcos= il importe d'avoir présent à l'esprit que le signal analytique associé à un signal

modulé selon ( ) ( )( )tta ϕcos n'a apriori aucune raison d'avoir une écriture exponentielle dans laquelleles mêmes a(t) et ϕ(t) seraient respectivement les termes de module et de phase. D'un point de vuephysique, on se rapprochera cependant d'autant plus de cette situation que les effets de modulationseront faibles. En particulier, si a(t) est de type passe-bas, alors (selon le théorème de Bedrosian, [4])

( ) ( ) ( ) ( ) tHtattaH ϕϕ coscos = (3.56)

Ces seules considérations spectrales ne garantissent cependant pas l'écriture exponentielle dusignal analytique puisqu'il faudrait en outre que :

( ) ( )ttH ϕϕ sincos = (3.57)

ce qui n'est pas vérifié dans le cas général mais l'est approximativement dans le cas quasi-monochromatique pour lequel la largeur de bande est très faible vis-à-vis de la fréquence centrale despectre.

Page 45: carte - representations temps - frequences ENSIETA

3. Généralités sur les signaux non-stationnaires

ENSIETA, Janvier 2002Centre de Recherche "Extraction et Exploitation de l'Information en Environnements Incertains"

40

3.3. Modèles et approches non-stationnaires

L'absence de stationnarité ne suffit pas pour préciser le type de signaux non-stationnaires surlesquels on travaille, d'où la nécessité de déterminer des classes ou des types de signaux non-stationnaires. Ces classes peuvent être obtenues suivant le point vue selon lequel ces signaux non-stationnaires sont considérés.

Une première façon considère les signaux d'un point de vue de la rapidité de leur non-stationnarité. Si, une situation non-stationnaire correspond à la concaténation de quasi-stationnaritéou de non-stationnarités lentes, une approche adaptative est alors applicable à ce genre des signaux.Lorsque les hypothèses de quasi-stationnarité ne sont plus justifiées, l'approche évolutive est alorsvalable et suppose que les non-stationnarités sont rapides. Mais certaine non-stationnarités sont trèsparticulières pour être traitées par l'une ou l'autre des approches, ce sont les changements brusques ouabrupts.

Une autre manière consiste à considérer les non-stationnarités du point de vue de leur naturedéterministe ou aléatoire. Ce qui mène à la notion de non-stationnarités permanentes déterministes,non-stationnarités permanentes aléatoires ou des ruptures. Les deux premiers cas concernent les non-stationnarités lentes, le dernier étant le cas des non stationnarité rapide. Néanmoins, il est difficile deconnaître la limite entre non-stationnarités lente et rapide.

La modélisation consiste en la donnée d'un structure de modèles susceptible de décrire lecomportement dynamique entrée/sortie auxquel on s'intéresse, ainsi que la spécification desparamètres à choisir dans la structure du modèle pour définir complètement le système. En général,ces paramètres sont rassemblés dans un vecteur dont la connaissance suffit alors à caractériser lastructure.

Il existe plusieurs approches de modélisation et d'analyse des signaux non-stationnaires.Celles-ci diffèrent par leur hypothèses de départ et/ou la structure du modèle choisi. Les hypothèsesde départ peuvent être temporelles, ce qui conduit aux algorithmes adaptatifs; fréquentielles, ce quimène à des algorithmes d'analyse spectrale, ou bien, des hypothèses temps-fréquence ou temps-échelle et ce qui donne les algorithmes des représentations temps-fréquence ou ondelettes.

3.3.1. Approche adaptative

L'idée de base de cette approche est de suivre les évolutions du signal par une récursiontemporelle en ne modifiant que peu les outils pour les situations stationnaires. Cette approche prenden compte les non-stationnarités par l'intermédiaire de l'algorithme adaptatif.

Une modélisation adaptative peut être vue comme un processus à deux niveaux :− Niveau 1 : rendre récursif une méthodes globale;− Niveau 2 : rendre « oublieuse » la méthode ainsi obtenue pour lui permettre de suivre les

évolutions du signal.

Cette méthode présente l'avantage qu'elle ne fait pas d'hypothèse "directe" sur le type de non-stationnarité. Cependant, il n'y a ni paramétrisation de l'évolution temporelle du signal, ni de mesurede performance de l'algorithme et ses capacités à suivre les non-stationnarités.

3.3.2. Approche évolutive

Selon la synthèse de Y. Grenier, la méthode évolutive est similaire à la première, mais enconsidérant que les paramètres du modèle ont des variations déterministes et non plus aléatoires.Dans ce cas, les paramètres du modèle s'expriment linéairement sur une base de fonctions connues àpriori, donnant des modèles que l'on appellera évolutifs. Plusieurs fonctions ont été utilisées pour desapplications dans le domaine de la parole, parmi ces fonctions on peut citer celles de typesinusoïdales, sphéroïdales, les fonctions de Bessel, etc. Le problème qui se pose pour cette méthode

Page 46: carte - representations temps - frequences ENSIETA

3. Généralités sur les signaux non-stationnaires

ENSIETA, Janvier 2002Centre de Recherche "Extraction et Exploitation de l'Information en Environnements Incertains"

41

est le choix de ces fonctions : devant un problème donné, on ne dispose pas de méthodologie qui nouspermette d'opter pour l'une ou l'autre des fonctions.

3.3.3. Stationnarité par morceaux

Cette approche limite les non-stationnarités à des sauts en des instants isolés entre lesquels lemodèle reste invariant; on peut dire qu'il s'agit de modèles stationnaires par morceaux.

L'hypothèse d'un modèle invariant entre deux instants peut être interprétée de deux façonsdifférentes :- La première considère que c'est réellement dans la production du signal que se situent ces sauts, et

le problème est donc d'identifier les instants de leur occurrence, et ensuite d'estimer le modèle surchaque intervalle et de suivre les variations du signal sur ces intervalles. C'est notamment le casen reconnaissance de la parole;

- Pour la seconde, l'hypothèse des sauts n'est vue que comme une astuce d'analyse permettant demodéliser l'évolution du signal. Les instants des sauts sont alors arbitraires, ne dépendent pas dusignal lui-même et peuvent être fixés par l'utilisateur. On teste alors si ces instants de sauts sontjustes.

3.3.4. Modèle à coefficients aléatoires

Cette méthode consiste à considérer les coefficients du modèle comme aléatoires, et donc lemodèle global est constitué par deux niveaux. Le premier est celui du système engendrant le signal,tandis que le second est celui de la dynamique du système de niveau 1.

L'identification simultanée des deux niveaux est très délicate, puisqu'il s'agit en général deproblèmes non-linéaires, d'autant plus qu'au second niveau l'entrée comme la sortie du modèle sontinconnues, et multipliées par les paramètres, eux aussi inconnus, du modèle au niveau 1.

Si on suppose, par exemple, que θ(t) est le vecteur des paramètres, à l'instant t, (niveau 2), onobtient les équations suivantes :

( ) ( ) ( ) ( )( ) ( ) ( ) ( )

+−=+=

twttAttvttty T

1θθθϕ

(3.58)

où ( ) ( ) ( )[ ]ptytytT −−−−= ,,1 …ϕ , y(t) est le signal engendré par le modèle AR d'ordre p, et excitépar le bruit blanc v(t), le modèle θ(t) a pour matrice de transition A(t) et l'innovation est le bruit blancvectoriel w(t).

Les équations (3.58) forment alors une équation d'état pour y(t) et le problème concernel'estimation conjointe de l'état θ(t) et des paramètres A(t) du système. Les travaux faits dans cedomaine supposent que l'un des deux niveaux est connu afin de pouvoir identifier l'autre. Lorsque lesparamètres du second niveau, la matrice A(t) et la covariance de w(t), sont connus, l'identification deθ(t) est un problème d'estimation de l'état d'un système, qui se réalise au moyen du filtre de Kalman(dans une approximation gaussienne sur y(t)).

3.3.5. Représentations temps-fréquence et/ou temps-échelle

Cette approche non-paramétrique (qui fera l'objet des chapitres suivants) consiste à utilisercertaines distributions temps-fréquence capables de donner une représentation conjointe en temps eten fréquence d'un signal non-stationnaire. Elle nous permet, à quelques hypothèses près, de voir larépartition de l'énergie du signal dans le plan temps-fréquence. On obtient ainsi, simultanément, lesinformations concernant les structures temporelles et fréquentielles, quel que soit le degré de non-stationnarité du signal.

Page 47: carte - representations temps - frequences ENSIETA

3. Généralités sur les signaux non-stationnaires

ENSIETA, Janvier 2002Centre de Recherche "Extraction et Exploitation de l'Information en Environnements Incertains"

42

La justification de l'utilisation de cette approche dans le contexte non-stationnaire consisteégalement à l'idée d'éviter les limitations des méthodes classiques de traitement et, notamment, latransformée de Fourier qui représente l'outil de base pour le développement des approche classiques.

3.4. Limitations de la transformée de Fourier

Quoique parfaite du point de vue mathématique, la transformée de Fourier conduit biensouvent à des difficultés d'interprétation physique. En effet,

• Pour obtenir la valeur X(ν) associée à une fréquence donnée, il faut connaître le signal surune durée infinie. Il en est de même pour la transformation inverse qui nécessite la connaissance duspectre complet du signal. Si ces contraintes semblent normales au mathématicien, il n’en est pas demême pour le physicien. En effet, dans la pratique, il est impossible de connaître toute l’histoire d’unsignal.

• Un signal d’énergie finie se trouve ainsi décomposé en une combinaison linéaire d’élémentsconstitutifs d’énergie infinie.

• En fait, la transformation de Fourier ne permet pas de concilier ladescription fréquentielle etla localisation dans le temps. Dans le cas général, on peut se référer à l’inégalité d’Heisenberg-Gaborqui stipule que le produit bande passante support temporel du signal est minoré par l’énergie dusignal au facteur 1/4π près.

∆ ∆tE x..

νπ

≥4

(3.59)

Ce qui signifie dans le cas pratique, qu’il est impossible d’obtenir un signal dont les supportstemporel et fréquentiel soient simultanément arbitrairement petits. En effet, la dimension du supporttemporel est inversement proportionnelle à la dimension du support fréquentiel et inversement.

Dû à l’absence de l’information temporelle, dans les applications pratiques, la transformée deFourier peut induire des confusions, dans le cadre d’un processus d’idéntification des signaux non-stationnaire. Ceci est illustré sur la figures suivante, on presente les spectres d’une modulationlinéaire en fréquence et, respectivement, d’une modulation sinusoidale en fréquence.

Figure 3.6. RTF versus la transformée de Fourier

Spectre de la modulation sinusoidale de fréquenceSpectre de la modulation linéaire de fréquence

Fréquence (normalisée)Fréquence (normalisée)

Fréq

uenc

e (n

orm

alis

ée)

Fréq

uenc

e (n

orm

alis

ée)RTF idéelle RTF idéelle

TempsTemps

Page 48: carte - representations temps - frequences ENSIETA

3. Généralités sur les signaux non-stationnaires

ENSIETA, Janvier 2002Centre de Recherche "Extraction et Exploitation de l'Information en Environnements Incertains"

43

Sur cette figure on observe que les spectre des signaux test ont quasiment la meme formetandis que les images obtenues par une RTF permettent d’indentifier sans ambiguités les types demodulation considerés.

Ainsi, la définition de la transformation de Fourier est à l'origine d'un inconvénientmajeur. En effet, le résultat obtenu par cette transformation est soit une fonction du temps soit unefonction de la fréquence ce qui interdit tout accès à une notion telle que la fréquence instantanée.Si on souhaite étudier un signal non stationnaire et détecter les variations de fréquence en lesassociant à un instant donné, la transformation de Fourier est sans intérêt. Pour répondre à cettenouvelle exigence, il est fait appel à des outils d’analyse temps-fréquence.

Références

[1] J. Ville - "Théorie et applications de la notion de signal analytique, Câbles et transmissions", Vol 2, n°1, pp61-74,1948[2] A. Blanc-Lapierre, B. Picinbono - "Remarques sur la notion de spectre instantané de puissance", Publications Scient.Université Alger, Série B, Vol 1, n°1, pp17-32, 1955[3] A. Papoulis - "Signal analysis", MacGraw Hill, 1986[4] M.H. Hayes - "Statistical digital signal processing and modeling", John Wiley & Sons, Inc, 1996[5] A. Quinquis - "Représentations temps-fréquence", Support de cours, ENSIETA, 1995

Page 49: carte - representations temps - frequences ENSIETA

3. Généralités sur les signaux non-stationnaires

ENSIETA, Janvier 2002Centre de Recherche "Extraction et Exploitation de l'Information en Environnements Incertains"

44

EXERCISES ET PROBLEMES

1. (Structures temporelles et fréquentielles)a. En considérant les expressions de la fréquence moyenne et de la largeur de bande suivantes

( ) ( ) ( )∫ ∫ −=== ωωωωσωωωω ω dSBdS 22222 et

où ( ) 2ωS est la DSP d'un signal s(t). Ecrire l'expression de la fréquence moyenne et de la largeur de

bande en utilisant l'expression temporelle du signal.b. En utilisant ces résultats, trouver la fréquence moyenne et la largeur de bande d'une modulation

sinusoïdale en fréquence, donnée par l'expression

( ) ( )

+++−

= tjtjmtj

tts m 0

2225.0

sin2

exp ωωβα

πα

2. (Analyse spectrale) On dispose de N observations xi indépendantes de même moyenne m et devariance σ2

.

a. On estime m par ∑==

N

iix

Nm

1

i) m est-il biaisé ?ii) Quelle la variance de m ?

b. On estime σ2 par ( )∑ −==

N

ii mx

N 1

22 ˆ1

σ

i) 2σ est-il biaisé ?ii) Peut-on calculer la variance de 2σ ?

3. (Analyse spectrale) Soit x(n) un processus AR(1) défini par les paramètres a1,σ2.a. Montrer que la fonction d'autocorrélation s'écrit :

( ) ( ) mxx a

amr 12

1

2

1−

−=

σ

b. Caractériser ce processus d'un point de vue spectral (passe-bas, passe-bande…?) en fonction dusigne de a1.

4. (Analyse spectrale) Soit x(n) un processus ARMA (1,1) défini par a1,b1,σ2 et soit rxx(m) safonction de corrélation. Montrer que

( )

( )

( )( ) ( )

≥−−

−−

=−

−+

=− 1,

1

1

0,1

21

112

1

11112

21

1121

2

maa

abba

ma

bab

mrm

xxσ

σ

5. (Analyse spectrale) Soit x(n) un processus MA(1) défini par b1,σ2 et soit rxx(m) sa fonction decorrélation. Montrer que la fonction d'autocorrélation de ce processus s'écrit :

( )( )

≥=

=+

=2,0

1,

0,1

12

21

2

mmb

mb

mrxx σ

σ

Page 50: carte - representations temps - frequences ENSIETA

3. Généralités sur les signaux non-stationnaires

ENSIETA, Janvier 2002Centre de Recherche "Extraction et Exploitation de l'Information en Environnements Incertains"

45

6. (Signal analytique) Calculer le signal analytique pour :a. ( ) ( );cos tts ω=

b. ( ) ( ) ( )ttts 21 coscos ωω= .

7. (Fréquence instantanée) On suppose un signal composé de deux sinusoïdes donné par :( ) ( ) ( ) tjtj eAeAtststs 21

2121ωω +=+=

Calculer la fréquence instantanée de ce signal.

8. (Fréquence instantanée) On suppose un signal chirp donné par :

( )

+=

2exp

2

02

1

2

ttets

ωα

a. Tracer le graphique de l'amplitude et de la fréquence instantanée du signal s1(t).b. On suppose un autre signal chirp donné par :

( )

−=

2exp

2

02

2

2

ttets

ωα

i. Tracer, sur le même graphique, les fréquences instantanées de s1(t) et s2(t).ii. Le signal s1+s2 est-il stationnaire ? Justification. Par quelle opération entre le s1(t) et

s2(t) le résultat devient-il stationnaire ?

9. (Inégalité temps-fréquence) Donner la preuve pour le principe d'Heisenberg-Gabor (relation3.59).

(Indication : on utilisera les définitions de la durée et de la bande utile d'un signal

( ) ( )∫=∆∫=∆∞

∞−

∞−dffXffdttxtt 222222 ;

et la quantité ( ) ( )∫ ⋅=∞

∞−dttxtxtI '* , où ( ) ( )tx

dtd

tx =' .

Page 51: carte - representations temps - frequences ENSIETA

4. Représentations temps-fréquence linéaires

ENSIETA, Janvier 2002Centre de Recherche "Extraction et Exploitation de l'Information en Environnements Incertains"

46

4REPRESENTATIONS TEMPS-FREQUENCE LINEAIRES

4.1. Transformée de Fourier à court terme. Spectrogramme ([1], [3])

4.1.1. Définitions

La transformée de Fourier à court terme (TFCT) et ses dérivées (notamment lespectrogramme) sont les méthodes temps-fréquence les plus utilisées dans les applications pratiques.Ainsi, cette classe de méthodes représente la solution la plus repandue pour éliminer les limitations dela transformée de Fourier. L’idée de base est très simple et efficace : on décompose le signal en petitssegments et on applique, sur chacune des sections, la transformée de Fourier en obtenant ainsi lespectre « local ». La totalité des spectres « locaux » indique alors comment le spectre varie au coursde temps. Ce concept est présenté sur la figure suivante.

Figure 4.1. Le principe de la TFCT

Du point de vue mathématique, la TFCT peut être interprétée comme l’analyse de Fourier detranches successives pondérées par une fenêtre temporelle (Hamming, par exemple). Ce principe estéquivalent à l’approximation du signal par un ensemble des fonctions élémentaires semi-localiséessimultanément en temps et en fréquence :

( ) ( ) ττττττυ υτπυ dethxdhxtG j

t ∫∫ −−== 2**, )()(),( (4.1)

Cette relation représente le produit scalaire entre le signal x(t) et les fonctions de base

( ) ( ) πυτυ ττ 2,

jt ethh −= (reflet de la similarité qui existe entre x(t) et les fonctions (h(t)).

En pratique, on utilise le Spectrogramme qui est le module au carré de la TFCT. Lorsque lesvaleurs de TFCT sont, en général, complexes, le module carré nous assure que la valeur duspectrogramme sera toujours une valeur réelle. Le spectrogramme (expression numérique) est alorsdéfini comme une densité d’énergie soit :

( ) ( ) 22*),( ∫ −−= τττ πυτ dethxvtS j (4.2)

La TFCT ou le spectrogramme considère implicitement un signal non stationnaire comme unesuccession de situations quasi-stationnaires, à l’échelle de la fenêtre à court terme h(u). La résolutiontemporelle d’une telle analyse est fixée par la largeur de la fenêtre, la résolution fréquentielle étantfixée par la largeur de sa transformée de Fourier. Ces deux largeurs étant antagonistes, on se trouvealors en présence d’un compromis entre les résolutions temporelle et fréquentielle. En effet :

h(t)

x(t)

TF

TF TF

TF

TF

Temps

TempsFréq

uenc

e

TFCT

Page 52: carte - representations temps - frequences ENSIETA

4. Représentations temps-fréquence linéaires

ENSIETA, Janvier 2002Centre de Recherche "Extraction et Exploitation de l'Information en Environnements Incertains"

47

- pour un signal fortement non-stationnaire, une bonne résolution temporelle est requise, cequi impose de travailler avec une fenêtre h(u) courte, limitant par voie de fait la résolutionfréquentielle ;

- réciproquement, si une analyse fréquentielle fine est nécessaire, une fenêtre h(u) longue doitêtre utilisée, ce qui a le double effet de moyenner les contributions fréquentielles sur la durée de lafenêtre et de dégrader la résolution temporelle.

Pour en déduire les propriétés générales de la TFCT et du spectrogramme, on introduit lanotion de fonction caractéristique du spectrogramme, [3], selon :

( ) ( ) ( ) ( )∫∫ −== + τθτθυυτθ πυτπθ ,,,, 22hx

jtjSP AAdtdetSM (4.3)

( ) ∫

+

−= dtetxtxA tj

xπθττ

τθ 2*

22, (4.4)

est la fonction d’ambiguïté du signal x(t) et Ah est la fonction d’ambiguïté de la fenêtre h(t), définied’une manière analogique.

4.1.2. Propriétés générales de la TFCT et du spectrogramme

• Energie totale

L’énergie totale est obtenue par l’intégration sur tout le support temporel et fréquentiel. Enutilisant la fonction caractéristique définie ci-dessus (4.3 et 4.4), on obtient :

( ) ( ) ( ) ( )( )

( )( ) ( )( )∫×∫=

=∫∫ ⋅===

dtthdtts

AAMdtdtSE hxSPSP22

4.4)3.4(0,00,00,0, υυ

(4.5)

Pour que l’énergie soit conservée, par l’application du spectrogramme, on déduit, à partir de la

relation (4.5), que la fenêtre doit avoir une énergie unitaire ( ( ) 12

=∫ dtth ).

• Les marginales en temps et en fréquence

Pour déterminer les expressions des marginales en temps et en fréquence, on introduit lesnotations suivantes :

( ) ( ) ( ) ( ) ( ) ( )

( ) ( ) ( ) ( ) ( ) ( )υψυψ

ϕϕ

υυυυ H

h

jH

j

tjh

tj

eBHeBX

etAthetAtx

==

==

;

;(4.6)

La marginal en temps est obtenue par intégration du spectrogramme sur tout l’axefréquentiel :

( ) ( ) ( ) ( )∫ ∫ −== τττυυ dtAAdtStP h22

)6.4(2, (4.7)

D’une manière s imilaire, la marginale en fréquence sera donnée par :

( ) ( ) ( ) ( )∫ ∫ −== ''2'2)6.4(2, υυυυυυ dBBdttSP H (4.8)

On peut observer, à partir de (4.7) et (4.8), que, en général, les marginales en temps et enfréquence du spectrogramme ne satisfont pas les marginales corrects du signal :

( ) ( ) ( )( ) ( ) ( ) 22

22

υυυ XBP

txtAtP

=≠

=≠(4.9)

Page 53: carte - representations temps - frequences ENSIETA

4. Représentations temps-fréquence linéaires

ENSIETA, Janvier 2002Centre de Recherche "Extraction et Exploitation de l'Information en Environnements Incertains"

48

L’explication physique est liée au fait que le spectrogramme mélange la distributionénergétique du signal avec celle de la fenêtre, la distribution issue n’étant pas celle du signal propre.

• Conservation des supports temporel et fréquentiel

Cette propriété consiste à considèrer qu’une représentations temps-fréquence (RTF) est nulleen dehors des supports physiques d’un signal. En effet, pour un signal s(t) (avec la TF S(f)), cettepropriété s’écrit :

( ) [ ] ( ) [ ]( ) [ ] ( ) [ ]

( )[ ] [ ][ ] [ ] )10.4(

2,2et 2,2 si 0

2,2et 2,2 si0,

si elfréquenctiet temporelsupports des onsconservati de propriété la respecte RTF

unequ'dit On .2,2fpour 0et 2,2pour 0Fourier de

ée transformla avec 2,2pour 0et 2,2pour 0Soit

0000

0000

0000

0000

+−∉+−∉=

+−∈+−∈≠=

+−∉=+−∈≠

+−∉=+−∈≠

BfBffTtTtt

BfBffTtTttftRTF

BfBffSBfBfffS

TtTtttsTtTttts

s

Dans le cas du spectrogramme, cette propriété n’est pas verifiée, car même si s(t)=0 pour t0,en raison de la pondération du signal par une fenêtre h(t) le terme x(τ)h(τ-t) ne sera pas nul à cetinstant et, par conséquent, le spectrogramme ne sera pas nul pour cette valeur de t. Ceci est illustré surla figure suivante où on a considéré, comme signal de test, un atome gaussien et, pour t0=45 onconstate clairement que, même si le signal est nul, le produit x(τ)h(τ-t) est différent de 0 et, commeconclusion finale, la spectrogramme ne conserve donc pas le support temporel du signal.

Figure 4.2. Non-conservation du support temporel

Des considérations similaires peuvent être faites pour le cas fréquentiel, et, ainsi, lespectrogramme et la TFCT ne respectent pas la propriété de conservation des supports temporel etfréquentiel.

• Le compromis entre les résolutions temporelle et fréquentielle

Comme illustré ci-dessus, si on souhaite une bonne localisation temporelle on a besoin d’unefenêtre étroite h(t) et si on souhaite une bonne localisation fréquentielle la fenêtre H(f) doit etreétroite. Mais comme h(t) étroit conduit à une H(f) large et vice-versa, on aura toujours un compromisà résoudre, quand il s’agit de choisir la fenêtre h(t). Dans le tableau ci dessous on présente quelquestypes des fonctions de pondération h(t) couramment utilisées.

Temps

Fréq

uenc

e (n

orm

alis

ée)

Atome gaussien

h(τ-45)

Spectrogramme : h-Hamming, 77

Page 54: carte - representations temps - frequences ENSIETA

4. Représentations temps-fréquence linéaires

ENSIETA, Janvier 2002Centre de Recherche "Extraction et Exploitation de l'Information en Environnements Incertains"

49

Ce compromis est régi par le principe d’incertitude d’Heisenberg-Gabor (voir la section 3.4)et le meilleur choix est une fonction de type gaussien, la transformée générée étant alors appeléetransformée de Gabor (qui sera présentée dans la section 4.2.).

Tableau 4.1 Fenêtres d'analyse couramment utilisées

• L’inversibilité du spectrogramme

Lorsque le spectrogramme est le module carré de la TFCT il est affirmé qu’on ne dispose plusde la phase du signal et, par conséquent, la reconstruction de celui-ci n’est pas possible. Cettesupposition est fausse, car lorsqu'on calcule le spectrogramme on perd seulement la phase de TFCT,pas celle du signal. En conclusion, la reconstruction est possible mais avec quelques précautions surle choix de la fenêtre.

A partir de la relation (4.3), la fonction d’ambiguïté du signal peut s’écrire de manièreéquivalente :

( ) ( )( ) ( ) ( )∫∫ +

−=

−= υυ

τθτθτθ

τθ πτυπθ dtdetSAA

MA jtj

hh

SPx

222,,

1,,

, (4.11)

A partir de la fonction d’ambiguïté, le signal peut être généré selon :

Expression mathématiques Représentationtemporelle

( )( ) ( ) ( )

( )( )∑

=

+=

−≤≤−−

−=

02!

2

210

sinon,0

2/12/1,0

2/12

12

10

L L

Lx

xI

NnNI

Nn

Inkw

β

β

( )

+=N

nnw

π2cos*46.054.0

( )

+=N

nnw

π2cos*5.05.0

( )2

2/2/1

−−=N

Nnnw

( )

≤≤−+

≤≤−=

sinon,0

02/,/212/0,/21

nNNnNnNn

nw

Welch

Bartlett

Hamming

Hanning

Kaiser

Rectangulaire ( ) ≤≤−

=sinon,0

2/2/,1 NnNnw

Fenêtred'analyse

Représentationfréquentielle

30 40 50 60

30 40 50 60

40 50 60

40 50

40 50 60

Page 55: carte - representations temps - frequences ENSIETA

4. Représentations temps-fréquence linéaires

ENSIETA, Janvier 2002Centre de Recherche "Extraction et Exploitation de l'Information en Environnements Incertains"

50

( ) ( ) ( ) θτθπ

ττ πθ deAtxtx tjx∫ −=+− 2* ,

21

22 (4.12)

et, pour une valeur particulière de t=τ/2 cette relation devient :

( ) ( ) ( ) θτθπ

πθ deAtxx tjx∫ −= 2/2* ,

21

0 (4.13)

Compte tenu de (4.11) et (4.13), la formule d’inversion du spectrogramme est :

( )( )

( )( ) θ

θθ

ππθ de

tAtM

xtx tj

h

SP∫ −

−= 2/2

* ,,

02

1(4.14)

La reconstruction à partir d’un spectrogramme est possible lorsque la fonction d’ambiguïté deh(t) est différente de 0, ce qui introduit des contraintes sur le choix de h(t).

• Invariance du spectrogramme

Pour le spectrogramme, la propriété d’invariance par translation temporelle et fréquentielles’écrit selon :

( ) ( ) ( ) ( )00~20 ,,~ 0 υυυπυ −−=⇒−= − ttStSettxtx xx

tj (4.15)

La preuve de cette propriété est laissée comme exercice aux lecteurs.

4.1.3. Le pavage temps-fréquence généré par le spectrogramme

Comme on l’a montré au début du chapitre, la TFCT peut être interprétée comme la projectiondu signal x(t) sur les fonctions de base ( ) ( ) πυτ

υ ττ 2,

jt ethh −= (voir la relation (4.1)). Sur la figure

4.3 on présente, de manière comparative, le pavage temps-fréquence induit par cette transformée.

Figure 4.3. Pavages du plan temps-fréquence par (a) Transformée identité

(b) Transformée de Fourier (c) TFCT

Par ailleurs, la transformée identité peut être interprétée comme la projection du signal sur unensemble d’impulsions decalées, représentant une meilleure localisation temporelle mais la pirelocalisation fréquentielle (figure 4.3.a). A l’opposé on trouve la représentation fréquentielle, fourniepar la transformée de Fourier (figure 4.3.b).

TempsFréq

uenc

e

Pavage de Shannon Pavage de Fourier

Pavage de TFCT Atome de Gabor

0 20 40 60 80 100 120 140-0.8

-0.6

-0.4

-0.2

0

0.2

0.4

0.6

0.8

1

Page 56: carte - representations temps - frequences ENSIETA

4. Représentations temps-fréquence linéaires

ENSIETA, Janvier 2002Centre de Recherche "Extraction et Exploitation de l'Information en Environnements Incertains"

51

4.1.4. Considérations sur la discrétisation du spectrogramme

La discrétisation des expressions de la TFCT et du spectrogramme est fortement imposée pardes raisons qui tiennent de l’implémentation de ces approches soit sur des processeurs numériques designaux, dans le cas des applications en temps réel soit sur l’ordinateur, comme outil de simulation etd’analyse. Ainsi, les expressions de la TFCT et du spectrogramme sont :

( ) ∑−

=

−+=1

0

2)()(,N

n

jvnenkxnhkTFCT πυ (4.16)

21

0

2)()(),( ∑−

=

−+=N

n

jvnenkxnhvkS π (4.17)

La transformation pourrait s’interpréter comme une batterie de filtres de même gabarit,décalés en fréquence. Donc, la méthode la plus rapide pour l’implémentation est de calculer S par la

transformée de Fourier rapide aux points viNi = .

Comme vu dans le chapitre précédent, dans les applications pratiques une limitation majeurede l’utilisation de la transformée de Fourier réside dans le fait qu’on ne dispose que d’un ensemblefinit de données et, cela conduit aux problèmes d’interprétation physique. Un de ces problèmes estl’apparition des effets de bord qui sont générés aux extrémités du segment de données traité par TF.Le même problème apparait dans le cadre de la TFCT : aux bords de la fenêtre d’analyse on obtientde fausses composantes spectrales qui ne sont associées à aucun phénomène physique (figure 4.3.a).Pour diminuer l’importance de cet effet, on utilise en pratique des fenêtres particulières, qui minimisel’importance des éléments qui se trouvent vers les bords de la fenêtres. On prend comme exemple lecas d’une fenêtre Hamming (figure 4.3.b). Pour améliorer de plus la lisibilité du spectrogramme, onintroduit un facteur de recouvrement entre les fenêtres d’analyse, l’effet obtenu étant présenté sur lafigure 4.3.b.

Figure 4.3. L’effet du choix de la fenêtre d’analyse et du facteur de recouvrement

4.1.5. Conclusion

Ce paragraphe a décrit la problématique liée à la première approche temps-fréquence utiliséedans le monde scientifique : la TFCT et son module au carré. Après les définitions de celle-ci on aétudié qu’elles sont les propriétés générales de ces approches. Ces propriétés imposent des contraintessur le choix de la fenêtre d’analyse et, du point de vue pratique, on a présenté quels sont les critèresde choix.

Temps TempsTemps

Fréq

uenc

e (n

orm

alis

ée)

Fréq

uenc

e (n

orm

alis

ée)

Fréq

uenc

e (n

orm

alis

ée)

h1 : (Rectang, 35); Recouvrement : 0 h2 : (Hamming, 35); Recouvrement : 0 h3 : (Hamming, 35); Recouvrement : 8

Spectrogramme (h1) Spectrogramme (h2) Spectrogramme (h3)

a. b. c.

Page 57: carte - representations temps - frequences ENSIETA

4. Représentations temps-fréquence linéaires

ENSIETA, Janvier 2002Centre de Recherche "Extraction et Exploitation de l'Information en Environnements Incertains"

52

L’utilisation à grande échelle du spectrogramme est due principalement au concept trèssimple, qui permet l’implémentation à partir des algorithmes de la TF rapide. Néanmoins, l’inégalitéd’Heisenberg-Gabor (ce qu’en pratique se traduit par le choix de la fenêtre, ses paramètres et lerecouvrement) limite les domaines d’applications au cas où on dispose des informations a-prioriconcernant le signal analysé.

Parmi toutes les fenêtres possibles, on s’appuie, dans la section suivante, sur celle de Gabor,qui fournit le meilleur compromis, au sens de l’inégalité d’Heisenberg-Gabor.

4.2. La transformée de Gabor [1]

4.2.1. Définition

En 1946, Gabor a proposé une représentation bi-dimensionnelle temps-fréquence, obtenue parune décomposition du signal x(t) sur un ensemble de fonctions élémentaires qui occupent la mêmesurface minimale dans le plan temps-fréquence. Il a proposé une surface qui minimise l’inégalitéd’Heisenberg-Gabor, et, par conséquent, les fonctions élémentaires sont données par la fonction deGauss :

( )

= 24

1

2exp tth

απα

(4.18)

Dans ce cas, le principe d’incertitude s’écrit :

ππα

α 41

41

==∆∆ ft (4.19)

où π41

représente la limite de l’inégalité d’Heisenberg-Gabor.

La définition mathématique de la transformée de Gabor, à partir des opérateurs introduits dansle chapitre 2, s’écrit :

Pour un espace de Hilbert H, la transformée de Gabor est une application Gh : H→Gh(H)parametrisée par la fonction h. Plus rigoureusement, la transformée de Gabor d’une fonctionf∈L2(R) est donnée par :

( ) ( )( )( )RLt

hh

heff

RLGRLG

2,

: 22

τγa→

(4.20)

Autrement dit, la transformée de Gabor représente la projection du signal sur toutes lesversions modulées et translatées de la fonction d’analyse h.

L’implémentation pratique de cette transformation impose l’existence d’un réseaud’échantillonnage bidimensionnel, paramétré par T- le pas de discrétisation temporelle et υ - le pas dediscrétisation fréquentielle. Un tel réseau est présenté sur la figure suivante.

Figure 4.4. Réseau d’échantillonnage pour la transformé de Gabor

Dans ces conditions, un signal quelconque peut être décomposé en série de Gabor [1], selon :

Temps

Fréq

uenc

e

mT

(0,0)

T

υ

Page 58: carte - representations temps - frequences ENSIETA

4. Représentations temps-fréquence linéaires

ENSIETA, Janvier 2002Centre de Recherche "Extraction et Exploitation de l'Information en Environnements Incertains"

53

( ) ( ) ( ) ∑ ∑∑ ∑∞

−∞=

−∞=

−∞=

−∞=−==

m nnm

m nnmnm tnjmTthCthCtx υπ2exp,,, (4.21)

Cette décomposition, proposée par Gabor, existe si les paramètres d’échantillonnage satisfontla condition :

1≤υT (4.22)

Intuitivement, si le produit Tυ est plus grand que 1, on n’a pas assez d’information pourpouvoir reconstruire le signal (cas de sous-echantillonage). Si Tυ est plus petit que 1, lareprésentation sera redondante (cas de sur-echantillonage-« oversampling »). Traditionnellement (caspris en compte par Gabor), si Tυ=1 on obtient la représentation la plus compacte ; ce cas s’appelleéchantillonnage critique.

Dans ces travaux, Gabor n’a proposé aucune méthode pour calculer les coefficients Cm,n etceci explique pourquoi ces approches ont été abandonnées jusqu’en 1980. A ce moment-là, Bastians[1] a unifié la décomposition de Gabor avec la TFCT, proposant ainsi une méthode pour le calcul deCm,n. De même, Bastians a mis en évidence les trois possibilités d’échantillonnage, présentées ci-dessus. C’est toujours lui qui a montré que la TFCT continue inverse est une représentation fortementredondante et, par conséquent, il a proposé l’échantillonnage de la TFCT, en utilisant un réseaucritique. La transformée issue constitue une méthode efficiente pour le calcul des coefficients deGabor Cm,n. Ainsi, si les fonctions de Gabor hm,n(t) forment un ensemble complet, alors il existe unensemble dual de fonctions ( ) th nm,

~ tel que :

( ) ( ) ( ) ( ) ( )υπυ nmTTFCTdttjnmTthtxthtxC nmnm ,2exp~~ **

,, =−−== ∫∫ (4.23)

La TFCT (dans le cas d’une fenêtre d’analyse gaussienne) échantillonnée a été nommée parBastians la transformée de Gabor.

4.2.2. Implémentation de la transformée de Gabor

Concernant l’implémentation de la transformée de Gabor, il existe deux problèmes majeurs :• Trouver une méthode pour le calcul des fonctions duales ( ) th nm,

~.

• Trouver une méthode pour la sélection des ( ) th nm,~

, dans le cas où cet ensemble n’est pas unique.

Cas de l’échantillonnage critique

Dans le cas de l’échantillonnage critique, l’ensemble des fonctions hm,n(t) est linéaireindépendant et, selon les notions de biorthogonalité (introduites dans le chapitre 3), il existe unensemble de fonctions duales à hm,n(t) et unique (l’ensemble sera unique, donc, dans ce cas, ledeuxième problème est résolu ), qui représente la base de Riesz associée au hm,n(t).

En remplaçant la relation (4.23) dans la partie droite de l’expression (4.21), on obtient :

( ) ( ) ( ) ( )∫ ∑ ∑∞

−∞=

−∞==

m nnmnm dtththtxtx ',

'*,

' ~(4.24)

Evidement, la décomposition de Gabor existe si et seulement si la somme double est égal à lafonction de Dirac :

( ) ( ) ( )','*

,~

ttththm n

nmnm −=∑ ∑∞

−∞=

−∞=δ (4.25)

Par la formule de sommation de Poisson, [4], (4.25) peut être réduite à une seule intégration :

( ) ( ) ( ) ( )nmdtththT nmnm δδυ =∫ *,

0,00

~ (4.26)

Page 59: carte - representations temps - frequences ENSIETA

4. Représentations temps-fréquence linéaires

ENSIETA, Janvier 2002Centre de Recherche "Extraction et Exploitation de l'Information en Environnements Incertains"

54

où ( ) ( ) 00*

,0 2exp

~~πυjnmTthth nm −= et T0=1/υ, υ0=2π/T. Cette relation, appelée l’identité de

Wexler-Raz, présente l’outil de base pour déterminer les fonctions duales de hm,n(t). Ainsi, la solutionde l’équation (4.26) représente l’ensemble dual cherché.

Cas du sur-échantillonage

Dans ce cas, les fonctions hm,n(t) sont linéaires dépendantes. Dans ce cas, l’unicité del’ensemble dual n’est plus valable. La représentation est alors redondante : la reconstruction ne serapas exacte, mais ce degré de redondance apporte quelques propriétés importantes, qui seront discutéespar la suite.

Pour au moins deux raisons, il est préférable de choisir un échantillonnage critique : lapremière est due au fait que les fonctions duales, qui vont déterminer les coefficients de Gabor sontdonnées par l’équation (4.26) (rapidité de calcul) et la seconde, l’ensemble dual issu est unique, cequi nous garantit une reconstruction parfaite. Mais tous ces avantages n’existent que dans le casideal : quand on dispose de signaux sur un support infini et quand on n’est pas intéressé de la lisibilitéde la RTF engendrée. En effet, Bastians a montré que, dans le cas d’échantillonnage critique, lorsqueh(t) est concentrée optimalement dans le domaine temps-fréquence la fonction duale n’est concentréeni en temps ni en fréquence (figure 4.5.a et b). Ainsi, les coefficients Cm,n qui sont déterminés à partirde ces fonctions ne caractériseront pas la distribution du signal dans le plan temps-fréquence, pour lalocation correspondante [ ] [ ]υυυ υυ ∆+∆−×∆+∆− nnmTmT t ,, (voir la figure 4.5.c.).

Dans le cas du sur-échantillonage, l’ensemble dual de fonctions n’est pas unique, mais ilexiste plusieurs méthodes ([1, pag. 56-73]) pour sélectionner l’ensemble optimal. Une de ces méthodesera présentée dans la section suivante ; selon cette méthode, le degré de redondance introduit permetd’améliorer fortement la lisibilité de la RTF calculée, qui consiste, en fait, à représenter lescoefficients de Gabor dans le plan temps-fréquence.

Figure 4.5. L’inconvénient de l’échantillonnage critique en ce qui concerne la lisibilité de la RTF

Representation temporelle de h(t) et de sa duale

)(~

th

h(t)

Representation fréquentielle de h(t) et de sa duale

Temps Fréquence (normalisée)

H(υ)

)(~

υH

Les coefficients de Gabor pour Tυ=1

Fréq

uenc

e (n

orm

alis

ée)

Temps Temps

Fréq

uenc

e (n

orm

alis

ée)

Les coefficients de Gabor pour Tυ<1

a. b.

c. d.

Page 60: carte - representations temps - frequences ENSIETA

4. Représentations temps-fréquence linéaires

ENSIETA, Janvier 2002Centre de Recherche "Extraction et Exploitation de l'Information en Environnements Incertains"

55

4.2.3. Sélection optimale de l’ensemble dual des fonctions

Dans la section précédente on a vu que le degré de redondance qui apparait pour un sur-échantillonage de la transformée de Gabor rend une meilleure lisibilité à la représentation temps-fréquence engendrée, mais ceci se passe lorsque la fonction duale, utilisée pour déterminer lescoefficients de Gabor, est choisie de manière optimale, en respectant un certain critère [1, pag. 56-73]. Dans cette section on présente une méthode proposée par Qian et Chen [1], développée pour unsignal discret, s[k], composé de L échantillons. La procédure pour calculer les coefficients de Gabor,dans le cas du sur-échantillonage, est présentée ci-dessous.

Figure 4.6. La décomposition discrète de Gabor

La décomposition discrète de Gabor a pour expression :

[ ] [ ]∑ ∑−

=

=

∆∆−=1

0

1

0,

M

m

N

n

NknLnm WMmkhCks (4.27)

où les coefficients Cm,n sont calculés selon :

[ ] [ ]∑−

=

∆−∆−=1

0,

~L

k

NknLnm WMmkhksC (4.28)

Les termes ∆M et ∆N représentent les incréments de discrétisation en temps et,respectivement, en fréquence. Le taux de sur-échantillonage est défini selon :

1≥∆∆

=NM

La (4.29)

Dans le cas de l’échantillonnage critique, le nombre de coefficients de Gabor est égal aunombre d’échantillons. Dans le cas du sur-échantillonage, le nombre de coefficients de Gabor est plusgrand que le nombre d’échantillons du signal.

Si on introduit la restriction ∆N⋅N=L, les relations (4.28) et (4.29) peuvent être réécritesselon :

[ ] [ ]∑ ∑−

=

=∆−=

1

0

1

0,

M

m

N

n

nkNnm WMmkhCks (4.30)

et

[ ] [ ]∑−

=

−∆−=1

0

*,

~L

k

nkNnm WMmkhksC (4.31)

En remplaçant ∆NN=L en (4.29), on obtient :

s[k]

[ ]kh~

TFD

TFD

TFD

Les coefficients de Gabor

M

N

Page 61: carte - representations temps - frequences ENSIETA

4. Représentations temps-fréquence linéaires

ENSIETA, Janvier 2002Centre de Recherche "Extraction et Exploitation de l'Information en Environnements Incertains"

56

1≥∆

=MN

a (4.32)

ce qui revient à dire que pour une reconstruction stable, le pas d’échantillonnage en temps, ∆M, doitêtre plus petit ou égal au nombre de canaux fréquentiels N.

Pour déterminer [ ]kh~

pour une h[k] donnée, on introduit (4.31) en (4.32) et on obtient :

[ ] [ ] [ ] [ ]∑ ∑ ∑−

=

−−

=

=∆−∆−=

1

0

)('*1

0

1

0

'

'

'~L

k

kknN

M

m

N

nWMmkhMmkhksks (4.33)

d’où la décomposition discrète de Gabor existe si et seulement si :

[ ] [ ] [ ]')('*1

0

1

0

'~kkWMmkhMmkh kkn

N

M

m

N

n−=∆−∆− −

=

=∑ ∑ δ (4.34)

Pour rendre exploitable cette relation, on applique la formule de sommation discrète dePoisson :

[ ] [ ]∑ ∑ ∑−

=

−∆

=∆

=

−∆

∆=∆−

1

0

1

0

1

0

1M

m

M

k

nkM

L

i

ikM WWia

MMmna (4.35)

en (4.34) et on obtient la version discrète de l’identité de Wexler-Raz :

[ ] [ ] [ ] [ ]∑−

=

−∆

∆=+

1

0

*~L

k

pkM qp

NM

khWqNkh δδ (4.36)

où NqMp ∆<≤∆<≤ 0et 0 .L’équation (4.36) représente un système linéaire d’équations, qui permettra de déterminer

l’ensemble des fonctions duales [ ]kh~

. Cette équation peut être mise en forme matricielle :

µ=⋅ *~H h (4.37)

où H est une matrice ∆M∆N×L, avec les éléments définis selon :

[ ] pkMkqMp WqNkhh −

∆+∆ +=, (4.38)

et µ est un vecteur ∆M∆N dimensionnel donné par T

NM

= 0,...,0,0,µ .

Une condition nécessaire et suffisante pour que la solution de (4.37) existe est que la taille deµ soit inférieure ou égale au nombre de colonnes de H. Dans le cas de l’échantillonnage critique,∆M∆N=L, H est une matrice carrée et la solution sera unique. Dans le cas du sur-échantillonage,∆M∆N<L le système (4.37) et indéterminé est, par conséquent, la solution ne sera pas unique. Donc,il faut alors trouver un critère pour la sélection optimale de la fonction duale, [ ]khopt

~.

Comme la fonction élémentaire h[k] est une fonction gaussienne qui est optimalementconcentrée dans le domaine temps-fréquence, une idée naturelle pour la sélection de la fonction dualeoptimale est de minimiser l’erreur quadratique moyenne , définie selon :

[ ] [ ] [ ] [ ] [ ] [ ]

[ ] [ ]

−=

=

+−

=−=Γ

∑∑

==⋅

==⋅

==⋅

1

0~

1

0

2

2

~

21

0~

~~2

2min

~

~2~

~min~

~min

L

khH

L

khH

L

khH

khkhh

khh

khkh

h

khkh

h

kh

µ

µµ

(4.39)

Page 62: carte - representations temps - frequences ENSIETA

4. Représentations temps-fréquence linéaires

ENSIETA, Janvier 2002Centre de Recherche "Extraction et Exploitation de l'Information en Environnements Incertains"

57

où [ ]∑−

==

1

0

2~~ L

kkhh . Compte tenu de (4.36), la relation (4.39) devient :

−=Γ=⋅ N

M

hhH~1

1min~µ

(4.40)

qui montre que la solution optimale sera donnée par [ ]kh~

(solution du système linéaire (4.37))

d’énergie minimale.On suppose que la matrice H est de rang p et que son nombre de lignes vaut q. En appliquant

la décomposition en valeurs singulières à la matrice H, (4.37) devient :

µ=⋅ *~hUSV (4.41)

où S∈Rq,L et les matrices U ∈ Cq,q et V∈ CL,L sont des matrices unitaires. Si on multiplie les deux

parties de (4 .41) par UT , celle-ci devient :

( )( ) ( ) ( )

[ ] µT

pqqpqLpL

Lp

plpqppq

plppp UUhV

V

OO

OS 1)(

01

)(

00 ~−××

×−

×

−×−×−

−×× =

(4.42)

La solution de (4.42) existe si µ est orthogonal sur U1 (la condition de consistance). Dans cecas, (4.42) peut être réécrite selon :

µ~

H * =⋅ h (4.43)

où LPCVSH ,00ˆ ∈= et ( ) µµT

U 0ˆ = . En utilisant la pseudo-inverse de H , la solution optimaledevient :

( ) µˆˆˆ~ 1* −= TT

opt HHHh (4.44)

La fonction duale ainsi obtenue s’approche de celle de Gabor lorsque le taux de sur-échantillonage augmente. Comme résultat immédiat, la concentration de la fonction duale dans leplan temps-fréquence s’approche de la fonction optimale, par conséquent, les coefficients de Gaborvont approximer au mieux les caractéristiques locales du signal.

4.2.4. Conclusions

Dans les sections 4.1 et 4.2 la problématique des représentations temps-fréquence linéairespour lesquelles le principe d’incertitude d’Heisenberg-Gauss constitue l’inconvénient majeur a étéprésenté. La transformée qui minimise au mieux l’influence de ce principe est celle de Gabor.Néanmoins, dans les cas pratiques, cette transformation ne respecte plus les propriétés mathématiquesde base ou celles-ci ne sont pas toujours utiles dans les applications pratiques. Ainsi, quelquesconsidérations sur le cas du sur-echantillonage, qui a pour but l’amélioration de la lisibilité de la RTF,ont été faites pour obtenir une solution satisfaisante. Ce cas apporte des difficultés sur ladétermination de la fonction duale optimale et une solution générale à ce problème a été approchée.

4.3. La transformée ondelettes continue (TOC) [4,5]

Durant les vingt dernières années, les décompositions en bandes de fréquences ont trouvé denombreuses applications en traitement du signal. L'expansion d'une fonction sur quelques bandes defréquences donne une représentation intermédiaire entre une représentation spatiale (ou temporelle) etune représentation de Fourier. En analyse harmonique, ce type de représentation est apparu dans lestravaux de Littlewood et Payley dans les années 1930. De nombreuses recherches ont convergé

Page 63: carte - representations temps - frequences ENSIETA

4. Représentations temps-fréquence linéaires

ENSIETA, Janvier 2002Centre de Recherche "Extraction et Exploitation de l'Information en Environnements Incertains"

58

récemment pour la création d'une nouvelle décomposition appelée Transformations en Ondelettes.Pour mieux comprendre ce modèle nous allons en décrire les motivations.

La transformée de Fourier (TF) d'une fonction f(t) donne une mesure des irrégularités (hautesfréquences du signal) mais cette information n'est pas localisée. Pour éliminer cet inconvénient,Gabor a introduit la notion de transformée de Fourier à court terme, en introduisant une fenêtred'analyse h(t) dans l'intégrale de Fourier. Cette fenêtre est translatée sur tout le domaine temps-fréquence, et, par conséquent, on mesure, autour d'un point u, l'amplitude de la composantesinusoïdale de fréquence f. Le problème de cette représentation est d'utiliser une fenêtre de taille fixecouvrant le domaine temps-fréquence. Or, on souhaiterait avoir une fenêtre qui s'adapte en fonctiondes irrégularités du signal. Il s'agit de la Transformation en Ondelettes.

Morlet et Grossman ont formalisé de nombreux concepts introduits, pour certains, dès le débutdu siècle. Ils ont ouvert la porte à un vaste champ d'applications et à de nouveaux résultats trèsimportants. Actuellement, il serait difficile d'énumérer tous les domaines d'application de cette théorietant ils sont nombreux, que ce soit en traitement du signal (bancs de filtres), en compression (parole,images, scènes tri-dimensionnelle), en chimie, en physique, en astronomie etc. En traitement dusignal, la théorie des bancs de filtres a donné lieu au fameux schéma de décomposition -reconstruction de Stéphane Mallat. En compression d'images, l'algorithme de décompositionpyramidale d'une image a servi de base pour l'analyse multirésolution. Mais avant tout on vaprésenter, dans la section suivante, ce qu’est une ondelette.

4.3.1. La notion d'ondelette. Exemples

Une ondelette est une fonction avec quelques propriétés particulières. Dans le contexte le plusgénéral, la fonction ondelette satisfait les conditions suivantes1. Elle a une structure courte, d'énergie finie, dans le domaine temporel;2. Elle présente quelques oscillations dans le même domaine.

La première condition fournit l'attribut "little" et la deuxième - l'attribut "wave" (onde) et d'ici,le nom dans le langage anglo-saxon : "wavelet" .

Une fonction ondelette générée, par dilatation (ou contraction) et translation (selon l'axetemporel), génère une famille de fonctions ondelettes. Mathématiquement, cette famille est généréeselon gDstτ , où g est appelée la fonction ondelette d'analyse ou l'ondelette mère. Cet ensemblecontient toutes les versions dilatées (par s) et translatées (par t) de la fonction d'analyse. D'unemanière très générale, la TOC est définie comme la projection d'un signal f sur toute la famille desfonctions ondelettes gDf stτ, . A chaque point (t,s) dans le plan temps-échelle, l'amplitude de latransformée ondellete fournit une information sur le degré de ressemblance entre le signal analysé etla version de g décalée de t, à l'échelle s.

Dans les applications pratiques (debruitage, compression etc.) on veut que la TOC soitinversible et, par conséquent, les conditions 1 et 2 ne sont pas suffisantes : il faut que la famillegénérée par g soit complète. Autrement dit, chaque fonction f doit être représentable par unecombinaison linéaire des fonctions générées par g. La troisième condition consiste donc à assurerl'inversion de la TOC; par la suite, on verra que cette condition est satisfaite si g est une fonction demoyenne nulle (ce qui impose le caractère oscillant de la fonction).

Dans la suite on va donner quelques exemples de fonctions d'ondelettes fondamentales, quivont nous aider pour la compréhension des éléments qui seront introduits après.

A. Ondelette de Haar

L'ondelette de Haar représente l’exemple le plus classique de la fonction ondelette. La familled’ondelettes générée par celle-ci forme une base orthonormale si et seulement si les translations et lesdilatations sont restrictionées aux indices dyadique (puissance de 2).

L'ondelette de Haar est définie selon (voir la figure 4.7.a pour la représentation graphique) :

Page 64: carte - representations temps - frequences ENSIETA

4. Représentations temps-fréquence linéaires

ENSIETA, Janvier 2002Centre de Recherche "Extraction et Exploitation de l'Information en Environnements Incertains"

59

[ ) ( ][ ]2/1,00,2/1 112

1−= −Haarg (4.45)

où "1" est la fonction indicatrice définie selon : 1t=1, quelqu'en soit t. Dans le domaine fréquentiel,l'ondelette de Haar est donnée par :

( )πγ

πγ

γ

=2

sin2ˆ

2

jg Haar (4.46)

A cause de fait que l'enveloppe fréquentielle de g décroisse avec γ, la localisation fréquentielleofferte par l'ondelette de Haar est faible.

Figure 4.7. Ondelette de Haar

La caractéristique de base de cette fonction est le support compact en temps, ce qui nousautorise d'utiliser cette fonction pour la détection des transitoires, dans le domaine temporel.

B. Ondelette de Shannon

L'idée de base de la conception de cette fonction est d'assurer un support fréquentiel compactsur un certain intervalle, défini en terme de fréquence centrale, γc, et la largeur de bande désirée, γb :( ]2/;2/ bcbc γγγγ +− . La transformée de Fourier de cette ondelette s'écrit alors :

( ) ( ] +−∈

=sinon,0

2/;2/,1ˆ bcbc

Shannongγγγγγ

γ (4.47)

L'expression temporelle de l'ondelette de Shannon devient :

( ) ( )t

tetg btj

bShannonc

ππγ

γ πγ sin22/1−= (4.48)

A l'opposée de l'ondelette de Haar, l'ondelette de Shannon permet d'avoir une bonnelocalisation fréquentielle tandis que la localisation temporelle sera très faible, car l'enveloppetemporelle décroît en 1/t.

La fonction ondelette de Shannon est un exemple d'ondelette construite dans le domainefréquentiel.

C. Les ondelettes B-splines

Les ondelettes B-spline représentent une généralisation de l'ondelette de Shannon. Elles sontdéfinies en association avec un ensemble de fonctions θm (la fonction B-spline d'ordre m), définiesselon :

Haar

Imag(Haar^)

Page 65: carte - representations temps - frequences ENSIETA

4. Représentations temps-fréquence linéaires

ENSIETA, Janvier 2002Centre de Recherche "Extraction et Exploitation de l'Information en Environnements Incertains"

60

( ) ,....3,2,1;sin

=

=

∆m

tt

tm

m ππ

θ (4.49)

Dans le domaine fréquentiel, l'expression de ces fonctions est :

(4.50)

La fonction ondelette B-spline d'ordre m est définie, dans le domaine fréquentiel, selon :

mmmbc

Dg θτ γγˆˆ 1−

∆= (4.51)

τ est l'opérateur de translation et D - l'opérateur d'échelle.En utilisant les propriétés de la transformée de Fourier on trouve l'expression temporelle d'une

fonction ondelettes B-spline d'ordre m :

( )( )

mb

tjm

bm t

me

mtg c

=

π

πγγ πγ

sin2

2/1

(4.52)

L'intérêt pour les ondelettes B-spline est dû au compromis satisfaisant entre les localisationstemporelle et fréquentielle : comme observé sur la figure suivante l'ondelette B-spline estrelativement bien localisée en temps et en fréquence.

Figure 4.8. Exemple de fonction ondelette B-spline

D. L'ondelette de Morlet

Comme illustré dans les exemples précédents le choix d'une ondelette comporte un certaincompromis entre la localisation temporelle et fréquentielle. Dans ce contexte, une idée naturelle estd'utiliser la fonction gaussienne (le meilleur compromis entre les résolutions temporelle etfréquentielle - voir le sous-chapitre précédent) modulée, pour couvrir la bande de fréquence désirée,qui est déterminée selon la relation :

( )∫= γγγγ dg Morletb ˆ2 (4.53)

L'expression analytique de l'ondelette de Morlet est :

( ) ( )bc ttj

bMorlet etg γπγ

πγ/2 21 −⋅= (4.54)

La transformée de Fourier de l'ondelette de Morlet s’écrit (exercice 11.d.) :

[ ) [ ) [ )2/1,2/12/1,2/12/1,2/1 1*...1*1ˆ−−−=mθ

m fois

B-spline : γc=0.14; γb=0.2; m=2

Temps

Fréquence

TF de B-spline

Page 66: carte - representations temps - frequences ENSIETA

4. Représentations temps-fréquence linéaires

ENSIETA, Janvier 2002Centre de Recherche "Extraction et Exploitation de l'Information en Environnements Incertains"

61

( ) ( )22ˆ cbeg Morlet

γγγπγ −−= (4.55)

Cette ondelette n'a pas une moyenne nulle, donc, pour l'utilisation de celle-ci il faudraeffectuer quelques modifications.

4.3.2. La transformée en ondelettes continue directe

La définition mathématique de la TOC, à partir des opérateurs introduits dans le chapitre 2,s’écrit :

Pour un espace de Hilbert H, la transformée ondelettes continue est une application Wg : H→Wg(H) parametrée par la fonction ondelette g. Plus rigoureusement, la transformée ondelettecontinue d’une fonction f∈ L2(R) est donnée par :

( ) ( )( )( )RLst

gg

gDff

RLWRLW

2,

: 22

τa→

(4.56)

où τtDsg est la version dilatée (par s) et translatée (par t) de g, écrit d'une manière explicite selon :

( )( ) ( )( )σστ −= tsgsgDst2/1

(4.57)

Ainsi, la TOC d'un signal mono-dimensionnel est une fonction bidimensionnelle des variablesréelles t et s et peut être écrite selon :

( )( ) ( ) ( )( )tgDtfgDfstfW sstg −==∆

**,, τ (4.58)

Pour des valeurs particulières de s et t la TOC associe au signal f une valeur numériquecomplexe qui décrit quantitativement la similarité entre ce signal et la version dilatée de s ettranslatée de t de l'ondelette g. En utilisant la relation (4.57), (4.58) peut être écrite d'une manièreintégrale selon :

( )( ) ( ) ( ) σσσ dtgfsstfWR

g ∫ −= *2/1, (4.59)

Selon l'équation (4.(8), la transformée Wgf peut être interprétée comme la sortie d'un bancinfini de filtres linéaires, décrits par la réponse impulsionelles Dsg* (figure 4.9).

Figure 4.9. La TOC vue comme la sortie d'un banc infini de filtres linéaires

Les propriétés de base de la TOC sont :

1. (Linéarité) ( )( )( ) ( )( ) ( )( ) ( ) ( )RLffRbastfWbstfWastbfafW ggg2

212121 ,,,)(;,,, ∈∀∈∀+=+

2. (Invariance en temps) ( )( )( ) ( )( )sbtfWstfW gbg ,, −=τ

3. (Dilatation) ( )( )( ) ( )( ) 0;,, 1 ≠= − asaatfWstfDW gag

La demonstration de ces propriétés est proposée à titre d’exercice (exercice 12).

4.3.3. La transformée ondelettes continue inverse

L'inversibilité de la TOC est une des plus importantes propriétés de celle-ci. L'idée pour lareconstruction à partir de TOC est basée sur l'interprétation de cette transformation comme la sortied'un banc infini de filtres linéaires décrits par leurs réponses impulsionelles Dsg*. D'une manière

Dsg*f (Wgf)(t,s)

Page 67: carte - representations temps - frequences ENSIETA

4. Représentations temps-fréquence linéaires

ENSIETA, Janvier 2002Centre de Recherche "Extraction et Exploitation de l'Information en Environnements Incertains"

62

alternative ce banc peut être décrit en terme de la réponse fréquentielle *ˆ1 gDs− . Pour déterminer

l'inverse de tout le banc de filtres, on suppose, tout d'abord, que ce banc est composé d'un seul filtre,ayant la réponse impulsionelle g. On suppose également que le support fréquentiel du signal f estentièrement inclus dans le support fréquentiel de g et que la transformée de Fourier de celle-cirespecte les conditions suivantes :• g est continue

• 0ˆ >> εg pour tout le support de f .

Dans ce cas, tous les signaux f peuvent être reconstruits à partir de la TOC (f∗g) selon :

( )

⋅⋅⋅⋅=∗∗= −

fsg

ggfTFhgff ˆupp2*1 1

ˆ

1ˆˆˆ (4.60)

où fg

gh ˆsupp2* 1

ˆ

1ˆˆ ⋅⋅=∆

représente le filtre inverse de g sur tout le support fréquentiel de f . Grâce

aux conditions imposées ci-dessus, le filtre h est bien défini. La figure suivante présente, de manièreschématique, l'implémentation d'un seul filtre inverse, suggérée par la relation (4.60).

Figure 4.10. L'implémentation du filtre inverse de g

Si on considère le cas d'un banc de filtres continus gs, indexés par s; on suppose quel'ensemble gs satisfait la condition suivante :

∞<∫< dsg s2ˆ0 (4.61)

En généralisant le concept présenté sur la figure 4.10., le banc inverse de filtres gs seraimplémenté selon le schéma présenté sur la figure suivante :

Figure 4.11. L'implémentation de la banque des filtres inverse

Dans le domaine fréquentiel cette procédure d'implémentation s'écrit selon :

( )∫ ∫=⋅= dsgfdsggfy sss2* ˆˆˆˆˆˆ (4.62)

Donc, f peut être obtenue par la division de y par ∫2ˆ sg . Cette opération est bien définie

car grâce à la condition (4.61), elle peut être interprétée comme un filtrage linéaire avec la réponseimpulsionelle donnée par h :

∫= −

dsgTFh

s2

1

ˆ

1(4.63)

Dans le cas de la TOC, l'expression de gs est donnée par gDg ss = et l'expression de laréponse impulsionelle du banc de filtres inverse devient :

f g g(-t) ( )21 ˆ −− gTF

g-1

f

f gs gs(-t)

=

−− ∫

121 ˆ dsgTFh s

gs-1

f∫ ds

Page 68: carte - representations temps - frequences ENSIETA

4. Représentations temps-fréquence linéaires

ENSIETA, Janvier 2002Centre de Recherche "Extraction et Exploitation de l'Information en Environnements Incertains"

63

∫=

dsgDTFh

s

21

ˆ

1

1

(4.64)

Le théorème suivant donne l'expression de la TOC inverse, dans le cas d'un signal à energiefinie.

Théorème 4.1. (TOC inverse) Soit F=Wgf la TOC d'un signal f∈L2(R) et g∈ L2(R)\0 telle que

( )∫ ∞<= −∆

R dgC γγγ 21 ˆ (4.65)

et l'application ( )( ) ( )RLRLWW gg221 : a− définie selon :

( ) ( )( )( )∫ ∫=

∫ =∗⋅=−

−∆

R R s

R sg

dsdgDsFC

dsgDsFCFW

στσ σ,

,1

11(4.66)

Alors FWf g1−= .

Demonstration :

La relation (4.58) s'écrit, dans le domaine fréquentiel, selon :( ) ( ) ( )( )γγ *ˆˆ,^ 1 gDfsfW

sg −⋅= (4.67)

En multipliant, les deux membres, par gDs

ˆ1− et, en intégrant pour toutes les échelles s, on

obtient :

( ) ( )( )( ) ( )

( ) ( )( ) ( )∫=

∫ ==

∫ =

⋅=∫

−=

−−

−−

R

su

R

R sss g

duuguf

dssgsf

dsgDfgDsfW

21

211

2^0

ˆˆ

ˆˆ

ˆˆˆ,

1

11

γ

γγ

γγγ

γ

(4.68)

A partir de cette relation on obtient la transformée de Fourier du signal de départ :( ) ( ) ( )( )( )∫= −

−R sg dsgDsfWCf γγγ ˆ,ˆ

1^1 (4.69)

En temps, cette relation devient :

( ) ( )( ) ( )( )( ) FWdstgDsfWCtf gR sg1

)65.4(1 , −− =∫ ∗⋅= (4.70)

En fait, la relation (4.65) et la condition auxiliaire C>0 (qui est verifiée par n'importe quellefonction différente de 0) représente la condition d'admissibilité qui garantit l'existence de la TOCinverse. D'une manière alternative, on peut dire que la TOC existe si le terme ( ) ( )RLg 22/1 ˆ ∈− γγ .

La relation (4.65) est verifié par toutes les fonctions pour lesquelles ( ) 00ˆ =g , donc toutes lesfonctions oscillantes. En conclusion, toutes les fonctions g∈L1(R) ⊂ L2(R) (absolument intégrable) àmoyenne nulle peuvent constituer des fonctions ondelettes pour lesquelles il est possible de définir laTOC inverse.

Page 69: carte - representations temps - frequences ENSIETA

4. Représentations temps-fréquence linéaires

ENSIETA, Janvier 2002Centre de Recherche "Extraction et Exploitation de l'Information en Environnements Incertains"

64

4.3.4. La discrétisation de la transformée en ondelettes continue

La transformée en ondelettes discrète (TOD) est générée par l'échantillonnage, dans le plantemps-échelle, de la TOC correspondante. Ainsi, la TOD est caractérisée par les deux éléments :

1. Une fonction ondelette d'analyse

Les aspects sur le choix de la fonction d'ondelette d'analyse ont été discutés dans les sectionsprécédents. Le critère de base est donné par la condition d'admissibilité. De plus, pour desapplications où la reconstruction est indispensable, on introduit la condition supplémentaired'orthogonalité ou de bi-orthogonalité.

2. Le réseau d'échantillonnage temps-échelle

L'existence de ce réseau est imposée par des nécessitées pratiques : la relation (4.58), quidonne l'expression de la TOC, ne peut être évaluée que avec une précision finie, associée aucalculateur. Par conséquent, il faudra restreindre le domaine continu de variation de t et s à un

ensemble discret ( ) nnm st ,,

∆=Γ qui va générer un ensemble "fini" d’ondelettes : gD

nnm st ,τ .

Théoriquement, on peut choisir n'import quel réseau d'échantillonnage, mais en pratique, pourassurer la reconstruction parfaite, on utilise un réseau d'échantillonnage dyadique (voir la figure4.12).

( ) Znmnn

D m ∈−

∆=Γ ,2,2 (4.71)

Figure 4.12. Réseau d'échantillonnage dyadique dans le plant temps-échelle

En conclusion, le terme transformation en ondelettes discrète est utilisé pour indiquer un typeparticulière d'échantillonnage de la TOC, qui satisfait les conditions suivantes :a. Le réseau d'échantillonnage temps-échelle doit être dyadique;b. La famille des ondelette ( ) Dstst gD Γ∈,τ doit former une base orthonormale pour l'espace

d'intérêt;c. L'ondelette d'analyse doit avoir un support compact (ainsi, toute la famille générée aura un

support compact).

Sous ces conditions, il existe un algorithme rapide (pyramidal) pour le calcul de la TOD, enutilisant uniquement des filtres de réponse impulsionelle finie. Cet algorithme sera détaillé dans lechapitre suivant.

Le fort intérêt pour la TOD est dû à deux facteurs majeurs. Premièrement, les coefficients issusde la TOD expriment la ressemblance entre le signal traité et les ondelettes associées, exactementcomme dans le cas de la TOC. De plus, le nombre des coefficients sera fini ce qui nous permetd'appliquer cette approche sur des systèmes numériques (ordinateurs, processeurs numériques du

Temps

Ech

elle

1 2 3

2021

22

23

Page 70: carte - representations temps - frequences ENSIETA

4. Représentations temps-fréquence linéaires

ENSIETA, Janvier 2002Centre de Recherche "Extraction et Exploitation de l'Information en Environnements Incertains"

65

signal etc). Deuxièmement, les conditions imposées ci-dessus nous assurent la reconstruction parfaitedu signal initial, à partir des coefficients de la TOD. Par conséquent, cette approche est bien adaptéepour des applications comme le débruitage ou la compression des données.

4.3.5. Le scalogramme. Comparaison entre la TFCT et la TOC

Dans le paragraphe (4.1) on a vu qu'à partir de la TFCT (qui peut être interprétée comme laprojection d'un signal sur un ensemble de fonctions de base) on peut générer une distributionénergétique du signal qu'on appelle le spectrogramme. Précédemment on a montré que la TOCreprésente aussi une projection du signal sur un ensemble des fonctions ondelettes.

Ainsi, la TOC peut se rattacher à l’analyse temps-fréquence en posant υυ

= 0a

, ce qui permet de

construire la scalogramme défini par :

( )2

0,),(

=

atfWt g

υυρ

(4.72)Pour comparaison avec la TFCT, on présente sur la figure suivante les bancs de filtres

correspondants à la TFCT et à la TO et, également, les pavages temps-fréquence correspondants.

Figure 4.13. Comparaison entre TFCT et TO

La différence principale avec la transformée de Fourier à court terme est que les résolutions nesont pas identiques en tous les points du plan temps-fréquence :

• dans le cas de changements brusques ou de structures très localisées, la transformée enondelettes existera essentiellement dans le domaine des petites échelles, aptes à « voir » desdétails fins du signal; cependant, puisque ces petites échelles sont traduites par une ondeletteanalysante de support temporel réduit, il s’en suit que son support fréquentiel est étendu, cequi limite la résolution fréquentielle absolue;

• réciproquement, une résolution fréquentielle importante n’est possible qu’avec une ondeletteanalysante longue, soit à de grandes échelles d’observation. Dans la zone du plan temps-fréquence où le gain en résolution fréquentielle est possible, celui-ci se fait donc encore audétriment de la résolution temporelle.

L’analyse en ondelettes présente cependant l’avantage de ne pas correspondre à une résolutionfixée a priori par le choix du signal élémentaire : c’est fondamentalement une analyse multi-échelles.

La propriété de base du scalogramme est la conservation de l'énergie du signal et s'écrit :

S( )υ

υ

a. Banc de filtres de TFCT : Largeur debande - constante

S( )υ

υ

c. Banc de filtres de TO : Largeur debande – croissante avec la fréquence

Temps

Fréq

uenc

e

Temps

Fréq

uenc

e

b. Le pavage T-F généré par TFCT d. Le pavage T-F généré par TO

Page 71: carte - representations temps - frequences ENSIETA

4. Représentations temps-fréquence linéaires

ENSIETA, Janvier 2002Centre de Recherche "Extraction et Exploitation de l'Information en Environnements Incertains"

66

( )( )∫ ∫ =∞∞−

∞∞− fg E

sds

dtstfW2

, (4.73)

Cette relation justifie l'attribut de "distribution énergétique du signal" dans le plan temps-échelle. Comme dans le cas du spectrogramme, le scalogramme est aussi affecté par le principed'incertitude. En fait, la résolution temporelle est proportionnelle à s et la résolution fréquentielle estinversement proportionnelle à s.

D’autres propriétés temps-fréquence de la TOC seront discutées dans le chapitre suivant. Parmicelles-ci, on peut citer la capacité d'analyser la régularité locale d'un signal, par rapport à la TF quipermet d'analyser globalement un signal donné. Cette propriété est induite par la plus importantecaractéristique d'une ondelette : le nombre de ses moments nuls.

4.3.6. La transformée ondelettes supracomplete

La Transformation par Ondelette Supracomplete (TOS) peut être obtenue, à partir de laTransformation en Ondelettes Continue (TOC), par une procédure d’échantillonnage différente decelle qui suit une répartition dyadique. L’implémentation de cette transformation est présentée sur lafigure suivante.

Figure 4.14. Implémentation de la TOS

L’idée de la TOS est de construire un banc de filtres, à partir de l’ondelette mère g et,contrairement à la TOD, on va concevoir ce banc dans le domaine fréquentiel, en utilisant latransformation de Fourier rapide (Fast Fourier Transform - FFT). Un exemple d’un tel banc, conçu àpartir de l’ondelette Morlet, est présenté sur la même figure. Le résultat de ce filtrage est similaire aurésultat d’une TOC. Pour obtenir la version discrète on choisit un réseau d’échantillonnagelogarithmique, avec un paramètre a0 qui contrôle le recouvrement entre les fonctions de transfert desfiltres et, mathématiquement, le degré de redondance de la transformation. Pour a0=2 on obtient laTOD.

L’élimination de la contrainte d’orthonormalité offre une large possibilité de choix de lafonction d’ondelettes, qui peut être bien adaptée sur la structure du signal. Les avantages de TOS – larobustesse contre le bruit et l’absence des termes d’interférence temps-fréquence – sont dus à un hautdegré de redondance, offert par la structure « cadre » de cette transformation. Ces avantages sontillustrés dans l’exemple présenté en figure 4.14 : pour un signal formé par 7 atomes, la TOS fournit

Signal d’analyse f

FFT(DSng)FFT(Ds2g)

FFT(DS1g)

Wgf - « Continuous » Wavelet Transform

Supra-échantillonage (Over Sampling)

( )

( ) DWT2apour;2,1a

asetnt

s,t

00

m0mn,m

mn,mn,m

−=∈

=∆=

TOS du signal f

Banc de filtres supracomplets (Morlet:a=1.5)Temps

Fréq

uenc

e

OCWT (Morlet: a0=1.5)

Page 72: carte - representations temps - frequences ENSIETA

4. Représentations temps-fréquence linéaires

ENSIETA, Janvier 2002Centre de Recherche "Extraction et Exploitation de l'Information en Environnements Incertains"

67

une RTF lisible, sans termes d’interférences. On a utilisé le banc de filtres présenté sur la mêmefigure.

Pour plus de détails, les lecteurs peuvent consulter la référence [4].Néanmoins, à cause du fait que la famille utilisée n’est pas orthogonale, on aura toujours des

problèmes de reconstruction. En conséquence, cette technique ne peut être utilisée que dans desapplications pour lesquelles la reconstruction n’est pas forcement nécessaire (par exemple, pour laclassification des signaux où on s’intéresse uniquement de l’extraction des caractéristiques du signal).

References

[1] S. Qian, D. Chen – “Joint Time-Frequency Analysis” , Prentice Hall, New Jersey, 1998[2] P. Flandrin – “Représentations temps-fréquence” , Ed. Hermes, Paris, 1993[3] L. Cohen – “Time-frequency analysis”, Prentice Hall, New Jersey, 1995[4] S. Mallat – “A Wavelet Tour of signal processing”, Academic Press, 1998[5] A. Theolis – “Computational Signal Processing with Wavelet ”, Birkhauser Press, Boston, 1998

Page 73: carte - representations temps - frequences ENSIETA

4. Représentations temps-fréquence linéaires

ENSIETA, Janvier 2002Centre de Recherche "Extraction et Exploitation de l'Information en Environnements Incertains"

68

Exercices et problèmes

1. (Les propriétés de la TFCT et du spectrogramme)

a) Identifier quelle est le modèle non-stationnaire adopté pour la construction de la TFCT (voir lasection 3.3).

b) Montrer que les marginales en temps et en fréquence du spectrogramme ont pour expression 4.7et 4.8.c) Justifier la propriété d’invariance par la translation temporelle et fréquentielle, dans le cas duspectrogramme.

2. (Calcul de la TFCT) Calculer l’expression de la TFCT d’une sinusoïde ( ) tjets 0ω= pour une

fenêtre gaussienne ( ) ( ) 2/4/1 2teath απ

−= . Le même exercice que 2 pour une impulsion à t=t0 :

( ) ( )02 ttts −= δπ .

3. (Calcul de la TFCT) Le même exercice pour une fenêtre rectangulaire

( ) 2/2/,1

TtTT

th ≤≤−= .

4. (Calcul du spectrogramme) On suppose la somme d’une sinusoïde et ‘une impulsion :( ) ( )020 ttets tj −+= δπω

En utilisant la fenêtre gaussienne ( ) ( ) 2/4/1 2teath απ

−= , donnez l’expression du

spectrogramme. Commentaires sur le choix de la fenêtre.

5. (Spectrogramme) Evaluer les distributions marginales à partir du spectrogramme d’un signal

chirp donnée par ( )

−=

2

20exp2

2tt

t

ets βω

α

en utilisant la fenêtre gaussienne definie dans

l’exercise 4.6. (Transformée de Gabor) Compte tenu des différences entre l'échantillonnage critique et le sur-

échantillonage, quel genre d'applications peut-on envisager à partir de chacun des cas?

7. (Transformée de Gabor) Montrer que la transformée de Gabor vérifie la propriété d'invariance.

8. (Transformée de Gabor) Quelles sont les différences majeures entre la décomposition en série deFourier et en série de Gabor?

9. (Transformée de Gabor) A partir de la relation (4.33), retrouver la version discrète de l'identité deWexler-Raz.

10. (Transformée de Gabor) On suppose la transformée de Gabor d'un signal chirp pour deux taux desur-échantillonage.

a) Quelle est la relation d'ordre entre a1 et a2 ?b) Est-ce que la représentation graphique des fonctions duales, dans ces deux cas, aurait-elle été

suffisante pour arriver à la même conclusion ?

Page 74: carte - representations temps - frequences ENSIETA

4. Représentations temps-fréquence linéaires

ENSIETA, Janvier 2002Centre de Recherche "Extraction et Exploitation de l'Information en Environnements Incertains"

69

11. (Exemples d' ondelettes) a) Calculer la transformée de Fourier de l'ondelette de Haar.Représentation graphique.

b) A partir de l'expression de la transformée de Fourier de l'ondelette de Shannon (4.47), calculer sonexpression temporelle.c) Mettre en évidence les différences entre ces deux fonctions.

12. (Transformée ondelette continue) Prouver les propriétés de linéarité, invariance et dilatation de laTOC.

13. (TOC inverse) Montrer que l'intégrale ( ) dssgsR

211 ˆ∫ −− γ ne dépend pas de s. Quelle est

l'importance de cette propriété ?

14. (Discrétisation de la TOC)

a) Ecrire l'expression générale de la fonction ondelette pour un réseau d'échantillonnage discret

nna ama ,−=Γ .

b) La propriété d'invariance est-elle conservée ?

c) Comparer l'expression obtenue au point a) avec celle d'une fonction de Gabor. A partir de cette

comparaison, quel est l'avantage des ondelettes par rapport aux atomes de Gabor ?

15. (Calcul de la TOC)

a) Calculer la TOC d'une impulsion définie par :

( ) [ ][ ]

∉∈

=baxbax

tx,,0,,1

b) Sur la figure suivante, mettre a et b aux bons endroits. Quelle est la signification des axes ?

16. (Calcul de la TOC) Montrer que la TOC d'une fonction Dirac δ(x0) vaut ( )( )txssg −0 (s – indice

d’échelle). Représentation graphique.

17. (TOS) Expliquer l'importance du degré de redondance dans le cas de TOS. Montrer, à partir du

banc de filtres présenté sur la figure 4.14, la signification physique de celui-ci.

Page 75: carte - representations temps - frequences ENSIETA

5. Analyse multirésolution et paquet d'ondelettes

ENSIETA, Janvier 2002Centre de Recherche "Extraction et Exploitation de l'Information en Environnements Incertains"

70

5ANALYSE MULTIRESOLUTION ET PAQUET D'ONDELETTES

5.1. Analyse Multi-résolution ([1], [3])

Il existe deux façons d'introduire les ondelettes : l'une à travers la transformation ondelettecontinue (présentée dans la section 4.3.), l'autre au travers l'analyse multirésolution. En effet, afind’assurer une représentation non-redondante du signal et la possibilité de le reconstruire parfaitementà partir de sa décomposition, Mallat et Meyer [1] ont mis au point en 1989 un outil très efficace ettrès flexible qui a engendré depuis un nombre impressionnant d’applications: l’analyse multi-résolution. Grâce à ce concept il a été possible l'implémentation pratique de la décomposition enondelette [2].

Pour mieux comprendre ce que l'on appelle Analyse Multi-résolution, prenons cet exemple :quelle est la longueur de la côte bretonne ? Nous pouvons prendre un globe, avec une règle on calculela distance et grace l'échelle de la carte on en déduit la longueur de la côte. Il s'agit d'une vision trèsgrossière de l'allure de la côte. Prenons maintenant une carte de France et on répète les mêmesopérations. On aura alors un aperçu beaucoup plus précis de la côte et de sa longueur. Si on prend unecarte de Bretagne, là encore notre vision de la côte sera bien plus fine. Finalement, on peut se rendresur le terrain et on aura la vision la plus fine qui soit pour calculer la longueur de la côte. Ainsi,d'échelle en échelle (mais nous préférons le terme de résolution), les détails viennent affiner notreimage de la côte, d'une vision grossière on passe à une vision fine et plus précise.

5.1.1. Définition et Propriétés de l'analyse multi-résolution

Mathématiquement, en analyse multi-résolution on cherche à écrire toutes fonctions f de L2

comme la limite d'approximations successives, chacune étant une version lissée de f, avec desfonctions lissées de plus en plus concentrées.

Définition 5.1.1.(Analyse Multi-résolution) Une suite ZjjV

∈de sous-espaces fermés de L2(R) est une

analyse multi-résolution si les 6 propriétés suivantes sont vérifiées :1. ( ) ( ) ( ) j

jj VktfVtfZkj ∈−⇔∈∈∀ 2,, 2 (5.1)

2. jj VVZj ⊂∈∀ +1, (5.2)

3. ( ) 12, +∈

⇔∈∈∀ jj V

tfVtfZj (5.3)

4. ( )RLVj

j2=

−∞=∪ (5.4)

5. 0=∞

−∞=∩

jjV (5.5)

6. Il existe 0V∈θ telle que ( ) Znnt ∈−θ soit une base de Riesz de V0.

Pour une meilleure compréhension, donnons les interprétations intuitives de ces propriétés.La première (relation 5.1) montre que Vj+1 est l'image de Vj par une dilatation d'un facteur 2;

autrement dit, il existe une grille fréquentielle sous-jacente en progression géométrique. La deuxième

Page 76: carte - representations temps - frequences ENSIETA

5. Analyse multirésolution et paquet d'ondelettes

ENSIETA, Janvier 2002Centre de Recherche "Extraction et Exploitation de l'Information en Environnements Incertains"

71

propriété (relation 5.2) montre que pour tout j, Vj+1 est un sous-espace de Vj, ce qui revient à direqu'un signal basse résolution est aussi un signal à haute résolution.

Les relations 5.4 et, respectivement, 5.5 montrent que l'intersection des Vj est réduite à 0 dansL2 (à résolution minimale, on perd toute l'image) et que la réunion des Vj est dense dans L2 (à larésolution infinie, on reproduit parfaitement tous les signaux). La condition (5.3) assure que lesespaces Vm correspondent à différentes résolutions tandis que l'invariance par translation :

( ) ZnVntfVf mm

m ∈∀∈−→∈ ,2 (5.6)

est une conséquence de 5.1.A partir de cette définition, on peut présenter dans la suite les propriétés de base de l'analyse

multi-résolution. Pour cela, on définit l'opérateur Pm de projection orthogonale sur Vm.

1. Orthogonalité et biorthogonalité. L'espace d'approximation

L'approximation de f à la résolution 2-j est définie comme la projection orthogonale fPjV sur

Vj. Pour calculer cette projection il faut trouver une base orthogonale de Vj. Le théorème suivantdonne le support pour l'othogonalisation de la base Riesz ( ) Znnt ∈−θ et pour la construction d'unebase orthogonale pour caque sous-espace Vj par la translation et la dilatation d'une seule fonction φ,appelée fonction d'échelle.

Théorème 5.1.(Mallat et Meyer) Soit ZjjV

∈une analyse multi-résolution et φ la fonction d'échelle

dont la transformée de Fourier vaut

( ) ( )

( )2/12

ˆˆ

∑ +

=∞

−∞=k kπωθ

ωθωφ (5.7)

Soit ( )

=jjnjnt

t22

1, φφ . La famille

Znnj ∈,φ est une base orthogonale pour Vj, quelque soit j∈Z.

La demonstration de ce théorème est donnée en [1, pag. 225].

A partir du résultat issu de ce théorème la projection orthogonale de f en Vj peut être écrite par:

∑=∞

−∞=nnjnjV fP

j ,,, φφ (5.8)

Le produit scalaire

[ ] ( ) ( )∫ =

−== ∞

∞− nfdtnt

tffna jjj

j

jnjj 2*2

2

2

1, *

, φφφ (5.9)

L'énergie de la transformée de Fourier φ est concentrée sur l'intervalle [-π;π], comme il estillustré sur la figure 5.1. pour une ondelette spline cubique.

Figure 5.1. Fonction ondelette spline cubique et sa transformée de Fourier

φ(t) TF φ(t)

Page 77: carte - representations temps - frequences ENSIETA

5. Analyse multirésolution et paquet d'ondelettes

ENSIETA, Janvier 2002Centre de Recherche "Extraction et Exploitation de l'Information en Environnements Incertains"

72

La transformée de Fourier ( )ωφ jj 2ˆ2 * de φj*(t) est essentiellement centrée en [-2-jπ ,2-jπ]. Par

conséquent, l'approximation discrète de aj[n] peut être interprétée comme le résultat d'un filtragepasse-bas du signal f échantillonné aux intervalles 2j.

Néanmoins, l'orthogonalité impose des contraintes qui peuvent ne pas être souhaitables. L'unedes plus importantes est qu'une fonction d'échelle φ orthogonale à support compact ne peut pas êtresymétrique et continue. La propriété de symétrie est utile pour l'analyse des signaux de longueur finie.Certaines de ces restriction (notamment sur la symétrie) peuvent être attenuées en utilisant desanalyses multirésolutions biorthogonales. Ainsi, une paire [(Vj),(V*

l)] d'analyses multirésolutionsforme un système biorthogonal si et seulement si

( ) ( )⊥⊕= *00

2 VVRL (5.10)

Alors V*0 admet une base de Riesz de la forme θ*(t-n), n décrivant Z, telle que les translatés de

θ et de θ* forment un système biorthogonal:

( ) ( ) knktkt −=−− δθθ *, (5.11)

On ne parle plus de base orthogonale, mais de base biorthogonale.

2. Construction et filtrage discret

Une analyse multi-résolution est entièrement caractérisée par la fonction d'échelle φ quigénère une base orthogonale pour tout l'espace Vj. La propriété (5.2) impose que jj VVZj ⊂∈∀ +1, .

En particulier 2-1/2φ(t/2) ∈V1⊂ V0 . Lorsque ( ) Znnt ∈−φ est une base orthonormale sur V0 on peutécrire :

[ ] ( )∑ −=

−∞=nntnh φφ

21

21

(5.12)

avec

[ ] ( )ntnh −

= φφ ,

21

21

(5.13)

L'expression (5.12) s'appelle l'équation d'échelle est montre que φ(t/2) est une combinaisonlinéaire des φ(t-n). La séquence h[n] peut être interprétée comme la réponse impulsionelle d'un filtrediscret.

Dans le domaine fréquentiel, (5.12) s'écrit selon :

( ) ( ) ( )ωφωωφ ˆˆ2

12ˆ h= (5.14)

pour ( ) [ ]∑=∞

−∞=

n

jnenhh ωωˆ . Pour p>0 quelconque la relation (5.14) s'écrit :

( ) ( ) ( )ωφωωφ ppp h −−+− = 2ˆ2ˆ2

12ˆ 1 (5.15)

Par substitution, on obtient :

( ) ( ) ( )ωφω

ωφ PP

p

ph −

=

∏= 2ˆ

2

2ˆˆ

1(5.16)

Si ( )ωφ est continue en ω=0 alors ( ) ( )0ˆ2ˆlim φωφ =−

+∞→

P

P et (5.16) devient :

( ) ( ) ( )0ˆ2

2ˆˆ

ωωφ

∏=

=

−P

p

ph(5.17)

Page 78: carte - representations temps - frequences ENSIETA

5. Analyse multirésolution et paquet d'ondelettes

ENSIETA, Janvier 2002Centre de Recherche "Extraction et Exploitation de l'Information en Environnements Incertains"

73

L'étude des filtres h conduisant à des approximations de multirésolution a donné lieu à denombreux et importants théorèmes. Le premier d'entre eux donne des conditions nécessaires etsuffisantes pour que h engendre une fonction d'échelle.

Théorème 5.2.(Mallat et Meyer) Soit φ ∈ L2(R) une fonction d'échelle intégrable. La série de Fourier

de [ ] ( ) ( )nttnh −= − φφ ,2/2 2/1 satisfait

( ) ( ) 2ˆˆ,22

=++∈∀ πωωω hhR (5.18)

et( ) 20ˆ =h (5.19)

Ainsi, si ( )ωh vérifie (5.18) et (5.19) et si les conditions suivantes sont verifiées :

− ( )ωh est périodique de periode 2π et différentiable au voisinage de ω=0 ;

− [ ]

( ) 0ˆinf2/,2/

>−∈

ωππω

h (5.20)

alors

( ) ( )

∏=

=

−P

p

ph

1 2

2ˆˆ ω

ωφ (5.21)

est la transformée de Fourier de la fonction d'échelle φ∈L2(R).

La demonstration de ce théorème est donnée en [1, pag. 229-234]. Ce théorème représente unrésultat fondamental dans le cadre de la problématique des ondelette et surtout, pour l'implémentationpratique des techniques d’ondelettes. En effet, en pratique, la fonction d'échelle sera remplacée par lescoefficients h[n]. De plus, comme on verra dans la section suivante, ceci permet d'implémenter latransformée en ondelettes et ses dérivées en utilisant une structure de banc de filtres.

La condition (5.18) signifie que h est un filtre miroir conjugué, qui sera défini dans la sectionsuivante. La condition (5.19) est une simple normalisation tandis que la condition (5.20) permet devérifier que la fonction définie par (5.21) est d'énergie finie.

3. La définition de la fonction ondelette. L'espace de détail

Les ondelettes orthogonales portent les détails nécessaires pour augmenter l'approximation dusignal. Les approximations de f à l'échelle 2j

et 2j-1 sont respectivement égales à leurs projections surVj et Vj-1. On sait que Vj est inclus dans Vj-1. Soit Wj la partie complémentaire de Vj dans Vj-1 :

jjj WVV ⊕=−1 (5.22)

La projection orthogonale de f sur Vj-1 peut être décomposée comme la somme des projectionsorthogonales sur Vj et Wj :

fPfPfPjjj WVV +=

−1(5.23)

La projection fPjW donne les détails de f qui apparaissent à l'échelle 2j-1 mais qui

disparaissent à l'échelle 2j. Le théorème suivant prouve que on peut construire une base orthogonal deWj par la translation et la modification d'échelle d'une ondelette ψ.

Théorème 5.3.(Mallat et Meyer) Soit φ une fonctions d'échelle et h – la reponse impulsionnelle dufiltre miroir conjugué. Soit ψ une fonction dont la transformée de Fourier est donnée par

( )

=

21

ˆω

φω

ωψ g (5.24)

Page 79: carte - representations temps - frequences ENSIETA

5. Analyse multirésolution et paquet d'ondelettes

ENSIETA, Janvier 2002Centre de Recherche "Extraction et Exploitation de l'Information en Environnements Incertains"

74

avec( ) ( )πωω ω += − *ˆˆ heg i (5.25)

Soit

( )

−= j

j

jnjnt

t2

2

2

1, ψψ (5.26)

Pour chacune des échelles 2j, Znnj ∈,ψ est une base orthonormale de Wj. Pour toutes les échelles

2),(, Znjnj ∈ψ est une base orthonormale de L2(R).

La demonstration de ce théorème (voir [1, pag. 236]) est basée sur le lemme suivant.

Lemme 5.1. La famille Znnj ∈,ψ est une base orthonormale pour Wj si et seulement si

( ) ( ) 2ˆˆ 22=++ πωω gg (5.27)

et( ) ( ) ( ) ( ) 0ˆˆˆˆ ** =+++ πωπωωω hghg (5.28)

Un des résultats issu de ce théorème est que g est la transformée de Fourier de :

[ ] ( )ntt

ng −

= φψ ,

221

(5.29)

qui représente les coefficients de la décomposition de

[ ] ( )∑ −=

−∞=nntng

tφψ

221

(5.30)

En prenant la transformée de Fourier inverse de (5.25) on obtient :[ ] ( ) [ ]nhng n −−= − 11 1 (5.31)

Le filtre miroir défini par cette relation joue un rôle important dans la définition de latransformation en ondelette rapide.

Le théorème 5.3. représente un outil de base efficace pour la construction des basesorthogonales à partir des coefficients du filtre miroir conjugué. Dans la section suivante on présenteles classes de bases d'ondelettes et, pour chacune des classes, on verra comment il est possible deconstruire ( )ωh pour des paramètres qui seront imposés.

5.1.2. Les classes de bases ondelettes

Il existe plusieurs applications de bases d'ondelette qui exploitent leurs capacité d'approximerles classes des fonctions particulières par quelques coefficients ondelette différents de 0. A titred’exemple on peut citer la compression ou le debruitage des signaux. Ainsi, la construction de ψ doitêtre optimisée pour produire un nombre maximal de coefficients qui sont proches de 0. Ceci dépendseulement de quelques paramètres : la régularité de f, le nombre des moments nuls de ψ et la taille deson support [1]. Par la suite on décrira les contraintes qu'il faut imposer à ( )ωh pour pouvoirconstruire une fonctions ψ adaptée à l'application souhaitée.

• Moments nuls ("Vanishing Moments")

Par définition, une fonction ψ a p moments nuls si

( )∫ ≤≤=∞

∞−pk0pour 0dtttkψ (5.32)

Page 80: carte - representations temps - frequences ENSIETA

5. Analyse multirésolution et paquet d'ondelettes

ENSIETA, Janvier 2002Centre de Recherche "Extraction et Exploitation de l'Information en Environnements Incertains"

75

c'est-à-dire que ψ est orthogonale à tous les polynômes d'ordre p (exercice 3). Dans [1, section 6.1.3.]il est montré que si f est régulière et si ψ a un nombre suffisant de moments nuls, les coefficients

deduits du produit scalaire njf ,,ψ sont petits à l'échelle 2j. En effet, si f est localement dérivable

d'ordre k, alors sur un petit intervalle, elle peut être approximée par des polynômes de Taylor d'ordrek. Puisque pour k<p, les ondelettes sont orthogonales à ces polynômes de Taylor, alors on obtiendrade coefficients de petite valeur à cette échelle et, d'ici, l'intérêt d'avoir des ondelettes avec un nombreimportant de moments nuls.

Le théorème suivant met en évidence la correspondance entre les moments nuls de ψ et lesdérivées nulles de ( )ωψ à ω = 0 et du nombre de 0 de ( )ωh à ω = π . Il montre également que lespolynômes d'ordre p-1 sont générés par les fonctions d'échelle.

Théorème 5.4. (Moments nuls) Soit ψ et φ une fonction ondelette et une fonction d'échelle qui génère

une base orthogonale. On suppose que ( ) ( )

+=

−− 12/21p

tOtψ et ( ) ( )

+=

−− 12/21p

tOtφ . Les

quatre conclusions suivantes sont équivalentes :(i) L'ondelette ψ a p moments nuls.(ii) ( )ωψ et ses premières p-1 dérivées sont nulles à ω=0.

(iii) ( )ωh et ses premières p-1 dérivées sont nulles à ω=π .(iv) Pour tout 0≤k<p,

( ) ( ) k ordred' polynomeun est ∑ −=∞

−∞=n

kk ntntq φ (5.33)

La demonstration de ce théorème est proposée comme exercice (exercice 7).La proposition (iv) est appelée la condition de Fix-Strang; elle prouve que ψ a p moments nuls

si et seulement si tous les polynômes d'ordre p-1 peuvent être écrits comme une expansion linéaire de( ) Znnt ∈−φ .

• La taille du support

Si une fonction f a une singularité isolée à t0 (elle n'est pas définie en ce point) et si t0

appartient au support de ( )

−= j

j

jnjnt

t2

2

2

1, ψψ , alors njf ,,ψ peut avoir une amplitude

importante. Si ψ a un support compact de taille K, à chaque échelle 2j, il existe K ondelettes ψ j,n pour

lesquelles leurs supports incluent t0. Ainsi, pour réduire le nombre de coefficients à grande amplitudeil faut réduire la taille du support de ψ. La proposition suivante assure la liaison entre la taille dusupport de h et le support de φ et ψ.

Proposition 5.1.(Support compact) La fonction d'échelle φ a un support compact si et seulement si lesupport de h est compact. Dans ce cas, leurs supports seront les mêmes. Si le support de h et φ est[N1,N2] alors le support de ψ est [(N1-N2+1)/2,(N2-N1+1)/2].

La demonstration de ce théorème est également proposée comme exercice 8. Si h a une réponse implusionelle finie sur [N1,N2], la proposition 5.2. prouve que le support de

ψ a une taille de N2-N1 , centré en 1/2. Du point de vue pratique, pour minimiser la taille du supportles filtres miroir conjugués doivent avoir un nombre de coefficients non-nuls plus petit possible.

La taille du support d'une fonction et son nombre de moments nuls sont, en général, desnotions indépendantes. Mais dans le cas des ondelettes orthogonales, on peut montrer (théorème 5.5)que si ψ a p moments nuls alors la borne inférieure de la taille du support vaut 2p-1. Ainsi, laconstruction d'une ondelette comporte un compromis entre la taille du support et le nombre de

Page 81: carte - representations temps - frequences ENSIETA

5. Analyse multirésolution et paquet d'ondelettes

ENSIETA, Janvier 2002Centre de Recherche "Extraction et Exploitation de l'Information en Environnements Incertains"

76

moments nuls. Il existe plusieurs familles d'ondelette qui essaient de minimiser les effets de cecompromis. La famille d’ondelettes de Daubechies ([3]), par exemple, est optimale au sens où ellesont un support minimal pour un nombre de moments nuls donné.

En fait, le choix optimal d'une famille d'ondelettes suppose avoir une connaissance à priori surla structure du signal : si f a quelques singularités isolées et elle est très régulière entre ces singularitésalors il faudra choisir une ondelette avec un nombre important de moments nuls pour générer ungrand nombre de petits coefficients.

• Régularité

La propriété de régularité de ψ agit sur l'erreur introduite par le seuillage ou la quantificationdes coefficients d’ondelette. Quand on reconstruit un signal, pour faire la compression, par exemple,on utilise les coefficients d’ondelette selon

∑ ∑=∞

−∞=

−∞=j nnjnjff ,,, ψψ (5.34)

Une petite modification ε des coefficients njf ,,ψ engendre une modification εψ j,n sur le

signal reconstruit. Si ψ est une forme lissée, l'erreur sera aussi lissée (par le terme forme "lissée" onentend une fonction multiple différentiable, avec des dérivées continues). Ainsi, pour des applicationscomme le débruitage ou la compression il faudra mieux choisir une ondelette lissée qu'une formediscontinue, comme l'ondelette de Haar, par exemple.

Dans le paragraphe suivant présente les principales types des ondelettes et leurs propriétés.Les expressions fréquentielles de ces ondelettes seront déduites à partir de la relation de base, fourniepar le théorème 5.3. :

( )

+

−=

=

2exp

2

12

ˆ2

ˆ2

1ˆ * ω

φπωωω

φω

ωψ hj

g (5.35)

1. Les ondelettes de Shannon, Meyer et Battle-Lemarié

L'ondelette de Shannon est construite à partir de l'analyse multi-résolution qui approxime lesfonctions par leurs restrictions aux intervalles basses fréquences, pour [ ]ππφ ,-1=ˆ et

( ) [ ]2/2/2ˆππω ,-1=h pour ω ∈[-π ,π] et à partir de (5.35), on trouve :

( ) ( ) [ ] [ ] ∪∈−

=autrement ,0

2,,-2- si,2/expˆ

ππππωωωψ

j(5.36)

et par la transformée de Fourier inverse on obtient :

( ) ( )( )

( )( )2/1

2/1sin2/12

2/12sin−

−−

−−

=t

tt

tt

ππ

ππ

ψ (5.37)

Cette ondelette est infiniment dérivable mais son enveloppe décroît selon la loi 1/t à l'infini( ( )ωψ n'est pas continue en ±π et ±2π) ce qui n'est pas acceptable ni en accord avec la propriété de lataille de support, qu'on souhaite être le plus petit possible.

L'ondelette de Meyer est une fonction de bande fréquentielle limitée dont la transformée deFourier est plus lissée que celle de l'ondelette de Shannon. Cette caractéristique lissée assure unedécroissance plus rapide en temps, et représente un avantage par rapport aux ondelettes de Shannon.La figure suivante met en évidence ces différences.

Page 82: carte - representations temps - frequences ENSIETA

5. Analyse multirésolution et paquet d'ondelettes

ENSIETA, Janvier 2002Centre de Recherche "Extraction et Exploitation de l'Information en Environnements Incertains"

77

Figure 5.2. Les ondelettes de Shannon et de Meyer

Les ondelettes de Meyer (figure 5.2.b) sont construites à partir des filtres miroir conjuguésdonnés par :

( ) [ ][ ] [ ]

∪∈∈

=ππππω

ππωω

/3,2/3,-2- si,0/3/3,- si,2

h (5.38)

Le seul degré de liberté est la forme de ( )ωh dans les bandes de transitions [-2π/3,-π/3]∪[π/3,2π/3] .

La fonction d'échelle correspondante à cette ondelette ( ) ( )∏=+∞

=

−−

1

1 2ˆ2ˆp

ph ωωφ a un support

compact et on peut montrer que :

( ) ( )

>≤

=−

3/4 si0,3/4si,2/ˆ2ˆ

2/1

πωπωω

ωφh

(5.39)

On peut egalement montrer qu'en utilisant la relation (5.35), la fonction ondelette sera donnéepar :

( ) ( )( ) ( )

>≤≤−≤≤

= −

3/8 si 03/8/34 si 4/ˆ2/exp23/4/32 si ,2/ˆ2

3/2 si 0

ˆ 2/1

1/2-

πωπωπωωπωπω

πω

ωψhj

g(5.40)

Les fonctions φ et ψ sont infinitivement dérivables grâce aux supports compacts de leurstransformées de Fourier. Lorsque ( ) 0ˆ =ωφ au voisinage de ω=0 toutes ses dérivées sont 0 pour ω=0,ce qui prouve que ψ a une infinité de moments nuls.

a. Ondelette de ShannonTemps

ψ(t)ψ^(ω)

Fréquence

ψ(t) ψ^(ω)

FréquenceTemps b. Ondelette de Meyer

Page 83: carte - representations temps - frequences ENSIETA

5. Analyse multirésolution et paquet d'ondelettes

ENSIETA, Janvier 2002Centre de Recherche "Extraction et Exploitation de l'Information en Environnements Incertains"

78

Les discontinuités de la dérivée d'ordre (n+1) de ( )ωh sont localisées autour des transitions de

bande 3/2,3/ ππω = ; dans ce cas, on peut montrer qu'il existe A tel que :

( ) ( ) ( ) ( ) 111et 1

−−−−+≤+≤

nntAttAt ψφ (5.41)

Cette relation nous assure une décroissance rapide de l'ondelette ce qui réduit la taille dusupport (avantage par rapport aux ondelettes de Shannon).

Les ondelettes de Meyer-Lemarié sont basées sur les polynômes splines; les expressionsanalytiques de la fonctions d'échelle et du filtre miroir conjugué sont :

( ) ( )( )ωω

εωωφ

221

expˆ+

+−

=m

m S

j(5.42)

avec

( )( )

∑+

=∞

−∞=k nnk

Sπω

ω2

1(5.43)

et, respectivement

( ) ( )( )ω

ωεωω

222expˆ

2212

22

++

+

=m

mm

S

Sjh (5.44)

où ε=0 si m est impair et ε=1 si m est pair.Dans ce conditions, en utilisant (5.35) on trouve l'expression de la TF de l'ondelette :

( ) ( ) ( )( ) ( )2/

2/2/expˆ

2222

221 ωω

πω

ω

εωωψ

++

++

+−=

mm

mm SS

Sj(5.45)

Cette relation montre que l'ondelette ψ détroit d'une manière exponentielle. De plus, commecette ondelette est générée à partir d'un polynôme spline d'ordre m, elle sera (m-1) dérivable et sesdérivées seront continues.

Sur la figure 5.3. on présente la forme temporelle de la fonction d'échelle et d'ondelette pourm=1 et m=3 (m - l'ordre du polynôme).

Figure 5.3. Exemples des ondelettes de Battle-Lemarié

φ(t)- m=3

φ(t) - m=1 ψ(t)- m=1

ψ(t)- m=3

Page 84: carte - representations temps - frequences ENSIETA

5. Analyse multirésolution et paquet d'ondelettes

ENSIETA, Janvier 2002Centre de Recherche "Extraction et Exploitation de l'Information en Environnements Incertains"

79

L'avantage de ce type d’ondelettes, par rapport aux celles de Meyer ou de Shannon, est ladécroissance rapide en temps.

2. Les ondelettes à support compact de Daubechies [3]

Les ondelettes de Daubechies sont optimales au sens de la taille du support pour un numbre demoments nuls donné. La proposition 5.1. prouve que les ondelettes de support compact sontconstruites avec des filtres miroir conjugués de réponse impulsionelle finie. On considère un filtreréel causal h[n] de transformée de Fourier h :

( ) [ ]∑=−

=

−1

0

ˆ N

n

jnenhh ωω (5.46)

Pour assurer que ψ a p moments nuls, le théorème 5.4. prouve que h doit avoir un zéro d'ordrep (la dérivée d'ordre p doit avoir un zéro) à ω=π . Une expression qui satisfait cette demande est basée

sur les polynômes ( )pje π−+1 et peut être écrite selon :

( ) ( )ωω

ω jpj

eRe

h −−

+=

21

2ˆ (5.47)

La difficulté est de construire le polynôme R de degré minimal m tel que :

( ) ( ) 2ˆˆ 22=++ πωω hh (5.46)

Le théorème suivant prouve que le degré minimal de R est m=p-1.

Théorème 5.5. (Daubechies) Un filtre miroir conjugué réel h, tel que ( )ωh a p zéros à ω=π , a aumoins 2p coefficients non-nuls. Les filtres de Daubechies ont 2p coefficients non-nuls.

ProuveLa demonstration de ce théorème représente également la méthode pour la construction des filtres ondelettes de

Daubechies.

Lorsque h[n] est réel, ( ) 2ˆ ωh est une fonction paire elle peut être décomposée en série de cosω. Ainsi, R définie

en (5.47) est un polynôme en cosω qui peut également être écrit comme un polynôme

2sin 2 ω

P :

( )

=

2sin

2cos2ˆ 2

22 ωωω Ph

p

(5.47)

Dans ce cas, la condition de quadrature (5.46) devient :

( ) ( ) ( ) 111 =−+− yPyyPy pp pour tout [ ]1,02

sin 2 ∈=ω

y (5.48)

Pour minimiser le nombre de termes non-nuls de la série finie de Fourier ( )ωh , il faut trouver la solutionP(y)>0 de degré minimal, qui est obtenue par le théorème suivant :Théorème 5.6. (Bezout) Soit Q1(y) et Q2(y) deux polynômes de degrés n1 et n2 qui ont des zéros différents, il existe alorsdeux polynômes uniques P1(y) et P2(y) de degrés n1-1 et n2-1 tel que

( ) ( ) ( ) ( ) 12211 =+ yQyPyQyP (5.49)

Lorsque Q1(y)=(1-y)p et Q2(y)=yp sont deux polynômes (avec des zéros différents) de degrés

identiques p, conformément à ce théorème, il existe deux polynômes P1(y) et P2(y) telle que :( ) ( ) ( ) 11 21 =+− yPyyPy pp (5.50)

où P2(y)=P1(1-y)=P(1-y) avec

( ) ∑

+−=

=

1

0

1p

k

kyk

kpyP (5.51)

Page 85: carte - representations temps - frequences ENSIETA

5. Analyse multirésolution et paquet d'ondelettes

ENSIETA, Janvier 2002Centre de Recherche "Extraction et Exploitation de l'Information en Environnements Incertains"

80

Il faut maintenant construire le polynôme de degré minimal ( ) ( )∏ −=∑==

=

−− m

k

jk

m

k

jkk

j earereR0

00

1 ωωω tel

que ( )

=−

2sin 22 ωω PeR j . Lorsque les coefficients sont réels, ( ) ( )ωω jj eReR =−* , on peut écrire :

( ) ( ) ( ) ( )ωωω

ωωω jjj

jjj eQee

PeReReR −−

−− =

−−==

422

(5.52)

Cette factorisation est résolue par la généralisation de cette relation dans tout le plancomplexe, avec la variable ωjez −= :

( ) ( ) ( )( ) ( )

−−==∏ −−=

=

−−

42

111

0

120

1 zzPzQzazarzRzR

m

kkk (5.53)

Le calcul de R revient à calculer les racines ck de Q(z). Comme les coefficients de Q(z) sontréels et comme Q(z) est une fonction de z+z-1,( c*

k, 1/ck et 1/ c*k ) sont aussi les racines de Q(z). Pour

construire R(z) qui satisfait (5.53), chaque racine ak de R(z) sera soit ck, soit 1/ck.Cette procédure fournie un polynôme de degré m=p-1 avec r2

0=Q(0)=P(1/2)=2p-1. Le filtrecorrespondant h de taille minimale a N=p+m+1=2p coefficients non-nuls.

Parmi toutes les factorisations possibles, la solution de phase minimale ( )ωjeR est obtenuepour 1≤ka .

Cette démonstration constitue une méthode pour le calcul des coefficients des filtres« ondelettes de Daubechies » de taille 2p. Le tableau suivant présente les coefficients des filtres deDaubechies pour p variant de 2 à 9.

Tableau 5.1. Les coefficients des filtres Daubechies pour p=2-9

La proposition suivante présente le cadre pour le calcul des ondelettes de Daubechies à partirde ces coefficients.

Page 86: carte - representations temps - frequences ENSIETA

5. Analyse multirésolution et paquet d'ondelettes

ENSIETA, Janvier 2002Centre de Recherche "Extraction et Exploitation de l'Information en Environnements Incertains"

81

Proposition 5.2. Si φ(t) est une ondelette avec p moments nuls qui génère une base orthonormale surL2(R) alors elle a un support de taille minimale 2p-1. L'ondelette de Daubechies a un supportminimal [-p+1,p] et la fonction d'échelle correspondante a le support [0,2p-1].

Cette proposition est une conséquence du théorème 2.5. Sur la figure suivante on présente φet ψ pour p=4,6,8.

Figure 5.4. Les fonctions d'échelle et d'ondelette de Daubechies avec p moments nuls

La régularité de φ et ψ est identique car ψ(t) s'écrit comme la combinaison linéaire de φ(2t-n).Néanmoins, l'estimation analytique de cette régularité est difficile à estimer, mais, d'une manièreintuitive, on observe sur la figure 5.4. que la régularité est améliorée avec la croissance de p. Cecijustifie l'intérêt pratique pour cette famille d'ondelette.

Sur la même figure, on observe que ces ondelettes sont fortement non-symétriques ce qui peutintroduire une certaine erreur sur l'approximation d'un signal à partir de ces ondelettes. Ainsi,Symmlet a introduit une procédure optimale du choix des racines des polynômes R et Q qui génèrentles ondelettes Symmlet, caractérisées par une phase quasiment linéaire et une symétrie plusprononcée que dans le cas des ondelettes de Daubechies. Ceci est illustrée sur la figure suivante.

Figure 5.5. Les fonctions d'échelle et d'ondelette de Symmlet avec 8moments nuls

Une autre famille d’ondelettes, dérivée des concepts de Daubechies, et celle de Coiflet. Lafonction d'échelle de cette famille doit satisfaire les conditions suivantes :

( ) ( ) pk1pour 1et 1 <≤== ∫∫∞

∞−

∞−

dtttdtt kφφ (5.54)

p=6

ψ(t)

φ(t)

p=4

ψ(t)ψ(t)

p=8

φ(t)φ(t)

ψ(t) : p=8φ(t) : p=8

Page 87: carte - representations temps - frequences ENSIETA

5. Analyse multirésolution et paquet d'ondelettes

ENSIETA, Janvier 2002Centre de Recherche "Extraction et Exploitation de l'Information en Environnements Incertains"

82

Une telle forme de la fonction d'échelle est utile pour fournir une formule quadratique précise.Si f est k fois dérivable autour de 2Jn, avec k<p alors l'expansion de Taylor de f montre que

( ) ( )( )nOnff kJnJ

J 1,

2/ 22,2 +− +≈φ (5.55)

Ceci nous montre qu’à l'échelle 2J les coefficients d'échelle peuvent être approximés par leséchantillons correspondants du signal f, ce qui constitue un grand avantage, de point de vueimplementation. Néanmoins, ceci est au détriment de la taille du support qui devient 3p-1.

5.2. Les ondelettes et les bancs de filtres ([1])

Dans cette section on propose, à partir du concept d’analyse multi-résolution, un algorithmecascade pour le calcul des coefficients issus de la décomposition sur une base orhonormale d’ondelettes. Ainsi, on présente une procédure pour la synthèse des filtres utilisés dans cet algorithmeet, par la suite, on détermine les conditions qui doivent être imposées à cette structure pour que lareconstruction du signal soit parfaite.

5.2.1. La transformation ondelettes rapide – TOR (« Fast Wavelet Transform »)

Le calcul de cette transformation est basé sur une structure de banc de filtres, qui décomposesuccessivement chaque approximation P fVj

dans une approximation plus lissée P fVj +1et les

coefficients P fW j +1 correspondants à la différence d’information entre deux « versions » de f à deux

niveaux de résolution consécutifs.Lorsque φ j n n Z, ∈

et ψ j n n Z, ∈sont des bases orthonormales pour Vj et Wj les projections dans

ces espaces sont caractérisées par :

[ ] [ ]a n f d n fj j n j j n= =, ,, ,φ ψ et (5.56)

Le théorème suivant montre que ces coefficients sont calculés par une cascade deconvolutions discrètes et des procédures de sous-échantillonage. Le résultat ci dessous présente unegrande importance, car il nous fournit un outil pratique, très efficace, pour le calcul de la TFR.

Théorème 5.7. (Mallat) Les coefficients définis par (5.56) sont déterminés par :

[ ] [ ] [ ] [ ]a p h n p a n a h pj j jn

+=−∞

= − = ∗∑1 2 2 (5.57)

[ ] [ ] [ ] [ ]d p g n p a n a g pj j jn

+=−∞

= − = ∗∑1 2 2 (5.58)

A la reconstruction on a :

[ ] [ ] [ ] [ ] [ ] [ ] [ ]a p h p n a n g p n d n a h p d g pj jn

jn

j j= − + − = ∗ + ∗+=−∞

+=−∞

+ +∑ ∑2 21 1 1 1( (

(5.59)

(On a utilisé les notions suivantes : [ ] [ ]x n x n= − et

[ ] [ ](x nx p

=

,,

si n = 2psi n = 2p + 10

(5.60)

où x symbolise soit h, soit g).

Demonstration

A partir de la définition de l’analyse multi-résolution, toutes les fonctions φ j p j jV V+ +∈ ⊂1 1, peuvent être

décomposées sur une base orthonormale φ j n n Z, ∈ de Vj :

Page 88: carte - representations temps - frequences ENSIETA

5. Analyse multirésolution et paquet d'ondelettes

ENSIETA, Janvier 2002Centre de Recherche "Extraction et Exploitation de l'Information en Environnements Incertains"

83

φ φ φ φj p j p j n j nn

+ +=−∞

= ∑1 1, , , ,, (5.61)

Par changement de variable t’=2-jt-2p on obtient :

( )

( ) [ ]

φ φ φ φ

φ φ

φ φ

j p j n j

j

j j

j

j

t p t ndt

tt n p dt

tt n p h n p

+ +

+

+−∞

−∞

=−

=

=

− + =

=

− + = −

1 1

1

1

1

2

22

1

2

22

1

2 22

12 2

2 2

, ,

*

,

,

(5.62)

En remplaçant l’expression de φ φj p j n+1, ,, donnée par (5.62) en (5.61) on obtient :

[ ]φ φj p j nn

h n p+=−∞

= −∑1 2, , (5.63)

Si on remplace, dans la forme générale des coefficients aj[n] (5.56) les fonctions φj,n par l’expression (5.63) onretrouve l’expression (5.57).

Pour prouver l’expression (5.58) le calcul est similaire (ceci est proposé comme exercice).Pour prouver la relation (5.59) on utilise le fait que Wj+1 soit le complément orthogonal de Vj+1 en Vj ce qui

représente, en fait, l’union de deux bases φ j n n Z+ ∈1, et ψ j n n Z+ ∈1, . Ainsi, toute fonction φj,p peut être décomposée

sur cette base :

φ φ φ φ φ ψ ψj p j p j n j nn

j p j n j nn

, , , , , , ,, ,= ++ +=−∞

+ +=−∞

∑ ∑1 1 1 1 (5.64)

Si on introduit (5.62) et la relation similaire [ ]ψ φj p j n g n p+ = −1 2, ,, , on obtient :

[ ] [ ]φ φ ψj p j nn

j nn

h n p g n p, , ,= − + −+=−∞

+=−∞

∑ ∑2 21 1 (5.65)

Si on applique dans les deux membres de cette équation le produit scalaire avec f on retrouve directement larelation (5.59).

***Sur la figure suivante on présente, dune manière schématique, les opérations nécessaires pour

calculer les coefficients an et dn.

Figure 5.6. La transformation en ondelette rapide directe et inverse

aj h ↓2

g ↓2

aj+1

dj+1

h ↓2

g ↓2

aj+2

dj+2

a. TOR directe

aj+2 h↑2 h↑2

g↑2dj+2

aj+1

g↑2dj+1

aj

b. TOR inverse

Page 89: carte - representations temps - frequences ENSIETA

5. Analyse multirésolution et paquet d'ondelettes

ENSIETA, Janvier 2002Centre de Recherche "Extraction et Exploitation de l'Information en Environnements Incertains"

84

La représentation en ondelette orthogonale de a fL L n= , ,φ est composée par les

coefficients de détails de f aux échelles 2 2 2L j J< ≤ plus les coefficients d’approximation àl’échelle 2J :

d aj L j J J< ≤

, (5.66)

Le théorème 5.7. fournit une technique optimale, de point de vue implementation, pour lecalcul de la TOR. A partir d’un vecteur initial contenant 2N échantillons (en pratique, pour un tempsde calcul minimal, on préfère avoir des signaux d’une taille dyadique [1]), on crée deux sous-vecteursde 2N-1 échantillons. L’un est obtenu en filtrant passe-bas (avec le filtre h) et l’autre en filtrant passe-haut (avec le filtre g). On répète cette procédure sur la version passe-bas. Sur la figure suivante onprésente le cas d’un vecteur de N=23 échantillons.

Figure 5.7. La TOR pour un vecteur de N=23 échantillons

Sur la figure suivante on présente le résultat de la TOR sur 6 niveaux de décomposition, pourun chirp bruité.

Figure 5.8. La TOR d’un chirp bruité

gh

aaa daa

h g

aa0 aa1 da0 da1

gh

x0 x1 x2 x3 x4 x5 x6 x7

a0 a1 a2 a3 d0 d1 d2 d3

h : filtre passe-basg : filtre passe-haut

Vecteur original

aaa daa da0 da1 d0 d1 d2 d3 Vecteur transformé

Page 90: carte - representations temps - frequences ENSIETA

5. Analyse multirésolution et paquet d'ondelettes

ENSIETA, Janvier 2002Centre de Recherche "Extraction et Exploitation de l'Information en Environnements Incertains"

85

Sur cette figure on observe les détails à chaque niveau de décomposition et l’approximationsur le dernier niveau.

TOR 2D

Les notions définies ci-dessus peuvent être généralisées dans le cas bi-dimensionel. Ainsi,cette généralisation fournit un outil efficace pour le traitement des images, en utilisant les techniquespar ondelettes. Tous les aspects mathématiques sont décrits en [1, pag. 306-313] ; par la suite onprésentera brièvement les notions théoriques de base liées à la TOR 2D.

Dans le cas 2D, on parle de l’analyse multi-résolution séparable (généralisation de l’analysemulti-résolution 1D, [1]). En conséquence, les fonctions d’échelle et d’ondelette s’écrivent selon :

( ) ( ) ( )( ) ( ) ( ) ( ) ( ) ( ) ( )

Φ

Ψ

x s t

x s t s t s t

=

=

φ φ

ψ ψ ψ φ φ ψ, ,(5.67)

Les versions dilatées et translatées sont :( ) ( ) ( )

( ) ( ) ( ) ( ) ( ) ( ) ( ) Φ

Ψ

j k l j k j l

j k l j k j l j k j l j k j l

x s t

x s t s t s t

, , , ,

, , , , , , , ,, ,

=

=

φ φ

ψ ψ ψ φ φ ψ(5.68)

Sur la figure suivante on présente la fonction ondelette et échelle bi-dimensionelle, obtenues àpartir de l’ondelette de Daubechies d’ordre 4.

Figure 5.9. La transformée de Fourier des fonctions 2D ondelette et échelle de Daubechies, 4

Sur cette figure on remarque le caractère passe-bas 2D de la fonctions d’échelle et celui passe-haut de la fonction ondelette. Ceci nous permettra de définir la TOR2D en utilisant les filtres 2Dpasse-bas et passe-haut, définis de la même manière que les filtres 1D.

L’ensemble Φ Ψ0 0, , , , , ,,k l j k l j k l Z≥ ∈

forme une analyse multi-résolution séparable en 2D. Pour

effectuer une TOR 2D il existe deux méthodes :- La méthode du quinconce. Cette méthode consiste à utiliser des filtres de même dimension

que le signal à analyser. Le nombre d’opérations nécessaires au filtrage est assez important et,pour cette raison, on lui préfère bien souvent la deuxième méthode.

Page 91: carte - representations temps - frequences ENSIETA

5. Analyse multirésolution et paquet d'ondelettes

ENSIETA, Janvier 2002Centre de Recherche "Extraction et Exploitation de l'Information en Environnements Incertains"

86

- La méthode de la séparabilité du noyau. Elle consiste à réaliser une TOR 1D dans chacunedes dimensions du signal. Pour une image, on réalise donc une TOR sur chaque ligne puis uneTOR sur chaque colonnes. Un des avantages de cette méthode est qu’elle est directive enfréquence. Dans ce cas, les opérateurs « ondelette » de décomposition et de reconstruction 2Dont la structure définie sur la figure suivante :

Figure 5.10. Les opérateurs d’analyse et synthèse ondelettes 2D

La disposition des coefficients d’approximation et de détails, selon cette méthode, est illustréesur la figure suivante.

Figure 5.11. Dispositions spatiales des images issues par TOR 2D

h ↓2 h ↓2

g ↓2

g ↓2 h ↓2

g ↓2

aj+1aj

d j+11

d j +12

d j +13

aj

d j +12

d j +13 g

↑2

h↑2g

↑2

b. Opérateur de synthèse ondelette 2D

a. Opérateur d’analyse ondelette 2D

g↑2

aj+1

d j+11

h↑2h↑2

Colonnes Lignes

ColonnesLignes

d L+11 d L+1

3

d L+12

d L+ 21 d L+2

3

d L+22

d L+ 31 dL +3

3

dL +32aL+ 3

Page 92: carte - representations temps - frequences ENSIETA

5. Analyse multirésolution et paquet d'ondelettes

ENSIETA, Janvier 2002Centre de Recherche "Extraction et Exploitation de l'Information en Environnements Incertains"

87

Comme pour TOR 1D, si on a une image 2Nx2N, on ne peut faire au maximum que Ndécompositions. Dans le cas bi-dimensionnel, ces algorithmes doivent être modifiés pour ne paseffectuer la décomposition sur N niveaux de chaque ligne ou de chaque colonnes de l’image. Il suffitd’effectuer une décomposition et une seule par ligne et par colonne et par niveau. Puis onrecommence avec 2 fois moins d'échantillons par colonne et par ligne (donc 4 fois moinsd’échantillons au total).Sur la figure suivante on présente un exemple de TOR 2D sur 2 niveaux de décomposition.

Figure 5.12. La TOR 2D sur 2 niveaux de decomposition

5.2.2. Les bancs de filtres à reconstruction parfaite

La transformation par ondelette discrète rapide décompose les signaux en composants passe-bas et passe-haut sous-échantillonés d’un facteur 2. L’idée d’implémentation d’une telletransformation par un banc de filtres est apparue en 1976, quand Croisier, Esteban et Galand ontdécouvert qu’il est possible de réaliser la décomposition et la reconstruction par des filtres miroirquadratique. Le problème était que, hormis le filtre de Haar, les autres familles de filtres n’avaientpas une réponse impulsionelle finie, ce qui pouvait induire des distorsions non-linéaires, à cause de lacaractéristique de phase qui n’était pas linéaire. En 1984, Smith et Barnwell [6] ont trouvé lesconditions nécessaires et suffisantes pour obtenir les filtres à réponse impulsionelle finie orthogonauxqui assurent la reconstruction parfaite ; ils ont appelé ces filtres « filtres miroir conjugué ». Cetteapproche a été complétée par les équations biorthogonales de Vetterli. Dans la suite on présentebrièvement ces approches qui constituent la base pour le développement des applications pourlesquelles la reconstruction est souhaitée.

La notion de banque de filtres

Par définition, un banc de filtres à deux canaux réalise une convolution d’un signal a0 avec unfiltre passe-bas [ ] [ ]h n h n= − et un filtre passe-haut [ ] [ ]g n g n= − et un sous-échantillonage par 2, lesignal obtenu étant :

[ ] [ ] [ ] [ ]a n a h n d n a g n1 0 1 02 2= ∗ = ∗ et (5.69)

Le signal reconstruit est obtenu par le filtrage des signaux a1 et d1, étendus par zéro-padding,avec les filtres duaux passe-bas, ~h , et passe-haut, ~g , comme illustré sur la figure suivante.

Figure 5.13. Structure d’un banc de filtres d’analyse/synthese à deux canaux

a0[n]

h ↓2

g ↓2

a1[n]

d1[n]

↑2

↑2

~h

~g

[ ]~a n0

Disposition spatiale des sous-espaces

Niveau 1

Niveau 2

Les sous-espaces de l’image x

Page 93: carte - representations temps - frequences ENSIETA

5. Analyse multirésolution et paquet d'ondelettes

ENSIETA, Janvier 2002Centre de Recherche "Extraction et Exploitation de l'Information en Environnements Incertains"

88

Ainsi, le signal reconstruit peut être exprimé selon :[ ] [ ] [ ] [ ]~ ~ ~a n a h n d n g n0 1 1= ∗ + ∗( (

(5.70)

Par la suite, on va voir quelles sont les conditions nécessaires et suffisantes, imposées aux h,g, ~h , ~g pour garantir la reconstruction parfaite : ~a a0 0= .

• Sous-échantillonage et interpolation

Pour un signal x[n], dont la transformée de Fourier est ( ) [ ]$x x n e jn

nω ω= −

=−∞

∑ , la transformée de

Fourier de sa version sous-échantillonée y[n]=x[2n] peut être écrite par :

( ) [ ] ( ) ( )( )$ $ $y x n e x xj n

n2 2

12

2ω ω ω πω= = + +−

=−∞

∑ (5.71)

La composante ( )$x ω π+ introduit un pliage (folding) fréquentiel qui doit être annulé à lareconstruction.

L’insertion de zéros se définit :

[ ] [ ] [ ]y n x n

x p n= pn p

= == +

( si si

20 2 1

(5.72)

dont la transformée de Fourier est :

( ) [ ] ( )$ $y x n e xj n

nω ωω= =−

=−∞

∑ 2 2 (5.73)

Le théorème suivant donne les conditions biorthogonales de Vetterli [7] qui garantit que~a a0 0= .

Théorème 5.8. (Vetterli) Un banc de filtres défini selon (5.69) réalise une reconstruction parfaite siet seulement si :

( ) ( ) ( ) ( ) ,0~ˆ~ˆ ** =+++ ωπωωπω gghh (5.74)

et

( ) ( ) ( ) ( ) 2~ˆ~ˆ ** =+ ωωωω gghh (5.75)

Preuve

Tout d'abord, on exprime la transformée de Fourier de a1 et d1 à partir de la transformée de Fourier de a0. Comme

h et g sont réels, les fonctions de transfert de h et g sont respectivement données par : ( ) ( )ωω *ˆˆ hh =− et

( ) ( )ωω *ˆˆ gg =− . En utilisant (5.71) on obtient, à partir de (5.69), les relations suivantes :

( ) ( ) ( ) ( ) ( )( )πωπωωωω +++= *0

*01

ˆˆˆˆ21

2ˆ hahaa (5.76)

( ) ( ) ( ) ( ) ( )( )πωπωωωω +++= *0

*01 ˆˆˆˆ

21

2ˆ gagad (5.77)

Si on remplace dans la version fréquentielle de (5.70)

( ) ( ) ( ) ( ) ( )ωωωωω gdhaa ~2ˆ~2ˆ~

110 += (5.78)

les expressions de ( )ω2ˆ1a et ( )ω2ˆ1d données par (5.76) et (5.77), on obtient :

( ) ( ) ( ) ( ) ( ) ( ) ( ) ( ) ( ) ( ) ( )πωωπωωπωωωωωωω +

++++

+= 0

**0

** ˆ~ˆ~ˆ

21

ˆ~ˆ~ˆ

21~ agghhagghha (5.78')

Page 94: carte - representations temps - frequences ENSIETA

5. Analyse multirésolution et paquet d'ondelettes

ENSIETA, Janvier 2002Centre de Recherche "Extraction et Exploitation de l'Information en Environnements Incertains"

89

On observe, à partir de cette équation, que pour obtenir ~a a0 0= , quel que soit a0, les filtres doivent rejeter le

terme ( )πω +0a et assurer un gain unitaire pour ( )ω0a , ce qui justifie les relations (5.74) et (5.75).

***Le théorème 5.8. montre que les filtres de reconstruction h et g sont entièrement définis par

les filtres de décomposition h et g. Sous forme matricielle, on peut réécrire :

( ) ( )( ) ( )

( )( )

=

×

++ 02

~

~

ˆˆˆˆ

*

*

ωω

πωπωωω

gh

ghgh

(5.79)

L'inversion de cette matrice conduit à :

( )( ) ( )

( )( )

+−

+

∆=

πωπω

ωωω

hg

gh ˆ2~

~

*

*(5.80)

où ∆(ω) est le déterminant :( ) ( ) ( ) ( ) ( )ωπωπωωω ghgh ˆˆˆˆ +−+=∆ (5.81)

Les filtres de reconstruction sont stables si seulement si le déterminant est différent de 0 pourtout [ ]ππω ,−∈ .

• La réponse impulsionelle finie

Il existe deux motivations pour lesquelles on souhaite que les filtres de décomposition etreconstruction aient une réponse impulsionelle finie. Tout d'abord, une caractéristique de phaselinéaire assure l'absence des distorsions de phase. Deuxièment, comme on le montrera par la suite,dans le cas des filtres d'une réponse impulsionelle finie il est possible d'établir une relation simpleentre les filtres de décomposition et reconstruction.

Théorème 5.9. (Mallat) Les filtres à reconstruction parfaite satisfont

( ) ( ) ( ) ( ) 2~ˆ~ˆ ** =+++ πωπωωω hhhh (5.82)

Pour les filtres à réponses impulsionelles finies, il existe a∈ R et l∈ Z telles que :

( ) ( ) ( ) ( ) ( ) ( )πωωπωω ωω +=+= +−−+− *121*12 ˆ~et ~

ˆ heaghaeg ljlj (5.83)

Preuve

A partir de l'équation (5.80), on obtient :

( )( )

( ) ( )( )

( )πωω

ωπωω

ω +∆−

=+∆

= hggh ˆ2~et ˆ2~ ** (5.84)

En conséquence,

( ) ( ) ( )( )

( ) ( )πωπωω

πωωω ++

∆+∆

−= hhgg ˆ~~ˆ ** (5.85)

La définition (5.81) implique ( ) ( )ωπω ∆−=+∆ . En insérant (5.85) en (5.75) on obtient (5.82).

La transformée de Fourier de la réponse impulsionelle des filtres est une série finie en exp(±jnω). Le déterminant∆(ω) définit par (5.81) peut être aussi exprimé par une série de Fourier finie. De plus, (5.84) justifie que ∆-1(ω) doit êtreexprimé par une série de Fourier finie. En [1, pag.262] il est montré qu'une série finie en exp(±jnω) dont l'inverse est aussiune série finie doit avoir un seul terme . Cela prouve qu'il existe l∈ Z et a∈ R tel que :

( ) ( )[ ]ωω 12exp2 +−=∆ lja (5.86)

En introduisant cette expression en (5.84) on obtient (5.83).

Page 95: carte - representations temps - frequences ENSIETA

5. Analyse multirésolution et paquet d'ondelettes

ENSIETA, Janvier 2002Centre de Recherche "Extraction et Exploitation de l'Information en Environnements Incertains"

90

***Le facteur a est le gain et l est l'indice de décalage. Généralement, on prend a=1 et l=0 et,

dans le domaine temporel, (5.83) peut s'écrira selon :

[ ] ( ) [ ] [ ] ( ) [ ] 11~et 1~

1 11 nhngnhng nn −−=−−= −− (5.87)

Les deux paires de filtres (h,g) et ( )gh ~,~

jouent un rôle symétrique et peuvent être inversées.

• Les filtres miroir conjugués

Si on impose que le filtre de décomposition h soit égal à celui de reconstruction h~

alors (5.82)devient la conditions de Smith et Barnwell qui définit les filtres miroir conjugués :

( ) ( ) 2ˆˆ 22=++ πωω hh (5.88)

Les résultats présentés dans cette section fournissent la base pour l'implémentation pratique dela transformée en ondelette en utilisant une structure de banc de filtres.

5.3. Ondelettes biorthogonales [1]

La propriété d’orthogonalité, quoique requise pour certaines applications numériques, imposede fortes limitations sur la construction des ondelettes. En effet, on sait qu’il n’existe pas d’ondelettesà support compact, symétriques et orthogonales. En conséquence on a introduit la généralisation desondelettes biorthogonales. Il existe une fonction d’échelle duale φ~ et une fonction ondelette duale

ψ~ qui génèrent une analyse multirésolution avec les sous-espaces V j~ et W j

~ tels que

V j~ ⊥W j et V j ⊥W j

~ (5.89)

et par conséquent

W j~ ⊥W j pour j≠j (5.90)

Une analyse multirésolution duale n ‘est pas nécessairement la même que celle générée par lesfonctions primaires (sinon c’est une analyse orthogonale). Equivalent à (5.89), les fonctions dualesdoivent vérifier

)(,~)(,~

lxlx −=− φψψφ (5.91)

llx δφφ =− )(,~

et llx δφψ =− )(,~ (5.92)

En utilisant un argument d’échelle, avec lj,~φ et lj,

~ψ définis comme φ et ψ,

ZjjllZjll lljjljljllljlj ∈=∈= −−−''

,,'

,, ,,,,,~,,,,~

'''''' δδψψδφφ (5.93)

Les conditions de biorthogonalité sont alors

(5.94)

=++

=++

=++

=++

∈∀

∑∑

∑∑

k

k

k

k

kk

kk

kk

kk

R

1)2(~)2(~

1)2(~)2(~

1)2(~)2(~

1)2(~)2(~

πωψπωφ

πωφπωψ

πωψπωψ

πωφπωφ

ω

Page 96: carte - representations temps - frequences ENSIETA

5. Analyse multirésolution et paquet d'ondelettes

ENSIETA, Janvier 2002Centre de Recherche "Extraction et Exploitation de l'Information en Environnements Incertains"

91

Comme elles définissent une analyse multi-résolution les fonctions duales φ~ et ψ~ satisfont :

( ) ( ) ( ) ( )kxgxkxhxk

kk

k −∑=−∑= 2~~2~et 2

~~2

~φψφφ (5.95)

De même, on définit les fonctions de transfert h~

et g~ similaires à h et g . Les conditions(pour la reconstruction parfaite) nécessaires et suffisantes sont alors :

( ) ( ) ( ) ( )( ) ( ) ( ) ( )( ) ( ) ( ) ( )( ) ( ) ( ) ( )

=+++

=+++=+++=+++

∈∀

0ˆ~ˆ~0ˆ~ˆ~1ˆ~ˆ~1ˆ~ˆ~

**

**

**

**

πωπωωω

πωπωωωπωπωωωπωπωωω

ω

ghgh

hghggggghhhh

R (5.96)

ou

( )( ) ( ) 1~ *

=ωω tMM (5.97)

avec M la matrice du système :

( ) ( ) ( )( ) ( )

++

=πωωπωω

ωgghh

Mˆˆ

ˆˆ(5.98)

La résolution du système donne :

( ) ( )( )

( ) ( )( )ω

ωω

ω

πωω

*

*

*

* ˆ~;ˆ~

∆−=

+=

hg

gh (5.99)

où ∆(ω)=det(M(ω)).Les opérateurs de projection prennent alors la forme :

∑=∑=i

ljljii

ljlji ffQffP ,,,,~,et

~, ψψφφ (5.100)

De l'équation (5.100) on note que tous les coefficients d’ondelette sont calculés par φ~ pour Pjf

et ψ~ pour Qjf. Par conséquent, avec un φ~ simple, on peut calculer rapidement les coefficients. φ~ peutne pas être de grande régularité (par exemple, fonction de Haar). Ce manque de régularité seracompensé par φ et ψ, qui pourraient être des fonctions spline, comme on le verra par la suite. Il s'agitlà d'un très grand avantage procuré par ce type de filtres.

D'après (5.92), (5.93) et (5.94), on voit que( ) ( ) ( ) ( )kxlxgkxlxh lklk −−=−−= −− 2,~~et 2,

~~22 φψφφ (5.101)

De plus, en remarquant que φ(2x-k)∈V-1 on peut la décomposer sur V0 et W0 selon :( ) ( ) ( )∑ −+∑ −=− −−

llk

llk lxglxhkx ψφφ 22

~~2 (5.102)

On a la même chose avec φ~ car les fonctions primaires et duales sont interchangeables.Notons toutefois que le fait que la fonction échelle et la fonction ondelette ne soient pas

orthogonales ne signifie pas nécessairement que l'analyse multi-résolution ne soit pas orthogonale. Siles fonctions d'échelle et ondelette sont biorthogonales elles engendrent une analyse orthogonales. Onles appelle semi-orthogonales.

Les contraintes (5.96), en termes de filtres, s'écrivent :[ ] kl

nknlnknln gghh δ=∑ + +−+−−− 121222

~~~(5.103)

on a alors :( ) ( ) 1~et

~1 11

nn

nnn

n hghg −+

−+ −=−= (5.104)

et en utilisant la notation en z( ) ( ) ( ) ( ) 2

~~=−−+ zhzhzhzh (5.105)

ou

Page 97: carte - representations temps - frequences ENSIETA

5. Analyse multirésolution et paquet d'ondelettes

ENSIETA, Janvier 2002Centre de Recherche "Extraction et Exploitation de l'Information en Environnements Incertains"

92

0,2~

kn

knmhh δ=∑ + (5.106)

5.3.1. Ondelettes biorthogonales splines

Daubechies, Cohen et Feauveau ont développé des ondelettes biorthogonales à partir defonctions B-splines cardinales en dupliquant la construction de φ et ψ du cas orthogonal. Dans leurcas, on a ∆(ω)=e-jω et par conséquent :

( ) ( ) ( ) ( )πωωπωω ωω +−=+−= −− ** ˆ~et ~

ˆ hegheg jj (5.107)

On définit :( )

( ) ∑=

∑=

−−

−−

n

jnn

n

jnn

ehm

ehm

ω

ω

ω

ω

~2~

2

2/10

2/10

(5.108)

Dans le cas biorthogonal, il est possible de choisir m0 tel qu'il corresponde à un filtre à phaselinéaire, i.e. a une fonction d'échelle φ symétrique. Le filtre associé à m0 à phase linéaire est

( ) ( ) Zmem j ∈= λωω λω ,00 (5.109)

Pour hn réel, m0(-ω)=m0(ω) ou, d'une manière équivalente, on peut dire que m0(ω) est unpolynôme en cos(ω).

On a donc φ(x)= φ(-x) vu que φ est réel. Or, cette définition n'inclut pas le cas des filtres deHaar dont la fonction d'échelle φ est symétrique autour de x=1/2. Cela correspond à

( ) ( )ωω ω00 mem j=− (5.110)

ou, d'une manière équivalente,( ) ( ) ?em j cosen polynome 2/cos2/

0 ωω ω−= (5.111)

Nous désirons donc déterminer m0 et 0~m qui vérifient

( ) ( ) ( ) ( ) 1~~ 0*

00*

0 =+++ πωπωωω mmmm (5.112)

On arrive donc à la proposition suivante.

Proposition 5.3. Soit m0 un polynôme trigonométrique à coefficients réels satisfaisant (5.110), i.e. m0peut être écrit

( ) ( ) ( )ωωω χω cos2/cos 02/

0 pem Nj= (5.113)

avec p0(-1)≠0, χ=1 si N- nombre naturel impaire, 0 sinon. S'il existe des solutions 0~m à (5.112),

alors elles sont de la même forme que m0, i.e.

( ) ( ) ( )ωωω χω cos~2/cos~0

~2/

0 pem Nj= (5.114)

De plus, m0 et 0~m sont contraints par

( ) ( ) ( ) ( ) ( )∑ +

+−=

=

1

0

2200 cos2/sin2/sin

1cos~cos

k

n

knR

nnk

pp ωωωωω (5.115)

où kNN 2~

=+ et R est un polynôme impair.

Si on prend p0=1, R=0, il vient :

( ) [ ][ ]

[ ]

[ ][ ]

[ ]∑

+

=∑

+

=

+=

−=

−=−

−=

−− − 2/

2/

2/

2/0 2/

22/

22

1 NN

Nn

nNezNN

Nn

jnNNj

zNN

Ne

NN

Nem

jωω

ωω (5.116)

L'expression de m0 fait clairement apparaître les coefficients des zn comme ceux d'une B-spline.

Page 98: carte - representations temps - frequences ENSIETA

5. Analyse multirésolution et paquet d'ondelettes

ENSIETA, Janvier 2002Centre de Recherche "Extraction et Exploitation de l'Information en Environnements Incertains"

93

Le 0~m vérifiant (5.112), qui a la même symétrie que m0 est alors donné par

( ) ( ) ( )

+−=

=

− 1

0

22/0 2/sin

12/cos~ k

n

nNj

nnk

em ωωω χω(5.117)

Par conséquent, on en déduit les supports (compacts) de φ et φ~

( )

( )

++−

−−−−==

+−−==

2

~1,

2

~)1(~supp

~supp

2,

2suppsupp

0

0

χχφ

χχφ

Nk

Nkzm

NNzm

(5.118)

L'algorithme de génération des filtres h et h~

est présenté en [8, pag. 133].

5.3.2. Pseudo-coiflets (les ondelettes de Coiflet biorthogonales)

On peut se demander s'il ne serait pas plus facile de calculer des filtres biorthogonaux ayantles propriétés des coiflets; à savoir que φ à des moments nuls sauf le premier qui vaut 1. Cette idée apermis à Reissell de synthétiser ces filtres.

Avec les notations précédentes, soit ( ) ∑= −−

n

jnnehm ωω 2/1

0 2 , il doit vérifier

( ) ( ) ( ) ( ) ( )ωωωω ω22

20

22 cos1111 PLem NNj −+=−+= − (5.119)

( ) ( ) ( ) ( ) ( )ωωωω ω11

20

11 cos11 PLem NNj +=+= (5.120)

Ici P1 et P2 sont des polynômes en cosω . La parité des polynômes garantit la symétrie de lafonction φ résultante.

Egaliser ces deux équations revient à résoudre( ) ( ) ( ) ( ) 111 21 =−−+ xPxxPx NN (5.121)

où x=cosω et N=N1=N2. Ceci n'autre qu'une équation de Bezout (appelée "équation des coiflets") dont la solution est

( ) ( ) ( ) ( )∑ −+−

+−=

=

−− 1

01 112

12

N

k

kkkN xFxxk

kNxP (5.122)

où F est un polynôme impair arbitraire.Dans le cas des pseudo-coiflets, supposons qu'on demande une fonction d'échelle symétrique

au banc de synthèse, φ~ , et que l'on veuille trouver la fonction d'échelle correspondante φ au banc

d'analyse. Dans cet algorithme, on utilise deux polynômes trigonométriques P et P~ pour, φ et φ~

respectivement. L'équation est alors résolue pour P et P~ , convenablement factorisés. Reissell montreque connaissant P~ , on peut toujours trouver P vérifiant (5.121).

On définit les fonctions de transfert des filtres d'analyse et de synthèse, resp. m0 et 0~m

satisfaisant les 2N ou N~

2 premières conditions sur les moments (5.119) et (5.120) par

( ) ( ) ( ) ( ) ( ) ( )ωωωωωω PmPm NN ~cos1~,cos1

~

00 +=+= (5.123)

En posant x=cosω, il vient

( ) ( ) ( ) ( ) ( ) ( ) 1~1~1~~

=−−−−+ ++ xPxPxxPxPx NNNN (5.124)

Si ( )xP~ et ( )xP −~ n'ont pas de zéros commun, l'équation (5.124) admet une solution unique

de degré minimum(P(x),P(-x)) avec deg P=N+ N~

+deg P~ -1; cela vient du théorème de Bezout. Onmontre alors que si ( )xP~ est la solution de degré minimum (5.122) alors il existe P de degré

minimum tel que P et P~ satisfont l'équation de biorthogonalité (5.124). On a alorsdegP=3N-2 et deg P~ =N-1

Page 99: carte - representations temps - frequences ENSIETA

5. Analyse multirésolution et paquet d'ondelettes

ENSIETA, Janvier 2002Centre de Recherche "Extraction et Exploitation de l'Information en Environnements Incertains"

94

L'algorithme de génération des pseudo-coiflets est présenté en [8, pag. 134].Les propriétés des fonctions ondelettes obtenues sont les suivantes :

− Les pseudo-coiflets ( )ψφ , et ( )ψφ ~,~ sont symétriques;− Les pseudo-coiflets ψψ ~et ont 2N moments nuls, tout comme ;

− La longueur du filtre d'analyse h est 8N-3, celle du filtre de synthèse de h~

est 4N-1.

5.4. Analyse en paquets d'ondelette

5.4.1. Préliminaires

Au début de cette section on va faire un résumé concernant les idées et les principes de basequi ont été présentés dans les sections 5.1.-5.3. Ceci servira comme point de départ pour lesapproches qui seront introduites dans ce sous-chapitre.

Ainsi, on a vu qu'il existe deux façons d’introduire les ondelettes : l’une à travers latransformation d’ondelette continue (présentée aux sous-chapitre 4.3), l’autre à travers l’analysemultirésolution (sous-chapitre 5.1.).

En termes de traitement du signal, l’analyse multirésolution est un moyen de décomposer unsignal en composantes ayant chacune leur énergie contenue dans une certaine bande de fréquences.Chaque composante correspond à un niveau de résolution. On obtient chacun d’eux en projetant lesignal sur les fonctions ondulées : les mêmes pour tous les niveaux, mais prises seulement à l’échelleconvenant à chacun. De plus en se déplaçant dans le temps elles nous permettent de voir l’évolutiontemporelle de chaque composante. Les ondelettes sont donc une famille de fonctions localisées entemps et en fréquence et formant une base orthonormale.

Chaque ondelette est utilisée pour décomposer le signal comme on utilise chaque fonction e inx

dans la transformée de Fourier. La différence est que les fonctions ondelettes sont bien localiséesdans le temps, contrairement aux exponentielles complexes. C’est pourquoi les ondelettes sontparticulièrement intéressantes pour étudier les signaux transitoires. Dans ce cas, on utilise lesondelettes parce qu’elles nous permettent de diviser le signal en plusieurs bandes de fréquence :l’énergie du signal à détecter doit être en effet bien localisée en fréquence, alors, dans la bandecorrespondante, le rapport signal sur bruit sera considérablement augmenté, et donc nos chances dedétecter le signal seront plus importantes.

Ainsi les premiers niveaux de décomposition correspondent aux détails grossiers du signal etles derniers aux détails fins.

Si φ φ( ) ( ) ,/x x k avec j kj j= − ∈− −2 22 Ζ forment une base orthonormale pour les sous-espacesd’ondelettes Vj dans une analyse en multirésolution V V Lj j⊂ ⊂ ⊂ ℜ+1 2... ( ) on peut déterminer lafonction d’ondelette ``mère`` ν ( )x telle que ses dilatations et ses translations :

ν νjk

jjx x k avec j k( ) ( ) ,= − ∈

− −2 22 Ζ (5.124)

forment une base orthonormale de L Les fonctions et2 ( ).ℜ φ ν satisfont les équations de dilatation :

φ φ( ) ( )x h x kk k= ∑ −2 2 (5.125)

etν( )x = 2 2∑ −k kg x kφ( ) (5.126)

où hk et gk sont des filtres miroirs en quadrature liés par (voir le théorème 5.9):g hk

kk= − −( ) .1 1 (5.127)

La fonction d’échelle φ(x) et son filtre associé hk possèdent les caractéristiques d’un filtrepasse-bas, tandis que l’ondelette ν ( )x et son filtre associé gk possèdent celles d’un filtre passe-haut.Tous deux sont liés par la relation miroir en quadrature.

( ) ( )H Gω ω2 2

1+ = (5.128)

φ~

Page 100: carte - representations temps - frequences ENSIETA

5. Analyse multirésolution et paquet d'ondelettes

ENSIETA, Janvier 2002Centre de Recherche "Extraction et Exploitation de l'Information en Environnements Incertains"

95

Remarque : Selon les conventions d’écriture, le filtre appelé H est parfois appelé H’ car il correspondà la fonction de transfert de h-k. De même, la normalisation de la fonction d’échelle et par conséquentles coefficients des filtres varient d’un auteur à l’autre. On adopte la convention suivante:

∑=

∑=

∞=

−∞=

∞=

−∞=k

k

kik

k

k

kik

egG

ehH

πω

πω

ω

ω

2

2

21

)(

21

)((5.129)

Ainsi la fonction f(x) (un signal quelconque) peut être représentée par :f(x) = ∑ ∈j k jk j kd x, , ( )Ζ ν (5.130)

où les coefficients d jk = ∫ f(x) ν j k x dx, ( ) . (5.131)

Dans un premier temps, on peut décomposer le signal de N échantillons, en deux signaux de

taille N2

. Ils correspondent respectivement aux hautes et basses fréquences du signal initial. Dans un

second temps, on décompose le premier de ces nouveaux signaux en deux signaux de taille N/2 (N -la taille du signal original), etc.

Afin d'aboutir une certaine application, que ce soit le débruitage ou la compression dessignaux, une idée consiste alors à assurer la reconstruction du signal en ne prenant en compte que lescoefficients supérieurs à un certain seuil qui pourrait être défini de manière adaptative en fonction dela statistique du bruit. Néanmoins la décomposition du signal sur une base unique peut être limitativeet non optimale. Les paquets d’ondelette permettent de décomposer le signal sur un grand nombre debases et de choisir, au sens d’un certain critère, celle qui représente au mieux le signal bruité.

5.4.2. La notion d'arbre de décomposition [1,9]

Dans ce paragraphe on va généraliser les concepts de la multirésolution. Cette généralisationest donnée par la décomposition de sous-espaces correspondants aux hautes fréquences. Onobtiendra alors, toujours avec une fenêtre de N points et en prenant en compte ce signal original, unematrice de (log2(N)+1)*N où les coefficients de la décomposition sont disposés comme indiqué sur lafigure 5.14. A chaque niveau, le signal d’approximation et de détail du niveau précédent est filtrépasse-bas et passe haut pour fournir respectivement les nouveaux coefficients d’approximation et dedétail. Les coefficients résultants correspondent à la projection du signal de départ sur une baseorthonormale. Il est donc possible de reconstruire exactement le signal à partir de ces coefficients etdes atomes-temps échelle correspondant. Les aspects mathématiques liés de cette généralisation sontprésentés en [1, chap. VIII]. Sur cette figure, on peut voir la différence entre l’analyse multi-résolution et l’analyse en paquets d’ondelettes.

Figure 5.14: Arbres de décomposition pour une analyse multirésolution et pour une analyse en paquets d’ondelettes

g h

aaa daa

h g

aa0 aa1 da0 da1

g h

x0 x1 x2 x3 x4 x5 x6 x7

a0 a1 a2 a3 d0 d1 d2 d3

Analyse Multiresolution

ggg

gg

h h h h

h h

g h

x0 x1 x2 x3 x4 x5 x6 x7

a0 a1 a2 a3 d0 d1 d2 d3

Analyse en paquets d’ondelettes

aa0 aa1 da0 da1 ad0 ad1 dd0 dd1

aaa daa ada dda aad dad add ddd

Vecteur Initial

h : filtre passe-basg : filtre passe-haut

Page 101: carte - representations temps - frequences ENSIETA

5. Analyse multirésolution et paquet d'ondelettes

ENSIETA, Janvier 2002Centre de Recherche "Extraction et Exploitation de l'Information en Environnements Incertains"

96

Ce concept a été développé par Coifman et Wickerhauser [9] et permet de travaillersimultanément sur une collection de bases de décomposition. Ainsi, lors de l’analyse en paquetsd’ondelettes, ce ne sont plus seulement les versions filtrées passe-bas du signal qui sont décomposées,mais aussi les versions filtrées passe-haut. L’approximation des détails et les détails des détailsviennent donc s’ajouter à l’approximation du signal. Autrement dit, les hautes fréquences sont aussidécoupées en sous-bandes et l’arbre de décomposition dévient symétrique (figure 5.14).

Cette étape représente l’étape d’analyse. L’introduction des filtres discrets hk et gk présente unintérêt majeur pour le calcul pratique des coefficients d’approximation:On montre [1] en effet que

aa m k h a j k

da m k g a j k

f m j xj

j

f m j xj

[ , ] [ , ]

[ , ] [ , ]

= +

= +

−=−∞

=∞

−=−∞

1

1(5.131)

de même on établit que

ad m k h d j k

dd m k g d j k

f m j xj

j

f m j xj

[ , ] [ , ]

[ , ] [ , ]

= +

= +

−=−∞

=∞

−=−∞

1

1(5.132)

Ainsi, les coefficients d’approximation et de détail associés à une résolution donnée peuventse déduire, par filtrage suivi de décimation des coefficients d’approximation et de détail à larésolution immédiatement supérieure. Opérant de proche en proche, on dispose donc d’un algorithmerapide et récursif, qui ne met en jeu que deux filtres discrets, dont on itère l’action (figure 5.15). Cetalgorithme est un algorithme pyramidal, établie par Mallat [1], qui a été utilisé antérieurement auxondelettes en traitement d’images.

La figure 5.15 présente le schéma d’analyse pour un signal de 8 échantillons, comme celuiprésenté sur la figure 5.14. On peut voir que pour effectuer la décomposition en paquets d’ondelettes,il suffit d’appliquer récursivement l’opérateur d’analyse (voir figure 5.14) pour les coefficientsd’approximation et de détail.

Figure 5.15. Algorithme pyramidal d’analyse en paquets d’ondelettes

Maintenant, on se demande comment peut-on représenter les coefficients, tout en sachant qu'ilsont caractérisés par trois paramètres : niveau de décomposition, indice de fréquence et indicetemporel. Ce problème a été résolu par Coifman [9] : le résultat de l’analyse en paquets d’ondelettessera donné sous forme de tableau, constitué des lignes de l’arbre. Ainsi la première ligne représente lesignal de départ (composé de N échantillons) dans le domaine temporel; il n’y a pas encore la notion

signal original

H(z) G(z)

↓2↓2

↓2↓2

Opérateur d’analyse (A)

AA

A A

AAAA

Page 102: carte - representations temps - frequences ENSIETA

5. Analyse multirésolution et paquet d'ondelettes

ENSIETA, Janvier 2002Centre de Recherche "Extraction et Exploitation de l'Information en Environnements Incertains"

97

de fréquence. La deuxième ligne se découpe en deux grands blocs ou cellules. Le premier bloc decoefficients résulte du filtrage passe-bas (h[n]) du signal initial et contient donc une approximation decelui-ci. Le deuxième, provient du filtrage passe-haut (g[n]) et représente les détails. Dans chaquebloc de cette ligne, on retrouve N/2 coefficients, correspondant à N/2 positions différentes de l’atometemps-échelle. Chaque cellule qui engendre par division deux autres cellules sur le niveauimmédiatement inférieur s’appelle cellule père, tandis que les cellules engendrées s’appellentcellules fils. Le principe de lecture est le même pour les lignes suivantes. Le numéro de ligne indiquel’échelle, tandis que le numéro de colonne donne à la fois une information de position et defréquence.

En effet, chaque paquet d’ondelettes est porteur d’une triple information f, s, p fréquence,échelle (scale), position, là où l’ondelettes ne comptait que deux paramètres, un paramètre d’échelleet un paramètre de position. Pour l’ondelette, à une échelle donnée correspondait une gamme defréquences, il n’y avait pas d’ambiguïté. Ainsi, le coefficient en paquet d’ondelettes d’une fonction x,se trouvant sur la ligne ls, dans le bloc bf, à la position p, correspond à la projection de x sur lafonction d’ondelette f,s,p. Si ce coefficient est important, on peut en déduire que x contient unequantité d’énergie conséquente, au voisinage de la fréquence f, de la position p à l’échelle s.

5.4.3. Sélection de la meilleure base

Pour choisir la meilleure base, c’est-à-dire la plus adaptée à l’extraction de l’information utile,il faut définir une fonction de mesure de l’information qui porte le nom de fonction de coût. Chacunpeut définir sa fonction de coût, mais il faut s’assurer que la fonction soit additive.

Définition Une fonction M:l2(Z) → R est appelée fonction de coût additive si:1) M(0)=0;2) ( ) ( )M x M xi ii

= ∑

Voici quelques fonctions employées [5]:

1. Nombre au dessus d’un seuil. Pour un seuil arbitraire ε fixé, on compte les éléments en valeurabsolue supérieures à ε. Cela donne le nombre de coefficients nécessaires à la transmission du signalpour une précision ε.2. Entropie. On définit l’entropie au sens de Shannon-Weaver d’une séquence x=x j par

( )η x p pj jj= −∑ log , où p

x

xj

j=

2

2 et on impose plogp=0 si p=0. Il ne s’agit pas d’une fonction de

coût additive. Par contre, la fonction ( )λ x x xj jj= −∑

2 2log l’est. Par la relation

( ) ( )η λx x x x= +2 2log , minimiser la précédente minimisera cette dernière.

3. Logarithme de l’énergie. Soit ( )M x x jj= ∑ log

2 avec log0=0. Cela peut être interprété comme

un processus de Gauss-Markov composé de N variables aléatoires gaussiennes de variances

σ σ12

1

2 2 2= =x xN N, ........, . La redéfinition du log à 0 est équivalente à ignorer toute composante

inchangée dans le processus. Minimiser cette fonction conduit à la meilleure approximation de la basede Karhunen-Loeve, pour le processus, qui atteint le minimum global de M sur tout le groupeorthogonal.

Les fonctions de coût d’information additive sont des fonctionnelles d’un ensemble de basesorthonormales sur le groupe orthogonal. Dans le cas pratique, les ensembles sont compacts donc ilexiste un minimum global.

Page 103: carte - representations temps - frequences ENSIETA

5. Analyse multirésolution et paquet d'ondelettes

ENSIETA, Janvier 2002Centre de Recherche "Extraction et Exploitation de l'Information en Environnements Incertains"

98

Soit M une fonction de coût additive et soit x un vecteur d’espace V. Soit une base de lalibrairie (une base correspondant à un nœud de la décomposition par paquets d’ondelettes), et soit Bxune séquence de coefficients de x dans la base V.

Définition La meilleure base pour x∈V relative à M est B telle que M(Bx) soit minimale.

Algorithme de recherche de la meilleure base

Dans ce paragraphe on présente quelques méthodes pour implémenter la décomposition enpaquets d’ondelettes du point de vue théorique.

Les paquets d’ondelettes sont implémentés sous forme d’arbres un peu particulier dans le butd’optimiser la recherche des bases utiles. Comme on a montré, la décomposition en paquetsd’ondelettes consiste à effectuer une décomposition du signal par les mêmes filtres (orthogonaux oubiorthogonaux) mais cette fois-ci on décompose également les coefficients de détails (voir figure5.14). Cette représentation peut être associée à un arbre binaire (figure 5.16) qui est une structure depointers: chaque nœud père pointant sur 2 fils (cas d’un signal 1D).

Figure 5.16. Arbre binaire réalisé

En fait, cette structure, quoique très facilement implémentable récursivement, n’est pas la plusadaptée. On propose la structure présentée sur la figure 5.17 :

Figure 5.17. Arbre utilisé en paquets d’ondelettes

Si la librairie est un arbre, alors on peut trouver la meilleure base parinduction sur k. Soit Bn,k la base de vecteur correspondant à l’intervalle delongueur N de la forme In,k=[2kn,2k(n+1)] et soit An,k la meilleure base pour xprojeté sur les vecteurs de Bn,k,. Pour k=0, il existe une seule base, cellecorrespondant à In,0.On construit An,k+1 pour tout n≥0 ainsi:

( ) ( ) ( )A

B si M B M A M A

A An k

n k n k n k n k

n k n k,

, , , ,

, ,

,

,+

+ +

+

=≤ +

1

1 2 2 1

2 2 1 sinon (5.133)

x

Nœud j du niveau i :tab[ i ][ j ]

Arbre de pointeurs Tableau de pointeurs : tab

nœud fil

nœud fil

noeud père

Page 104: carte - representations temps - frequences ENSIETA

5. Analyse multirésolution et paquet d'ondelettes

ENSIETA, Janvier 2002Centre de Recherche "Extraction et Exploitation de l'Information en Environnements Incertains"

99

Le tableau de pointeur tab a autant de lignes que de niveaux de décomposition désirés.Chaque ligne pointe sur un vecteur de pointeurs de structure. Chaque structure pointe sur un nœud del’arbre. Cette structure est plus souple à gérer. En fait, elle prend moins de place en mémoire qu’unarbre binaire. De plus, il est très facile de se déplacer dans l’arbre pour rechercher qu’elle est la base àretenir. Cette recherche serait très lourde si on le faisait avec un arbre de pointeurs: elle demanderaitbeaucoup plus de temps et bien plus de ressources auxiliaires.

Il ne suffit pas d’avoir un pointeur sur chaque nœud de l’arbre, on a également besoin d’unefonction de coût et d’un booléen associé à chaque nœud pour nous dire si ce nœud a été retenue ounon. Par conséquent, la structure d’un élément du tableau peut être celle-ci:

Figure 5.18. Elément du tableau associé à un nœud

Il faut remarquer que- on a 2Ni nœuds au niveau i,- chaque nœud pointe sur 2N(L-i) coefficients,où i∈[0,L], L nombre maximum de niveaux de décomposition et N nombre de dimension (=1 sisignal 1D, =2 si image 2D, ...).Il existe différents types de méthodes permettant de trouver des bases utiles suivant un critère de coût.

1. La méthode des bases ondelettesIl s’agit ici de prendre uniquement les bases nécessaires à la transformée en ondelettes. On ne

retient que les bases de détail après filtrage de la version passe-bas du signal original. On a alors leschéma suivant:

Figure 5.19 Méthode des bases ondelettes

Arbre binaire Tableau de pointeurs: tab

3 3 2 1

Niveaux de décomposition

Décomposition fréquentielle retenue

- ptr : pointeur sur les coefficients du nœud (sur2N(L-j) éléments)

- cost : coût du nœud

- mark : Booléen

N - la dimension du signalL - le nombre total de niveaux

Niveau j, Nœud i

Page 105: carte - representations temps - frequences ENSIETA

5. Analyse multirésolution et paquet d'ondelettes

ENSIETA, Janvier 2002Centre de Recherche "Extraction et Exploitation de l'Information en Environnements Incertains"

100

2. La méthode du meilleur niveauOn parcourt l’arbre de niveau en niveau et on calcule le coût de chaque niveau.

Figure 5.20. Méthode du meilleur niveau

3. La méthode de la meilleure base

Il s’agit de la méthode la plus communément employée car elle procure l’entropie la plusfaible des trois méthodes.

On part de l’avant dernier niveau de l’arbre (le niveau L-1) et on remonte vers la racine(niveau 0). On teste:

si cout cout père est conservé cout coutseuls les fils sont conservés cout cout

père des fils père

des fils

$ $ , : $ $, , $ $

≤ ⇒ =⇒ =

sinon (5.134)

A la fin, on est assuré d’avoir pour cette décomposition (avec les filtres utilisés), les bases quivont procurer le coût d’information le plus bas (coût fonction de la fonction de coût employée, biensûr). Pour un signal composé de 8 échantillons, le choix de la meilleure base est présenté sur la figuresuivante:

Figure 5.21. Méthode de la meilleure base

Notons que cette méthode est la plus générale et s’exécute quelle que soit la dimension dusignal (1D, 2D,...) : chaque nœud sera décomposé en sous-arbre et on effectue la recherche des basescontribuant au coût global minimal et ce quel que soit le nombre de nœuds de l’arbre. Elle crée unpavage non régulier en fréquence du plan temps-fréquence.

Arbre binaire Tableau de pointeurs: tab

3 3 2

Niveau 2 est le meilleure

Décomposition fréquentielle retenue

← Niveau retenu:2

Répartition fréquentielle des coefficients retenus:4 au niveau 12 au niveau 22x1 au niveau 3

Arbre binaire Tableau de pointeurs:tab 3 3 21

Niveaux retenus

Bases retenues

Page 106: carte - representations temps - frequences ENSIETA

5. Analyse multirésolution et paquet d'ondelettes

ENSIETA, Janvier 2002Centre de Recherche "Extraction et Exploitation de l'Information en Environnements Incertains"

101

5.4.4. La reconstruction du signal

L’intérêt pour la décomposition en paquets d’ondelettes est que celle-ci permet une analyseplus détaillée des composantes hautes-fréquences des signaux, mais également de pouvoir choisir labase de décomposition la mieux adaptée au traitement recherché. On peut en effet remarquer quel’information est redondante, car le signal a été projeté sur une librairie d’ondes modulées, de laquelleon peut extraire un grand nombre de bases (figure 5.22)

Figure 5.22. Exemples de bases possibles

Pour choisir une base qui sera optimale pour une certaine application, on utilise une desméthodes présentée antérieurement. Après le choix de la meilleure base, on peut envisager laprocédure de reconstruction (ou de synthèse).

L’algorithme d’analyse, qui a été présenté dans le sous-chapitre 5.4.2 est réversible et conduità un algorithme dual de synthèse, dans lequel une approximation à une résolution donnée se déduit del’approximation et du détail à la résolution immédiatement inférieure. Pour la synthèse on peututiliser la relation suivante:

a j k h a m k g d m kf n m fn

n

n m fn

n

[ , ] [ , ] [ , ]+ = +−=−∞

=∞

−=−∞

=∞

∑ ∑1 2 2 (5.135)

A l’inverse de l’algorithme d’analyse qui opérait par filtrages suivis de décimations,l’algorithme de synthèse opère par interpolations suivi de filtrages. L’algorithme de synthèse(supposons que l’on a choisi la meilleure base, celle-ci étant comme celle présentée sur la figure 5.22,partie droite) est présenté dans la figure suivante:

Figure 5.23. Algorithme pyramidal de synthèse

x0 x1 x2 x3 x4 x5 x6 x7

a0 a1 a2 a3 d0 d1 d2 d3

aa0 aa1 da0 da1 ad0 ad1 dd0 dd1

aaa daa ada dda aad dad add ddd

x0 x1 x2 x3 x4 x5 x6 x7

a0 a1 a2 a3 d0 d1 d2 d3

aa0 aa1 da0 da1 ad0 ad1 dd0 dd1

aaa daa ada dda aad dad add ddd

Exemples de bases possibles de reconstruction

temps (dans chaque cellule)

échelle

fréquence (de chaque cellule) fréquence (de chaque cellule)

temps (dans chaque cellule)

0

1

2

3

Signal reconstruit

H’(z) G’(z)

↓2↑2

↓2↑2

Opérateur de synthèse (S)

S +

S

S

S

S

S

daaaaa add ddd

(da0,da1) (ad0,ad1)

Page 107: carte - representations temps - frequences ENSIETA

5. Analyse multirésolution et paquet d'ondelettes

ENSIETA, Janvier 2002Centre de Recherche "Extraction et Exploitation de l'Information en Environnements Incertains"

102

Les cellules de synthèse opèrent tout d’abord une interpolation sur les entrées (en fait il s’agitd’un insertion d’un zéro entre deux échantillons consécutifs), puis un filtrage par H’ et G’, filtrestransposés de H et G (c’est-à-dire tels que h’

n=h-n et g’n=g-n).

Pour plus de détails théoriques, les lecteurs peuvent consulter [1]. Dans l'annexe A1 on décritles aspect d'implémentation de la transformation en paquet ondelette directe et inverse.

5.4.5. Exemples d'application

Pour illustrer le principe d'utilisation de la décomposition en paquets d'ondelette on présente lecas du débruitage d'un signal. Les algorithmes de débruitage et de compression de données fondés surla décomposition en paquets d’ondelettes reposent sur le principe suivant:

1. Décomposer le signal en paquets d’ondelettes2. Choisir une base B de caractérisation du signal3. Sur B, sélectionner les coefficients Ci les plus significatifs (porteurs d’information utile)4. Reconstruire le signal à partir des coefficients Ci retenus et des fonctions d’ondelettescorrespondantes.

Les deux premières étapes ont été présentées antérieurement. Après avoir sélectionné une baseB, il est possible de reconstruire le signal en utilisant la transformée en ondelettes inverse et lescoefficients de projection sur la base choisie. Cependant, il est nécessaire d’effectuer au préalable unesélection parmi les coefficients, sinon, le signal reconstruit sera exactement identique au signal dedépart, et l’opération de décomposition n’aura permis aucun traitement.

Plusieurs méthodes existent pour sélectionner les coefficients dans la base optimale B. Lescritères de sélection les plus couramment rencontrés sont énumérés ci-dessous. Notons qu’il s’agitd’une décomposition sur une base orthonormale et qu’il y a donc conservation de l’énergie totale du

signal initial E x Donc C Eii jj= =∑ ∑2 2

. , .

L’idée de Donoho et de ses collaborateurs [11], [12] est que l’énergie du bruit est répartie surtous les coefficients de la décomposition en paquets d’ondelettes alors que celle du signal n’estprésente que sur une partie de ceux-ci. Donc les plus petits coefficients correspondent seulement à dubruit et les plus grands à du bruit auquel est rajouté le signal.

Deux méthodes de seuillage ont été développées, appelées Hard Tresh et Soft Tresh.Dans ces deux méthodes, le choix du seuil t est empirique aussi pour automatiser la procédure,

la méthode SURE a été développée. Nous explicitons ces trois méthodes ci-dessous.

Méthodes de seuillage

Les méthodes de seuillage que nous avons utilisées sont abondamment décrites et utilisées parDonoho et Johnstone dans [11] et [12].

§ Hard Tresh

x = Hard Tresh (y,t) x = y si y t≥ (5.136)

x = 0 sinonoù y est constitué du signal bruité et où t est le seuil, x est le signal après seuillage. Les coefficientsinférieurs au seuil sont éliminés. Les autres sont gardés tels qu’ils sont.

§ Soft Tresh

x = Soft Tresh (y,t) x = sign ( )( )y y t si y t− ≥ (5.137)

x = 0 sinon

Page 108: carte - representations temps - frequences ENSIETA

5. Analyse multirésolution et paquet d'ondelettes

ENSIETA, Janvier 2002Centre de Recherche "Extraction et Exploitation de l'Information en Environnements Incertains"

103

où y est constitué du signal bruité et où t est le seuil.

§ SUREThresh

Nous voulons ici minimiser l’estimateur non biaisé du risque développé par Stein (Stein’sUnbiased Estimate of Risk : SURE), pour déterminer le seuil, comme il est décrit dans [11] :

SURE(y) = ( ) min( , )n yyii

n

ii

n− +

<= =∑ ∑2 11

21

λ (5.138)

où λ est le seuil choisi pour estimer SURE (y).

Donc, avec SUREThresh, le seuil est choisi automatiquement. Ce choix automatique du seuilest l’un des buts que nous poursuivons. Ensuite, nous seuillons soit par SoftTresh, soit par HardTresh.

Les deux premières méthodes sont des propriétés bien spécifiques :- HARDTRESH : en terme d’erreur quadratique est meilleure, mais la méthode crée des

oscillations parasites.- SOFTTRESH : le signal est au moins aussi lisse que le signal pur et la méthode ne crée pas

d’oscillations parasites.Il existe d’autres méthodes envisageables pour assurer le débruitage. Par exemple, on peut

utiliser le seuillage énergétique. On décide, dans ce cas, de conserver un pourcentage α de l’énergiedu signal étudié. Les coefficients sont alors triés par ordre décroisant; les plus grands sont ensuiteretenus un par un, jusqu’à ce que l’énergie des coefficients sélectionnés soit égale à αE. Les autrescoefficients sont fixés à zéro.

Le plus grand avantage de la décomposition en paquets d’ondelettes est la possibilité de lasélection de la meilleure base utilisant des bases orthogonales à partir d’une certaine méthode. Lescoefficients dans cette base seront seuillés de telle manière à maintenir l’information essentielle etéliminer l’influence du bruit. La méthode la plus utilisée pour choisir la meilleure base est laminimisation du coût de l’entropie Shanon-Weaver, parce que la majorité de l’énergie descoefficients de la meilleure base est concentrée sur un nombre minimal de coefficients représentatifs.L’inconvénient de ce critère est qu’il privilégie les coefficients «basses fréquences» qui sont les plusénergétiques.

Pour illustrer le principe de débruitage en utilisant la décomposition en paquets d'ondelette, onconsidère l'exemple d'un chirp bruité, pour un RSB=4 dB. Sur la figure 5.24.a. on présente lescoefficients issus par décomposition et la meilleure base, au sens d'entropie de Shannon.

Figure 5.24. Debruitage par décomposition en paquets d'ondelettes

0 50 100 150 200 250 300-1

-0.5

0

0.5

1

1.5

2Original signal (blue);Noisy signal (red)

0 50 100 150 200 250 300-1

-0.5

0

0.5

1

1.5

2HardThresholding denoised signal

0 50 100 150 200 250 300-1

-0.5

0

0.5

1

1.5SoftThresholding denoised signal

0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1

-3

-2.5

-2

-1.5

-1

-0.5

0Decomposition tree

Entr

opy

0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1-6

-5

-4

-3

-2

-1

0

1The coefficients of the best basis

Leve

l

Arbre de décomposition

Le tableau des coefficients

Signal original (bleu) et signal bruité (rouge)

Signal debruité par HardThresholding

Signal debruité par SoftThresholding

b.a.

Page 109: carte - representations temps - frequences ENSIETA

5. Analyse multirésolution et paquet d'ondelettes

ENSIETA, Janvier 2002Centre de Recherche "Extraction et Exploitation de l'Information en Environnements Incertains"

104

5.4.6. Décomposition en paquets d'ondelette 2D [13]

Dans la section 5.2.1. on a introduit la notion de l'analyse multi-résolution séparable à partirde laquelle on a développé la transformée ondelettes 2D. L'analyse en paquets d'ondelettes 2D est unegénéralisation de cette approche : comme dans le cas 1D, on décompose également les détails, enutilisant les opérateurs d'analyse/synthèse présentés sur la figure 5.10. L'algorithme de décompositionutilisé est toujours pyramidal; le résultat sera un ensemble de sous-espaces (appelés également"imagettes" ). Sur la figure suivante on présente l'exemple de décomposition d'une image sur 3niveaux.

Figure 5.25. Décomposition en paquets d'ondelette 2D

Comme on peut observer sur cette figure, chaque sous-espace qpjW , est décomposé en quatre

sous-espaces orthogonaux, selon :12,12

112,2

12,12

12,2

1, ++

++

++

++ ⊕⊕⊕= qpj

qpj

qpj

qpj

qpj WWWWW (5.139)

Ces sous-espaces sont localisés en quatre nœuds d'un arbre quaternaire, comme il est illustrésur la figure suivante.

Figure 5.26. L'arbre quaternaire de décomposition

L'algorithme de décomposition et du choix de la meilleure base est similaire au celui des cas1D. En fait, on applique l'algorithme de décomposition 1D sur les lignes puis sur les colonnes. A lareconstruction, on effectue les opérations inverses [13].

L'implémentation pratique de la décomposition en paquets d'ondelettes 2D impliquel'utilisation d'un banc de filtres séparables qui est, en fait, une extension 2D du banc de filtres utilisés

Opérateur d'analyse (A) : voir fig. 5.10.a

A

A A

A A

L'image originale a0

qpjW ,

12,121

+++

qpjW12,2

1+

+qp

jWqpjW 2,12

1+

+qp

jW 2,21+

Page 110: carte - representations temps - frequences ENSIETA

5. Analyse multirésolution et paquet d'ondelettes

ENSIETA, Janvier 2002Centre de Recherche "Extraction et Exploitation de l'Information en Environnements Incertains"

105

dans le cas 1D. De point de vue physique, un tel banc de filtres décompose l'image de départ enplusieurs imagettes.

Pour le choix de la base optimale, on peut utiliser la version 2D de l'algorithme décrit ensection 5.4.4., en utilisant toujours l'entropie de Shannon comme fonction de coût.

fils

p,qj

p,qj

q,pj

qp,j

q,pj

qp,j

p,qj

CoutCout

)M(WCoutconservéW

)M(W)M(W)M(W)M(W)M(W

=→

=−⇒

⇒+++≤→ +++

++

+++

conservés,sont fils Les

;

Si 12121

1221

2121

221

(5.140)

Sur la figure suivante on présente un exemple de représentation d'une meilleure base, pourdeux niveaux de décomposition.

Figure 5.27. La représentation de la meilleure base dans le cas 2D

Figure 5.28. Décomposition en paquets d'ondelettes 2D

0,11+LW

1,01+LW

0,0LW

1,11+LW0,0

1+LW

0,01+LW

1,01+LW

1,11+LW

0,11+LW

L'image de départ Niveau 1

La meilleure base (répres. 3D)

Niveau 2

La meilleure base (répres. 2D)

Page 111: carte - representations temps - frequences ENSIETA

5. Analyse multirésolution et paquet d'ondelettes

ENSIETA, Janvier 2002Centre de Recherche "Extraction et Exploitation de l'Information en Environnements Incertains"

106

5.5. Analyse en paquets d'ondelette invariante en temps [14]

5.5.1. Préliminaires

Ces dernières années, la transformation en ondelettes et la décomposition en paquetsd’ondelettes ont été très utilisées, mais leurs applications ont été limitées par le fait qu’elles ne sontpas invariantes en temps, c’est-à-dire que si on modifie l’origine des temps d’un signal, la meilleurebase (dans le cas de la décomposition en paquets d’ondelettes) ne sera pas la même. Ceci constitue ungrand inconvénient dans les applications de traitement des signaux statistiques, par exemple ladétection et l’estimation des paramètres des signaux. Ce phénomène est dû à la discrétisation de laTOC.Un autre inconvénient est que jusqu’à présent, pour choisir la famille d’ondelettes pour faire ladécomposition, il n’existait pas de méthode; le choix étant fait par l’essai de plusieurs familles etensuite on regarde quelle est la famille la mieux adaptée à la situation donnée. Ce choix n’est pasvalable pour une autre application parce que la procédure utilisée n’est pas objective.Donc, il est nécessaire de chercher à implanter une technique qui pallie ces inconvénients et quis’appelle la décomposition en paquet d’ondelettes invariante en temps (Shift-Invariant WaveletPacket Decomposition- SIWPD).

Ce chapitre présente cette technique d’un point de vue théorique (on définit la librairie depaquets d’ondelettes invariante, on introduit un algorithme pour choisir la meilleure base qui serainvariante en temps). Ensuite, on présente la comparaison entre la décomposition en paquetd’ondelettes classique et celle qui est invariante en temps.

5.5.2. La librairie de paquets d’ondelettes invariante en temps

Soit la séquence hn qui représente les coefficients du filtre qui respectent les équationssuivantes:

Σhn-2khn-2l=δk,l. (5.141)

hnn

∑ = 2 (5.142)

Soit φn(x) un ensemble d’ondelettes, qui est généré par l’équation (5.145)

( )

( )

φ φ

φ φ

2

2 1

2 2

2 2

n kk

n

n k n

h x k

g x k

= −

= −

∑+

(5.143)

g hkk

k= − −( )1 1 où φ ϕ0( ) ( )x x≡ est une fonction d’échelle qui satisfait

ϕ ϕ δ( ), ( ) ,,x p x q p qp q− − = ∈Ζ (5.144)

Il a été observé [14] que la projection d’une fonction f(x) sur une base classique 2 22

0j j x k k/ ( ) :φ − ∈Ζ reste invariante pour un décalage inférieur à 2-jm (m∈Z). Néanmoins, si on

fait la décomposition en paquets d’ondelettes, à partir de l’algorithme pour sélectionner la meilleurebase classique ( ce qui a été montré dans le sous-chapitre 5.4.3), la propriété d’invariance en temps nesera pas valide [14]. Donc, la première méthode pour obtenir l’invariance est d’ajuster lalocalisation temporelle des fonctions de base. Ainsi: les nouveaux coefficients restent les mêmesque les coefficients du signal non décalé et la représentation temps-fréquence est la même, maisdécalée en temps de quelques périodes. Cette stratégie propose la création d’une librairie étendue quiengendrera toutes les versions décalées des fonctions de base. Ensuite, il faut chercher un algorithmeefficace qui trouve la meilleure base. Cela veut dire qu’il faut retenir, lors de la décomposition, tousles sous-espaces du signal décalé ou non.

Pour décrire cette stratégie, on introduit les notations

Page 112: carte - representations temps - frequences ENSIETA

5. Analyse multirésolution et paquet d'ondelettes

ENSIETA, Janvier 2002Centre de Recherche "Extraction et Exploitation de l'Information en Environnements Incertains"

107

B x m k k Zl n mj l j

nl j

, ,( ) / [ ( ) ] := − − ∈+2 2 22 φ (5.145)

U clos Bl n mj

L l n mj

, , ( ) , ,=ℜ2 (5.146)

Vj=combinaison linéaire2j/2φ0(2jx-k); k∈Z (5.147)

Définition La librairie de paquets d’ondelettes invariante en temps est une collection de toutes lesbases orthonormales de Vj qui sont sous-ensemble de

B l Z n Z ml n mj l, , : , ,∈ ∈ ≤ <− +

−0 2 (5.148)

Cette librairie peut être mise sous une configuration d’arbre qui facilite les algorithmes rapidesde choix de la meilleure base. Une telle configuration est présentée sur la figure 5.29 :

Figure 5.29. L’ensemble étendu de paquets d’ondelettes organisé sous une structure d’arbre

Chaque nœud d’arbre est indexé par le triplet (l,n,m) et représente le sous-espace Ujl,n,m . Ici l

représente le niveau de décomposition, n-la position dans le niveau. Comme dans les arbres binairesutilisés pour la décomposition en paquets d’ondelettes, chaque noeud contient un pointeur vers unvecteur défini sur un intervalle dyadique donné par Il,n=[2ln,2l(n+1)] .

Le paramètre additionnel m est un nouveau degré de liberté introduit pour ajuster lalocalisation temporelle des fonctions de base. On l’appellera indice d’invariance. La propositionsuivante donne les conditions nécessaires pour assurer l’orthonormalité d’un certain sous-ensemble.

Proposition 5.4. Soit E l n m Z Z Z m l= ⊂ × × ≤ <− + +−( , , ) , ,0 2 la collection des indices qui

satisfont:(i) Le segment Il,n=[2ln,2l(n+1)) est un recouvrement disjoint de [0,1).(ii) Les indices d’invariance d’une paire de noeuds (l1,n1,m1),(l2,n2,m2)∈E sont liés par

m1mod(2-l)=m2mod(2-l) (5.149)où l est le niveau où on évalue’ intervalle dyadique Il,n.

Alors E génère une base orthonormale (BO) pour Vj≡Uj0,0,0, par exemple B l n m El n m

j, , : ( , , ) ∈ c’est

une BO et l’ensemble de toutes E génère une librairie de paquets d’ondelettes invariantes en temps.

La condition (ii) est équivalente à rechercher l’indice d’invariance relative entre le nœud pèreet les nœuds enfants soit zéro ou un. En effet, chaque nœud père (l,n,m) génère des nœuds enfants (l-1,2n,m’) et (l-1,2n+1,m’’) où, tenant compte de la condition (ii), l’indice d’invariance n’aura que deuxvaleurs: m’=m’’=0 ou m’=m’’=2-l

L’arbre de décomposition associé à un certain signal décrit la représentation du signal dansune base orthonormale choisie dans la librairie invariante en temps. La collection des indices E

(-2,0,m-2,0)

(0,0,0)

(-1,0,m-1,0) (-1,1,m-1,1)

(-2,0,m-2,0) (-2,1,m-2,1) (-2,2,m-2,2) (-2,3,m-2,3)

(-3,0,m-3,0) (-3,1,m-3,1) (-3,2,m-3,2) (-3,3,m-3,3) (-3,4,m-3,4) (-3,5,m-3,5) (-3,6,m-3,6) (-3,7,m-3,7)

Page 113: carte - representations temps - frequences ENSIETA

5. Analyse multirésolution et paquet d'ondelettes

ENSIETA, Janvier 2002Centre de Recherche "Extraction et Exploitation de l'Information en Environnements Incertains"

108

représente la collection de tous les nœuds terminaux. Pour vérifier que la condition (ii) est respectéeon considère l’exemple présenté sur la figure suivante:

Figure 5.30. Exemple de décomposition en paquets d’ondelettes invariante en temps. (a) Le signal modulé linéairement en fréquence avec 64 échantillons non-décalés. (b) Le même signal décalé de 15

échantillons. (c) l’arbre de décomposition pour le signal non décalé. (d) l’arbre de décomposition pour le signal décalé.

On peut voir que les signaux ont la même meilleure base de décomposition, mais on a obtenul’invariance grâce aux indices d’invariance. Avec des lignes en trait épais on a représenté lesbranches correspondantes aux décompositions des nœuds qui ont mc=m+2-l, c’est-à-dire qu’on achoisi, dans l’étape de sous-échantillonage, les termes pairs de la décomposition.

On considère les nœuds (-3,0,4) et (-5,3,20). A ces nœuds correspondent deux intervallesdyadiques: I-3,0=[0,1/8) et I-5,1=[3/32,1/8). Ces deux intervalles sont contenus dans l’intervalle I-2,0=[0,1/4) qui correspond au nœud (-2,0,0). Donc, l=-2. La vérification de la relation (ii) est:

m1mod(2-l)=m2mod(2-l)→4mod(4)=20mod(4)=0

5.5.3. La sélection de la meilleure base

La configuration de l’arbre de la librairie étendue facilite une méthode efficace pour choisir lameilleure base.

Soit f∈Vj=Uj0,0,0 et soit M une fonction de coût additive. Soit B une librairie de paquets

d’ondelettes invariante en temps.

Définition La meilleure base pour f dans B par rapport à M est B∈ B pour laquelle M(Bf) estminimale.

Soit Ajl,n,m la meilleure base pour le sous-espace Uj

l,n,m . Par conséquent, Aj0,0,0 représente la

meilleure base pour f∈Vj par rapport à M.

Page 114: carte - representations temps - frequences ENSIETA

5. Analyse multirésolution et paquet d'ondelettes

ENSIETA, Janvier 2002Centre de Recherche "Extraction et Exploitation de l'Information en Environnements Incertains"

109

Algorithme de recherche de la meilleure base

Si la librairie est un arbre, alors on peut trouver la meilleure base parinduction sur k. Soit Bl,n,m la base de vecteurs correspondant à l’intervallede la forme Il,n=[2ln,2l(n+1)) et soit Al,n,m la meilleure base pour f projetéesur les vecteurs de Bn,k,m. Pour l=0, il existe une seule base, cellecorrespondant à I0,n. Ici m représente l’indice d’invariance qui sera donnépar l’équation (6.10).On construit Al+1,n,m, pour tout n≥0 ainsi:

( ) ( ) ( ))150.5(

sinon,

,

,,12,1,2,1

,12,1,2,1,,,,,,

+≤=

+−−

+−−

cc

cc

mnlmnl

mnlmnlmnlmnlmnl AA

AMAMBMsiBA

Les indices d’invariance sont générés ainsi:

( ) ( )m

m si M A x M A x

m onc

l n i mi i

l n i m

l

l

=≤

+

+= =

+ +

∑ ∑ −,

, sin

, , , ,20

1

0

1

2 2

2(5.151)

L’algorithme est récursif et s’arrête au dernier niveau de décomposition, quand l=-L(A-L,n,m =B-L,n,m ). L’indice d’invariance relatif (entre le nœud père et les nœuds enfants, m-mc) ne peutavoir que deux valeurs (m-mc∈0,2-l).

Proposition 5.5. Soit E1 et E2 deux collections d’ indices qui respectent la proposition 5.4, et soit B1

et B2 deux bases orthonormales. Alors B1 et B2 sont identiques à un décalage près si uniquement ilexiste une constante q∈ Z telle que pour tous les (l,n,m)∈E1 il existe (l,n,,m’)∈E2 oùm’=(m+q)mod(2-l).

Preuve:On dit que les bases de Vj sont identiques à un décalage près si seulement s’ il existe q∈Z tel que pour chaque

élément du B1 on a un élément identique dans B2 qui est translaté de q2-j

En fait, si

2 2 221

( )/ [ ( ) ]l jn

l j x m k B+ − − ∈φ (5.152)

alors

2 2 2 222

( )/ [ ( ( ) ) ]l jn

l j jx q m k B+ −− − − ∈φ (5.153)

Si E représente la collection des indices obtenue par la proposition 5.4. et B est la base correspondante, alors(l,n,m) ∈ E est équivalent à Bj

l,n,m ⊂B. Aussi, on peut observer que

φ φnl j j

nl jx q m k x m k[ ( ( ) ) ] [ ( ' ) ']2 2 2 2 2− − − = − −− (5.154)

où m’=(m+q)mod(2-l) et k’=k+[2 l(m+q)].

Définition Les arbres binaires sont invariants pour un décalage temporel s’ils correspondent auxbases invariantes pour le même décalage.

Proposition 5.6. La meilleure base obtenue par algorithme décrit dans ce sous-chapitre estinvariante en temps.

La démonstration de cette proposition se trouve en [14].L’implémentation, de point de vue théorique, est identique à la décomposition en paquets

d’ondelettes classiques (voir le sous-chapitre 5.4).

Page 115: carte - representations temps - frequences ENSIETA

5. Analyse multirésolution et paquet d'ondelettes

ENSIETA, Janvier 2002Centre de Recherche "Extraction et Exploitation de l'Information en Environnements Incertains"

110

Les organigrammes pour l'implementation de ces approches sont donnés dans l'annexe 1.

CONCLUSION

D’un point de vue pratique, l’idée de base pour obtenir l’invariance est d’adapter lesous-échantillonage quand on étend un nœud.

5.5.4. La comparaison entre la décomposition en paquets d'ondelette classique et celle invarianteen temps

Dans ce sous-chapitre, on présente la comparaison entre la décomposition en paquetsd’ondelettes classique et la décomposition en paquets d’ondelettes invariante en temps. Oncomparera:

- l’entropie globale, c’est-à-dire la somme entre les entropies des cellules qui formentla meilleure base.

- la meilleure base de la décomposition.Pour mettre en évidence les propriétés de la décomposition en paquets d’ondelettes invariante

en temps, vis-à-vis des propriétés de la décomposition classique, on illustre l’exemple suivant. Onsuppose une portion du signal utile compressé sur 64 points autour du pic de corrélation. Pour mettreen évidence les propriétés d’invariance, on fait un zéro-padding sur 64 positions. Ainsi le signald’analyse est composé de 128 échantillons comme on peut le voir sur la figure 5.31.a.

En translatant ce signal de 23 échantillons on obtient le signal présenté à la figure 5.31.b. Lafamille d’ondellete Symmlet, à l’ordre 6 est mise en oeuvre.

En appliquant l’algorithme de décomposition classique sur les deux signaux on obtient deuxarbres de décomposition, présentés dans les figure 5.31.c,d. Les nœuds terminaux correspondent auxcoefficients qui se trouvent dans la meilleure base. On peut facilement observer qu’en raison du faitque les signaux n’ont pas la même origine temporelle, les meilleures bases sont différentes.

Figure 5.31. Comparaison entre WPD et SIWPD

Page 116: carte - representations temps - frequences ENSIETA

5. Analyse multirésolution et paquet d'ondelettes

ENSIETA, Janvier 2002Centre de Recherche "Extraction et Exploitation de l'Information en Environnements Incertains"

111

Par contre, si on utilise la décomposition en paquets d’ondelletes invariante en temps, onobtient (voir les figures 5.31.e et 5.31.f) toujours la même meilleure base.

Pour chacune de 4 bases définies, on a calculé les entropies globales, et leurs valeurs setrouvent dans le tableau suivant:

Tableau 5.2.WPD SIWPD

x(t) 4.53 1.32x(t-23) 6.23 1.32

Pour la décomposition classique, on a les valeurs différentes qui dépendent de l’originetemporelle du signal. A partir de la décomposition invariante en temps, on obtient une entropieconstante, sans avoir la même origine des temps. Cet état peut être utilisé pour effectuer uneclassification objective des familles d’ondelettes, et on peut établir une procédure pour choisir lafamille la plus mieux pour un certain signal. Par exemple, pour notre signal, décomposé par SIWPD,on a obtenu les valeurs suivantes pour l’entropie (calculée toujours dans la meilleure base), enutilisant plusieurs familles d’ondelettes:

Tableau 5.3

Familles d’ondelettesCoiflet, 2 Coiflet, 3 Daubechies, 4 Daubechies, 6 Symmlet, 6 Symmlet, 8

Entropie dex

1.4628 1.3732 1.6555 1.5783 1.3254 1.3447

La plus petite entropie est obtenue pour la famille ‘’Symmlet’’, à l’ordre 6. Cette famille seradonc la mieux adaptée à notre signal.

5.5.5. La décomposition en paquets d'ondelettes invariante en temps 2D (DPOIT 2D)

La procédure pour implémenter la DPOIT 2D reste essentiellement la même que dans le cas1D. Dans ce cas, l'indice de décalage n'est plus une seule valeur mais un vecteur m=(mx,my).Soit mp etme les indices de décalage de père et, respectivement, des enfants. Le décalage relatif peut prendrequatre valeurs :

me-mp=(0,0,(2-l,0),(0,2-l),(2-l,2-l) (5.155)

La valeur la mieux adaptée sera toujours celle qui minimise l'information de coût. La preuvepeut se faire en extrapolant la preuve du cas 1D. Sur la figure suivante on donne l'exemple de la DPOIT 2D, comparativement à ladécomposition classique.

Figure 5.32. Comparaison WPD2D et SIWPD2D

Page 117: carte - representations temps - frequences ENSIETA

5. Analyse multirésolution et paquet d'ondelettes

ENSIETA, Janvier 2002Centre de Recherche "Extraction et Exploitation de l'Information en Environnements Incertains"

112

Références

[1] S. Mallat – “A Wavelet Tour of signal processing”, Academic Press, 1998[2] A. Theolis – “Computational Signal Processing with Wavelet ”, Birkhauser Press, Boston, 1998[3] Daubechies, I. - "Orthonormal Bases of Compactly Supported Wavelets" , Comm. in Pure and Applied Math., Vol. 41No. 7 pp909-996, 1988.[4] A. Poularikas (Editor-in-Chief), "The transforms and applications handbook", CRC Press & IEEE Press, ISBN0849383420, 1996[5] R.R. Coifman – “Wavelet Analysis and Signal Processing”, in Signal Processing Part 1 : Signal Processing Theory.L. Auslander et al.eds., IMA. Vol. 22, Springer, New York. 1990[6] M.J. Smith, T.P. Barnwell – “A procedure for designing exact reconstruction filter banks for tree structured sub-bandcoders”, In Proc. IEEE Int. Conf. Acoust., Speech, and Signal Processing,San Diego, CA, March 1984[7] M. Vetterli - "Filter banks allowing perfect reconstruction", Signal Proc., 10(3):219-244, April, 1986[8] A. Quinquis - "Représentations temps-fréquence", Support de cours, ENSIETA, 1995[9] R.R. Coifman – “Wavelet Analysis and Signal Processing”, in Signal Processing Part 1 : Signal Processing Theory.L. Auslander et al.eds., IMA. Vol. 22, Springer, New York. 1990[10] D.L. Donoho and I.M. Johnstone – “Adapting to unknown smoothness by wavelet shrinkage”, Pretint Department ofStatistics, Stanford University, 1992.[11] D. Donoho - "Nonlinear Wavelet Methods for Recovery of Signals. Densities and Specrta from Indirect and NoisyData", Proceedings of Symposia in Applied Mathematics, 173-205, 1993[12] D. Donoho, I. Johnson - "Ideal spatial adaptation by wavelet shrinkage", Biometrika 81, N° 3, 425-455, 1994[13] S. Mallat -"An efficient image representation for multiscale analysis", In Proc. of Machine Vision Conference, LakeTaho, February, 1987 [14] I. Cohen, “Shift-Invariant Adaptive Wavelet Decomposition and Applications”, Research Thesis, Israel Institute ofTechnology, 1998

Page 118: carte - representations temps - frequences ENSIETA

5. Analyse multirésolution et paquet d'ondelettes

ENSIETA, Janvier 2002Centre de Recherche "Extraction et Exploitation de l'Information en Environnements Incertains"

113

Exercises et problèmes

1. (Analyse Multirésolution) On considère une analyse multirésolution et l'équation d'échelle pourφ(t) définie selon (5.12).

On suppose que φ(t-n) est une base orthonormale pour V0. Montrer que :

a) [ ] 1h n = ;

b) [ ] ( ) ( )2 2 ,h n t n tφ φ= −2. (Analyse Multirésolution) Soit h un filtre miroir conjugué associé à une fonction d'échelle φ .

a) Montrer que si la dérivée d'ordre p de ( )h ω est 0 à ω π= alors ( ) ( )ˆ 2 0l kφ π = pour tous

0−∈ Zk et l<p.

b) Dériver que si q<p alors ( ) ( )∫=∑ ∞∞−

−∞=dtttnn q

n

q φφ .

3. (Analyse Multirésolution) Montrer que ( )∑ =−∞

−∞=nnt 1φ si φ est une fonction échelle orthogonale.

4. (Analyse Multirésolution)a) On considère le produit infini :

1;0

<∑==

bapk

i

bk

i

Montrer que bk

iapp −

∞→== 1

1

lim .

b) A partir de l'expression du filtre de Haar passe-bas ( )2

1 1−+=

zzH et sa version normalisée

( ) ( )2

0

ωω

jeHM = montrer que ( ) ( )

2/2/sin

22

10 ω

ωωω

ωj

k keM

−∞

==∏

=Φ .

c) Montrer que l'ondelette de Haar est donnée par :

( ) ( )4/

4/sin 22

ωω

ωωω

jej

−=Ψ

5. (Analyse Multirésolution) On considère le signal

( ) [ ][ ]

∉∈

=1,0,11,0,1

tt

tf

a) Trouver les coefficients de la décomposition de f(t) sur l'ensemble des ondelettes de Haar - nm,ψ .

b) Vérifier que ∑ ∑ =m n

nmf 1,2

,ψ (l'identité de Parseval).

c) On suppose ( ) ( ) +− ∈−= Zitftf i

a ;2 . Donner les domaines d'échelle pour lesquels lescoefficients de la décomposition de ce signal sur l'ensemble des ondelettes de Haar sont non-nuls.

d) Le même exercice pour ( )

−=

21

tftfb .

6. (Les moments nuls) Montrer qu'une fonction ψ avec p moments nuls est orthogonale sur tous lespolynômes d'ordre p.

Page 119: carte - representations temps - frequences ENSIETA

5. Analyse multirésolution et paquet d'ondelettes

ENSIETA, Janvier 2002Centre de Recherche "Extraction et Exploitation de l'Information en Environnements Incertains"

114

7. (Les moments nuls) Donner la preuve du théorème 5.4.8. (La taille du support) Donner la preuve de la proposition 5.1.9. (Les ondelettes de Daubechies) Soit ψ(t) l'ondelette mère de support compact générée par les

filtres miroir quadratique de Daubechies. Soit ( ) ( )ntt jjnj −= −− 22 '2/'

, ψψ les dérivées desfonctions ondelettes générées par ψ(t).

a) Vérifier que h1 et g1 définis par

( ) ( )( ) ( ) ( ) ( )ωωωω ωω gegehh jj ˆ12ˆ;1ˆ2ˆ1

11 −=−=

sont des filtres à réponse finie.b) Montrer que la transformée de Fourier de ψ '(t) peut être écrite selon :

( ) ( ) ( )∏=∞

=

−−

2

11

1'

2

2

2ˆˆ

p

phg ωωωψ

10. (Les filtres miroir quadratique) On définit un banc de filtre avec quatre réponses impulsionellesh, g, h

~et g~ qui décompose un signal a0[n]

[ ] [ ] [ ] [ ]ngandnhana 22 0101 ∗=∗=En utilisant la relation (5.70), la reconstruction est donnée par :

[ ] [ ] [ ] [ ]~ ~ ~a n a h n d n g n0 1 1= ∗ + ∗( (

a) Montrer que [ ] [ ]lnana −= 0~ si

( ) ( ) ( ) ( ) ( ) ( )πωωωωπωω +−==+= hghhhg~~,ˆ~

,ˆˆet h satisfait la condition quadratique

( ) ( ) ωπωω jlehh −=+− 2ˆˆ 22

b) Montrer que l est nécessairement pair.

11. (Les ondelettes et les bancs de filtres) On définit

( ) [ ] ( )∑ −=∞

−∞=+

nkk ntnht 221 φφ

avec φ0=1[0,1] et [ ] ( ) ( )nttna kkk −= φφ , .a) Soit P un opérateur défini par :

( )

+

++

= π

ωπ

ωωωω

21ˆ

22

fhfhfP

Montrer que ( ) ( )ωω kk aPa ˆˆ 1 =+ .

b) Montrer que s'il existe φ telle que 0lim =−∞→

φφkk

alors 1 est une valeur propre de P et

( ) ( )∏=∞

=

−−

1

2/1 2ˆ2ˆp

ph ωωφ .

12. (La transformée ondelettes rapide) Soit b[n]=f(N -1n) avec 2L=N-1 et LVf ∈ . On veut, en utilisant

[ ] nLL fna ,,φ= calculés à partir de b[N], trouver les coefficients ondelettes de f, définis dans le

théorème 5.7.a) Soit [ ] ( )nn LL

L−−= 22 2/ φφ . Montrer que ][][ nanb LL φ∗= .

b) Prouver que s'il existe C>0 tel que pour tous [ ]ππω ,−∈

( ) ( ) Ckk

d ≥∑ +=∞

−∞=πωφωφ 2ˆˆ

alors aL peut être calculé à partir de b avec un filtre stable [ ]nL1−φ .

Page 120: carte - representations temps - frequences ENSIETA

5. Analyse multirésolution et paquet d'ondelettes

ENSIETA, Janvier 2002Centre de Recherche "Extraction et Exploitation de l'Information en Environnements Incertains"

115

13. (La transformée ondelettes rapide) On considère la séquencey=[1 0 -3 2 1 0 1 2]

a) Calculer les coefficients de la décomposition de cette séquence sur l'ensemble des ondelettes deHaar.

b) Montrer que la reconstruction, au sens du théorème 5.7, est parfaite.

14. (Ondelettes biorthogonales)Expliquer l'intérêt pratique de l'utilisation des ondelettes biorthogonales.

15. (Analyse par paquets d'ondelettes)A partir de l'algorithme de décomposition en paquets d'ondelettes, proposer une procédure dedébruitage pour le cas 1D. Commentaires sur le choix de l'ondelette et sur le critère de la sélectionde la meilleure base.

16. (Décomposition en paquets d'ondelettes invariante en temps)Quels sont les avantage de l'utilisation de la DPOIT par rapport à la décomposition en paquetsd'ondelettes classique?

Page 121: carte - representations temps - frequences ENSIETA

6. Représentation temps-fréquence bilinéaires

ENSIETA, Janvier 2002Centre de Recherche "Extraction et Exploitation de l'Information en Environnements Incertains"

116

6REPRESENTATIONS TEMPS-FREQUENCE BILINEAIRES

6.1. La transformée de Wigner-Ville [1,3]

6.1.1. Définition [1]

Le carré de la transformée de Fourier est appelé le spectre de puissance et il caractérisel’énergie de la distribution d'un signal dans le domaine fréquentiel. Puisque la transformée de Fouriereste linéaire, le spectre de puissance est une fonction quadratique de fréquence. On utilise égalementle carré de la transformée de Fourier à courte terme et la transformé en ondelettes pour décrire ladistribution énergétique d'un signal dans le domaine temps-frequence. Les carrés de la transforméeFourier à court terme et de la transformée en ondelettes sont appelés le spectrogramme et,respectivement, le scalogramme. Comme discuté dans les chapitres précédents, les résultats obtenuspar le spectogramme et par le scalogramme font l’objet de la sélection de fonctions d’analyse. Poursurmonter ces problèmes, nous présentons une méthode plus générale pour décrire la distributionénergétique d'un signal dans le plan temps-frequence.

Selon le théorème de Wiener-Kinchine, le spectre de puissance peut être considéré comme latransformée de Fourier de la fonction d’autocorrélation R(τ), selon :

( ) ( ) ( ) ∫ −== τωττωω djRStSP exp,2

(6.1)

où R(τ) est donné par :

( ) ( ) ( )∫ −= dttstsR ττ * (6.2)

L’équation (6.1) n’est pas une fonction du temps ce qui indique que la quantité d'énergieprésente à la fréquence ω englobe toute la durrée temporelle. Cette relation montre que le spectre estdistribué dans le temps. En utilisant (6.1), il n'y a aucune façon de constater si le spectre de puissanced'un signal change au cours du temps. Le spectre de puissance standard est donc insatisfaisant pourcaractériser les signaux dont le contenu en fréquence évolue au cours du temps, comme la plupart dessignaux biomédicaux, de sons ou de vibrations.

En examinant (6.1), nous pouvons voir qu'une possibilité de construire un spectre dépendantde temps consiste à rendre la fonction d'autocorrélation dépendante du temps. La transformée deFourier résultante de la fonction d'autocorrélation R(t, τ), qui est fonction de la variable τ, devientalors une fonction de temps, par :

( ) ( ) ∫ −= τωττω djtRtP exp,, (6.3)

On appelle P(t,ϖ) le spectre de puissance dépendant de temps. La question qui persiste est dedéterminer la fonction d'autocorrélation dépendante du temps R(t, τ).

Apparemment, le choix de R(t,τ) n'est pas arbitraire. Par exemple, puisque P(t,ϖ) décrit lespectre de puissance dépendant du temps, en sommant tous les spectres P(t0,ϖ) instantanés on doitretrouver le spectre de puissance |S(ϖ)|2, par :

( ) ( )∫ =2

, ωωω SdtP (6.4)

Page 122: carte - representations temps - frequences ENSIETA

6. Représentation temps-fréquence bilinéaires

ENSIETA, Janvier 2002Centre de Recherche "Extraction et Exploitation de l'Information en Environnements Incertains"

117

ce qu’on appelle traditionnellement la condition de conservation de la marginale en fréquence.Réciproquement, sur l'axe de fréquence doit être égale à l'énergie instantanée, selon :

( ) ( )∫ = 2,21

tsdtP ωωπ

(6.5)

ce qui traduit la condition de conservation de la marginale en temps. Si P(t,ϖ) représente ladistribution d'énergie du signal dans le domaine temps-fréquence, alors nous lui voulons des valeursréelles :

P(t,ϖ) = P*(t,ϖ) (6.6)

En accord avec le concept conventionnel de l'énergie, nous souhaitons également que lespectre dépendant du temps soit non-négatif.

D'une manière primordiale, cependant, nous devons nous assurer que P(t,ϖ) s’identifie eneffet à l'analyse en fréquence du signal et c'est également la propriété la plus difficile à justifier. Pourles représentations linéaires, telles que la transformée de Fourier à court terme et la transformée enondelettes, la qualité de la représentation peut simplement être jugée par la concentration desfonctions élémentaires. Plus les fonctions élémentaires sont concentrées, mieux la représentationproposée pour décrire les comportements locaux d'un signal. Malheureusement, ce n'est pas le cas duspectre dépendant du temps. Pour les spectres dépendant de temps, il n'y a aucune fonctionélémentaire explicite.

Le spectre dépendant du temps le plus connu est le spectrogramme. D'une manière alternative,on a vu au chapitre 4 que le spectrogramme peut être écrit comme la transformée de Fourier de lafonction d'autocorrélation dépendante du temps R(t, τ), où :

( ) ( ) ( ) ∫= υυτυτυπ

τ γ dtjAAtR s exp,,21

, (6.7)

où As(υ,τ) représente la fonction d'ambiguïté de s(t). Aγ(υ,τ) est la fonction d'ambiguïté de la fenêtred'analyse γ(t). Comme vu au chapitre 4, la résolution du spectrogramme dépend de la sélection de lafonction d'analyse γ(t).

Pendant les cinquante dernières années, beaucoup de recherches ont été concentrées sur laconstruction du spectre dépendant du temps. La méthodologie de découvrir les fonctionsd'autocorrélation dépendantes du temps désirées R(t, τ) a été une démarche importante. Nous nefouillerons pas ici dans ces détails, mais présentons plutôt les résultats qui ont été bien établis, commela distribution de Wigner-Ville.

La distribution de Wigner-Ville (DWV) a été initialement développée pour le domaine de lamécanique quantique en 1932 et a été adaptée pour l'analyse des signaux par un scientifique françaisVille 15 ans plus tard. On la connaît généralement, dans la communauté de traitement des signaux,comme la distribution de Wigner-Ville.

Dans le cas de la DWV, la fonction d'autocorrélation dépendante de temps est choisie par :

( )

+=

22, * τττ tststR (6.8)

La substitution de cette fonction d'autocorrélation dépendant du temps en (6.3) rapporte :

( ) ∫ −

+= τωτ

ττω djtststDWV s exp

22, * (6.9)

L’equation (6.9) traduit habituellement l'auto-DWV. La DWV croisée est définie par :

( ) ∫ −

+= τωτ

ττω djtgtstDWV gs exp

22, *

, (6.10)

où s(t) et g(t) représentent deux signaux différents. Il est facile de vérifier que :( ) ( )ωω ,, ,

*, tDWVtDWV sggs = (6.11)

Par conséquent,( ) ( )ωω ,, * tDWVtDWV ss = (6.12)

Page 123: carte - representations temps - frequences ENSIETA

6. Représentation temps-fréquence bilinéaires

ENSIETA, Janvier 2002Centre de Recherche "Extraction et Exploitation de l'Information en Environnements Incertains"

118

ce qui implique le fait que auto-DWV sera toujours réelle.

D'une manière équivalente, la DWV peut également être calculée à partir du domainefréquentiel. Soit

( ) ( )

−=

+=

2et

2*

11τ

ττ

τ tggtss

dont les transformées de Fourier sont données par :

( ) ( ) ( ) ( ) ( ) ( ) ? tj? tj e?GGe?SSs 2*11

211 22get 22 −=↔=↔ ωτωτ

ττ

En utilisant le théorème de convolution, (6.10) peut être écrite comme :

(6.13)

où S(ω) est la transformée de Fourier de s(t) et G(ω) est la transformée de Fourier de g(t). L’auto-DWV correspondante est :

( ) ∫ ΩΩ

Ω

Ω

+= dtjSStDWVs exp222

1, * ωω

πω (6.14)

6.1.2. Propriétés générales de la distribution de Wigner-Ville [1,3]

Dans la section précédente, nous avons présenté les concepts de spectre dépendant de temps etde la distribution de Wigner-Ville. Comparée à la TFCT, la DWV présente une meilleure résolution,et, également ne souffre pas des effets de la fenêtre (voir le chapitre 4). Dans ce qui suit, nousétudierons les propriétés de la DWV.

1. L'invariance par translation temporelle

Si la DWV d'un signal s(t) est DWVs(t,ω), alors la DWV de sa version décalée en tempss0(t)=s(t-t0) est la DWV décalée temporellement de s(t), exprimée selon :

( ) ( )ωω ,, 00ttDWVtDWV ss −= (6.15)

2. L'invariance par translation fréquentielle (modulation fréquentielle)

Si la DWV d'un signal s(t) est DWVs(t,ω), alors la DWV de sa version modulé en fréquences0(t)=s(t)expjω0t est la DWV de s(t) décalée en fréquence, exprimée selon :

( ) ( )0,,0

ωωω −= tDWVtDWV ss (6.16)

La preuve de ces deux propriétés est laissée à titre d’exercice.

Sur la figure suivante, on met en évidence ces deux propriétés, à partir d'une modulationlinéaire de fréquence (signal chirp).

( )

( ) ( ) ( ) ( )

( ) [ ] ( )

∫ ΩΩ

Ω

Ω

+=

=∫ −=

∫ =⊗=−=

=∫ −

+=

Ω+=−

dtjGS

deGS

GSdjgs

djtgtstDWV

j

gs

exp222

1

22224

exp

exp22

,

*

2/224*

1111

*,

ωωπ

ααωαπ

ωωτωτττ

τωτττ

ω

ωαωα

Page 124: carte - representations temps - frequences ENSIETA

6. Représentation temps-fréquence bilinéaires

ENSIETA, Janvier 2002Centre de Recherche "Extraction et Exploitation de l'Information en Environnements Incertains"

119

Figure 6.1. Les propriétés d'invariance par décalage en temps et en fréquence

Sur cette figure on observe que, dans le cas de la DWV, la structure temps-fréquence d'unsignal est conservée par décalage en temps ou en fréquence. Cela représente une propriété importantede la DWV, intensivement exploitée dans des applications comme la détection ou la classification dessignaux.

3. Les marginalles en temps et en fréquence

Par définition, la marginale en temps d'une représentation temps-fréquence est obtenue parl'intégration de celle-ci sur tout l'axe de fréquence :

( )

( ) ( ) 2*

*

22

exp21

22,

21

tsdtsts

ddjtstsdtDWV s

∫ =

+=

∫ =−∫

+=∫

ττδττ

τωωτπ

ττωω

π(6.17)

D'une manière similaire la marginale en fréquence peut être obtenue par intégration sur tout ledomaine temporel :

( )

( ) ( ) ( ) ( )∫ =−=∫ −∫ −=

∫∫ −

+=∫

2*

*

expexp

exp22

,

ωττωτττωτ

τωτττ

ω

SdRjdtdtstsj

dtdjtstsdttDWV s(6.18)

4. La conservation de l'énergie par transformation

Cette propriété assure que l'énergie obtenue par DWVs(t,ω) sera identique à l'énergie du signalde départ. Elle est induite par les conditions marginales en temps et en fréquence et par la relation deParseval

( ) ( ) ( ) dttsdSdtdtDWV s∫∫ ∫ ∫== 22

21

,21

ωωπ

ωωπ

(6.19)

4. Valeurs réelles

La relation 6.12 montre le fait que la DWV d'un signal aura toujours des valeurs réelles.

5. Covariance par dilatation

Cette propriété est exprimée de la manière suivante :

DWV DWVDWV

Signal originalSignal décalé en temps Signal décalé en fréquence (modulé)

T

F

Page 125: carte - representations temps - frequences ENSIETA

6. Représentation temps-fréquence bilinéaires

ENSIETA, Janvier 2002Centre de Recherche "Extraction et Exploitation de l'Information en Environnements Incertains"

120

( ) ( ) ( )

=⇒>=

kktDWVtDWVkktxkty xy

ωω ,,0; (6.20)

6. Compatibilités par filtrage et par modulation

La propriété de compatibilité par filtrage assure le fait que si le signal y est la convolutionentre x et h (autrement dit, y est la sortie d'un filtre h quand on applique x à l'entrée) alors la DWV dey est la convolution temporelle entre la DWV de x et la DWV de h :

( ) ( ) ( ) ( ) ( ) ( )∫ −=⇒∫ −=∞

∞−

∞−dssDWVstDWVtDWVdssxsthty xhy ωωω ,,, (6.21)

D'une manière duale la propriété de compatibilité par modulation s'exprime par : si y est unemodulation de x par une fonction m, la DWV de y est une convolution fréquentielle entre la DWV dex et la DWV de m :

( ) ( ) ( ) ( ) ( ) ( )∫ −=⇒=∞

∞−ξξξωω dtDWVtDWVtDWVtxtmty xmy ,,, (6.22)

7. Conservation des supports temporel et fréquentiel

Si le signal a un support compact en temps et en fréquence alors sa DWV aura le mêmesupport temporel et fréquentiel :

( ) ( )( ) ( ) BtDWVBX

TttDWVTttx

x

x

>=⇒>=

>=⇒>=

ωωωω

ω

,0,,0

,0,,0(6.23)

Cette propriété est illustrée sur la figure suivante, où on considère comme signal de test unesinusoïde avec une modulation d’amplitude gaussienne. On présente également la représentationtemporelle et le spectre du signal.

Figure 6.2. La conservation du support fréquentiel et temporel

8. Unitarité - la formule de Moyal

La propriété d'unitarité exprime l'effet de la conservation du produit scalaire du domainetemporel et du domaine temps-fréquence :

( ) ( ) ( ) ( )∫ ∫=∫∞

∞−

∞−

∞−ωωω

πdtdtDWVtDWVdttytx yx ,,

4

1 *2

2*

(6.24)

Rep

rése

ntat

ion

fréq

uent

ielle

du

sign

al

50 100 150 200 2500

0.05

0.1

0.15

0.2

0.25

0.3

0.35

0.4

0.45

50 100 150 200 250

-1

-0.8

-0.6

-0.4

-0.2

0

0.2

0.4

0.6

0.8

1

Distribution de Wigner-Ville

Représentation temporelle du signal

T

F

Page 126: carte - representations temps - frequences ENSIETA

6. Représentation temps-fréquence bilinéaires

ENSIETA, Janvier 2002Centre de Recherche "Extraction et Exploitation de l'Information en Environnements Incertains"

121

9. La fréquence instantanée

La fréquence instantanée d'un signal x peut être calculée à partir de sa DWV comme lemoment de premier ordre (le centre de gravité) en fréquence :

( )( )

( )∫

∫= ∞

∞−

∞−

υυ

υυυ

dtDWV

dtDWVtf

a

a

x

x

x,

,(6.25)

où xa est le signal analytique associé à x. La preuve de cette propriété est donnée en [1, pag. 109].

10. Le retard de groupe

D'une manière duale, le retard de groupe peut être obtenu comme le moment temporel dupremier ordre de sa DWV, selon :

( )( )

( )∫

∫=

∞−

∞−

dttDWV

dtttDWVt

a

a

x

x

x

υ

υυ

,

,(6.26)

Ces deux propriétés sont importantes dans des applications où on cherche à estimer lafréquence instantanée d'un signal mono-composante.

11. La localisation parfaite d'un signal chirp

On suppose un signal chirp dont l'expression générale est ( ) ( )ttj xetx πυ2= , où ( ) ttx βυυ 20 += .L'expression de la DWV de ce signal, obtenue en utilisant (6.10) est :

( ) ( )( )ttDWVx βυυδυ +−= 0, (6.27)

Cette relation met en évidence la propriété centrale de la DWV qui a constituée le cadre debase pour la généralisation menée par Cohen [3] et qui a conduit à la construction de la classe deCohen. Cette propriété est illustrée sur la figure suivante.

Figure 6.3. DWV d'un signal chirp

Comme on a vu dans cette section, la DWV respecte un nombre important de propriétés qui larend utile, avec quelques modifications, dans des application comme l'extraction ou l'estimation desparamètres. Néanmoins, la distribution de Wigner-Ville ne vérifie pas quelques propriétés quiauraient été souhaitables pour rendre cet outil encore plus performant. La première propriété nonvérifiée par Wigner-Ville est la positivité. En effet, la distribution de Wigner-Ville peut prendre desvaleurs négatives ce qui d'une part ne permet pas de la classer dans la catégorie des densités d'énergie,et d'autre part rend l'interprétation des résultats assez difficile. D'autre part, la distribution de Wigner-Ville ne vérifie pas la propriété dite de causalité; c'est-à-dire que l'évaluation de la distribution à uninstant t donné nécessite la connaissance du signal avant et après cet instant. Le passé du signal nesuffit pas. La mise en œuvre d'une analyse en temps réel n'est donc pas envisageable.

50 100 150 200 2500

0.05

0.1

0.15

0.2

0.25

0.3

0.35

0.4

0.45

Distribution de Wigner-Ville d'un chirp2D 3D

Temps

Fréq

uenc

e(n

orm

alis

ée)

TF

Am

plitu

de

Page 127: carte - representations temps - frequences ENSIETA

6. Représentation temps-fréquence bilinéaires

ENSIETA, Janvier 2002Centre de Recherche "Extraction et Exploitation de l'Information en Environnements Incertains"

122

Une autre propriété de la Distribution de Wigner-Ville, qui peut être vue comme uninconvénient important est sa bilinéarité. Celle-ci est à l’origine de l’apparition de termes ditsd’interférences qui peuvent dans certains cas nuire à la lisibilité de la représentation temps-fréquenceobtenue. C’est pourquoi, il convient d’étudier ces termes de manière plus précise.

6.1.3. Les termes d'interférence générés par la DWV [1]

Cette "limite" de la distribution de Wigner-Ville est un prix à payer pour toutes ses autresbonnes propriétés. En effet, la forme quadratique de celle-ci est à l'origine de la plupart descaractéristiques intéressantes de la distribution, mais elle est également à l'origine de la non-linéaritéde cette dernière. Considérons pour cela deux signaux x(t) et y(t). La DWV de z(t)=x(t)+y(t ) - lesignal somme des deux signaux précédents a pour expression (en partant de la relation (6.9)) :

( ) ⇒∫ −

−+

++

+= τωτ

ττττω djtytxtytxtDWV z exp

2222, **

( )

⇒∫ −

++∫ −

++

+∫ −

++∫ −

+=⇒

τωτττ

τωτττ

τωτττ

τωτττ

ω

djtytxdjtytx

djtytydjtxtxtDWV z

exp22

exp22

exp22

exp22

,

**

**

( ) ( ) ( ) ( ) ωωωω ,2,,, , tDWVRetDWVtDWVtDWV yxyxz ++=⇒ (6.28)

Le troisième terme de cette expression est non nul et représente le terme dit d'interférence.Ceux-ci augmentent rapidement puisque leur nombre (si on pose N le nombre de signauxélémentaires constituant un signal z(t)) est donné par le produit N(N-1)/2.

Ces termes nuisent à la lisibilité des représentations qui peuvent être faites à partir de ladistribution, mais ils peuvent dans certains cas être utiles car ils contiennent une information sur laphase du signal. Il peut donc être intéressant de bien comprendre les mécanismes qui sont à l’originede l’apparition des termes interférentiels de manière d’une part à les différencier des termes non-interférentiels, et d’autre part pour en extraire le cas échéant une information utile.

Les études qui ont été faites sur les interférences ont montré que les termes interférentielsavaient une structure oscillante. Il est donc envisageable de limiter l’importance de ces termes eneffectuant un filtrage qui tienne compte de cette particularité. La mise en œuvre de cette idée a aboutià la définition des versions lissées de la distribution de Wigner-Ville qui fait l’objet de la sectionultérieure. Il est montré, par quelques exemples, le mécanisme et la géométrie des termesd'interférences.On suppose un signal composé de deux sinusoïdes complexes : ( ) ( ) ( )tjtjts 21 expexp ωω += .

Le spectre de ce signal est ( ) ( )21 22 ωπδωπδ + tandis que la DWV est donnée par la relationsuivante :

( ) ( ) ( ) ( )∑ −+−==

2

1cos42,

idis ttDWV ωωωπδωωδπω µ (6.29)

où ωµ et ωd est le centre géométrique et la distance entre les deux sinusoïdes, dans le domainefréquentiel, comme il est illustré sur la figure suivante :

Figure 6.4. La définition du centre géométrique et la distance entre deux sinusoïdes

0 0.05 0.1 0.15 0.2 0.25 0.3 0.35 0.4 0.45 0.50

100

200

300

221 ωω

ωµ+

=

ω1 ω2

ω

( ) 2ωS

ωd=ω1-ω2

Page 128: carte - representations temps - frequences ENSIETA

6. Représentation temps-fréquence bilinéaires

ENSIETA, Janvier 2002Centre de Recherche "Extraction et Exploitation de l'Information en Environnements Incertains"

123

La DWV exprimée par la relation (6.29) est présentée sur la figure suivante.

Figure 6.5. La DWV de deux sinusoïdes

Sur cette figure, on met en évidence le résultat issu de l'expression (6.29) : on obtient deuxauto-termes aux fréquences ω1 et ω2 mais également des termes d'interférence , placés sur un axesitué entre les deux composantes propres. Lorsque les auto-termes sont non-oscillants, ceuxd'interférence ont une structure oscillante de pulsation ωd . D'ailleurs, l'amplitude de ces termes estdeux fois plus grande que celle de termes propres.

La géométrie des termes d'interférence issus par la DWV est donnée par la loi suivante : lestermes d'interférence générés par deux atomes temps-fréquence sont concentrés autour du milieu dela droite qui unit ces points, ayant une structure oscillante à travers d'un axe perpendiculaire à cettedroite. La pulsation est donnée par la différence entre les fréquences correspondantes aux atomespris en compte. Cette loi est illustrée à partir de l'exemple suivant : on considère deux atomesgaussiens et, pour différentes positions de ceux-ci, on obtient plusieurs configurations de termesd'interférences, mais qui suivent la même loi.

Figure 6.6. La dépendance de la configuration des termes d'interférence de la positions des termes propres

50 100 150 200 2500

0.05

0.1

0.15

0.2

0.25

0.3

0.35

0.4

0.45

Temps

Fréq

uenc

eDWV de deux sinusoïdes

Termes d'interférences

Distribution de Wigner-Ville

Temps

Fréq

uenc

e (n

orm

alis

ée)

Distribution de Wigner-Ville

Temps

Fréq

uenc

e (n

orm

alis

ée)

Distribution de Wigner-Ville

Temps

Fréq

uenc

e (n

orm

alis

ée)

Distribution de Wigner-Ville

Temps

Fréq

uenc

e (n

orm

alis

ée)

Page 129: carte - representations temps - frequences ENSIETA

6. Représentation temps-fréquence bilinéaires

ENSIETA, Janvier 2002Centre de Recherche "Extraction et Exploitation de l'Information en Environnements Incertains"

124

6.1.4. La DWV discrète [4]

Il parait évident que la distribution de Wigner-Ville dans sa version continue n'est pas adaptée àun traitement dans des conditions réelles. D'une part, le signal étudié est toujours connu sur une duréefinie. D'autre part, pour permettre une implémentation sur les ordinateurs actuels, il est nécessaire dedéfinir des versions de cette distribution à temps discret (mise en œuvre de la transformation sur unsignal échantillonné), à fréquence discrète ou même à temps et à fréquence discrets.

Il convient également de garder à l’esprit que la version discrétisée de la transformation deWigner-Ville ne sera dans tous les cas qu’une expression approchée de la version à temps continu. Ace titre, certaines des propriétés de base de la transformation seront altérées voire perdues et denouvelles difficultés apparaissent comme le phénomène de repliement.

§ Distribution de Wigner-Ville à temps discret

Cette distribution doit répondre à certaines exigences :− Conserver le maximum de caractéristiques de la version à temps continu.− Permettre de retrouver la forme à temps continu de manière simple Pour cela, on considère le signal à temps discret,

∑ −=n

Tntntftf ).().()(^

δ (6.30)

où T est la période d'échantillonnage du signalAlors on a:

ττ

δτ

δ τπ deTntTnfTktTkfutDWV ui

nkf..).

2()..(.).

2()..(),( ....2*

^−∞+

∞−∫

∑ −−

∑ −+= (6.31)

d'où:

∑ ∑ −−−−=n kf

TntTnkiTknfTkfutDWV )

2.

().)..2.(..2exp().).(()..(),( *^ δπ (6.32)

On constate alors que la distribution de Wigner-Ville du signal échantillonné est elle-mêmeéchantillonnée en temps à une fréquence deux fois plus importante que celle du signal.

Partant de cette expression, il est naturel de définir la distribution de Wigner-Ville à tempsdiscret comme le poids de la distribution de Dirac, soit:

W t u W n u tn T

ff

n^

^( , ) ( , ). (.

)^

= −∑ δ2

(6.33)

où ^

fW est la transformée de Fourier de la distribution de Wigner-Ville de f .

La distribution de Wigner-Ville à temps discret est périodique de période 1/T par rapport à u.Pour obtenir la relation liant la version continue à la version discrète, qui permet de mieux

appréhender les conséquences de la discrétisation, il convient de rappeler que l'on a, d'une part:

W t u W n u tn T

ff

n^

^( , ) ( , ). (.

)^

= −∑ δ2

et d'autre part:

W t uT

W t ulT

tn T

f

n l

n lf^ ( , )

.( ) . ( ,

.). (

.).

,

= − − −∑12

12 2

δ (6.34)

En identifiant terme à terme, on obtient alors la relation qui existe entre la distribution deWigner-Ville à temps discret et la distribution à temps continu, soit:

W n uT

Wn T

ulT

fn l

n lf

^.

,

^ ( , ).

( ) . (.

,.

)= − −∑12

12 2

(6.35)

Cette formule met en évidence deux conséquences importantes de la discrétisation.→ La distribution de Wigner-Ville est échantillonnée à une fréquence double de celle du signal;

Page 130: carte - representations temps - frequences ENSIETA

6. Représentation temps-fréquence bilinéaires

ENSIETA, Janvier 2002Centre de Recherche "Extraction et Exploitation de l'Information en Environnements Incertains"

125

→ La distribution de Wigner-Ville est périodique en fréquence de période 1/2.T avec un changementde signe (on rappelle que T est la période d'échantillonnage du signal). Pour éviter le phénomène derepliement spectral, il faut donc que la fréquence d'échantillonnage soit choisie de façon à ce que lapériode de répétition en fréquence soit supérieure à la largeur de bande du signal. Si le signal analysén'est pas à bande limitée, il est donc impossible d'éviter le repliement spectral.

Dans le cas d'un signal à bande limitée, il existe deux méthodes pour s'affranchir durepliement spectral.→ La première consiste à échantillonner le signal à une fréquence au moins deux fois supérieure à la

fréquence de Shannon. En effet, dans ce cas, la période de répétition du spectre en fréquence estde 2 fois la fréquence maximum du signal, soit exactement sa largeur de bande (la largeur debande d'un signal tient compte à la fois des fréquences positives et négatives du signal; la largeurde bande est donc obtenue en multipliant par deux la fréquence positive la plus élevée).

→ La seconde méthode s'appuie sur le signal analytique . En effet, celui-ci a la particularité de nepas posséder, dans le plan fréquentiel, de composantes négatives. Il s'ensuit que la largeur debande du signal analytique est deux fois plus faible que celle du signal d'origine. Par conséquent,pour éliminer le phénomène d'aliasing, il suffit d'échantillonner le signal à une fréquence égale àla fréquence de Shannon et de calculer le signal analytique associé. Ce que l'on gagne enfréquence d'échantillonnage doit être récupéré par le calcul, car en fait, le passage au signalanalytique multiplie par deux le nombre de composants sur lequel est calculée la distribution.

§ Distribution de Wigner-Ville à fréquence discrète

En raison de la symétrie entre la définition de la distribution de Wigner-Ville à partir du signaltemporel et du spectre du signal, il existe une dualité entre les résultats obtenus lors d'unediscrétisation en temps et d'une discrétisation en fréquence.

Ainsi, la distribution de Wigner-Ville d'un signal échantillonné en fréquence est périodique entemps. En posant, Λ la période d'échantillonnage fréquentiel, on obtient la relation :

W t u W tl

u u mf

m lf

m l^ ( , ) . ( ) . (

., ). ( . ).

,

= − − −∑ΛΛ

Λ2

12 2

δ (6.36)

On observe alors que la distribution de Wigner-Ville est périodisée en temps de période 1/2.Λavec changement de signe et échantillonné en fréquence à une fréquence double de celle du signal(période d'échantillonnage de Λ/2).

Par analogie avec la discrétisation à temps discret, on peut définir la distribution de Wigner-Ville à fréquence discrète par :

W t m F k F m k i t k mF

k

^*^ ( , ) ( . ). (( ). ).exp( . . . .( . ). )= − −∑ Λ Λ Λ2 2π (6.37)

Pour éviter les phénomènes de repliement temporel, il faut alors que la durée du signaln'excède pas la durée 1/2.Λ. Comme dans le cas de la discrétisation temporelle, il convient donc dechoisir la fréquence d'échantillonnage fréquentiel de manière à s'affranchir de ce problème mais celareste possible.

§ Distribution de Wigner-Ville à temps et à fréquence discrète

Considérons maintenant un signal discrétisé à la fois en temps et en fréquence. Ladiscrétisation en temps va entraîner une périodisation en fréquence, de même que la discrétisation enfréquence entraîne une périodisation en temps. Dans ces conditions, un nombre fini d'échantillonssuffit à décrire le signal dans l'espace temps-fréquence.

Pour ce faire, il faut que les périodes d'échantillonnage temporel T et fréquentiel Λ vérifient larelation :

Λ =1

N T.(6.38)

Page 131: carte - representations temps - frequences ENSIETA

6. Représentation temps-fréquence bilinéaires

ENSIETA, Janvier 2002Centre de Recherche "Extraction et Exploitation de l'Information en Environnements Incertains"

126

où N est le nombre d'échantillons dans le domaine temporel.En posant les conventions de notation suivantes,

f t f t N l trl

( ) ( . . )= −∑ - le signal périodique réduit à l'intervalle N.T

f f k Tk r= ( . ) - f le signal échantillonné à la fois en temps et en fréquence.

Alors en suivant une démarche identique à celle suivie pour définir la distribution à tempsdiscret, on peut écrire que :

W t uN T

f fi mN

k n tn T

umN Tf

k n kk

N

n m− =

−−

− −−

=

∑∑( , ). .

. . .exp. .

.( . ) . (.

). (. .

)*

,

12

22 20

1 πδ δ (6.39)

Si on définit la distribution de Wigner-Ville à temps et à fréquence discrets comme le poids dela fonction de Dirac bidimensionnelle aux points t=n.T/2 et u=m/2.N.T, on obtient :

( ) ( )W n mN T

f fi m

Nk nk n k

k

N

,. .

. . .exp. .

. .*=−

=

∑12

20

1 π(6.40)

Ceci revient à décomposer l'espace temps-fréquence en atomes temps-fréquence de dimensionT/2×1/2.N.T et de calculer la contribution énergétique du signal dans cet atome.

Partant de cette observation, il est clair qu'il est impossible de s'affranchir du phénomène derepliement dans le cas d'une double discrétisation. En effet, pour obtenir une version de distributiondiscrète ne temps et en fréquence, il faudrait que l'on ait d'une part, une distribution nulle à l'extérieurd'un intervalle de fréquence [0, 1/2.T] et d'autre part, cette même distribution nulle en dehors d'unintervalle de temps [0, N.T/2] où T représente la période d'échantillonnage temporel. Or ces deuxconditions ne peuvent être vérifiées simultanément puisqu'un signal n'est jamais à la fois de durée etde spectre fini.

Dans la pratique, il est néanmoins possible de se rapprocher fortement de cette situation maisil conviendra de toujours avoir à l'esprit les conséquences que peuvent avoir l'aliasing sur lareprésentation du signal à partir d'une distribution de Wigner-Ville à temps et à fréquence discrète.

6.1.5. L'implémentation de la DWV discrète [4]

L’expression de la distribution de Wigner-Ville à temps et à fréquence continue est lasuivante:

( ) ( )W t x t x t e dxj, ( / ) /ν τ τ τπ ν τ= + ⋅ − ⋅ ⋅∗ − ⋅ ⋅ ⋅ ⋅

−∞

+∞

∫ 2 2 2

Une version discrète en temps et en fréquence de cette transformation est alors donnée par :

( ) [ ] [ ]W n x n k x n k exk

j k,ν π ν= ⋅ + ⋅ − ⋅∗

=−∞

+∞− ⋅ ⋅ ⋅ ⋅∑2 4 (6.41)

Pour mettre en œuvre cette transformation, il convient d’utiliser une implémentation qui serapproche de ce qui suit :§ 1 passage au signal analytique : (on rappelle que le passage au signal analytique permet de

limiter le spectre du signal aux seules composantes positives.)

Pour obtenir le signal analytique, il existe deux méthodes envisageables:A. La première consiste à calculer la transformation de Hilbert du signal considéré. Le signal

analytique est alors le résultat de la somme du signal initial (qui constitue la partie réelle dusignal analytique) et de la transformée de Hilbert de ce signal (qui constitue la partie imaginairedu signal analytique).

B. La seconde méthode se décompose en 3 étapes:1. calculer la transformée de Fourier du signal.2. multiplier par 2 les coefficients correspondant à des fréquences strictement

positives, mettre les coefficients correspondant aux fréquences négatives à zéro. Lors de cetteétape, seul le coefficient correspondant au continu n’est pas modifié.

Page 132: carte - representations temps - frequences ENSIETA

6. Représentation temps-fréquence bilinéaires

ENSIETA, Janvier 2002Centre de Recherche "Extraction et Exploitation de l'Information en Environnements Incertains"

127

3. calculer la transformée de Fourier inverse du signal vecteur obtenu à l’issuede la seconde étape. Le résultat obtenu est alors le signal analytique.

A ce stade, il convient de mettre l’accent sur une difficulté qui intervient dans le passage de laversion continue à la version discrète. En effet, le passage au domaine discret entraîne l’apparition dephénomènes qui n’existent pas à temps continu tel que le repliement ou aliasing. La difficulté quiintervient dans le cas des représentations temps-fréquence est que la transformation est discrétisée àla fois en temps et en fréquence. De ce fait, il faut tenir compte du phénomène de repliement à la foisdans le domaine temporel et dans le domaine fréquentiel. En raison de la dualité du temps et de lafréquence, il sera toujours impossible d’éviter totalement tout phénomène de repliement mais ilconvient toutefois de prendre des précautions afin d’en limiter les effets au maximum.

Pour cela, il faudra donc prendre les mesures suivantes: d’une part, le signal x(t) devra auminimum être échantillonné à la fréquence de Shannon (ou de Nyquist) si l’on effectue lepassage par le signal analytique et à 2 fois la fréquence de Shannon si le passage au signalanalytique n’est pas effectué. Ces mesures doivent permettre d’éviter les problèmes derepliement dans le domaine fréquentiel.

Afin d’éviter les problèmes de repliement temporel dont on oublie trop souvent l’existence, ilconvient d’augmenter artificiellement le nombre de points sur lequel on effectue l’analyse afind’augmenter le pas d’échantillonnage dans le domaine fréquentiel. Pour cela, on fait appel à laméthode du zéro-padding. Pour que celle-ci soit efficace, on multiplie habituellement par deux lalongueur du signal par cette méthode.

En tenant compte de toutes ces remarques, l’implémentation se poursuit de la manière suivante:§ La seconde étape consiste à calculer le terme généralement désigné sous le nom de noyau et dont

l’expression est:[ ] [ ]x n k x n k+ ⋅ −∗

où n représente l’indice d’instant d’échantillonnage.La structure de l'algorithme devient :

Si le calcul est effectué dans de bonnes conditions et en respectant les observations concernantle repliement, seuls les termes correspondant à des valeurs négatives ou nulles de k sont intéressantesà visualiser.

En effet, à une valeur de k correspond un échantillon fréquentiel sachant que le pasd’échantillonnage est donné par :

∆ν=fe/2* size(x) (6.42)

Le signal, dans le cas limite possède une largeur de bande telle que fe=2*B où B représente lafréquence la plus élevée du signal. En utilisant le signal analytique, la largeur de bande du signal estdivisé par deux du fait de l’absence de composante dans le domaine des fréquences négatives. Lepassage à la transformée de Wigner-Ville est responsable d’une périodisation dans le domainefréquentiel de période la fréquence d’échantillonnage divisée par 2. Il s’ensuit que pour un signal

créer une matrice noyau de dimension size(x)×(2.size(x)) partout nulle.pour n variant de 1 à size(x),

( ) [ ] [ ]noyau n x n x n,0 2= ⋅ ⋅ ∗

pour k variant de 1 à size(x)( ) [ ] [ ]noyau n k x n k x n k, = ⋅ + ⋅ −∗2

noyau(n,2. size(x) -k)=conj(noyau(n,k))fin pourWigner-Ville(n,:)=fft(noyau(n,:).conj(fft(noyau(n,:)))

end

Page 133: carte - representations temps - frequences ENSIETA

6. Représentation temps-fréquence bilinéaires

ENSIETA, Janvier 2002Centre de Recherche "Extraction et Exploitation de l'Information en Environnements Incertains"

128

analytique de fréquence maximale fe/2, le ‘spectre’ utile du signal se limite à la bande de fréquence[0,fe/2]. La moitié des termes du résultat suffisent donc à caractériser le signal.

6.2. La transformée Pseudo Wigner-Ville [1,3]

La pseudo-distribution de Wigner-Ville a été définie pour permettre un traitement pluspratique des signaux de manière à obtenir une représentation se rapprochant le plus possible de ladéfinition originale de la distribution de Wigner-Ville qui n'est malheureusement pas directementapplicable. Le problème que l'on cherche à résoudre est celui de la durée du signal, qui dans laversion exacte est infinie ce qui est évidemment impossible à programmer. L'idée consiste alors àn'effectuer l'étude que sur un signal vu à travers une fenêtre de durée fixée et finie.

De la définition de la taille de cette fenêtre et de sa forme dépendront les résultats obtenus tantdans le domaine de la résolution que dans celui de la validité des mesures. En effet, il faudra tenircompte des effets de fenêtrage que nous allons expliquer ultérieurement plus en détails mais aussi desphénomènes tels que l'aliasing et également l'influence de toutes ces manipulations sur les termesinterférentiels que nous avons déjà évoqué précédemment.

6.2.1. Définition de la pseudo-distribution de Wigner-Ville (PDWV)

On utilise une fenêtre en τ (p(τ)), agissant sur la fonction q tx ( , )τ . (La fonction q est définiecomme étant le noyau sur lequel est appliquée une transformation de Fourier; en d'autres termes :

q t x t x tx ( , ) . *ττ τ

= +

2 2

) La distribution ainsi obtenue a été appelée pseudo-distribution de

Wigner-Ville et sa définition est:

PW t p x t x t e d P W t dxi

x( , ) ( ). ( / ). ( / ). . ( ). ( , ).* . . . .ν τ τ τ τ ν ξ ξ ξπ ν τ= + − = −−

−∞

+∞

−∞

+∞

∫ ∫2 2 2 (6.43)

De manière plus exacte, on obtient la forme couramment utilisée de la pseudo-distribution deWigner-Ville lorsque la fenêtre p(τ) est factorisable selon :

p h h( ) ( / ). ( / )*τ τ τ= −2 2 (6.44)

La distribution ainsi obtenue, tout en gardant l'esprit de la distribution de Wigner-Ville est uneanalyse par l'intermédiaire d'une fenêtre glissante à court terme, ce qui en fait une proche voisine duspectrogramme. Il semble donc intéressant de comparer ces deux outils du plan temps-fréquence afinde mieux mettre en évidence les apports de la transformation de Wigner-Ville.

6.2.2. Comparaison entre la pseudo-distribution de Wigner-Ville et le spectrogramme

Bien que le spectrogramme et la distribution pseudo-Wigner-Ville utilisent les mêmessupports (un segment de signal prélevé à l’aide d’une fenêtre à court terme), l’ordre différent danslequel s’effectuent les opérations de transformation de Fourier et de type quadratique entraîne desdifférences de propriété importantes.

On peut citer deux exemples qui mettent en évidence cette remarque:→ Dans le cas d’un signal à support fini de largeur T1, et en effectuant une analyse à court terme dece signal à l’aide d’une fenêtre temporelle de largeur T2, on constate que dans le cas duspectrogramme, le spectre sera reparti sur une durée égale à T1+T2 , alors que dans le cas de ladistribution pseudo-Wigner-Ville, le support temporel du signal est conservé (étalement du spectresur une durée T1);→ Une caractéristique particulièrement recherchée pour une distribution temps-fréquence est sacapacité de localisation sur la loi d’évolution de la fréquence instantanée du signal. Dans le cas d’unchirp linéaire, la fréquence instantanée est représentée par une droite dans le plan temps-fréquence

Page 134: carte - representations temps - frequences ENSIETA

6. Représentation temps-fréquence bilinéaires

ENSIETA, Janvier 2002Centre de Recherche "Extraction et Exploitation de l'Information en Environnements Incertains"

129

dont la pente détermine la rapidité de modulation. La meilleure situation d’analyse dans le cas duspectrogramme est d’avoir un signal quasi stationnaire à l’intérieur de la fenêtre d’analyse. On setrouve alors confronté au compromis du choix de la largeur de la fenêtre permettant de concilier à lafois quasi-stationnarité à l’intérieur de la fenêtre et temps d’analyse suffisamment long pour ne pastrop dégrader la résolution fréquentielle. Dans le cas d’un chirp linéaire, la résolution atteignable àl’aide du spectrogramme sera d’autant plus faible que la pente de modulation du signal sera élevée :en effet, la fenêtre dans laquelle on peut faire l’approximation de quasi-stationnarité est d’autant plusétroite que la rapidité de modulation est importante. Ces aspects sont illustrés sur la figure suivante.

Figure 6.7. Comparaison entre la DWV et le spectrogramme

Dans le cas de la distribution de Wigner-Ville, la confrontation à ce problème intervient à undegré supérieur. En effet, la situation d’analyse optimale est alors la modulation linéaire en raison del’introduction du produit du signal par son miroir local. Le choix de la fenêtre doit donc être fait demanière à avoir une variation quasi-linéaire de la fréquence dans cette fenêtre et à conserver unerésolution fréquentielle suffisante. Il s’ensuit de ces remarques que l’analyse d’un chirp linéaire parla distribution pseudo-Wigner-Ville permet d’obtenir une concentration quasi parfaite de lareprésentation sur la droite représentant la fréquence instantanée du signal dans le plan tempsfréquence et ce, quelle que soit la pente de modulation du chirp.

6.2.3. La pseudo-distribution de Wigner-Ville lissée

La bilinéarité de la transformation est à l’origine de l’apparition de termes d’interaction entretoutes les composantes du plan temps-fréquence.

Les termes d’interaction entre les fréquences négative et positive du signal peuvent êtreéliminées en utilisant le signal analytique puisque celui-ci ne possède pas de fréquences négatives.

Toutefois, cette opération n’empêche en aucun cas l’apparition de termes d’interférence entrecomposantes distinctes sur l’axe des fréquences positives. Il a été montré dans le sous-chapitreantérieur que ces termes d’interférence avaient une structure fortement oscillatoire à la différence descomposantes propres du signal qui ont une structure beaucoup plus régulière.

De cette constatation est née l’idée de réduire l’influence des termes interférentiels par uneméthode correctement choisie de lissage. La distribution modifiée ainsi obtenue peut alors s’écrire:

( ) ( ) ( )x xC Wt F t F t t dt d, ; ' , ' ' , ' ' 'ν ν ν ν ν= ⋅ − − ⋅ ⋅−∞

+∞

−∞

+∞

∫∫ (6.45)

où F est une fonction de lissage normalisée:

( )F t dt d,ν ν⋅ ⋅ =−∞

+∞

−∞

+∞

∫∫ 1 (6.46)

La représentation ainsi formulée définit la classe la plus générale des représentationsbilinéaires admissibles, sous la seule contrainte d’invariance vis-à-vis des translations dans le plantemps-fréquence. Cette classe est connue sous le nom de classe de Cohen, du nom de celui quiprésenta pour la première fois les distributions bilinéaires sous cette forme, encore une fois dans ledomaine de la mécanique quantique (utilisation dans le plan position-impulsion).

20 40 60 80 100 1200

0.1

0.2

0.3

0.4

20 40 60 80 100 1200

0.1

0.2

0.3

0.4

0.5DWV Spectrogramme

Temps Temps

Fréq

uenc

e (n

orm

alis

ée)

Fréq

uenc

e (n

orm

alis

ée)

Page 135: carte - representations temps - frequences ENSIETA

6. Représentation temps-fréquence bilinéaires

ENSIETA, Janvier 2002Centre de Recherche "Extraction et Exploitation de l'Information en Environnements Incertains"

130

Le choix de la fonction de lissage détermine donc de façon cruciale la méthode d’analyseretenue comme approximation lissée de la distribution de Wigner-Ville initiale. D’autre part, il estpossible de déterminer les propriétés de la représentation bilinéaire obtenue à partir des seulescaractéristiques de la fonction de paramétrisation.

Ainsi, on voit que les méthodes du type spectrogramme pour lesquelles :( ) ( )F t thW, ,ν ν= (6.47)

où h(t) est la fenêtre d’observation temporelle sont fondamentalement limitées par la nécessité d’uncompromis entre les résolutions temporelle et fréquentielle : améliorer la résolution fréquentielle nepeut se faire qu’au prix d’un élargissement de la durée d’observation et inversement.

Cette propriété provient du fait que la fonction de lissage associée possède desépanouissements temporels et fréquentiels dépendant les uns des autres (inégalité d’Heisenberg-Gabor).

Une méthode naturelle pour s’affranchir de ce problème consiste alors à passer à une analyse àdeux degrés de liberté en utilisant une fonction de lissage à deux variables séparables, soit:

( ) ( ) ( )F t g t H,ν ν= ⋅ (6.48)

Une telle fonction de lissage permet de définir la distribution pseudo-Wigner-Ville lissée:

( ) ( ) ( )x

jPW et h g t x x d d,ν τ ν ντ

ντ

ν τπ ν τ

= ⋅ ⋅ − ⋅ +

⋅ −

− ⋅ ⋅ ⋅ ⋅ ∗

−∞

+ ∞

−∞

+ ∞

∫∫ 2

2 2(6.49)

où h(τ) est la transformée de Fourier inverse de H(ν).La structure d’une telle transformation prend une forme relativement simple de corrélation

pondérée et centrée sur la droite de travail, suivie d’une transformation de Fourier elle-mêmepondérée.

Une deuxième interprétation de cette représentation est possible, que rend plus tangible samise en œuvre en l'apparentant à une TF à courte terme modifiée. Alors, si on prend comme fonctionsde lissage g(t)=δ(t) et h’(τ)=conj(h(τ/2))×h(-τ/2) (6.50), on retrouve la définition de la distributionpseudo- Wigner-Ville :

( ) ττττ

υ υπ detxtxhtPW tjjx

2*2

222, −∞

∞−

+∫

= (6.51)

soit encore :( ) ( ) txx t

WtPW == υυυυ ,, (6.52)

où ( ) ( ) ( )thxxt −= υυυ est le signal x pondéré par h autour de t. Ceci permet de travailler à courtterme en faisant porter l'opération de transformation de Fourier non plus sur une tranche de signalmais sur le produit de celle-ci par son image miroir. Ou, ce qui revient au même, à calculer une TFCTdans laquelle la fenêtre de pondération serait continuellement choisie comme l'image en miroir de latranche analysée. Cette interprétation est à la base de la propriété de représentation parfaite d'unemodulation linéaire en fréquence. L'extension de cette propriété à la PWVL fournit le résultat centralselon lequel une telle analyse peut être considérée comme une TFCT modifiée dans laquellel'hypothèse, propre aux spectrogrammes, de stationnarité ou de constance dans la durée d'observationpeut être remplacée par l'hypothèse plus amiable d'approximation linéaire sur cette même durée. Lapossibilité ainsi offerte d'élargissement de la durée d'analyse permet d'atteindre une meilleurerésolution fréquentielle, la "meilleure" fenêtre étant maintenant la plus grande pour laquellel'approximation reste valide. De plus, et toujours sous cette approximation, le choix d'une fenêtreayant la forme d'une fonction d'autocorrelation suffira à assurer la positivité de la représentationassociée si le signal considéré est monocomposante.

Cette stationnarisation locale se fait cependant au prix d'un traitement non linéaire dont l'effetsecondaire est de créer des termes d'interférence entre les composantes du plan temps-fréquence. Sil'on revient alors à la forme générale, la pondération g introduit un nouveau lissage suivant l'axe detemps. Le rôle essentiel de celui-ci est précisément de réduire les termes d'interaction entrecomposantes situées autour de fréquences différentes. Le résultat principal est que l'amplitude d'unterme interférentiel provenant de deux composantes distantes d'un intervalle fréquentiel δυ sera rendu

Page 136: carte - representations temps - frequences ENSIETA

6. Représentation temps-fréquence bilinéaires

ENSIETA, Janvier 2002Centre de Recherche "Extraction et Exploitation de l'Information en Environnements Incertains"

131

négligeable devant l'amplitude associée à chacune des composantes si le lissage temporel se fait surune durée au moins égale à 1/δυ. Ceci est illustré sur la figure suivante, où on présente la PWVLd'un signal composé de deux sinusoïdes pour différentes tailles de la fenêtre G entre elles.

Figure 6.8. Influence de la fenêtre G sur le niveau des termes d'interférence

A partir de cette figure on observe que, pour obtenir une bonne résolution fréquentiellesimultanément avec la réduction du niveau de termes d'interférence, il faut choisir une taillefréquentielle petite (ceci se traduit par une bonne sélectivité fréquentielle).

D'une manière similaire on peut étudier l'influence de la taille de H en prenant commeexemple deux atomes gaussiens, situés à la même fréquence.

Figure 6.9. Influence de la fenêtre H sur le niveau des termes d'interférence

20 40 60 80 100 1200

0.1

0.2

0.3

0.4

20 40 60 80 100 1200

0.1

0.2

0.3

0.4

20 40 60 80 100 1200

0.1

0.2

0.3

0.4

20 40 60 80 100 1200

0.1

0.2

0.3

0.4

DWV

Temps

Fréq

uenc

e (n

orm

alis

ée)

PWVL : taille G - 65

Temps

Fréq

uenc

e (n

orm

alis

ée)

PWVL : taille G - 121

Temps

Fréq

uenc

e (n

orm

alis

ée)

PWVL : taille G - 9

Temps

Fréq

uenc

e (n

orm

alis

ée)

20 40 60 80 100 1200

0.1

0.2

0.3

0.4

20 40 60 80 100 1200

0.1

0.2

0.3

0.4

20 40 60 80 100 1200

0.1

0.2

0.3

0.4

20 40 60 80 100 1200

0.1

0.2

0.3

0.4

DWV

Temps

Fréq

uenc

e (n

orm

alis

ée)

PWVL : taille H - 73

Temps

Fréq

uenc

e (n

orm

alis

ée)

PWVL : taille H - 23

Temps

Fréq

uenc

e (n

orm

alis

ée)

PWVL : taille H - 53

Temps

Fréq

uenc

e (n

orm

alis

ée)

Page 137: carte - representations temps - frequences ENSIETA

6. Représentation temps-fréquence bilinéaires

ENSIETA, Janvier 2002Centre de Recherche "Extraction et Exploitation de l'Information en Environnements Incertains"

132

En pratique, on choisit les tailles des fenêtres H et G telles que, pour un instant donné, dans lafenêtre on a une seule composante temporelle et, respectivement, fréquentielle. Ainsi, en généralisantles résultats illustrés sur 6.8 et 6.9, on peut dire que la PWVL permet d'éliminer tous les termesd'interférence, dans le cas des signaux dont les support fréquentiel ou temporel est superposés. Dansle cas où on a des composantes dont le support ne se superpose pas il faudra faire un compromis entrela résolution souhaitée et le niveau des termes d'interférence. Cette situation est illustrée sur la figuresuivante on considère comme signal de test la somme des quatre atomes gaussiens.

Figure 6.10. Le compromis entre la résolution temps-fréquence et le niveaudes termes d'interférence

Comme on observe sur cette figure il est possible d'éliminer tous les termes d'interférence,mais la résolution temps-fréquence sera affectée en conséquence. Autrement dit, la PWVL nerespecte pas la propriété de conservation des supports, mais, dans les applications pratiques, grâce àces paramètres de contrôle, on peut améliorer la lisibilité de l'image temps-fréquence.

6.2.4. Implémentation de la PWVL [4]

La PWVL diffère de la transformée de Wigner-Ville de base par l’introduction de deuxfenêtres d’analyse l’une agissant sur le temps, l’autre sur la fréquence de manière à limiter les termesd’interférence en localisant l’analyse. Ainsi le nombre de composantes du signal en interactiondiminue et le nombre de termes interférentiels diminue d’autant. La réduction de la distance entretermes qui entrent en interaction permet également de réduire la rapidité de modulation des termesinterférentiels, qui rappelons le, ont une fréquence d’oscillation qui dépend directement de la distancedans le plan temps-fréquence entre les termes à l’origine du terme interférentiel considéré.

L’idée de base est simple, mais la mise en œuvre rend la compréhension des opérationseffectuées délicate au premier abord.

Rappelons la formulation de la transformation de Wigner-Ville lissée:

( ) ( )x

jPWVL et h g s t x s x s ds d, ' ( )ν ττ τ

τπ ν τ= − ⋅ +

⋅ −

⋅ ⋅∗

−∞

+∞

−∞

+∞ − ⋅ ⋅ ⋅ ⋅∫∫ 2 22

La formulation à temps et à fréquence discrète est alors:

20 40 60 80 100 1200

0.1

0.2

0.3

0.4

20 40 60 80 100 1200

0.1

0.2

0.3

0.4

20 40 60 80 100 1200

0.1

0.2

0.3

0.4

20 40 60 80 100 1200

0.1

0.2

0.3

0.4

DWV

Temps

Fréq

uenc

e (n

orm

alis

ée)

PWVL : taille H - 19; taille G -91

TempsFr

éque

nce

(nor

mal

isée

)

PWVL : taille H - 9; taille G -91

Temps

Fréq

uenc

e (n

orm

alis

ée)

PWVL : taille H - 9; taille G -51

Temps

Fréq

uenc

e (n

orm

alis

ée)

Page 138: carte - representations temps - frequences ENSIETA

6. Représentation temps-fréquence bilinéaires

ENSIETA, Janvier 2002Centre de Recherche "Extraction et Exploitation de l'Information en Environnements Incertains"

133

[ ] [ ] [ ] [ ] [ ]xmk

j k fePWVL en k h k g m n x m k x m k, /= × − ⋅ + ⋅ −

⋅∗

=−∞

+∞

=−∞

+∞− ⋅ ⋅ ⋅∑∑ 2 4 2π

(6.53)

Comme dans le cas de la distribution pseudo-Wigner-Ville, il convient d’abord de calculer lesignal analytique (pour l’implémentation voir, le chapitre précédent).

Le calcul du noyau s’effectue alors de la manière suivante:

Le calcul de la fréquence associée à chaque valeur de k est le même que celui effectué pour lapseudo-distribution de Wigner-Ville.

6.3. La classe de Cohen [3]

Dans les sections précédents nous avons introduit la distribution de Wigner-Ville et sesdifférentes versions, créées pour éliminer les inconvénients liés à sa bilinéarité. En addition, il existeplusieurs représentations temps-fréquence bilinéaires qui ont été créées ces dernières années ([1], [2],[3], [5], [6] ). Malgré cette diversité, il existe une expression générale qui unit toutes cesreprésentations bilinéaires, concept introduit par Cohen [3]. Ce cadre général des représentationstemps-fréquence bilinéaires permettra la construction de la distribution la plus optimale pour uneapplication donnée.

Le concept introduit par Cohen est basé sur la fonction d'ambiguïté. On s'appuiera alors sur larelation qui existe entre les fonctions noyau et les représentations temps-fréquence associées. Ladernière section sera consacrée à l'étude des principales approches temps-fréquence, issues de laclasse de Cohen.

6.3.1. La fonction d'ambiguïté [7]

Dans la section (6.1), on a vu que la DWV d'un signal peut être définie (6.9.) comme latransformée de Fourier de la fonction d'autocorrelation instantanée (6.8), en utilisant τ commevariable d'intégration. D'une manière similaire, la fonction d'ambiguïté symétrique (FA symétrique)est définie, de point de vue mathématique, comme la transformée de Fourier de la fonctiond'autocorrelation instantanée, mais en utilisant t comme variable d'intégration :

( ) dttjtstsFAs ϑττ

τϑ −∫

+= exp

22, * (6.54)

qui a été déterminée par Ville et Moyal. D’un point de vue physique, la fonction d'ambiguïté exprimela corrélation entre un signal et sa copie décalée en temps et/ou en fréquence. Elle est une desapproches de base utilisées dans le domaine radar et sonar.

L'expression (6.54) est appelée traditionnellement la fonction d'autocorrelation. D'unemanière similaire, la fonction d’intercorrélation sera définie par :

1. périodisation des échantillons temporels du signal sur 8 foisla durée du signal de base.

2. pour n variant de 1 à N,pour k variant de 1 à 2*N,

pour m variant de -M à +M,

noyau(n,k)=g(m)*sign_anal(n+k+m)*conj(sign_anal(n-k+m)+noyau(n,k);

finpour,noyau(n,k)=abs(h(k))^2*noyau(n,k);

finpour,pWV(n,k)=transformée de Fourier du noyau sur k (ou

en core pour chaque valeur de n).finpour.

Page 139: carte - representations temps - frequences ENSIETA

6. Représentation temps-fréquence bilinéaires

ENSIETA, Janvier 2002Centre de Recherche "Extraction et Exploitation de l'Information en Environnements Incertains"

134

( ) dttjtgtsFA gs ϑττ

τϑ −∫

+= exp

22, *

, (6.55)

Bien que la DWV ait toujours des valeurs réelles, la FA prend généralement des valeurscomplexes :

( ) ( )τϑτϑ ,, ,*

, sggs FAFA ≠ (6.56)

A partir de la relation (6.54) et en utilisant également la transformée de Fourier inverse, onobtient :

( ) ∫

+=

22exp,

21 * ττ

ϑϑτϑπ

tstsdtjFAs (6.57)

Si on substitue cette relation en (6.9), on obtient :

( ) ( ) [ ] ∫∫ −−= τϑϑωττϑπ

ω ddtjFAtDWV ss exp,21

, (6.58)

qui indique que la distribution de Wigner-Ville est la double transformée de Fourier de la fonctiond'ambiguïté symétrique.

La figure suivante illustre, en détail, les relations entre la distribution de Wigner-Ville et lafonction d'ambiguïté symétrique.

On a vu, dans les sections précédentes, que dans le plan temps-fréquence, les termesd’interférence se trouvent situés entre les termes utiles (et d’ici les difficultés d’interprétation). Par lasuite on montrera la propriété la plus importante de la fonction d'ambiguïté, dans le contexte de ladéfinition de la classe de Cohen : dans le plan d’ambiguïté les termes utiles se trouvent concentrés àl’origine et les termes d’interférence sont éloignés de l’origine avec une distance proportionnelle à lafréquence d’oscillation de ces termes dans le plan temps-fréquence.

Figure 6.11. Relation entre la distribution de Wigner-Ville et la fonction d'ambiguïté

On suppose un signal qui est la somme de deux fonction gaussiennes :

( ) ( )x t x t t t j tii

i ii

( ) exp= =

− − +

= =

∑ ∑1

214 2

1

2

2απ

αω (6.59)

Ces deux fonctions gaussiennes sont localisées en ( )t1 1,ω et ( )t 2 2,ω . La fonctiond’ambiguïté symétrique est donnée par:

( ) ( ) ( ) ( )FA FA FA FAx xi x x x xi

ϑ τ ϑ τ ϑ τ ϑ τ, , , ,, ,= + +=

∑ 1 2 2 11

2

(6.60)

L’auto-fonction d’ambiguïté (auto-FA) WVxi est donnée par

( ) ( ) FA j txi i iϑ τα

ϑα

τ ω τ ϑ, exp exp= − +

+1

4 42 2 (6.61)

et les fonctions d’ambiguïté croisées, FAx1,x2 et FAx2,x1 sont:

1−ϑF

1−ϑτ FF

( )τϑ,sFA

+

22* ττ

tsts ( )ω,tDWVsFt Fτ

1−ωF

1−ωFFt

Page 140: carte - representations temps - frequences ENSIETA

6. Représentation temps-fréquence bilinéaires

ENSIETA, Janvier 2002Centre de Recherche "Extraction et Exploitation de l'Information en Environnements Incertains"

135

( ) ( ) ( ) ( ) ( ) ( ) ( ) ( )

FA t j t t

FA t j t t

x x d d d

x x d d d

1 2

2 2

2 1

2 2

14 41

4 4

,

,

, exp exp

, exp exp

ϑ τα

ϑ ωα

τ ω τ ϑ ω

ϑ τα

ϑ ωα

τ ω τ ϑ ω

µ µ µ

µ µ µ

= − − + −

− +

= − + + +

− + (6.62)

tt t

ff f

t t t f f fd dµ µ=+

=+

= − = −1 2 1 21 2 1 22 2

; ; ; (6.63)

A partir de ces relations, on peut voir que les termes (6.61) sont localisés autour de l’origine etles termes d’interférence sont localisées autour des points ( )t d d,ω et ( )− −td d, ω , donc loin de

l’origine (la distance étant déterminée par ( )t d d,ω ), comment on peut le voir sur la figure suivante.

Figure 6.12. La fonction d’ambiguïté des deux signaux gaussiens

En utilisant les mêmes notations qu’en 6.63 et l’expression de DWV (6.8), on obtient ladistribution de Wigner-Ville du même signal :

( ) ( ) ( ) ( )∑ ++==

2

1,, ,,,,

1221i

xxxxxx tWVtWVtWVtWVi

ωωωω (6.64)

où:- les termes propres de la DWV, WVxi, sont donnés par:

( ) ( ) ( ) 2,1;1

exp2, 22 =

−+−−⋅= itttWV iixi

ωωαα

ω (6.65)

- les termes d’interférences de la DWV, WVx1,x2 et WVx2,x1, sont donnés par:

( ) ( ) ( ) ( )( )[ ] ttj

tttWVtWV

dd

xxxx

ωωω

ωωα

αωω

µ

µµ

+−×

−+−−⋅==

exp

1exp2,, 22

,, 1221 (6.66)

Si on écrit la DWV et la FA en fonction de l'amplitude et de la phase,( ) ( ) ( )

( ) ( ) ( ) τϑϕτϑτϑ

ωϕωω

,exp,,

,exp,,

21

21

,

,

FAFAxx

DWVDWVxx

jAFA

tjtAtDWV

=

=(6.67)

En utilisant (6.62) et (6.66) on en déduit :

( ) ( ) µµ ωτϑϕτ

τϑϕϑ

=∂∂

−=∂∂

,, FAFA t (6.68)

qui signifie que les dérivées partielles de la phase de la fonction d'ambiguïté représentent les centresen temps et en fréquence du même atome, mais dans le plan de Wigner-Ville. De la même manière

τ

ϑ

FAx2,x1

− ωd

FAx1,x2

ωd

td

-td

FAx1+ FAx2

Page 141: carte - representations temps - frequences ENSIETA

6. Représentation temps-fréquence bilinéaires

ENSIETA, Janvier 2002Centre de Recherche "Extraction et Exploitation de l'Information en Environnements Incertains"

136

( ) ( ) dFAdDWV tt

tt ωωϕωϕω

=∂∂

=∂∂

,, (6.69)

qui assure la réciprocité. Cette propriété est présentée sur la figure suivante. On observe que, parrapport à la fonction d’ambiguïté, la situation est inverse : les termes d’interférences WVx1,x2 etWVx2,x1 occupent la même position et, par conséquent, leur amplitude est deux fois plus grande que

l’amplitude des termes propres. En plus, les interférences sont placées autour du point ( )tµ µω, , donc,

entre les termes utiles. Cela est présenté sur la figure suivante; on représente également le pland’ambiguïté pour illustrer la propriété énoncée auparavant.

Figure 6.13. La liaison entre la DWV et la FA

Si ω1=ω2=ω0 (les deux signaux gaussiens ont le même centre fréquentiel), alors la FAx1,x2

donnée par (6.62) devient :

( ) ( ) ( ) µϑτωτα

ϑα

τϑ tjtFA dxx −

−+−= 0

222,1 exp

441

exp, (6.70)

qui est concentrée sur l'axe retard (τ). La distance entre le centre de FAx1,x2 et l'origine est dt ,comme montré sur la figure 6.14.

Figure 6.14. La correspondance entre le plane temps-fréquence ete plane d'ambiguïté pour ω1=ω2=ω0

D'une manière similaire, pour t1=t2=t0, la fonction d'ambiguïté sera concentrée sur l'axe ϑ et(6.62) devient :

( ) ( ) ( ) 0022

12,1 exp44

1exp, ttjFA ddxx ωϑτωτ

αωϑ

ατϑ µ +−

+−−= (6.71)

En conclusion, la propriété de la fonction d'ambiguïté d'éloigner les termes d'interférencereprésente la base de la plupart des méthodes de réduction des termes d’interférences. A partir de laliaison établie ci-dessus, on peut définir différentes transformations temps-fréquence, chacune étantadaptée à une certaine classe de signaux.

t

ω

ω µ

WVx1,x2+WVx2,x1

1.3. Plaτ

ϑ

FAx2,x1

FAx1,x2 td

-td

1.4. Pla

t

ω

t1 t2tµ

ω1

ω µ

ω2

WVx1

WVx2

WVx1,x2+WVx2,x1

1.1. Plaτ

ϑ

FAx2,x1

− ωd

FAx1,x2

ωd

td

-td

FAx1+ FAx2

1.2. Pla

Page 142: carte - representations temps - frequences ENSIETA

6. Représentation temps-fréquence bilinéaires

ENSIETA, Janvier 2002Centre de Recherche "Extraction et Exploitation de l'Information en Environnements Incertains"

137

6.3.2. La définition de la classe de Cohen [6]En 1966, Leon Cohen a finalisé, en utilisant les fonctions caractéristiques et la théorie des

opérateurs, une classe générale qui engendre toutes les transformations temps-fréquence bilinéaires.En accord avec [6], la fonction d'autocorrélation instantanée est définie par :

( ) ( ) ( ) ϑϑτϑτϑπ

τ dtjFAtR exp,,21

, ∫ Φ= (6.72)

où ( )τϑ,FA est la fonction d'ambiguïté symétrique définie par (6.54) et ( )τϑ ,Φ est la fonction noyau.En utilisant le théorème de convolution, (6.72) peut être réécrite selon :

(6.73)

où ( )τφ ,t représente la transformée de Fourier inverse de ( )τϑ ,Φ . Cette équation indique que lafonction d'autocorrélation instantanée proposée par Cohen est une version filtrée linéairement des(t+τ/2)s*(t-τ/2), qui représente la fonction d'autocorrelation employée par la distribution de Wigner-Ville. En conséquence, la différence entre la DWV et les autres distributions de la classe de Cohen(comme la distribution de Choi-Williams) est complètement déterminée par la nature du filtre ( )τφ ,t .Si ( )τφ ,t est un filtre passe-tout, c'est-à-dire ( )τϑ ,Φ =1, ( )τ,tR devient :

( ) ( )

+=∫=

22exp,

21

, * ττϑϑτϑ

πτ tstsdtjFAtR (6.74)

qui représente l'expression de la fonction d'autocorrelation employée par la distribution de Wigner-Ville. L'expression générale de la classe de Cohen s'obtient en remplaçant, dans la définition duspectre de puissance dépendant du temps (6.3.), l'expression de ( )τ,tR proposée par Cohen (relation(6.72)) :

( ) ( ) ( ) ( ) ∫ −∫ Φ= τϑωτϑτϑτϑπ

ω ddtjFAtC exp,,21

, (6.75)

D'une manière alternative, en remplaçant (6.73) en (6.3.) on obtient la deuxième définition dela classe de Cohen :

( ) ( ) τωττφττ

ω djduutusustC −∫ ∫ −

+= exp,

22, * (6.76)

En utilisant également la définition de la distribution de Wigner-Ville (6.9) on obtient, à partirde (6.76), la troisième définition de la classe de Cohen :

( ) ( ) ( )∫∫ −−Π= ξηξηωξηω ddDWVttC s ,,, (6.77)

où( ) ( ) ( )

∫∫=Π +− ξηξηφω ωξηπ ddet tj 2,, (6.78)

représente la transformée de Fourier bidimensionnelle du noyau.Pour calculer la fonction d'ambiguïté d'un signal il faut disposer de valeurs du signal sur tout

le support de définition. Ceci n'est pas toujours possible en pratique, et, par conséquent, la définition(6.76) sera envisageable pour des applications en temps réel.

Les relations (6.75) et (6.76) représentent le point clé de l'approche de Cohen : le problèmede la construction d'une RTF est ramené à la sélection de la fonction noyau ( )τϑ ,Φ . Ainsi chaquepropriété de la RTF se traduit par une condition imposée à la structure de la fonction noyau. Cesliaisons sont présentées, pour les plus importantes d’entre elles, dans le tableau suivant.

( ) ( )[ ] ( )[ ]

( )

( )∫ −

+=

=⊗

+=

=Φ⊗= −−

duutusus

ttsts

FFAFtR

τφττ

τφττ

τϑτϑτ

,22

,22

,,,

*

*

11

Page 143: carte - representations temps - frequences ENSIETA

6. Représentation temps-fréquence bilinéaires

ENSIETA, Janvier 2002Centre de Recherche "Extraction et Exploitation de l'Information en Environnements Incertains"

138

Tableau 6.1. Contraintes induites sur le noyau par les propriétés de la RTF correspondantePropriétés Contraintes sur le noyau

1. Invariance par translation temporelle Indépendance de temps (t)2. Invariance par translation fréquentielle Indépendance de fréquence (ω)3. Valeurs réelles ( ) ( )τϑτϑ −−Φ=Φ ,,4. Marginal en temps ( ) 10, =Φ ϑ5. Marginal en fréquence ( ) 1,0 =Φ τ6. La fréquence instantanée

( ) ( ) 0,et 10, 0 =Φ∂∂

=Φ =ττϑτ

ϑ

7. Le retard de groupe( ) ( ) 0,et 1,0 0 =Φ

∂∂

=Φ =ϑτϑϑ

τ

8. Positivité ( )τϑ,Φ est la fonction d'ambiguïté d'un fonction

γ(t)

Par la suite on liera les approches temps-fréquence classiques déjà introduites (spectrogrammeet PWVL) au cadre général de la classe de Cohen.

Tout d'abord, on montre que le spectrogramme appartient à la classe de Cohen. On supposeune fonction temporelle γ(t) dont la fonction d'ambiguïté vaut :

( ) dttjtt ϑτ

γτ

γτϑ −∫

+=Φ exp

22, * (6.79)

et, par la transformée de Fourier inverse, on obtient :

( )

+=

22, * τ

γτ

γτφ ttt (6.80)

En remplaçant (6.80) en (6.76) on obtient :

( )

−−∫

+−

+−∫

+=

=∫∫ −

+

−−

+−=

ττ

ωτ

γττ

ωτ

γτ

τωττττ

γτ

γω

dujutusduujutus

dudjususututtC

2exp

222exp

22

exp2222

,

**

*

Avec les changements de variables 2τ

+= ux et 2τ

−= uy on obtient :

( ) ( ) ( ) ( ) ( ) ( ) ( )( ) ( ) ( ) ( )ωωωω

ωγωγω

,,,,

expexp,2

**

* tSPtTFCTtTFCTtTFCT

dyyjytysdxxjxtxstC

ssss ===

=∫ −−∫ −−=(6.81)

En conclusion, le spectrogramme peut être interprété comme une distribution de la classe deCohen pour un noyau déterminé par une fonction temporel le γ(t). Une autre interprétation duspectrogramme peut être obtenue en utilisant la formule de Moyal, qui permet d'exprimer lespectrogramme par :

( ) ( ) ( )∫∫ −−= ξτξτωξτπ

ω γ ddDWVtDWVtSP ss ,,4

1,

2(6.82)

En conséquence, le spectrogramme peut être vu comme la distribution temps-fréquence de laclasse de Cohen pour laquelle ( )τϑ ,Φ est la DWV de la fenêtre γ(t). Cette nouvelle formulation nouspermet de mettre en évidence, d'une façon alternative, le compromis entre la résolution temporelle etfréquentielle du spectrogramme : si on choisit une fenêtre d'analyse courte, la fonction de lissage de laDWV sera étroite en temps et large en fréquence, en fournissant une bonne résolution temporelle etune mauvaise résolution fréquentielle.

Page 144: carte - representations temps - frequences ENSIETA

6. Représentation temps-fréquence bilinéaires

ENSIETA, Janvier 2002Centre de Recherche "Extraction et Exploitation de l'Information en Environnements Incertains"

139

Le problème avec le noyau employé par le spectrogramme est dû au fait qu’on ne dispose qued'un seul degré de liberté pour le choix du noyau. Si on rajoute encore un degré de liberté par ladéfinition de fonction noyau suivante :

( ) ( ) ( )ωω −Γ=Π tgt, (6.83)

(où ( )ωΓ est la transformée de Fourier de la fenêtre γ(t)) on pourra contrôler indépendamment laperformance de la nouvelle RTF sur toutes les deux axes (temps et fréquence). On obtient ladistribution Pseudo Wigner-Ville Lissée, qui a été présenté dans la section (6.2.1). Le compromisassocié au spectrogramme entre la résolution temporelle et fréquentielle est remplacé, dans le cas dela PWVL, par le compromis entre la résolution temps-fréquence et le niveau de termes d'interférence.

En termes pratiques, on multiplie la fonction d'autocorrélation locale du signal par une fenêtreglissante γ centrée en t puis on prend sa DWV. Cette opération correspond à un lissage selon l’axedes fréquences. La DWV du signal fenêtré est ensuite lissée selon l’axe de temps, par un filtre deréponse impulsionnelle g. Par ce lissage séparable, on peut régler indépendamment lescaractéristiques de lissage selon l’axe des temps et selon l’axe des fréquences. D’une manièregénérale, le lissage spectral, introduit sous la forme d’une fenêtre glissante, vise à atténuer lesinterférences entre les composantes temporelles, tandis que le lissage temporel vise à atténuer lesinterférences entre les composantes fréquentielles.

Sur la figure 6.15. on présente la PWVL d’un signal constitué par deux MLF (2 chirps), avecla RTF idéelle présentée sur la même figure. Pour comparaison on représente également la DWV :malgré à une bonne résolution, la DWV introduit beaucoup des termes d’interférences.

Le principe de la PWVL, présenté ci-dessus, consiste en l’application d’un lissage temporel etfréquentiel, ce qui est équivalent avec l’application d’un noyau rectangulaire dans le plan d’ambiguïté(voir la figure 6.15.). Conformément à la propriété de la FA, démontré dans la section 6.3.1.), par cenoyau on va garder les termes propres (qui se trouve autour de l’origine) et on va éliminer la plupartdes termes d’interférences.

Néanmoins, l’application de ce noyau va diminuer la résolution T-F ; pour optimiser larésolution on va effectuer un lissage indépendant en temps et un fréquence. La recherche desparamètres optimaux de lissage est souvent difficile à réaliser et, donc, l’application de cette méthodeest limitée dans le cas où on connaisse la structure du signal.

Figure 6.15. Comparaison entre la DWV et la PWVL

Ainsi, une application qu’on peut l’envisagée est le débruitage des signaux.

6.3.3. Les membres de base de la classe de Cohen [6]

Le grand intérêt pour l’étude de la classe de Cohen, pendant ces dernières années, a été ladécouverte de nouvelles représentations temps-fréquence qui permettent à la fois de conserver toutesles propriétés utiles d’une RTF mais aussi la suppression de termes d’interférence. Comme nous

RTF idéelle

Fréq

uenc

e

Distribution de Wigner-Ville

Temps

Fréq

uenc

e

Temps

Noyau

Retard

Dop

pler

Plan d’ambiguïté

Fréq

uenc

e

Temps

Pseudo Wigner-Ville Lissée

Page 145: carte - representations temps - frequences ENSIETA

6. Représentation temps-fréquence bilinéaires

ENSIETA, Janvier 2002Centre de Recherche "Extraction et Exploitation de l'Information en Environnements Incertains"

140

avons vu dans la section 6.3.1., la partie de la fonction d’ambiguïté qui correspond aux termespropres est localisée autour de l’origine du plan d’ambiguïté, tandis que la partie correspondante auxtermes d’interférence tend de se distribuer plus loin de l’origine. Cette propriété a été à la base deplusieurs études pour la construction d’une fonction noyau ( )τϑ ,Φ afin que le produit

( ) ( )τϑτϑ ,, FAΦ soit localisé au voisinage de l’origine. Cependant, en introduisant quelques

contraintes sur ( )τϑ ,Φ , on peut assurer, selon le tableau 6.1., la conservation d’une partie despropriétés utiles, en fonction d’une application concrète. Néanmoins, la satisfaction de ces propriétéset la suppression des termes d’interférence ne peuvent pas être accomplies simultanément. Parexemple, pour réduire les termes d’interférence, le produit ( ) ( )τϑτϑ ,, FAΦ doit être nul pour ϑ etτ grands. De l’autre côté, les propriétés de marginales en temps et en fréquence imposent :

( ) ( ) ( ) ( ) ( ) ( )τττϑϑϑ ,0,0,00,0,0, FAFAFAFA =Φ=Φ (6.84)

qui impliquent l’existence non-nulle de ce produit sur les axes ϑ et τ . Mathématiquement, cettecondition est en contradiction avec celle qui est nécessaire pour assurer la réduction des termesd’interférence. En pratique, il va falloir réaliser un compromis entre la satisfaction des propriétésutiles et le niveau de termes d’interférence résidents.

Dans cette section on présente quelques RTFs qui représentent les éléments de base de laclasse de Cohen. On présente la spécificité de chacune des méthodes concernant la réduction destermes d’interférence et les conséquences sur la conservation des propriétés utiles.

A. La distribution de Choi-Williams DCW [8]

Pour éliminer, dans le plan d’ambiguïté, les termes qui se trouvent loin de l’origine, Choi etWilliams [8] ont proposé l’introduction d’un noyau exponentiel :

( ) ( )

−=Φ

2

2

2exp,

σ

ϑτπτϑ (6.85)

Le paramètreσ 2 contrôle le taux de décroissance de la fonction exponentielle. Si ce paramètreest petit on éliminera la plupart des termes d’interférence, mais on affectera les termes propres. Ils’agira toujours d’un compromis pour le choix de σ 2 .

L’expression de la distribution CW est :

(6.86)

Sur la figure suivante on présente l’exemple d’application de la distribution de CW dans le casdu même signal de test utilisé antérieurement pour la PWVL.

Figure 6.16. Distribution de Choi-Williams

Sur la figure suivante on présente la structure du noyau de la DCW pour σ 2 =0.03.

( )( )

τττ

τσ

πτπτ

σ

dsdesxsxeftCW fjts

x2*

2

222

, 2

22

−∞

∞−

−−

∫ ∫

+=

Distribution de Choi-Williams

Fréq

uenc

e

TempsRetard

Dop

pler

Plan d’ambiguïté

Page 146: carte - representations temps - frequences ENSIETA

6. Représentation temps-fréquence bilinéaires

ENSIETA, Janvier 2002Centre de Recherche "Extraction et Exploitation de l'Information en Environnements Incertains"

141

Figure 6.17. La représentation graphique du noyau de la DCW pour σ 2 =0.03

L’expression du noyau, donnée en (6.83), satisfait les propriétés imposées aux noyaux (voir letableau 6.1.). Cela représente un avantage par rapport à la PWVL où ces propriétés étaient respectéesseulement pour des noyaux avec des structures particulières. Un autre avantage est représentée par larésolution T-F obtenue (voir la figure 6.15. et 6.16.) qui est meilleure dans le cas de la distribution deChoi-Williams. En plus, cette transformation est plus facilement applicable en pratique que la PWVLcar dans ce cas on a un seul paramètre à régler (σ 2 ) alors que dans le cas de la PWVL il nous fautchoisir deux fenêtres de lissage.

Néanmoins, en raison de la structure du noyau utilisé (qui présente les propriétés :( ) ( )φ φ ξ τ ξ τ0 0 1 1 0 0, , ,= < ≠ ≠et si ), on peut rejeter tous les termes d’interférence entre les

fonctions avec des centres temps-fréquence différents, mais on garder les termes d’interférences entreles composants avec les support temporel et/ou fréquentiel superposés. Sur la figure suivante onprésente ces deux cas.

Figure 6.18. La géométrie des interférences pour la distribution CW

A cause de cet inconvénient, l’utilisation de la distribution de CW pour de signaux avec dessupports superposés (le cas des signaux TDMA – Time Division Multiply Acces, par exemple) estlimitée. Pour éliminer cet inconvénient, une idée consiste à modifier l’orientation du noyau (quirestera gaussien) pour que les singularités du signal soient bien mises en évidence dans le pland’ambiguïté. Cette approche, appelée représentation temps-fréquence par le noyau gaussien adaptatif(RTF-NGA) sera présentée dans le sous-chapitre suivant.

B. La distribution de Rihaczek (DR) et la distribution de Margenau-Hill (DMH) [6], [9]

En [9], Rihaczek a proposé une expression alternative pour la distribution de l’énergie temps-fréquence d’un signal. Ainsi, il a considéré l’interaction énergétique entre un signal s restreint à unintervalle infinitésimal δT centré en t et le même signal s passé par un filtre passe-bande de bandeinfinitesimale δB centré en υ. Cette interaction peut être exprimée par :

Temps

Fréq

uenc

e

DCW des atomes avec des centres T-F différents

Temps

Fréq

uenc

e

DCW des atomes avec le support fréquentiel superposé

RetardDoppler

Projection 2D

RetardDoppler

Am

plitu

deReprésentation 3D du noyau de la DCW

Page 147: carte - representations temps - frequences ENSIETA

6. Représentation temps-fréquence bilinéaires

ENSIETA, Janvier 2002Centre de Recherche "Extraction et Exploitation de l'Information en Environnements Incertains"

142

( ) ( )[ ]tjBT eSts πυυδδ 2* − (6.87)

Cette grandeur nous permet d’introduire la distribution de Rihaczek par :( ) ( ) ( ) tj

s eStstR πυυυ 2*, −= (6.88)

qui représente la distribution de l’énergie du signal autour d’un point (t, υ). Cette distribution est unélément de la classe de Cohen ([6]) pour lequel la fonction de noyau est définie par :

( ) πϑττϑ je=Φ , (6.89)

Comme cette relation le montre, le noyau aura une forme complexe ; sur la figure suivante onprésente le module carré de ce noyau.

Figure 6.19. Représentation graphique 3D du noyau de la distribution de Rihaczek

Par transformé de Fourier inverse, on retrouve l’expression temporelle du noyau :

( )

−=

2,

τδτφ tt (6.90)

Cette distribution respecte toutes les propriétés présentées dans le tableau 6.1., sauf lapropriétés 3 : à cause de la forme complexe du noyau cette distribution prendra des valeurscomplexes, difficiles à interpréter en pratique. Pour éliminer cet inconvénient, Margenau et Hill ontutilisé seulement la partie réelle de la distribution de Rihaczek, en introduisant la distribution deMargenau-Hill. Celle-ci est également un élément de la classe de Cohen pour lequel la fonctionnoyau a pour expression (voir la figure 6.20) :

( ) ( )πϑττϑ cos, =Φ (6.91)

Figure 6.20. Représentation graphique 3D du noyau de la distribution de Margeneau-Hill

La structure des termes d’interférence générés par les distributions de Rihaczek et Margenau-Hill est différente par rapport à la géométrie des termes d’interférence générés par la distribution deWigner-Ville : les termes d’intérference associés aux points (t1,υ1) et (t2,υ2) sont localisés aux points(t1,υ2) et (t2,υ1). Pour démontrer cette propriété on suppose un signal s(t)=s1(t)+s2(t) où s1(t) et s2(t)sont deux atomes gaussiens dont la transformée temps-fréquence idéale est illustrée sur la figure6.21.a. L distribution de Rihaczek de s(t) est donnée par :

( ) ( ) ( )[ ] ( ) ( )[ ] ( ) ( ) ( ) ( )

( ) ( ) ( ) ( ) ( ) ( ) ( ) ( )4444 34444 21ceintérferend' termes

,,2*

122*

21

2*22

2*11

2*2121

,,,,

,

122121υυυυυυ

υυυυυπυπυ

πυπυπυ

tRtRtRtReStseSts

eStseStseSStststR

sssssstjtj

tjtjtjs

+++=++

++=++=−−

−−−

(6.92)

RetardDoppler

Am

plitu

de

RetardDoppler

Am

plitu

de

Page 148: carte - representations temps - frequences ENSIETA

6. Représentation temps-fréquence bilinéaires

ENSIETA, Janvier 2002Centre de Recherche "Extraction et Exploitation de l'Information en Environnements Incertains"

143

Cette relation montre que les termes d’interférence sont situés autour des centres énergétiquesde s1(t)S2(υ) et, respectivement, s2(t)S1(υ). Autrement dit, les termes d’interférence sont situés autourde points (t1,υ2) et (t2,υ1), comme montré sur la figure 6.21.b.

Figure 6.21. Les termes d’interférence générés par la distribution de Rihaczek

Ainsi, l’utilisation de la distribution de Rihaczek ou de Margeneau-Hill n’est pas envisageablepour des signaux multi-structures, avec des composantes localisés à la même position temporelle oufréquentielle.

C. La distribution de Page [10]

Motivé par la construction d’une densité d’énergie causale, plus adaptée à l’implémentationpratique, Page [10] a proposé la distribution temps-fréquence suivante :

( ) ( ) ( ) ( )

=

= −∞−

−∞−

− ∫∫ tjt ujt ujs edueustxdueus

dtd

tP πυπυπυυ 2*

22

2 Re2, (6.93)

Celle-ci correspond à l’élément de la classe de Cohen pour lequel la fonction noyau est définiepar :

( ) τπϑτϑ je−=Φ , (6.94)

dont l’expression temporelle vaut :

( )

−=

2,

τδτφ tt (6.95)

Le noyau spécifique à cette distribution est présenté sur la figure suivante :

Figure 6.22. Le noyau de la distribution de Page

Ce noyau vérifie la plupart de propriétés présentées dans le tableau 6.1. sauf 3 et 8. En plus,par rapport à la DWV, la distribution de Page ne respecte pas la propriété de compatibilité parfiltrage. Néanmoins, l’intérêt pour la distribution de Page est due au fait qu’elle est le seul élément dela classe de Cohen qui est simultanément causal, unitaire, compatible avec les modulations et quiconserve les supports temporel et fréquentiel.

La géometrie de termes d’interférence est similaire à celle de la distribution de Rihaczek (voir[3]) d’ou les mêmes limitations pratiques.

Temps

Fréq

uenc

e

t1 t2

υ2

υ1

a. RTF idéale de deux atomes gaussiens

Signal de test : 2 atomes gaussiens

Distribution de Rihaczek

Temps

Fréq

uenc

e

b. Distribution de Rihaczek

RetardDoppler

Am

plitu

de

Page 149: carte - representations temps - frequences ENSIETA

6. Représentation temps-fréquence bilinéaires

ENSIETA, Janvier 2002Centre de Recherche "Extraction et Exploitation de l'Information en Environnements Incertains"

144

D. Distributions de Born-Jordan (DBJ) et Zhao-Atlas-Marks (DZAM) [1,11]

Pour assurer la propriété de conservation des supports temporel et fréquentiel, Born et Jordanont proposé une fonction noyau de la forme suivante :

( ) ( )πϑτ

πϑττϑ

sin, =Φ (6.96)

Cette fonction définit la distribution de Born-Jordan exrpimée par :

( ) ( ) ( )∫∫+

−∞

∞−

−+=2/

2/

2* 2/2/1

τ

πυτ ττττ

υt

t

js ddueusustBJ (6.97)

Sur la figure suivante on présente le noyau de la distribution de Born-Jordan. On observe quela forme de ce noyau s’approche de celle du noyau de la distribution de Choi-Wiliams, mais, parrapport à celle-ci, la distribution de Born-Jordan respecte la propriété de conservation du supporttemps-fréquence.

Figure 6.23. Représentation du noyau de Born-Jordan

Ceci est mis en évidence sur la figure suivante où on représente la DCW et la DBJ d’un signalcomposé de deux sinusoïdes de fréquences différentes, avec le même support temporel (voir 6.24.a).

Figure 6.24. Comparaison entre la distribution de Choi-Wiliams et de Born-Jordan

Une autre observation pratique qu’on puisse faire est que la géométrie des termesd’interférence générés par ces deux distributions est la même (figure 6.24.b et 6.24.c) : on aura

RetardRetard

Doppler

Dop

pler

Apl

itude

Représentation spatiale Projection 2D

RTF idéale

Temps

Fréq

uenc

e

a.Distribution de Choi-Williams

Temps

Fréq

uenc

e

b.Distribution de Born-Jordan

Temps

Fréq

uenc

e

c.

Page 150: carte - representations temps - frequences ENSIETA

6. Représentation temps-fréquence bilinéaires

ENSIETA, Janvier 2002Centre de Recherche "Extraction et Exploitation de l'Information en Environnements Incertains"

145

toujours des termes d’interférence entre les composantes dont les supports temporels et/oufréquentiels sont superposés. Ceci est dû à la structure des noyaux employés [3] et la réduction totalede ces termes peut se faire par un lissage fréquentiel. Néanmoins, pour le même niveau de termesd’interférence, la distribution de Born-Jordan conserve le support temporel des atomes du signal(l’explication sera donnée dans le paragraphe correspondant à la distribution de Z.A.M.) (figure6.24.c), tandis que, dans le cas de la distribution de Choi-Williams, la réduction des termesd’interférence suppose l’utilisation d’un noyau étroit, qui induit une redistribution de l’énergie endehors du support physique du signal (figure 6.24.b).

Un autre avantage de la DBJ est lié au fait que, dans ce cas, il n’y aucun paramètre à choisir,par opposition à DCW où le choix de σ est essentiel pour avoir une bonne lisibilité de l’image temps-fréquence issue.

Comme on vient de l’observer sur la figure précédente, la réduction totale des termesd’interférence peut se faire par un lissage temporel à travers l’axe fréquentiel.

Ceci a été exploité par Zhao, Atlas et Marks [11], qui ont proposé l’utilisation d’une fenêtre delissage h, capable de générer un noyau de forme conique (« cone-shape kernel ») et capable deproduire une atténuation importante des termes d’interférence. En effet, la distribution proposée peutêtre vue comme étant une généralisation de la distribution de Born-Jordan, pour une fenêtre arbitraireh :

( ) ( ) ( ) ( )∫∫+

−∞

∞−

−+=2/

2/

2* 2/2/,τ

τ

πυτ ττττυt

t

js ddueusushtZAM (6.98)

On observe que pour ( )τ

τ1

=h on retrouve l’expression de la DBJ. Cette nouvelle distribution,

qui fait partie de la classe de Cohen, utilise une fonction noyau de forme temporelle conique (commela distribution de Born-Jordan), dans le plan (t,τ) (voir la figure 6.25), donnée par :

( ) ( ) ≥

=sinon,0

2,,

tht

τττφ (6.99)

Figure 6.25. Représentation graphique de φ(t,τ)

On montre alors que la forme conique du noyau assure la conservation du support temporel (ladémonstration sera similaire dans le cas fréquentiel). On suppose un signal de support temporellimité, donné par :

( ) [ ][ ]

−∉=−∈≠

=2/,2/,02/,2/,0

TTtTTt

ts (6.100)

On cherche la forme générale de φ(t,τ) pour laquelle la RTF associée conserve le supportfréquentiel :

τ

t

τ=2tτ=-2t

a. Fonction de forme conique

Am

plitu

de

b. Représentation spatiale de φ(t,τ)

Page 151: carte - representations temps - frequences ENSIETA

6. Représentation temps-fréquence bilinéaires

ENSIETA, Janvier 2002Centre de Recherche "Extraction et Exploitation de l'Information en Environnements Incertains"

146

( ) [ ][ ]

−∉=−∈≠

=2/,2/,02/,2/,0

,TTtTTt

tCs ω (6.101)

En introduisant l’expression de s(t) en (6.76), on obtient :

( ) ( ) ττφττ

ω ωτ

τ

τ

deduutusustC j

Tt

Tt

s−

∞−

++

−−

∫ ∫

+=

22

22

* ,22

, (6.102)

Pour que l’intervalle d’intégration ne soit pas défini en dehors de support utile, [-T/2,T/2] onimpose que φ(t,τ)=0 pour t2<τ . Ainsi, on assure que les RTFs associées à ce type de noyau (lesdistributions de Born-Jordan et Zhao-Atlas-Marks sont les plus connues) respectent les propriétés deconservation des supports temporel et fréquentiel. Dans le domaine d’ambiguïté, le noyau aura pourexpression :

( ) ( ) ( ) ( )∫− =−=Φ

2/

2/

2/sin2exp,

τ

τ ϑϑτ

τϑττϑ hdttjh (6.103)

La réduction des termes d’interférence dépend du choix de la fonction h(τ). Zhao, Atlas etMark ont proposé l’expression suivante pour cette fonction [11] :

( ) 2exp1

αττ

τ −=h (6.104)

Ainsi, la fonction noyau devient :

( ) ( ) 0exp2/

2/sin, 2 >−=Φ αατ

ϑτϑτ

τϑ (6.105)

Dans le plan d’ambiguïté, le noyau sera défini par :

( )

=−=

=Φ0exp01

, 2 ϑαττ

τϑ (6.106)

Sur la figure suivante on présente ce noyau pour deux valeurs du paramètre α.

Figure 6.26. Le noyau de la distribution de Zhao-Atlas-Marks

Noyau de la DZAM : α=0.3 Noyau de la DZAM : α=0.003

Projection 2D Projection 2D

DopplerRetardDoppler

Retard

Ret

ard

Doppler

Am

plitu

de

Am

plitu

de

Ret

ard

Doppler

Page 152: carte - representations temps - frequences ENSIETA

6. Représentation temps-fréquence bilinéaires

ENSIETA, Janvier 2002Centre de Recherche "Extraction et Exploitation de l'Information en Environnements Incertains"

147

Le paramètre α contrôle le degré de suppression des termes d’interférence : pour α grand, ilest possible d’éliminer une grande partie des termes d’interférence, surtout ceux qui se trouvent surl’axe de retard (figure 6.26). Pour α petit les performances de la DZAM, au niveau de la réductiondes termes d’interférence, sont identiques à celles de la DBJ.

Par rapport au noyau de la distribution de Choi-Williams, qui conserve les termes qui setrouvent sur les axes retard et Doppler (figure 6.17), le noyau de la DZAM élimine les termes qui sontlocalisés sur l’axe retard. En conséquence, cette distribution permettra d’éliminer tous les termesd’interférence crées par des fonctions avec le même support fréquentiel. Pour illustrer cette propriété,on considère le signal de test utilisé sur l’exemple donné sur la figure 6.18.

Figure 6.27. Comparaison entre la DCW et la DZAM

Dû à la forme du noyau, dans le cas de la distribution de Zhao-Atlas-Marks, les termesd’interférence sont réduits. Grâce à ces performances, cette distribution a été beaucoup utilisée dansle contexte de l’analyse de la parole [1], [11].

6.3.4. Conclusion

Dans cette section nous avons abordé la problématique des RTFs issues de la classe de Cohen.Nous avons vu que chaque élément de cette classe est lié, d’une manière univoque, à une fonctionnoyau de parametrisation.

En fonction du choix de ce noyau, on peut obtenir différentes distributions temps-fréquence,adaptées pour une certaine classe de signaux. Par exemple, la distribution de Wigner-Ville (qui estobtenue pour ( )τυφ , =1) est bien adaptée à des signaux de modulation linéaire de fréquence.

Une autre propriété importante des distributions de la classe de Cohen est l’invariance partranslation en temps et en fréquence. Cette propriété est très utile en traitement du signal radar ousonar, où on ne connaît pas la position du signal reçu dans le plan temps-fréquence.

Malheureusement, la propriété de biliniarité induit des termes d’interférence, qui affectentgravement le processus d’interprétation de l’information dans le plan temps-fréquence. Commesolution potentielle, on peut envisager la construction d’un noyau susceptible de ne retenir que lestermes propres. Mais, un noyau fixé ne peut assurer des bonnes performances que pour une classeétroite des signaux.

Retard

Dop

pler

Retard

Dop

pler

Retard

Dop

pler

( )τϑ,sFADCW : ( ) ( )τϑτϑ ,, ΦsFA DZAM : ( ) ( )τϑτϑ ,, ΦsFA

Temps

Fréq

uenc

e

Temps

Fréq

uenc

e

Noyau de laDCW

Noyau de laDZAM

DCW DZAM

Page 153: carte - representations temps - frequences ENSIETA

6. Représentation temps-fréquence bilinéaires

ENSIETA, Janvier 2002Centre de Recherche "Extraction et Exploitation de l'Information en Environnements Incertains"

148

Pour ces raisons, il est apparu un fort intérêt pour les distributions temps-fréquence avec desnoyaux adaptés aux structures des signaux (noyau dépendant du signal). Un noyau optimal, commeon le verra dans le paragraphe suivant, appliqué dans le plan d’ambiguïté du signal, permet une trèsbonne extraction des caractéristiques du signal.

6.4. Le noyau gaussien adaptatif

Un choix naturel du noyau peut être le noyau gaussien, qui nous assure un meilleur compromis entrela résolution temps-fréquence [1]. Ce choix, spécifique à la transformation de Choi-Williams,représente le point de départ pour l’approche qu’on présentera par la suite.Tout d’abord, on introduit, dans la structure du noyau gaussien classique, un paramètre variable(6.107), qui permet l’adaptation du noyau à la structure du signal , dans le plan d’ambiguïté.

(6.107)

où σ(ψ) représente la distribution des points du noyau pour un certain angle ψ. On appelera cettevariable « la fonction de distribution angulaire » .L’angle ψ est mesuré par rapport à l’axe τ, :

τϑ

ψ arctan= (6.108)

où ( )ϑτ , - représente la paire retard-Doppler.La nouvelle structure de ce noyau permet l’utilisation d’une procédure d’optimisation pour

adapter la forme de celui-ci à la structure du signal. Pour la construction efficace de cette procédure,on utilise l’expression du noyau en coordonnées polaires (6.109). La méthode de transformation estdétaillée en [12].

L’expression (6.109) montre que, en effet, l’optimisation du noyau est équivalente àl’optimisation du choix de ψ.

(6.109)

La procédure d’optimisation consiste à chercher φopt qui maximisera la fonction présentéedans la relation (6.110) :

(6.110)

Cette fonction représente la distribution d’énergie dans le plan d’ambiguïté, pour différentesvaleurs de l’angle ψ. Le but est de trouver les valeurs optimales de ψ pour lesquelles cette distributionest maximale. En conséquence, les valeurs obtenues permettront de mettre en évidence lescomposants d’un signal multi-structures.

L’intérêt pour l’optimisation dans le plan d’ambiguïté est justifié par la propriété deséparation entre les termes utiles et les termes d’interférence : lorsque dans le plan temps-fréquenceles termes d’interférence se trouvent parmi les composantes utiles, dans le plan d’ambiguïté ils sontplacés loin d’origine (voir la section 6.3). Donc, on peut faire l’extraction des termes utiles enconsidérant un masque qui gardera seulement les termes autour de l’origine (en effet, c’est l’idée deconstruction des noyaux pour les RTFs de la classe de Cohen ). Ce masque (noyau) sera adapté pourfournir le meilleur compromis entre la conservation du support temps-fréquence et la suppression destermes d’interférences (si le masque est étroit, on éliminera la plupart des termes d’interférence, maison perdra aussi des termes utiles ; par contre, si le masque est grand, on garde beaucoup de termesd’interférences). Pour résoudre ce compromis, on introduit une contrainte pour la procédured’optimisation (6.111) : le volume du noyau doit être inférieur à une certaine valeur α . Cette valeurcontrôlera le niveau des interférences et sera fixée au début.

( ) ( )∫ ∫ ∫∞

≥≤=Φπ π

ααψψσπ

ψψπ

2

0 0

2

02

22

20,

4

1,

4

1drdrdr (6.111)

( )( )

+−=

ψσ

ϑττξφ

2

22

2exp,

( )( )

222

2,

2exp, ϑτ

ψσψφ +=

−= r

rr

( ) ( )f A r r rdrd=∞

∫∫ , ,ψ φ ψ ψπ

2

00

2

Page 154: carte - representations temps - frequences ENSIETA

6. Représentation temps-fréquence bilinéaires

ENSIETA, Janvier 2002Centre de Recherche "Extraction et Exploitation de l'Information en Environnements Incertains"

149

Le procédure d’optimisation est présentée sur la figure 6.28.

Figure 6.28. L’algorithme de RTF avec le noyau gaussien adaptatif

Dans une première étape, on calcule la fonction d’ambiguïté du signal. Ensuite, à partir decelle-ci, on cherche φopt qui maximise la fonction f. On utilise, comme procédure d’optimisation duchoix de φopt , un algorithme du gradient, détaillé en [12]. On utilise un pas variable : au début, grandet ensuite, de plus en plus petit, pour éviter les valeurs maximales locales. On utilise, commecondition d’arrêt de l’algorithme soit le nombre imposé d’itérations, soit la grandeur de lamodification par rapport à l’itération antérieure.

Le noyau obtenu pondère la fonction d’ambiguïté et le résultat sera transformé dans le plantemps-fréquence, en utilisant la transformation de Fourier bidimensionnelle.

Sur la figure suivante, on illustre ce principe, à partir d’un signal synthétique, composé dedeux chirps. La transformation temps-fréquence idéale de celui-ci est présentée dans la figure 6.29.a.

Figure 6.29. Le principe de la RTF à partir du noyau gaussien adaptatif(a) RTF idéale du signal ; (b) Fonction d’ambiguïté et positionnement du noyau ;

(b) Fonction f pour différentes valeurs de ψ ; (d) Noyau optimal obtenu par la procédure d’optimisation(e) Représentation temps-fréquence adaptative

Sur la figure 6.29.b on peut voir la fonction d’ambiguïté du signal et, également, le noyaupour un certain angle ψ ; pour un intervalle de variation [0 ;2π] on obtient une fonction f qui estprésentée sur la figure 6.29.c. On voit deux pics, correspondants aux angles pour lesquels le noyaurecouvre les structures correspondantes des signaux chirp.

Après l’application de la procédure d’optimisation (extraction des maxima) on obtient lenoyau optimal, présenté sur la figure 6.29.d. Enfin, sur la figure 6.29.e. on peut voir la transformation

Fréq

uenc

e

RTF idéale

a

Retard

Dop

pler

Plan d’ambiguïtéNoyau gaussien

ψ

bψ [rad]

f

( ) ( )f A r r rdrd=∞

∫∫ , ,ψ φ ψ ψπ

2

00

2

c

Noyau optimal

Dop

pler

Retard

Procédured’optimisation

d

Temps

Fréq

uenc

e

RTF adaptative

e

RTFxFA0

α - la valeur limite du volume du noyau

ΦoptFAxSignalx

Calcul de lafonction

d’ambiguite

Evaluation de Φopt

( ) ( )∫ ∫∞

ΦΦ

πψψψ

2

0 0

2,,max rdrdrrA

( )∫ ≤π

αψψσπ

2

0

224

1d

Calcul deFFT2D(AF0)

Calcul deAFx(τ,f)* Φopt(τ,f)

Page 155: carte - representations temps - frequences ENSIETA

6. Représentation temps-fréquence bilinéaires

ENSIETA, Janvier 2002Centre de Recherche "Extraction et Exploitation de l'Information en Environnements Incertains"

150

temps-fréquence obtenue en utilisant le noyau optimal. On observe que l’image temps-fréquenceobtenue a une bonne visibilité, ce qui nous permet de mettre en évidence les deux composantes dusignal. Pour montrer la supériorité de cette méthode par rapport aux méthodes qui utilisent desnoyaux fixes, on présente aussi les résultats obtenu, pour le même signal, à partir de la DistributionPseudo Wigner-Ville Lissée (PWVL) et de la Distribution de Choi-Williams (CW).

Figure 6.30. Distribution PWVL et CW du signal composé de deux chirps

§ Noyau gaussien adaptatif à court terme

Malheureusement, la méthode présentée ci-dessus a deux grands inconvénients. Tout d’abord,lorsqu’on construit un noyau adaptatif pour toute la durée du signal, on ne peut pas suivre lesparticularités d’un signal ayant une fréquence instantanée qui varie rapidement dans le temps. Ainsi,il vaut mieux utiliser une méthode qui construit un noyau gaussien adaptatif sur les intervalles donnéspar une fenêtre glissante sur toute la longueur du signal.

Le deuxième inconvénient est représenté par le choix initial du paramètre α , qui peut êtreimpossible quand on ne connait pas la structure du signal traité, ce qu’il est le cas en identificationdes signaux.

Par la suite, on présente une méthode pour remedier au le premier inconvénient. En principe,l’intérêt pour l’analyse à court terme est bien étendu (on peut le montrer par l’analogie avec laTransformation de Fourier en Court Terme). Cette nouvelle méthode est présentée, d’une manièreschématique, sur la figure suivante.

Figure 6.31. RTF avec des noyaux conçus à court de terme

En pratique, l’application de cette méthode sera toujours un problème parce qu’on ne disposepas d’une information qui peut dire quelle est la taille optimale de la fenêtre. Une solution pourrésoudre ce problème consiste en utilisation de l’information offerte par le plan de phase, obtenu parla Décomposition en Paquet d’Ondelettes Invariante en Temps (SIWPD – Shift Invariant WaveletPacket Decomposition). Le principe de cette méthode est présenté sur la figure 6.32. Comme signalde test, on utilise on utilise un signal à 8 sauts de fréquence (FSK 8) ; sa RTF idéal est présentée surcette figure.

A partir de SIWPD on obtient le plan de phase et, ensuite, la marginale en temps, qui nousoffre une information qui sera exploitée pour déterminer les longueurs optimales des fenêtres. Pourchaque fenêtre on construit un noyau optimal qui permet d’obtenir une RTF optimale.

Fenêtre Signal

Noyau gaussien adaptatif en court terms

RTF adaptive en court terms

Fréq

uenc

e

Smoothed Pseudo Wigner Distribution Choi-Williams Distribution

Fréq

uenc

e

Page 156: carte - representations temps - frequences ENSIETA

6. Représentation temps-fréquence bilinéaires

ENSIETA, Janvier 2002Centre de Recherche "Extraction et Exploitation de l'Information en Environnements Incertains"

151

Figure 6.32. Le principe de RTF adaptative à court terme avec des fenêtres d’analyses variables

• Résultats comparatifs

Par la suite, on analyse comparativement les performances de cette nouvelle approche, enutilisant PWVL, la représentation de CW et la Distribution de Wigner-Ville Modifiée (ModifiedWigner-Ville Distribution – MWVD) - voir le chapitre suivant. Mais, tout d’abord, on introduitquelques paramètres de qualité pour analyser, d’une manière objective, les performances de chaqueRTF.

1. Le degré de conservation du support temporel (« Degree of time support conservation –DTSC »)

Ce paramètre est défini pour un certain atome T-F et représente le support temporel de celui-ci(∆t), normalisé à la taille du signal (T), c’est-à-dire :

DTSCt

T=

∆ (6.112)

La signification ∆t et T est représentée sur la figure 6.33. Dans le cas idéal, ce paramètre vaut1.

2. Le degré de conservation du support fréquentiel (« Degree of frequency support conservation –DFSC »)

Ce paramètre est définit comme la bande de fréquence d’un certain atome divisée par lafréquence d’échantillonnage :

eFB

DFSC = (6.113)

La signification de B et Fe est présentée sur la figure 6.33.

Signal FSK

Fréquence instantanée

Le plan de phase

SIWPD

RTF adaptative à court terme

Temps

Fréq

uenc

e

La marginale en temps

Fenetres d’analyse avec des tailles variables

Page 157: carte - representations temps - frequences ENSIETA

6. Représentation temps-fréquence bilinéaires

ENSIETA, Janvier 2002Centre de Recherche "Extraction et Exploitation de l'Information en Environnements Incertains"

152

Figure 6.33. Les supports temporel et fréquentiel

3. Le facteur d’atténuation des interférences (« Interférences attenuation factor – IAF »)Ce paramètre montre la qualité de l’élimination des termes d’interférence T-F :

i

u

EE

IAF = (6.114)

où Eu est énergie des termes utiles et Ei est l’énergie des termes d’interférence. Dans le cas idéal, cefacteur doit être ∞. Pour le signal FSK présenté la figure 6.32., les résultats obtenus à partir desméthodes présentées ci-dessus sont résumés dans le tableau suivant.

Tableau 6.2. Les performances des distributions temps-fréquenceTFRs DTSCn DTFCn IAFIdéal 0.125 0 ∞ Pseudo Wigner-Ville Lisée 0.0947 0.029 1.5Choi-Williams 0.1 0.034 1.02Modified Wigner-Ville 0.0688 0.062 53.27Noyau Gaussien Adaptatif 0.0512 0.022 3.1Noyau Gaussien Adaptatif à Court Terme 0.0893 0.011 157.27

On observe la supériorité de cette méthode en ce qui concerne les indices de conservation dessupports en fréquence et en temps, et, également, la meilleure suppression des termes d’interférence.

Sur la figure suivante on présente, graphiquement, les résultats obtenus à partir de PWVL,CW, MWVD et la RTF avec le noyau gaussien adaptatif (NGA). A titre de comparaison, il fautégalement regarder la figure 6.32.

Figure 6.34. Comparaison entre différentes RTFs(a) Pseudo Wigner-Ville Lissée avec la taille de g qui vaut 33 et

La taille de h qui vaut 123. (b) Distribution de Choi-Williams avec le paramètre de lissage σ=3.5.(c) Modified Wigner-Ville distribution avec ε=0.15 and D=2.1.(d) RTF avec le noyau gaussien adaptatif (NGA) : volume α=25

t

f

T

Fe

∆t

B

a b

dc

Pseudo Wigner-Ville Lissée Distribution de Choi-Williams

RTF - NGAMWVD

TempsTemps

TempsTemps

Fréq

uenc

e

Fréq

uenc

e

Fréq

uenc

e

Fréq

uenc

e

Page 158: carte - representations temps - frequences ENSIETA

6. Représentation temps-fréquence bilinéaires

ENSIETA, Janvier 2002Centre de Recherche "Extraction et Exploitation de l'Information en Environnements Incertains"

153

§ Conclusions

Dans ce chapitre, on a introduit une nouvelle méthode pour obtenir une transformation temps-fréquence adaptative, ayant comme but l’élimination des termes d’interférence. En partant de laclasse de Cohen on a développé la notion de noyau gaussien adaptatif dans le plan d’ambiguïté etensuite une méthode pour le construire.

On a mis en évidence les principaux inconvénients et on a introduit une méthode pouraméliorer les performances.

On a étudié comparativement les approches introduites avec les plus classiques et on a vu queles résultats obtenus sont meilleurs.

En conclusion, ces approches nous offrent la possibilité de traiter, d’une manière optimale, lessignaux multi-composantes. En plus, les notions présentées nous ouvrent de nouveaux champsd’application, parmi lesquelles on peut mentionner :- utilisation des paramètres du noyau optimal comme élément de classification des signaux ;- ayant comme point de départ la notion de noyau optimal, on peut concevoir des poly-noyaux pour

caractériser les signaux avec une structure relativement compliquée (les signaux decommunications). Ces poly-noyaux peuvent être utilisés comme outil pour l’identification et laséparation des composantes du signal traité.

Références

[1] S. Qian, D. Chen – “Joint Time-Frequency Analysis” , Pretince Hall, New Jersey, 1998[2] P. Flandrin – "Représentations temps-fréquence" , Ed. Hermes, Paris, 1993[3] L. Cohen - "Time-Frequency Analysis",[4] A. Quinquis - "Représentations temps-fréquence", Support de cours, ENSIETA, 1995[5] A. Papandreou, G.F. Boudreaux-Bartels - "A generalization of the Choi-Williams and the Butterworth time-frequencydistributions", IEEE Trans. Signal. Processing, vol. 41, pp. 463-472, 1993[6] L. Cohen, "Time-frequency distributions - A review", Proc. IEEE, vol. 77, no. 7, pp. 941-981, July, 1989[7] P.M. Woodward - "Probability and Information theory with Applications to Radar", Elmsford, NY: Pregamon Press,1953[8] H.I. Choi, W.J. Williams – "Improved Time-Frequency Representations of Multicomponent Signals UsingExponential Kernels", IEEE Trans. Acoust., Speech, Sig. Proc, Vol. ASSP-37, no. 6, pp. 862-871, 1989[9] A.W. Rihaczek – "Signal Energy Distribution in Time and Frequency", IEEE Trans. Info. Th., vol. IT-14, no. 3, pp.369-374, 1968[10] C.H. Page – "Instantaneous Power Spectra", J. Appl. Phys, vol. 23, pp. 103-106, 1952[11] Y. Zhao, L.E. Atlas, R.J. Marks - "The Use of Cone-Shaped Kernels for Generalized Time-FrequencyRepresentations of Nonstationary Signals", IEEE Trans. Acoust. Speech. Sig. Proc., vol. ASSP-38, no. 7, pp. 1084-1091,July, 1990[12] R.G. Baraniuk and D.L. Jones - "A signal-dependent time-frequency representation: Optimalkernel design", IEEE Trans. Signal Processing, vol. 41, pp. 1589-1602, April 1993

Page 159: carte - representations temps - frequences ENSIETA

6. Représentation temps-fréquence bilinéaires

ENSIETA, Janvier 2002Centre de Recherche "Extraction et Exploitation de l'Information en Environnements Incertains"

154

Exercices et problèmes

1. (Calcul de la DWV) Calculer la DWV d'une fonction gaussienne définie par :

( )

= 24

1

2exp tts

απα

2. (Propriétés de la DWV)a) Montrer les propriétés d'invariance par décalage temporel et fréquentiel (relations 6.15 et 6.16).b) Justifier pour quoi ces propriétés sont souhaitées dans des applications comme la classification oula détection des signaux.c) Montrer la propriété de covariance par dilatation dans la cas de la DWV

3. (Propriétés de la DWV)a) Justifier les propriétés de compatibilité par filtrage et modulationb) Justifier la propriété de conservation des supports temporel et fréquentiel.c) Donner la preuve de la formule de Moyal.d) Prouver la relation (6.27).

4. (Termes d'interférence issus de la DWV)a) Prouver la relation (6.29)b) Calculer la DWV de la somme de deux atomes gaussiens :

( ) ( )∑

+−−

=

=

2

1

24/1

2exp

iii tjttts ω

απα

Quelle est la géométrie des termes d'interférence ?

5. (Termes d'interférence issus de la DWV)a) On suppose deux signaux donnés par :

( ) ( ) ( )( ) ( ) ( )ϕππ

ππ++=

+=tftftstftfts

212

211

2cos2cos2cos2cos

Donner les expressions de la DWV de ces deux signaux.b) A partir de la figure suivante, proposer une méthode pour distinguer les deux signaux.

6. (Discrétisation de la DWV)Vérifier les propriétés d'invariance par translation et la modulation dans le cas de la DWV

discrète.

7. (PWVL)Montrer que la PWVL respecte les propriétés d'invariance par translation et modulation.

8. (Fonction d'ambiguïté)Calculer la fonction d'ambiguïté d'une fonction gaussienne donnée par

25 30 35 40 45

0.1

0.2

0.3

0.4

25 30 35 40

0.1

0.2

0.3

0.4

DWV(s1) DWV(s2)

Page 160: carte - representations temps - frequences ENSIETA

6. Représentation temps-fréquence bilinéaires

ENSIETA, Janvier 2002Centre de Recherche "Extraction et Exploitation de l'Information en Environnements Incertains"

155

( ) ( )

+−−

= tjttts 0

20

41

2exp ω

απα

9. (Fonction d'ambiguïté)a) Donner les preuves pour les relations 6.70 et 6.71.b) Présenter, d'une manière schématique, la correspondance entre le plan temps-fréquence et le plan

d'ambiguïté dans le cas t1=t2=t0.

10. (Classe de Cohen)Prouver les concordances (tableau 6.1.) entre les propriétés d'une RTF et les contraintes imposéesau noyau associé.

11. (Classe de Cohen)La relation (6.79) prouve que le spectrogramme fait partie de la classe de représentations temps-fréquence bilinéaires de Cohen. Dans ce cas, quelle est la géométrie des termes d'interférence decette distribution.

12. (Classe de Cohen)Prouver que la distribution de Choi-Williams respecte toutes les propriétés données dans letableau 6.1., sauf celle de positivité.

13. (Classe de Cohen)

a) Prouver que la distribution de Rihaczek respecte toutes les propriétés données dans le tableau 6.1.,sauf la propriété 3.

b) Montrer que la distribution de Margenau-Hill ne respecte pas les propriétés de compatibilité parfiltrage et par modulation et celle d’unitarité.

14. (Classe de Cohen)Trouver les expressions de la distribution de pseudo-Rihaczek et de la distribution de pseudo-Margenau-Hill, par analogie avec l’expression de la pseudo-Wigner-Ville. Peut-on trouver uneliaison entre les nouvelles distributions et le spectrogramme similaire à celle entre la PWV et lespectrogramme ?

15. (Classe de Cohen)a) Prouver que la distribution de Page respecte toutes les propriétés présentées sur le tableau 6.1.,

sauf 3 et 8.b) Donner l’expression de la distribution de pseudo-Page. Quels sont les avantages et les

inconvénients induits par cette modification ?

16. (Classe de Cohen)

a) Prouver que la distribution de Born-Jordan respecte les mêmes propriétés due à la distribution deChoi-Williams, et, en plus, celles liées de la conservation du support temps-fréquence.

b) Montrer que la géométrie de termes d’interférence générés par la distribution de Choi-Williamsest identique à ceux générés par la distribution de Born-Jordan.

17. (Classe de Cohen)a) Trouver, parmi les propriétés presentées dans le tableau 6.1., celles qui sont satisfaites par la

distribution de Zhao-Atlas-Marks.b) Quelle contrainte faut-il imposer à la fonction h(τ) pour que la RTF issue soit donnée par des

valeurs réelles ?

Page 161: carte - representations temps - frequences ENSIETA

6. Représentation temps-fréquence bilinéaires

ENSIETA, Janvier 2002Centre de Recherche "Extraction et Exploitation de l'Information en Environnements Incertains"

156

18. (Classe de Cohen)Quels sont les avantages de la distribution de Zhao-Atlas-Marks par rapport à la distribution

de Choi-Williams ?

19. (Classe de Cohen)Soit un noyau donné par φ(t,τ). Quelle est la condition qui doit être l’imposée pour que la RTF

associée soit capable de conserver le support fréquentiel ?

Page 162: carte - representations temps - frequences ENSIETA

7. Méthodes temps-fréquence modernes

ENSIETA, Janvier 2002Centre de Recherche "Extraction et Exploitation de l'Information en Environnements Incertains

157

7METHODES TEMPS-FREQUENCE MODERNES

7.1. Motivations [2,4]

L'analyse temps-fréquence repose sur la combinaison des deux variables temps et fréquencedans une même représentation, fournissant ainsi une signature de l'évolution temporelle du contenuspectral. C'est la raison pour laquelle les représentations temps-fréquence (RTF) ont connu un fortdéveloppement, au niveau des outils disponibles, et une grande extension de la gamme d'applications:traitement du signal sonar et radar [1], imagerie médicale, communications numériques, etc.

La classification des signaux, en utilisant des paramètres extraits du plan temps-fréquencereprésente un domaine où les RTFs sont les approches les plus adaptées, grâce à l'informationcomplète sur la nature du signal que l'on peut extraire de plane temps-fréquence [4]. Néanmoins,dans le cas des RTFs quadratique (voir chapitre 6), la classification est rendue difficile en raison de labilinéarité des distributions de la classe de Cohen qui génèrent des termes d'interférence.

Le succès de l'extraction des caractéristiques discriminantes est assuré si la RTF utilisée estadaptée aux signaux traités. Il est donc nécessaire d'appliquer, à chaque signal, sa RTF optimisée.Pour des signaux ayant une structure simple, la RTF optimale peut être une des représentations de laclasse de Cohen, mais pour les signaux dont la structure est plus complexe, le choix de la meilleureRTF pose des problèmes difficiles à surmonter, car les noyaux classiques ne préservent pas unensemble des propriétés acceptables pour résoudre le problème posé.

La question fondamentale est donc : comment peut-on augmenter la lisibilité d'une RTF pourextraire les paramètres d'un signal ? Une première méthode temps-fréquence adaptative, proposée audébut des années '90, est la RTF basée sur le noyau gaussien adaptatif (NGA), qui a été décrite dansla section 6.4. On a vu que cette méthode est capable de fournir une image temps-fréquence avec unniveau réduit de termes d'interférence. Néanmoins, cette approche présente deux inconvénientsmajeurs, illustrés sur la figure 7.1.

En pratique, il est souvent difficile de trouver la bonne valeur pour le paramètre α (section6.4), surtout pour les signaux ayant une structure complexe dans le plan temps-fréquence. Si la valeurdu volume est trop petite, on élimine tous les termes d’interférence, mais les supports temporel etfréquentiel sont affectés. Dans le cas contraire la RTF sera toujours entachée d'interférences. Cephénomène est illustré sur la figure suivante, en considérant comme signaux de test une modulationdiscrète en fréquence à 8 états (figure 7.1.a.). et un mélange d'une sinusoïde, une modulationhyperbolique de fréquence et d'une impulsion (figure 7.1.b.).

Dans le premier cas (figure 7.1.a.), il est difficile de mettre en évidence toutes lescomposantes. Pour y arriver on a choisi α=25. Par conséquent, le choix de α est déterminant pour lesperformances de la RTF-NGA et, donc, il faut définir une procédure pour estimer cette valeur.Puisque cette procédure sera dépendante de la structure du signal, elle ne sera valable que pour uneclasse étroite de signaux.

Sur la figure 7.1.b., un autre inconvénient est mis en évidence, lié à la forme particulière dunoyau. La RTF-NGA, de ce signal, caractérisée par un niveau relativement élevé des termesd’interférence, montre l’incapacité du noyau gaussien à s’adapter à une structure d’un signalmulticomposantes.

Page 163: carte - representations temps - frequences ENSIETA

7. Méthodes temps-fréquence modernes

ENSIETA, Janvier 2002Centre de Recherche "Extraction et Exploitation de l'Information en Environnements Incertains

158

Figure 7.1. Les principaux inconvénients de la RTF-NGA

Une solution consiste alors à construire des noyaux complexes (polynoyaux) qui vontpermettre de retrouver toutes les composantes dans le plan d’ambiguïté. Ces polynoyaux serontcomposés par un certain nombre de noyaux gaussiens primaires dont les paramètres (l’angle parrapport à l’axe de retard et la dispersion) pourront être calculés à partir de certaines fonctions de basequi fourniront une approximation optimale (au sens de l’erreur d’approximation, par exemple) dusignal. Il s’agit du principe des décompositions adaptatives [1] développé dans la section suivante.

7.2. Le principe des décompositions temps-fréquence adaptatives

Ce principe, introduit par S.Mallat et Zhang [6] et appelé également "Matching Pursuit",consiste en la projection, de manière itérative, d’un signal s(t) sur un ensemble de fonctions de basehp(t) :

( ) ( )s t B h tp p= ∑ (7.1)

où les coefficients Bp sont donnés par :

B s hp p= , (7.2)

L’opérateur • •, représente le produit scalaire. La relation (7.2) montre le degré de similaritéentre le signal s(t) et la fonction de base hp(t). La figure suivante présente la procédure de ladécomposition adaptative du signal.

Figure 7.2. La décomposition adaptative du signalB hp p

rrhp

rsp −1

rsp

rsp −1

rsp −2

rhp −1

B hp p− −1 1

r

Plan d’ambiguïté

Retard

RTF-NGA: α=10

TempsFr

éque

nce

Dop

pler

RTF-NGA: α=15 RTF-NGA: α=25

TempsTemps

Fréq

uenc

e

Fréq

uenc

e

a. Influence de la valeur de α sur la lisibilité de la RTF

b. Influence de la forme du noyau

Page 164: carte - representations temps - frequences ENSIETA

7. Méthodes temps-fréquence modernes

ENSIETA, Janvier 2002Centre de Recherche "Extraction et Exploitation de l'Information en Environnements Incertains

159

Initialement (p=0) on a s0(t)=s(t) (le signal original). On cherche la fonction h0(t) parmitoutes les fonctions h(t) qui ressemble le plus au signal s(t). Le coefficient de la projection sera choisiselon (on considère p=0) :

( ) ( )B s t h tphp

p p

2 2= max , (7.3)

Le signal résiduel vaut alors :( ) ( ) ( )s t s t B h tp p p p+ = −1 (7.4)

et, supposant que hp(t) est d’énergie unité, l’énergie du signal résiduel sera :

( ) ( )s t s t Bp p p+ = −1

2 2 2(7.5)

Par la continuation du processus on obtiendra :

( )s t Bpp

2 2

0=

=

∑ (7.6)

qui représente l’équation de conservation de l’énergie, similaire à la relation de Parseval dans ledomaine de Fourier. Les étapes suivantes reprennent cet algorithme et cherchent la fonction hp(t) quia la meilleure similitude avec le signal résiduel sp(t). La décomposition adaptative met en évidence

l’ensemble des fonctions de base ( ) h tp qui est le plus ressemblant avec la structure temps-fréquence

du signal. A cet ensemble de fonctions, en appliquant alors la transformation de Wigner-Ville onobtient :

( ) ( ) ( )∑∑≠

+=qp

hhqphp

ps ftWVBBftWVBftWVqpp

,,, *2 (7.7)

En [1, pag. 187] il est montré que le deuxième terme de la relation (7.7) a une énergie nulle.Donc, on peut écrire l’expression générale de la représentation temps-fréquence adaptative (RTFA)selon :

( ) ( )ftWVBftRTFAph

pps ,,

2

∑= (7.8)

Le principe sera à la base du cadre général à la particularisation des relations présentées ci-dessus aux deux familles de fonctions de base : les ondelettes et les chirplets.

7.3. La Distribution de Wigner-Ville Modifiée (DWVM)

On considère la librairie de paquets d’ondelettes invariante en temps (POIT) [7] qui est unecollection de toutes les bases orthonormales de Vj (combinaison linéaire2 j/2ϕ0(2jx-k); k∈Z ) quisont sous-ensemble de

B l Z n Z ml n mj l, , : , ,∈ ∈ ≤ <− +

−0 2 (7.9)

où B x m k k Zl n mj l j

nl j

, ,( ) / [ ( ) ] := − − ∈+2 2 22ϕ (7.10)

Soit B un ensemble défini par la relation (20) et Cλ les coefficients de la meilleure base d’unsignal g. Alors :

BtCtg NN

∈= ∈∈∑ λλλ

λλ ϕϕ ,)()( (7.11)

Tenant compte de la relation (7.7), la distribution de Wigner-Ville de l'approximation dusignal g(t) s’écrit :

∑∈

=N

ftWVCCftWV g'

*

,),(,),(

''

λλϕϕ

λλλλ

∑∑>

⋅+

∈⋅=

'

*2),(,2),(

''

λλϕϕϕ

λ λλλλ

λλ ftWVCCReftWV

NC (7.12)

L’équation (7.12) sépare la transformation de Wigner-Ville classique en deux parties :

Page 165: carte - representations temps - frequences ENSIETA

7. Méthodes temps-fréquence modernes

ENSIETA, Janvier 2002Centre de Recherche "Extraction et Exploitation de l'Information en Environnements Incertains

160

• La superposition d’auto-distributions de toutes les fonctions de base. Cette superpositionreprésente les auto-termes. L’auto-distribution d’une fonction de base peut être calculée par larelation :

ττπτϕτϕϕ λλλdfettftWV j2)2/()2/(),( * −

∫ −+= (7.13)

• La seconde somme représente les inter-distributions de Wigner-Ville de toutes les fonctions debase; cela représente les termes croisés. L’inter-distribution de deux fonctions de base est donnéepar la relation (7.14) :

( ) ∫ −−+= ττϕτϕϕϕτπ

λλλλ

dettftWV fj 2*' )2/()2/(,, ' (7.14)

Les sommes sont limitées aux fonctions de base dont les coefficients de projection est plusproche qu’un certain seuil et dont la localisation dans le plan temps-fréquence sont plus prochesqu’un seuil prédéfini. Soit ε le seuil d’amplitude et D le seuil de distance dans le plan temps-fréquence. Alors, on peut définir deux ensembles par les relations :

( )

Λ

Γ

= ≥ =

= < ≤ ≥

λ ε

λ λ ϕ ϕ ε

λλ

λ

λ λ λ λ

C M M C

d D C C M

, max

, , ,'' '0 2 2

(7.15)

( )',λλ ϕϕd représente la distance entre deux fonctions de base dans le plan temps-fréquence. La

quantité est définit par :

( ) ( ) ( )d

t tt t

f f

f fϕ ϕλ λ

λ λ

λ λ

λ λ

λ λ

, '

'

'

'

'

/

=−

+−

2 2 1 2

∆ ∆ ∆ ∆(7.16)

où ( )t fλ λ, est la position centrale de la fonction de base ϕλ dans le plan temps-fréquence et ∆tλ et∆fλ sont les ambiguïtés temporelle et fréquentielle. Par les modifications du seuil de distance et duseuil d’amplitude ε, on peut supprimer la plupart des termes d’interférence [3].

Les fonctions de base sont données par:( ) [ ]ϕ ϕl n m k

ln

lt t m k, , ,/ ( )= − −2 22 (7.17)

où l est le niveau de décomposition courant, n l’indice de fréquence, m l’indice d’invariance et kl’indice de la position dans la cellule courante. A chaque fonction de base est associée une celluledans le plan temps-fréquence; le centre de celle-ci a les coordonnées :

t k m Cl lh

l= − ⋅ + + − ⋅ − −( ) ( )1 2 2 1 2 1 (7.18)

( )f

nl=

+ 052

.(7.19)

où Ch est le centre énergétique du filtre passe-bas, donné par la relation :

Ch

j hh jj Z

=∈∑1

2

2(7.20)

où hj représente les coefficients du filtre passe-bas.La largeur et la hauteur de cette cellule sont données par les relations suivantes :

∆ ∆t fl l= =− −2 21 ; (7.21)

Ainsi, si on tient compte de l’amplitude des coefficients de la décomposition POIT, lameilleure base et de la distance entre les centres énergétiques des ondelettes correspondantes, onélimine les termes d’interférence en conservant la structure temps-fréquence du signal. Lesperformances de cette méthode sont meilleures que celles obtenues par les méthodes présentéesantérieurement ; ce fait, justifié objectivement en [3], est dû à la décomposition en paquetsd’ondelettes invariante en temps (DPOIT), qui fournit la meilleure base au sens de l'entropieminimale, et permet une sélection efficace des coefficients et, donc, un choix optimal des fonctionsde base.

Page 166: carte - representations temps - frequences ENSIETA

7. Méthodes temps-fréquence modernes

ENSIETA, Janvier 2002Centre de Recherche "Extraction et Exploitation de l'Information en Environnements Incertains

161

Malgré ses performances, cette approche, introduite par I. Cohen [7], présente deuxinconvénients qui limitent son application :

- Les résultats de la DWVM dépendent fortement du choix du couple de paramètres (ε,D) quin’est pas toujours optimal et est difficile à définir. Pour s'affranchir de cet inconvénient, nous avonsproposé et argumenté deux techniques. A l'opposé de l’approche de I. Cohen, qui accordait la mêmeimportance à tous les termes d’interférence, on a montré [11] que les termes d’interférences entre lesondelettes qui appartiennent au même sous-espace du signal sont des termes utiles et doivent êtreprivilégiés par rapport aux autres. La première technique va permettre de garder tous ces termes etéliminer les autres. Dans le même article, nous avons également montré l’intérêt pour un seuillageadaptatif. Cette solution consiste à calculer, pour chaque sous-espace du signal, un seuil qui permetd’améliorer les performances de la procédure de sélection des coefficients.

Ces deux techniques accroissent les performances de la DWVM. L’exemple suivant illustreclairement les avantages offerts par la DWVM par rapport à la RTF-NGA et à la DWVM classique(l’approche de I. Cohen). Cet exemple utilise le même signal que celui considéré pour mettre enévidence les inconvénients de la RTF-NGA.

Figure 7.3. Amélioration de la lisibilité par DWVM

7.4. Le Dictionnaire Adaptatif Chirplets à 4 paramètres (DAC4)

Pour améliorer les performances de la RTFA, une idée naturelle est d’introduire un nouveauparamètre (degré de liberté) pour les fonctions de base. On va ainsi former un dictionnaire desfonctions de base à quatre paramètres. Le dictionnaire à quatre paramètres le plus naturel est celuicomposé par des fonctions "chirplet" [9]. La justification est présentée sur la figure suivante : d'unpoint de vue théorique, il est possible d’approximer n’importe quelle forme dans le plan temps-fréquence par un nombre limité des chirplets. Une certaine erreur sera commise mais peut êtrecontrôlée sa valeur par une bonne résolution.

Figure 7.4. Approximation d’une forme quelconque par un certain nombre de chirplets

Pour obtenir un dictionnaire "chirplet" adapté à la structure du signal de départ, il faut trouver uneméthode qui choisisse la meilleure combinaison des fonctions chirplets. Deux solutions peuvent êtreformulées :• La première, formulée par D. Lowe [9], consiste à représenter une structure temps-fréquence d’un

signal comme un mélange de distributions gaussiennes bidimensionnelles. Alors, on choisit lesfonctions chirplets bien adaptées à ces distributions.

• La deuxième, introduite par S. Chian [10], est de construire directement le dictionnaire à quatreparamètres à partir du dictionnaire de Gabor à trois paramètres (décalages temporel, fréquentiel etéchelle) et en introduisant le quatrième paramètre (le taux de modulation) par l’application de latransformation de Fourier fractionnaire (FRFT). Pour choisir itérativement les fonctions de base,Bultan [10] a utilisé l’algorithme de « Matching Pursuit ».

RTF-NGA: α=10

Temps

Fréq

uenc

e

DWVM classique: ε=2; D=2.4

Temps

Fréq

uenc

e

Fréq

uenc

e

Temps

DWVM automatisée

t

f

t

fApproximation d’unsignal avec unensemble de

fonctions chirplets

Page 167: carte - representations temps - frequences ENSIETA

7. Méthodes temps-fréquence modernes

ENSIETA, Janvier 2002Centre de Recherche "Extraction et Exploitation de l'Information en Environnements Incertains

162

7.4.1. Expression mathématique des fonctions chirplet

Cette expression est donnée par la formule (33).

( ) [ ]

( )

ψ θ

θ

π

i

j f ct t

te t t t d

on

t f c d

,,

, sin

, , ,

( ),

=∈ +

=

+2 00 0

0 0

0 (7.22)

Figure 7.5. Les paramètres d’une fonction chirplet

Les différents paramètres qui interviennent dans cette formule sont :t0 – l’origine temporelle ;f0 – l’origine fréquentielle ;c – la vitesse de variation de la fréquence (taux de modulation);d- la durée du signal chirplet.

La figure 7.5. donne les représentations temporelle et fréquentielle d’une fonction chirp enmontrant également l’implication de chacun des paramètres.

Sachant qu’une fonction ondelette est caractérisée par un facteur d’échelle et qu’à partir de cet d on peut définir un facteur d’échelle pour la fonction chirplet, la similitude est évidente entre lafonction introduite ci-dessus et une fonction ondelettes, en ce qui concerne le support limité de cettefonction.

7.4.2. La RTFA obtenue à partir de DAC4

Le dictionnaire utilisé pour construire la RTFA est composé par l’ensemble de M fonctions detype chirplet. Initialement, on ne construit pas le dictionnaire; on considère uniquement connu lenombre de fonctions cherchées M (la dimension de l’espace de recherche). L’algorithme de cetteméthode peut être décomposé en deux phases (voir la figure 7.12).

La première phase permet d’estimer les paramètres de chaque fonction chirplet. Cetteestimation sera basée sur la maximisation du rapport de vraisemblance et, pour diminuer l’erreurd’estimation, on utilisera la procédure d’optimisation de quasi-Newton. Cette procédured’optimisation donne un caractère optimal à cette RTFA.

La deuxième phase, permet d’obtenir effectivement la RTF en utilisant l’algorithme"Matching Pursuit".

L’attribut adaptatif est dû à la procédure d’optimisation qui a une double action : localement,elle cherche à trouver la fonction chirplet la mieux adaptée à une composante donnée du signal et,globalement, elle définit l’ensemble des fonctions les mieux adaptées à la structure temps-fréquencedu signal.

§ Phase 1 : Estimation des paramètres de chacune des fonctions « chirplet »

Cette phase permet d’estimer les quatre paramètres de chacune des fonctions dedécomposition. L’estimation est itérative, pour obtenir une qualité satisfaisante de ce processus.

Page 168: carte - representations temps - frequences ENSIETA

7. Méthodes temps-fréquence modernes

ENSIETA, Janvier 2002Centre de Recherche "Extraction et Exploitation de l'Information en Environnements Incertains

163

• Estimation globale :

On considère le signal s(t) comme une suite de deux chirps et sa représentation T-F présentéesur la figure 7.6.a.

Figure 7.6. Estimation globale de c

Pour estimer le taux de modulation, on tourne, dans le plan TF, une droite (figure 7.6.b).L’incrément angulaire vaut π

4 M. Pour chaque valeur de l'incrément angulaire, l’énergie

cumulée (figure 7.6.c) est calculée et la valeur maximale correspond à la valeur estimée de c.Cette valeur est alors utilisée pour l’estimation globale de la durée. Le principe est présenté

sur la figure suivante

Figure 7.7. Estimation globale de d

Pour définir la longueur du signal d, on considère une fenêtre 2D de longueur variable (selonla figure 7.7.b) et on calcule fois l’énergie de la région où cette fenêtre est superposée à l’atome.

L’énergie pour d ( d length s∈[ ; ( )]0 ) peut être représentée, comme sur la figure 7.7.c. et ladurée optimale (globale) représente la taille de la région où l’énergie reste approximativement lamême sous l'hypothèse d'un chirp faiblement atténué.

• Estimation de t0 et f0

Le paramètre t0 peut être estimé (voir figure 7.7) comme correspondant à un certainpourcentage de l’amplitude du front croissant. Pour l’estimation simultanée de (t0,f0), on peut calculerla transformation de Wigner-Ville du signal modulé avec la fonction chirplet obtenue à partir de c etd. Le calcul de la marginale en temps et en fréquence permet alors d’avoir l’estimation de (t0,f0). Unexemple pour un signal composé de deux chirps, est présenté sur la figure 7.8.

Figure 7.8. Principe de l’estimation de (t0,f0)

TWV

Signal de départForme d’onde issue del’estimation globale

Signal modulé

Marginal en fréquence

Marginal entempstc

fc

t

f

a. RTF du signal de depart

t

f

b. Estimation globale de c

π/4/Mcg

cgc

Energie cumulée

c. Energie cumulée

Energie cumulée

t

f

a. RTF du signal de départ

t

f

b. Estimation globale de d

dg

dt0

c. Energie cumulée

Page 169: carte - representations temps - frequences ENSIETA

7. Méthodes temps-fréquence modernes

ENSIETA, Janvier 2002Centre de Recherche "Extraction et Exploitation de l'Information en Environnements Incertains

164

En utilisant le principe présenté ci-dessus on obtient le centre énergétique (tc,fc) de l’atomepris un compte. Pour déterminer le point (t0,f0) on utilise la formule suivante :

t td

f f cd

cg

c gg

0

0

2

2

= −

= − ⋅

(7.23)

On remarque que si cg est négatif (il s’agit de chirp où la fréquence décroît), f0 (la fréquenceinitiale) sera la fréquence maximale du spectre.

• Estimation locale de c et d

Pour éviter les situations où l’énergie cumulée, en fonction de c, présente deux pics (deuxvaleurs maximales) ou quand la fenêtre utilisée pour estimer d n’est pas bien superposée à l’atomeTF, on a établi qu’il est impératif d’avoir une étape d’estimation locale. On utilise la même procédureque celle proposée pour l’estimation globale, mais en commençant la rotation autour du point (t0,f0),calculé ci-dessus. Le principe et la comparaison avec l’estimation globale sont présentés à la figure7.9.

Figure 7.9. Principe de l'estimation locale des paramètres

Figure 7.10. Comparaison entre l’estimation globale et locale

Sur la figure 7.10 on peut observer que la forme d’onde obtenue par l’estimation locale estplus adaptée à l’atome considéré que la forme obtenue par l’estimation globale.

Pour améliorer la qualité de l’estimation, on applique ces étapes trois fois. Un nombre plusélevé d’itérations n’apporte pas de résultats plus significatifs.

Ces étapes permettent de définir un vecteur θe (la relation 7.22), qui sera la valeur d’entréepour la procédure suivante.

• Estimation optimale

Pour augmenter la précision de l’estimation, on a utilisé une méthode d’optimisation basée surla maximisation d’une fonction objective qui représente la projection du signal sur une certainefonction. Cette procédure est basée sur un algorithme du gradient.

Donc, la valeur optimale de θ est obtenue selon :

( )[ ]θθ

ψ θopt MAX s= − ⋅2

(7.24)

La procédure d’optimisation nécessite, comme données d’entrée:− Le vecteur initial: θe ;

t

f

Axe dereference(t0,f0)

cl

t

f

(t0,f0)cl

dl

Signal de départForme d’onde issue del’estimation globale

Forme d’ondeissue del’estimationlocale

Page 170: carte - representations temps - frequences ENSIETA

7. Méthodes temps-fréquence modernes

ENSIETA, Janvier 2002Centre de Recherche "Extraction et Exploitation de l'Information en Environnements Incertains

165

− L’espace de recherche pour la meilleure solution :

( ) [ ]θ ππ π

= ∈ − +

× × −

×

t f c d tM

tM N

e e0 0 2 20 2

4 425

2, , , , , , . , (7.25)

Figure 7.11. L’estimation optimale des paramètres par rapport à la procédure locale

La figure 7.11. permet d'observer l’avantage de l’utilisation de cette procédured’optimisation : la forme d’onde issue est très bien adaptée à la structure de l’atome singulier.

§ Phase 2 : calcul de la RTF

La fonction de base chirplet obtenue après la phase d’estimation, ( )ψ θopt , est utilisée pour la

projection du signal. Ainsi, on obtient, à chaque itération, un ensemble ( )( )Ci i opt,ψ θ (qui sera utilisé

pour évaluer la transformation TF) et, également, le signal résiduel (la relation 7.26), qui sera utilisépour l'itération suivante (voir la figure 7.12).

( )( )

ss s C

C s

i i opt

i opt

= − ⋅

=

ψ θ

ψ θ, (7.26)

Pour évaluer la RTF du signal de départ, on utilise les transformations TF de chaque atome retenu.

( ) ( )( )TFR C WV WV ssDAC i iN

i

N

412

1= +

=∑ ψ (7.27)

Figure 7. 12. Algorithme de la RTFA-DAC4

Signal dedépart Fonction de base

après l’estimationlocale

Fonction de baseaprès l’estimationoptimale

s(t)

cg, dg

Estimation de t0 et f0

t0,f0

Estimation localede c et d

3 itérations

θ0=(t0,f0,c,d)

Estimation optimale

( )[ ]θθ

ψ θopt MAX s= − ⋅2 θopt

Evaluation du signal résiduel

( )( )

s s s C

C s

i o p t

i o p t

= − ⋅

=

ψ θ

ψ θ,

N itérations

ψ1

C1

ψ2

C2

ψi

Ci

ψN

CN

Ensemble retenu

Transformation T-F

( ) ( )( )∑=

+=N

i

NiiDAC ssWVWVCRTF

1

241 ψ

Phase 1 : Estimation des paramètres de chaquefonction chirplet

Phase 2 : Calcul de la nouvelle RTF

Page 171: carte - representations temps - frequences ENSIETA

7. Méthodes temps-fréquence modernes

ENSIETA, Janvier 2002Centre de Recherche "Extraction et Exploitation de l'Information en Environnements Incertains

166

7.5. Résultats expérimentaux

Pour justifier les performances de l'approche propsoé, on a tout d’abord considéré un signalcomposé de 6 chirps (modulations linéaires de fréquence - MLF) élémentaires. La transformation TFidéale est présentée sur la figure 7.13.a.

Figure 7.13. RTF idéale et RTFA-DAC4 pour un signal composé de 6 MLF

La figure 7.13.b illustre le fait qu’on puisse bien localiser, dans le plan TF, les six éléments dusignal. Un autre exemple montre la capacité de DAC4 à approximer une structure non-linéaire dans leplan TF. Le signal utilisé est un mélange d'un signal sinusoïdal, d'un chirp et d'une modulationsinusoïdale en fréquence. Les résultats sont présentés sur la figure 7.14.

Figure 7.14. RTFA-DAC4 pour le deuxième signal de test pour différentes valeurs de M

On constate que les termes d'interférences ont été éliminés, mais on ne peut pas approximerprécisément les modulations non-linéaires, à cause de la forme linéaire des fonctions de base qui nepermet pas une approximation fidèle d'une forme non-linéaire.

Dans ce paragraphe on va tout d'abord étudier l'effet de l'atténuation du signal sur les degrésde conservation des supports temporel et fréquentiel.

Comme signal de test on utilise un chirp atténué temporellement. La fonction d’atténuationest définie par la relation suivante :

g t e at( ) = − (7.28)

où a est le facteur d’atténuation. Pour différentes valeurs de a, les indicateurs DTSC et DFSC (voir lasection 6.4) sont calculés. Les résultats obtenus sont présentés sur la figure 7.15. Les valeurs deDTSC et DFSC pour a=0 (chirp non atténué) montrent une bonne mesure liée à la qualité destransformations, concernant la conservation des supports temporel et fréquentiel. Ces résultats sontprésentés dans le tableau 7.1.

Tableau 7.1. : DTSC, DFSC et TFSC pour le signal originalDistribution T-F DTSC DFSC

Idéal 1 0.3PWVL 0.992 0.46DWVM 0.956 0.393

NGA 0.979 0.477RTF-DAC4 0.992 0.36

Temps

Fréq

uenc

e

RTFA-DAC4: M=12

Temps

Fréq

uenc

e

RTFA-DAC4: M=5

Temps

Fréq

uenc

e

RTFA-DAC4: M=16

Temps

Fréq

uenc

e

RTFA-DAC4: M=20

a.

RTF idéale

Temps

Fréq

uenc

e

b.Temps

Fréq

uenc

e

RTFA-DAC4: M=12

Page 172: carte - representations temps - frequences ENSIETA

7. Méthodes temps-fréquence modernes

ENSIETA, Janvier 2002Centre de Recherche "Extraction et Exploitation de l'Information en Environnements Incertains

167

Figure 7.15. DTSC et DFSC en fonction du facteur d’atténuation a pour les quatre approches:DAC4, PWVL, DWVM et NGA

Quelques remarques peuvent être faites:

1. Du point de vue de la conservation du support temporel (paramètre DTSC) les performances deRTF-DAC4 sont similaires à celles de PWVL, mais la première présente l'avantage d'être fortementautomatisée : pour l'évaluer on a initialement choisi le nombre de fonctions désirées et le nombre defonctions de base (64). Par contre, pour évaluer la PWVL, on a dû adapter les tailles des fenêtres G etH. De plus, nous avons été contraints de faire un compromis entre les résolutions temporelle etfréquentielle.

Les performances des autres méthodes (NGA et DWVM) sont moins bonnes que cellesprésentées ci-dessus. La justification est due au fait que ces distributions ne sont pas adaptées à lastructure du signal : même si le signal de départ est atténué, RTF-DAC4 peut suivre la loi de variationen fréquence. Au contraire, DWVM, par exemple, qui utilise un critère d’entropie (le critère du choixde la meilleure base donnée par DPOIT) a un fonctionnement fort différent : lorsque le signal estatténué, des coefficients sont perdus et, par conséquent, l’entropie augmente et donc la sélection de lameilleure base n'est plus efficace.

2. Sur le plan de la conservation du support fréquentiel (paramètre DFSC) les résultats sontsimilaires. Le deuxième graphique de la figure 7.16, montre la supériorité de RTF-DAC4 par rapportaux autres méthodes.

Pour des valeurs du coefficient d’atténuation supérieures à 0.4, DFSC n’apporte aucuneinformation, puisque le signal initial tend vers une impulsion qui occupe tout le support fréquentiel.

Les tests présentés dans la suite de ce paragraphe permettent de qualifier le décalage temporelminimal entre deux signaux chirp pour lequel on pourra continuer à les distinguer. On utilise deuxchirps avec un décalage [ ]t 0 1 30∈ ; échantillons. Pour chaque valeur de t0 , on applique les quatredistributions T-F et on évalue le paramètre DTSC (la procédure de mesure est présentéeschématiquement sur la figure suivante).

Support temporel en fonction de a

Support fréquentiel en fonction de a

DTS

CD

FSC

a

a

Page 173: carte - representations temps - frequences ENSIETA

7. Méthodes temps-fréquence modernes

ENSIETA, Janvier 2002Centre de Recherche "Extraction et Exploitation de l'Information en Environnements Incertains

168

Figure 7.16. La procédure de mesure de SSCR pour les chirp décalés temporellement

Les résultats obtenus sont reportés dans le tableau 7.2; la valeur idéale de SSCR vaut 1.Tableau 7.2. : SSCR en fonction de t0

SSCRt0

PWVD DWVM NGA RTF-DAC424 4 1 1 117 3 1 1 116 3 1 1 115 2.5 1.5 1 114 2.5 3 1 113 2 2 1 112 2 2.5 0.5 111 2 4 0.5 110 2 2 0.5 19 2 2 0.5 18 2 2.5 0.5 17 2 4 0.5 0.56 2 0.5 0.5 0.52 2 0.5 0.5 0.51 2 0.5 0.5 0.5

Comme on peut le constater, les performances de RTF-DAC4 sont meilleures. Lefonctionnement des autres méthodes est affecté :− dans le cas de PWVL : quand les signaux sont proches l’un de l’autre (un décalage plus petit que

24), le choix des tailles des filtres ne permet pas de mettre en évidence ces deux composantes.− DWVM fonctionne correctement jusqu’un décalage de 15 échantillons; la situation est présentée

sur la figure 7.18. L’explication de ce phénomène est montrée, d’une manière schématique, sur lafigure 7.17.

Figure 7.17. Apparition des termes d’interférence parasites pour DWMD

t

f

t0

DAC4 NGA PWVL DWVM

Calcul de DTSC et comparaison

Temps

Fréquence

Chirp1Chirp2

Interferencesparasites

D

Page 174: carte - representations temps - frequences ENSIETA

7. Méthodes temps-fréquence modernes

ENSIETA, Janvier 2002Centre de Recherche "Extraction et Exploitation de l'Information en Environnements Incertains

169

Figure 7.18. Décalage temporel: comparaison entre MWVD et DAC4

Comme il est démontré en [11], les termes d’interférence entre les fonctions de base quiappartiennent au même sous-espace sont des termes utiles. Pour les retenir on a introduit un seuil dedistance, D. Dans le cas où les atomes sont très proches l’un de l’autre on a des termes quiappartiennent aux différents sous-espaces et une distance plus petite que le seuil D. Par conséquent,on aura des termes d’interférence qui nuisent aux performances de DWVM. Le fonctionnement deNGA est limité par la capacité du noyau à s’adapter à la structure du signal dans le plan desambiguïtés. La figure 7.19 montre que le noyau gaussien ne peut pas mettre en évidence les deuxchirps. Mais, par rapport aux DWVM et PWVL, NGA fonctionne jusqu’à un décalage de 13échantillons. Ce graphique illustre la supériorité de RTF-DAC4 en ce qui concerne la conservationde la structure du signal, quand il s’agit de chirps décalés en temps.

Figure 7.19. Décalage temporel: comparaison entre NGA et DAC4

7.6. Conclusion. Perspectives

Cet chapitre a présenté deux approches temps-fréquence modernes adaptées aux applicationscomme la classification des signaux. Par les exemples présentés, on a mis en évidence les avantagesde ces méthodes, en ce qui concerne l'amélioration de la lisibilité des images temps-fréquence

Temps

Fréq

uenc

e (n

orm

alis

ée)

TempsFr

éque

nce

(nor

mal

isée

)Retard

Dop

pler

Temps

Fréq

uenc

e (n

orm

alis

ée) DAC4 - M=2 éléments

Fonction d'ambiguïtéRTF idéale

DWVM: eps=0.3,D=16

Fréq

uenc

e (n

orm

alis

ée)

Fréq

uenc

e (n

orm

alis

ée)

Fréq

uenc

e (n

orm

alis

ée)

Retard

Dop

pler

Fonction d'ambiguïté

DAC4 - M=2 elementsTemps

TempsTemps

RTF idéale

Noyau Gaussien Adaptatif: alpha=3

Page 175: carte - representations temps - frequences ENSIETA

7. Méthodes temps-fréquence modernes

ENSIETA, Janvier 2002Centre de Recherche "Extraction et Exploitation de l'Information en Environnements Incertains

170

générées. Une étude comparative des performances de ces méthodes par rapport aux outils classiques(distribution de pseudo Wigner-Ville lissée) et ayant comme critère d'évaluation le degré deconservation du support temporel et, aussi, la lisibilité de l'image obtenue a été critiquée.

Les deux outils présentées (DWVM et DAC4) ont un haut degré d'adaptation aux structurestemps-fréquence du signal, en raison de la famille de fonctions de base, déterminée d'une manièreoptimale, soit par une décomposition en paquets d'ondelettes, soit par l'algorithme Matching Pursuit.Quel que soit l'algorithme de décomposition, la famille obtenue est complète, et nous assure l'unicitédes caractéristiques du signal. Pour la classification, on utilisera alors cet ensemble de fonctions et lescaractéristiques discriminantes seront extraites à partir des paramètres des fonctions de base.

Néanmoins, ces méthodes présentent quelques limitations et l'élimination de celles-ci feral'objet de travaux ultérieurs. Ainsi, la DWVM a deux grandes limitations : le choix des paramètres εet D et la capacité de l'ensemble des fonctions ondelette de mettre en évidence précisément lescaractéristiques du signal analysé. Pour éliminer le premier inconvénient, deux méthodes ont étéenvisagées:− L'utilisation du concept des termes d'interférence utiles, décrit en [11]. Selon ce concept, on

évaluera les termes d'interférence seulement pour les fonctions qui appartiennent au même sous-espace, surmontant ainsi le problème du choix de D. Pour le choix de ε une idée consiste àappliquer un seuil spécifique pour chaque sous-espace, mais la stratégie optimale de seuillagesera définie dans les travaux futurs;

− L'utilisation de la TOS pour avoir une information sur la proximité des atomes dans le plantemps-fréquence. A partir de cette information, on peut calculer l'ensemble des paramètres ε et D.

Le deuxième inconvénient peut être atténué par l'introduction de quelques paramètressupplémentaires dans la structure des fonctions de base utilisées. En fait, par l'introduction du taux demodulation linéaire, par exemple, on pourra davantage adapter l'ensemble des fonctions pour l'étudedes modulations linéaires. Ensuite, par l'utilisation des opérateurs "warping", on pourra accroître lacapacité de la transformée à s'adapter à n'importe quelle modulation traitée. Cette idée demeurevalable pour DAC4 dans l'esprit d'enrichir l'ensemble des fonctions de base dans lequel on effectue larecherche de la meilleure combinaison. De plus, pour ôter l'inconvénient lié au choix de la dimensionde l'espace de recherche (M), mis en évidence sur la figure 13, on étudiera la possibilité de remplacerl'algorithme "Matching Pursuit" par un autre, plus performant, comme Basic Pursuit ou l'algorithmepyramidal de Mallat.

Références

[1] S. Qian, D. Chen – “Joint Time-Frequency Analysis ” , Pretince Hall, New Jersey, 1998[2] P. Flandrin – "Représentations temps-fréquence” , Ed. Hermes, Paris, 1993[3] A. Quinquis, C. Ioana - “Suppression of Wigner interference-terms using extended libraries of bases”, MilitaryTechnical Academy Scientific Communications Session, Bucharest, Oct., 1999[4] L. Atlas, J. Droppo, and J. McLaughlin, "Optimizing Time-Frequency Distributions for Automatic Classification,"Proceedings of SPIE – The International Society for Optical Engineering, Vol. 3162, CA, pp. 161-171, San Diego, July,1997.[5] D.L. Jones and R.G. Baraniuk, “A simple scheme for adapting time-frequency representations”, IEEE Trans. SignalProcessing, Dec. 1994[6] S. Mallat, Z. Zhang – “Matching pursuit with time-frequency dictionaries”, IEEE Trans. Signal Processing, vol.41,no.12, PP. 3397-3415, Dec., 1993[7] I. Cohen, “Shift-Invariant Adaptive Wavelet Decomposition and Applications”, Research Thesis, Israel Institute ofTechnology, 1998[8] A. Theolis – “Computational Signal Processing with Wavelet ”, Birkhauser Press, Boston, 1998[9] Steve Mann, Simon Haykin – “The Chirplet Transform : A Generalisation of Gabor’s logon”, Canadian ImageProcessing and Patern Recognition Society, Oct. 1991[10] Aykut Bultan - “A Four-Parameter Atomic Decomposition of Chirplets”, IEEE Transaction on Signal Processing,,March 1999 [11] C. Ioana, A. Quinquis - “On The Signal Interference Structure Generated by Modified Wigner-Ville Distribution”,Paper accepted at ICASSP 2002 Conf, Orlando, Florida, May, 2002

Page 176: carte - representations temps - frequences ENSIETA

ANNEXE 1. Implémentation des décomposition en paquets d'ondelettes

ENSIETA, Janvier 2002Centre de Recherche "Extraction et Exploitation de l'Information en Environnements Incertains

171

ANNEXE 1

Implémentation des décomposition en paquets d'ondelettes classique

Dans cette annexe on présente les aspects d’implémentation de la décomposition en paquetsd’ondelettes. Dans tous les organigrammes qui seront présentées, on utilise quelques conventionspour symboliser les opérations effectuées dans les algorithmes.

NotationsPour présenter l’algorithme de décomposition en paquets d’ondelettes il faut introduire

quelques notations, qui seront corrélées aux éléments spécifiques des paquets d’ondelettes.− N - la longueur du signal;− L - le niveau maximal de décomposition: L≤log2(N);− h,g - les coefficients des filtres utilisés− l - le niveau courant de décomposition;− n - la localisation dans un certain niveau; n=0,...,2l-1;

− Il,n - l’intervalle de définition pour le sous-espace au niveau l, dans la localisation n;

[ ]I nN

nN

l n l l, , ( )= + +2

1 12

− PO - la matrice de dimension LxN qui contient la décomposition en paquets d’ondelettes;− k - l’index donné par: k=2l + n, c’est-à-dire que cet indice permet de parcourir l’arbre en ordre.− Coût - le vecteur qui contient les valeurs d’entropie au sens de Shannon à chaque localisation. La

dimension du vecteur est 2l+1-1.− MB - le vecteur qui contient les valeurs booléens ‘’mark’’. Cette valeur montrera si le sous-espace

correspondant est retenu (mark=0) ou non (mark=1).

A.1.1. L’implémentation de la décomposition

Comme on l'a vu au sous-chapitre 5.4.2 la décomposition en paquets d’ondelettes consiste àeffectuer, à chaque niveau, un filtrage passe-bas et passe-haut, suivi d’un sous-échantillonnage(décimation). Comme on a pu le voir quand on a décrit l’algorithme pyramidal de décomposition,l’opérateur d’analyse reste le même pour tout l’arbre de décomposition, donc on peut construire unalgorithme qui implémente l’opérateur d’analyse et qui est présenté dans l’organigramme suivant etensuite, on utilisera cet algorithme comme un objet. Dans cet organigramme, les variables d’entréesont :- f, qui représente le sous-espace du signal au niveau l et au nœud n;- h, g, les coefficients des filtres passe-bas et passe-haut;

CONVENTIONS

→ La séquence pour l’introduction des donnés

→ Une action

→ La vérification d’une condition de test

→ Le tracé logique des donnés → Le tracé des vecteurs → Le tracé pour reprendre une boucle

Page 177: carte - representations temps - frequences ENSIETA

ANNEXE 1. Implémentation des décomposition en paquets d'ondelettes

ENSIETA, Janvier 2002Centre de Recherche "Extraction et Exploitation de l'Information en Environnements Incertains

172

Figure 5.11. L’organigramme pour les opérations de filtrage et décimation

Les opérations sont celles décrites dans le sous-chapitre V.2.3: convolution entre lescoefficients h (g) et les coefficients situés à la position (l,n) dans l’arbre de décomposition et la

décimation, qui de point de vue informatique, peut être réalisée de la manière suivante:

Après avoir ces deux opérations, on obtient deux vecteurs de longueur N/2 qui sont mémorisédans la matrice PO aux positions Il+1,2n et Il+1,2n+1. Maintenant, on élabore l’organigramme pour ladécomposition, à partir de l’algorithme pyramidal. Celui-ci est un algorithme récursif, donc on aurabesoin d’une fonction récursive (la plus utilisée est ‘’for’’).

Opérateur de décimation de point de vue informatique

Soit (x)i=0,...,N-1 un vecteur et soit y le vecteur obtenu pardécimation.Alors,

y(i)=x(2i), où i=0,...,[(N-1)/2]si on sélectionne les termes pairs, et

y(i)=x(2i+1), où i=0,...,[(N-1)/2]si on sélectionne les termes impairs.Remarque

En pratique, on utilise les termes impairs

Sous-espace f définisur Il,n

DEBUT

Convolution Convolution

Décimation Décimation

hi gi

Filtragepasse-bas

Filtragepasse-haut

2 sous-espaces définis sur:-Il+1,2n-l’approximation de f-Il+1,2n+1-le détail de f

Approximation de f Détail de f

FIN

Organigramme d’opérateurd’analyse

Page 178: carte - representations temps - frequences ENSIETA

ANNEXE 1. Implémentation des décomposition en paquets d'ondelettes

ENSIETA, Janvier 2002Centre de Recherche "Extraction et Exploitation de l'Information en Environnements Incertains

173

Commentaires

Dans cet organigramme les variables d’entrée sont:- f - le signal de taille L qui sera analysé;- h, g - les filtres nécessaires pour l’opérateur d’analyse;- N - le niveau maximal de décomposition souhaité.

On a utilisé quelques notations: ‘’PO0,:=f’’; qui signifie que dans la première ligne de lamatrice on introduit le signal f, ‘’l!=N’’ est équivalent à ‘’l différente de N’’, ‘’dim(PO)’’ représentela dimension de la matrice. De plus, avec des lignes en trait épais on a symbolisé le tracé des sous-espaces.

A.1.2. L’implémentation de la procédure pour sélection de la meilleure base

Ce sous-chapitre on présente l’organigramme de l'algorithme du choix la meilleure base qui aété présenté au sous-chapitre 5.4.3. D’un point de vue informatique, on divise l’algorithme en deuxparties :I. On calcule l’entropie de chaque localisation et on met cette valeur dans le vecteur Coût à la positioncorrespondante (l,n).

N

PO(Il,n)

PO(Il+1,2n)PO(Il+1,2n+1)

Signal f avec unelongueur L

N

DEBUT

Ecriture dans la matrice

hihi gi

Opérateur d’analyse

if l !=N

l=l+1OUI

Organigramme d’algorithmepyramidal de décomposition

if n!=2 l-1

FIN

Initialisation de la matrice PO: chaque POl,n=0Dim(PO)=LxNPO0,:=f;

n=n+1

NON

OUI

Sortie: la matrice contenantles coefficients de la

décompositionRésultat

NON

N-niveau dedécomposition

Page 179: carte - representations temps - frequences ENSIETA

ANNEXE 1. Implémentation des décomposition en paquets d'ondelettes

ENSIETA, Janvier 2002Centre de Recherche "Extraction et Exploitation de l'Information en Environnements Incertains

174

II. On compare la valeur de l’entropie du nœud père (Coûtpère) à la somme (Coûtenfants) des entropiesdes nœuds enfants. Si Coûtpère<Coûtenfants, mark=0 et les coefficients de la décomposition quicorrespondent au nœud père seront retenus dans la meilleure base. Sinon, mark=0.

Pour évaluer l’entropie au sens Shannon de (voir le sous-chapitre 5.4.3) de chaquesous-espace on peut suivre l’algorithme décrit par l’organigramme présentée sur la figure suivante

Comme on peut voir sur cet organigramme, de point de vue informatique, pour choisir lameilleure base on suite l’algorithme suivant:

* On introduit comme variable d’entrée le vecteur Coût qui contient les valeurs de l’entropiede chaque localisation issue par la décomposition (toutes les approximations et les détails du signal).

* On définit le vecteur MB qui contiendra les valeurs booléennes mark(k); une telle valeurmontre si les coefficients correspondants à la localisation (l,n) appartiennent ou pas à la meilleurebase. MB est initialisé à zéro.

* On introduit et initialise un vecteur local ‘’Val’’ qui contient les valeurs de coût qui résultepar l’application de la méthode pour sélectionner la meilleure base.

* On développe l’algorithme récursif:- on aura une boucle ‘’FOR’’ en fonction de l - le niveau de décomposition; et une

autre en fonction de n - l’atome (le nœud) numéro ‘’n’’ sur le niveau l.- à chaque itération on compare le Coûtpère et le Coûtenfants; en fonction du résultat de

cette comparaison, on évalue:Val(2l+n)=Coûtpère; mark(2l+n)=0, si Coûtpère<Coûtenfants.

En fait, par cette opération, on a retenu les coefficients correspondant au nœud père, qui sontcaractérisés par une entropie plus petite que l’entropie des coefficients qui correspondent aux nœudsenfants.Sinon, on met Val(2l+n)=Coûtenfants; mark(2l+n)=1.

La valeur ‘’Val(2l+n)’’ sera nécessaire pour l'itération suivante (plus précisément, pourcalculer le Coûtenfant).

* A la sortie, on obtient les valeurs de ‘’mark’’ qui se trouvent dans le vecteur MB; les valeurs0 correspondent aux nœuds qui pointent vers les coefficients de la meilleure base. La sortie estvalidée quand la boucle principale (en fonction de l) est finie (la branche NON).

DEBUTOrganigramme pour le

calcul de l’entropie

Coût(k)

PO(Il,n)

if l !=NOUI

if n!=2 l-1

(l,n)

n=n+1

NON

OUINON

Matrice PO qui contient ladécomposition

Evaluation de l’entropie de PO(Il,n) k=2l+n

Cout k PO j PO jl n l n

j nN

nN

l

l

$ ( ) ( ) log ( ), ,

( )

= −= +

+

∑ 2 2

21

12

Ecrit dans levecteur Coût

Coût

FIN

Initialisation l=0;n=0

On envoie le vecteur Coûtvers l’algorithme de choixde la meilleure base

l=l+1

Page 180: carte - representations temps - frequences ENSIETA

ANNEXE 1. Implémentation des décomposition en paquets d'ondelettes

ENSIETA, Janvier 2002Centre de Recherche "Extraction et Exploitation de l'Information en Environnements Incertains

175

A.1.3.L’implémentation de la procédure de reconstruction

Après le choix de la meilleure base on peut faire le traitement souhaité (compression,débruitage) dans la meilleure base et ensuite il est nécessaire de faire la reconstruction à partir descoefficients de la meilleure base modifiés en fonction du traitement appliqué. Comme on a vu dans le

Coût(2l+n)

if l !=N

OUI

NON

l=l+1

if n!=2 l-1

n=n+1

OUI

NON

DEBUT

Calcul de:-Coûtpère=Cout(2l+n)-Coûtenfants=Val(2l+1+2n)+ +Val(2l+1+2n+1)

Le vecteur Coût quicontient l’entropie

l

NON OUI

MB(2l+n)=1 MB(2l+n)=0

if Coûtpère<Coûtenfants

Val(2 l+n)=coûtpère Val(2 l+n)=coûtenfants

Ecrit dans le vecteur MB les valeurssuccessifs de la variable mark

Initialisation MB

InitialisationVal=Coût

SortieLa meilleure

base

OrganigrammeLa sélection de la

meilleure base

FIN

Initialisationl=0

Initialisation n=0

Page 181: carte - representations temps - frequences ENSIETA

ANNEXE 1. Implémentation des décomposition en paquets d'ondelettes

ENSIETA, Janvier 2002Centre de Recherche "Extraction et Exploitation de l'Information en Environnements Incertains

176

sous-chapitre 5.4.4, l’algorithme de reconstruction est aussi pyramidal mais il faut partir du dernierniveau de décomposition en ne tenant compte que des coefficients de la meilleure base. Dans ce senson a introduit l’opérateur de synthèse qui répète les opérations de la fonction d’analyse. Dansl’organigramme suivant on montre quelle est la forme de l’opérateur de synthèse, du point de vueinformatique. On définit l’opérateur d’interpolation:

Pour la reconstruction, on applique cet opérateur pour tous les coefficients de la meilleurebase, à partir du dernier niveau de décomposition. Donc, l’algorithme sera récursif, mais la boucle enfonction de l commencera de l=N-1.

Commentaires

Les données d’entrée sont: la matrice de décomposition PO et le vecteur MB qui est issu del’algorithme de sélection de la meilleure base. Ensuite, on introduit une fonction de typeINPUT/OUTPUT qui permet de modifier les valeurs de la PO en concordance avec les modificationsqui apparaîtront dues à l’opérateur de synthèse. A chaque itération on teste si la valeur MB du nœud(l,n) est 1. C’est-à-dire on teste si le nœud est terminal ou pas. Si MB(2l+n)=1 le nœud est non

Opérateur d’interpolation de point de vue informatique

Soit (x)i=0,...,N/2 un vecteur et soit y le vecteur obtenu parinterpolation.Alors,

y(i)=x(i), si i=2k+1, k=0,...,N/2y(i)=0, si i=2k, k=0,...,N/2

Donc, la taille de y sera N.

Coefficientsfiltré passe-

Coefficientsfiltré passe-bas

DEBUT

Convolution Convolution

FIN

Organigramme de l’opérateurde synthèse

hi gi

Coefficients dunœud (l+1,2n)

Coefficients dunœud (l+1,2n+1)

Interpolation Interpolation

Sommevectorielle

Coefficients dunœud (l,n)

Page 182: carte - representations temps - frequences ENSIETA

ANNEXE 1. Implémentation des décomposition en paquets d'ondelettes

ENSIETA, Janvier 2002Centre de Recherche "Extraction et Exploitation de l'Information en Environnements Incertains

177

terminal, donc on applique l’opérateur de synthèse pour ses nœuds enfants. Sinon, on passe au nœudimmédiatement suivant, dans le même niveau de décomposition.

Comme on a déjà remarqué, l’algorithme commence au niveau N-1 et la procédure présentéenous assure que les nœuds traités sont ceux de la meilleure base. Quand l=0, n sera aussi 0, et cecicorrespond à la première ligne de la matrice qui ne sera que le signal reconstruit.

NON

NONPO(Il+1,2n) PO(I l+1,2n+1 )

DEBUT

Matrice POl,n Vecteur MBInitialisationl=N-1;n=0

Ecrit/Lire dans/de lamatrice PO

if l !=0NON

OUII

Organigrammed’algorithme pyramidal desynthèse

l=l-1

if n!=2 l-1

n=n+1

FIN

OUII

if MB(2l+n)=1OUII

Opérateur de synthèse

PO(Il,n)

l n

Signal reconstruit

PO(I0,0)

Page 183: carte - representations temps - frequences ENSIETA

ANNEXE 1. Implémentation des décomposition en paquets d'ondelettes

ENSIETA, Janvier 2002Centre de Recherche "Extraction et Exploitation de l'Information en Environnements Incertains

178

Implémentation des décomposition un paquets d'ondelettesinvariante par translation (DPOIT)

Dans les sous-chapitres antérieurs, on a démontré les propriétés d’invariance du point de vuemathématique et une méthode d’obtenir l’invariance en temps a été déployée.

Après la décomposition et le choix de la meilleure base, on peut faire la reconstruction. Onutilise les sous-espaces du signal, dans la meilleure base déterminée par algorithme présenté dans lesous-chapitre antérieur. Du au fait qu’on ne peut pas savoir, avant de faire la décomposition, quelssont les sous-espaces retenus dans la meilleure base, il faut mémoriser tous les bases orthonormalesqui se trouvent dans la libraire étendue d’ondelettes. Néanmoins, on va voir que cette solution(proposée pas Israel Cohen) n’est pas applicable car l’espace mémoire nécessaire est très grand, et, lagestion de cette mémoire augmentera le temps de calcul. On propose, donc, une autre méthode (quirespecte la théorie présentée) mais qui est plus adaptée pour l’application pratique.

La décimation

Dans le cas de la décomposition en paquets d’ondelettes classique la décimation ne prend encompte que les termes impairs. Dans le cas de la DPOIU, on introduit la notion de Sous-Echantillonnage adaptatif.

Soit Ckk=1,...,N une séquence numérique qui sera décimée adaptativement et soit Dkk=1,...N/2

la séquence qui résultera après cette opération (on a supposé que N est paire; sinon, on introduit unzéro pour avoir une longueur paire). On a deux cas:I. Dk=C2k, k=1,.....,N/2 si on a sélectionné les termes paires.II.Dk=C2k-1, k=1,.....,N/2 si on a sélectionné les termes impaires.

Pour la sélection de la meilleure base, on peut utiliser plusieurs critères: l’entropie au sens deShannon, le MDL(Minimum Description Length), le Kurtosis etc. On utilisera, pour décrire laprocédure, l’entropie au sens de Shannon.

Pour choisir parmi les termes paires ou impaires, on évalue l’entropie de la séquence C2k(EN2k) et l’entropie de la séquence C2k-1 (EN2k-1). Si EN2k<EN2k-1, Dk=C2k; sinon,Dk=C2k-1.

Pour pouvoir utiliser les fonctions qui ont été définies pour les paquets d’ondelettes, (doncpour être compatible avec l’environnement Wavelab) et pour faire un sous-échantillonage adaptatif,on utilise la séquence initiale et la séquence décalée d’une position et on applique la même procédureque pour la décimation classique pour les deux séquences. En fait, on fait ce que nous avons présenté,parce que par décalage circulaire d’une position, les termes qui étaient impairs deviennent les termespaires. On montre ceci sur l’exemple suivant:

Soit x=[2 3 1 4 3 4 2 1] . Les termes pairs sont 3,4,4,1 et les termes impairs sont 2,1,3,2.Par la décimation classique utilisée pour les paquets d’ondelettes classique on obtient:Dimpaires=[2 1 3 2].

Si on fait un décalage circulaire d’une position vers la droite; on obtiendraxdécalé=[1 2 3 1 4 3 4 2] ; ici, les termes pairs sont 2,1,3,2 et les termes impairs sont 1,3,4,4. On aobtenu les termes impairs (pairs) qui, pour la séquence initiale étaient les termes paires(impaires),mais l’ordre n’est pas le même.

Finalement, si on applique la même fonction de décimation, on choisit les termes paires dusignal initial. On obtiendra:Dpaires=[1,3,4,4].

RemarqueSoit x un certain signal. On appellera le décalage circulaire de x d’une position la version

décalée de x.

Page 184: carte - representations temps - frequences ENSIETA

ANNEXE 1. Implémentation des décomposition en paquets d'ondelettes

ENSIETA, Janvier 2002Centre de Recherche "Extraction et Exploitation de l'Information en Environnements Incertains

179

Dans le sous-chapitre 5.5., pour obtenir l’invariance en temps, on a introduit un nouveau degréde liberté qui modifie la localisation en temps des fonctions de base. La décomposition en paquetsd’ondelettes classique décompose, à chaque niveau, chacune des nœud en deux nœuds enfants: lenœud enfant gauche représente la version filtrée passe-bas et décimée, par la délection des termesimpaires du nœud père, et le nœud enfant droit représente la version filtrée passe-haut et décimée dela même façon. Dans le cas de la décomposition invariante en temps on fait la même décomposition,mais on décompose également la version décalée du signal qui correspond au nœud père. Ensuite, onapplique la procédure de sous-échantillonage adaptatif.

L’algorithme d’analyse sera toujours pyramidal, mais l’opérateur d’analyse ‘’A’’ seradiffèrent : cette fois-ci il s'agit d'un sous-échantillonage adaptatif.

Figure 6.3. L’algorithme pyramidal de décomposition en paquets d’ondelettesinvariante en temps

L’opérateur d’analyse implémente la procédure suivante:1. On décale le signal x d’une position et on obtient xd.

Sous-échantillonage adaptatifSoit (Ck)k=0,..,N le signal issu par filtrage passe-bas(passe-haut). Soit(Dk) le signal résulté de la décimation adaptative.On note Ck’ la version décalée de Ck.

Si Entropie(C’2k-1)<Entropie(C2k-1), k=1,...,N/2Dk=C’2k-1 → on a choisi les termes pairs

SinonDk=C2k-1 → on a choisi les termes impairs

ENd

G(z)

↓2↓2

Opérateur d’analyse (A)

A

signal original

A

A A

AAAA

x

xh

xd

xg

Entropie(xh) Entropie(xdh) Entropie(xdg) Entropie(xg)

↓2↓2 ↓2↓2 ↓2↓2

++

ENd

ComparaisonSi ENd>EN → r=0Si ENd<EN → r=1

rValidation

si r=1Validation

si r=0

xdh xdg xh xg

OU

H(z)

xdh xdg

D

H(z) G(z)

Page 185: carte - representations temps - frequences ENSIETA

ANNEXE 1. Implémentation des décomposition en paquets d'ondelettes

ENSIETA, Janvier 2002Centre de Recherche "Extraction et Exploitation de l'Information en Environnements Incertains

180

2. On filtre et on décime x et xd, et on obtient xh,xg (correspondant au signal initial x) et xdh, xdg(correspondant à la version décalée du signal xd).3. On calcule EN=Entropie(xh)+Entropie(xg) et ENd=Entropie(xdh)+Entropie(xdg).4. On compare EN et End:

- si EN<ENd, r=0 et l’approximation de x sera xh et le détail sera xg;- si EN>ENd, r=1 et l’approximation de x sera xdh et le détail sera xdg.

On peut observer que l’opérateur d’analyse est plus compliqué que l’opérateur d’analyseclassique. L’implémentation de cet opérateur permet l’optimisation du logiciel qui sera développé.

Dans l’algorithme précèdent on a introduit l’indice ‘’r’’ qu’on va l'appeller ‘’l’indiced’invariance relatif’’ et qui est défini de la manière suivante :

- si on a choisi les termes pairs: r=1- sinon, r=0.A la reconstruction, on utilise les coefficients dans la meilleure base et les indices r

correspondant.Les notations nécessaires pour élaborer les organigramme spécifiques à la décomposition

invariante en temps sont les mêmes que celles utilisées pour décrire la décomposition en paquetsd’ondelettes classique. On a en plus besoin des notations suivantes:- af - l’approximation du signal f;- df - le détail du signal f;- fd - la version décalée circulairement de f;- fh - la version du signal f filtrée passe-bas et puis décimée par la sélection des termes impaires;- fg - la version du signal f filtrée passe-haut et puis décimée par la sélection des termes impaires;- fhd - la version du signal fd filtrée passe-bas et décimée de la même manière;- fgd - la version du signal fd filtrée passe-haut et décimée de la même manière;- ent(x) - l’entropie du signal x, où x peut être: fh, fg, fhd, fgd.- r - l’indice d’invariance relatif correspondant à chaque sous-espace du signal;

En conséquent, l’opérateur d’analyse, du point de vue informatique, présenté ci-dessus,réalise, par rapport à l’opérateur classique, plusieurs fonctions:

→ le calcul de l’entropie pour chaque sous-espace du signal (ent(af) et ent(df)), lesvaleurs qui seront utilisées pour sélectionner la meilleure base.

→ on génère les valeurs des indices d’invariance relatifs, qui seront utilisés pour lareconstruction;

→ on ne retient que les coefficients filtrés passe-bas et passe-haut qui ont, ensemble,une entropie minimale. On applique cet opérateur récursivement, et on voit que l’entropie descoefficients dans la meilleure base est minimale et constante sans tenir compte de la positiontemporelle du signal. Il n’est pas nécessaire de retenir toute la librairie étendue d’ondelettes; donc, onpeut utiliser la même matrice que pour la décomposition classique.

L'inconvénient de la décomposition en paquets d’ondelettes invariante en temps est que letemps de calcul est plus important que celui de la décomposition classique, à cause du test dudécalage. Mais le fait qu’il n’est pas nécessaire de retenir toute la libraire étendue et le fait qu'on peutcalculer encore dans cette phase les valeurs de l’entropie nous permettent d’optimiser le code.

Page 186: carte - representations temps - frequences ENSIETA

ANNEXE 1. Implémentation des décomposition en paquets d'ondelettes

ENSIETA, Janvier 2002Centre de Recherche "Extraction et Exploitation de l'Information en Environnements Incertains

181

Figure 6.4. L’organigramme pour l’opérateur d’analysede la décomposition invariante

DEBUT

Sous-espace f définisur Il,n

hi gi

Décalage circulairefd[n]=f[n-1]

Convolution

Décimationy(i)=x(2i-1)

Convolution Convolution Convolution fd

Décimationy(i)=x(2i-1)

Décimationy(i)=x(2i-1)

Décimationy(i)=x(2i-1)

fh fhd fgd fg

ENd=Ent(fhd)+Ent(fgd)Ent - entropie évaluée par

la relation ci-dessus

CalculEnt(fhd)

CalculEnt(fgd)

CalculEnt(fh)

CalculEnt(fg)

EN=Ent(fh)+Ent(fg)Ent - entropie évaluée par

la relation ci-dessus

∆E=EN-ENd

Si ∆E<0OUI NON

af=fhdf=fg

EN(af)=Ent(fh)EN(df)=Ent(fg)

af=fhddf=fgd

EN(af)=Ent(fhd)EN(df)=Ent(fgd)

r(af)=0r(df)=0

r(af)=1r(df)=1

Organigramme de l’opérateurd’analyse

pour la décompositioninvariante en temps

FIN

Sortie r(af) et r(df)

SortieEN(af) et EN(df)

Sortie af et df

Formule pour évaluer l’entropie

Ent(x)= − ∑ x xi i

2 2log

Significations des variables:- fd - la version décalée du signal f- af - l’approximation du signal f- df - le détail du signal faf et df sont définis sur les intervalles Il+1,2n

et Il+1,2n+1

Page 187: carte - representations temps - frequences ENSIETA

ANNEXE 1. Implémentation des décomposition en paquets d'ondelettes

ENSIETA, Janvier 2002Centre de Recherche "Extraction et Exploitation de l'Information en Environnements Incertains

182

PO(Il+1,2n)

PO(Il+1,2n+1)

Signal f de longeur L

N

DEBUT

Ecriture/Lecture dans/de lamatrice

N-niveau dedécomposition hihi gi

Opérateur d’analysepour la décompositioneinvariante en temps

Organigramme d’algorithmepyramidal de décomposition

invariante en temps

FIN

Initialisation de la matrice PO: chaque POl,n=0Dim(PO)=LxNPO0,:=f;

SortieLa matrice de décomposition

PO

N

PO(Il,n)

if l !=N

l=l+1OUI

if n!=2 l-1

(l,n)

n=n+1

NON

OUINON

La matricePO

Coût(2l+1 +2n)=EN(POl+1,2n)Coût(2l+1 +2n+1)=EN(POl+1,2n+1 )

r(2l+1 +2n)=r(POl+1,2n)r(2l+1 +2n+1)=r(POl+1,2n+1 )

SortieLe vecteur Coût pour lasélection de la MB

SortieLe vecteur r pour lareconstruction

Page 188: carte - representations temps - frequences ENSIETA

ANNEXE 1. Implémentation des décomposition en paquets d'ondelettes

ENSIETA, Janvier 2002Centre de Recherche "Extraction et Exploitation de l'Information en Environnements Incertains

183

L’algorithme pour la sélection de la meilleure base sera le même comme celui dans le cas dedécomposition en paquets d’ondelettes classique, puisqu’on a retenu, dans la phase de décomposition,les sous-espaces du signal qui présentent les plus petites valeurs de l’entropie. On nous garantit que lameilleure base trouvée sera invariante en temps.

Après le traitement souhaité, on peut faire la reconstruction. L’algorithme de synthèseressemble à l’algorithme de synthèse classique, mais, l’opérateur de synthèse sera différent parcequ’il doit tenir compte des indices d’invariance relatifs. Donc, l’algorithme de synthèse sera:

Pour illustrer l’algorithme de synthèse, on prend le même exemple que celui utilisé pourmontrer l’algorithme de synthèse classique.. On peut voir que l’opérateur de synthèse utilise quatrecommutateurs qui sont commandés par la valeur du r:

− si r=0, les commutateurs K1 et K3 sont fermés (K2 et K4 sont ouverts). r=0, c’est-à-direque ax (l’approximation du x) et dx (le détail du x) sont obtenus en appliquant l’opérateurd’analyse invariante en temps sur le signal x.

Signal originalreconstruit

S

S

S

S

S

daaaaaadd ddd

(da0,da1) (ad0,ad1)

K4

K3K1

K2

H’(z)

↓2↑2

G’(z)

↓2↑2

Opérateur de synthèse (S)

S

+

ax dx

-D -D

Si r(ax)=r(dx)=0 →K1,K3-fermés K2,K4-ouverts

Si r(ax)=r(dx)=1 →K1,K3-ouverts K2,K4-fermés

r(ax)=r(dx)

x

Page 189: carte - representations temps - frequences ENSIETA

ANNEXE 1. Implémentation des décomposition en paquets d'ondelettes

ENSIETA, Janvier 2002Centre de Recherche "Extraction et Exploitation de l'Information en Environnements Incertains

184

− si r=1, la situation est inversée est c’est-à-dire que ax et dx sont obtenus en appliquant lemême opérateur sur la version décalée vers la droite de x. C’est pour cela qu’il faut faireun décalage inverse (vers la gauche), par l’opérateur ‘’-D’’.

L’organigramme pour l’opérateur de synthèse est donné sur la figure antérieure.

Après la définition de l’opérateur de synthèse, on peut construire l’algorithme dereconstruction, qui ressemble beaucoup à celui de la reconstruction classique; on introduit, en plus, levecteur r qui est nécessaire pour l’opérateur associé à l’algorithme invariant en temps.

d

r(2 l+1+2n)=r(2 l+1+2n+1)

DEBUT

Organigramme d’opérateur desynthèse pour ladécomposition invariante entemps

Coefficientsfiltré passe-haute

Convolution

giCoefficients du

noeud (l+1,2n+1)

Interpolation

Coefficientsfiltré passe-bas

Convolution

hi

Coefficients dunoeud (l+1,2n)

Interpolation

FIN

Sommevectorielle

Coefficients dunoeud (l,n)

DEBUT DEBUT

if r=0OUI NON

a(i)=a(i+1)

d(i)=d(i)

d(i)=d(i+1)

aa(i)=a(i)

Page 190: carte - representations temps - frequences ENSIETA

ANNEXE 1. Implémentation des décomposition en paquets d'ondelettes

ENSIETA, Janvier 2002Centre de Recherche "Extraction et Exploitation de l'Information en Environnements Incertains

185

Observations

1. On appelle les opérations associées à la décomposition en paquets d’ondelettes invariante en tempspar les noms donnés aux opérations associés à la décomposition classique accompagnés del’expression ‘’invariante en temps’’; par exemple,’’l’opérateur d’analyse invariante en temps’’.2 Le vecteur r a la même forme que le vecteur MB et chaque valeur de ce vecteur correspond à uncertain nœud.

r(2l+1 +2n)r(2l+1 +2n+1)

NON

NONPO(Il+1,2n) PO(I l+1,2n+1 )

DEBUT

Matrice POl,n Vecteur MBInitialisation

l=N-1;n=0

Ecrit/Lecture dans/de lamatrice PO

if l !=0NON

OUII

Organigramme d’algorithmepyramidal de synthèse pour ladécomposition invariante entemps

l=l-1

if n!=2 l-1

n=n+1

FIN

OUII

if MB(2l+n)=1OUII

Opérateur de synthèse

PO(Il,n)

l n

Signal reconstruit

PO(I0,0)

Vecteur r