zeit-frequenz-analyse mit methoden der gabor analysiszeit-frequenz-analyse mit methoden der gabor...

113
Zeit-Frequenz-Analyse mit Methoden der Gabor Analysis DIPLOMARBEIT Zur Erlangung des Grades eines Diplom-Mathematikers Justus-Liebig Universität Giessen Mathematisches Institut eingereicht von Nicki Holighaus Giessen, März 2010 Betreuer: Prof. Dr. Tomas Sauer Zweitgutachter: Prof. Dr. Hans Georg Feichtinger

Upload: others

Post on 02-Oct-2020

20 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: Zeit-Frequenz-Analyse mit Methoden der Gabor AnalysisZeit-Frequenz-Analyse mit Methoden der Gabor Analysis DIPLOMARBEIT Zur Erlangung des Grades eines Diplom-Mathematikers Justus-Liebig

Zeit-Frequenz-Analyse mit Methoden der GaborAnalysis

D I P L O M A R B E I T

Zur Erlangung des Grades eines Diplom-Mathematikers

Justus-Liebig Universität GiessenMathematisches Institut

eingereicht von

Nicki Holighaus

Giessen, März 2010

Betreuer: Prof. Dr. Tomas SauerZweitgutachter: Prof. Dr. Hans Georg Feichtinger

Page 2: Zeit-Frequenz-Analyse mit Methoden der Gabor AnalysisZeit-Frequenz-Analyse mit Methoden der Gabor Analysis DIPLOMARBEIT Zur Erlangung des Grades eines Diplom-Mathematikers Justus-Liebig

Hiermit erkläre ich, dass ich die vorliegende Diplomarbeit bis auf die offizielle Be-treuung selbst und ohne fremde Hilfe angefertigt habe und die benutzten Quellenund Hilfsmittel vollständig angegeben sind.

Giessen, den

Page 3: Zeit-Frequenz-Analyse mit Methoden der Gabor AnalysisZeit-Frequenz-Analyse mit Methoden der Gabor Analysis DIPLOMARBEIT Zur Erlangung des Grades eines Diplom-Mathematikers Justus-Liebig

InhaltsverzeichnisEinleitung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1Aufbau dieser Arbeit . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3Notation . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5

1 Die Short-Time Fourier Transform 61.1 Zeit-Frequenz-Analyse . . . . . . . . . . . . . . . . . . . . . . . . . 61.2 Short-Time Fourier Transform . . . . . . . . . . . . . . . . . . . . . 91.3 Diskrete Short-Time Fourier Transform . . . . . . . . . . . . . . . . 201.4 Algorithmen für DSTFT und Inverse DSTFT . . . . . . . . . . . . 25

2 Die Gabortransformation 322.1 Eine kurze Geschichte der Gabor Analysis . . . . . . . . . . . . . . 322.2 Gabor-Zerlegung und Gabortransformation . . . . . . . . . . . . . . 342.3 Diskrete Gabortransformation . . . . . . . . . . . . . . . . . . . . . 422.4 Algorithmen für DGT und Inverse DGT . . . . . . . . . . . . . . . 50

3 Gabor-Frames und Gabor-Tight-Frames 563.1 Grundlagen der Frametheorie . . . . . . . . . . . . . . . . . . . . . 563.2 Gabor-Frames . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 583.3 Diskrete Gabor-Tight-Frames . . . . . . . . . . . . . . . . . . . . . 70

4 Gabor und Wavelets 764.1 Die Wavelettransformation . . . . . . . . . . . . . . . . . . . . . . . 774.2 Musikanalyse - Exkursion ins Reich der Töne . . . . . . . . . . . . 83

4.2.1 Testsignale - Gruppe 1 - Obertonreihen . . . . . . . . . . . . 854.2.2 Testsignale - Gruppe 2 - Der Akkord . . . . . . . . . . . . . 854.2.3 Testsignale - Gruppe 3 - Das Violinsolo . . . . . . . . . . . . 85

4.3 Résumé . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 86

A Mathematische Grundlagen 94A.1 Funktionen, Folgen, Integrierbarkeit . . . . . . . . . . . . . . . . . . 94A.2 Fourier Analysis und Signalverarbeitung . . . . . . . . . . . . . . . 98

B Zur Wahl von Wavelet und Darstellung 102

C Inhalt der beiliegenden CD 104

Index 105

Literatur 107

Page 4: Zeit-Frequenz-Analyse mit Methoden der Gabor AnalysisZeit-Frequenz-Analyse mit Methoden der Gabor Analysis DIPLOMARBEIT Zur Erlangung des Grades eines Diplom-Mathematikers Justus-Liebig

Abbildungsverzeichnis1 Heisenberg-Box . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 92 Gabor- und Waveletatome . . . . . . . . . . . . . . . . . . . . . . . 103 Zeit-Frequenz-Shifts . . . . . . . . . . . . . . . . . . . . . . . . . . . 114 Testsignal und STFT . . . . . . . . . . . . . . . . . . . . . . . . . . 165 Variation der Fensterlänge . . . . . . . . . . . . . . . . . . . . . . . 166 Zufallssignal und Dreieckspuls . . . . . . . . . . . . . . . . . . . . . 267 DFT und sinc2 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 268 Produkt und Faltung . . . . . . . . . . . . . . . . . . . . . . . . . . 269 DFT des von-Hann-Fensters . . . . . . . . . . . . . . . . . . . . . . 2710 Explizite Fouriertransformierte (von-Hann) . . . . . . . . . . . . . . 2711 Differenzen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2712 Relative Abweichung . . . . . . . . . . . . . . . . . . . . . . . . . . 2813 Fallunterscheidung - Sampling . . . . . . . . . . . . . . . . . . . . . 3714 Verlängertes von-Hann-Fenster . . . . . . . . . . . . . . . . . . . . . 7115 Verlängertes Blackman-Fenster . . . . . . . . . . . . . . . . . . . . 7116 Haar- und Morlet-Wavelet ω = 2 . . . . . . . . . . . . . . . . . . . 7817 Morlet-Wavelet ω = 7 . . . . . . . . . . . . . . . . . . . . . . . . . . 7818 von-Hann-Wavelet ω = 7 . . . . . . . . . . . . . . . . . . . . . . . . 7819 Wahl des Waveletparameters . . . . . . . . . . . . . . . . . . . . . . 8020 Testsignale 1,2 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 8821 Transformationen Signal 1 . . . . . . . . . . . . . . . . . . . . . . . 8822 Transformationen Signal 2 . . . . . . . . . . . . . . . . . . . . . . . 8823 Testsignale 3,4 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 8924 Transformationen Signal 3 . . . . . . . . . . . . . . . . . . . . . . . 8925 Transformationen Signal 4 . . . . . . . . . . . . . . . . . . . . . . . 8926 Testsignale 5,6 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 9027 Transformationen Signal 5 . . . . . . . . . . . . . . . . . . . . . . . 9028 Transformationen Signal 6 . . . . . . . . . . . . . . . . . . . . . . . 9029 Testsignal 7 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 9130 Transformationen Signal 7 . . . . . . . . . . . . . . . . . . . . . . . 9131 logarithmierte Transformationen Signal 7 . . . . . . . . . . . . . . . 9132 Spektrogramm-Zoom (Signal 7) . . . . . . . . . . . . . . . . . . . . 9233 Variation der Zeit-Frequenz-Auflösung . . . . . . . . . . . . . . . . 9234 Wahl der Darstellung 1 . . . . . . . . . . . . . . . . . . . . . . . . . 10235 Wahl der Darstellung 2 . . . . . . . . . . . . . . . . . . . . . . . . . 10336 von-Hann vs. Morlet . . . . . . . . . . . . . . . . . . . . . . . . . . 103

Page 5: Zeit-Frequenz-Analyse mit Methoden der Gabor AnalysisZeit-Frequenz-Analyse mit Methoden der Gabor Analysis DIPLOMARBEIT Zur Erlangung des Grades eines Diplom-Mathematikers Justus-Liebig

ABBILDUNGSVERZEICHNIS

DanksagungIch möchte allen Menschen danken, die mir im vergangenen Jahr in derPrüfungsphase und bei der Erstellung dieser Arbeit geholfen haben. Meinbesonderer Dank geht an Herrn Prof. Dr. Tomas Sauer, der mich mehr alsvorbildlich betreut hat und mir seine Zeit nur allzu oft und immer freundlichwidmete, obwohl ich mitunter sicherlich nicht einfach gewesen bin. Außerdeman Herrn Prof. Dr. Hans Georg Feichtinger für die Bereitschaft, seine Zeit fürdie Pflicht des Zweitgutachters zu opfern und für die Gelegenheit, die Arbeitder NuHAG in Aktion zu sehen. An Herrn Dipl. math. Alexander Klein, dermich in seinen Waveletalgorithmus eingeführt und ihn mir zur Verwendung indieser Arbeit zur Verfügung gestellt hat.

Mein größter Dank gilt meiner Familie und vor allem Marion dafür, dass sieimmer an meiner Seite standen und mich davor bewahrt haben, vor lauterMathematik das Essen, Trinken und andere Dinge des alltäglichen Lebens zuvergessen.

Version vom 27.09.2010: Dies ist die Online-Version dieser Arbeit und auchwenn ich hoffe alle gefundenen Fehler korrigiert und keine neuen hinzugefügt zu ha-ben, ist eine solche Arbeit nie ganz und gar vollendet. Falls sie, lieber Leser, einenFehler finden oder anderweitige Verbesserungsvorschläge haben, senden sie sie bittean [email protected] oder [email protected].

Die in dieser Arbeit abgebildeten Plots wurden mit Hilfe von GNUOctave http://www.gnu.org/software/octave/ und Gnuplot http://www.gnuplot.info/ erstellt. Die verwendeten Algorithmen wurdenebenfalls in GNU Octave getestet.

1

Page 6: Zeit-Frequenz-Analyse mit Methoden der Gabor AnalysisZeit-Frequenz-Analyse mit Methoden der Gabor Analysis DIPLOMARBEIT Zur Erlangung des Grades eines Diplom-Mathematikers Justus-Liebig

ABBILDUNGSVERZEICHNIS

EinleitungIn der Signalverarbeitung streben wir danach, unterschiedlichste Signale derart ineinfache Bestandteile zu zerlegen, dass wir jedem dieser Bestandteile eine gewisseRolle in der Komposition des Gesamtsignals zuordnen können. Oft ist es sehr vielleichter, die Auswirkungen einer Manipulation dieser einfachen Komponenten ein-zuschätzen, als das gesamte Signal auf vernünftige Weise zu verändern. Wissen wirzum Beispiel von einer bestimmten Komponente, dass sie unerwünscht ist, ermög-licht uns die Zerlegung des Signals, gezielt nach dieser Komponente zu suchen undsie, falls sie doch auftritt, ebenso gezielt zu entfernen.

Ein sehr intuitives Beispiel für eine Klasse von Signalen ist Musik. Wir könnendem Signal selbst nicht, oder nur in sehr einfachen Fällen, ansehen aus welchenTönen es besteht. Haben wir jedoch die Möglichkeit, unterschiedliche Töne vonein-ander zu trennen, so können wir diese nach Belieben verstärken, abschwächen odersogar ganz entfernen.

Dieser Aufgabe der Zerlegung eines Signals in seine sogenannten Frequenzenwidmet sich die klassische Fourier Analysis, welche die Grundlage der digitalenSignalverarbeitung ist, wie wir sie heute kennen. Die Fouriertransformation, dasAnalyse-Werkzeug der Fourier Analysis, hat jedoch einen entscheidenden Nachteil:Sie verschleiert den zeitlichen Ablauf des Signals. Wir können sie uns vereinfachtals eine Art Stabdiagramm vorstellen, welches die Anteile der Frequenzen am Ge-samtsignal aufführt.

Um bei der Analogie der Musik zu bleiben: Es ist leicht zu sehen, dass einederartige Darstellung für die Analyse eines komplexen Musikstücks, das naturgemäßin seinem Verlauf stark variiert, ungenügend ist. Idealerweise würde die Analyseeines solchen Signals der zugehörigen Partitur wohl sehr stark ähneln, die so gesehennichts anderes tut, als die Zeit-Frequenz-Komponenten (Noten) des Musikstücksaufzulisten. Ein guter Musiker kann sich anhand der Partitur vorstellen, wie daszugehörige Musikstück klingen sollte und was die Veränderung einzelner Töne fürdas Gesamtwerk bedeutet.

Genau eine solche Darstellung versucht die Zeit-Frequenz-Analyse zu erreichen,wobei sich dieses Konzept jedoch auf sinnvole Weise von der Musik auf viele andereSignalklassen ausweiten lässt. Die Rolle der Noten übernehmen dabei sogenannteZeit-Frequenz-Atome, die je nach gewählter Analysemethode unterschiedliche Struk-tur haben.

Eine solche Methode ist die Gabortransformation. Ihre Atome sind in Zeit undFrequenz verschobene Versionen einer Funktion, die gut konzentriert um einenPunkt der Zeit-Frequenz-Ebene ist, die sogenannte Fensterfunktion. Alternativ kannman die Gabortransformation auch als Abtastung der Short-Time Fourier Trans-form ansehen, einer Variation der Fouriertransformation, in der verschobene Ver-sionen der Fensterfunktion mit dem Signal multipliziert werden und das Ergebniseiner Fourier-Analyse unterzogen wird. In diesem Sinne erhalten wir für jede Ver-

2

Page 7: Zeit-Frequenz-Analyse mit Methoden der Gabor AnalysisZeit-Frequenz-Analyse mit Methoden der Gabor Analysis DIPLOMARBEIT Zur Erlangung des Grades eines Diplom-Mathematikers Justus-Liebig

ABBILDUNGSVERZEICHNIS

schiebung der Fensterfunktion eine Zerlegung in die lokal auftretenden Frequenzendes Signals.

Das mathematische Teilgebiet, dass sich mit der Ausführung und den Eigen-schaften dieser Methode befasst, wird Gabor Analysis genannt. Die vorliegendeArbeit versteht sich als Einführung in die grundlegenden Prinzipien dieses Gebiets,wobei der Schwerpunkt auf der praxistauglichen Anwendung der Gabortransfor-mation zur Zeit-Frequenz-Analyse liegt. Dazu führen wir die Short-Time FourierTransform im kontinuierlichen und diskreten Kontext ein und behandeln ihre wich-tigsten Eigenschaften, wobei wir uns hier auf den 1-dimensionalen Fall beschränken.Wir sehen, dass die Gabortransformation einer Abtastung der Short-Time Fouri-er Transform entspricht, und befassen uns damit, unter welchen Umständen sie dievollständige Information des Ausgangssignals erhält und gewisse andere wünschens-werte Eigenschaften hat.

In diesem Zusammenhang behandeln wir Gabor-Tight-Frames, die besonderseinfachen Wechsel zwischen Signal und Zeit-Frequenzdarstellung ermöglichen unddennoch vollständigen Informationserhalt und numerische Stabilität gewährleisten.

Da unser besonderes Interesse der praktischen Umsetzung gilt, führen wir dieGabortransformation auf diskreten Signalen ein, auf deren Basis wir effektive Algo-rithmen zu ihrer Implementierung entwickeln. Mit Hilfe dieser Algorithmen unter-suchen wir beispielhaft einige einfache Musiksignale und vergleichen die Ergebnissemit einer weiteren Methode zur Zeit-Frequenz-Analyse, der Wavelettransformation.Dieser Vergleich beschließt die Arbeit.

Aufbau dieser Arbeit.1 Die Short-Time Fourier Transform

Wir führen kurz in die Konzepte der Zeit-Frequenz-Analyse ein und zeigen ihrenatürlichen Grenzen auf, bevor wir uns der Short-Time Fourier Transform zuwen-den. Ihre Eigenschaften und Übertragung auf den Fall diskreter Signale machenden Kern dieses Kapitels aus. Außerdem gehen wir auf die bei der Diskretisierungkontinuierlicher Signale entstehenden Probleme ein, welche die Short-Time FourierTransform von der Fouriertransformation erbt, auf die sie aufbaut. Den Abschlussdes Kapitels bilden Algorithmen zur Berechnung der Short-Time Fourier Transformund ihrer Inversen.

.2 Die Gabortransformation

Nach einem kurzen Exkurs in die Geschichte der Gabor Analysis wenden wir unsder Gabortransformation zu, einer Abtastung der Short-Time Fourier Transform,die naturgemäß einige wichtige Eigenschaften von dieser übernimmt, aber auch alseigenständige Operation betrachtet über viele interessante Charakteristiken verfügt.Bevor wir uns wiederum mit dem diskreten Fall und der Übertragung der Gabor-transformation und ihrer Eigenschaften auf diesen befassen, interessieren wir uns

3

Page 8: Zeit-Frequenz-Analyse mit Methoden der Gabor AnalysisZeit-Frequenz-Analyse mit Methoden der Gabor Analysis DIPLOMARBEIT Zur Erlangung des Grades eines Diplom-Mathematikers Justus-Liebig

ABBILDUNGSVERZEICHNIS

vor allem dafür, unter welchen Umständen die Gabortransformierte die gesamte In-formation des Ausgangssignals enthält und wie es rekonstruiert werden kann. DasKapitel wird durch Algorithmen zur Berechnung und Inversion der Gabortransfor-mation abgeschlossen.

.3 Gabor-Frames und Gabor-Tight-Frames

Befassen wir uns mit der Vollständigkeit und numerischer Umsetzung der Gabor-transformation, dann führt kein Weg am Konzept der Frames vorbei. Wir wiederho-len zunächst einige wichtige Resultate der Frametheorie, der Schwerpunkt des Ka-pitels liegt jedoch auf notwendigen und hinreichenden Kriterien für Gabor-Framesund einer Klasse von Gabor-Tight-Frames, die wir Trigonometric Frames nennenwerden. Sie entstehen als Ausschnitt aus gewissen trigonometrischen Polynomen.Da der Wechsel zwischen Signal und Gabortransformierter bei der Verwendung vonTight Frames besonders einfach ist, sind solche Frames von besonderem Interesse.Mit Hilfe einiger einfacher Überlegungen lassen sich Trigonometric Frames auch imdiskreten Fall konstruieren, was ihre Anwendung im praktischen Gebrauch ermög-licht.

.4 Gabor und Wavelets

Die Wavelettransformation ist ein äußerst populäres Werkzeug zur Zeit-Frequenz-Analyse für verschiedenste Klassen von Signalen. Wir stellen sie kurz vor und ver-gleichen sie anhand ihrer grundlegenden Eigenschaften zunächst intuitiv mit derGabortransformation. Anschließend wenden wir beide Verfahren auf einfache Mu-siksignale an und ziehen weitere Schlüsse aus den gewonnenen Ergebnissen.

.A Mathematische Grundlagen

Im ersten Abschnitt des Anhangs wiederholen wir für diese Arbeit essentielle Defini-tionen und Resultate zu Funktions- und Folgenräumen, sowie aus Fourier Analysisund Signalverarbeitung. Dieser Abschnitt dient als Einstieg für Leser, die mit denzugrundeliegenden mathematischen Prinzipien nicht vertraut sind, aber auch alsAuffrischung und Nachschlagewerk während des Studiums dieser Arbeit. Er solltegegebenenfalls zuerst gelesen werden.

4

Page 9: Zeit-Frequenz-Analyse mit Methoden der Gabor AnalysisZeit-Frequenz-Analyse mit Methoden der Gabor Analysis DIPLOMARBEIT Zur Erlangung des Grades eines Diplom-Mathematikers Justus-Liebig

ABBILDUNGSVERZEICHNIS

Notation

〈f, g〉 Inneres Produkt.f = O(g) Es existiert K mit f ≤ Kg.i imaginäre Einheit i =

√−1.

z komplexe Konjugation von z ∈ C.|z| Absolutbetrag von z ∈ C.‖ · ‖ L2(R)-Norm.‖ · ‖Lp(Rd) Lp(Rd)-Norm.‖ · ‖p `p-Norm. Behandle f ∈ `N als Folge mit Trägerlänge N .

Signalef(·); f [·] (kontinuierliche) Funktion; Folge, diskrete Funktion.f komplexe Konjugation von f .f ∗ Involution von f . f ∗(·) = f(−·) bzw. f ∗[·] = f [−·].sinc(·) normierter Sinus Cardinalis. sinc(t) = sin(πt)/(πt).χI charakteristische Funktion des Intervalls I.

MengenN natürliche Zahlen ohne 0.Z ganze Zahlen.Q rationale Zahlen.R reelle Zahlen.R+ (strikt) positive, reelle Zahlen.C komplexe Zahlen.

RäumeLp(R) Raum der Funktionen mit

∫|f(t)|p dt <∞.

`p(Z) Raum der Folgen mit ∑n∈Z |f [n]|p <∞.`N Raum N -periodischer Folgen.span(M) von der Menge M aufgespannter Raum.span(M) Abschluss des von der Menge M aufgespannten Raums.

Operationenf ∗ g Faltung von f, g.Tyf Translation von f um y.Myf Modulation von f um y.f , f∧ Fouriertransformierte von f (kontinuierlich oder diskret).fN , f∧N Diskrete Fouriertransformierte (DFT) von f ∈ `N .Vgf Short-Time Fourier Transform von f bezüglich g

(kontinuierlich oder diskret).Vg,a,bf Gabortransformation von f bezüglich des Gabor-Tripels

(g, a, b) (kontinuierlich) bzw. [g, a, b] (diskret).Wψf Wavelettransformation von f bezüglich des Wavelets ψ.

5

Page 10: Zeit-Frequenz-Analyse mit Methoden der Gabor AnalysisZeit-Frequenz-Analyse mit Methoden der Gabor Analysis DIPLOMARBEIT Zur Erlangung des Grades eines Diplom-Mathematikers Justus-Liebig

1 DIE SHORT-TIME FOURIER TRANSFORM

1 Zeit-Frequenz-Analyse und die Short-TimeFourier Transform

Wir stellen das Konzept der Zeit-Frequenz-Analyse mit translations-invarianten Fa-milien von Atomen vor. Ein spezieller Fall solcher Atome sind Weyl-Heisenberg oderGabor-Atome, Translationen und Modulationen einer einzigen Fensterfunktion. Siewerden für die Zeit-Frequenz-Analyse mittels Short-Time Fourier Transform undGabortransformation verwendet. Aber auch die Familien skalierter Translaten einesWavelets in der Waveletanalyse bilden eine solche translations-invariante Familie.Somit lernen wir einige grundsätzliche Eigenschaften kennen, die Gabortransfor-mation und Wavelettransformation miteinander teilen, erkennen aber sogleich aucherste Unterschiede.

Vorwiegend befasst sich dieses Kapitel mit der Short-Time Fourier Transform(STFT). Eine Motivation der STFT liegt darin, lokale Spektren einer gegebenenFunktion zu erhalten. Es ist bekannt, dass lokale Änderungen einer Funktion eineglobale Änderung ihres (Fourier-)Spektrums bewirken können, es kann also wichtigsein, diese Änderung zu lokalisieren und isoliert zu betrachten. Ein reines, zeit-unabhängiges Spektrum ist ebenso wenig hilfreich, falls die auftretenden Frequenzenentlang des betrachteten Signals variieren.

Mit Hilfe einer zuvor gewählten Fensterfunktion, „schneiden“ wir also Teile desSignals aus und betrachten die Fouriertransformation des Ausschnitts. Verschiebenwir die Fensterfunktion nun entlang der Zeitachse, erhalten wir ein recht genauesBild davon, welche Frequenzen zu gewissen Zeitpunkten im untersuchten Signalauftauchen.

Wir definieren die STFT und diskutieren ihre Eigenschaften. Die Invertierbarkeitder STFT wird bewiesen und Kriterien zur Auswahl geeigneter Fensterfunktionenaufgezeigt. Die meisten der hier erwähnten Resultate sind wohlbekannt und in denBüchern von Gröchenig [21] und Mallat [33] zu finden, daher werden wir nur einigeKernresultate erneut beweisen.

1.1 Zeit-Frequenz-AnalyseWenn wir davon sprechen, ein Signal einer Zeit-Frequenz-Analyse zu unterziehen,heißt das wir sind daran interessiert, wie sich die Frequenzkomponenten des Signalsentlang seines Verlaufs verändern.

Betrachten wir ein Signal als zeitabhängige Funktion f(t), so können wir leichterkennen, wie sich das Signal entlang der Zeitachse verändert. Ohne erheblichenAufwand ist es im Allgemeinen jedoch nicht möglich zu sehen, aus welchen Fre-quenzkomponenten das Signal besteht.

6

Page 11: Zeit-Frequenz-Analyse mit Methoden der Gabor AnalysisZeit-Frequenz-Analyse mit Methoden der Gabor Analysis DIPLOMARBEIT Zur Erlangung des Grades eines Diplom-Mathematikers Justus-Liebig

1.1 Zeit-Frequenz-Analyse

Die Fouriertransformierte des Signals, gegeben durch

f(ξ) =∫

Rf(t) exp(−2πiξt) dt, ξ ∈ R,

verrät uns analog dazu alles über die Frequenzanteile des Signals, verschleiert je-doch den zeitlichen Verlauf. Dennoch enthalten beide Repräsentationen die gesam-te Information des Signals; sie stehen in einer 1 : 1 Beziehung. Überhaupt ist dieFouriertransformation, trotz ihrer Schwächen, eines der wichtigsten Werkzeuge derSignalanalyse. Insbesondere sind ihre Eigenschaften entscheidend für die in dieserArbeit angeführten Ergebnisse. Die Wichtigsten haben wir daher in Anhang A nocheinmal zusammengefasst.

In [21] beschreibt Gröchenig, wie viele Andere, die Zeit-Frequenz-Analyse an-hand eines Musikstücks. Betrachten wir das Signal selbst, können wir vielleichtetwas über rhythmische Muster des Signals aussagen, aber nicht ohne weiteres überseine Melodie oder die auftretenden Töne. Die Fouriertransformation zeigt uns dieauftretenden Frequenzen (oder Töne), aber keine Rhythmik oder Melodie. Obwohlalso beide Repräsentationen die gesamte Information des Signals enthalten, zeigtkeine von ihnen die Information, die den Hörer des Musikstücks interessiert, dieMelodie.

Musiker verfügen seit geraumer Zeit über eine Notation, die gerade dies erreicht.Die Notenschrift zeigt an, welche Töne (beziehungsweise Frequenzen) in einem Mu-sikstück zu einer bestimmten Zeit auftreten. Ziel der Zeit-Frequenz-Analyse ist es,solche Zerlegungen eines Signals in seine Komponenten in Zeit und Frequenz immathematischen Kontext zu untersuchen. Dazu betrachten wir das Signal in dersogenannten Zeit-Frequenz-Ebene R× R ∼= R2. Dabei bezeichnet die erste Kompo-nente die Zeitachse, die zweite die Frequenzachse. Wir werden sehen, dass solcheZerlegungen möglich sind, jedoch nicht in derart idealisierter Form. Das definitiveHindernis exakter Zeit-Frequenz-Analyse ist die sogenannte Unschärfe.

Unschärfe und Heisenberg. Die einfachste der mannigfaltigen Formulierun-gen dieser Unschärfe ist die klassische Heisenbergsche Unschärferelation. Um sie zuformulieren, benötigen wir noch den Begriff der Varianz.

Für eine Funktion f ∈ L2(R), |f(t)|2 aufgefasst als Wahrscheinlichkeitsvertei-lung mit Erwartungswert

x =∫ +∞

−∞t|f(t)|2dt,

falls dieses Integral konvergiert, x =∞ sonst. Ist der Erwartungswert endlich, dannist die Varianz gegeben durch

σ2(f) =∫ +∞

−∞(t− x)2|f(t)|2dt,

oder σ2(f) =∞, falls das Integral divergiert. Wir bezeichnen

σ2t (f) = σ2(f)

‖f‖2 und σ2ξ (f) = σ2(f)

‖f‖2= σ2(f)‖f‖2

7

Page 12: Zeit-Frequenz-Analyse mit Methoden der Gabor AnalysisZeit-Frequenz-Analyse mit Methoden der Gabor Analysis DIPLOMARBEIT Zur Erlangung des Grades eines Diplom-Mathematikers Justus-Liebig

1 DIE SHORT-TIME FOURIER TRANSFORM

als effektive Länge, beziehungsweise effektive Bandbreite, von f . Mit diesen Be-zeichnungen gilt der folgende Satz. Ein leicht verständlicher Beweis findet sich zumBeispiel in [33].

Satz 1.1.1 (Heisenbergsche Unschärferelation).Für f ∈ L2(R) gilt

σt(f)σξ(f) ≥ 14π . (1.1)

Das bedeutet grob gesagt, je genauer die gewählte Zeit-Frequenz-Repräsentationzeitlich lokalisiert ist, desto gröber ist sie im Frequenzbereich und umgekehrt. Für fe-ste Zeitauflösung (Frequenzauflösung) gibt es eine signalunabhängige untere Schran-ke für die Feinheit der Frequenzauflösung (Zeitauflösung). Das heißt aber auch, dasswir jederzeit einen Kompromiss zwischen diesen beiden Größen eingehen müssen,während wir versuchen, die optimale Repräsentation des betrachteten Signals zuerreichen.

In L2(R) können wir jede Familie D = {φj}j∈I von Funktionen φj ∈ L2(R)mit einer Indexmenge I als eine Familie von sogenannten Zeit-Frequenz-Atomenauffassen, beziehungsweise die φj als Zeit-Frequenz-Atome. Im Normalfall sprechenwir jedoch nur dann von Zeit-Frequenz-Atomen, wenn diese Funktionen konzentriertin Zeit und Frequenz, also Funktion und ihre Fouriertransformierte außerhalb einesIntervalls fast 0 sind. Die Zeit- und Frequenzauflösungen der Analyse wird durchdie ausgewählte Familie von Zeit-Frequenz-Atomen bestimmt.

Die Zeit-Frequenz Konzentration eines Atoms können wir anschaulich an derzugehörigen Heisenberg-Box erkennen. Für ein Atom φj sei x der Erwartungswertvon |φ(t)|2, ω der Erwartungswert von |φ(ξ)|2 und σ2

t (φj), σ2ξ (φj) wie oben definiert,

dann ist die zu φj gehörende Heisenberg-Box ein Rechteck mit den Seitenlängen σtund σξ entlang der Zeit-, beziehungsweise Frequenzachse, zentriert um den Punkt(x, ω) ∈ R2.

Wird die Funktion φj mit einem Faktor s skaliert, ist also φs,j(t) = φj(t/s)/√s,

so hat die Heisenberg-Box von φs,j die Seitenlängen sσt, σξ/s, ihre Fläche bleibtunverändert. Offensichtlich ist nach (1.1) die minimale Fläche einer Heisenberg-Box 1/(4π) und oft enthalten Formulierungen der Unschärferelation den Zusatz,dass diese minimale Fläche ausschließlich für Gaussfunktionen erreicht wird.

Wir beschäftigen uns insbesondere mit translations-invarianten Repräsentatio-nen, das heißt für φj ∈ D, ist auch φj(· + u) ∈ D. Wir erhalten, ausgehend von{φj}j∈I die translations-invariante Familie D = {φu,j}u∈R,j∈I , mit φu,j(t) = φj(t−u)und für eine Funktion f ∈ L2(R) die zugehörige Zeit-Frequenz-Transformation

Φf(u, j) = 〈f, φu,j〉.

Dabei ist das innere Produkt 〈f, g〉 von Funktionen f, g ∈ L2(R) gegeben durch

〈f, g〉 =∫

Rf(t)g(t) dt. (1.2)

8

Page 13: Zeit-Frequenz-Analyse mit Methoden der Gabor AnalysisZeit-Frequenz-Analyse mit Methoden der Gabor Analysis DIPLOMARBEIT Zur Erlangung des Grades eines Diplom-Mathematikers Justus-Liebig

1.2 Short-Time Fourier Transform

Abbildung 1: Schematische Darstellung der Heisenberg-Box einer Funktion.

Sowohl die STFT, als auch die Wavelettransformation, basieren auf solchenFamilien von Zeit-Frequenz-Atomen. Im Fall der STFT entstehen diese Familiendurch Translation und Modulation (oder Translation entlang der Frequenzachse)einer einzigen, zuvor gewählten Fensterfunktion. Die Wavelettransformation dage-gen verwendet Translationen und Skalierungen eines sogenannten Mother-Wavelets.In einigen Werken findet sich auch für die Ausgangsfunktion der STFT die Bezeich-nung Mother-Wavelet, die wir hier jedoch nicht verwenden wollen.

Die unterschiedliche Struktur dieser beiden Repräsentationen führt neben denGemeinsamkeiten, die ihre enge Verwandtschaft mit sich bringt, jedoch auch zuentscheidenden Unterschieden. Wir werden in Kapitel 4 auf Einige eingehen.

1.2 Short-Time Fourier TransformDie Short-Time Fourier Transform ist eine zentrale Methode der Zeit-Frequenz-Analyse. Sie bildet den logischen ersten Schritt von reiner, nicht zeitabhängigerFourieranalyse zu einer Repräsentation, die das lokale Frequenzverhalten des be-trachteten Signals zeigt. Intuitiv ist die STFT eine lokalisierte Fouriertransformati-on. Eine in der Regel gut zeitlokalisierte Funktion, die sogenannte Fensterfunktionwird entlang der Zeitachse verschoben, über das Signal gelegt (mit ihm multipli-ziert) und das Ergebnis wird fouriertransformiert. So erhalten wir, bei geeigneterWahl der Fensterfunktion, lokale Spektren des Signals.

Nicht nur bildet die STFT die Grundlage der Gabortransformation, auch vieleandere Repräsentationen, wie zum Beispiel die Wigner-Ville-Verteilung ([21], [45],[42]), die die meisten Kriterien einer idealen Zeit-Frequenz-Repräsentation erfüllt,lassen sich durch sie darstellen. Doch auch diese Darstellung hat ein signifikantesProblem. Da sie negativ werden kann, können wir sie nicht ohne Weiteres wie das

9

Page 14: Zeit-Frequenz-Analyse mit Methoden der Gabor AnalysisZeit-Frequenz-Analyse mit Methoden der Gabor Analysis DIPLOMARBEIT Zur Erlangung des Grades eines Diplom-Mathematikers Justus-Liebig

1 DIE SHORT-TIME FOURIER TRANSFORM

Abbildung 2: Überlagerung eines Ausschnitts der Zeit-Frequenz-Ebene mit Gabor- (l) undWavelet-Atomen (r).

Spektrogramm (1.30) als Darstellung der lokalen Energie der analysierten Funktioninterpretieren. Somit ist sie ein weiteres Beispiel dafür, dass in der Zeit-Frequenz-Analyse nichts perfekt ist.

Bevor wir jedoch die STFT einführen und ihre Eigenschaften aufzeigen, nocheinige Worte zu Translations- und Modulations-Operatoren.

Translation und Modulation. Für x, ω ∈ R definieren wir die Operatoren

Txf(t) = f(t− x) (1.3)

undMωf(t) = exp(2πiωt)f(t). (1.4)

Dabei heißt Tx Translation um x und Mω Modulation um ω. Operatoren der FormTxMω oder MωTx werden Zeit-Frequenz-Shifts genannt. Zwischen Translation undModulation besteht die sogenannte kanonische Kommutationsrelation

TxMω = exp(−2πixω)MωTx. (1.5)

Zeit-Frequenz-Shifts spielen für die STFT eine ausgesprochen wichtige Rolle,denn es sind die Operationen, mit deren Hilfe aus einer Fensterfunktion g die in derTransformation verwendete Familie von Zeit-Frequenz-Atomen konstruiert wird. Esist erwähnenswert, dass sie außerdem Isometrien in Lp für 1 ≤ p ≤ ∞ sind, also

‖TxMωf‖Lp(R) = ‖f‖Lp(R)

gilt. Außerdem gilt nach (A.9) und (A.10)

(Txf)∧ = M−xf und (Mωf)∧ = Tωf .

Insgesamt erhalten wir

(TxMωf)∧ = M−xTωf = exp(−2πixω)TωM−xf . (1.6)

10

Page 15: Zeit-Frequenz-Analyse mit Methoden der Gabor AnalysisZeit-Frequenz-Analyse mit Methoden der Gabor Analysis DIPLOMARBEIT Zur Erlangung des Grades eines Diplom-Mathematikers Justus-Liebig

1.2 Short-Time Fourier Transform

Abbildung 3: Translation (b) und Modulation (Realteil) (c) einer Funktion (a). Werdenbeide Operationen kombiniert, erhalten wir einen Zeit-Frequenz-Shift, der Realteil ist zusehen in (d).

11

Page 16: Zeit-Frequenz-Analyse mit Methoden der Gabor AnalysisZeit-Frequenz-Analyse mit Methoden der Gabor Analysis DIPLOMARBEIT Zur Erlangung des Grades eines Diplom-Mathematikers Justus-Liebig

1 DIE SHORT-TIME FOURIER TRANSFORM

Weyl-Heisenberg-Systeme. Die Zeit-Frequenz-Atome der Short-Time Fou-rier Transform werden klassischerweise als Weyl-Heisenberg-Atome bezeichnet. Sieentstehen aus einer Funktion g ∈ L2(R) durch Zeit-Frequenz-Shifts. Wir bezeichnen

gx,ω = MωTxg = exp(2πiω·)g(· − x)

und nennen {gx,ω}(x,ω)∈R2 das zu g gehörende (kontinuierliche) Weyl-Heisenberg-System. Wir können nun die STFT definieren.

Definition 1.2.1 (Short-Time Fourier Transform).Zu 0 6= g ∈ L2(R) sei {gx,ω}(x,ω)∈R2 das zugeordnete Weyl-Heisenberg-System. Dannist die Short-Time Fourier Transform (STFT) einer Funktion f ∈ L2(R) bezüglichg definiert als

Vgf(x, ω) = 〈f, gx,ω〉 =∫

Rf(t)g(t− x) exp(−2πiωt) dt, für (x, ω) ∈ R2. (1.7)

Nach der Hölder-Ungleichung (A.2) ist das Integral in (1.7) punktweise definiert.

Ist die Funktion g in Zeit und Frequenz um den Punkt (0, 0) konzentriert, dannkönnen wir Vgf(x, ω) unter Vorbehalt als die Energie der Funktion f im Bereichum den Punkt (x, ω) der Zeit-Frequenz-Ebene auffassen. An der zweiten Gleichungin (1.7) sehen wir außerdem, dass Vgf(x, ·) für ein g, das beispielsweise kompaktenTräger hat und um 0 zentriert ist, der Fouriertransformation eines Ausschnitts vonf um x entspricht und in diesem Sinne ein lokales Spektrum der Funktion darstellt.

Formen der STFT. Wir führen nun einige äquivalente Formulierungen derSTFT ein, die im Laufe dieser Arbeit verwendet werden. Die folgenden Gleichun-gen sind einfache Umformungen nach den Rechenregeln der FouriertransformationA.2.1 oder nutzen nur eine von der Definition verschiedene Notation. Wir benötigenaußerdem die inverse Fouriertransformierte, gegeben durch:

f = (f(−·))∧ =∫

Rf(ξ) exp(2πiξ·) dξ

und bezeichnen von nun an mit f ∗ die Involution von f , definiert durch:

f ∗ = f(−·).

12

Page 17: Zeit-Frequenz-Analyse mit Methoden der Gabor AnalysisZeit-Frequenz-Analyse mit Methoden der Gabor Analysis DIPLOMARBEIT Zur Erlangung des Grades eines Diplom-Mathematikers Justus-Liebig

1.2 Short-Time Fourier Transform

Sind f, g ∈ L2(R), dann gilt

Vgf(x, ω) = (f · Txg)∧(ω) (1.8)= 〈f,MωTxg〉 (1.9)= 〈f , TωM−xg〉 (1.10)= exp(−2πixω)(f · Tω ¯g)∧(−x) (1.11)= exp(−2πixω)Vgf(ω,−x) (1.12)= (M−ωf ∗ g∗) (x) (1.13)

=(T−ωf · g∗

)∨(x). (1.14)

Gleichung (1.12) ist von besonderer Bedeutung, daher wollen wir sie zusammen miteiner weiteren Eigenschaft der Short-Time Fourier Transform in einem Lemma for-mulieren.

Lemma 1.2.2 (Fundamentale Identität). Sind f, g ∈ L2(R), so ist Vgf gleichmäßigstetig auf R2 und es gilt

Vgf(x, ω) = exp(−2πixω)Vgf(ω,−x) (1.15)

Diese Gleichung wird auch fundamentale Identität der Zeit-Frequenz-Analyse ge-nannt. Sie kombiniert f und f in eine gemeinsame Zeit-Frequenz-Repräsentation.

Beweis: Nur die gleichmäßige Stetigkeit ist zu zeigen. Sie folgt aus der Stetigkeitdes inneren Produktes in (1.7) zusammen mit

‖TyTxf − Tyf‖ = ‖Txf − f‖ und ‖MηMωf −Mηf‖ = ‖Mωf − f‖,

sowie

limx→0‖Txf − f‖ = 0 und lim

ω→0‖Mωf − f‖ = lim

ω→0‖Tωf − f‖ = 0.

Die Gleichungen (1.14) und (1.15) sind im Kontext dieser Arbeit vor allemdeshalb interessant, weil sie uns die Berechnung der STFT mit Hilfe der Fourier-transformierten von f und g erlauben. So können wir im diskreten Fall zum Beispielmit Abtastungen der Fensterfunktion im Frequenzbereich arbeiten, falls ihre Fou-riertransformation explizit berechnet werden kann. Mehr dazu in Kapitel 1.3.

Die STFT ist eine Sesquilinearform, das heißt sie ist linear bezüglich f undkonjugiert-linear bezüglich g. Da g üblicherweise festgehalten wird, kann Vg als li-nearer Operator von L2(R) auf Funktionen über R2 aufgefasst werden. Sie hängtoffensichtlich entscheidend von der gewählten Fensterfunktion g ab. Viele Arbeiten

13

Page 18: Zeit-Frequenz-Analyse mit Methoden der Gabor AnalysisZeit-Frequenz-Analyse mit Methoden der Gabor Analysis DIPLOMARBEIT Zur Erlangung des Grades eines Diplom-Mathematikers Justus-Liebig

1 DIE SHORT-TIME FOURIER TRANSFORM

sind ausschließlich der Frage nach geeigneten, beziehungsweise optimalen, Fenster-funktionen gewidmet ([21, Kapitel 12,13],[30],[31],[18]). Später gehen wir kurz aufeinige Eigenschaften ein, die ein Fenster haben sollte.

Orthogonalitätsrelation und Umkehrbarkeit. Der folgende Abschnitt ori-entiert sich an [21, Kapitel 3.2], wo auch der Beweis des nächsten Satzes zu findenist. Er stellt eine Art Parsevalsche Formel (A.14) für die STFT dar und wird fürden Beweis ihrer Rekonstruktionsformel benötigt.

Satz 1.2.3 (Orthogonalitätsrelation der STFT). Seien f1, f2, g1, g2 ∈ L2(R), dannist Vgjfj ∈ L2(R2) und es gilt

〈Vg1f1,Vg2f2〉L2(R2) = 〈f1, f2〉〈g1, g2〉. (1.16)

Der Beweis nutzt hauptsächlich die Parsevalsche Formel, den Satz von FubiniA.1.3 und ein Dichteargument. Wir können direkt das folgende Korollar ableiten.

Korollar 1.2.4 (Isometrie). Sind f, g ∈ L2(R), dann gilt

‖Vgf‖ = ‖f‖‖g‖.

Insbesondere gilt mit ‖g‖ = 1,

‖f‖ = ‖Vgf‖L2(R2), für alle f ∈ L2(R). (1.17)

In diesem Fall ist die STFT also eine Isometrie von L2(R) nach L2(R2).

Daraus folgern wir, dass f durch Vgf vollständig bestimmt ist. Außerdem giltmit g 6= 0 die Aussage

〈f,MωTxg〉 = 0, ∀ (x, ω) ∈ R2 ⇒ f = 0,

die gerade equivalent dazu ist, dass für jedes feste g ∈ L2(R) das zugehörige Weyl-Heisenberg-System {gx,ω}(x,ω)∈R2 einen dichten Unterraum von L2(R) aufspannt.

Mit Hilfe der Orthogonalitätsrelation können wir die Rekonstruktionsformel derShort-Time Fourier Transform beweisen, wir benötigen allerdings noch etwas mehr.Weyl-Heisenberg-Systeme zu Funktionen g ∈ L2(R) haben die Eigenschaft, dassIntegrale der Form∫

R2Φ(x, ω)MωTxg dxdω =

∫R2

Φ(x, ω)gx,ω dxdω, (1.18)

14

Page 19: Zeit-Frequenz-Analyse mit Methoden der Gabor AnalysisZeit-Frequenz-Analyse mit Methoden der Gabor Analysis DIPLOMARBEIT Zur Erlangung des Grades eines Diplom-Mathematikers Justus-Liebig

1.2 Short-Time Fourier Transform

im schwachen Sinne interpretiert, mit einer beliebigen Funktion Φ ∈ L2(R2), eineFunktion in L2(R) definieren. Das bedeutet,

〈∫

R2Φ(x, ω)gx,ω dxdω, h〉 <∞,

für alle h ∈ L2(R). Ist außerdem für ein f ∈ L2(R)

〈f , h〉 = 〈∫

R2Φ(x, ω)gx,ω dxdω, h〉,

für alle h ∈ L2(R), dann ist

f =∫

R2Φ(x, ω)gx,ω dxdω fast überall,

also sind beide Funktionen im L2-Sinne gleich. Im Folgenden sind alle vektorwerti-gen Integrale im schwachen Sinn zu verstehen.

Korollar 1.2.5 (Inverse STFT). Seien g, γ ∈ L2(R) und gelte 〈g, γ〉 6= 0. Dann istfür alle f ∈ L2(R)

f = 1〈γ, g〉

∫R2Vgf(x, ω)MωTxγ dωdx. (1.19)

Insbesondere gilt (1.19) für γ = g.

Beweis: Wir wissen nach Korollar 1.2.4, dass Vgf ∈ L2(R2). Also ist das Integral

f = 1〈γ, g〉

∫R2Vgf(x, ω)MωTxγ dxdω

nach (1.18) wohldefiniert als Funktion in L2(R). Nun sehen wir, dass unter Anwen-dung der Orthogonalitätsrelation die schwache Identität

〈f , h〉 = 1〈γ, g〉

∫R2Vgf(x, ω)〈h,MωTxγ〉 dxdω

= 1〈γ, g〉

〈Vgf,Vγh〉L2(R2) = 〈f, h〉

für beliebiges h ∈ L2(R) gilt. Damit folgt f = f und die Umkehrformel ist bewie-sen.

Kommen wir noch einmal zurück zu Heisenberg-Boxen und der Auswahl einerFensterfunktion.

15

Page 20: Zeit-Frequenz-Analyse mit Methoden der Gabor AnalysisZeit-Frequenz-Analyse mit Methoden der Gabor Analysis DIPLOMARBEIT Zur Erlangung des Grades eines Diplom-Mathematikers Justus-Liebig

1 DIE SHORT-TIME FOURIER TRANSFORM

Abbildung 4: Testsignal (l) bestehend aus Schwingungen konstanter und variierender Fre-quenz und einem Puls. STFT des Testsignals mit Fensterlänge L = 700 (r).

Abbildung 5: STFT des Testsignals mit Fensterlänge L = 100 (l) beziehungsweiseL = 6300 (r). Es ist gut zu erkennen, dass ungünstig gewählte Fensterlängen schlech-te Lokalisation bestimmter Signalanteile liefern können.

Wahl der Fensterfunktion. Wir erinnern daran, dass die Heisenberg-Boxeiner Funktion ein qualitatives Verständnis ihrer Zeit- und Frequenzauflösung ver-mittelt. Da Translation und Modulation einer L2-Funktion ihre Varianz und Normunverändert lassen, sind die Heisenberg-Boxen eines Weyl-Heisenberg-Systems inihrer Form identisch mit derjenigen der gewählten Fensterfunktion.

Das heißt, dass die Auflösung in der gesamten Zeit-Frequenz-Ebene gleich bleibt,aber auch, dass wir nur an solchen Fenstern interessiert sind, die dem Problemangemessene Auflösung entlang beider Achsen bieten. Gute Zeitauflösung bedeutetdabei eine kurze effektive Dauer, gute Frequenzauflösung entspricht einer geringeneffektiven Bandbreite.

Das klassische Beispiel einer ungeeigneten Fensterfunktion ist das Rechtecksfen-ster, welches einfachem Ausschneiden eines Teilsignals entspricht. Die Fouriertrans-formation des Rechtecksfensters ist die sinc-Funktion, die nicht einmal in L1(R) liegt

16

Page 21: Zeit-Frequenz-Analyse mit Methoden der Gabor AnalysisZeit-Frequenz-Analyse mit Methoden der Gabor Analysis DIPLOMARBEIT Zur Erlangung des Grades eines Diplom-Mathematikers Justus-Liebig

1.2 Short-Time Fourier Transform

und deren effektive Bandbreite unendlich ist. Aber Größe und Form der Heisenberg-Box sind nicht alles, wie sehr gut am Hamming-Fenster zu erkennen ist. Es istdefiniert als

gHam(t) = (0, 54 + 0, 46 cos (2πt))χ[−1/2,1/2].

Trotz unendlicher effektiver Bandbreite ist es eine häufig verwendete Fensterfunk-tion, da es über andere positive Eigenschaften verfügt.

Es reicht also für die Auswahl eines Fensters g nicht, sich ausschließlich aufdie Betrachtung effektiver Länge und Bandbreite zu beschränken, sonst wärenGaussfunktionen, als Folge der Unschärferelation, sowieso nicht zu übertreffen undzumindest in der theoretischen Zeit-Frequenz-Analyse wäre die Suche nach weiterenFensterfunktionen müßig. Welche Kriterien sind also sonst noch entscheidend fürdie Qualität von g?

Die Antwort ist sicherlich anwendungsabhängig, aber einige grundsätzliche Fest-stellungen können gemacht werden, wobei wir auch hier beim Vergleich unterschied-licher Fensterfunktionen erkennen können, dass zwischen den unterschiedlichen Ei-genschaften ein gewisser Trade-Off zu bestehen scheint.

Für numerische Anwendungen ist es mehr als sinnvoll, dass g kompakten Trä-ger hat. Dann muss g nach A.2.5 unendlichen Träger haben. In der Regel wird gsymmetrisch, und reellwertig gewählt, dann ist g ebenfalls reell und symmetrisch.Die Fouriertransformierte g sollte weiterhin ihre Hauptamplitude bei ξ = 0 haben.Als Konsequenz des kompakten Trägers konvergiert sie mit Oszillationen gegen nullund die folgenden drei Parameter geben Aufschluss über das Verhalten von g:

• Die RMS (Root Mean Square) Bandbreite ∆ξ, definiert durch

|g(∆ξ/2)|2|g(0)|2 = 1

2 .

• Die maximale Amplitude A der ersten Oszillationen bei ξ = ±ξ0, gemessen inDezibel,

A = 10 log10|g(ξ0)|2|g(0)|2 .

• Die Geschwindigkeit des asymptotischen Abklingens von |g(ξ)| für hohe Fre-quenzen, gegeben durch den Exponenten p in

|g(ξ)| = O(ξ−p−1).

Dabei wären ∆ξ und A für ein optimales Fenster möglichst klein und p groß. EineVergleichstabelle mehrerer Fensterfunktionen findet sich zum Beispiel in [33, S.100].Prinzipiell können wir jedoch festhalten, dass die Verbesserung eines Parameters inder Regel zu einer Verschlechterung in den anderen führt.

Aus vielen Gründen ist es grundsätzlich sinnvoll, g aus der Feichtingeralgebra

M1(R) = {f ∈ L2(R) : ‖Vg0f‖L1(R2)}

17

Page 22: Zeit-Frequenz-Analyse mit Methoden der Gabor AnalysisZeit-Frequenz-Analyse mit Methoden der Gabor Analysis DIPLOMARBEIT Zur Erlangung des Grades eines Diplom-Mathematikers Justus-Liebig

1 DIE SHORT-TIME FOURIER TRANSFORM

mit g0 = exp(−πx2) zu wählen. M1(R) ist im Gegensatz zu S, dem Schwartzraumschnell fallender Funktionen, den sie enthält, ein Banachraum und daher leichter zuhandhaben. Die STFT mit Fenstern aus der Feichtingeralgebra hat viele wünschens-werte Eigenschaften, sie ist zum Beispiel stabil unter Störung des Zeit-Frequenz-Gitters. Ausführliche Abhandlungen über M1(R) und die Gründe, die diesen Raumzur ersten Wahl für Fensterfunktionen machen, finden sich unter anderem in [17],[18], [21]. Für unsere Zwecke reicht es, zu wissen, dass (nach [21, S.246])

f ∈M1(R)⇔ Vff ∈ L1(R2)

gilt. Diese Bedingung ist zum Beispiel dann erfüllt, wenn f eine stetige Funktionmit kompaktem Träger ist und f ∈ L1(R) ist. Wir verwenden nur solche Fenster,genauer ist für stetige Fensterfunktionen, welche die Bedingungen in 3.2.7 erfüllen,f ∈ L1(R).

Injektivität und Manipulation der STFT. Aus der Umkehrbarkeit derSTFT folgt Injektivität, aber nicht Bijektivität. Für eine gegebene Fensterfunk-tion g ∈ L2(R) bildet die Short-Time Fourier Transform den Raum L2(R) nur aufeinen abgeschlossenen Unterraum von L2(R2) ab. Das bedeutet, nicht jede Funktionin L2(R2) ist die STFT einer Funktion f ∈ L2(R) bezüglich g. Eine notwendige undhinreichende Bedingung für Φ ∈ L2(R2), eine STFT zu sein, liefert der sogenanntereproduzierende Kern.

Satz 1.2.6 (Reproduzierender Kern). Sei Φ ∈ L2(R2). Dann existiert genau dannein f ∈ L2(R) mit Φ(x, ω) = Vgf(x, ω), wenn

Φ(x0, ω0) = 1‖g‖2

∫R2

Φ(x, ω)K(x0, x, ω0, ω) dωdx, (1.20)

mitK(x0, x, ω0, ω) = 〈gx,ω, gx0,ω0〉. (1.21)

Für festes g bezeichnen wir den Unterraum aller Funktionen, die (1.20) erfüllenmit Wg = {Φ(x, ω) : Φ(x, ω) = Vgf , für eine Funktion f ∈ L2(R)}.

Beweis: Aus [33]. Existierte f , so dass Φ(x, ω) = Vgf(x, ω) gilt. Ersetzen wir nunf in der Definition der STFT (1.7) durch die zugehörige Rekonstruktionsformel(1.19), dann erhalten wir

Vgf(x0, ω0) =∫

R

(1‖g‖2

∫R2Vgf(x, ω)MωTxg(t) dωdx

)gx0,ω0(t) dt.

Ziehen wir das Integral über t nach innen, dann bekommen wir (1.20). Dass die-se Bedingung hinreichend ist, zeigen wir, indem wir f wie in der Umkehrformeldefinieren, als

f = 1‖g‖2

∫R2

Φ(x, ω)MωTxg dωdx,

18

Page 23: Zeit-Frequenz-Analyse mit Methoden der Gabor AnalysisZeit-Frequenz-Analyse mit Methoden der Gabor Analysis DIPLOMARBEIT Zur Erlangung des Grades eines Diplom-Mathematikers Justus-Liebig

1.2 Short-Time Fourier Transform

mit f ∈ L2(R) nach (1.18). Dann liefert Multiplikation mit gx0,ω0 und Integrationüber t ∫

Rf(t)gx0,ω0(t) dt = 1

‖g‖2

∫R

(∫R2

Φ(x, ω)MωTxg(t) dωdx)gx0,ω0(t) dt

= 1‖g‖2

∫R2

Φ(x, ω)(∫

R2gx,ω(t)gx0,ω0(t) dt

)dωdx

= 1‖g‖2

∫R2

Φ(x, ω)〈gx,ω, gx0,ω0〉 dωdx.

Wobei wir die Höldersche Ungleichung (A.2) und den Satz von Fubini A.1.3 ange-wandt haben. Mit (1.20) folgt Φ(x, ω) = Vgf(x, ω), was den Beweis abschließt.

Man spricht von einem reproduzierenden Kern, da das Integral in (1.20), alsFunktion in x0, ω0 aufgefasst eine Art Faltungsintegral darstellt und Gleichung(1.20) dann bedeutet, dass die STFT sich durch Faltung mit dem Kern K selbstreproduziert.

Für die Rekonstruktionsformel kann gezeigt werden, dass sie jede Funktion ausL2(R2) auf eine Funktion f ∈ L2(R) abbildet. Dadurch wird gewährleistet, dass ei-ne „vernünftige“ Veränderung der STFT in der Zeit-Frequenz-Ebene (zum Beispieldurch STFT-Multiplier) nach der Rekonstruktion eine sinnvolle Funktion ergibt. Esgilt sogar noch etwas mehr, wie der folgende Satz zeigt, der aus [37] stammt.

Satz 1.2.7 (Inverse STFT von Funktionen ausW⊥g .). Für alle Funktionen Φ⊥(x, ω)

aus W⊥g gilt ∫

R2Φ⊥(x, ω)MωTxg(t) dωdx = 0, für alle t ∈ R. (1.22)

Beweis: Wir multiplizieren die linke Seite von (1.22) mitM−ω0Tx0g(t). Dann liefertIntegration über t und Vertauschung der Integrale∫

R2Φ⊥(x, ω)

(∫RMωTxg(t)M−ω0Tx0g(t) dt

)dωdx

und aus der Definition des Raums Wg folgt∫RMωTxg(t)M−ω0Tx0g(t) dt ∈Wg.

Somit ist0 =

∫R2

Φ⊥(x, ω)(∫

RMωTxg(t)M−ω0Tx0g(t) dt

)dωdx, (1.23)

denn Φ⊥ ist orthogonal zu jeder Funktion aus Wg.Dies können wir nach erneuter Vertauschung der Integrale umschreiben in

〈F (·),Mω0Tx0g(·)〉 =∫

RF (t)M−ω0Tx0g(t) dt,

19

Page 24: Zeit-Frequenz-Analyse mit Methoden der Gabor AnalysisZeit-Frequenz-Analyse mit Methoden der Gabor Analysis DIPLOMARBEIT Zur Erlangung des Grades eines Diplom-Mathematikers Justus-Liebig

1 DIE SHORT-TIME FOURIER TRANSFORM

mitF (t) =

∫R2

Φ⊥(x, ω)MωTxg(t) dωdx.

Da span{Mω0Tx0g}(x0,ω0)∈R2 = L2(R) und

〈F (t),Mω0Tx0g(t)〉 = 0, für alle (x0, ω0) ∈ R2

gilt, folgern wir F (x) ≡ 0.

Für ein beliebiges Φ ∈ L2(R2) passiert also etwas mehr als nur die Abbildungauf eine unbekannte Funktion f ∈ L2(R) durch das Rekonstruktionsintegral derSTFT. Für beliebiges, festes g ∈ L2(R) gilt

L2(R2) = Wg ⊕W⊥g .

Das heißt, wir können Φ schreiben als

Φ = Φ0 + Φ1 mit Φ0 ∈Wg, Φ1 ∈W⊥g , (1.24)

wobei Φ0 die orthogonale Projektion von Φ auf Wg ist. Mit anderen Worten: Genaudie Funktion in Wg, die Φ am nächsten liegt. Es gilt weiterhin,∫

R2Φ(x, ω)MωTxg(t) dωdx (1.25)

=∫

R2Φ0(x, ω)MωTxg(t) dωdx+

∫R2

Φ1(x, ω)MωTxg(t) dωdx

=∫

R2Φ0(x, ω)MωTxg(t) dωdx. (1.26)

Das ist nichts anderes, als die Umkehrformel für Φ0. Wir können also sagen, dassdie Umkehrformel (bezüglich g) eine Funktion Φ ∈ L2(R2) auf diejenige Funktionf ∈ L2(R) abbildet, deren STFT bezüglich g der Funktion Φ am nächsten liegt.

So viel zunächst zur kontinuierlichen Short-Time Fourier Transform. Als Näch-stes betrachten wir unterschiedliche Arten, sie für numerische Zwecke zu diskreti-sieren und effektiv zu berechnen.

1.3 Diskrete Short-Time Fourier TransformIn der Praxis können weder kontinuierliche, noch unendlich lange Signale verarbei-tet werden. Wir betrachten also in Wirklichkeit endliche oder periodische Folgen,von denen wir als diskrete Signale sprechen. Die Räume und Operationen, mitdenen wir arbeiten, müssen daher ebenfalls diskretisiert werden. Theoretisch gibtes unterschiedliche Ansatzpunkte für diese Diskretisierung, abhängig von der ge-wählten Betrachtung der STFT, die alle auf dem einen oder anderen Weg auf dieFast Fourier Transform (FFT) als schnelle Implementierung der diskreten Fou-riertransformtion zurückgreifen. Wir werden aber feststellen, dass das Ergebnis imWesentlichen unabhängig von der gewählten Methode ist.

20

Page 25: Zeit-Frequenz-Analyse mit Methoden der Gabor AnalysisZeit-Frequenz-Analyse mit Methoden der Gabor Analysis DIPLOMARBEIT Zur Erlangung des Grades eines Diplom-Mathematikers Justus-Liebig

1.3 Diskrete Short-Time Fourier Transform

Bevor wir beginnen, werfen wir einen kurzen Blick auf die Folgenräume, mitdenen wir von nun an arbeiten. Wir haben bereits gesagt, dass, unabhängig von dergewählten Methode, zum einen oder anderen Zeitpunkt die diskrete Fouriertrans-formation (DFT) verwendet wird. Sie ist wie folgt definiert:

f [k] = fN [k] =N−1∑n=0

f [n] exp(−2πikn/N), für alle k ∈ {0, . . . , N − 1}.

Ihre Inverse, die IDFT ist gegeben durch:

f [n] = 1N

N−1∑k=0

f [k] exp(2πikn/N).

Beides sind Operationen auf endlichen Signalen der LängeN , wobeiN eine beliebigenatürliche Zahl sein kann und behandeln sie als unendliche Signale mit Periode derLänge N . Mit anderen Worten, sie arbeiten über dem Raum der N -periodischenFolgen

`N = {f : Z→ C : f [n] = f [n+N ]}.Die Vereinigung der `N über alle N ∈ N ist isomorph zur Menge der beschränktenFolgen mit endlichem Träger, die wiederum dicht in `2(R) liegt. Folgen aus einemdieser Räume nennen wir diskrete Signale. Theoretisch schränken wir uns also durchdie Betrachtung endlicher Signale nicht entscheidend ein. In der Praxis sieht dasanders aus, denn Berechnungszeit und Speicherkapazität setzen schnell Grenzen,die ohne bessere Hardware oder Verfahren nicht zu überwinden sind. Dies gilt ins-besondere für Verfahren zur Zeit-Frequenz-Analyse, die naturgemäß quadratischeSpeicherkomplexität haben, und ist einer der Gründe, die die Gabortransformati-on so interessant machen werden. Die wichtigsten Eigenschaften der DFT sind inAnhang A zu finden.

Der übliche Fall in der Signalverarbeitung ist folgender: Das Signal f ∈ `N isteine endliche Abtastung eines, endlichen oder unendlichen, unbekannten Signals,die Fensterfunktion ist explizit bekannt. Oft können wir die Fouriertransformiertedes Fensters ebenfalls explizit angeben, und haben so die Wahl, diese im Zeit-oder Frequenzbereich abzutasten, was zu geringfügig unterschiedlichen Ergebnissenführt. f ∗ bezeichnet wieder die Involution.Die Kandidaten. Kommen wir zurück zur Frage der Diskretisierung, so ist es nurnatürlich, einen Blick auf die unterschiedlichen Formen der STFT in 1.2.2 zu werfen.Dort wiederum machen vor allem (1.8), (1.11) und (1.14) einen vielversprechendenEindruck für einen Ansatz mit Hilfe der DFT. Wir schauen sie uns genauer an:

• Die Gleichung Vgf(x, ω) = (f · Txg)∧(ω) ist nichts anderes, als die Definitionder STFT, zeilenweise als Fouriertransformierte des Produkts von f mit einerTranslation der (komplex konjugierten) Fensterfunktion aufgefasst. Da dieFensterfunktion für gewöhnlich reellwertig ist, spielt die Konjugation von gnur in ganz bestimmten Fällen eine Rolle. Sind nun f, g ∈ `N , müssen wirnur die kontinuierliche Fouriertransformation durch eine DFT ersetzen underhalten die übliche Definition der diskreten STFT.

21

Page 26: Zeit-Frequenz-Analyse mit Methoden der Gabor AnalysisZeit-Frequenz-Analyse mit Methoden der Gabor Analysis DIPLOMARBEIT Zur Erlangung des Grades eines Diplom-Mathematikers Justus-Liebig

1 DIE SHORT-TIME FOURIER TRANSFORM

• Vgf(x, ω) = exp(−2πixω)(f ·Tω ¯g)∧(−x) ist die zum vorigen Fall analoge For-mulierung der fundamentalen Identität (1.15). Von einer Phasenverschiebungabgesehen, kann das gleiche Verfahren angewandt werden, wie zuvor. Für dieEntwicklung eines Algorithmus können wir beide Fälle als identisch betrach-ten. Falls die (kontinuierliche) Fouriertransformierte der gewählten Fenster-funktion bekannt ist, können wir die STFT also auch „aus dem Frequenzbe-reich heraus“ berechnen.

• Vgf(x, ω) = (M−ωf ∗ g∗) (x) =(T−ωf · g∗

)∨(x) scheint zunächst ein etwas

anderer Fall zu sein. Wir betrachten die STFT als Faltung, die wir über diesogenannte FFT-Faltung schnell berechnen können. Berechnen wir die rech-te Seite wie im vorigen Fall mit der DFT von f und einer Abtastung derFouriertransformation des Fensters, dann zeigt die einfache Manipulation(

T−kf · g∗)∨

[m] =(T−kf · ¯g

)∧[−m] = Mk

(f · Tk ¯g

)∧[−m], m, k ∈ Z

die Gleichheit beider Varianten. Dabei ist nun f die DFT der Abtastfolge vonf , g eine passende Abtastung der expliziten FT von g und m, k ∈ Z.

Die fundamentale Identität reduziert die verschiedenen Ansätze also auf eineneinzigen, zumindest bezüglich der Entwicklung eines Algorithmus zu ihrer Berech-nung. Bevor wir uns der Frage zuwenden, inwiefern es einen Unterschied macht, obwir im Zeitbereich oder im Frequenzbereich diskretisieren, wollen wir die diskreteShort-Time Fourier Transform formal definieren und ihre Umkehrformel herleiten.

Zunächst einige Bezeichnungen für den diskreten Fall. Sprechen wir von derdiskreten Zeit-Frequenz-Ebene so ist stets die Menge der Punkte gemeint, auf derdie diskrete STFT definiert ist. Operatoren der Form

Tmf [n] = f [n−m] und Mkf [n] = exp(2πikn/N)·f [n], für m, k ∈ {0, . . . , N−1},

nennen wir diskrete Translations- und Modulationsoperatoren.Für m /∈ {0, . . . , N − 1} assozieren wir Tm mit Tm, wobei m ∈ {0, . . . , N − 1}

gegeben ist durchm = pN+m, mit p ∈ Z. Für k /∈ {0, . . . , N−1} behandeln wirMk

analog. Die Kombinationen TmMk oder MkTm werden diskrete Zeit-Frequenz-Shiftsgenannt. Dabei gilt die Relation

TmMk = exp(−2πikm)MkTm.

Für eine Folge g ∈ `N heißt die Menge {gm,k}m,k∈Z/NZ mit

gm,k = MkTmg,

das zu g gehörende diskrete Weyl-Heisenberg-System. Die Folgen gm,k heißen diskreteWeyl-Heisenberg-Atome.

Mit diesen Bezeichnungen können wir die diskrete STFT definieren.

22

Page 27: Zeit-Frequenz-Analyse mit Methoden der Gabor AnalysisZeit-Frequenz-Analyse mit Methoden der Gabor Analysis DIPLOMARBEIT Zur Erlangung des Grades eines Diplom-Mathematikers Justus-Liebig

1.3 Diskrete Short-Time Fourier Transform

Definition 1.3.1 (Diskrete Short-Time Fourier Transform).Zu 0 6= g ∈ `N sei {gm,k}(m,k)∈Z/NZ das zugeordnete Weyl-Heisenberg-System. Dannist die diskrete Short-Time Fourier Transform (DSTFT) einer Folge f ∈ `N bezüg-lich g definiert als

Vgf [m, k] = 〈f, gm,k〉 =N−1∑n=0

f [n] · g[n−m] exp(−2πikn/N), (1.27)

für m, k ∈ {0, . . . , N − 1}.

Betrachten wir ein diskretes Signal f ∈ `N und eine Fensterfunktion g, ebenfallsaus `N , so gelten die Identitäten aus 1.2.2 in diskretisierter Form und es gilt

Vgf [m, k] = (f · Tmg)∧ [k]

= exp(2πikm)(f · Tk ¯g

)∧[−m]

=(T−kf · g∗

)∨[m]. (1.28)

Wir sehen noch einmal, dass die drei Diskretisierungskandidaten in diesem Fallidentisch sind.

Die Umkehrformel zur DSTFT kann mit einer Variation der Orthogonalitätsre-lation 1.2.3 für f1, f2, g1, g2 ∈ `N , genauer

〈Vg1f1,Vg2f2〉`N×`N = N · 〈f1, f2〉〈g1, g2〉,

völlig analog zum kontinuierlichen Fall bewiesen werden, wobei wir uns hier keineGedanken um Wohldefiniertheit machen müssen. Sie lautet wie folgt.

Lemma 1.3.2 (Inverse DSTFT). Seien g, γ ∈ `N und gelte 〈g, γ〉 6= 0. Dann istfür alle f ∈ `N

f = 1〈γ, g〉 ·N

N−1∑m=0

N−1∑k=0

Vgf [m, k]MkTmγ. (1.29)

Insbesondere gilt (1.29) für γ = g.

Somit verfügen wir, da die DFT die wichtigen Eigenschaften ihres kontinuierli-chen Gegenstücks übernimmt, bei der Arbeit mit der diskreten Short-Time FourierTransform über den gleichen Fundus an Hilfsmitteln wie über L2(R). Die meistenErgebnisse dieses Falls können ohne Schwierigkeiten ins Diskrete übertragen wer-den.

23

Page 28: Zeit-Frequenz-Analyse mit Methoden der Gabor AnalysisZeit-Frequenz-Analyse mit Methoden der Gabor Analysis DIPLOMARBEIT Zur Erlangung des Grades eines Diplom-Mathematikers Justus-Liebig

1 DIE SHORT-TIME FOURIER TRANSFORM

Es ist allerdings auch zu erwarten, dass die STFT die Probleme der diskre-ten Fouriertransformation übernimmt. Sogenanntes Leaking durch die Faltung desSignals mit der Fensterfunktion führt schon im kontinuierlichen Fall dazu, dassFrequenzen nicht mehr genau lokalisiert werden und ist eine Konsequenz der Un-schärferelation. Im Zuge der Diskretisierung wird das Spektrum periodisiert und eskommt zu einem weiteren Effekt, dem Aliasing.

Diskretisierungsfehler durch Aliasing. Es ist bekannt, dass außer der Null-funktion keine bandbeschränkte Funktion mit endlichem Träger existiert (A.2.5).Also muss die diskrete Betrachtung kontinuierlicher Phänomene zwangsläufig zuFehlern im Zuge der Periodisierung von Zeit- und Frequenzbereich führen. DieseProbleme übertragen sich auf die diskrete STFT, weshalb wir sie hier erneut be-schreiben.

Das zu betrachtende Signal f ist meist als, bis auf Meßgenauigkeit exakte, end-liche Abtastung gegeben. Nur selten ist dagegen eine Abtastung des Spektrumsbekannt und das zugeordnete Signal gesucht. Die Problembehandlung ist außerdemanalog, weshalb wir nur den ersten Fall behandeln. Abhängig von den auftretendenFrequenzen produziert die Periodisierung des Spektrums Fehler von zunächst unbe-kannter Größenordnung. Die Behandlung solcher Fehler ist ein klassisches Problemder digitalen Signalverarbeitung und wird zum Beispiel von Schüßler [40] diskutiert.

Wir wissen nach dem Riemann-Lebesgue Lemma A.2.2, dass die Fouriertrans-formation einer Funktion für hohe Frequenzen gegen null konvergiert, theoretischmüssen wir also nur dicht genug abtasten, dann ist die (kontinuierliche) Fourier-transformierte (FT) f des Signals näherungsweise null außerhalb der Bandbreiteder DFT.

Sei die Abtastrate S die Anzahl der Abtastwerte pro Zeiteinheit und es geltef(ξ) ≈ 0 für |ξ| > S/2, wobei S die Abtastrate ist, dann ist fN [k] ≈ f(Sk/N)(siehe Anhang B.2) und der Fehler ist vernachlässigbar. Die Abtastrate ist jedochmeist durch äußere Umstände vorgegeben und nicht immer optimal für das jeweiligeProblem. Für beliebige, nicht genau klassifizierte Signale ist es gut möglich, dassdies nicht der Fall ist.

Können wir aber zumindest annehmen, das Signal wurde dicht genug abgeta-stet, dass f(ξ) für |ξ| > S/2 klein ist und in höheren Frequenzen relativ schnellabfällt, kann es sinnvoll sein, die Abtastung vor der Verarbeitung zu glätten. In [40]geschieht dies durch die Faltung der Abtastfolge mit einem Dreieckspuls Λ (Abbil-dung 6), dessen Fouriertransformierte eine Skalierung von sinc2 ist (Abbildung 7).Schreiben wir f0 für die auf Z mit Nullen aufgefüllte Abtastung von f , f0 für diezugehörige Fouriertransformation und bezeichnen wir das Ergebnis der Faltung mitf , dann erhalten wir

f(t) = f0 ∗ Λ(t) = (f0 · sinc2))∨(t) = ˆf∨(t).

Es ist zu beachten, dass f0 die Fouriertransformierte einer (unendlichen) Folge (A.4)ist. Diese unterscheidet sich wesentlich von der DFT. Für k ∈ {−N/2, N/2 − 1}

24

Page 29: Zeit-Frequenz-Analyse mit Methoden der Gabor AnalysisZeit-Frequenz-Analyse mit Methoden der Gabor Analysis DIPLOMARBEIT Zur Erlangung des Grades eines Diplom-Mathematikers Justus-Liebig

1.4 Algorithmen für DSTFT und Inverse DSTFT

nehmen wir nun fN [k] · sinc2(k/N), k ∈ {−N/2, N/2− 1} als Näherung für ˆf(k/N)und erhalten eine Dämpfung der hohen Frequenzen, zu sehen in Abbildung 8. Damithaben wir eine erste Anwendung für die Berechnung der diskreten STFT aus demFrequenzbereich gefunden. Eine solche Dämpfung macht allerdings nicht pauschalfür jedes Signal Sinn und kann das Spektrum unangemessen verfremden, falls dasSignal zum Beispiel dicht genug abgetastet wurde, um alle wesentlich auftretendenFrequenzen zu erfassen.

Nach 1.2.7 ist zu erwarten, dass zeilenweise Multiplikation der DSTFT mitsinc2(·/N) und anschließende Berechnung der Inversen zu einem ähnlichen Signalführt wie die inverse DFT des gedämpften Spektrums. Eine Dämpfung nach derAnalyse kann also näherungsweise das gleiche Ergebnis liefern. Solche punktweisenOperationen auf der Short-Time Fourier Transform eines Signals mit anschließenderRekonstruktion nennt man STFT-Multiplier.

Für viele gebräuchliche Fensterfunktionen g kann die Fouriertransformation ex-plizit angegeben werden, wir haben also die Wahl, im Zeit- oder Frequenzbereichzu diskretisieren. Aufgrund ihrer Konzentration in Zeit und Frequenz ist jedoch zuerwarten, dass die Unterschiede gering sind.

Dass sie für „vernünftige“ Fenster tatsächlich bereits bei kurzen Signalen undkleinem Träger der Fensterfunktion vernachlässigbar klein werden, verdeutlichendie Abbildungen 9-11 an einem Beispiel.

Visualisierung der STFT: Das Spektrogramm. In der Spektralanalysesind wir meist weniger an den komplexen Werten der Short-Time Fourier Trans-form interessiert, sondern vielmehr an der Amplitude der auftretenden Frequenzenin einem gewissen Bereich des Signals. Wir betrachten dann die Quadrate der Ab-solutbeträge der STFT. Die Form

Sgf [m, k] = |Vgf [m, k]|2 (1.30)

wird (diskretes) Spektrogramm von f bezüglich g genannt. Oft ist jedoch nur dieVisualisierung des Spektrogramms (zum Beispiel in den Abbildungen 4 und 5) ge-meint, wenn wir diese Bezeichnung verwenden.

In diesen Visualisierungen sind oft einige wenige Frequenzen so prominent, dassdie übrigen praktisch unsichtbar werden und wir wählen zur Darstellung stattdessendie Wurzel des Absolutbeträge der STFT |Vgf [m, k]|1/2 oder das log-Spektrogrammlog(|Vgf [m, k]|).

Wir beschließen dieses Kapitel mit je einem Algorithmus in GNU Octave zurBerechnung der diskreten STFT und ihrer Inversen.

1.4 Algorithmen für DSTFT und Inverse DSTFTWir geben hier nur die Grundalgorithmen an, ohne den Code zum Abfangen vonEingabefehlern und Fallunterscheidungen, wie sie zum Beispiel für gerade und unge-rade Fensterlängen benötigt werden. Der vollständige Code ist auf der beiliegenden

25

Page 30: Zeit-Frequenz-Analyse mit Methoden der Gabor AnalysisZeit-Frequenz-Analyse mit Methoden der Gabor Analysis DIPLOMARBEIT Zur Erlangung des Grades eines Diplom-Mathematikers Justus-Liebig

1 DIE SHORT-TIME FOURIER TRANSFORM

Abbildung 6: Zufälliges Signal überlagerter Cosinus-Schwingungen (l). Dreieckspuls (r).

Abbildung 7: DFT des Zufallssignals (l) und ein Ausschnitt der Funktion sinc2 (r), welcherder diskretisierten expliziten Fouriertransformierten des Dreickspulses entspricht.

Abbildung 8: Produkt der DFT mit sinc2 (l). Inverse DFT des Produktes (r), sie entsprichtder semi-diskreten Faltung des Signals in 6 mit einem Dreieckspuls.

26

Page 31: Zeit-Frequenz-Analyse mit Methoden der Gabor AnalysisZeit-Frequenz-Analyse mit Methoden der Gabor Analysis DIPLOMARBEIT Zur Erlangung des Grades eines Diplom-Mathematikers Justus-Liebig

1.4 Algorithmen für DSTFT und Inverse DSTFT

Abbildung 9: Von-Hann-Fenster (l) der Länge L = 33 und logarithmierte Darstellungseiner DFT (r). Das Maximum der DFT liegt bei 16.

Abbildung 10: Logarithmierte Darstellung der diskretisierten expliziten Fouriertransfor-mierten des von-Hann-Fensters aus der vorigen Abbildung (l) und deren inverse DFT(r).

Abbildung 11: (l) Absolutbetrag der Differenzen der Folgen in 9.(l) und 10.(r) beziehungs-weise (r) der Folgen in 9.(r) und 10.(l). Die Maxima links liegen bei 1.2 · 10−4 rechts bei1.1 · 10−3. Für längere Fenster werden die Unterschiede sogar noch geringer.

27

Page 32: Zeit-Frequenz-Analyse mit Methoden der Gabor AnalysisZeit-Frequenz-Analyse mit Methoden der Gabor Analysis DIPLOMARBEIT Zur Erlangung des Grades eines Diplom-Mathematikers Justus-Liebig

1 DIE SHORT-TIME FOURIER TRANSFORM

Abbildung 12: Alternativ zu 11 bilden wir die relativen Abweichungen x−xx der in 9 und

10 abgebildeten Funktionen. Es ist x die Abtastung der expliziten Funktion, x die DFT-Rekonstruktion aus dem expliziten Gegenstück. (l) Relative Differenz der Fenster.(r) Relative Differenz der Fouriertransformierten. Da Nullstellen nicht exakt rekonstruiertwerden ist die Relative Differenz dort ∞. Wir sehen aber, dass sie dort, wo Funktion undFouriertransformierte nennenswert von 0 verschiedene Werte hat, praktisch 0 ist.

CD zu finden.

Die Algorithmen interpretieren einen gegebenen Fenstervektor als Werte derFensterfunktion auf einem kompakten Träger, der um den Punkt 0 zentriert ist. Dieverwendete Fensterfunktion ist also ein symmetrisch mit Nullen aufgefüllter Vek-tor der Signallänge. Geschrieben wurden die Algorithmen ausschließlich für reelleFensterfunktionen, es wird g = g angenommen. Außerdem ist erwähnenswert, dassVektoren unter Octave ab 1 indiziert werden, was leicht zu Verwirrung führen kann.

Algorithmus 1.4.1 (Short-Time Fourier Transform [Front-End]).

function [G, win] = STFTfrontend(sig, win, show_spec)

win = win/norm(win, 2);win_length = length(win);

## change ’sig’ to include border values

border = win_length/2;right = border-1;sig = [zeros(border, 1); sig; zeros(right, 1)];

## call ’ST_FT.m’ to compute the STFT of ’sig’ with## window ’win’ in G

28

Page 33: Zeit-Frequenz-Analyse mit Methoden der Gabor AnalysisZeit-Frequenz-Analyse mit Methoden der Gabor Analysis DIPLOMARBEIT Zur Erlangung des Grades eines Diplom-Mathematikers Justus-Liebig

1.4 Algorithmen für DSTFT und Inverse DSTFT

G = ST_FT(sig, win);

## call ’spectrogram.m’ to show the spectrogram of ’g’ only## if show_spec = 1

if (show_spec == 1)spectrogram(G, 1);

endif

endfunction

Dieses Front-End für die Short-Time Fourier Transform normiert einen gege-benen Fenstervektor und füllt das Signal links und rechts um die halbe Länge desFensterträgers mit Nullen auf. Diese Randwerte werden zur Berechung der erstenund letzten Zeilen der STFT benötigt. Im Unterschied zur Definition der diskre-ten STFT verwenden wir also zero-padding zur Randwertbehandlung, statt dasSignal zu periodisieren. Der vollständige Algorithmus verfügt jedoch über die Op-tion periodische oder anti-symmetrische Randwerte zu verwenden. Mit normiertemFenster und verlängertem Signal wird dann der Berechnungsalgorithmus 1.4.2 auf-gerufen und gegebenenfalls das Spektrogramm angezeigt. Ausgabeparameter sinddie DSTFT von „sig“ und der Fenstervektor „win“, der üblicherweise für die Re-konstruktion verwendet wird.

Algorithmus 1.4.2 (Short-Time Fourier Transform [Berechnung]).

function G = ST_FT (sig, win)

## compute ’sig’ and ’win’ length

win_length = length(win);sig_length = length(sig);

## create the matrix of time slices

N = sig_length-win_length+1;border = win_length/2;right = border-1;G = zeros (N,N);

for k = 1:1:borderG(k,[(N-border+k:N),(1:k+right)]) = sig(k:k+win_length-1) .* win;

endfor

for k = border+1:1:N-border+1

29

Page 34: Zeit-Frequenz-Analyse mit Methoden der Gabor AnalysisZeit-Frequenz-Analyse mit Methoden der Gabor Analysis DIPLOMARBEIT Zur Erlangung des Grades eines Diplom-Mathematikers Justus-Liebig

1 DIE SHORT-TIME FOURIER TRANSFORM

G(k,k-border:k+right) = sig(k:k+win_length-1) .* win;endfor

for k = N-border+2:1:NG(k,[(k-border:N),(1:k-N+right)]) = sig(k:k+win_length-1) .* win;

endfor

## compute the STFT

G = fft(G,N,2);

endfunction

Aus normiertem Fenstervektor und verlängertem Signal werden die Werte derdiskreten STFT berechnet. Dazu wird zeilenweise eine Matrix mit den EinträgenG[m,n] = (f · Tmg)[n] erstellt. Nehmen wir an, der Fenstervektor hat die LängeM , dann ist zu beachten, dass durch das zero-padding im vorigen Algorithmusder Eintrag sig[n + M/2 + 1] dem Wert f [n] entspricht und die Werte f [−l] fürl ∈ {1, . . . ,M/2} und f [N+l−1] für l ∈ {1, . . . ,M/2−1} gleich null gesetzt wurden.Wir sehen, dass N die ursprüngliche Länge des Signals vor der Verlängerung ist.Nachdem die Matrix vollständig konstruiert wurde, bilden wir die zeilenweise DFTund erhalten die DSTFT von „sig“.

Algorithmus 1.4.3 (Inverse STFT).

function sig = inv_stft (G, win)

## compute the inverse fourier transform along the colums of G

N = size(G,1);G = ifft(G,N,2);

## summarize along the rows of G

border = win_length/2;left = border-1;sig = zeros (N,1);

for n = 1:1:leftsig(n) = sum(G((1:border+n),n) .* win(border+n:-1:1));

endfor

for n = left+1:1:N-bordersig(n) = sum(G((n-left:n+border),n) .* fliplr(win));

30

Page 35: Zeit-Frequenz-Analyse mit Methoden der Gabor AnalysisZeit-Frequenz-Analyse mit Methoden der Gabor Analysis DIPLOMARBEIT Zur Erlangung des Grades eines Diplom-Mathematikers Justus-Liebig

1.4 Algorithmen für DSTFT und Inverse DSTFT

endfor

for n = N-border+1:1:sig_lengthsig(n) = sum(G((n-left:N),n) .* win(length(win):-1:border-N+n+1));

endfor

## omit complex part

sig = real(sig);

endfunction

Zur Berechnung der inversen Short-Time Fourier Transform bilden wir zunächstzeilenweise die inverse Fouriertransformation. War die gegebene Matrix also dieSTFT einer Funktion f , so haben wir im folgenden Schritt G[m,n] = (f · Tmg)[n]für eine Fensterfunktion g. Dieses Vorgehen erschließt sich durch eine Umformungder Rekonstruktionsformel (1.29). Es ist

f [n] = 1〈g, g〉 ·N

N−1∑m=0

N−1∑k=0

Vgf [m, k]MkTmg[n]

= 1〈g, g〉

N−1∑m=0

Tmg[n] 1N

N−1∑k=0

Vgf [m, k] exp(2πikn)

= 1〈g, g〉

N−1∑m=0

(Tmg · f · Tmg)[n]. (1.31)

Hieraus ergeben sich auch die Schleifen, denn für die Summe über m wird die Spaltevon G festgehalten, die vor der Summation mit dem gespiegelten, um n verscho-benen Fenster multipliziert wird. Der vorgestellte Algorithmus ist auf reellwertigeSignale ausgelegt, es kann jedoch durch Rundungsfehler ein kleiner Imaginärteil imrekonstruierten Signal auftreten. Dieser besteht nur aus „numerischem Müll“ undwird abschließend verworfen.

31

Page 36: Zeit-Frequenz-Analyse mit Methoden der Gabor AnalysisZeit-Frequenz-Analyse mit Methoden der Gabor Analysis DIPLOMARBEIT Zur Erlangung des Grades eines Diplom-Mathematikers Justus-Liebig

2 DIE GABORTRANSFORMATION

2 Die Gabortransformation und Grundlagen derGabor Analysis

Wir haben bereits kurz erwähnt, dass die STFT schon für geringe Signallänge sehrschnell an die Grenzen dessen stößt, was auch ein moderner Rechner mit vertret-barem Aufwand bewältigen kann. Um dennoch Zeit-Frequenz-Analysen längererSignale erstellen zu können, müssen wir die berechneten, beziehungsweise betrach-teten Werte weiter ausdünnen. Für diesen Zweck ist die Gabortransformation dasWerkzeug unserer Wahl. Sie ist von dieser Warte aus gesehen nichts anderes als eineAuswertung der Short-Time Fourier Transform auf einer diskreten Teilmenge derZeit-Frequenz-Ebene, einem sogenannten Zeit-Frequenz-Gitter. Dennoch gewährlei-stet die Gabortransformation unter gewissen Voraussetzungen weiterhin eine exakteRekonstruktion der Ausgangsfunktion.

Die Frage der Rekonstruierbarkeit einer Funktion aus ihrer Gabortransformationist nur unter Berücksichtigung der gewählten Fensterfunktion und der Dichte derAbtastung zu beantworten und führt uns zum Konzept der Gabor-Frames, die wirin Kapitel 3 genauer betrachten werden.

Als Abtastung der STFT betrachtet, vereint die Gabortransformation die Vor-teile einer vollständigen Repräsentation mit handhabbarer Komplexität der Berech-nung. Es wäre aber vorschnell und der Schönheit des mathematischen Hintergrundsunangemessen, die Gabortransformation ausschließlich aus diesem Blickwinkel zubetrachten, weshalb wir auch einige Worte zu ihrer Herkunft und ihrer zugeordnetenOperation, der Gabor-Zerlegung verlieren wollen. Im Zuge dessen werden wir einigeGrundlagen der Gabor Analysis behandeln und auf vertiefende Ansätze hinweisen.

Wie schon in Kapitel 1 führen wir nach der Behandlung der Gabortransforma-tion auf L2(R) ihre diskrete Variante auf `N ein und behandeln Gemeinsamkei-ten und Unterschiede der beiden Fälle. Abschließend stellen wir Algorithmen zurBerechnung der diskreten Gabortransformation (DGT) und der passenden Gabor-Synthese vor, die diesen Abschnitt abschließen.

2.1 Eine kurze Geschichte der Gabor AnalysisAlles begann 1946, als Dennis Gábor in seinem Paper Theory of Communication[19] seine Zerlegung einer Funktion in elementare Signale vorstellte. Sein Verfahrenhatte die Form:

f(t) =∑

m,n∈Zcm,ngm,n(t), (2.1)

mit elementaren Funktionen gm,n(t) = g(t−ma) exp(2πinbt) und einer festen Funk-tion g. Gabor wählte für g eine Gaussfunktion, die die Unschärferelation minimiert,

32

Page 37: Zeit-Frequenz-Analyse mit Methoden der Gabor AnalysisZeit-Frequenz-Analyse mit Methoden der Gabor Analysis DIPLOMARBEIT Zur Erlangung des Grades eines Diplom-Mathematikers Justus-Liebig

2.1 Eine kurze Geschichte der Gabor Analysis

sowie Gitterparameter a, b = 1. Diese Einschränkungen wurden mittlerweile auf-gegeben. Für die verallgemeinerte Gabor-Zerlegung, die auch wir verwenden, sindbeliebige Fensterfunktionen und jedes diskrete, gleichmäßige Gitter Λ = aZ × bZ,mit a, b ∈ R zulässig.

Gabors Zerlegung geriet für viele Jahre praktisch in Vergessenheit, was nichtzuletzt daran lag, dass keine analytische Methode zur Berechnung der Koeffizientencm,n bekannt war. Gabor selbst stellte nur eine iterative Methode zu ihrer nähe-rungsweisen Berechnung vor. Erst 1980 fand Bastiaans [3], [4] die gesuchte Lösung:Eine Integraltransformation, die genau jener Abtastung der STFT von f bezüglicheines zu g dualen Fensters entspricht, die wir heute als Gabortransformation kennen.

Von nun an stieß die Gabor-Zerlegung auf reges Interesse und es ist Autorenwie Janssen ([25], [26], [27] u.a.) zu verdanken, dass wir heute aus einem solchreichen Fundus an Erkenntnissen zur Gabortheorie schöpfen können. Aus dieserZeit stammt auch eines der bis heute wichtigsten Erkenntnisse der Gabor Analysis,der Satz von Balian-Low [2], [32]. Er besagt: Für eine jede Familie {gm,n}, die eineRiesz-Basis von L2(R) bildet, gilt σt(g)σξ(g) = ∞. Dabei sind σt(g) und σξ(g)die effektive Länge, beziehungsweise effektive Bandbreite der Funktion g. Also hatjede Familie von Gabor-Atomen, die eine Riesz-Basis bildet ungenügende Zeit- oderFrequenzlokalisation.

Es stellte sich nun eine neue Frage: Zu Atomen, die keine Orthonormalbasisbilden, muss zunächst eine sogenannte duale Fensterfunktion gefunden werden, umdie Zerlegungskoeffizienten berechnen zu können. Diese Suche nach dem dualenFenster und seine Berechnung sind nun seit knapp 30 Jahren ein zentrales Pro-blem der Gabor Analysis und das Fehlen effektiver Berechnungsmethoden machtedie Gabor-Zerlegung lange Zeit zu einer unattraktiven Alternative zur mittlerweileäußerst populären Wavelettransformation.

Die Verbindung zur Wavelettheorie und das Interesse an Gabor-Frames, stabi-len und vollständigen Familien von Gabor-Atomen, wurde sicherlich durch kaumjemanden so geprägt, wie Daubechies, die zum Beispiel in [7], [9] und ihrem Buch [8]die Grundlagen für die Arbeit mit Gabor-Frames geschaffen hat. Um 1990 tauchtezum ersten Mal die Wexler-Raz Dualitätsbedingung [44] auf, welche die Berechnungdes dualen Systems im diskreten Fall durch Lösen eines linearen Gleichungssystemsermöglicht. Aus der Suche nach dem dualen Fenster wurde diejenige nach dem dua-len Frame Operator und die folgenden Jahre brachten effektive, wenn auch immernoch meist iterative Methoden zu seiner Berechnung ([15], [34], [35], [36], [41] uvm.).

Von da an waren die Gabor-Zerlegung und Gabortransformation nicht mehrnur ein schönes mathematisches Konzept, es standen auch effektive Methoden zuihrer numerischen Berechnung zur Verfügung, so dass ihrer praktischen Verwen-dung nichts mehr im Wege stand. Dennoch wurde die Theorie in den letzten Jahrenständig weiterentwickelt und Konzepte wie Gabor-Multiplier, Matching Pursuit Al-gorithmen und Multi-Window Gabor-Zerlegungen finden inzwischen vielfache An-wendung in der Gabor Analysis.

Das soll hier genügen, eine ausführlichere Abhandlung mit mehr mathematischenDetails findet sich in der Einführung von [16].

33

Page 38: Zeit-Frequenz-Analyse mit Methoden der Gabor AnalysisZeit-Frequenz-Analyse mit Methoden der Gabor Analysis DIPLOMARBEIT Zur Erlangung des Grades eines Diplom-Mathematikers Justus-Liebig

2 DIE GABORTRANSFORMATION

2.2 Gabor-Zerlegung und GabortransformationDie Gabor-Zerlegung stellt Funktionen als Linearkombination bestimmter, abzähl-barer Teilmengen eines zuvor gewählten Weyl-Heisenberg-Systems dar. Zu einerFunktion g ∈ L2(R) und Konstanten a, b ∈ R assoziieren wir das Tripel

(g, a, b) ∈ L2(R)× R× R

mit der Familie

{gm,n : gm,n = g(t−ma) exp(2πint), für m,n ∈ Z}.

Wir nennen Tripel dieser Form Gabor-Tripel, seine Elemente gm,n Gabor-Atome undΛa,b = aZ× bZ das zugeordnete Zeit-Frequenz-Gitter . Die Familie {gm,n}m,n∈Z wirdauch Gabor-System genannt.

Für ein solches Gabor-Tripel ist die zugeordnete Gabor-Zerlegung von f definiertals

f(t) =∑

m,n∈Zcm,ngm,n(t), (2.2)

wobei f die orthogonale Projektion von f auf den Abschluss des von (g, a, b) aufge-spannten Raums ist. Berechnen wir f über die Gabor-Zerlegung, sprechen wir vonGabor-Synthese.

Ist span(g, a, b) = L2(R), dann gilt f = f für alle f ∈ L2(R) und (g, a, b) ist voll-ständig. Solche vollständigen Gabor-Tripel und ihre zugeordneten Zerlegungen sindvon besonderem Interesse, aber noch eine weitere Eigenschaft ist wünschenswert:Stabilität.

Genauer sprechen wir von einer stabilen Zerlegung, wenn für die Zerlegungsko-effizienten cm,n aus (2.2) einer jeden Funktion f ∈ L2(R) gilt, dass

A‖f‖2 ≤∑

m,n∈Z|cm,n|2 ≤ B‖f‖2

ist, wobei B ≥ A > 0 von f unabhängige Konstanten sind.Es wurde für die Gabor-Zerlegung zum ersten Mal von Bastiaans beschrieben [3],

[4] und ist eine Konsequenz der Frametheorie, dass die Koeffizienten der Zerlegungsich aus einer Integraltransformation der Funktion f bezüglich eines Tripels (γ, a, b)der gleichen Form wie (g, a, b) ergeben. Diese Transformation hat die uns bekannteForm

cm,n =∫

Rf(t)γ(t−ma) exp(−2πinbt) dt =

∫Rf(t)γm,n dt,

in der wir die Short-Time Fourier Transform wiedererkennen. Wir nennen (γ, a, b)ein duales Gabor-Tripel. Im Allgemeinen ist γ /∈ L2(R), aber Stabilität gewährleistetdie Existenz eines dualen Tripels mit einer Funktion γ ∈ L2(R). Insbesondere wirddas kanonische duale System, das wir in Kapitel 3 kennenlernen werden, in diesemFall durch eine L2(R)-Funktion gebildet.

Wir wissen noch nicht, wie die duale Funktion γ überhaupt zu finden ist. Vorerstwollen wir uns aber damit zufrieden geben, dass es sie gibt und weiterhin annehmen

34

Page 39: Zeit-Frequenz-Analyse mit Methoden der Gabor AnalysisZeit-Frequenz-Analyse mit Methoden der Gabor Analysis DIPLOMARBEIT Zur Erlangung des Grades eines Diplom-Mathematikers Justus-Liebig

2.2 Gabor-Zerlegung und Gabortransformation

das Tripel (g, a, b) sei vollständig und stabil. Dann können wir die Rollen von g undγ in den obigen Gleichungen vertauschen und auch (γ, a, b) ist vollständig und stabil.

Die oben beschriebene Integraltransformation ist eine Abtastung der STFT vonf bezüglich des Weyl-Heisenberg-Systems {γx,ω}(x,ω)∈R2 auf dem Zeit-Frequenz-Gitter Λa,b = aZ × bZ und wird Gabortransformation genannt. Wir definieren sienun formal.

Definition 2.2.1 (Gabortransformation).Für ein Gabor-Tripel (g, a, b) mit g ∈ L2(R) und a, b ∈ R ist die zu f ∈ L2(R)gehörende Gabortransformation bezüglich (g, a, b) definiert als

Vg,a,bf [m,n] =∫

Rf(t)g(t−ma) exp(−2πinbt) dt =

∫Rf(t)gm,n(t) dt. (2.3)

Sie ist eine diskrete Abtastung der Short-Time Fourier Transform und erhält dieentsprechenden Eigenschaften.

Falls (g, a, b) vollständig und stabil ist, können wir, statt der STFT, die Gabor-transformation zur Signalanalyse verwenden. Solange die zu untersuchende Funkti-on endliche Energie hat, enthält die Darstellung die gesamte Information der Funk-tion und behält die intuitive Lesbarkeit der STFT bei. Auf den folgenden Seitenwollen wir uns mit der Frage auseinandersetzen, unter welchen Bedingungen andie Fensterfunktion g und die Konstanten a, b diese Kriterien erfüllt werden kön-nen. Dazu führen wir an dieser Stelle, etwas vorgreifend, den Begriff des Frames ein.

Definition 2.2.2 (Frames und Besselfolgen).Sei I eine abzählbare Indexmenge. Eine Familie {φj}j∈I von Funktionen aus L2(R)wird Frame (von L2(R)) genannt, falls Konstanten B ≥ A > 0 existieren, so dass

A‖f‖2 ≤∑j∈I|〈f, φj〉|2 ≤ B‖f‖2, für alle f ∈ L2(R). (2.4)

Ist A = B sprechen wir auch von einem Tight Frame. Gilt (2.4) nicht mehr sobaldwir ein beliebiges Element aus der Familie entfernen, so nennen wir {φj}j∈I einexaktes Frame oder Riesz-Basis. Ist die Familie {φj}j∈I mit einem Gabor-Tripelassoziiert, dann bezeichnen wir sie als Gabor-Frame.

Wenn zumindest die obere Frame Bedingung,∑j∈I|〈f, φj〉|2 ≤ B‖f‖2,

erfüllt ist, wird {φj}j∈I Besselfolge genannt.

35

Page 40: Zeit-Frequenz-Analyse mit Methoden der Gabor AnalysisZeit-Frequenz-Analyse mit Methoden der Gabor Analysis DIPLOMARBEIT Zur Erlangung des Grades eines Diplom-Mathematikers Justus-Liebig

2 DIE GABORTRANSFORMATION

In der Frame-Gleichung (2.4) kann A als Vollständigkeitskonstante interpretiertwerden, sie geht in der Regel immer weiter gegen 0, je mehr wir das Frame aus-dünnen. Die Größe B/A dagegen können wir als Stabilitätskonstante auffassen, dieangibt, wie gutartig ein duales Frame sein kann. Wird sie sehr groß, dann liegenduale Frames „fast nicht mehr“ in L2(R). Die Frame-Eigenschaft verbindet also,was wir zuvor als Stabilität und Vollständigkeit bezeichnet haben.

Grundlegende Eigenschaften der Gabortransformation. Unser erstes Er-gebnis wird ein Dichtekriterium an die Konstanten a, b sein, das den Grundstein füralle weiteren Untersuchungen legt und als Analogon zum Nyquist-Kriterium desShannonschen Abtastsatzes verstanden werden kann. Es wurde von Rieffel in [38]bewiesen, als Folgerung aus Erkenntnissen über bestimmte von-Neumann-Algebren.Ohne eine gewisse Sachkenntnis bereitet es allerdings bereits Schwierigkeiten, dieBehauptung in jenem Paper überhaupt auszumachen, geschweige denn die Argu-mentation zu verstehen. Wir werden später eine nur wenig schwächere Form zeigen,für die Janssen in [28] einen sehr eleganten Beweis geliefert hat.

Satz 2.2.3 (Rieffel).Sei (g, a, b) = {gm,n : gm,n = g(t −ma) exp(2πinbt), für m,n ∈ Z} ein beliebigesGabor-Tripel mit ab > 1, dann existiert eine Funktion 0 6= f ∈ L2(R), so dass∑

m,n∈Z|〈f, gm,n〉|2 = 0. (2.5)

Insbesondere bildet (g, a, b) kein Frame.

Wir wissen nun also, dass wir für zu grobe Abtastung in jedem Fall auf Vollstän-digkeit verzichten müssen. Für ab = 1 hat bereits Gabor selbst gewusst, dass dieWahl von g(t) = exp(−πt2) zu einem vollständigen System führt. Bacry, Grossmannund Zak haben jedoch in [22] gezeigt, dass dieses System kein Frame sein kann. Derfolgende berühmte Satz von Balian [2] und Low [32] zeigt, dass (im kontinuier-lichen Fall) ab = 1 für Weyl-Heisenberg-Systeme tatsächlich die Rolle kritischerAbtastdichte annimmt. Sein Beweis hat eine recht interessante Geschichte und un-terschiedliche Ansätze sind zum Beispiel in [5], [7] und [11] zu finden.

Satz 2.2.4 (Satz von Balian-Low).Bildet (g, a, b) mit g ∈ L2(R) und ab = 1 ein Frame, so gilt(∫

Rt2|g(t)|2 dt

)(∫Rξ2|g(ξ)|2 dξ

)=∞. (2.6)

36

Page 41: Zeit-Frequenz-Analyse mit Methoden der Gabor AnalysisZeit-Frequenz-Analyse mit Methoden der Gabor Analysis DIPLOMARBEIT Zur Erlangung des Grades eines Diplom-Mathematikers Justus-Liebig

2.2 Gabor-Zerlegung und Gabortransformation

Abbildung 13: Schemadarstellung der drei Sampling-Fälle. Kritische Abtastung (l), Un-terabtastung (m) und Überabtastung (r).

Mit anderen Worten, es gibt kein Gabor-Tripel (g, a, b), das gute Zeit- und Fre-quenzlokalisation bietet und gleichzeitig eine Riesz-Basis bildet. Oder noch einmalanders, es gibt kein Gabor-Frame mit ab = 1, für das die Unschärferelation (1.1)endlich ist. Wir können also nicht auf eine „vernünftige“ Orthonormalbasis mit leichtberechenbaren Koeffizienten hoffen. Immerhin gibt es aber für alle ab < 1 Funktio-nen g guter Lokalisation, die Gabor-Frames erzeugen. Zum Beispiel die Gaussfunk-tion g(t) = exp(−πt2). Sie bildet ein Frame für alle ab < 1. Die Funktion γ, die daskanonische duale Gabor-Frame erzeugt ist dann sogar eine Schwartzfunktion.

Wir können nun also drei Fälle unterscheiden:

• ab > 1 (Unterabtastung): Es gibt keine vollständigen Gabor-Tripel. Gleichbe-deutend können wir sagen: Für alle g ∈ L2(R) ist span(g, a, b) ( L2(R).

• ab = 1 (Kritische Abtastung): Vollständige Gabor-Tripel existieren. SogarFrames existieren, aber nur mit schlechten Eigenschaften. Es gilt (2.6).

• ab < 1 (Überabtastung): Gabor-Frames mit guten Eigenschaften existieren.Jedes solche System ist zu einem gewissen Grad redundant.

Mit diesen Ergebnissen können wir sehen, warum Frames in der Gabor Analysiseine so große Rolle spielen und weshalb ein solch immenser Forschungsaufwand indie Suche nach effektiven Methoden zur Berechnung dualer Frames investiert wurde.

Der nächste Satz gibt eine erstaunliche, notwendige und hinreichende Bedin-gung für die Dualität zweier Gabor-Tripel (g, a, b) und (γ, a, b). Er stammt ur-sprünglich aus [44] und wurde dort benutzt, um das duale System der diskretenGabor-Zerlegung im Fall kritscher Abtastung zu finden. Wir verwenden die For-mulierung nach Janssen [28], dessen Beweis wir hier ebenfalls reproduzieren. Aberzuvor wollen wir definieren, was genau unter Dualität zu verstehen ist.

37

Page 42: Zeit-Frequenz-Analyse mit Methoden der Gabor AnalysisZeit-Frequenz-Analyse mit Methoden der Gabor Analysis DIPLOMARBEIT Zur Erlangung des Grades eines Diplom-Mathematikers Justus-Liebig

2 DIE GABORTRANSFORMATION

Definition 2.2.5 (Schwache Form der Dualität).Wir nennen zwei Gabor-Tripel (g, a, b) und (γ, a, b) dual im schwachen Sinn, wennsie für alle f, h ∈ L2(R) die Gleichung

〈f, h〉 =∑

m,n∈Z〈f, γm,n〉〈gm,n, h〉 (2.7)

erfüllen.

Diese Definition ist äquivalent zu unserer bisherigen (starken) Auffassung derDualität: f = ∑

m,n∈Z〈f, γm,n〉gm,n (siehe (2.2)).

Satz 2.2.6 (Wexler-Raz Biorthogonalitätsbedingung).Die Gabor-Tripel (g, a, b), (γ, a, b) seien Besselfolgen, das heißt es existiert B > 0mit ∑

m,n∈Z|〈f, gm,n〉|2 ≤ B‖f‖2 und

∑m,n∈Z

|〈f, γm,n〉|2 ≤ B‖f‖2,

für alle f ∈ L2(R). Genau dann sind (g, a, b) und (γ, a, b) dual, wenn für allek, l ∈ Z gilt

〈gk/b,l/a, γ〉 = abδkδl (2.8)

mit gk/b,l/a = g(t−k/b) exp(2πitl/a). Dabei bezeichnet δ das Kronecker-Delta (sieheAnhang A). Die Bedingung (2.8) nennen wir auch einfach Biorthogonalitätsbedin-gung oder Wexler-Raz Kriterium.

Beweis: Bevor wir beginnen, erleichtern wir uns die Notation indem wir für dieDauer des Beweises die Bezeichnung fx,ω = MωTxf für beliebige Funktionen ein-führen.

Nach der Orthogonalitätsrelation der STFT 1.2.3 gilt für f1, f2, g1, g2 ∈ L2(R)

〈Vg1f1,Vg2f2〉L2(R2) = 〈f1, f2〉〈g1, g2〉.

Wir wählen f1 = f−β,α, f2 = h und g1 = γ−β,α, g2 = g mit α, β ∈ R und erhaltenunter Anwendung der kanonischen Kommutationsrelation der Zeit-Frequenz-Shifts

38

Page 43: Zeit-Frequenz-Analyse mit Methoden der Gabor AnalysisZeit-Frequenz-Analyse mit Methoden der Gabor Analysis DIPLOMARBEIT Zur Erlangung des Grades eines Diplom-Mathematikers Justus-Liebig

2.2 Gabor-Zerlegung und Gabortransformation

(1.5) zunächst

Vγ−β,αf−β,α(x, ω)

=∫

Rf(t+ β) exp(2πitα) · (γ(·+ β) exp(2πiα·))(t− x) exp(−2πiωt) dt

=∫

Rf(t+ β)γ(t− x+ β) exp(−2πiωt) exp(2πiαx) dt

=∫

RM−ωT−β(f · Txγ)(t) exp(2πiαx) dt

= exp (2πi(αx+ βω)) ·∫

RT−β(f ·M−ωTxγ)(t) dt

= exp (2πi(αx+ βω)) · Vγf(x, ω).

Dies können wir nutzen, um die Form

〈f−β,α, h〉〈g, γ−β,α〉 = 〈f−β,α, h〉〈γ−β,α, g〉= 〈Vγ−β,αf−β,α,Vgh〉L2(R2)

=∫

R

∫R〈f, γx,ω〉〈gx,ω, h〉 exp(2πiαx+ 2πiβω) dxdω (2.9)

zu bekommen, die wir später benötigen werden.

Betrachten wir nur g, γ ∈ L2(R), so dass (g, a, b), (γ, a, b) Besselfolgen sind, dannkönnen wir die Funktion H durch die nun punktweise absolut konvergente Reihe

H(x, ω) =∑

m,n∈Z〈f−x,−ω, γma,nb〉〈gma,nb, h−x,−ω〉, für x, ω ∈ R (2.10)

definieren. Außerdem ist (wieder nach (1.5)) für u, v ∈ L2(R) und alle x, y, ω, ν ∈ R

〈u−x,−ω, vy,ν〉 = 〈u, vy+x,ν+ω〉 exp (2πi (ν + ω)x) , (2.11)

wasH(x, ω) =

∑m,n∈Z

〈f, γma+x,nb+ω〉〈gma+x,nb+ω, h〉 (2.12)

liefert. Also ist H a-periodisch in x und b-periodisch in ω.Zusätzlich gilt für (x, ω)→ (y, ν)

‖f−x,−ω − f−y,−ν‖ → 0 und ‖h−x,−ω − h−y,−ν‖ → 0.

Da (g, a, b) und (γ, a, b) Besselfolgen sind, folgt mit (2.10), dass H stetig ist und,eingeschränkt auf eine Periode, endliche Energie hat. Wir können also die (2-dimensionale) Fourierreihe von H bilden:

H(x, ω) ∼ 1ab

∑k,l∈Z

ck,l exp(−2πikx/a− 2πilω/b) (2.13)

39

Page 44: Zeit-Frequenz-Analyse mit Methoden der Gabor AnalysisZeit-Frequenz-Analyse mit Methoden der Gabor Analysis DIPLOMARBEIT Zur Erlangung des Grades eines Diplom-Mathematikers Justus-Liebig

2 DIE GABORTRANSFORMATION

mit den Fourierkoeffizienten

ck,l =∫ a

0

∫ b

0H(x, ω) exp(2πikx/a+ 2πilω/b) dxdω

=∑

m,n∈Z

∫ a

0

∫ b

0〈f, γma+x,nb+ω〉〈gma+x,nb+ω, h〉 exp(2πikx/a+ 2πilω/b) dxdω

=∫

R

∫R〈f, γx,ω〉〈gx,ω, h〉 exp(2πikx/a+ 2πilω/b) dxdω. (2.14)

In der Berechnung wurde der Satz von der beschränkten Konvergenz A.1.2, sowiedie (a, b)-Periodizität von exp(2πikx/a + 2πilω/b) benutzt. Unter Benutzung von(2.9) erhalten wir

ck,l = 〈f−l/b,k/a, h〉〈g, γ−l/b,k/a〉. (2.15)

Unter der Annahme, dass (2.8) gilt, wird dies zu

ck,l = abδkδl〈f−l/b,k/a, h〉

und aus (2.13) zusammen mit Stetigkeit und (auf eine Periode eingeschränkt) end-licher Energie von H folgt

H(x, ω) =∑k,l∈Z

δkδl〈f−l/b,k/a, h〉 exp(−2πikx/a− 2πilω/b)

= 〈f, h〉, (2.16)

für alle x, ω ∈ R. Vergleichen wir dies mit der Definition von H (2.10), dann sehenwir, dass ∑

m,n∈Z〈f, γma,nb〉〈gma,nb, h〉 = H(0, 0) = 〈f, h〉 (2.17)

ist. Dies entspricht gerade der Definition von Dualität 2.2.5.

Nehmen wir umgekehrt an, (g, a, b) und (γ, a, b) seien dual nach 2.2.5, dann ist

H(x, y) =∑

m,n∈Z〈f−x,−ω, γma,nb〉〈gma,nb, h−x,−ω〉

= 〈f−x,−ω, h−x,−ω〉= 〈f, h〉,

(2.18)

unabhängig von x, ω ∈ R. Verwenden wir wieder die Fourierreihe von H (2.14),(2.15), dann erhalten wir

〈f−l/b,k/a, h〉〈g, γ−l/b,k/a〉 = abδkδl〈f, h〉, für k, l ∈ Z. (2.19)

40

Page 45: Zeit-Frequenz-Analyse mit Methoden der Gabor AnalysisZeit-Frequenz-Analyse mit Methoden der Gabor Analysis DIPLOMARBEIT Zur Erlangung des Grades eines Diplom-Mathematikers Justus-Liebig

2.2 Gabor-Zerlegung und Gabortransformation

Wählen wir f, h ∈ L2(R) so, dass 〈fx,ω, h〉 nie null wird, also zum Beispiel identischeGaussfunktionen f(t) = h(t) = exp(−πt2), dann können wir (2.8) folgern.

Das Wexler-Raz Kriterium in dieser Form verwendet Janssen [28], um eineschwache Version des Satzes 2.2.3 von Rieffel zu zeigen. Wir reproduzieren den nunsehr einfachen Beweis an dieser Stelle, um die Wichtigkeit des Resultats nochmalszu unterstreichen. Er nutzt das kanonische duale Frame des Gabor-Frames (g, a, b),welches wir erst später behandeln werden. Für die Anwendbarkeit der Wexler-RazBedingung reicht es an dieser Stelle jedoch zu wissen, dass dieses System tatsächlichein Gabor-Frame bildet.

Korollar 2.2.7 (Rieffel-Janssen).Jedes Gabor-Tripel (g, a, b) = {gm,n : gm,n = g(t−ma) exp(2πint), für m,n ∈ Z}mit ab > 1 bildet kein Frame.

Beweis: Wir nehmen an (g, a, b) mit ab > 1 bildet ein Frame. Dann ist das ka-nonische duale Frame, das wir in Kapitel 3 kennenlernen werden, gegeben durch(γ0, a, b) mit γ0 = S−1g, wobei der Operator S : L2(R)→ L2(R) durch

Sf =∑

m,n∈Z〈f, gm,n〉gm,n, für f ∈ L2(R)

defniniert ist. Dieses Gabor-Tripel bildet eine Frame, also ist es insbesondere ei-ne Besselfolge. Es ist dual zu (g, a, b) im Sinne von 2.2.5 und erfüllt die folgendeMinimalitätseigenschaft:Für alle Folgen cm,n ∈ `2(Z) mit

f =∑

m,n∈Zcm,ngm,n (2.20)

gilt ∑m,n∈Z

|cm,n| ≥∑

m,n∈Z|〈f, γ0

m,n〉|. (2.21)

Diese Ungleichung wird strikt, sobald cm,n 6= 〈f, γ0m,n〉 für mindestens ein cm,n.

Wir wählen nun f = g in (2.20). Mit der Darstellung

g =∑

m,n∈Zδmδngm,n (2.22)

folgt|〈g, γ0〉|2 ≤

∑m,n∈Z

|〈f, γ0m,n〉|2 ≤

∑m,n∈Z

|δmδn|2 = 1.

Dabei ist δ wieder das Kronecker-Delta. Die Wexler-Raz Bedingung (2.8) liefert fürk = l = 0 jedoch 〈g, γ0〉 = ab > 1. Dies ist ein Widerspruch zur Minimalitätseigen-schaft des kanonischen dualen Frames.

41

Page 46: Zeit-Frequenz-Analyse mit Methoden der Gabor AnalysisZeit-Frequenz-Analyse mit Methoden der Gabor Analysis DIPLOMARBEIT Zur Erlangung des Grades eines Diplom-Mathematikers Justus-Liebig

2 DIE GABORTRANSFORMATION

Frames, Injektivität und Manipulation der Gabortransformation. Fürein vollständiges Gabor-Tripel (g, a, b) können wir, wie zuvor schon im Fall derShort-Time Fourier Transform, aus der Umkehrbarkeit ihrer zugeordneten Gabor-transformation schließen, dass sie Funktionen aus L2(R) injektiv, aber nicht bijektiv,auf Z2 abbildet.

Als letztes Ergebnis für diesen Abschnitt wollen wir Satz 1.2.7 über die Inverseder STFT auf die Gabortransformation übertragen. Dazu definieren wir für einGabor-Tripel (g, a, b) den Raum Wg,a,b durch

Wg,a,b = {Φ(m,n) : Φ(m,n) = Vg,a,bf , für eine Funktion f ∈ L2(R)}.

Satz 2.2.8 (Inverse Gabortransformation von Funktionen aus W⊥g,a,b.).

Sei (g, a, b) ein Gabor-Tripel, dass ein Frame erzeugt und (γ, a, b) ein duales Frame.Dann ist für jede Funktion Φ⊥(m,n) aus W⊥

g,a,b∑m,n∈Z

Φ⊥(m,n)MmTnγ(t) dωdx = 0. (2.23)

Beweis: Analog zu 1.2.7. Es sind nur die offensichtlichen Veränderungen zu ma-chen.

Nun wollen wir uns anschauen, inwiefern die bisher gewonnenen Erkenntnisseauf die diskrete Gabortransformation übertragen werden können.

2.3 Diskrete GabortransformationDer Schritt zur diskreten Gabortransformation von der DSTFT ist ebenso natürlichwie derjenige von der kontinuierlichen Short-Time Fourier Transform zur Gabor-transformation, in gewissem Sinne vielleicht sogar noch natürlicher. Genauer ist dieDSTFT eine Gabortransformation maximaler Redundanz, also nur ein Spezialfalleiner deutlich größeren Klasse von Operatoren. Wir wollen sie hier motivierend nocheinmal in der leicht veränderten Terminologie der Gabortransformation darstellenund uns von dort aus vorarbeiten.

Die diskrete Gabor-Zerlegung (DGE, für Discrete Gabor Expansion) einer Funk-tion f ∈ `N bezüglich des Fensters 0 6= γ ∈ `N mit Abtastparametern a = 1, b = 1ist

f =N−1∑m=0

N−1∑k=0

cm,kMk1Tm1γ.

Dabei ist {cm,n}m,n∈{0,...,N−1} eine Koeffizientenfolge, die sich mit Hilfe einer dualenFunktion g ∈ `N durch die zugeordnete diskrete Gabortransformation (DGT) vonf berechnen lässt, die wie folgt lautet.

Vg,1,1f [m,n] =N−1∑n=0

f [n] · g[n−m1] exp(−2πik1n/N), für m, k ∈ {0, . . . , N − 1}.

42

Page 47: Zeit-Frequenz-Analyse mit Methoden der Gabor AnalysisZeit-Frequenz-Analyse mit Methoden der Gabor Analysis DIPLOMARBEIT Zur Erlangung des Grades eines Diplom-Mathematikers Justus-Liebig

2.3 Diskrete Gabortransformation

Dabei ist, nach Lemma 1.3.2, in diesem speziellen Fall jede Funktion g dual zu γ,die 〈γ, g〉 = 1/N erfüllt. An diesem Beispiel sehen wir nicht nur, dass die Short-Time Fourier Transform im Diskreten nur kleiner Teil eines größeren Ganzen ist,wir können auch schon sagen, dass für die Parameter a, b die Einschränkung

N/a,N/b ∈ N

sinnvoll ist. Wir schreiben dann

a0 = N/a und b0 = N/b.

Ein diskretes Gabor-Tripel hat die Form [g, a, b] mit g ∈ `N und a, b ∈ {1, . . . , N}so, dass N/a,N/b ∈ N ist. Wir assoziieren [g, a, b] mit der Familie

{gm,k}m∈{0,...,a0−1},k∈{0,...,b0−1}, (2.24)

mitgm,k = g[n−ma] exp(2πikb/N) = g[n−ma] exp(2πik/b0). (2.25)

Ist span([g, a, b]) = `N , so nennen wir das Gabor-Tripel vollständig.

Die einem diskreten Gabor-Tripel [g, a, b] zugeordnete diskrete Gabor-Zerlegung(DGE) von f ∈ `N ist definiert als

f [n] =a0−1∑m=0

b0−1∑k=0

cm,kgm,k[n], (2.26)

wobei f ∈ `N die orthogonale Projektion von f auf span([g, a, b]) ist. Berechnen wirf über die diskrete Gabor-Zerlegung, sprechen wir von diskreter Gabor-Synthese.

Die diskrete Gabortransformation wird von der diskreten STFT analog zumL2(R)-Fall abgeleitet. Formal lautet die Definition wie folgt.

Definition 2.3.1 (Diskrete Gabortransformation).Für ein Gabor-Tripel [g, a, b] mit g ∈ `N und a, b ∈ N mit a0 = N/a, b0 = N/b ∈ Nist die zu f ∈ `N gehörende diskrete Gabortransformation (DGT) bezüglich [g, a, b]definiert als

Vg,a,bf [m, k] =N−1∑n=0

f [n]·gm,k[n], für m ∈ {0, . . . , a0−1}, k ∈ {0, . . . , b0−1}. (2.27)

Sie kann als Abtastung der DSTFT interpretiert werden und erhält die entsprechen-den Eigenschaften.

43

Page 48: Zeit-Frequenz-Analyse mit Methoden der Gabor AnalysisZeit-Frequenz-Analyse mit Methoden der Gabor Analysis DIPLOMARBEIT Zur Erlangung des Grades eines Diplom-Mathematikers Justus-Liebig

2 DIE GABORTRANSFORMATION

Bevor wir die Ergebnisse des vorherigen Abschnitts auf die DGT übertragen,führen wir diskrete Gabor-Frames ein.

Definition 2.3.2 (Diskrete Gabor-Frames und Besselfolgen über `N).Seien a, b ∈ N beliebige Teiler von N und [g, a, b] ein Gabor-Tripel. [g, a, b] heißtdiskretes Gabor-Frame (von `N), falls Konstanten B ≥ A > 0 existieren, so dass

A‖f‖22 ≤

a0−1∑m=0

b0−1∑k=0|〈f, gm,k〉|2 ≤ B‖f‖2

2, für alle f ∈ `N . (2.28)

Ist A = B sprechen wir von einem Tight Frame. Gilt (2.28) nicht mehr sobald wirein beliebiges Element aus der Familie entfernen, so nennen wir [g, a, b] ein exaktesFrame oder Riesz-Basis. Ist zumindest die obere Frame Bedingung,

a0−1∑m=0

b0−1∑k=0|〈f, gm,k〉|2 ≤ B‖f‖2

2,

erfüllt, wird [g, a, b] Besselfolge über `N genannt.

`N ist ein N -dimensionaler Raum, das diskrete Dichtekriterium ist daher eineeinfache Konsequenz grundlegender linearer Algebra. Jede (Riesz-)Basis eines N -dimensionalen Raumes enthält genau N Elemente. Das heißt für jede Familie von`N -Folgen {sl}l∈{0,...,L−1} mit L < N ist span({sl}) ( `N .

Sei also [g, a, b] ein Gabor-Tripel, das eine Basis bildet, so gilt a0b0 = N2/ab = Nund wir können die folgende Fallunterscheidung machen.

• ab > N (Unterabtastung): Es gibt keine vollständigen Gabor-Tripel. JedeZerlegung erfasst nur einen Teilraum von `N .

• ab = N (Kritische Abtastung): Vollständige Gabor-Tripel, auch Frames, exi-stieren. Es ist a0 = b, b0 = a und beispielsweise das Rechtecksfenster χ[0,a−1]bildet eine Orthogonalbasis mit b = N/a.

• ab < N (Überabtastung): Es gibt Gabor-Frames. Jedes solche Frame bildetein überbestimmtes System mit Redundanz R = N/(ab).

Für Gabor-Frames über L2(R) besagt der Satz von Balian-Low, dass Riesz-Basennur mit schlechter Lokalisation in Zeit oder Frequenz möglich sind. Ein einfachesGegenbeispiel zeigt jedoch, dass dies im diskreten Fall nicht mehr gilt. Für kritischeAbtastung und a = b lässt sich die Frame-Eigenschaft über `N , wie auch über L2(R)

44

Page 49: Zeit-Frequenz-Analyse mit Methoden der Gabor AnalysisZeit-Frequenz-Analyse mit Methoden der Gabor Analysis DIPLOMARBEIT Zur Erlangung des Grades eines Diplom-Mathematikers Justus-Liebig

2.3 Diskrete Gabortransformation

darauf zurückführen, dass die der Fensterfunktion g zugeordnete Zak-Transforma-tion bezüglich des Parameters a ([20], [21], [22]) keine Nullstelle hat. Nicht ganzpräzise kann der Beweis so zusammengefasst werden: Die Zak-Transformation ei-ner Gaussfunktion hat genau eine Nullstele und die diskrete Zak-Transformationder Abtastung einer solchen Funktion ist eine Abtastung ihrer koninuierlichen Zak-Transformation. Wird nun die Abtastung von g so gewählt, dass die diskrete Zak-Transformation die Nullstelle nicht enthält, dann bildet g mit den entsprechendenParametern a, b ein Frame. Für eine präzisere Formulierung und weitere Zusam-menhänge zwischen Zak-Transformation und Gabortransformation, siehe [23].

Es ist bisher nicht gelungen, in `N ein Analogon zum Satz von Balian-Low zufinden. Das Phänomen immer stärkerer Entartung des dualen Fensters für ab→ Nist jedoch auch im Diskreten zu beobachten. Daher ist die Annahme recht verbrei-tet, dass unter geeigneten Forderungen an g eine ähnliche Aussage gilt.

Die Wexler-Raz Bedingung 2.2.6 dagegen lässt sich auf den `N -Fall übertragen.Sie kann außerdem als lineares Gleichungssystem aufgefasst werden, dessen Lösung,gegebenenfalls unter Nebenbedingungen, ein duales Fenster ist. Wir wählen dieForm aus [44], unser Beweis folgt ebenso diesem Paper. Er verwendet die Tatsache,dass für eine beliebige (nicht notwendigerweise primitive) N -te Einheitswurzel r ∈C,

N∑k=1

rk =N−1∑k=0

rk =N r = 1

0 sonst.Das ist eine einfache Konsequenz der geometrischen Summenformel und wir spre-chen auch kurz vom Einheitswurzelargument. Wir werden es im Satz über TightTrigonometric Frames 3.2.7 noch einmal verwenden.

Satz 2.3.3 (Diskrete Wexler-Raz Biorthogonalitätsbedingung).Sei [g, a, b] ein vollständiges Gabor-Tripel. Die Gabor-Tripel [g, a, b], [γ, a, b] sinddual genau dann, wenn für alle m ∈ {0, . . . , b− 1}, k ∈ {0, . . . , a− 1}

N−1∑n=0

(g[·+ mb0] exp

(−2πik · /a

))[n] · γ[n] = ab

Nδmδk (2.29)

ist. Dabei ist δ die diskrete Delta-Funktion.

Nehmen wir das Gabor-Tripel [g, b0, a0] = [g,N/b,N/a], dann können wir (2.29),mit g−m,−k bezüglich [g, b0, a0], umschreiben zu

〈g−m,−k[·], γ[·]〉 = ab

Nδmδk.

45

Page 50: Zeit-Frequenz-Analyse mit Methoden der Gabor AnalysisZeit-Frequenz-Analyse mit Methoden der Gabor Analysis DIPLOMARBEIT Zur Erlangung des Grades eines Diplom-Mathematikers Justus-Liebig

2 DIE GABORTRANSFORMATION

Beweis (Satz 2.3.3): Unter der Annahme, [g, a, b] sei vollständig, muss fürjedes duale Tripel [γ, a, b] und jede Funktion f ∈ `N gelten:

f [n] =∑m,k

(N−1∑n=0

f [n]γm,k[n])gm,k[n] (2.30)

=N−1∑n=0

∑m,k

gm,k[n]γm,k[n] f [n], (2.31)

wobei (2.30) gerade die Definition der Vollständigkeit ist, in welche die Definitionder Gabortransformation eingesetzt wurde. Aus (2.31) folgt leicht∑

m,k

gm,k[n]γm,k[n] = δ[n− n], (2.32)

mit der diskreten Delta-Funktion. Dies ist die sogenannte Vollständigkeitsrelation.Wir können die linke Seite umschreiben in∑

m

g[n−ma]γ[n−ma] ·∑k

exp(−2πik(n− n)/b0), (2.33)

wobei nach dem Einheitswurzelargument

∑k

exp(−2πik(n− n)/b0) = b0

b−1∑m=0

δ[n− n− mb0]

ist. Wir bekommen

b0

b−1∑m=0

δ[n− n− mb0]∑m

g[n+ mb0 −ma]γ[n−ma] (2.34)

= b0

b−1∑m=0

δ[n− n− mb0]

·

a−1a−1∑k=0

(N−1∑n=0

g[n+ mb0] exp(−2πikn/a

)γ[n]

)exp

(2πikn/a

) . (2.35)

Im Schritt von (2.34) nach (2.35) haben wir

a0−1∑m=0

c[n−ma] = a−1a−1∑k=0

(N−1∑n=0

c[n] exp (−2πikn/a))

exp (2πikn/a)

genutzt. Obige Aussage folgt aus der a-Periodizität der Summe auf der linken Seiteund Anwendung von DFT und Inverser DFT. Setzen wir nun noch (2.29) für dieinnere Summe ein, erhalten wir

b0

b−1∑m=0

δ[n− n− mb0] ·a−1

a−1∑k=0

ab

Nδmδk exp

(2πikn/a

) = δ[n− n]. (2.36)

46

Page 51: Zeit-Frequenz-Analyse mit Methoden der Gabor AnalysisZeit-Frequenz-Analyse mit Methoden der Gabor Analysis DIPLOMARBEIT Zur Erlangung des Grades eines Diplom-Mathematikers Justus-Liebig

2.3 Diskrete Gabortransformation

Also impliziert (2.29), falls ein zu [g, a, b] duales Gabor-Tripel [γ, a, b] existiert, dieVollständigkeitsrelation (2.32). Umgekehrt folgt aus der Vollständigkeit direkt dieExistenz eines dualen Tripels [γ, a, b], dass dann (2.29) erfüllen muss.

Die Vollständigkeitsbedingung können wir ohne Schwierigkeiten auch auf Voll-ständigkeit bezüglich eines Unterraumes X von `N reduzieren. Wählen wir dann γaus diesem Unterraum, gelten alle Schritte des Beweises weiterhin.

Die Schönheit des Wexler-Raz Kriteriums liegt vor allem darin, dass es uns er-laubt, duale Fenster durch Lösen eines einfachen, wenn auch mitunter sehr großen,linearen Gleichungssystems (LGS) zu erhalten. Für ab < N ist das Gleichungssy-stem unterbestimmt und es können Nebenbedingungen gewählt und erfüllt werden.Üblicherweise sind dies zum Beispiel Bedingungen an die Norm oder den Träger derdualen Fensterfunktion. Das LGS hat die Form

g0,0[0] g0,0[1] · · · g0,0[N − 1]g1,0[0] · · · · · · g1,0[N − 1]

... . . . . . . ...ga,0[0] · · · · · · ga,0[N − 1]g0,1[0] · · · · · · g0,1[N − 1]

... . . . . . . ...ga,1[0] · · · · · · ga,1[N − 1]

... . . . . . . ...ga,b[0] · · · · · · ga,b[N − 1]

·

γ[0]...

γ[N − 1]

=

ab/N

0...0

.

Insgesamt sind also ab = N2/a0b0 Gleichungen in N Variablen zu lösen, was fürkurze Signale handhabbar sein kann, für längere jedoch immer noch unzufrieden-stellend ist. Aber wir sind einen Schritt weiter und können nun eine duale Fenster-funktion finden, wenn nötig. Da unser Schwerpunkt auf Gabor-Tight-Frames liegt,werden wir auf die effektive Berechnung dualer Frames nicht weiter eingehen. Dassschnelle Verfahren aber möglich sind, können wir zum Beispiel in [15], [34], [35],[36] und [41] sehen.

Komplexität der DGT und DGE. Über Speicherkomplexität der DGT müs-sen wir keine großen Worte verlieren, sie entspricht der Anzahl der Koeffizientena0b0 = N2/ab. Sind a, b variabel und die Redundanz R = N/ab fest, so erhalten wirlineare Speicherkomplexität RN = O(N). Was die Zeitkomplexität betrifft, so sindfür die DGT a0b0 = N2/ab Fouriertransformationen der Länge b0 zu berechnen.

47

Page 52: Zeit-Frequenz-Analyse mit Methoden der Gabor AnalysisZeit-Frequenz-Analyse mit Methoden der Gabor Analysis DIPLOMARBEIT Zur Erlangung des Grades eines Diplom-Mathematikers Justus-Liebig

2 DIE GABORTRANSFORMATION

Dazu schreiben wir (2.27) auf folgende Weise um.

Vg,a,b[m, k] =N−1∑n=0

f [n] · gm,k[n]

=N−1∑n=0

f [n]g[n−ma] exp(−2πikn/b0)

=b0−1∑n=0

(b−1∑l=0

f [n+ lb0]g[n−ma+ lb0])

exp(−2πikn/b0)

=b0−1∑n=0

hm[n] exp(−2πikn/b0)

= hm[k]. (2.37)

Dabei haben wir die b0-Periodizität von exp(−2πikn/b0) und den üblichen Periodi-sierungstrick verwendet.

Das heißt, wir erhalten eine Zeitkomplexität von O(N2/ab logN/b)+M , mit a0DFTs der Ordnung b0 undM = a0N = N2/a Multiplikationen. Dabei vernachlässi-gen wir Additionen und berechnen die DFT mittels eines FFT-Verfahrens. Wählenwir b variabel, a und die Redundanz R = N/ab fest, so ist auch b0 = N/b fest undes bleibt O (RN log b0) + a0N = O(N2). Diese Wahl ist sinnvoll, denn b0 ist dieAnzahl der betrachteten Frequenzen, beziehungsweise Frequenzbänder.

Für die Berechnung der Rekonstruktion f durch die DGE sieht es ähnlich aus,es werden a0b0 = N2/ab Fouriertransformationen der Länge b0 benötigt. Außer-dem noch M = a0N = N2/a Multiplikationen. Dazu betrachten wir die DGE inVektorschreibweise. Aber zunächst formen wir (2.26) etwas um. Es ist

f [n] =a0−1∑m=0

b0−1∑k=0

cm,kgm,k[n]

=a0−1∑m=0

g[n−ma]b0−1∑k=0

cm,k exp(2πikn/b0)

= b0 ·a0−1∑m=0

g[n−ma] (cm,·)∨ [n], (2.38)

wobei n definiert ist durch n = pb0 + n, mit p ∈ N ∪ {0} und n < b0. Sei nunhm definiert durch hm[n] = g[n−ma] (cm,·)∨ [n], für n ∈ {0, . . . , N − 1} und n wiezuvor. Dann gilt

f =a0−1∑m=0

hm. (2.39)

Da jede Folge hm durch N Multiplikationen berechnet werden kann, erhalten wirdas gesuchte Ergebnis. Unter der obigen Annahme, dass a und R = N/ab fest sind,erhalten wir eine Zeitkomplexität von O (RN log b0) +N2/a = O(N2).

48

Page 53: Zeit-Frequenz-Analyse mit Methoden der Gabor AnalysisZeit-Frequenz-Analyse mit Methoden der Gabor Analysis DIPLOMARBEIT Zur Erlangung des Grades eines Diplom-Mathematikers Justus-Liebig

2.3 Diskrete Gabortransformation

Wählen wir stattdessen b und R = N/ab fest, erhalten wir O (RN logN/b) +a0N = O(N logN). Hat g zusätzlich einen Träger konstanter Länge L, so giltM = a0L, falls a und R = N/ab fest sind. Dann erreichen wir für Analyse undSynthese eine Komplexität O(N). Die Summation in (2.39) wird dann durch einOverlap-Add Verfahren realisiert.

Das bedeutet in diesem Falle, dass wir für alle hm in (2.39) nur diejenigen Werteberechen, die innerhalb des Trägers von g[· − ma] liegen. Wir erhalten also a0Vektoren der Länge L. Diese werden dann zueinander versetzt so aufsummiert,dass als Ergebnis ein Vektor der Länge N eintsteht. Bezeichnen wir nur die Ltatsächlich berechneten Werte mit hm können wir den Algorithmus in Pseudo-Codeso beschreiben:

49

Page 54: Zeit-Frequenz-Analyse mit Methoden der Gabor AnalysisZeit-Frequenz-Analyse mit Methoden der Gabor Analysis DIPLOMARBEIT Zur Erlangung des Grades eines Diplom-Mathematikers Justus-Liebig

2 DIE GABORTRANSFORMATION

f = zeros(N, 1)for m = 0 : a0 − 1

f [−L/2 +ma : L/2− 1 +ma] = f [−L/2 +ma : L/2− 1 +ma] + hm[1 : L]endfor

Dabei fassen wir alle Indizes modulo N auf und haben der Einfachheit halberL ∈ 2N angenommen. Der Versatz aufeinanderfolgender Vektoren beträgt genau a.Da a · a0 = N ist, können wir die dieses Konstrukt zyklisch betrachten und sehen,dass die Überlappungen der hm überall, auch am zyklischen Übergang gleich sind.Das Verfahren wird als Overlap-Add bezeichnet, da die Überlappung jeweils aufad-diert wird.

Wir schließen dieses Kapitel mit 2 Algorithmen, die DGT und diskrete Gabor-Synthese berechnen.

2.4 Algorithmen für DGT und Inverse DGTWir drucken nur den Algorithmus selbst, ohne Fehlerabfangcode und Fallunter-scheidungen ab. Die Algorithmen basieren auf den Techniken, die wir im Zuge derKomplexitätsbehandlung besprochen haben. Der gesamte Code ist auf der beilie-genden CD zu finden.

Wie zuvor in den Algorithmen zur STFT beschränken wir uns auf reelle Fenster-funktionen. Der eingegebene Fenstervektor wird als Werte einer Fensterfunktion aufihrem Träger, der um 0 zentriert ist, interpretiert. Wir weisen noch einmal auf dieIndizierung von Vektoren unter GNU Octave hin, das erste Element eines Vektorsträgt hier den Index 1, nicht 0.

Algorithmus 2.4.1 (Gabortransformation [Front-End]).

function [G,win,a,b,N] = GTfrontend (sig, win, a, b, show_spec,samp_freq)

win_length = length(win);N = length(sig);

## determine time-frequency lattice

ab = lcm(a,b);B=0;

if ( mod(N,ab) != 0 )B = ab-mod(N,ab);

endif

50

Page 55: Zeit-Frequenz-Analyse mit Methoden der Gabor AnalysisZeit-Frequenz-Analyse mit Methoden der Gabor Analysis DIPLOMARBEIT Zur Erlangung des Grades eines Diplom-Mathematikers Justus-Liebig

2.4 Algorithmen für DGT und Inverse DGT

## change ’sig’ to include border values

border=win_length-/2;left = border;

sig = [zeros(left,1); sig; zeros(B+border-1,1)];

## call ’gabor.m’ to compute the Gabor transform of ’sig’ with## window ’win’ in G

full_matrix = 0;

if ( nargout > 1 )full_matrix = 1;

endif

G = gabor(sig, win, a, b, full_matrix);

## call ’sqrt_spectrogram.m’ to show the spectrogram of ’g’## only if show_spec = 1

b0 = (N+B)/b;

if (show_spec == 1)if (full_matrix == 1)

sqrt_spectrogram(G(:,1:b0/2),a,samp_freq,2,1);else

sqrt_spectrogram(G,a,samp_freq,2,1);endif

endif

endfunction

Der obige Algorithmus bereitet das Signal auf die Transformation vor. Die Vek-toren ’sig’ und ’win’ enthalten das zu transformierende Signal f beziehungsweisedie Fensterfunktion g. Für ein Gabor-Tripel [g, a, b] wird das Signal derart verlän-gert, dass die neue Signallänge durch a und b teilbar ist. Dies ist Voraussetzungfür die Durchführbarkeit der Gabortransformation mit den gewählten Parametern.Das Signal wird außerdem links und rechts per zero-padding um Randwerte er-gänzt. Der vollständige Algorithmus verfügt auch hier wieder über die Möglichkeitperiodischer und antisymmetrischer Randwertbehandlung, insbesondere die Peri-odisierung ist jedoch mit Vorsicht zu geniessen, falls das Ursprungssignal keine zumGabor-Tripel [g, a, b] kompatible Länge hatte.

Dann wird die Gabortransformation ’gabor.m’ aufgerufen, welche die DGT des

51

Page 56: Zeit-Frequenz-Analyse mit Methoden der Gabor AnalysisZeit-Frequenz-Analyse mit Methoden der Gabor Analysis DIPLOMARBEIT Zur Erlangung des Grades eines Diplom-Mathematikers Justus-Liebig

2 DIE GABORTRANSFORMATION

vorbereiteten Signals f bezüglich des Gabor-Tripels [g, a, b] berechnet. Wird dasProgramm mit nur einem Ausgabeparameter gestartet, so wird nur die Hälfte derFrequenzen ausgegeben. Damit kann das Spektrogramm angezeigt, die Funktionjedoch nicht ohne Weiteres rekonstruiert werden. Bei einem Aufruf mit allen Aus-gabeparametern wird dagegen die vollständige DGT von f in ’G’ gespeichert undmit Hilfe der übrigen Ausgabeparameter kann die Transformation umgekehrt wer-den.

Zuletzt wird das Spektrogramm ausgegeben, falls ’show_spec’ = 1 gesetzt wur-de. Die Abtastrate wird lediglich für die Erstellung des Spektrogramms benötigt.

Algorithmus 2.4.2 (Gabortransformation [Berechnung]).

function G = gabor (sig, win, a, b, full_matrix)

## compute ’sig’ and ’win’ length

win_length = length(win);sig_length = length(sig);

## prepare matrix creation

N = sig_length-win_length+1;border = win_length/2;a0 = N/a;b0 = N/b;G = zeros(a0,b0);

## create the transform matrix

fac = fix((win_length-1)/b0)+1;B0 = fac*b0;

k = [fix(B0/2)-border+1:fix(B0/2)+border]’;

B=fix(B0/2);tempmat=zeros(b0,fac);

for m = 1:a0temp = zeros(1,B0);M=(m-1)*a;temp(k) = sig(1+M:M+win_length) .* win;tempmat(:) = shift(temp,-B+M);

52

Page 57: Zeit-Frequenz-Analyse mit Methoden der Gabor AnalysisZeit-Frequenz-Analyse mit Methoden der Gabor Analysis DIPLOMARBEIT Zur Erlangung des Grades eines Diplom-Mathematikers Justus-Liebig

2.4 Algorithmen für DGT und Inverse DGT

G(m,:) = fft(sum(tempmat,2));endfor

## If full_matrix = 0, only the first half of frequencies are saved.## This is all that is necessary to create the spectrogram.

if ( full_matrix == 0 )G=G(:,1:b0/2);

endif

endfunction

Für die Berechnung der Gabortransformation werden das vorbereitete Signalund ein Gabor-Tripel [g, a, b] benötigt. ’B0’ im Programm ist das kleinste Vielfachevon b0 = N/b, das größer als die Trägergröße von g ist. Es gibt die Größe des Bereichsan, auf den wir die Periodisierung aus (2.37) anwenden müssen. Dazu speichern wirden mit dem Fenster multiplizierten Signalausschnitt in einer, als Vektor der Länge’B0’ aufgefassen Matrix der Größe b0× fac. Durch geschickte Platzierung der Wertein dieser Matrix erhalten wir die Periodisierung als einfache zeilenweise Summedieser Matrix. Was zunächst kompliziert klingt, ist in der Praxis deutlich schneller,als die Implementierung mittels einer Schleife. Die äußere Schleife entspricht derErstellung der einzelnen Zeilen der Koeffizientenmatrix.

Ist zusätzlich ’full_matrix’= 0, wird nur der Teil der Matrix zurückgegeben, derzur Erstellung des Spektrogramms benötigt wird. Für reelle Signale kann die gesam-te Matrix aus dem Teilabschnitt durch Anhängen der zeilen-invertierten, komplex-konjugierten Teilmatrix zurückgewonnen werden.

53

Page 58: Zeit-Frequenz-Analyse mit Methoden der Gabor AnalysisZeit-Frequenz-Analyse mit Methoden der Gabor Analysis DIPLOMARBEIT Zur Erlangung des Grades eines Diplom-Mathematikers Justus-Liebig

2 DIE GABORTRANSFORMATION

Algorithmus 2.4.3 (Gabor-Synthese via DGE).function sig = inv_gabor (G, win, a, b, sig_length)

[a0, b0] = size (G);win_length = length(win);N = a0*a;border = win_length/2;fac = fix((win_length-1)/b0)+1;

## compute the inverse fourier transform of G

G = real(ifft(G,b0,2));

## reconstruct ’sig’ via overlap-add

sig = zeros (N,1);wrap = fix((win_length-1)/(2*a))+1;left=border;right=border;

for m=1:wraprange = [(N-left+1+(m-1)*a:N),(1:right+(m-1)*a)];sig(range) = sig(range) + (win .* G(m,mod(range-1,b0)+1)’);

endfor

for m=wrap+1:a0-wrap+1range = [1-left+(m-1)*a:right+(m-1)*a];sig(range) = sig(range) + (win.* G(m,mod(range-1,b0)+1)’);

endfor

for m=a0-wrap+2:a0range = [(1-left+(m-1)*a:N),(1:right+(m-1)*a-N)];sig(range) = sig(range) + (win .* G(m,mod(range-1,b0)+1)’);

endfor

## Shorten signal to original length, if given

sig = sig(1:sig_length);

## Multiply by ’a’ (scaling)

sig = a*sig;

endfunction

54

Page 59: Zeit-Frequenz-Analyse mit Methoden der Gabor AnalysisZeit-Frequenz-Analyse mit Methoden der Gabor Analysis DIPLOMARBEIT Zur Erlangung des Grades eines Diplom-Mathematikers Justus-Liebig

2.4 Algorithmen für DGT und Inverse DGT

Die Gabor-Synthese verwendet weitgehend identische Bezeichnungen, wie dievorherigen Algorithmen. Zunächst wird die zeilenweise inverse DFT der Matrix’G’ gebildet. Die folgenden drei Schleifen implementieren die m-Summation derRekonstruktion nach (2.38) mit einem Overlap-Add Verfahren. Das bedeutet, dassein (langer) Ergebnisvektor durch Berechnung mehrerer kürzerer Vektoren entsteht,die mit passend gewählter Überlappung aufaddiert werden. Der Parameter ’wrap’überwacht dabei, ob der Träger von g[n−ma] über den Rand des Signals hinausragtund periodisch „umgeklappt“ werden muss.

Abschließend wird das Signal auf Originallänge zugeschnitten, falls diese gegebenwar und mit a multipliziert, so dass wir insgesamt

a

b0

a0−1∑m=0

b0−1∑k=0

cm,kgm,k[n] = ab

N

a0−1∑m=0

b0−1∑k=0

cm,kgm,k[n]

erhalten. Dies entspricht bis auf den Faktor abN

der Gabor-Synthese. Dieser Faktorist gerade der Kehrwert der Redundanz und wurde so gewählt, um später, wenn wirTight Frames mit normierten Fenstern verwenden, erneute Normierung überflüssigzu machen. Für solche Frames ist γ = ab/N · g die kanonische duale Funktion. Beinicht normierten Tight Frames müssen wir das Ergebnis durch ‖g‖2

2 dividieren, umdie korrekte Rekonstruktion zu erhalten, für beliebige Frames mit vorberechnetemdualem Fenster reicht eine Multiplikation von γ mit dem Faktor b0/a = N/ab, umdies auszugleichen. Dabei ist b0 die Anzahl der Spalten der Matrix ’G’ und somitbekannt.

55

Page 60: Zeit-Frequenz-Analyse mit Methoden der Gabor AnalysisZeit-Frequenz-Analyse mit Methoden der Gabor Analysis DIPLOMARBEIT Zur Erlangung des Grades eines Diplom-Mathematikers Justus-Liebig

3 GABOR-FRAMES UND GABOR-TIGHT-FRAMES

3 Gabor-Frames und Gabor-Tight-Frames

Der Satz von Balian-Low besagt, dass keine gut lokalisierten Orthonormalbasenfür die Gabortransformation existieren. Das macht Frames in diesem Fall sehr vielwichtiger als zum Beispiel für die Zeit-Skalen-Analyse mit Wavelets. Daher werdenwir uns auf den folgenden Seiten etwas näher mit den Eigenschaften von Frames,insbesondere von Gabor-Frames befassen.

Das Konzept der Frames ist zurückzuführen auf Duffin und Schaeffer [13], diesie im Kontext nichtharmonischer Fourierreihen 1952 zum ersten Mal verwende-ten. Sie wurden jedoch erst in der zweiten Häfte der 80er Jahre von Daubechies,Grossmann und Meyer in [9] für die Signalanalyse wiederentdeckt. Frames könnenals eine Erweiterung von Riesz-Basen aufgefasst werden, sie müssen die gleichenVollständigkeits- und Stabilitätskriterien erfüllen, ihre Elemente dürfen jedoch li-near abhängig sein. Riesz-Basen werden in der Frametheorie oft als exakte Framesbezeichnet.

Wir beginnen damit, einige Grundlagen der Frametheorie (ohne Beweise) auf-zuarbeiten. Dazu wiederholen wir kurz die Definition aus Kapitel 2, leiten darausdas kanonische duale Frame durch Inversion des Frame-Operators her und gehenauf die Eigenschaften dieses dualen Paares ein.

Dann betrachten wir, was diese Grundlagen für Gabor-Frames bedeuten undwelche zusätzlichen Eigenschaften diese besitzen. Wir geben notwendige und hin-reichende Kriterien für Gabor-Tripel an, die ein Frame bilden. Unser besonderesInteresse gilt dabei Tight Frames. Für diese ist das duale Frame besonders leichtzu finden, da ein solches duales Paar sich nur durch einen konstanten Faktor unter-scheidet. Wir lernen ein einfaches hinreichendes Kriterium für Gabor-Tight-Frameskennen und werden mit seiner Hilfe zwei Klassen solcher Frames konstruieren. Ei-ne dieser Klassen, die wir als Trigonometric Frames bezeichnen werden, beinhaltetbekannte Fensterfunktionen wie das von-Hann- oder Blackman-Fenster.

Abschließend übertragen wir die gewonnenen Erkenntnisse auf den `N -Fall. Sokönnen die entsprechenden Gabortransformationen und -Synthesen mit den in Ab-schnitt 2.4 vorgestellten Algorithmen berechnet werden.

3.1 Grundlagen der FrametheorieWir werden nun einige grundlegende Definitionen der Frametheorie über allgemei-nen Hilberträumen und Eigenschaften von Frames über solchen Räumen kennenler-nen. Alle hier vorgestellten Ergebnisse gelten insbesondere für Gabor-Frames überL2(R) und `N , wir können sie also im weiteren Verlauf dieser Arbeit ohne Ein-schränkungen verwenden. Falls nicht anders gekennzeichnet, sind sie aus [8, Kapitel3] entnommen. Bevor wir jedoch anfangen, wollen wir noch einmal in Erinnerung

56

Page 61: Zeit-Frequenz-Analyse mit Methoden der Gabor AnalysisZeit-Frequenz-Analyse mit Methoden der Gabor Analysis DIPLOMARBEIT Zur Erlangung des Grades eines Diplom-Mathematikers Justus-Liebig

3.1 Grundlagen der Frametheorie

rufen, was unter einem Frame zu verstehen ist.

Für eine abzählbare oder endliche Indexmenge I nennen wir eine Familie vonFunktionen {φj}j∈I über einem HilbertraumH ein Frame (von H), falls KonstantenA,B mit B ≥ A > 0 existieren, so dass

A‖f‖2 ≤∑j∈I|〈f, φj〉|2 ≤ B‖f‖2, für alle f ∈ H. (3.1)

A,B bezeichnen wir als untere beziehungsweise obere Frame Schranke. Wir nennenein Frame Tight, falls A = B. Sind die {φj}j∈I linear unabhängig, so ist das Frameexakt oder eine Riesz-Basis.

In endlichdimensionalen Räumen können wir die Frame Schranken, vor allemfür Tight Frames, als Maß der Überrepräsentation des Raumes H durch das Frameansehen. Ist ‖φj‖ = 1 für alle j ∈ I und hat H die Dimension N , so gilt (nach [33,S.157]) A ≤ |I|

N≤ B.

Die durch cf [j] = 〈f, φj〉 definierte Folge bezeichnen wir auch als Frame-Analysevon f , die Form∑

j∈I c[j]φj mit c ∈ `2(I) als Frame-Synthese. Außerdem bezeichnenwir den durch

Φf = {cf [j] = 〈f, φj〉}j∈I , für alle f ∈ H (3.2)

definierten linearen und beschränkten Operator Φ von H nach `2(I) als Frame-Analyse-Operator .

Der adjungierte Operator Φ∗ ist gegeben durch

〈Φ∗c, f〉 = 〈c,Φf〉, für alle c ∈ `2(I)

so dass im schwachen SinneΦ∗c =

∑j∈I

c[j]φj (3.3)

gilt. Tatsächlich ist diese Reihe jedoch konvergent in H (siehe [8, S.101, Anmerkung4]) und (3.3) gilt auch im starken Sinn. Daher bezeichnen wir Φ∗ als Frame-Synthese-Operator .

Mit diesen Bezeichungen ist der sogenannte Frame-Operator S = Φ∗Φ invertier-bar und das (kanonische) duale Frame zu {φj}j∈I ist definiert durch

φj = S−1φj. (3.4)

Es erfüllt

B−1‖f‖2 ≤∑j∈I|〈f, φj〉|2 ≤ A−1‖f‖2, für alle f ∈ H. (3.5)

57

Page 62: Zeit-Frequenz-Analyse mit Methoden der Gabor AnalysisZeit-Frequenz-Analyse mit Methoden der Gabor Analysis DIPLOMARBEIT Zur Erlangung des Grades eines Diplom-Mathematikers Justus-Liebig

3 GABOR-FRAMES UND GABOR-TIGHT-FRAMES

Der Frame-Analyse-Operator des dualen Frames ergibt sich also als Moore-PenroseInverse von Φ. Es gilt Φ = Φ(Φ∗Φ)−1.

Daraus folgt, dass ein Frame und sein (kanonisches) Duales die Gleichung

f =∑j∈I〈f, φj〉φj =

∑j∈I〈f, φj〉φj (3.6)

für alle f ∈ H erfüllen. Das (kanonische) duale Frame ist in dem Sinne eindeu-tig, dass die Folge cf [j], definiert wie oben, unter allen Folgen c ∈ `2(I) mitf = ∑

j∈I c[j]φj, diejenige mit minimaler Norm ist. Genauer gilt (aus [21]):∑j∈I|c[j]|2 ≥

∑j∈I|cf [j]|2 =

∑j∈I|〈f, φj〉|2, (3.7)

für alle solchen c. Dabei wird die Ungleichung strikt, sobald für mindestens ein Fol-genelement c[j] 6= 〈f, φj〉 gilt.

Ist {φj}j∈I keine Riesz-Basis, so existieren unendlich viele Familien, die (3.6)erfüllen. Das oben beschriebene Frame ist jedoch eindeutig in dem Sinne, dass dieKoeffizientenfolge c[j] = 〈f, φj〉 unter allen Folgen, die (3.6) erfüllen, minimale Normhat.

Bildet {φj}j∈I ein Tight Frame, so ist die Berechnung des dualen Frames beson-ders einfach, denn es gilt

S = Φ∗Φ = A · id,

wobei id den Identitätsoperator über H bezeichnet.

Für endlich viele Familien {φj,l}j∈Il , so dass jede dieser Familien ein Frame mitFrame Schranken Al, Bl bildet, ist ⋃

l

{φj,l}j∈Il

ebenfalls ein Frame mit Frame Schranken

A ≥∑l

Al und B ≤∑l

Bl,

Kurz gesagt bildet die Vereinigung endlich vieler Frames wieder ein Frame.

3.2 Gabor-FramesWählen wir für {φj}j∈I ein Gabor-Tripel (g, a, b), mit g ∈ L2(R) und a, b ∈ R,dann können weitere Aussagen gemacht werden. Zur Erleichterung der Notationbezeichnen wir ein Gabor-Tripel als Gabor-Frame-Tripel oder Gabor-Tight-Frame,

58

Page 63: Zeit-Frequenz-Analyse mit Methoden der Gabor AnalysisZeit-Frequenz-Analyse mit Methoden der Gabor Analysis DIPLOMARBEIT Zur Erlangung des Grades eines Diplom-Mathematikers Justus-Liebig

3.2 Gabor-Frames

wenn es ein Frame, beziehungsweise ein Tight Frame bildet. Sprechen wir in diesemAbschnitt von Frames, so sind stets Frames über L2(R) gemeint.

Ist (g, a, b) ein Gabor-Frame-Tripel, dann kommutiert der zugehörige Frame-Operator mit Translationen um a und Modulationen um b ([7],[8]). Also wird das(kanonische) duale Frame ebenfalls von einer einzigen Funktion gebildet, die wirmit γ0 bezeichnen wollen. Das kanonische duale Frame zu (g, a, b) wird also durchdas Gabor-Tripel (γ0, a, b) gebildet. Aus dem vorigen Abschnitt wissen wir, dass esebenfalls ein Frame ist. Hat zusätzlich (g, a, b) die Frame Schranken A, B, dann hat(γ0, a, b) die Frame Schranken B−1, A−1.

Der Satz von Rieffel-Janssen 2.2.7 gibt die notwendige Bedingung für Gabor-Frames

ab ≤ 1.

Daubechies zeigt in [8], dass in diesem Fall außerdem

A ≤ 1ab‖g‖2 ≤ B (3.8)

gilt. Diese Aussage wurde von Chui und Shi in [6] um die Ungleichungen

A ≤ 1b

∑m∈Z|g(t−ma)|2 ≤ B, für alle t ∈ R, (3.9)

undA ≤ 1

a

∑n∈Z|g(ω − nb)|2 ≤ B, für alle ω ∈ R, (3.10)

erweitert.Ebenfalls von Daubechies [8] stammt die folgende hinreichende Bedingung, die

Näherungswerte A0, B0 für die Frame Schranken A,B liefert.

Satz 3.2.1 (Hinreichende Bedingung für Gabor-Frames).Sei (g, a, b) ein Gabor-Tripel mit

0 < A0 = 1b

inf0≤t≤a

∑m∈Z|g(t−ma)|2 −∆

(3.11)

und

∞ > B0 = 1b

sup0≤t≤a

∑m∈Z|g(t−ma)|2 + ∆

, (3.12)

mit∆ =

∑n6=0,n∈Z

(θ(n

b

)θ(−nb

))1/2(3.13)

59

Page 64: Zeit-Frequenz-Analyse mit Methoden der Gabor AnalysisZeit-Frequenz-Analyse mit Methoden der Gabor Analysis DIPLOMARBEIT Zur Erlangung des Grades eines Diplom-Mathematikers Justus-Liebig

3 GABOR-FRAMES UND GABOR-TIGHT-FRAMES

undθ(u) = sup

0≤t≤a

∑m∈Z|g(t−ma)||g(t−ma+ u)|. (3.14)

dann bildet diese Familie ein Frame. Es gilt A0 ≤ A und B ≤ B0 für die optimalenFrame Schranken A,B.

Außerdem gilt: Ist g ∈ L2(R) und a ∈ R, so dass

0 < inf0≤t≤a

∑m∈Z|g(t−ma)|2 und sup

0≤t≤a

∑m∈Z|g(t−ma)|2 <∞ (3.15)

ist und es ein ε > 0 mit θ(u) ≤ C(1 + |u|)−(1+ε) gibt, dann existiert b, so dass dasGabor-Tripel (g, a, b) für alle b < b ein Frame bildet.

Das obige hinreichende Kriterium lässt sich bedeutend leichter nachprüfen, alsdie Frame-Ungleichung selbst. Für beliebige Fensterfunktionen kann die Auswer-tung aber weiterhin mit erheblichem Aufwand verbunden sein. Wählen wir, wie esin praktischen Anwendungen ohnehin geschehen muss, ein Fenster mit kompaktemTräger, so ist nochmals eine erhebliche Erleichterung möglich. Zunächst wollen wiraber zeigen, dass geeignete Umskalierungen eines Gabor-Frame-Tripels ebenfallsGabor-Frame-Tripel sind. Die Behauptung stammt aus [33], wir führen den Beweisjedoch etwas ausführlicher als dort.

Satz 3.2.2 (Fensterskalierung).Sei (g, a, b) ein Gabor-Frame-Tripel mit Frame Schranken A,B. Für s ∈ R sei gsdefiniert durch

gs(t) = s−1/2g(t/s).Dann bildet (gs, sa, b/s) ein Frame mit identischen Frame Schranken.

Beweis: Wir definieren zunächst f(t) := s−1/2f(t/s) ∈ L2(R), dann ist ‖f‖ = ‖f‖und ‖g‖ = ‖gs‖. Außerdem gilt

〈f, gm,n〉 =∫

Rf(t)gm,n(t) dt =

∫R

1sf(t′/s)gm,n(t′/s) dt′

=∫

Rf(t′)gs,m,n(t′) dt′ = 〈f , gs,m,n〉 (3.16)

und somit

A‖f‖2 = A‖f‖2 ≤ 〈f, gm,n〉 = 〈f , gs,m,n〉 ≤ B‖f‖2 = B‖f‖2, (3.17)

woraus die Behauptung folgt.

60

Page 65: Zeit-Frequenz-Analyse mit Methoden der Gabor AnalysisZeit-Frequenz-Analyse mit Methoden der Gabor Analysis DIPLOMARBEIT Zur Erlangung des Grades eines Diplom-Mathematikers Justus-Liebig

3.2 Gabor-Frames

Außerdem können wir für Gabor-Frames die Redundanz um beliebige positive,ganzzahlige Faktoren erhöhen, indem wir den Parameter a entsprechend anpassen.

Lemma 3.2.3 (Erhöhung der Redundanz).Ist (g, a, b) ein Gabor-Frame-Tripel mit Frame Schranken A,B und l ∈ N, so ist(g, a

l, b) ein Gabor-Frame-Tripel mit Frame Schranken A ≥ l · A und B ≤ l ·B.

Beweis: Wir können (g, al, b) = {gm,n = MnbTma/lg}m,n∈Z umschreiben in

(g, al, b) =

l−1⋃k=0{MnbTmag(· −

ka

l)}m,n∈Z,

mit{MnbTmag(· −

ka

l)}m,n∈Z = {MnbTma+ka/lg}m,n∈Z =: Gk.

Dabei ist G0 nach Voraussetzung ein Frame mit Frame Schranken A,B. Folglich,da L2(R) ein translations-invarianter Raum ist, bildet Gk für k ∈ {1, . . . , l − 1}ebenfalls ein Frame mit diesen Frame Schranken. Daraus folgt die Behauptung.

Fenster auf kompaktem Träger. In der Praxis sind Fenster mit unendlichemTräger, wie zum Beispiel das Gauss-Fenster, nicht exakt umsetzbar. Es macht da-her Sinn, ein Auge darauf zu werfen, ob wir die bisherigen Resultate vereinfachenkönnen, wenn wir uns auf Fensterfunktionen mit kompaktem Träger beschränken.Das folgende hinreichende Kriterium für Gabor-Frames ist eines der ältesten Er-gebnisse auf dem Gebiet der Zeit-Frequenz-Analyse mit Frames und findet sich in[9]. Wir beweisen hier eine Abwandlung, die wir später häufiger benutzen werden.Wir verwenden die Bezeichnung L für die Trägergröße der Fensterfunktion, dabeiist L ∈ R+.

Satz 3.2.4 (Gabor-Frames mit kompaktem Träger).Sei g ∈ L2(R) eine stetige Funktion mit Träger supp(g) ⊆ [−L/2, L/2]. Gilt wei-terhin |g(t)| ≥ c, mit einer Konstante c ∈ R+, für alle t ∈ [−µL/2, µL/2] mit0 < µ < 1, dann bildet das Gabor-Tripel (g, µL, 1/L) ein Frame.

Es gilt außerdem die folgende Variation, die eine hinreichende Bedingung fürGabor-Tight-Frames liefert, die leicht nachgewiesen werden kann.

61

Page 66: Zeit-Frequenz-Analyse mit Methoden der Gabor AnalysisZeit-Frequenz-Analyse mit Methoden der Gabor Analysis DIPLOMARBEIT Zur Erlangung des Grades eines Diplom-Mathematikers Justus-Liebig

3 GABOR-FRAMES UND GABOR-TIGHT-FRAMES

Satz 3.2.5 (Gabor-Tight-Frames).Sei g ∈ L2(R) eine Funktion mit Träger supp(g) ⊆ [−L/2, L/2]. Gilt

1b

∑m∈Z|g(t+ma)|2 = A > 0, für alle t ∈ R, (3.18)

mit a = µL, b = 1/L und 0 < µ ≤ 1, dann bildet das Gabor-Tripel (g, a, b) einTight Frame mit Frame Schranke A.

Beweis: Die Funktion g(· − ma)f(·) hat einen Träger in [ma − L/2,ma + L/2].Da die Einschränkung der Funktionen {exp(2πin · /L)}n∈Z auf dieses Intervall eineOrthogonalbasis von L2([ma − L/2,ma + L/2]) bildet, können wir die allgemeineParsevalsche Formel anwenden (siehe zum Beispiel [24]), die für dieses System dieForm

‖f‖2 = 〈f , f〉L = 1L

∑n∈Z|〈f , exp(2πin · /L)〉L|2,

mit dem inneren Produkt

〈f , g〉L =∫ ma+L/2

ma−L/2f(t)g(t) dt,

annimmt. Wegen des Trägers von g(· − ma)f(·) sind die inneren Produkte überL2([ma − L/2,ma + L/2]) hier gleich den inneren Produkten über L2(R) und wirerhalten∫

R|g(t−ma)|2|f(t)|2 dt =

∫ ma+L/2

ma−L/2|g(t−ma)|2|f(t)|2 dt

= 〈g(· −ma)f(·), g(· −ma)f(·)〉

= 1L

∑n∈Z|〈g(· −ma)f(·), exp(2πin · /L)〉|2,

da komplexe Konjugation den Betrag nicht verändert. Mit gm,n(t) wie üblich erhal-ten wir

L∫

R|g(t−ma)|2|f(t)|2 dt =

∑n∈Z|〈f, gm,n〉|2.

Wir summieren über m und setzen (3.18) ein, um

A‖f‖2 =∑

m,n∈Z|〈f, gm,n〉|2

zu erhalten. Damit ist {gm,n}m,n∈Z ein Gabor-Tight-Frame von L2(R). Für a > Lmuss A offensichtlich 0 sein, falls es existiert, die Wahl µ ≤ 1 ist also keine echteEinschränkung.

62

Page 67: Zeit-Frequenz-Analyse mit Methoden der Gabor AnalysisZeit-Frequenz-Analyse mit Methoden der Gabor Analysis DIPLOMARBEIT Zur Erlangung des Grades eines Diplom-Mathematikers Justus-Liebig

3.2 Gabor-Frames

Wir bemerken, dass durch den konstanten Wert der Summe in (3.18) die Exi-stenz einer (strikt) positiven unteren Schranke für g im Intervall [−µL/2, µL/2] undsogar die Stetigkeit von g überflüssig wird. Weiterhin ist leicht zu sehen, dass eineVerkleinerung des Parameters b die Bedingungen des Satzes nicht verletzt. Wir kön-nen die (Frequenz-)Redundanz also beliebig erhöhen und erhalten weiter ein TightFrame.

Trigonometric Frames. Wir nutzen nun Satz 3.2.5, um zu zeigen, dass be-stimmte trigonometrische Polynome mit gewissen Zeit-Frequenz-Gittern Gabor-Tight-Frames bilden. Zum Einstieg zeigen wir die Aussage für den einfachen Falldes von-Hann-Fensters. Diese Fensterfunktion ist gegeben durch

fHan(t) = cos2(πt)χ[−1/2,1/2) =(1

2 + 12 cos (2πt)

)χ[−1/2,1/2), (3.19)

wobei χI die charakteristische Funktion des Intervalls I ist.

Lemma 3.2.6 (von-Hann-Tight-Frame).Das Gabor-Tripel (fHan, a, b) bildet mit a = 1

4 , b ≤ 1 ein Tight-Frame mit FrameSchranke A = 4

b‖fHan‖2. Sei fHan,s definiert durch

fHan,s(t) = s−1/2fHan

(t

s

), für alle s ∈ R+. (3.20)

Dann bildet das Tripel (fHan,s, asl ,bs) für l ∈ N ein Gabor-Tight-Frame mit Frame

Schranke Al = 4lb‖fHan‖2.

Beweis: Wir weisen zunächst nach, dass (fHan, 14 , b), mit b ≤ 1 die Bedingungen

aus 3.2.5 erfüllt.Offensichtlich gilt supp(fHan) = [−1

2 ,12) ⊂ [− 1

2b ,12b ], also ist nur noch (3.18) zu

zeigen. Wir nehmen ohne Beschränkung der Allgemeinheit an, dass t ∈ [−12 ,−

14).

Ist das nicht der Fall, müssen nur die Summationsindizes entsprechend verschobenwerden. Es ist

1b

∑m∈Z|fHan(t−ma)|2 = 1

b

∑m∈Z

∣∣∣∣fHan (t− m

4

)∣∣∣∣2 .Offensichtlich ist diese Summe a-periodisch, wir können die rechte Seite also unterBenutzung von supp(fHan) = [−1

2 ,12) und fHan(t) ∈ R für alle t wie folgt weiter

63

Page 68: Zeit-Frequenz-Analyse mit Methoden der Gabor AnalysisZeit-Frequenz-Analyse mit Methoden der Gabor Analysis DIPLOMARBEIT Zur Erlangung des Grades eines Diplom-Mathematikers Justus-Liebig

3 GABOR-FRAMES UND GABOR-TIGHT-FRAMES

umformen:1b

∑m∈Z

∣∣∣∣fHan (t− m

4

)∣∣∣∣2

= 1b

0∑n=−3

∣∣∣∣fHan (t− m

4

)∣∣∣∣2= 1b

(f 2Han(t) + f 2

Han

(t+ 1

4

)+ f 2

Han

(t+ 1

2

)+ f 2

Han

(t+ 3

4

))

= 14b

4 + 2(cos (2πt) + cos

(2πt+ π

2

)+ cos (2πt+ π) + cos

(2πt+ 3π

2

))

+(cos2(2πt) + cos2

(2πt+ π

2

)+ cos2 (2πt+ π) + cos2

(2πt+ 3π

2

))= 1b(4 · 0, 52 + 0, 52(2 cos2(2πt) + 2 sin2(2πt))) = 2

b((2 ∗ 0, 52 + 0, 52))

= 4b‖fHan‖2 =: A > 0.

Dabei haben wir zusätzlich

cos(t) = sin(t+ π

2 ) = − cos(t+ π) = − sin(t+ 3π2 ) = cos(t+ 2π)

und sin2(t) + cos2(t) = 1 verwendet. Der zweite Teil der Behauptung folgt unmit-telbar aus 3.2.2 und 3.2.3.

Wir können auch Satz 3.2.4 anwenden und erhalten, dass (fHan, a, b) ein Gabor-Frame-Tripel ist, wann immer a < 1 und b ≤ 1 gilt. Auch hier können wir selbst-verständlich skalieren (3.2.2) und die Redundanz erhöhen (3.2.3).

Wir konstruieren nun allgemeiner trigonometrische Polynome, so dass ihre Ein-schränkung auf ein Einheitsintervall die Bedingung (3.18) erfüllt. Es ist durchausmöglich, dass das vorgestellte Resultat auf eine größere Klasse von trigonometri-schen Polynomen ausgeweitet werden kann, dies zu zeigen oder zu widerlegen über-steigt jedoch den Rahmen dieser Arbeit.

Satz 3.2.7 (Tight Trigonometric Frames).Sei g0 ∈ L2(R) ein trigonometrisches Polynom der Form:

g0(t) = d+∑k∈I

ak cos(2πbkt+ ck), (3.21)

mit einer endliche Indexmenge I, und Konstanten ak, ck, d ∈ R, bk ∈ N. Sei weiter-hin u ∈ N mit u ≥ bk für alle k ∈ I oder eine beliebige natürliche Zahl, falls I = ∅.Sei weiterhin g ∈ L2(R) definiert durch

g = g0χ[−1/2,1/2). (3.22)

64

Page 69: Zeit-Frequenz-Analyse mit Methoden der Gabor AnalysisZeit-Frequenz-Analyse mit Methoden der Gabor Analysis DIPLOMARBEIT Zur Erlangung des Grades eines Diplom-Mathematikers Justus-Liebig

3.2 Gabor-Frames

Dann bildet das Gabor-Tripel (g, a, b) mit a = 14u und b ≤ 1 ein Tight Frame,

falls g nicht die Nullfunktion ist. In diesem Fall hat (g, a, b) das Frame SchrankeA = 4u

b‖g‖2. Gelten die obigen Bedingungen und sei gs definiert durch

gs(t) = s−1/2g(t

s

), für alle s ∈ R. (3.23)

Dann bildet das Tripel (gs, asl ,bs), für l ∈ N ein Gabor-Tight-Frame mit Frame

Schranke Al = 4ulb‖g‖2.

Der Beweis verwendet wieder das Einheitswurzelargument, um zu zeigen, dassSummen der Form

N−1∑j=0

exp (2πikj/N) (3.24)

immer dann gleich 0 sind, wenn k ∈ Z \ {0} mit |k|N

/∈ N. Dies nutzen wir, um zuzeigen, dass die Ableitung von ∑

j∈Z|g (t− ja) |2

gleich 0 ist. Dann muss die Summe selbst konstant sein. Ist g dann nicht die Null-funktion, dann ist die zweite Bedingung aus 3.2.5 erfüllt.

Beweis (Satz 3.2.7): Sei g eine Funktion, welche den Annahmen aus 3.2.7genügt. Wir behandeln die Fälle I = ∅ und I 6= ∅ getrennt.

Um 3.2.5 anwenden zu können, müssen wir 0 < A = 1b

∑j∈Z |g (t− ja) |2 für

alle t ∈ R zeigen. Die Trägereigenschaft ist für b ≤ 1 offensichtlich erfüllt. Da greellwertig ist, können wir schreiben

∑j∈Z|g (t− ja) |2 =

∑j∈Z

g2(t− j

4u

).

Wie schon im Falle des von-Hann-Fensters ist diese Summe a-periodisch. Außerdemist für t ∈ [ c4u ,

c+14u ) mit c ∈ Z genau dann

t− j

4u /∈ [−1/2, 1/2), wenn j /∈ (c− 2u, c+ 2u] ∩ Z = [c− 2u+ 1, c+ 2u].

Für beliebiges t ∈ R tragen also genau 4u Terme zur Summe bei. Sei t ∈ [−12 ,−

12 +

14u), dann können wir die Summe weiter umformen in

0∑j=−4u+1

g2(t− j

4u

). (3.25)

65

Page 70: Zeit-Frequenz-Analyse mit Methoden der Gabor AnalysisZeit-Frequenz-Analyse mit Methoden der Gabor Analysis DIPLOMARBEIT Zur Erlangung des Grades eines Diplom-Mathematikers Justus-Liebig

3 GABOR-FRAMES UND GABOR-TIGHT-FRAMES

Ist t ∈ [−12 + c

4u ,−12 + c+1

4u ) für ein c ∈ Z, dann ist

∑j∈Z|g (t− ja) |2 =

0∑j=−4u+1

g2(t− j + c

4u

).

Definieren wir t = t− c4u , dann setzen wir in der folgenden Argumentation einfach

t für t ein und die Berechnungen bleiben korrekt.

Ist I = ∅, dann schreiben wir

0∑j=−4u+1

g2(t− j

4u

)= 4ud2 = 4u‖g‖2 = A.

Also ist A = A/b = 4ubd2, was offensichtlich unabhängig von t ist. Da nach Vor-

aussetzung g nicht die Nullfunktion ist, folgt A > 0 und somit ist (g, a, b) einGabor-Tight-Frame.

Ist I 6= ∅, dann zeigen wir, dass die Ableitung einer Summe wie in (3.25) unabhängigvon t gleich 0 ist. Dazu betrachten wir das g zugeordnete trigonometrische Polynomg0 in seiner komplexen Darstellung. Wir erhalten

g0(t) = d+∑k∈I

ak cos(2πbkt+ ck)

= d+ 12∑k∈I

ak (exp (i (2πbkt+ ck)) + exp (−i (2πbkt+ ck)))

= d+ 12∑k∈I

ak (exp (cki) exp (2πbkit) + exp (−cki) exp (−2πbkit)) .

Die Ableitung g′0 von g0 ist dann gegeben durch

g′0(t) = πi∑k∈I

akbk (exp (cki) exp (2πbkit)− exp (−cki) exp (−2πbkit)) .

66

Page 71: Zeit-Frequenz-Analyse mit Methoden der Gabor AnalysisZeit-Frequenz-Analyse mit Methoden der Gabor Analysis DIPLOMARBEIT Zur Erlangung des Grades eines Diplom-Mathematikers Justus-Liebig

3.2 Gabor-Frames

Nun betrachten wir die Ableitung von g = g20, diese ist nach nach der Produktregel

g′(t) = g′0(t)g0(t) + g0(t)g′0(t) = 2g0(t)g′0(t)

= 2d+ 1

2∑k∈I

ak (exp (cki) exp (2πbkit) + exp (−cki) exp (−2πbkit))

·

πi∑k∈I

akbk (exp (cki) exp (2πbkit)− exp (−cki) exp (−2πbkit))

= 2πid

∑k∈I

akbk (exp (cki) exp (2πbkit)− exp (−cki) exp (−2πbkit))

+ 12

(∑k∈I

∑l∈I

akalbl

(exp ((ck + cl)i) exp (2π(bk + bl)it)

+ exp ((cl − ck)i) exp (2π(bl − bk)it)− exp ((ck − cl)i) exp (2π(bk − bl)it)

− exp (−(ck + cl)i) exp (−2π(bk + bl)it))).

Wir wollen uns die Notation etwas erleichtern und definieren

ck,l = akalbl exp ((ck + cl)i) /2, ck,−l = akalbl exp ((ck − cl)i) /2,c−k,l = akalbl exp ((cl − ck)i) /2, c−k,−l = akalbl exp (−(ck + cl)i) /2,dk = dakbk exp (cki) und d−k = dakbk exp (−cki) .

Dann bekommen wir

g′(t) = 2πi∑k∈I

dk exp (2πbkit)− d−k exp (−2πbkit)

+(∑k∈I

∑l∈I

ck,l exp (2π(bk + bl)it) + c−k,l exp (2π(bl − bk)it)

− ck,−l exp (2π(bk − bl)it)− c−k,−l exp (−2π(bk + bl)it)).

Es gilt weiterhin

0∑j=−4u+1

g2(t) =0∑

j=−4u+1g2

0(t) =0∑

j=−4u+1g(t)

und somit 0∑j=−4u+1

g2(·)′ (t− j

4u

)= 0∑j=−4u+1

g(·)′ (t− j

4u

)=

0∑j=−4u+1

g′(t− j

4u

).

67

Page 72: Zeit-Frequenz-Analyse mit Methoden der Gabor AnalysisZeit-Frequenz-Analyse mit Methoden der Gabor Analysis DIPLOMARBEIT Zur Erlangung des Grades eines Diplom-Mathematikers Justus-Liebig

3 GABOR-FRAMES UND GABOR-TIGHT-FRAMES

Zeigen wir also, dass diese Summe gleich 0 ist, dann ist (3.25) konstant. Dazu formenwir zunächst weiter um:

0∑j=−4u+1

g′(t− j

4u

)

= 2πi(∑

k∈Idk

0∑j=−4u+1

exp(2πbki

(t− j

4u

))

− d−k0∑

j=−4u+1exp

(−2πbki

(t− j

4u

)))

+(∑k∈I

∑l∈I

ck,l0∑

j=−4u+1exp

(2π(bk + bl)i

(t− j

4u

))

+ c−k,l0∑

j=−4u+1exp

(2π(bl − bk)i

(t− j

4u

))

− ck,−l0∑

j=−4u+1exp

(2π(bk − bl)i

(t− j

4u

))

− c−k,−l0∑

j=−4u+1exp

(−2π(bk + bl)i

(t− j

4u

))). (3.26)

Das heißt, wir betrachten nur die Produkte konstanter Terme mit Summen derForm

0∑j=−4u+1

exp(2πbi

(t− j

4u

))= exp

(2πbit

) 0∑j=−4u+1

exp(−2πbi j4u

),

mit einem b ∈ Z, da bk ∈ N für alle k ∈ I. Die Summe auf der rechten Seite istimmer dann gleich 0, wenn

|b|4u /∈ N, (3.27)

denn dann ist die Summe nach dem Einheitswurzelargument gleich 0. Ist nunbk 6= bl, dann sind nach Voraussetzung |bk|, |bl|, |bk − bl|, |bk + bl| echt größer 0und echt kleiner 2u, also ist insbesondere (3.27) erfüllt.

Es bleibt der Fall bk = bl, der den Fall k = l beinhaltet. Hier gilt |bk|, |bl| sindecht größer 0 und kleiner 2u und für |bk + bl| gilt 0 < |bk + bl| ≤ 2u. Diese Fällesind also ebenso kein Problem. Es ist aber bk − bl = bl − bk = 0, und somit ist

68

Page 73: Zeit-Frequenz-Analyse mit Methoden der Gabor AnalysisZeit-Frequenz-Analyse mit Methoden der Gabor Analysis DIPLOMARBEIT Zur Erlangung des Grades eines Diplom-Mathematikers Justus-Liebig

3.2 Gabor-Frames

exp (±2π(bk − bl)it) = 1 unabhängig von t. Das heißt, (3.26) wird zu

0∑j=−4u+1

g′(t− j

4u

)= 2πi

∑k∈I

∑l∈Ibl=bk

4u (c−k,l − ck,−l)

= 2πi∑k∈I

∑l∈Ibl=bk

4u (akalbk exp ((cl − ck)i) /2− akalbk exp ((ck − cl)i) /2)

= 0,

da c−k,l = akalbk exp ((cl − ck)i) /2 = cl,−k, falls bk = bl. Also ist die Ableitung von(3.25) konstant 0 und die Summe selbst somit konstant.

Es ist leicht zu sehen, dass die gleiche Argumentation für t ∈ [−12 + c

4u ,−12 + c+1

4u )für ein c ∈ Z gilt, wenn wir t in den obigen Gleichung durch t = t − c

4u ersetzen.Also ist

1b

0∑j=−4u+1

g2(t− j

4u

)= A,

unabhängig von t ∈ R. Da g nach Voraussetzung nicht die Nullfunktion ist, folgtA > 0, also bildet (g, a, b) ein Gabor-Tight-Frame. Nach (3.8) gilt insbesondereA = 4u

b‖g‖2. Das (gs, asl ,

bs) ebenfalls ein Tight Frame ist, folgt aus den Lemmata

3.2.2 und 3.2.3.

Der Fall der stückweise konstanten Funktion, also leerer Indexmenge, gilt offen-sichtlich sogar für beliebiges a mit a−1 ∈ N

Somit haben wir eine ganze Klasse von Funktionen gefunden, für die Tight Fra-mes konstruiert werden können. Diese Konstruktion hat jedoch den Nachteil, dassdie minimale Redundanz mit der Komplexität der Fensterkonstruktion wächst, ge-nauer ist für g wie in 3.2.7 eine Redundanz von R = (ab)−1 = 4u nötig. Dafür er-fasst der Satz unter Anderem die bekannten Hamming-, von-Hann- und Blackman-Fenster. Ein Spezialfall, den der obige Satz dagegen nicht erfasst, ist die einfacheFunktion

cos(πt)χ[−1/2,1/2),

Die mit den Frame-Parametern a = 12 , b ≤ 1 ein Tight Frame bildet.

Die hohe minimale Redundanz lässt sich durch eine Konstruktion von Daube-chies, Grossmann und Meyer aus [9] ausgleichen. L ∈ R+ bezeichnet dabei wiederdie gewünschte Trägerlänge des konstruierten Fensters. Wir nehmen eine stetigeFunktion mit

h(t) = 0, für t ≤ 0 und h(t) = 1, für t ≥ 1. (3.28)

69

Page 74: Zeit-Frequenz-Analyse mit Methoden der Gabor AnalysisZeit-Frequenz-Analyse mit Methoden der Gabor Analysis DIPLOMARBEIT Zur Erlangung des Grades eines Diplom-Mathematikers Justus-Liebig

3 GABOR-FRAMES UND GABOR-TIGHT-FRAMES

Definieren wir nun g durch

g(t) =

0, t ∈ (−∞,−L/2) ∪ (L/2,∞)h(t+ L/2)1/2, t ∈ [−L/2,−L/2 + 1](1− h(L/2− t))1/2, t ∈ [L/2− 1, L/2]1, t ∈ (−L/2 + 1, L/2− 1),

(3.29)

mit 2 ≤ L ∈ R dann bildet (g, a, b) mit a = L − 1, b = L ein Tight Frame. DieSätze 3.2.2 und 3.2.3 sind anwendbar. Wählen wir nun ein stetiges g wie in 3.2.7und (g, a, b) ein Tight Frame mit Frame Schranke A und Redundanz R = 4u/b unddefinieren

h(t) = 1Ab

4u−1∑l=0

g2 (t− la+ (2u− 1)a) ,

dann hat h kompakten Träger in [−(4u− 1)a, 1] und g definiert durch

g(t) =

0, t ∈ (−∞,−L/2) ∪ (L/2,∞)h ((4u− 1) a (t+ L/2− 1))1/2 , t ∈ [−L/2,−L/2 + 1]h ((4u− 1) a (t− L/2 + 1) + a)1/2 , t ∈ [L/2− 1, L/2]1, t ∈ (−L/2 + 1, L/2− 1) ,

(3.30)

bildet auf dem Gitter aZ × bZ mit a = L − 1 und b = 1/L ein Tight Frame mitRedundanz R = L/(L− 1) nach 3.2.5. Dabei gilt

h ((4u− 1) a (t− L/2 + 1) + a)1/2 = (1− h ((4u− 1) a (L/2− 1− t)))1/2 .

Wir können nun auch die Redundanz des ausgewählten Frames beliebig anpas-sen. Zumindest das Konvergenzverhalten des Fensterspektrums bleibt dabei, wiewir in den Abbildungen 14 und 15 sehen können, unverändert. Die hier beschrie-bene Konstruktion ist zwar auch für unstetige Fenster möglich, führt dann jedochzusätzliche Unstetigkeiten ein, was in der Regel unerwünschtes Verhalten im Fre-quenzbereich mit sich bringt.

3.3 Diskrete Gabor-Tight-FramesTight Frames sind handhabbarer als allgemeine Frames. Insbesondere für numeri-sche Anwendungen kann es sinnvoll sein, die zur aufwendigen Berechnung des dua-len Frames nötige, zusätzliche Rechenzeit einzusparen. Für effiziente Zeit-Frequenz-Analyse und Signalverarbeitung mit DGT und DGE, sind Tight Frames daher vonbesonderer Bedeutung. Somit macht es Sinn, die Resultate des vorigen Abschnittsauf Gabor-Frames über `N zu übertragen, sofern möglich.

Dazu benötigen wir Skalierungs- und Redundanzsätze analog zu 3.2.2 und 3.2.3.Wir müssen außerdem das hinreichende Kriterium 3.2.5 auf den diskreten Fall über-tragen. Wir verwenden wieder die Bezeichnungen a0 = N/a, b0 = N/b.

70

Page 75: Zeit-Frequenz-Analyse mit Methoden der Gabor AnalysisZeit-Frequenz-Analyse mit Methoden der Gabor Analysis DIPLOMARBEIT Zur Erlangung des Grades eines Diplom-Mathematikers Justus-Liebig

3.3 Diskrete Gabor-Tight-Frames

Abbildung 14: (oben): von-Hann-Fenster und sein logarithmiertes Spektrum. (unten):„Verlängertes von-Hann-Fenster“ und sein logarithmiertes Spektrum.

Abbildung 15: (oben): Blackman-Fenster und sein logarithmiertes Spektrum. (unten):„Verlängertes Blackman-Fenster“ und sein logarithmiertes Spektrum.

71

Page 76: Zeit-Frequenz-Analyse mit Methoden der Gabor AnalysisZeit-Frequenz-Analyse mit Methoden der Gabor Analysis DIPLOMARBEIT Zur Erlangung des Grades eines Diplom-Mathematikers Justus-Liebig

3 GABOR-FRAMES UND GABOR-TIGHT-FRAMES

Eine Familie {gm,k}m∈{0,...,a0−1},k∈{0,...,b0−1} aus `N ist ein Frame (über `N), wenngilt:

A‖f‖22 ≤

a0−1∑m=0

b0−1∑k=0|〈f, gm,k〉|2 ≤ B‖f‖2

2. (3.31)

Dann gilt außerdem A ≤ Nab‖g‖2

2 ≤ B, was leicht zu sehen ist, indem wir für f in(3.31) die konstante Einserfolge, definiert durch

1[n] = 1, für alle n ∈ {0, . . . , N − 1},

einsetzen.

Es gilt das folgende hinreichende Kriterium für Gabor-Tight-Frames über `N .

Satz 3.3.1 (Diskrete Gabor-Tight-Frames).Sei [g, a, b] ein Gabor-Tripel mit supp (g) ⊆ [−b0/2, b0/2− 1] und es gilt

b0

a0−1∑m=0|g[n−ma]|2 = A > 0, für alle n ∈ {0, . . . , N − 1}, (3.32)

dann bildet [g, a, b] ein Tight Frame von `N mit Frame Schranke A.

Beweis:Mit der gleichen Argumentation wie im kontinuierlichen Fall 3.2.5 erhaltenwir

N−1∑n=0|g[n−ma]|2|f [n]|2 = 1

b0

b0−1∑k=0|〈f, gm,k〉|2,

wobei wir die Folgen {exp(2πik · /b0)}k∈{0,...,b0−1} als Orthogonalsystem des Raums`2([ma− b0

2 ,ma+ b02 − 1]) aufgefasst und die allgemeine parsevalsche Formel ange-

wandt haben. Wir summieren über m und erhaltena0−1∑m=0

b0−1∑k=0|〈f, gm,k〉|2 = b0

a0−1∑m=0

N−1∑n=0|g[n−ma]|2|f [n]|2

= b0

N−1∑n=0

(|f [n]|2

a0−1∑m=0|g[n−ma]|2

)

= AN−1∑n=0|f [n]|2 = A‖f‖2.

Also bildet [g, a, b] ein Gabor-Tight-Frame von `N mit Frame Schranke A.

Nun wollen wir Behauptungen analog zu 3.2.2 und 3.2.3 für Frames über `Nnachweisen. Das Redundanzlemma ist dabei sehr leicht auf den diskreten Fall zu

72

Page 77: Zeit-Frequenz-Analyse mit Methoden der Gabor AnalysisZeit-Frequenz-Analyse mit Methoden der Gabor Analysis DIPLOMARBEIT Zur Erlangung des Grades eines Diplom-Mathematikers Justus-Liebig

3.3 Diskrete Gabor-Tight-Frames

übertragen, während wir zum Nachweis eines Skalierungssatzes einige zusätzlicheAnnahmen machen müssen. Das ist eine Konsequenz der Tatsache, dass eine Ums-kalierung einer Folge, unter der Annahme, die Folge ist Abtastung einer kontinuier-lichen Funktion, gleichbedeutend mit einer Veränderung der Abtastrate ist. Dafürbekommen wir ein zusätzliches Resultat für die Diskretisierung kontinuierlicher Fra-mes. Wir erhalten die folgenden Aussagen.

Satz 3.3.2 (Diskretisierung von Frames über L2(R) und Fensterskalierung).Wähle N ∈ 2N. Sei (g, a, b/N) mit Träger in [−N/2, N/2 − 1] ein Gabor-Tight-Frame über L2(R) mit Frame Schranke A, dass 3.2.5 erfüllt. Sind a, b Teiler vonN , dann ist [g, a, b], mit g definiert durch

g[n] =∑l∈Z

g(n+ lN) =g(n), für n ∈ {0, . . . , N/2− 1}g(n−N), für n ∈ {N/2, . . . , N − 1},

(3.33)

ein diskretes Gabor-Tight-Frame mit Frame Schranke A = Nab‖g‖2

2. Für 1 ≥ s ∈ Q,so dass Ns ∈ 2N und sa, b/s Teiler von N sind, und gs definiert durch

gs[n] = s−1/2

g(n/s), für n ∈ {0, . . . , Ns/2− 1}g(n/s−N), für n ∈ {N −Ns/2, . . . , N − 1}0, für n ∈ {Ns/2, . . . , N −Ns/2− 1},

bildet [gs, sa, b/s] ebenfalls ein diskretes Gabor-Tight-Frame mit der Frame Schran-ken A.

Beweis: Wir nehmen an, dass 3.2.5 für (g, a, b/N) erfüllt ist, und zeigen, dass[g, a, b] den Bedingungen aus 3.3.1 genügt.Bezeichnen wir die N -Periodisierung von g mit g0, dann gilt mit b0 = N/b

b0

a0−1∑m=0|g[n−ma]|2 = N

b

N/a−1∑m=0

|g0(n−ma)|2 = A (3.34)

für alle n ∈ {0, . . . , N−1}. Also ist [g, a, b] ein Tight Frame nach 3.3.1 und es bleibtzu zeigen, dass ‖g‖2

2 = ‖g‖2 ist. Wir haben

‖g‖22 =

N/2−1∑n=−N/2

|g(n)|2

=a−1∑l=0

N/a−1∑m=0

|g0(l −ma)|2

= ab

NA = ab

N

N

ab‖g‖2 = ‖g‖2,

73

Page 78: Zeit-Frequenz-Analyse mit Methoden der Gabor AnalysisZeit-Frequenz-Analyse mit Methoden der Gabor Analysis DIPLOMARBEIT Zur Erlangung des Grades eines Diplom-Mathematikers Justus-Liebig

3 GABOR-FRAMES UND GABOR-TIGHT-FRAMES

wobei wir das Redundanzlemma 3.2.3 und die notwendige Bedingung (3.8) benutzthaben. Mit dem kontinuierlichen Skalierungssatz und der gleichen Argumentationfolgt die Behauptung für [gs, as, bs ].

Der Beweis des folgenden Redundanzlemmas ist vollständig analog zum L2(R)-Fall.

Lemma 3.3.3 (Erhöhung der Redundanz).Sei [g, a, b] ein diskretes Gabor-Frame-Tripel mit Frame Schranken A,B und l ∈ N,so dass a

lTeiler von N ist. Dann ist [g, a

l, b] ein Gabor-Frame-Tripel mit Frame

Schranken A ≥ l · A und B ≤ l ·B.

Nun können wir Trigonometric Frames wie in 3.2.7 über `N definieren. Dass sieTight-Frames bilden, lässt sich mit Hilfe dieser Resultate leicht zeigen.

Satz 3.3.4 (Diskrete Tight Trigonometric-Frames).Sei g0 ∈ L2(R) ein trigonometrisches Polynom der folgenden Form:

g0(t) = d+∑l∈I

al cos(2πblt+ cl), (3.35)

mit einer endlichen Indexmenge I, und Konstanten al, cl, d ∈ R, bl ∈ N. Sei u ≥ bkfür alle k ∈ I oder eine beliebige natürliche Zahl, falls I = ∅ und g ∈ L2(R) definiertdurch

g = g0χ[−1/2,1/2). (3.36)Für `N mit N ∈ 4uN, definieren wir g ∈ `N durch

g[n] :=g(

nN

), für n ∈ {0, . . . , N/2− 1}g( n

N− 1), für n ∈ {N/2, . . . , N − 1}.

(3.37)

Dann ist [g, a, b] mit a = N4u und b = 1 ein Gabor-Frame-Tripel mit Frame Schranke

A = 4u‖g‖22.

Für 1 ≥ s ∈ Q, l ∈ N und b ≤ bs

= s−1, so dass asl, b ∈ N Teiler von N sind, sei

gs ∈ `N definiert durch

gs[n] = s−1/2

g( n

sN), für n ∈ {0, . . . , Ns/2− 1}

g( nsN− 1), für n ∈ {N −Ns/2, . . . , N − 1}

0, für n ∈ {Ns/2, . . . , N −Ns/2− 1}.(3.38)

Dann bildet das Tripel [gs, asl , b], ein Gabor-Tight-Frame. Falls b = s−1 ist, hat[gs, asl , s

−1] die Frame Schranke Al = 4ul‖g‖22.

74

Page 79: Zeit-Frequenz-Analyse mit Methoden der Gabor AnalysisZeit-Frequenz-Analyse mit Methoden der Gabor Analysis DIPLOMARBEIT Zur Erlangung des Grades eines Diplom-Mathematikers Justus-Liebig

3.3 Diskrete Gabor-Tight-Frames

Beweis: Nach Satz 3.2.7 über Tight Trigonometric Frames bildet (g, 14u , 1) ein Tight

Frame mit Frame Schranke A = 4u‖g‖2. Wenden wir das Skalierungslemma 3.2.2an, erhalten wir, dass auch (g( ·

N), N4u ,

1N

) ein Tight Frame bildet, mit Frame Schran-ke A = 4uN‖g‖2.

Auf dieses Frame können wir den Diskretisierungs- und Skalierungssatz 3.3.2anwenden, um zu zeigen, dass [g, N4u , 1] ein Tight Frame ist, ebenso wie [g, sN4u ,

1s]

für 1 ≥ s ∈ Q, so dass asl, b ∈ N Teiler von N sind. Man beachte dabei, dass

asl

= sN4ul ∈ N auch sN ∈ 2N impliziert. Das Redundanzlemma 3.3.3 liefert dann die

Behauptung für [gs, asl , s−1]. Dass b < s−1 die Bedingungen des Satzes über diskrete

Gabor-Tight-Frames erhält ist leicht zu sehen.

Wir möchten noch einmal betonen, dass N passend gewählt werden kann, nach-dem das Gabor-Tripel ausgewählt wurde. Die Einschränkung auf Signale der LängeN ∈ 2N in 3.3.2 ist also keine echte Einschränkung, wenn wir Verlängerung desSignals auf passendes N , zum Beispiel durch zero-padding zulassen.

Die Konstruktion von Daubechies, Grossmann und Meyer aus [9] und ihre An-wendung auf die Trigonometric Frames lässt sich mit 3.3.2 ebenfalls auf Folgenüber `N übertragen. Insgesamt haben wir eine grosse Klasse von Fensterfunktionen,geeignet für numerische Anwendungen, zu denen wir problemlos Tight Frames kon-struieren können. Dabei können wir beliebig niedrige Redundanz größer 1 erreichen,bezahlen dafür jedoch mit einer Verschlechterung der Zeitauflösung.

75

Page 80: Zeit-Frequenz-Analyse mit Methoden der Gabor AnalysisZeit-Frequenz-Analyse mit Methoden der Gabor Analysis DIPLOMARBEIT Zur Erlangung des Grades eines Diplom-Mathematikers Justus-Liebig

4 GABOR UND WAVELETS

4 Gabor und Wavelets - Methoden der Zeit-Fre-quenz-Analyse

Die Wavelettransformation ist ein weiteres beliebtes Verfahren, zur Zeit-Frequenz-Analyse (streng genommen handelt es sich jedoch um Zeit-Skalen-Analyse). Sie ge-hört zur gleichen Familie linearer, zeit-invarianter Integraltransformationen, wie dieShort-Time Fourier Transform und ist daher auch mit der Gabortransformation engverwandt. Wir möchten an dieser Stelle einige Gemeinsamkeiten und Unterschie-de dieser beiden Transformationen herausstellen und ihr Verhalten anhand einigereinfacher Signale studieren. Die hier erstellte Analyse erhebt nicht den Anspruch,vollständig oder mathematisch rigoros zu sein. Sie dient nur dazu einen ersten Ein-blick zu gewinnen und Ansätze zu liefern, mit denen für konkrete Anwendungen diegeeignetere Methode ausgewählt werden kann.

Lange Zeit führte die Gabortransformation neben der ungleich populäreren Wa-velettransformation ein Schattendasein. Nicht zuletzt, da sie durch Fehlen orthonor-maler Basen mit guter Zeit-Frequenz-Lokalisation nicht effizient zu berechnen unddamit für numerische Anwendungen ungeeignet war. Als Mitte der 1990er Jahredie Struktur dualer Gabor-Frames genauer untersucht und in diesem Zuge schnelleAlgorithmen zu ihrer Berechnung gefunden wurden, war die Anwendung der Wa-velettransformation bereits so etabliert, dass weiterhin nur recht geringes Interessean Gabor-basierten Verfahren bestand.

In den letzten 20 Jahren hat sich jedoch Einiges getan und wir wollen hierauch zeigen, dass beide Methoden mittlerweile vergleichbare Möglichkeiten bieten,mit unterschiedlichen Vor- und Nachteilen, die je nach Problemstellung abgewägtwerden sollten.

Wir wiederholen kurz die wichtigsten Grundlagen und Eigenschaften der Wave-lettransformation, für weitere Details sei jedoch auf die Bücher von Daubechies [8]und Mallat [33] verwiesen. Diese Grundlagen liefern uns bereits einige Erkenntnissebezüglich der Verbindungen zwischen Gabortransformation und Wavelettransfor-mation.

Dann werden wir einige einfache Signale mit beiden Methoden analysieren, unterAnderem betrachten wir transponierte Obertonspektren unterschiedlicher Instru-mente, für einzeln angespielte Noten, einen Tonwechsel und einen Akkord. Wir ver-wenden dabei die diskrete Gabortransformation mit von-Hann Fensterfunktion unddie diskretisierte Wavelettransformation mit Gabor-Wavelets, die durch Modulationeiner Fensterfunktion gebildet werden. Das Zeit-Frequenz-Gitter der Gabortransfor-mation wird stets so gewählt, dass das zugehörige Gabor-Tripel ein Tight-Framebildet.

Zu Erstellung der Waveletanalysen wurde der Algorithmus von Alexander Kleinverwendet, den er freundlicherweise für diese Experimente zur Verfügung gestellthat. Die zugehörige Dokumentation wird in seiner Dissertation [29] zu finden sein.

76

Page 81: Zeit-Frequenz-Analyse mit Methoden der Gabor AnalysisZeit-Frequenz-Analyse mit Methoden der Gabor Analysis DIPLOMARBEIT Zur Erlangung des Grades eines Diplom-Mathematikers Justus-Liebig

4.1 Die Wavelettransformation

4.1 Die WavelettransformationWie die Short-Time Fourier Transform ist die Wavelettransformation einer Funk-tion ihre Zerlegung in innere Produkte bezüglich einer Familie von Atomen, diedurch einfache Operationen aus einer einzigen Basisfunktion entstehen. Wir wissen,dass die Basisfunktion der STFT eine, idealerweise in Zeit und Frequenz geeignetlokalisierte, Fensterfunktion ist. Die Zeit-Frequenz-Atome entstehen dabei durchTranslation und Modulation. Die Wavelettransformation verwendet ein sogenann-tes Mother-Wavelet und wir erhalten die Atome als Translationen und Skalierungendieses Wavelets.

Etwas formaler wählen wir 0 6= ψ ∈ L2(R), üblicherweise so, dass∫Rψ(t) dt = 0

und die sogenannte Zulässigkeitsbedingung

∫ ∞0

|ψ(ξ)|2ξ

dξ <∞ (4.1)

erfüllt ist, durch die Rekonstruierbarkeit gewährleistet wird. Dann ist die zugeord-nete (kontinuierliche) Famile von Wavelet-Atomen definiert durch

{ψm,s}m∈R,s∈R+ ,

mitψm,s(t) = s−1/2ψ

(t−ms

). (4.2)

Für eine solche Familie ist die Wavelettransformation (WT) von f ∈ L2(R) bezüg-lich ψ definiert als

Wψf(m, s) = 〈f, ψm,s〉 = s−1/2∫

Rf(t)ψ

(t−ms

)dt. (4.3)

Wavelets haben, daher auch ihr Name, in der Regel eine wellenartige Form,die einer abgeschnittenen oder gewichteten harmonischen Schwingung nicht unähn-lich ist. Wie bei solchen Schwingungen bedeutet eine Skalierung eine Änderungder Schwingungsfrequenz. Da die inneren Produkte 〈f, ψm,s〉 in gewissem Sinne dieÄhnlichkeit von f und ψm,s messen, „erkennt“ das Wavelet daher, abhängig von dergewählten Skala s, unterschiedliche Frequenzen.

Außerdem wissen wir aus Kapitel 1.1, dass eine Umskalierung auch eine ent-sprechende Veränderung der effektiven Dauer und Bandbreite bewirkt. Hat alsoψ = ψ0,1 eine Heisenberg-Box, um (0, c) in der Zeit-Frequenz-Ebene zentriert, mitden Seitenlängen a, b, dann ist die Heisenberg-Box von ψm,s zentriert um (m, c/s)und hat die Seitenlängen as und b/s. Im Gegensatz zur Gabortransformation habenwir also eine variable Zeit-Frequenzauflösung (Abbildung 2).

77

Page 82: Zeit-Frequenz-Analyse mit Methoden der Gabor AnalysisZeit-Frequenz-Analyse mit Methoden der Gabor Analysis DIPLOMARBEIT Zur Erlangung des Grades eines Diplom-Mathematikers Justus-Liebig

4 GABOR UND WAVELETS

Abbildung 16: Haar-Wavelet (l) und Realteil eines komplexen Morlet-Wavelets (r) mitParameter ω = 2.

Abbildung 17: Real- (l) und Imaginärteil (r) des komplexen Morlet-Wavelets mit Wave-letparameter ω = 7.

Abbildung 18: Real- (l) und Imaginärteil (r) des von-Hann-Wavelets mit Parameter ω = 7.

78

Page 83: Zeit-Frequenz-Analyse mit Methoden der Gabor AnalysisZeit-Frequenz-Analyse mit Methoden der Gabor Analysis DIPLOMARBEIT Zur Erlangung des Grades eines Diplom-Mathematikers Justus-Liebig

4.1 Die Wavelettransformation

Eine diskretisierte kontinuierliche Wavelettransformation kann analog zu (1.14)über eine FFT-Faltung berechnet werden, denn es gilt:

Wψf(m, s) =∫

Rf(t)ψs(t−m) dt

= (f ∗ ψ∗s) (m)

=(f · ψ∗s

)∨(m), (4.4)

wobei ψs = ψ0,s ist. Durch die Skalierung stellt sich jedoch auch die Frage, wie dis-kretisiert werden soll. Wählen wir, analog zur Gabortransformation, Wψf(ma, sb)mit a, b ∈ R konstant und m, s ∈ Z variabel, dann erhalten wir konstanten Ab-stand zwischen unterschiedlichen Skalen und von der Skala unabhängigen gleich-bleibenden Abstand im Zeitbereich. Durch die skalenabhängige Variation der Zeit-Frequenzauflösung erhalten wir eine sehr ungleichmäßige Überdeckung der Zeit-Frequenzebene. Daher ist es sinnvoll, das Sampling-Schema an die Variation derHeisenberg-Boxen anzupassen. Intuitiv sind zwei Varianten sinnvoll:

Eine Abtastung der Form Wψf(mabs, bs) nutzt zwar die Struktur der Familie{ψm,s} optimal aus und erscheint am natürlichsten, da die Abtastdistanzen derSkalierung des Wavelets, also ihrer Zeit-Frequenzauflösung angepasst werden. Sielässt sich aber nicht ohne weiteres als Matrix speichern und ist entsprechend schwerzu handhaben. Die (klassische, orthogonale) diskrete Wavelettransformation ist vondieser Form.

Der hier verwendete Algorithmus für die diskretisierte Wavelettransformationvon Klein [29] wählt Wψf(ma, bs), so dass die Menge der Abtastwerte pro Ska-la gleich bleibt und in jeder „Oktave“ gleich viele Frequenzen abgetastet werden.Wählen wir hier jedoch a nicht so klein wie möglich, dann ist es möglich, in hohenSkalen Information zu verlieren. Die maximale Zeit-Redundanz in niedrigen Skalenbedeutet aber Berechnungs- und Speicherkomplexitäten, die weit davon entferntsind, optimal zu sein.

Gabor-Wavelets. Als Gabor-Wavelet im engeren Sinne werden Wavelets be-zeichnet die aus einem Mother-Wavelet der Form

ψ(t) = g(t) exp(iωt), (4.5)

mit einer Gaussfunktion g entstehen. Das Wavelet

ψM,ω(t) =(exp(−2πiωt)− exp(−πω2)

)exp(−πt2) (4.6)

ist auch als Morlet-Wavelet bekannt.Wir wollen an dieser Stelle, aufgrund ihrer engen Verwandschaft mit der Gabor-

transformation, Wavelets der Form (4.5) mit beliebiger Fensterfunktion als Gabor-Wavelets bezeichnen. Wie bei der Gabortransformation wird sie jedoch in der Regelreell und symmetrisch gewählt.

79

Page 84: Zeit-Frequenz-Analyse mit Methoden der Gabor AnalysisZeit-Frequenz-Analyse mit Methoden der Gabor Analysis DIPLOMARBEIT Zur Erlangung des Grades eines Diplom-Mathematikers Justus-Liebig

4 GABOR UND WAVELETS

Abbildung 19: Wavelettransformierte des Testsignals in 4.(l) bezüglich des von-Hann-Wavelets mit Parameter ω = 5 (l) und ω = 80 (r). Wir sehen, dass zu niedrig gewählteParameter allgemein schlechte Frequenzauflösung liefern, sehr große Parameter dagegenschlechte Zeitauflösung schon für recht hohe Frequenzen.

Insbesondere definieren wir das von-Hann-Wavelet mit Parameter 1 ≤ ω ∈ Rals

ψvH,ω(t) = (12 + 12 cos(2πt))χ[−1/2,1/2) exp(2πiωt). (4.7)

Die Fouriertransformierte des von-Hann-Wavelets ist

ψvH,ω(ξ) =(sinc(·) + 1

2 (sinc(· − 1) + sinc(·+ 1)))

(ξ − ω). (4.8)

Wie auch das Morlet-Wavelet, ist das von-Hann-Wavelet näherungsweise analytisch,falls ω ausreichend groß gewählt wird.

Die Wahl des von-Hann-Wavelets erfordert sicherlich eine Begründung, dochnur so schaffen wir gleiche Voraussetzungen für die Zeit-Frequenz-Konzentrationder Basisfunktionen und gleichzeitig gewährleisten wir, die Gabortransformationbezüglich eines Tight Frames konstruieren zu können. Für ω ∈ N ∩ [2,∞) ist au-ßerdem ψvH,ω(0) = 0 und wir erhalten, auch ohne Korrekturterm, ein zulässigesWavelet. Gauss-Fenster und Morlet-Wavelet stehen im gleichen Verhältnis zueinan-der, wie von-Hann-Fenster und -Wavelet. Diese verfügen zwar theoretisch über einebessere kombinierte Zeit- und Frequenzlokalisation, die visuellen Darstellunen desSpektrogramms einer Funktion bezüglich vergleichbar Zeit-konzentrierter Gauss-beziehungsweise von-Hann-Fenster sind jedoch kaum unterscheidbar und es ist zuerwarten, dass dies für Morlet- und von-Hann-Wavelets ebenfalls gilt. Dies hat sichin unseren Experimenten bestätigt, vergleiche Abbildung 36. Hinzu kommt, dassvon-Hann-Fenster beziehungsweise -Wavelet, wegen ihres kompakten Trägers, bes-ser für numerische Anwendungen geeignet sind.

80

Page 85: Zeit-Frequenz-Analyse mit Methoden der Gabor AnalysisZeit-Frequenz-Analyse mit Methoden der Gabor Analysis DIPLOMARBEIT Zur Erlangung des Grades eines Diplom-Mathematikers Justus-Liebig

4.1 Die Wavelettransformation

Variable Zeit-Frequenz-Auflösung. Wir haben gesehen, dass die Wavelet-transformation im Gegensatz zur Gabortransformation über eine variable, von derSkala abhängige Zeit-Frequenz-Auflösung verfügt. Sie wird oft als die größte Stärkevon Wavelets gegenüber der Short-Time Fourier Transform, also auch der Gabor-transformation, aufgefasst. Konkret bedeutet das, die Wavelettransformation bietetin niedrigen Skalen eine genauere Frequenzauflösung, auf Kosten der Zeitauflösung,für hohe Skalen umgekehrt. Dieses Verhalten ähnelt, bezogen auf Tonsignale, derFunktionsweise des menschlichen Gehörs, dessen Zeitschärfe mit steigender Fre-quenz zunimmt, das dann jedoch nahe beieinander liegende Frequenzen zunehmendschlechter unterscheiden kann.

Die Auflösung der Gabortransformation dagegen ist über die gesamte Zeit-Frequenz-Ebene konstant und durch die Wahl der Fensterfunktion fixiert. Diesscheint zunächst ein Nachteil zu sein, es ist jedoch schwierig, vorab zu bestim-men, was für ein konkretes, vorgegebenes Signal „schlechte“ Zeit- oder Frequenz-auflösung bedeutet und ob die konstante Auflösung bei der Analyse anhand desSpektrogramms tatsächlich negativ ins Gewicht fällt.

Nehmen wir zum Beispiel die Aufnahme eines klassischen Musikstücks. Wir se-hen schon an der zugehörigen Partitur, dass ein solches Stück an fast allen Stellenein lokal näherungsweise konstantes Spektrum haben sollte. Notenwechsel gleichenentweder einem plötzlichen Sprung von einer Frequenz auf eine Andere, oder ei-nem kontinuierlichen und stetigen Übergang. Beide sind schon bei relativ niedrigerZeitauflösung recht gut zu erkennen. Deutlich mehr als zehn Notenwechsel pro Se-kunde sind dabei eher selten, virtuose Solo-Passagen ausgenommen, die bei Bedarfauch getrennt betrachtet werden können. Sehr viel genauer, als in 1/10-Sekundenaufzulösen, macht daher nur selten Sinn. Abhängig von der Instrumentation desStücks kann außerdem der relevante Frequenzbereich eingeschränkt werden, unddie Wahl der Fensterfunktion noch individueller an das Stück angepasst werden.Derartige Annahmen lassen sich selbstverständlich auch für andere Signalklassenmachen.

Die variable Auflösung hat jedoch auch Nachteile. Wir haben bereits festge-stellt, eine Diskretisierung der Wavelettransformation nutzt die Struktur ihrer Ato-me nicht optimal aus und ist so im niederfrequenten Bereich stark überrepräsentiert,in hohen Frequenzen unter Umständen sogar unvollständig, falls die Zeit-Abtastungvon Wφf nicht so dicht wie möglich gewählt wird. Oder sie ist umständlicher zuhandhaben, zu speichern und zu visualisieren. Für die konstante Auflösung derGabortransformation andererseits ist eine gleichmäßige Abtastung nicht nur dienatürliche Wahl, sie ist auch sehr einfach und durch einen FFT-Algorithmus mitniedrigem Berechnungsaufwand realisierbar. Wollen wir dennoch nicht auf varia-ble Zeit-Frequenz-Auflösung verzichten, gibt es zusätzlich Gabor-basierte Multi-Window-Methoden ([12],[14],[46],[47]), die jedoch höheren Berechnungsaufwand mitsich bringen.

Es ist außerdem etwas leichter, den Spalten der Gabortransformierten Vg,a,bfihre zugehörigen Frequenzen zuzuordnen, da sie sich aus der einfachen Formel Sk

b0

81

Page 86: Zeit-Frequenz-Analyse mit Methoden der Gabor AnalysisZeit-Frequenz-Analyse mit Methoden der Gabor Analysis DIPLOMARBEIT Zur Erlangung des Grades eines Diplom-Mathematikers Justus-Liebig

4 GABOR UND WAVELETS

ergeben, wobei S die Abtastrate des Signals, b0 = Nbdie Spaltenanzahl und k die

Spaltennummer ist, von 0 an indiziert. Für die Wavelettransformation ist diese Be-rechnung ein wenig aufwendiger.

Für numerische Anwendungen hat die Wavelettransformation einen weiterenentscheidenden Nachteil. Durch die Skalierung wächst der Träger des verwendetenWavelets mit fallender Skala exponentiell. Bei skalenunabhängiger Zeit-Abtastungvervielfacht sich die Komplexität der Transformation durch hinzufügen einer einzel-nen niedrigeren Skala. Viel gravierender wirkt sich der wachsende Träger jedoch aufEchtzeit-Anwendungen aus. Sollen etwa Daten anhand ihrer (eventuell modifizier-ten) Transformationskoeffizienten in Echtzeit an einen Empfänger gesandt und dortdas Signal schnellstmöglich rekonstruiert werden, dann ergeben sich Probleme: Fürdie Analyse und Synthese niedriger Frequenzen muss ein immer größerer Abschnittdes „zukünftigen Signals“ bekannt sein; anders gesagt können niedrige Frequenzenerst mit immer größerer Verzögerung in ihre Transformationskoeffizienten umge-wandelt, beziehungsweise rekonstruiert werden. Die Gabortransformation dagegenmuss stets nur um die Hälfte der Fensterlänge vorausschauen um die gesamte fürAnalyse und Synthese nötige Information zu erhalten. Gleiches gilt auch in umge-kehrter Richtung, jeder übertragene Koeffizientenvektor, der die Koeffizienten allerFrequenzbänder zu einem bestimmten Zeitpunkt enthält, kann vollständig verwor-fen werden, sobald er nicht mehr im Einzugsbereich des Synthesefensters liegt. Diesmacht die Gabortransformation für solche Anwendungen unter Umständen auchweniger speicherintensiv.

Im Allgemeinen entsteht der Eindruck, die Gabortransformation sei, zumindestfür Tight Frames, etwas leichter zu handhaben und verfüge über eine aus mathema-tischer Sicht elegantere Struktur, während Wavelets mathematisch etwas unhandli-cher wirken, aber eine natürlichere Darstellung liefern.

Es soll hier allerdings nicht der Eindruck entstehen, die „Natürlichkeit“ der Wa-veletdarstellung sei nur eine Art Trostpreis. Wollen wir Signale analysieren, diesowohl sehr schnell variierende, hochfrequente Anteile, als auch viele niederfrequen-te Komponenten enthalten, die sehr genau getrennt werden sollen, dann kann diesdurch eine einzige Wavelettransformation realisiert werden. Solche Signale sind nichtselten von Interesse. Um alle diese Kriterien mit der Gabortransformation zu erfül-len müssen Analysen mit unterschiedlichen Fenstern durchgeführt werden. Das istzwar möglich, unter Umständen aber deutlich aufwendiger als die Berechnung einereinzigen Wavelet-Analyse.

Gemeinsamkeiten und Unterschiede. Auf der mathematischen Seite derDinge können wir feststellen, dass Gabortransformation und diskretisierte Wav-lettransformation einer größeren Familie von Operatoren angehören, die sie beideverbindet. Sie sind Diskretisierungen einer Integraltransformation, die durch Bil-dung des inneren Produktes einer Funktion bezüglich einer Familie von Atomenentstehen. Diese sind beide invariant bezüglich Translation und ihre Atome in derZeit-Frequenz-Ebene konzentriert. Dadurch teilen sie viele mathematische Eigen-

82

Page 87: Zeit-Frequenz-Analyse mit Methoden der Gabor AnalysisZeit-Frequenz-Analyse mit Methoden der Gabor Analysis DIPLOMARBEIT Zur Erlangung des Grades eines Diplom-Mathematikers Justus-Liebig

4.2 Musikanalyse - Exkursion ins Reich der Töne

schaften, wie ihre Berechenbarkeit als Faltungsintegral, die Existenz von Framesund mehr.

Eine Familie von Gabor-Atomen entsteht durch Translation und Modulation,Wavelet-Atome durch Translation und Skalierung. Wird jedoch die Zeit-Frequenz-auflösung der Transformation verändert, findet eine Art Austausch von Operatio-nen statt und wir sehen, dass sie sogar noch enger verwandt sind. Die Auflösungder Gabortransformation verändern wir durch Skalierung der Fensterfunktion, dieAuflösung der Wavelettransformation kann durch Modulation des Mother-Waveletsvariiert werden.

Rekonstruierbarkeit der Wavelettransformation wird durch die Zulässigkeitsbe-dingung (4.1) gewährleistet. Eine solche Bedingung an die Fensterfunktion existiertfür die Short-Time Fourier Transform nicht. Auf der anderen Seite muss die Gab-ortransformation das Rieffelsche Dichtekriterium (2.5) erfüllen, eine derartige Ein-schränkung an die Dichte einer diskretisierten Wavelettransformation bezüglich be-liebiger Wavelets gibt es nicht.

Als große Schwäche der Gabortranformation wurde lange Zeit das Fehlen gut lo-kalisierter Orthogonalbasen, formalisiert durch den Satz von Balian-Low angesehen.Durch Tight Frames sind zwar die Koeffizienten der Gabor-Zerlegung genauso leichtzu finden, es muss aber stets eine gewisse Redundanz in Kauf genommen werden,um gute Lokalisation zu erhalten. Dagegen stellt es kein Problem dar, Orthonor-malbasen von Wavelets in L2(R) zu konstruieren, die hervorragende Lokalisationbieten. Für Anwendungen, bei denen die Minimierung der Speicherkomplexität ei-ne große Rolle spielt und andere Kriterien von weniger hoher Priorität sind, ist dieWavelettransformation daher das überlegene Verfahren. Eine kleine Veränderungin der Struktur der Gabortransformation, sogenannte Wilson-Basen ([5],[10],[21]),beheben diese Schwäche jedoch, allerdings auf Kosten der Berechenbarkeit als spal-tenweise Fouriertransformation.

Abschließend möchten wir, obwohl dieser Unterschied eher von theoretischemInteresse ist, nochmals auf die Fundamentale Identität (1.15) der Short-Time FourierTransform und Gabortransformation hinweisen. Ihre Existenz kann so verstandenwerden, dass die Gabortransformation auch im engeren mathematischen Sinne dieZeit- und Frequenz-Darstellungen des untersuchten Signals in sich vereint. Einesolche Identität fehlt für Wavelets. Streng genommen messen die Koeffizienten derWavelettransformation nur die lokale Ähnlichkeit des Signals mit den gewähltenWavelet-Atomen. In der Praxis können wir jedoch, bei geeignet gewähltem Mother-Wavelet ohne Bedenken von Frequenzerkennung sprechen.

4.2 Musikanalyse - Exkursion ins Reich der TöneWir haben uns nun ausführlich mit den Eigenschaften der Gabortransformation be-schäftigt, mit der Wavelettransformation ein weiteres Verfahren zur Zeit-Frequenz-Analyse kennengelernt und einige Schlüsse aus der ihnen zugrunde liegenden ma-

83

Page 88: Zeit-Frequenz-Analyse mit Methoden der Gabor AnalysisZeit-Frequenz-Analyse mit Methoden der Gabor Analysis DIPLOMARBEIT Zur Erlangung des Grades eines Diplom-Mathematikers Justus-Liebig

4 GABOR UND WAVELETS

thematischen Theorie gezogen. Es gilt nun, diese Schlüsse mit einigen Experimentenzu untermauern. Dazu haben wir, neben unserem Testsignal in Abbildung 4, einigeTonsignale ausgewählt und ihre Darstellung unter Gabor- und Wavelettransforma-tion betrachtet. Die Signale und unsere Ergebnisse beschreiben wir auf den folgen-den Seiten, Abbildungen 20,23,26.29 zeigen die Zeitdarstellung der ausgewähltenSignale, die zugehörigen Spektrogramme und Skalogramme sind in den Abbildun-gen 21,22,24,25,27,28,30 zu sehen. Die Signale sind außerdem in MATLAB/Octave-kompatiblen ASCII Format auf der beiliegenden CD zu finden.

Die Gabortransformation wurde mit von-Hann-Fenster durchgeführt. Als Fen-sterlänge L bezeichnen wir die Anzahl der Abtast innerhalb des Fensterträgers, beistetigen Fenstern inklusive der ersten Null links des Trägers. Falls nicht anders be-schrieben, haben wir L = 2100 gewählt. Weiterhin haben wir die Frameparamtera = 105, b = 7 verwendet, wir erhalten also für Signallängen N , die ganzzahli-ge Vielfache von 2100 · 7 = 14700 sind, ein Tight Frame. Wir zeigen |Vgf |1/2, dadiese Darstellung mehr Details des Signals zeigt als das Spektrogramm, sprechenaber dennoch vom Spektrogramm. Weiterhin zeigen wir aus Platzgründen meistnur einen Ausschnitt niedriger Frequenzen des Spektrogramms, in dem der relevan-te Teil des Signals zu sehen ist. Der Frequenzbereich des gesamten Spektrogrammsumfasst wie bei der Fouriertransformation die Frequenzen von 0 bis S/2, wobei Swieder die Abtastrate ist.

Für die Wavelettransformation haben wir das von-Hann-Wavelet und, soweitnicht anders erwähnt, den Parameter ω = 21 gewählt. Um zusätzlich die Feinheitdes Skalogramms zu verbessern haben wir die Anzahl der Skalen pro Oktave fixauf SPO = 25 gesetzt. Im Skalogramm stellen wir |Wψf |1/2 statt |Wψf |2 dar. EinVergleich der unterschiedlichen Darstellungen ist in Abbildung 34 zu sehen. DieDarstellung der Wavelettransformation ist recht „kompakt“ daher können wir stetsdas gesamte Skalogramm zeigen.

Die Werte für L und ω wurden experimentell angepasst, um ohne weitere Ver-änderungen für alle Testsignale gute Ergebnisse zu liefern.

Die Signale haben, bis auf jenes in Abbildung 29, eine Länge von N = 44100Abtastwerten und wurden mit 44, 1 kHz abgetastet, der Violinenton in Abbildung23.(l) mit 22, 05 kHz.

Falls nicht gesondert erwähnt, ist das Spektrogramm, beziehungsweise der ge-wählte Ausschnitt, in den Abbildungen links zu sehen, das Skalogramm rechts. DieBeschränkung im Spektrogramm auf einen Ausschnitt niedriger Frequenzen störtdas Ergebnis insofern nicht, da die signifikanten Unterschiede zwischen den Ver-fahren, angewandt auf die hier verwendeten Signale, vor allem im niederfrequentenBereich zu finden sind.

84

Page 89: Zeit-Frequenz-Analyse mit Methoden der Gabor AnalysisZeit-Frequenz-Analyse mit Methoden der Gabor Analysis DIPLOMARBEIT Zur Erlangung des Grades eines Diplom-Mathematikers Justus-Liebig

4.2 Musikanalyse - Exkursion ins Reich der Töne

4.2.1 Testsignale - Gruppe 1 - Obertonreihen

Diese erste Gruppe simpler Musiksignale besteht aus transponierten Versionen ein-zelner Töne und der zugehörigen Obertöne. Mit Flöte (Abbildung 20) und Violine(Abbildung 23.(l)) haben wir Instrumente mit sehr reichem Obertonspektrum aus-gewählt, so können wir sowohl in sehr niedrigen, als auch hohen Frequenzen sehen,ob diese gut getrennt, beziehungsweise im Frequenzbreich gut lokalisiert sind.

Dabei sehen wir, dass die Gabortransformation vor allem mit sehr niedrigenFrequenzen Schwierigkeiten hat. Dort kann sie unterschiedliche Frequenzen nicht inbefriedigender Weise trennen. Die Wavelettransformation profitiert hier von ihrerfeineren Frequenzauflösung und trennt die Obertöne im niederfrequenten Bereichgut, dort wirken die Frequenzen aber schwammig und nicht sauber lokalisiert. Be-sonders in Abbildung 24 ist zu erkennen, dass die Gabortransformation in der Regelmehr Obertöne zeigt und diese in hohen Frequenzen besser trennt.

4.2.2 Testsignale - Gruppe 2 - Der Akkord

Die Signale in 23.(r) und 26 sind Klavierakkorde, wiederum oktavweise transpo-niert. Die Obertonspektren sind beim Klavier weniger reich und fallen schneller ab,die Frequenzen liegen hier aber durch das gleichzeitige Anspielen mehrerer Tönedeutlich näher beisammen. Daher ähneln die Ansprüche bezüglich der Trennungunterschiedlicher Frequenzen schon eher einem tatsächlichen Musikstück.

Abbildung 25 bestätigt, was wir schon in Signalgruppe 1 feststellen konnten, eineFensterlänge von L = 2100 reicht nicht aus, um im niederfrequenten Bereich saubereFrequenztrennung zu erreichen, was der Wavelettransformation problemlos gelingt.Eine Oktave höher ist die Trennung der Grundtöne in der Gabortransformationnun fast ausreichend, in den Obertonblöcken sogar besser, als in der Wavelettrans-formation. In Abbildung 28 zieht die Gabortransformation dann auch im Bereichder Grundtöne gleich, die Wavelettransformation verwischt die Obertöe dagegenunabhängig von der tatsächlichen Tonhöhe gleich stark.

4.2.3 Testsignale - Gruppe 3 - Das Violinsolo

Für den abschließenden Härtetest ist unsere Wahl auf einen kurzen Ausschnitt ei-nes Violinkonzertes von Mendelssohn gefallen. Zuvor bestanden unsere Testsignaleletztlich nur aus einer Komponente, die zeitlich nur durch Abklingen variiert wurde.Nun folgt die Hauptstimme einer komplexen Melodielinie und eine Orchesterunter-malung wirkt als zusätzlicher Störfaktor. Auch um unsere Hypothese ausreichenderZeitauflösung der Gabortransformation für recht große Fensterlänge L zu bestäti-gen, haben wir eine sehr schnelle Passage ausgewählt. Die Orchesterstimmen sindstark im Hintergrund und nur für den aufmerksamen Zuhörer zu erkennen. Ist diegesuchte Signalkomponente stark überlagert oder nicht stark genug im Signal ver-treten, ist sie in beiden Transformation nur schwer auszumachen.

85

Page 90: Zeit-Frequenz-Analyse mit Methoden der Gabor AnalysisZeit-Frequenz-Analyse mit Methoden der Gabor Analysis DIPLOMARBEIT Zur Erlangung des Grades eines Diplom-Mathematikers Justus-Liebig

4 GABOR UND WAVELETS

Der Ausschnitt hat eine Länge von N = 126976, es wurden die FensterlängeL = 2048 und Parameter a = 128, b = 8 gewählt, wir erhalten also wiederum einTight Frame für das von-Hann-Fenster.

Sehen wir uns Spektrogramm und Skalogramm in Abbildung 30 an, dann ist dieGrundstimme der Violine in beiden Darstellungen mit wenig Mühe gut erkennbar.Wie wir schon in den vorigen Beispielen sehen konnten, stellt die Gabortransfor-mation Obertöne deutlicher dar. In dieser Abbildung müssen wir schon sehr genauhinschauen, aber in Abbildung 32.(r) sehen wir, dass die Zeitauflösung der Gab-ortransformation im relevanten Bereich nicht erkennbar schlechter ist, als jene derWavelettransformation.

Zusätzlich zu Abbildung 30 haben wir in Abbildung 31 das logarithmierte Spek-trogramm, beziehungsweise Skalogramm abgedruckt. Für die von uns ausgewähltenSignale scheint es jedoch eine Frage des Geschmacks zu sein, welche Darstellung bes-ser zu lesen ist, beziehungsweise mehr Information zeigt. Das übliche (quadratische)Spektrogramm scheint uns für Musikanalyse ungeeignet, da es zu viele relevante Si-gnalteile nicht zeigt. In Abbildung 32 sehen wir, wie einfach es ist, unterschiedlicheFrequenzanteile des untersuchten Signals vergrößert zu betrachten, indem wir nureinen Teil der Koeffizientenmatrix darstellen. Die gleichmäßige, hohe Redundanzder ausgeführten Gabortransformation ermöglicht dies. Links ist das gesamte Spek-trogramm zu sehen, rechts das Viertel der niedrigsten Frequenzen.

Variation der Zeit-Frequenz-Auflösung. Wir möchten noch einmal kurzauf den Akkord in den Signalen der Testgruppe 2 zurückkommen. In 23.(l) warzu sehen, dass die durchgeführte Gabortransformation im niederfrequenten Bereichkeine ausreichende Frequenzauflösung bietet, um die dort sehr nahe liegenden Tönezu differenzieren. Das gleiche Problem stellt sich für die Wavelettransformation be-züglich der Obertonblöcke in 23.(r). Wir haben für das dort betrachtete Signal dieParameter so verändert, dass in den Transformationen zumindest eine annehmba-re Frequenztrennung zu erkennen ist. Das Ergebnis ist in Abbildung 33 zu sehen.Die abgebildete Gabortransformation verwendet die Fensterlänge L = 6300, undFrame-Parameter a = 105, b = 7, bildet also wieder ein Tight Frame. Die Wav-lettransformation wurde mit Parameter ω = 70 durchgeführt.

In beiden Fällen liefern die veränderten Parameter für die übrigen Signale teil-weise deutlich schlechtere Ergebnisse, in jedem Fall ist mit einer zirka 3-fach schlech-teren Zeitauflösung zu rechnen.

4.3 RésuméWir haben schon ganz zu Beginn vorweggenommen, dass es für allgemeine Signalenicht möglich sein wird, einen „richtigen“Weg zu finden. Sowohl Gabortransformati-on, als auch Wavelettransformation haben ihre ganz eigenen Vor- und Nachteile, diein unterschiedlichen Signalklassen verschieden stark ins Gewicht fallen. Insgesamtkönnen wir sicherlich sagen, dass für die Gabortransformation eine unzufriedenstel-

86

Page 91: Zeit-Frequenz-Analyse mit Methoden der Gabor AnalysisZeit-Frequenz-Analyse mit Methoden der Gabor Analysis DIPLOMARBEIT Zur Erlangung des Grades eines Diplom-Mathematikers Justus-Liebig

4.3 Résumé

lende Zeitlokalisation in Kauf genommen werden muss, um in niedrigen Frequenzensehr nahe liegende Frequenzen zu trennen. Dies erreicht die Wavelettransformati-on ohne besondere Anpassung des Waveletparameters. Zumindest für Musiksignalescheint außerdem die steigende Zeitlokalisation des Waveletansatzes keinen Vorteilzu bieten, da die relevanten Anteile des Signals im mittleren Frequenzbereich lie-gen, in dem beide Transformationen ähnliche Lokalisationseigenschaften haben. ImGegenteil, die Wavelettransformation verwischt die Obertonreihen musikalischer Si-gnale zunehmend stark.

Zusätzlich hat die Gabortransformation eine etwas einfachere Struktur und ihreKoeffizientenmatrix ist intuitiv leichter zu deuten. Es ist außerdem anzunehmen,dass eine Gabortransformation dank der direkten Berechnung als abschnittsweiseFouriertransformation schneller zu berechnen ist, als die diskretisierte Wavelettrans-formation, die über den Umweg einer schnellen Faltung berechnet wird. Dabei neh-men wir selbstverständlich vergleichbare Redundanz an.

Für die Signale, die wir betrachtet haben, durften wir den Eindruck gewinnen,die Gabortransformation sei insgesamt die geeignetere Darstellung. Dieses Ergeb-nis darf jedoch nicht überbewertet werden und für andere Testsignale ist durchausder gegenteilige Schluss denkbar. Der Autor hofft aber, dass die hier gezeigten Re-sultate dabei helfen, weiteres Interesse für dieses spannende Gebiet angewandterMathematik und Signalverarbeitung zu wecken. Es ist zu erwarten, dass die GaborAnalysis in vielen Bereichen der Signalverarbeitung vergleichbare Ergebnisse liefernkann wie der Waveletansatz, vielleicht sogar Bessere als dieser.

87

Page 92: Zeit-Frequenz-Analyse mit Methoden der Gabor AnalysisZeit-Frequenz-Analyse mit Methoden der Gabor Analysis DIPLOMARBEIT Zur Erlangung des Grades eines Diplom-Mathematikers Justus-Liebig

4 GABOR UND WAVELETS

Abbildung 20: Flötenton, auf 6 Oktaven transponiert (l). Tonwechsel einer Flöte, auf 5Oktaven transponiert (r).

Abbildung 21: Spektrogramm (l) und Skalogramm (r) des Signals 20.(l). Der niedrigsteTon bereitet beiden Verfahren Probleme. In (l) ist die Frequenzauflösung zu niedrig, umdort die Obertöne sauber zu trennen, in (r) ist der Ton nicht sauber lokalisiert.

Abbildung 22: Spektrogramm (l) und Skalogramm (r) des Signals 20.(r). Hier sind weitge-hend die gleichen Beobachtungen zu machen, wie zuvor. Bei der Frequenzlokalisation imniederfrequenten Bereich hinterlässt die Wavelettransformation hier jedoch einen besserenEindruck.

88

Page 93: Zeit-Frequenz-Analyse mit Methoden der Gabor AnalysisZeit-Frequenz-Analyse mit Methoden der Gabor Analysis DIPLOMARBEIT Zur Erlangung des Grades eines Diplom-Mathematikers Justus-Liebig

4.3 Résumé

Abbildung 23: Violinenton mit Abtastrate 22, 05 kHz, auf 3 Oktaven transponiert (l) undKlavierakkord, transponiert damit der niedrigste voll angespielte Ton bei 55 Hz liegt (r).

Abbildung 24: Volles Spektrogramm (l) und Skalogramm (r) des Signals 23.(l). BeimÜbergang des 2. zum 3. Abschnitt ist die bessere Zeitauflösung der Wavelettransformationzu sehen, die Gabortransformation aber zeigt mehr sauber getrennte Obertöne.

Abbildung 25: Spektrogramm (l) und Skalogramm (r) des Signals 23.(r). Die höhere Fre-quenzauflösung der Wavelettransformation im niederfrequenten Bereich erlaubt hier einesaubere Trennung der Grundtöne. Obertöne werden von keiner Transformation gut er-kannt.

89

Page 94: Zeit-Frequenz-Analyse mit Methoden der Gabor AnalysisZeit-Frequenz-Analyse mit Methoden der Gabor Analysis DIPLOMARBEIT Zur Erlangung des Grades eines Diplom-Mathematikers Justus-Liebig

4 GABOR UND WAVELETS

Abbildung 26: Klavierakkord, transponiert damit der niedrigste, voll angespielte Ton bei110 Hz (l) liegt, beziehungsweise das Ursprungssignal mit diesem Ton bei 220 Hz (r).

Abbildung 27: Spektrogramm (l) und Skalogramm (r) des Signals 26.(l). Eine Oktavehöher als im vorigen Fall trennt die Gabortransfomation sämtliche Frequenzen annehmbar,wenn auch nicht sauber. Im Skalogramm bleiben die Obertöne dagegen schlecht erkennbar.

Abbildung 28: Spektrogramm (l) und Skalogramm (r) des Signals 26.(r). Der Trend ausAbbildung 27 ist hier deutlicher, das Spektrogramm trennt nun sämtliche Frequenzen, bei„vernünftiger“ Zeitlokalisation, sauber. Die WT zeigt das gleiche Bild wie zuvor.

90

Page 95: Zeit-Frequenz-Analyse mit Methoden der Gabor AnalysisZeit-Frequenz-Analyse mit Methoden der Gabor Analysis DIPLOMARBEIT Zur Erlangung des Grades eines Diplom-Mathematikers Justus-Liebig

4.3 Résumé

Abbildung 29: 3-sekündiger Ausschnitt eines Violinsolos mit Orchesteruntermalung.

Abbildung 30: Spektrogramm (l) und Skalogramm (r) des Signals 29. Für das aufmerksa-me Auge ist der Grundton der Violinenstimme in beiden Transformationen zu erkennen.Die Obertöne sind im Spektrogramm wieder deutlicher zu sehen.

Abbildung 31: log-Spektrogramm (l) und log-Skalogramm (r) des Signals 29. Insbesondereim Spektrogramm sind die Obertonreihen noch etwas besser zu erkennen, als in 30.

91

Page 96: Zeit-Frequenz-Analyse mit Methoden der Gabor AnalysisZeit-Frequenz-Analyse mit Methoden der Gabor Analysis DIPLOMARBEIT Zur Erlangung des Grades eines Diplom-Mathematikers Justus-Liebig

4 GABOR UND WAVELETS

Abbildung 32: Volles log-Spektrogramm (l) und Zoom in das untere Viertel des log-Spektrogramms (r). Wegen der Dichte der Abtastung erhalten wir scharfe Darstellungenauch für noch höhere Vergößerung. Rechts ist zu sehen, dass die Gabortransformation,trotz einer Fensterlänge von L = 2048 gute zeitliche Trennung aufeinanderfolgender Töneerreicht.

Abbildung 33: Wir betrachten nochmals ein Spektrogramm (l) des transponierten Kla-vierakkords aus 23.(r), beziehungsweise ein Skalogramm (r) des Akkords in 26. Linkswurde eine Fensterlänge von L = 6300, rechts der Waveletparameter ω = 70 gewählt, umzumindest die Frequenzen der ersten 2 Obertonblöcke zu trennen.

92

Page 97: Zeit-Frequenz-Analyse mit Methoden der Gabor AnalysisZeit-Frequenz-Analyse mit Methoden der Gabor Analysis DIPLOMARBEIT Zur Erlangung des Grades eines Diplom-Mathematikers Justus-Liebig

4.3 Résumé

93

Page 98: Zeit-Frequenz-Analyse mit Methoden der Gabor AnalysisZeit-Frequenz-Analyse mit Methoden der Gabor Analysis DIPLOMARBEIT Zur Erlangung des Grades eines Diplom-Mathematikers Justus-Liebig

A MATHEMATISCHE GRUNDLAGEN

A Mathematische Grundlagen

Die folgenden Seiten dienen dazu, dem Leser der vorliegenden Arbeit einige verwen-dete Grundlagen der Analysis, Fourier Analysis und digitalen Signalverarbeitung inkomprimierter Form nahezubringen. Die Resultate dieses Abschnitts sind essentiellfür das Verständnis unserer Ergebnisse und Beweise und wurden, wo möglich, aus[21] und [33] zusammengestellt. Anderere Quellen werden wir im Text gesonderterwähnen.

A.1 Funktionen, Folgen, IntegrierbarkeitIn der Lebesgueschen Integrationstheorie wird eine Funktion f : Rd → C mit d ≥ 1(absolut) integrierbar genannt, falls

∫Rd |f(x)| dx < ∞. Der Raum aller solcher

Funktionen wird mit L1(Rd) bezeichnet. Allgemeiner wird für 1 ≤ p <∞

Lp(Rd) = {f : Rd → C :∫

Rd|f(x)|p dx <∞},

mit der zugeordneten Norm

‖f‖Lp(Rd) =(∫

Rd|f(x)|p dx

)1/p

definiert. Für p =∞ ist

L∞(Rd) = {f : Rd → C : ess supx∈Rd |f(x)| <∞},

und‖f‖L∞(Rd) = ess supx∈Rd |f(x)|.

L2(Rd) nennen wir auch den Raum der quadratintegrierbaren Funktionen oder Funk-tionen endlicher Energie und wir schreiben im 1-dimensionalen Fall statt ‖f‖L2(R)auch einfacher ‖f‖. Dieser Raum spielt eine besondere Rolle, da er mit dem innerenProdukt

〈f, g〉 =∫

Rdf(x)g(x) dx

einen Hilbertraum bildet. Ein Hilbertraum ist ein Banachraum, also ein Raum indem jede Cauchyfolge gegen ein Element des Raumes konvergiert, mit inneremProdukt.

Es gilt der Satz von der majorisierten Konvergenz für konvergente Folgen inte-grierbarer Funktionen.

94

Page 99: Zeit-Frequenz-Analyse mit Methoden der Gabor AnalysisZeit-Frequenz-Analyse mit Methoden der Gabor Analysis DIPLOMARBEIT Zur Erlangung des Grades eines Diplom-Mathematikers Justus-Liebig

A.1 Funktionen, Folgen, Integrierbarkeit

Satz A.1.1 (Satz von der majorisierten Konvergenz).Sei {fn}n∈N eine Folge von Funktionen, so dass fast überall limn→∞ fn(x) = f(x)ist und es existiere eine Funktion g, so dass

∀n ∈ N : |fn(x)| ≤ g(x) und∫

Rdg(x) dx <∞.

Dann ist f integrierbar und es gilt∫Rdf(x) dx = lim

n→∞

∫Rdfn(x) dx.

Ein einfaches Korollar von A.1.1 ist der Satz von der beschränkten Konvergenz,der es für Folgen gleichmäßig beschränkter Funktionen erlaubt, Grenzwertbildungund Integration auf endlichen Intervallen zu vertauschen. Wir haben ihn aus [43]entnommen.

Korollar A.1.2 (Satz von der beschränkten Konvergenz).Sei I ein endliches Intervall und {fn}n∈N eine Folge auf I integrierbarer Funktionen,so dass limn→∞ fn(x) = f(x) fast überall auf I. Gibt es eine Konstante K, so dass

|fn(x)| ≤ K, für alle n ∈ N und alle x ∈ I,

dann ist f integrierbar auf I und es gilt∫If(x) dx = lim

n→∞

∫Ifn(x) dx.

Für L1-Funktionen erlaubt außerdem der Satz von Fubini die Vertauschung derIntegrationsreihenfolge.

Satz A.1.3 (Satz von Fubini).Sei d = d1 + d2 und es gilt∫

Rd|f(x)| dx <∞ oder

∫Rd2

(∫Rd1|f(x1, x2)| dx1

)dx2 <∞,

dann ist ∫Rdf(x) dx =

∫Rd2

(∫Rd1

f(x1, x2) dx1

)dx2

=∫

Rd1

(∫Rd2

f(x1, x2) dx2

)dx1,

wobei (x1, x2) = x mit x1 ∈ Rd1, x2 ∈ Rd2.

95

Page 100: Zeit-Frequenz-Analyse mit Methoden der Gabor AnalysisZeit-Frequenz-Analyse mit Methoden der Gabor Analysis DIPLOMARBEIT Zur Erlangung des Grades eines Diplom-Mathematikers Justus-Liebig

A MATHEMATISCHE GRUNDLAGEN

Ungleichungen. Aus [1]. Für f, g ∈ L2(Rd) gilt

|〈f, g〉| ≤ ‖f‖‖g‖ (Cauchy-Schwarzsche Ungleichung). (A.1)

Für f ∈ Lp(Rd), g ∈ Lq(Rd) mit 1/p+ 1/q = 1 ist

‖fg‖L1(Rd) ≤ ‖f‖Lp(Rd)‖g‖Lq(Rd) (Höldersche Ungleichung). (A.2)

Insbesondere ist fg ∈ L1(Rd) für f, g ∈ L2(Rd).

`p Räume. Die Folgenräume `p(Zd) sind analog zu ihrem Lp-Gegenstück defi-niert. Es ist

`p(Zd) = {f : Zd → C :∑n∈Zd|f [n]|p <∞}.

für 1 ≤ p <∞. Diesen Räumen ist die Norm definiert durch

‖f‖p =∑n∈Zd|f [n]|p

1/p

zugeordnet. `1(Zd) wird Raum der (absolut) summierbaren Folgen genannt, `2(Zd)Raum der quadratsummierbaren Folgen. Es gilt die diskrete Höldersche Ungleichung

‖fg‖1 ≤ ‖f‖p‖g‖q,

für 1/p+1/q = 1 und f ∈ `p(Zd), g ∈ `q(Zd). Damit ist in `2(Zd) das innere Produkt

〈f, g〉 =∑n∈Zd

f [n]g[n]

wohldefiniert. Für p =∞ ist

`∞(Zd) = {f : Zd → C : supn∈Zd|f [n]| <∞},

mit‖f‖∞ = sup

n∈Zd|f [n]|,

der Raum der beschränkten Folgen.Für N ∈ N bezeichnen wir mit `N den Raum der beschränkten, N-periodischen

(1-dimensionalen) Folgen

`N = {f : Z→ C : f [n] = f [n+N ]}.

Er ist isomorph zu

{f ∈ `∞(Zd) : f [n] = 0, für alle n ∈ Zd \ {0, · · · , N − 1}}= {f ∈ `p(Zd) : f [n] = 0, für alle n ∈ Zd \ {0, · · · , N − 1}},

96

Page 101: Zeit-Frequenz-Analyse mit Methoden der Gabor AnalysisZeit-Frequenz-Analyse mit Methoden der Gabor Analysis DIPLOMARBEIT Zur Erlangung des Grades eines Diplom-Mathematikers Justus-Liebig

A.1 Funktionen, Folgen, Integrierbarkeit

für alle 1 ≤ p ≤ ∞.

Faltungen. Für f, g ∈ L1(Rd), c, d ∈ `1(Zd) und c, d ∈ `N definieren wir dieFaltungen:

f ∗ g =∫

Rdf(x)g(· − x) dx (kontinuierliche Faltung)

undc ∗ d =

∑n∈Zd

c[n]d[· − n] (diskrete Faltung).

Weiterhin

c ∗ f = f ∗ c =∑n∈Zd

c[n]f(· − n) (semi-diskrete Faltung)

undc ∗ d =

N−1∑n=0

c[n]d[· − n] (zyklische Faltung).

Insbesondere gilt

‖f ∗ g‖L1(Rd) ≤ ‖f‖L1(Rd)‖g‖L1(Rd) und ‖c ∗ d‖1 ≤ ‖c‖1‖d‖1.

Nach den Hölder-Ungleichungen sind kontinuierliche und (semi-)diskrete Faltungaußerdem wohldefiniert für f, g ∈ L2(Rd), c, d ∈ `2(Zd).

Ein δ, viele Bedeutungen.Wir verwenden für den Dirac-Puls, das sogenannteKronecker-Delta und die diskrete Delta-Funktion die Bezeichnung δ. Dies rechtfer-tigt sich, neben üblicher Konvention, damit, dass sie in unserem Kontext ähnlicheAufgaben erfüllen. Da die Unterschiede jedoch entscheidend sind, erwähnen wirstets, welches δ gemeint ist.

Das (kontinuierliche) Dirac-δ ist eine Distribution, definiert durch

δ(t) = 0, für alle t ∈ R \ {0} und∫

Rδ(t)f(t) dt = f(0),

für jede stetige Funktion f : R→ C. Das Integral ist dabei symbolisch zu verstehenund bedeutet, dass der Dirac-Puls einer Funktion ihren Wert bei 0 zuordnet.

Das Kronecker-δ ist die Funktion δ : R→ R gegeben durch

δ(t) =1, für t = 0

0, sonst.

Zu guter Letzt ist die diskrete Delta-Funktion die Folge δ : Z→ R beziehungsweiseδ : Z/NZ→ R mit

δ[n] =1, für n = 0

0, sonst.In jedem dieser Fälle schreiben wir auch δl für δ(· − l) beziehungsweise δ[· − l].

97

Page 102: Zeit-Frequenz-Analyse mit Methoden der Gabor AnalysisZeit-Frequenz-Analyse mit Methoden der Gabor Analysis DIPLOMARBEIT Zur Erlangung des Grades eines Diplom-Mathematikers Justus-Liebig

A MATHEMATISCHE GRUNDLAGEN

A.2 Fourier Analysis und SignalverarbeitungDie Fouriertransformation in ihren unterschiedlichen Formen ist das Herzstück derSignalverarbeitung. Das gilt umso mehr für die Short-Time Fourier Transform, dienichts weiter als eine Aneinanderreihung lokalisierter Fouriertransformierter ist. Wirverwenden die Eigenschaften der Fouriertransformation an vielen Stellen dieser Ar-beit und setzen sie als bekannt voraus. Die wichtigsten Aussagen der Fourier Ana-lysis führen wir an dieser Stelle auf, wobei wir uns auf den 1-dimensionalen Fallbeschränken.

Für Funktionen f ∈ L1(R) ist die (unitäre) Fouriertransformation definiertdurch

f(ξ) =∫

Rf(t) exp(−2πiξt) dt, für alle ξ ∈ R, (A.3)

die Fouriertransformation für Folgen c ∈ `1(Z) durch

c(ξ) =∑Zc[n] exp(−2πiξn) dt, für alle ξ ∈ R. (A.4)

Die Fouriertransformation ist auf diesen Räumen wohldefiniert, offensichtlich gilt‖f‖L∞(R) ≤ ‖f‖L1(R), beziehungsweise ‖c‖L∞(R) ≤ ‖c‖1. Es ist außerdem leicht zusehen, dass beide Transformationen linear sind.

Wir erinnern kurz an die Definition der Translations- und Modulationsoperato-ren

Txf(t) = f(t− x) und Mωf(t) = exp(2πiωt)f(t).

Die Fouriertransformation hat die folgenden Eigenschaften (aus [33] und [39]).

Bemerkung A.2.1 (Eigenschaften der Fouriertransformation).Seien f, g ∈ L1(R), c, d ∈ `1(Z).

1. Die inverse Fouriertransformierte von f ist gegeben durch

f = (f(−·))∧ (A.5)

und falls f ∈ L1(R) ist, gilt

f(x) = f∨(t) =∫

Rf(ξ) exp(2πiξt) dξ.

2. Für kontinuierliche und (semi-)diskrete Faltung gilt

(f ∗ g)∧(ξ) = f(ξ)g(ξ), (A.6)

(c ∗ d)∧(ξ) = c(ξ)d(ξ) (A.7)

und(f ∗ c)∧(ξ) = f(ξ)c(ξ). (A.8)

98

Page 103: Zeit-Frequenz-Analyse mit Methoden der Gabor AnalysisZeit-Frequenz-Analyse mit Methoden der Gabor Analysis DIPLOMARBEIT Zur Erlangung des Grades eines Diplom-Mathematikers Justus-Liebig

A.2 Fourier Analysis und Signalverarbeitung

3. Die Fouriertransformation vertauscht Translation und Modulation. Es gilt

(Txf)∧ = M−xf (A.9)

und(Mωf)∧ = Tωf . (A.10)

4. Skalierung einer Funktion bedeutet inverse Skalierung der Fouriertransfor-mierten

(f(·/s))∧ = |s|f(s·). (A.11)

5. Für Spiegelung und komplexe Konjugation gelten

(f(−·))∧ = f(−·) (A.12)

und ¯f = f ∗. (A.13)

6. Ist f(t) ∈ R für alle t ∈ R, dann ist die Fouriertransformierte von f hermi-tesch symmetrisch, dass heißt

f(−·) = f(·).

Weiterhin gilt das Riemann-Lebesgue Lemma und der Satz von Plancherel, derdie Parsevalsche Formel impliziert.

Lemma A.2.2 (Riemann-Lebesgue Lemma).Für f ∈ L1(R) ist f gleichmäßig stetig und es gilt lim|ξ|→∞ |f(ξ)| = 0.

Satz A.2.3 (Satz von Plancherel).Sei f ∈ L1(R) ∩ L2(R), dann ist

‖f‖L2(R) = ‖f‖L2(R)

und für f, g ∈ L1(R) ∩ L2(R) gilt die Parsevalsche Formel

〈f, g〉 = 〈f , g〉. (A.14)

Die Fouriertransformation wird durch einen Grenzwertprozess auf L2(R) erwei-tert. Da L1(R) ∩ L2(R) dicht in L2(R) liegt, existiert zu f ∈ L2(R) eine Folge von

99

Page 104: Zeit-Frequenz-Analyse mit Methoden der Gabor AnalysisZeit-Frequenz-Analyse mit Methoden der Gabor Analysis DIPLOMARBEIT Zur Erlangung des Grades eines Diplom-Mathematikers Justus-Liebig

A MATHEMATISCHE GRUNDLAGEN

Funktionen fn ∈ L1(R) ∩ L2(R), so dass ‖fn − f‖L2(R) → 0. Daher ist {fn}n∈Z eineCauchyfolge in L2(R) und es existiert eine eindeutige Funktion f = limn→∞ fn inL2(R). Damit gilt A.2.3 für alle Funktionen mit beschränkter Energie.

Für periodische Signale in L1([−π, π]) sind die Fourierkoeffizienten definiert als

fk =∫ π

−πf(t) exp(−2πikt) dt, für alle k ∈ Z.

Die Fourierreihe von f ist dann

Ff =∑k∈Z

fk exp(2πik·). (A.15)

Die Folge der Fourierkoeffizienten {fk}k∈Z ist ein Element von `1(Z). Die Fourierrei-he ist daher, bis auf ein (unwichtiges) Vorzeichen, die Fouriertransformation für Fol-gen. Die Formel zur Berechnung der Fourierkoeffizienten können wir also als Inversezur Fouriertransformation einer Folge interpretieren. Weiterhin gilt die PoissonscheSummenformel, die mit Hilfe der Fourierreihe bewiesen wird (aus [39]).

Satz A.2.4 (Poissonsche Summenformel).Für f ∈ L1(R) ist ∑

k∈Zf(k) =

∑k∈Z

f(k). (A.16)

Diskrete Fouriertransformation (DFT). Für diskrete, periodische (oderendliche) Signale, also Folgen f ∈ `N für ein N ∈ N, verwenden wir die diskre-te Fouriertransformation, oder DFT . Für f ∈ `N(Z) ist die DFT der Ordnung Nvon f definiert durch

f [k] = fN [k] =N−1∑n=0

f [n] exp(−2πikn/N), für alle k ∈ {0, . . . , N − 1}. (A.17)

Ihre Inverse, die IDFT ist dann

f [n] = 1N

N−1∑k=0

f [k] exp(2πikn/N). (A.18)

Die Einschränkung auf k ∈ {0, . . . , N−1} ist keine Echte, da die DFT N -periodischist und somit ebenfalls als Signal in `N(Z) aufgefasst werden kann. Sie erhält dieEigenschaften der Fouriertransformation A.2.1 in analoger Form für zyklische Fal-tung und diskrete Translation und Modulation. Es gilt außerdem die diskrete Par-sevalsche Formel

〈f, g〉 = 1N〈f , g〉

für f, g ∈ `N .

100

Page 105: Zeit-Frequenz-Analyse mit Methoden der Gabor AnalysisZeit-Frequenz-Analyse mit Methoden der Gabor Analysis DIPLOMARBEIT Zur Erlangung des Grades eines Diplom-Mathematikers Justus-Liebig

A.2 Fourier Analysis und Signalverarbeitung

Diskretisierung. Für die Digitalisierung eines Signals müssen wir dieses ab-tasten. Dadurch kommt der Abtastsatz von Shannon [33, S.61] ins Spiel, der eserlaubt, bandbeschränkte Funktionen aus einer Abtastung wiederherzustellen, fallsdie Abtastrate hoch genug ist. Zusätzlich können wir nur endliche Abtastungenbearbeiten. Das Problem ist nur, es existiert keine bandbeschränkte Funktion aufkompaktem Träger außer der Nullfunktion ([33, S.45]).

Satz A.2.5 (Kompakter Träger).Hat f 6= 0 endlichen Träger, so gibt es kein Intervall I, so dass fχI ≡ 0. Umgekehrtgilt, hat f 6= 0 endlichen Träger, so gibt es kein Intervall I, so dass fχI ≡ 0.

Haben wir ein Signal f mit supp(f) ⊆ [0, N/S), und f ist die Abtastung gegebendurch

f [n] = f(n/S), für n ∈ {0, · · · , N − 1},dann ist (nach [33, S.60])

fN [k] =∑l∈Z

ˆf(S( kN− l)

), für alle k ∈ Z. (A.19)

Daraus können wir mehrere Schlüsse ziehen. Zum einen folgt aus ˆf(ξ) ≈ 0 für alleξ ∈ R \ [−S/2, S/2]:

fN [k] ≈ ˆf(Sk

N

), für alle k ∈ {0, . . . , N/2− 1},

undfN [k] ≈ ˆf

(Sk

N− S

), für alle k ∈ {N/2, . . . , N − 1}.

Ist dies erfüllt, dann hat fN (wegen der hermiteschen Symmetrie der Fouriertrans-formation auf reellen Signalen) eine Bandbreite von 0 bis S/2 und die k-te diskreteFrequenz entspricht einer „echten“ Frequenz von kS/N . In Formel A.19 erkennenwir außerdem die Auswirkungen zu niedriger Abtastrate, das sogenannte Aliasing.

Fast Fourier Transform. Durch ein Divide-And-Conquer-Verfahren kann dieDFT in O(N logN) Zeit berechnet werden. Algorithmen, die dieses Verfahren um-setzen, nennt man Fast-Fourier-Transform-, oder FFT-Algorithmen. Details zurFFT finden sich zum Beispiel in [40]. Unsere Algorithmen verwenden den in GNUOctave implementierten FFT-Algorithmus auf Basis der FFTW (Fastest FourierTransform in the West - http://www.fftw.org).

101

Page 106: Zeit-Frequenz-Analyse mit Methoden der Gabor AnalysisZeit-Frequenz-Analyse mit Methoden der Gabor Analysis DIPLOMARBEIT Zur Erlangung des Grades eines Diplom-Mathematikers Justus-Liebig

B ZUR WAHL VON WAVELET UND DARSTELLUNG

B Zur Wahl von Wavelet und DarstellungIm Folgenden haben wir einige Plots zusammengestellt, die illustrieren, warum wirdie Wurzel der Absolutbeträge der Gabor- beziehungsweise Wavelettransformiertenzeigen. Außerdem Plots, die an einem Beispiel zeigen, dass die Wahl des von-Hann-Wavelets statt eines Morlet-Wavelets keinen entscheidenden Unterschied macht.

Abbildung 34: (a),(b): Quadratisches Spektrogramm, bzw. Skalogramm, (c),(d): Abso-lutbeträge der Gabor- bzw. Wavelettransformation, (e),(f) Quadratwurzel der Absolutbe-träge. Für die Gabortransformation zeigt die letzte Darstellung (e) mehr Details, als dieVorigen. In (f) findet zumindest keine Verschlechterung der Lesbarkeit statt.

102

Page 107: Zeit-Frequenz-Analyse mit Methoden der Gabor AnalysisZeit-Frequenz-Analyse mit Methoden der Gabor Analysis DIPLOMARBEIT Zur Erlangung des Grades eines Diplom-Mathematikers Justus-Liebig

Abbildung 35: log-Spektrogramm (l), bzw. log-Skalogramm (r). Diese Darstellung liefertkeine nennenswerten zusätzlichen Details. Das hat sich auch für unsere übrigen Signalebestätigt. Ob die logarithmische Darstellung als besser oder schlechter empfunden wird,als jene in Abbildung 34, scheint Geschmackssache.

Abbildung 36: Das Skalogramm des von-Hann-Wavelets (l) ist von jenem des Morlet-Wavelets (r) kaum zu unterscheiden. Mathematisch unterscheiden sich ihre Zeit-Frequenz-Lokalisationen zwar stark, in der praktischen Umsetzung sind die Unterschiede jedochimmer noch so gering, dass sie nicht ins Gewicht fallen.

103

Page 108: Zeit-Frequenz-Analyse mit Methoden der Gabor AnalysisZeit-Frequenz-Analyse mit Methoden der Gabor Analysis DIPLOMARBEIT Zur Erlangung des Grades eines Diplom-Mathematikers Justus-Liebig

C INHALT DER BEILIEGENDEN CD

C Inhalt der beiliegenden CD

• ./zeit_frequenz_analyse_ho10.pdfElektronische Version der vorliegenden Diplomarbeit

• ./algorithms/stft/Algorithmen zur Short-Time Fourier Transform und zur Darstellung ihresSpektrogramms

• ./algorithms/gt/Algorithmen zur Gabortransformation und zu ihrer Darstellung

• ./pictures/Hochauflösende Versionen der wichtigsten Plots

• ./test_signals/Verwendete Testsignale im ASCII-Format

• ./test_signals_wave/Verwendete Testsignale als Wave-Dateien

104

Page 109: Zeit-Frequenz-Analyse mit Methoden der Gabor AnalysisZeit-Frequenz-Analyse mit Methoden der Gabor Analysis DIPLOMARBEIT Zur Erlangung des Grades eines Diplom-Mathematikers Justus-Liebig

IndexAliasing, 24, 101

Balian-Low, Satz von, 36, 44Banachraum, 18, 94Besselfolge, 35, 44Blackman-

Fenster, 56, 69

Cauchy-Schwarzsche Ungleichung, 96Cauchyfolge, 94

Delta-Funktion, 97DFT, 21, 48, 100DGE, 43DGT, 32, 43Dichte, 44Dirac-Puls, 97DSTFT, 20, 23, 43

Inverse, 23dual, 38Dualität, 37

Echtzeit, 82Einheitswurzelargument, 45

Fast Fourier Transform, 20Feichtingeralgebra, 17Fensterfunktion, 15

Wahl der, 16FFT, 20, 48Fouriertransformation

diskret, 21, 100Frame, 35, 57

diskret, 44duales, 57, 70exakt, 35, 44, 56, 57kanonisches duales, 57Tight, 35, 44, 56, 57, 61, 70

Frame Schranke, 57, 59Frame-

Analyse, 57Analyse-Operator, 57

Operator, 56, 57Synthese, 57Synthese-Operator, 57

FT, 24Fubini, Satz von, 95fundamentale Identität, 13

Gabor-Analyse, 49Atom, 34Frame, 35, 56Frame-Tripel, 58, 60Synthese, 32, 34, 49Synthese, diskret, 43System, 34Tight-Frame, 47, 56, 58, 61Tight-Frame, diskret, 72Tripel, 34Tripel, diskret, 43Tripel, duales, 34Wavelet, 76, 79Zerlegung, diskret, 43

Gabortransformation, 32, 35diskret, 32, 43

Gauss-Fenster, 80Gaussfunktion, 79

Höldersche Ungleichung, 96Hamming-

Fenster, 69Heisenberg-

Box, 8, 15Hilbertraum, 57, 94

IDFT, 21, 100Integraltransformation, 82

Kernreproduzierender, 18

kompakter Träger, 61Komplexität, 47Konvergenz

105

Page 110: Zeit-Frequenz-Analyse mit Methoden der Gabor AnalysisZeit-Frequenz-Analyse mit Methoden der Gabor Analysis DIPLOMARBEIT Zur Erlangung des Grades eines Diplom-Mathematikers Justus-Liebig

INDEX

beschränkte, 95Kronecker-δ, 97

Leaking, 24LGS, 47Lineares Gleichungssystem, 47

Modulation, 10, 83diskret, 22

Moore-Penrose Inverse, 58Morlet-Wavelet, 79Mother-Wavelet, 77, 79, 83

Nullfunktion, 24

Orthogonalitätsrelationdiskret, 23

Overlap Add, 49

Parsevalsche Formel, 99Plancherel

Satz von, 99

Redundanz, 44Rieffel

Satz von, 36Rieffel-Janssen, Satz von, 41Riemann-Lebesgue Lemma, 99Riesz-Basis, 44, 56, 57

Schwartzraum, 18Short-Time Fourier Transform, 6, 9, 12,

35diskret, 20, 23

Signaldiskret, 21

Skalierung, 83Spektrogramm, 25Stabilität, 34STFT, 6, 9, 12

Inverse, 15

Translation, 10, 83diskret, 22

translations-invariant, 8, 82Trigonometric Frame, 56

Trigonometric-Frame, 64diskret, 74

Unschärfe, 8Unschärferelation, 8

Vollständigkeit, 34von-Hann-

Fenster, 56, 63, 69, 76, 84Frame, 63Wavelet, 80, 84

Wavelet-Atom, 77Wavelettransformation, 76, 77Wexler-Raz-Bedingung, 38, 45

diskret, 45Weyl-Heisenberg-

Atom, 12Atom, diskret, 22System, 12, 34System, diskret, 22

Wilson-Basis, 83WT, 77

Zak-Transformation, 45Zeit-Frequenz-

Analyse, 6, 61, 70, 76Atom, 8, 77Ebene, 7, 77Ebene, diskret, 22Gitter, 18, 32, 34, 63Shift, 10Shift, diskret, 22

Zulässigkeitsbedingung, 83

106

Page 111: Zeit-Frequenz-Analyse mit Methoden der Gabor AnalysisZeit-Frequenz-Analyse mit Methoden der Gabor Analysis DIPLOMARBEIT Zur Erlangung des Grades eines Diplom-Mathematikers Justus-Liebig

LITERATUR

Literatur[1] H. Amann and J. Escher. Analysis III. Birkhäuser Basel, 2001.

[2] R. Balian. Un principe d’incertitude fort en théorie du signal ou en mécaniquequantique. C. R. Math. Acad. Sci. Paris, 292:1357–1362, 1981.

[3] M. J. Bastiaans. Gabor’s expansion of a signal into Gaussian elementary signals.Proc. IEEE, 68(4):538– 539, 1980.

[4] M. J. Bastiaans. The Expansion of an Optical Signal into a Discrete Set of Gaus-sian Beams. In Erzeugung und Analyse von Bildern und Strukturen, DGaO-DAGMTagung, volume 57, pages 95–102. Springer-Verlag, 1980.

[5] J. J. Benedetto, C. Heil, and D. F. Walnut. Differentiation and the Balian-Lowtheorem. J. Fourier Anal. Appl., 1(4):355–402, 1995.

[6] C. Chui and X. Shi. Inequalities of Littlewood-Paley type for frames and wavelets.SIAM J. Math. Anal., 24(1):263–277, 1993.

[7] I. Daubechies. The wavelet transform, time-frequency localization and signal analy-sis. IEEE Trans. Inform. Theory, 36(5):961–1005, 1990.

[8] I. Daubechies. Ten Lectures on Wavelets. SIAM, Society for Industrial and AppliedMathematics, 1992.

[9] I. Daubechies, A. Grossmann, and Y. Meyer. Painless nonorthogonal expansions. J.Math. Phys., 27(5):1271–1283, May 1986.

[10] I. Daubechies, Stephane Jaffard, and J. L. Journé. A simple Wilson orthonormalbasis with exponential decay. SIAM J. Math. Anal., 22:554–573, 1991.

[11] I. Daubechies and A. J. E. M. Janssen. Two theorems on lattice expansions. IEEETrans. Inform. Theory, 39(1):3–6, 1993.

[12] M. Dörfler. Gabor Analysis for a Class of Signals called Music. PhD thesis, 2002.

[13] R. J. Duffin and A. C. Schaeffer. A class of nonharmonic Fourier series. Trans.Amer. Math. Soc., 72:341–366, 1952.

[14] H. G. Feichtinger, W. Kozek, and J. Scharinger. Matched multiwindow methodsfor the estimation and filtering of nonstationary processes. In Proc. ISCAS ’96,volume 2, pages 509 – 512. IEEE, 1996.

[15] H. G. Feichtinger and S. Qiu. Gabor-type matrices and discrete huge Gabor trans-forms. In Proc. ICASSP’95, volume 2, pages 1089–1092. IEEE, 1995.

[16] H. G. Feichtinger and T. Strohmer. Gabor Analysis and Algorithms. Theory andApplications. Birkhäuser Boston, 1998.

107

Page 112: Zeit-Frequenz-Analyse mit Methoden der Gabor AnalysisZeit-Frequenz-Analyse mit Methoden der Gabor Analysis DIPLOMARBEIT Zur Erlangung des Grades eines Diplom-Mathematikers Justus-Liebig

LITERATUR

[17] H. G. Feichtinger and G. Zimmermann. A Banach space of test functions for Gaboranalysis. In H. G. Feichtinger and T. Strohmer, editors, Gabor Analysis and Algo-rithms: Theory and Applications, Applied and Numerical Harmonic Analysis, pages123–170. Birkhäuser Boston, 1998.

[18] H.G. Feichtinger. On a new Segal algebra. Monatsh. Math., 92:269–289, 1981.

[19] D. Gabor. Theory of communication. J. IEE, 93(26):429–457, 1946.

[20] I. M. Gelfand. Eigenfunction expansions for equations with periodic coefficients.Dokl. Akad. Nauk SSSR, 73(6):1117–1120, 1950.

[21] K. Gröchenig. Foundations of Time-Frequency Analysis. Birkhäuser Boston, 2001.

[22] A. Grossmann, H. Bacry, and J. Zak. Proof of completeness of lattice states in thekq representation. Phys. Rev. B, 12(4):1118–1120, August 1975.

[23] C. Heil. A discrete Zak transform. Technical report, 1989.

[24] J. Heine. Topologie und Funktionalanalysis. Oldenbourg Wissenschaftsverlag, 2002.

[25] A. J. E. M. Janssen. Gabor Representation of Generalized Functions. J. Math. Anal.Appl., 83:377–394, October 1981.

[26] A. J. E. M. Janssen. Bargmann transform, Zak transform, and coherent states. J.Math. Phys., 23(5):720–731, 1982.

[27] A. J. E. M. Janssen. Gabor representation and Wigner distribution of signals. InProc. IEEE ICASSP-84, volume 9, pages 258 – 261, March 1984.

[28] A. J. E. M. Janssen. Signal analytic proofs of two basic results on lattice expansions.Appl. Comput. Harmon. Anal., 1(4):350–354, 1994.

[29] A. Klein. Unpublished Wavelet Toolbox Documentation (part of PhD thesis). PhDthesis, to be submitted.

[30] W. Kozek. Matched generalized Gabor expansion of nonstationary processes. InProc. IEEE Int. Conf. Signals, Systems, and Computers, pages 499–503, November1993.

[31] W. Kozek. Matched Weyl-Heisenberg Expansions of Nonstationary Environments.PhD thesis, 1997.

[32] F. Low. Complete sets of wave packets. In C. DeTar, J. Finkelstein, and C.I. Tan,editors, A Passion for Physics - Essays in Honor of Geoffrey Chew, pages 17–22.World Scientific, 1985.

[33] S. Mallat. A Wavelet Tour of Signal Processing: The Sparse Way. Academic Press,2009.

108

Page 113: Zeit-Frequenz-Analyse mit Methoden der Gabor AnalysisZeit-Frequenz-Analyse mit Methoden der Gabor Analysis DIPLOMARBEIT Zur Erlangung des Grades eines Diplom-Mathematikers Justus-Liebig

LITERATUR

[34] S. Qiu and H. G. Feichtinger. The structure of the Gabor matrix and efficientnumerical algorithms for discrete Gabor expansion. In Proc. SPIE VCIP94, SPIE2308, pages 1146–1157, 1994.

[35] S. Qiu, H. G. Feichtinger, and T. Strohmer. Inexpensive Gabor Decompositions. InProc. SPIE’94: Wavelets Applications in Signal and Image Processing, pages 286–294, 1994.

[36] S. Qiu, F. Zhou, and P. E. Crandall. Discrete Gabor transform with complexityO(NlogN). Signal Process., 77:159–170, 1999.

[37] L. Rebollo Neira and J. Fernandez Rubio. On the inverse windowed Fourier trans-form. IEEE Trans. Inform. Theory, 45(7):2668–2671, 1999.

[38] M. A. Rieffel. Von Neumann algebras associated with pairs of lattices in Lie groups.Math. Ann., 257:403–418, 1981.

[39] T. Sauer. Digitale Signalverarbeitung. Vorlesungsskript, 2006.

[40] H.W. Schüßler. Digitale Signalverarbeitung 1. Springer-Verlag, 1994.

[41] T. Strohmer. Numerical algorithms for discrete Gabor expansions. In H.G. Feichtin-ger and T. Strohmer, editors, Gabor Analysis and Algorithms: Theory and Applica-tions, pages 267–294. Birkhäuser Boston, 1997.

[42] J. Ville. Theorie et applications de la notion de signal analytique. Cables et Trans-mission, (2A):61–74, 1948.

[43] A. J. Weir. Lebesgue Integration and Measure. Cambridge University Press, 1973.

[44] J. Wexler and S. Raz. Discrete Gabor expansions. Signal Process., 21:207–220, 1990.

[45] E.P. Wigner. On the quantum correction for thermo-dynamic equilibrium. Phys.Rev. Letters, (40):749–759, 1932.

[46] Y. Y. Zeevi, M. Zibulski, and M. Porat. Multi-window Gabor schemes in signaland image representations. In Hans G. Feichtinger and T. Strohmer, editors, GaborAnalysis and Algorithms: Theory and Applications, Appl. Numer. Harmon. Anal.,pages 381–407. Birkhäuser Boston, 1998.

[47] M. Zibulski and Y. Y. Zeevi. Analysis of multiwindow Gabor-type schemes by framemethods. Appl. Comput. Harmon. Anal., 4(2):188–221, 1997.

109