bfam-teilprojekt bf-s15t07 effiziente clustering-verfahren zur genomweiten expressionsanalyse...

8
BFAM-Teilprojekt BF-S15T07 Effiziente Clustering-Verfahren zur genomweiten ExpressionsanalyseBFAM-Teilprojekt BF-S15T08 Modellierung und Visualisierung Biochemischer ReaktionswegeSonstige Projekte im Bereich Bioinformatik Dr. Jens Ernst ([email protected]) Sebastian Wernicke ([email protected]) Arno Buchner ([email protected]) Jan Griebsch ([email protected]) Hanjo Täubig ([email protected]) Moritz Maass ([email protected])

Upload: reginmund-schmeling

Post on 05-Apr-2015

107 views

Category:

Documents


1 download

TRANSCRIPT

Page 1: BFAM-Teilprojekt BF-S15T07 Effiziente Clustering-Verfahren zur genomweiten Expressionsanalyse BFAM-Teilprojekt BF-S15T08 Modellierung und Visualisierung

BFAM-Teilprojekt BF-S15T07„Effiziente Clustering-Verfahren

zur genomweiten Expressionsanalyse“

BFAM-Teilprojekt BF-S15T08„Modellierung und VisualisierungBiochemischer Reaktionswege“

Sonstige Projekte imBereich Bioinformatik

Dr. Jens Ernst ([email protected]) Sebastian Wernicke ([email protected])Arno Buchner ([email protected])Jan Griebsch ([email protected])

Hanjo Täubig ([email protected])Moritz Maass ([email protected])

Page 2: BFAM-Teilprojekt BF-S15T07 Effiziente Clustering-Verfahren zur genomweiten Expressionsanalyse BFAM-Teilprojekt BF-S15T08 Modellierung und Visualisierung

BFAM im Forschungskontext des LehrstuhlsLehrstuhl für Effiziente Algorithmen

Graphentheorie

Kombinatorische Optimierung

Randomisierte Algorithmen

Computeralgebra

Petri-Netze

Scheduling

Komplexitätstheorie

Algorithmische Bioinformatik

Algorithmenvisualisierung

Teilprojekt„Clustering“

Teilprojekt„Biologische Netzwerke“

SonstigeBioinformatik-

Projekte

Page 3: BFAM-Teilprojekt BF-S15T07 Effiziente Clustering-Verfahren zur genomweiten Expressionsanalyse BFAM-Teilprojekt BF-S15T08 Modellierung und Visualisierung

Teilprojekt „Effiziente Clustering-Verfahren zur genomweiten Expressionsanalyse“

Genexpressionsdaten

Genexpressionsprofile

Ähnlichkeits-untersuchung

Normalisierung

Clustering

Page 4: BFAM-Teilprojekt BF-S15T07 Effiziente Clustering-Verfahren zur genomweiten Expressionsanalyse BFAM-Teilprojekt BF-S15T08 Modellierung und Visualisierung

Meilensteine des Teilprojekts:

1. Ähnlichkeitsmaße für Expressionsprofile:

2. Qualitätsmaße für Clusterings:

3. Neuentwicklung von Clustering-Algorithmen:

• RCPT-Algorithmus (graphentheoretisch, randomisiert)

• SR-Algorithmus (spektral)

4. Implementierung als Softwarepaket:

5. Entwicklung erweiterter Clustering-Modelle:

• Rekonstruktion überlappender Cluster

• Clustering in höheren Momenten

6. Einbringung von Vorwissen in den Clustering-Prozess:

Page 5: BFAM-Teilprojekt BF-S15T07 Effiziente Clustering-Verfahren zur genomweiten Expressionsanalyse BFAM-Teilprojekt BF-S15T08 Modellierung und Visualisierung

Kooperationen im BFAM-Verbund, Publikationen:

1. Kooperation mit der Genomatix Software GmbH:• Erweiterung der Cluster-Analyse um Vorwissen aus

biologischen Datenbanken und Nebenbedingungen

2. Kooperation mit Genomatix Software GmbH, der BiomaxInformatics GmbH, der Gruppe Prof. Lasser und der Gruppe Prof. Kriegel:• Vergleichende Bewertung von Clusterverfahren

3. Publikationen:[1] „Similarity-Based Clustering Algorithms for Gene Expression Profiles“,

J. Ernst, Dissertation, Technische Universität München, 2002

[2] „Generalized Clustering of Gene Expression Profiles – A Spectral Approach“,

J. Ernst, Proc. of the Int. Conference on Bioinformatics, Bangkok, 2002

[3] „The Complexity of Detecting Fixed-Density Clusters“, H. Täubig et. al.,

Proc. of the 5th Italian Conference on Algorithms and Complexity, 2003

Page 6: BFAM-Teilprojekt BF-S15T07 Effiziente Clustering-Verfahren zur genomweiten Expressionsanalyse BFAM-Teilprojekt BF-S15T08 Modellierung und Visualisierung

Teilprojekt „Modellierung und Visualisierung

Biochemischer Reaktionswege“ Fokus: Hierarchisierte Netzwerke

flexible Detailtiefe (Organisation: Z.B. Zelle, Organelle, Kompartiment, Teilreaktion,…),

Layouterhaltung („Preserving of the mental Map”)

Modellierung und Datenstrukturentwicklung Enwtwicklung verschiedener „Hierarchiekonzepte“, Analyse sich daraus ergebender Konsequenzen für die effiziente Darstellung und Analyse von biochemischen Netzwerken

Implementierung Programmierung einer generischen (modularen, erweiterbaren) Software. Beispielhafte Implementierung der entwickelten Ansätze für Anwendungen und als Proof-of-Concept.

Anwendung Vergleich von Reaktionsnetzwerken auf verschiedenen hierarchischen Ebenen, Ausnützen entwickelter Konzepte

kollabierenexpandieren

Page 7: BFAM-Teilprojekt BF-S15T07 Effiziente Clustering-Verfahren zur genomweiten Expressionsanalyse BFAM-Teilprojekt BF-S15T08 Modellierung und Visualisierung

Meilensteine des Teilprojekts:

Planung Implementierung Anwendung

Modellierung Enwicklung Daten- struktur

Hierarchie-konzepte

Graph Drawing

Verwendung der Software

Vorg

eh

en

Sta

tus

Bem

erk

un

gen

Darstellung von biochem. Netzwerken

Parametrisie-rung der Belegung

Hierarchisie-rung und Attributierung

Effiziente Realisierung von Operationen

Konsistenzüberwachung

Lokale Selbstähnlich-keit

Flexibler Wechsel zwischen Hierarchiestufen

Verschiedene Hierarchisie-rungen (modular) und Detailgrade

Untersuchung auf Einsetzbarkeit

Ergänzung um spezielle Verfahren

Implementie-rung

Ähnlichkeit zwischen Netzwerken

Consensus Netzwerke

Maximale / minimal ähnliche Substrukturen

Page 8: BFAM-Teilprojekt BF-S15T07 Effiziente Clustering-Verfahren zur genomweiten Expressionsanalyse BFAM-Teilprojekt BF-S15T08 Modellierung und Visualisierung

Kooperationen und Mitarbeit

1. Kooperationen mit anderen Forschungseinrichtungen und Firmen

- Computer-Chemie-Centrum der Friedrich-Alexander Universität Erlangen-Nürnberg (Prof. Dr. J. Gasteiger): Austausch von Daten (BioPath), Softwarebibliotheken (MOSES) gegen Netzwerkanalysedaten und –software.

- Munich Information Center for Protein Sequences (Dr. V. Stümpflen) Austausch von Daten über Protein-Proteininteraktionsnetzwerke gegen Analyse- und Visualisierungstool. Entwicklung von Schnittstellenstandards

- Lehrstuhl für Organische Chemie und Biochemie (Prof. Dr. Dr. A. Bacher) Netzwerkmodellierung für die Auswertung quantitativer Daten aus Markierungsexperimenten mit Glucose.

2. Diplomarbeiten - Tobias Binder: „Automatisierte Analyse und Zerlegung metabolischer

Netzwerke durch Knotenzentralitätsmasse – Analyse und Implementierung“. - Uwe Römers: „Motivsuche in Proteinstrukturdatenbanken unter

Berücksichtigung von Insertionen und Deletionen“. - Johannes Nowak: „A New Indexing Method for Approximate Pattern

Matching with One Mismatch, Johannes Nowak”