„bioinformatik – auch ein thema für informationsfachleute ...€¦ · einer base, einem zucker...

31
„Bioinformatik – auch ein Thema für Informationsfachleute ?“ „Bioinformatics – also a topic for experts in information science, research and management?“ Zusammenfassung Die Bioinformatik in ihrem gesamten Umfang kann kaum von einem Informationsspezialisten bewältigt werden. Nichtsdestotrotz gibt es sehr viele Teilbereiche, die ein Informationsspezialist bearbeiten kann und wo er mit seinen Kenntnissen die Bioinformatik betreiben kann. Vorraussetzung ist die Einarbeitung in Wissen der molekularen Biowissenschaften. Ohne dieses könnte ein Informationsspezialist nur peripher an der Bioinformatik teilnehmen bzw. nur Daten- und nicht Informationsmanipulation betreiben. Summary The bioinformatics in its broad scope can hardly be managed by a single expert in information science, research and management. Nevertheless there are sub-areas, in which a specialist in information science, research and management can work and can practise the bioinformatics with his knowledge. You can read about these sub-areas in the following article. The pre-requisite is to become familiar with the molecular biosciences. Without this an expert in information science, research and management could only take peripheral part in bioinformatics and he can only manipulate data but not information. Vorwort In zwei Artikeln soll das Spektrum der Bioinformatik dargestellt werden, welches für Informationsfachleute relevant ist. Dabei können die Themen immer nur angerissen werden. In dem Artikel sind aber viele Literaturhinweise und Links in das Internet aufgenommen worden, so dass jeder sich selbstständig in das Gebiet vertiefen kann. Bei Rückfragen bin ich auch unter meiner Email-Adresse [email protected] erreichbar. Bei Diskussionsbedarf kann die DGI-Mailingliste ( [email protected] ) genutzt werden. Die Übersicht der Themen: 1) Definition Bioinformatik 2) Bioinformatik für Informationsspezialisten 3) Biochemisches Grundwissen + Angabe von Standardliteratur in diesem Bereich 4) Internet-Tutorien 5) Portale 6) Institute 7) Datenbanken 8) Retrievalsysteme 9) Recherche in professionellen Hosts

Upload: others

Post on 19-Oct-2020

6 views

Category:

Documents


0 download

TRANSCRIPT

  • „Bioinformatik – auch ein Thema für Informationsfachleute ?“ „Bioinformatics – also a topic for experts in information science, research and management?“ Zusammenfassung Die Bioinformatik in ihrem gesamten Umfang kann kaum von einem Informationsspezialisten bewältigt werden. Nichtsdestotrotz gibt es sehr viele Teilbereiche, die ein Informationsspezialist bearbeiten kann und wo er mit seinen Kenntnissen die Bioinformatik betreiben kann. Vorraussetzung ist die Einarbeitung in Wissen der molekularen Biowissenschaften. Ohne dieses könnte ein Informationsspezialist nur peripher an der Bioinformatik teilnehmen bzw. nur Daten- und nicht Informationsmanipulation betreiben. Summary The bioinformatics in its broad scope can hardly be managed by a single expert in information science, research and management. Nevertheless there are sub-areas, in which a specialist in information science, research and management can work and can practise the bioinformatics with his knowledge. You can read about these sub-areas in the following article. The pre-requisite is to become familiar with the molecular biosciences. Without this an expert in information science, research and management could only take peripheral part in bioinformatics and he can only manipulate data but not information. Vorwort In zwei Artikeln soll das Spektrum der Bioinformatik dargestellt werden, welches für Informationsfachleute relevant ist. Dabei können die Themen immer nur angerissen werden. In dem Artikel sind aber viele Literaturhinweise und Links in das Internet aufgenommen worden, so dass jeder sich selbstständig in das Gebiet vertiefen kann. Bei Rückfragen bin ich auch unter meiner Email-Adresse [email protected] erreichbar. Bei Diskussionsbedarf kann die DGI-Mailingliste ( [email protected] ) genutzt werden. Die Übersicht der Themen: 1) Definition Bioinformatik 2) Bioinformatik für Informationsspezialisten 3) Biochemisches Grundwissen + Angabe von Standardliteratur in diesem Bereich 4) Internet-Tutorien 5) Portale 6) Institute 7) Datenbanken 8) Retrievalsysteme 9) Recherche in professionellen Hosts

  • 10) Patentrecherche 11) Sequenzprogramme 12) Visualisierung 13) Programmierung 14) Markuplanguages 15) Erstellung von Websites und Informationsportalen 16) Fazit 1) Definition Bioinformatik Laut Definition umfasst die Bioinformatik die IT-gestützte Verarbeitung von Daten aus den molekularen Biowissenschaften (Molekularbiologie, Biochemie, Medizin, Biotechnologie). Dabei ermöglicht die Bioinformatik eine immer umfassendere, integrierte Auswertung dieser Daten aus den verschiedenen Bereichen und soll somit Forschungsprozesse in der Biotechnologie und in der Medizin beschleunigen. 2) Bioinformatik für Informationsspezialisten In diesen Artikeln soll nicht das ganze Spektrum der Bioinformatik behandelt werden, sondern nur dieser Teil der für Informationsspezialisten relevant ist. Es wird nicht auf Algorithmen und Berechnungen eingegangen. Auch nicht auf das ganze Gebiet, in denen mit Molekülen Berechnungen angestellt werden. Betrachtet werden hingegen die Informationen der Bioinformatik im Internet, in den Datenbanken, in der Visualisierung und bei der Verarbeitung mit Markuplanguages. 3) Biochemisches Grundwissen und Angabe von Standardliteratur in diesem Bereich Hier werden folgende Aspekte angesprochen: a) Aufbau der DNA und RNA und deren Struktur b) Aufbau und Struktur von Proteinen c) Zusammenhang zwischen DNA, RNA und Proteinen a) DNA und RNA sind sequentiell aus Nukleotiden aufgebaut. Ein Nukleotid besteht aus einer Base, einem Zucker und einem Phosphorsäurerest. Die DNA und die RNA bestehen aus einer Abfolge der vier verschiedenen Nukleotiden. Die DNA besitzt die Purinbasen Adenin (A) und Guanin (G) sowie die Pyrimidinbasen Cytosin (C) und Thymin (T). Die RNA hat anstelle der Pyrimidinbase Thymin (T) die Pyrimidinbase Uracil (U). Die DNA ist doppelsträngig, wobei sich immer zwei komplementäre Nukleotide über den Basen gegenüberliegen. Bei den komplementären Basen handelt es sich um A und T sowie C und G. Eine Vermehrung der DNA geschieht semikonservativ, d.h. dass sich der Doppelstrang an einer Stelle öffnet und sich an den beiden offenen Stellen Nukleotide anlagern, die miteinander verknüpft werden. So entstehen zwei Doppelstränge. Dieser Vorgang wird Replikation genannt. Die RNA ist einzelsträngig.

  • b) Proteine sind sequentiell aus Aminosäuren aufgebaut. Von den Aminosäuren gibt es zwanzig verschiedene natürlich vorkommende. Die Aminosäuren unterscheiden sich in Größe, Masse und Polarität. Bei den Aminosäuren handelt es sich um: Aminosäure 1-Buchstabencode 3-Buchstabencode Strukturformel

    Alanin A Ala

    Cystein C Cys

    Asparaginsäure D Asp

    Glutaminsäure E Glu

    Phenylalanin F Phe

    Glycin G Gly

    Histidin H His

    Isoleucin I Ile

    Lysin K Lys

    Leucin L Leu

  • Methionin M Met

    Asparagin N Asp

    Prolin P Pro

    Glutamin Q Gln

    Arginin R Arg

    Serin S Ser

    Threonin T Thr

    Valin V Val

    Thrypthophan W Trp

    Tyrosin Y Tyr [Strukturbilder der Aminosäuren von http://www.chemie.fu-berlin.de/chemistry/bio/amino-acids.html]

  • Sowie die Abkürzungen für Asparagin oder Asparaginsäure B Asx Glutamin oder Glutaminsäure Z Glx beliebige oder unbekannte Aminosäure X Die Sequenzen der Proteine werden meistens im Einbuchstabencode geschrieben. Durch Betrachten und Vergleichen dieser Sequenzen können schon einige Rückschlüsse über die Art und die Funktion des Proteins gezogen werden. Dies gilt oft aber nur für Teilbereiche des Proteins. Bei den Proteinen unterscheidet man vier verschiedene Stufen von Strukturen. Man spricht von der I. Primärstruktur, wenn man die reine Aminosäuresequenz betrachtet

    Bsp. MGHFTEEDKA TITSLWGKVN VEDAGGETLG (Gamma A hemoglobin [Fragment])

    II. Sekundärstruktur, wenn man die Strukturmerkmale wie a-Helix oder ß-Faltblatt betrachtet

    a-Helix: Abbildung 1: a-Helix-Struktur eines Proteinfragments Die schraubenförmige Helix ist in violett hervorgehoben. Die Seitenketten der Aminosäuren bilden eine Wendeltreppe.

    ß-Faltblatt: Abbildung 2: ß-Faltblattstrukturen von Proteinfragmenten Die Stickstoffatome (blau) und die Sauerstoffatome (rot) passen sich ineinander und stabilisieren so das Faltblatt. In diesem Bild sind die Seitenketten der Aminosäuren nicht gezeigt. [Abbildung 1 und 2 mit dem dazugehörigen Text von http://www.biozentrum.unibas.ch/~xray/uniforum/ ]

  • III. Tertiärstruktur, wenn man die dreidimensionale Struktur eine Proteins betrachtet Bsp. Hämoglobin mit den vier hervorgehobenen HEM-Gruppen

    Abbildung 3: Dreidimensionale Darstellung von Hämoglobin mit dem Programm RasMol

    IV. Quartärstruktur, wenn mehrere Tertiärstrukturen zu einem Komplex zusammengeballt sind

    Eines der großen bis jetzt noch ungelösten Rätsel der Bioinformatik ist es, aus der Primärstruktur die Tertiärstruktur eines Proteins vorherzusagen. Dies ist deshalb so kompliziert, da es fast unendlich viele Möglichkeiten gibt, wie sich ein Protein falten könnte, aber es nur eine Tertiärstruktur pro Primärstruktur gibt, wie sich ein Protein faltet. Dieses Problem wird zur Zeit mit massiver Computerleistung zu lösen versucht.

    c) In der DNA sind die Aufbaupläne der Proteine codiert. Die DNA besteht aus einer Abfolge von vier verschiedenen Nukleotiden. Ein Nukleotid besteht aus einer Base, einem Zucker (hier Desoxyribose) und einem Phosphatrest. Dabei unterscheiden sich die vier Sorten von Nukleotiden durch die unterschiedlichen Basen.

    Adenin(A) Guanin(G) Cytosin(C) Thymin(T)

  • Auf dem DNA-Doppelstrang liegen sich immer die Basen Adenin und Thymin einerseits und Guanin und Cytosin anderseits gegenüber.

    Abbildung 4a: Ein Fragment des DNA-Doppelstrangs von der Seite

    Abbildung 4b: DNA-Fragment von schräg oben Dabei verschlüsseln je drei Nukleotide eine Aminosäure. Bei vier verschiedenen Nukleotiden ergibt sich daraus eine Kombinationsmöglichkeit von 64 Möglichkeiten = 43 Möglichkeiten, d.h. bei einer Anzahl von zwanzig Aminosäuren werden manche Aminosäuren durch verschiedene Tripletts codiert, z.B. die Aminosäure Serin durch AGA, AGG, AGT oder AGC.

  • Abbildung 5: Der genetische Code in tabellarischer Darstellung [http://www.diss.fu-berlin.de/2001/64/Einleitung.PDF] Drei Tripletts fungieren als Stop-Codon. Es handelt sich um die Tripletts ACT, ATC und ATT. Als Startsignal fingiert meistens das Triplett TAC bzw. auf der mRNA AUG, welches dem Triplett der Aminosäure Methionin entspricht. Am Anfang der Proteinsynthese werden die Informa tionen eines Teilstrangs der DNA über die komplementäre mRNA abgelesen. Dadurch würden die Triple tts auf der mRNA für die Aminosäure Serin wie folgt lauten: UCU, UCC, UCA oder UCG. Die Verknüpfung zwischen den Codons der Nukleotidsäuren und den Aminosäuren ist zusammenfassend im genetischen Code abgebildet. Eine vereinfachte Abbildung des genetischen Flusses wird hier dargestellt. Transkription Translation Replikation DNA RNA Protein Abbildung 6: Der genetische Informationsfluß

  • Zur Vertiefung des hier im Artikel nur angerissenen Grundwissens in den molekularen Wissenschaften, kann ein Standardlehrbuch der folgenden Listen verwandt werden. Standardlehrbücher für die Biochemie sind

    1. Stryer

    deutsche Ausgabe (vierte Auflage): http://www.spektrum-verlag.com/detail.php?isbn=3860253468&fach=3

    englische Ausgabe (fünfte Auflage): http://www.whfreeman.com/stryer/

    2. Voet

    deutsche Ausgabe: http://www.wiley.com/cda/product/0,,352730519X,00.html englische Ausgabe (dritte Auflage, angekündigt): http://www.wiley.com/cda/product/0,,0471250902|desc|3026,00.html bzw.

  • (zweite Auflage) http://www.wiley.com/cda/product/0,,047158651X,00.html

    3. Lehninger

    deutsche Ausgabe: http://www.springer.de/ bzw. http://www.thieme.de/viamedici/lernen/lehrbuecher/354041813x.html

    englische Ausgabe: http://www.worthpublishers.com/lehninger/ Standardlehrbücher für die Molekularbiologie sind

    1. Alberts

    deutsche Ausgabe: http://www.wiley-vch.de/books/tis/ger/3-527-30493-2.html

  • englische Ausgabe: http://www.garlandscience.com/MBoC4/about.html

    2. Knippers

    deutsche Ausgabe: http://www.thieme.de/detailseiten/3134770083.html

    3. Lewin

    englische Ausgabe: http://www.oup.co.uk/best.textbooks/biochemistry/genesvii/

    Weiterhin kann noch folgende Reihe genannt werden, wo einige Bücher aus der Praxis der Naturwissenschaft (nicht nur) für Bioinformatiker enthalten sind : Labor im Fokus http://www.wissenschaft-online.de/sixcms/detail.php?template=scishop_kno_list&suchfeld=stichwort&suchtext=labor+im+fokus&x=5&y=5 Eine Auflistung von Bioinformatikbüchern befindet sich hier: http://www.bioinformatik.de/cgi-bin/browse/Catalog/Literature/Books/ Eine Auflistung von wissenschaftlichen Verlagen gibt es hier: http://www.bionity.de/search/index.php3?vkid=151&domain=bionity&language=d&doanno=0&pattern=&scheme=default&selmedia[all]=1

  • 4) Internet-Tutorien In der folgenden kurzen Liste sind Internet-Tutorien enthalten, bei denen 3D-Darstellungen von Aminosäuren, Proteinen und / oder Nukleinsäuren inbegriffen sind. Bei den ersten dreien kann der Chime-Viever (www.mdli.com) benutzt werden. Bei dem dritten Tutorial kommt entweder das Programm xmol oder das Programm rasmol als Plug-In in Frage (nähere Informationen dazu: http://www.chemie.fu-berlin.de/chemistry/mime-notes.html). Eine ausführliche Beschreibung zu den Viewern erfolgt im Punkt 15). Eine Einführung zu frei verfügbaren Viewern mit Ausnahme von xmol und Chime , welches aber auf Rasmol basiert, befindet sich im Interne t unter www.aschomburg.de/Diplom/Kapitel_4.1.pdf (ab Seite 25).

    1. Ein Internet-Tutorial zum Lehrbuch Stryer: http://bcs.whfreeman.com/biochem5/

    2. Ein Internet-Tutorial zum Lehrbuch Lehninger: http://www.worthpublishers.com/lehninger3d/index.html

    3. Molecular Models for Biochemistry at CMU http://info.bio.cmu.edu/Courses/BiochemMols/BCMolecules.html

    4. Eine Auflistung der Aminosäuren mit 3D-Strukturen (.mol) an der FU Berlin http://www.chemie.fu-berlin.de/chemistry/bio/amino-acids.html

    Eine Übersicht der Tutorien mit und ohne Darstellungen gibt es unter: http://www.bioinformatik.de/cgi-bin/browse/Catalog/Research_and_Education/Online_Courses_and_Tutorials/ Ein Kurs, der in der Übersicht nicht aufgenommen ist, ist der des Max-Planck-Instituts für molekulare Genetik (Berlin): http://lectures.molgen.mpg.de/online_lectures.html

  • 5) Portale Bei deutschen Internetseiten gibt es zwei große Portale, die auch schon in den Verweisen aufgeführt wurden:

    1. www.bioinformatik.de

    Abbildung 7: Eingangsseite von bioinformatik.de

    2. www.bionity.com

    Abbildung 8: oberer Abschnitt der Eingangsseite von bionity.com

  • Beides sind sehr umfangreiche Linkkataloge zu den Aspekten der Bioinformatik, wobei bei bionity.com nicht nur die Bioinformatik aufgeführt wird, sondern alle Aspekte der molekularen Biowissenschaften zuzüglich der Pharmazie. Bionity.com ist das Pendant zu dem bekannten Webportal www.chemie.de. Als internationale Quelle ist zu erwähnen:

    1. www.bioinformatics.org

    Abbildung 9: oberer Abschnitt der Eingangsseite von bioinformatics.org Diese Seiten werden von einer internationalen Organisation betrieben, die sich stark mit dem Thema Open Source Software in der Bioinformatik beschäftigt.

    Portale, bei denen Institute im Hintergrund stehen, wie z.B. das NCBI werden im nächsten Punkt beschrieben.

  • 6) Institute Exemplarisch für alle Institute werden in diesem Abschnitt drei Einrichtungen besprochen:

    1. National Center for Biotechnology Information (NCBI): (www.ncbi.nlm.nih.gov)

    Abbildung 10: oberer Abschnitt der Startseite des NCBI-Servers Eine sehr umfangreiche Quelle im Bereich der Bioinformatik. Auf diesen Seiten sind einige der wichtigsten frei zugänglichen Datenbasen der molekularen Biowissenschaften zu finden, so z.B. Genbank und PubMed. Weiterhin gibt es hier zahlreiche Onlineprogramme, z.B. das Alignmentprogramm BLAST. Auch zahlreiche Tutorien zur Bioinformatik, speziell zu den Programmen und Datenbasen des NCBI sind hier zu finden.

  • 2. European Molecular Biology Laboratory (EMBL): (www.embl.de)

    Abbildung 11: Startseite des EMBL in Heidelberg und das dazugehörige European Bioinformatics Institute (EBI): (http://www.ebi.ac.uk/)

    Abbildung 11: Startseite des EBI in Hinxton

  • Das EMBL besteht aus mehreren Instituten in Europa mit Hauptsitz in Heidelberg. Die interessanteren Teile der Bioinformatik für Informationsspezialisten sind am EBI zu finden. Hier ist auch der Sitz zahlreicher Datenbasen, z.B. EMBL Nukleotid Datenbase, kurz EMBL. Zahlreiche Onlinetools zum Auswerten der Daten können über diesen Server benutzt werden. Ein weiterer Service des EBI ist ein umfangreicher FTP-Server mit zahlreichen Tools zum Herunterladen.

    3. Swiss Institute of Bioinformatics (SIB): (http://www.isb-sib.ch/)

    Abbildung 12: Startseite des Schweizer Instituts für Bioinformatik mit dem Expert Protein Analysis System (ExPASy)-Server: (http://www.expasy.org/)

  • Abbildung 13: oberer Abschnitt der Einstiegsseite für den ExPASy-Server Ein weiterer wichtiger Server im Internet ist der ExPASy-Server in der Schweiz. Auch hier gibt es viele Datenbasen der molekularen Biowissenschaften, darunter Swissprot, eine Proteindatenbank. Zum Angebot gehören auch zahlreiche Tools und ein FTP-Server. Erwähnenswert ist eine umfangreiche kommentierte Linkliste mit Links zu allen Aspekten der molekularen Biowissenschaften.

    7) Datenbanken Einen Überblick über alle öffentlichen verfügbaren Datenbanken in den molekularen Biowissenschaften erscheint jährlich in der ersten Ausgabe des Jahres in der Zeitschrift Nucleic Acids Research, die auch online verfügbar ist (http://www.nar.oupjournals.org/).Aus der Vielzahl von Datenbanken wurden vier ausgewählt, die einer näheren Betrachtung unterzogen werden, darunter eine Nukleotid- und drei Proteindatenbanken (Primärstrukturen, Tertiärstrukturen und Enzyme). Bei den Datenbanken werden kurz die Suchmasken erläutert. Außerdem gibt es zu jeder Datenbank einen Verweis zur Dokumentation.

  • 1. EMBL (http://www.ebi.ac.uk/embl/index.html) In der EMBL Datenbasis sind Nukleotidsequenzen abrufbar. Bei ihr liegen auch komplette Genome auf. Um Zugang zu der EMBL-Datenbasis zu bekommen, gibt es drei Möglichkeiten, die im unteren Bild aufgelistet sind.

    Abbildung 14: Suchmöglichkeiten bei der Datenbasis EMBL Bei der ersten Möglichkeit handelt es sich um einen (Link)-Katalog von vollständigen Genomen, z.B. von Viren oder Bakterien. Die zweite Möglichkeit, SRS6, wird im nächsten Punkt beschrieben. Die dritte Option ist eine einfache Suchmaske, wo man über die Zugangsnummer (accession number) eine Sequenz suchen kann. Über die Pulldown-Menüs können die Datenbasen, das Eingabe- und das Ausgabeformat gewählt werden.

    Abbildung 15: Suchmaske der einfachen Suche bei EMBL Dokumentation (http://www.ebi.ac.uk/embl/Documentation/index.html)

    2. SWISS-PROT (http://www.expasy.org/sprot/) Die SWISS-PROT-Datenbasis ist die Datenbasis für primäre Proteinsequenzen. Sie kann über verschiedene Suchmasken abgefragt werden. Neben dem Zugang über das Sequence Retrieval System (SRS) gibt es eine Volltextsuche, eine Expertensuche und Suchen über verschiedene Felder. Die Volltextsuche und die Expertensuche werden hier aufgeführt. Volltextsuche:

    Abbildung 16: Volltextsuche von SWISS-PROT Bei dieser Suche kann sowohl mit booleschen Operatoren als auch optional mit Wildcards gearbeitet werden.

  • Expertensuche:

    Abbildung 17: Expertensuche von SWISS-PROT Bei dieser Abfrageform kann die Abfrage noch stärker spezifiziert werden. Es kann der Name des Gens eingetragen werden und dieser kann über ein Pulldownmenü mit der Beschreibung über einen boolschen Operator verknüpft werden. Weiterhin kann noch ein Organismus ausgesucht werden. Sollte man sich nicht sicher sein, wie dieser geschrieben wird, kann dieser über ein Pulldownmenü selektiert werden. Auch die Ansicht der Resultate kann so spezifiziert werden. Dokumentation (http://www.expasy.org/sprot/sp-docu.html) 3. PROTEIN DATA BANK (PDB) (http://www.rcsb.org/pdb/)

    Die Proteindatenbank beinhaltet Daten für die dreidimensionalen Strukturen von Proteinen und Nukleotiden. Durch entsprechende Viewer (siehe auch www.aschomburg.de/Diplom/Kapitel_4.1.pdf (ab Seite 25)), von denen zwei im Punkt 15 im nächsten Artikel beschrieben werden, können diese sichtbar gemacht werden.

    Abbildung 18: Einstiegsseite bei der PDB

  • Auf der Einstiegsseite findet sich die Abfrage Search the Archive. Sie entspricht der SearchLite-Version.

    Abbildung 19: oberer Abschnitt der SearchLite-Maske der PDB Dies ist die einfache Suchmaske bei der PDB. Hier können Suchterme sowohl mit boolschen Termen verknüpft werden. Auch können bestimmte Felder aus der Datenbank ausgesucht werden. Dies geschieht durch nachgestellten Doppelpunkt nach dem Feldnamen. Beispiel: author: brown Die weitaus komplexere Suchmaske ist die Expertensuche bei der PDB.

  • Abbildung 20: SearchFields von der PDB Diese Suchmaske lässt sehr viel mehr Suchoptionen zu, sowohl was die Abfrage als auch die Ausgabe betrifft. Die Besonderheit bei der PDB ist, dass man sich die Suchmaske selber zusammenstellen kann.

    Abbildung 21: Erstellungsmaske für SearchFields von der PDB Durch Setzen der Häkchen kann eine angepasste Suchmaske erstellt werden. Eine weitere Möglichkeit der Suche ist die nach dem Status der unveröffentlichen Einträge.

  • Abbildung 22: Suchmaske des Status der unveröffentlichen Abbildungen Dokumentation (http://www.rcsb.org/pdb/info.html)

    4. BRENDA (http://www.brenda.uni-koeln.de) BRENDA ist eine Datenbasis, die speziell für Enzyme zuständig ist. Sie wird an der Universität Köln produziert. Als einzige von den hier beschriebenen Datenbasen braucht sie eine Zugangsberechtigung. Diese kann über ein Webformular angefordert werden und ist für Angehörige der Hochschulen kostenfrei.

  • Abbildung 23: Die Hauptseite von BRENDA Im oberen rechten Bereich gibt es eine einfache Suchmaske. Bei dieser kann mit Wildcards gearbeitet werden, so dass auch Linkstrunkierung möglich ist. Über die Links in der unteren Tabelle kommt man wieder zu jeweils einer Suchmaske pro Verweis. Das gleiche gilt für die Baumstruktur auf der linken Seite, die nur eine andere Abbildung der Tabellenstruktur ist. Die Baumstruktur kann, wie aus den verschiedenen Dateiverzeichnissen gewohnt, durch Anklicken der Ordner auf- und zugeklappt werden. Zusätzlich besteht die Möglichkeit, alle Ordner auf- bzw. zuzuklappen.

    Abbildung 24: Suchmaske für Enzymnamen

  • Über Pulldownmenüs kann die Art der Suche eingestellt werden, bzw. die Anzahl der maximalen angezeigten Treffer. Die einzelnen Felder sind über den AND-Operator verknüpft. Zusätzlich zu diesen Suchmasken gibt es noch die Expertensuche. Hier kann über zahlreiche Pulldownmenüs die Suche eingestellt werden. Durch Anhaken verschiedener Kategorien kann die Suche noch weiter spezifiziert werden.

  • Abbildung 25: Expertensuche bei BRENDA Dokumentation (http://www.brenda.uni-koeln.de/data.php4)

    Zu den Datenbanken SWISS-PROT und PDB (Versionen von 1998) gibt es eine weitere Beschreibung unter www.aschomburg.de/Diplom/Kapitel_4.2.pdf. 8) Retrievalsysteme Mit Hilfe der Retrievalsysteme kann gleichzeitig in einer Vielzahl von Datenbasen gesucht werden.

    1. Sequence Retrieval System 6 (SRS6) (z.B. http://srs.ebi.ac.uk/)

    Abbildung 26: Startseite des SRS6 auf dem EBI-Server

  • Das SRS6 liegt auf einer Reihe von Servern auf. Über eine Hauptmaske können alle Datenbasen abgehakt werden, die gleichzeitig abgefragt werden.

    Abbildung 27: Auswahlmaske von SRS6 Durch Anklicken der Pluszeichen können weitere Kategorien von Datenbasen zur Auswahl aufgeklappt werden. Am oberen Bildschirmrand befindet sich eine Schnellsuche. Am linken Bildschirmrand kann nach Auswahl mindestens einer Datenbasis zwischen der Standardsuchform und der erweiterten Suchform gewählt werden. Sie unterscheiden sich in der Anzahl und Spezifikation der Suchfelder.

  • Abbildung 28: Standardsuchmaske von SRS6

  • Abbildung 29: Erweiterte Suchform von SRS6 Eine Beschreibung zu dem SRS gibt es hier: http://srs.ebi.ac.uk/srs6bin/cgi-bin/wgetz?-page+docoPage+-newId

  • 2. Entrez (http://www.ncbi.nlm.nih.gov/Entrez/) Das Entrez-System verknüpft alle Datenbasen des NCBI-Servers.

    Abbildung 30: Übersicht der Datenbasen von Entrez Eine Übersicht der Datenbasen ist in der oberen Abbildung. Am oberen rechten Rand des Bildes kann der Datenbasencluster ausgewählt werden, in dem gesucht wird. In diesem Fall PubMed. Daneben befindet sich die Suchmaske für die Abfragen.

    Abbildung 31: Verlinkung der Datenbasen des Entrez-Systems

  • Dies beschreibt aber nur einen kleinen Ausschnitt aus den Suchmöglichkeiten von Entrez. Es gibt auch Kataloge von Strukturen und die Möglichkeit von Sequenzsuchen sowie weitere Möglichkeiten. Eine genauere Beschreibung würde aber den Umfang des Artikels sprengen. Die Dokumentation zu Entrez ist auf folgender Internetseite zu finden: http://www.ncbi.nlm.nih.gov/entrez/query/static/help/helpdoc.html