Ε ΘΝΙΚΟ Μ ΕΤΣΟΒΙΟ Π ΟΛΥΤΕΧΝΕΙΟ Σ χολή Η λεκτρολόγων Μ...
Post on 18-Jan-2016
46 Views
Preview:
DESCRIPTION
TRANSCRIPT
ΕΘΝΙΚΟ ΜΕΤΣΟΒΙΟ ΠΟΛΥΤΕΧΝΕΙΟΣχολή Ηλεκτρολόγων Μηχανικών και Μηχανικών ΥπολογιστώνΤομέας Τεχνολογίας Πληροφορικής και Υπολογιστών
Διπλωματική Εργασία
DIANA 2.0: Προηγμένη Εφαρμογή Ιστού Διαχείρισης Δεδομένων Βιοεπιστημών
Φωτοπούλου Χ. Γεωργία
Επίβλεψη: Τιμολέων Σελλής
12 Ιουλίου 2010
Φωτοπούλου Γεωργία 1
Υπόβαρθο
DNA
Φωτοπούλου Γεωργία 1
Υπόβαρθο
DNA
mRNA
Φωτοπούλου Γεωργία 1
Υπόβαρθο
DNA
mRNA
πρωτεϊνη
Φωτοπούλου Γεωργία 1
Υπόβαρθο
DNA
mRNA
πρωτεϊνη
γονίδιο ↔ mRNA
Φωτοπούλου Γεωργία 2
Υπόβαρθο
microRNA
στόχοι
πειραματικές και υπολογιστές τεχνικές
Ε.Κ. Βιοϊατρικών Επιστημών “Αλέξανδρος Φλέμινγκ”
Φωτοπούλου Γεωργία 3
Αρχιτεκτονική
Φωτοπούλου Γεωργία 4
Αποφάσεις
Ανάλυση απαιτήσεων → Περιπτώσεις χρήσης
Σχεδιασμός → Model-View-Controller (MVC)
Yλοποίηση → Apache+MySQL+PHP+Yii
Αξιολόγηση/Έλεγχος → Σενάρια εκτέλεσης
Φωτοπούλου Γεωργία 5
Χαρακτηριστικά DIANA 2.0
Αναζήτηση βιολογικών στόχων
Παροχή προτάσεων σε λανθασμένους όρους
Προβολή στόχων με βάση άλλους αλγορίθμους
Περιβάλλον διαχείρισης χρηστών
Φωτοπούλου Γεωργία 6
Αναζήτηση βιολογικών στόχων Υποστήριξη όρων διαφόρων τύπων
- όνομα microRNAπχ “hsa-let-7e”
- κωδικός ΜΙΜΑ microRNAπχ “ΜΙΜΑΤ0000062” ή “MI0000401”
- όνομα γονιδίου πχ “FIGN”
- κωδικός ENSEMBL γονιδίουπχ ENSG00000000005 ή ENSMUSG00000070000
- κωδικός TRANSCRIPT γονιδίουπχ ENST00000400000 ή ENSMUST00000020000
- κωδικός Refseq γονιδίουπχ XM_905004 ή XR_002000 ή NM_012001 ή NR_000003
Απλοποίηση
Φωτοπούλου Γεωργία 7
Παροχή προτάσεων Εξοικονομεί μνήμη και χρόνο
Μαντεύει
Εκμεταλλεύεται τη δομή των όρων
Χρησιμοποιεί συντακτική απόσταση LevenshteinL(seq1,seq2) = #delete + #insert + #substitution
πχ L (foo, fo) = 1 → 1 deleteL (hat, cat) = 1 → 1 substitution L (beta, res) = 3 → 1 insert, 2 substitutions
Φωτοπούλου Γεωργία 8
tokenizationπχ hsa-let-100g → 4 tokens
db-tokens
hsa → Ναι let → Ναι 100 → Ναι g → Όχι
Παροχή προτάσεων – microRNA ονόματα
Φωτοπούλου Γεωργία 8
tokenizationπχ hsa-let-100g → 4 tokens
db-tokens
hsa → Ναι let → Ναι 100 → Ναι g → Όχι
Παροχή προτάσεων – microRNA ονόματα
Φωτοπούλου Γεωργία 9
ranking
Λίστα “Ναι”: σκορ εμφάνισης
[(hsa-let-7i → 2), (hsa-mir-95 → 1), (mmu-mir-100 → 1)]
Λίστα “Όχι”: απόσταση levenshtein
[(hsa-let-7i → 1)]
normalization
Λίστα “Ναι” : (item / #tokens)*0.5
[(hsa-let-7i → 0.25), (hsa-mir-95 → 0.125), (mmu-mir-100 → 0.125)]
Λίστα “Όχι”: (item / min_levenshtein) * 0.5]
[(hsa-let-7i → 0.5)]
Παροχή προτάσεων – microRNA ονόματα
Φωτοπούλου Γεωργία 10
merge
merged_list = [(hsa-let-7i → 0.75),(hsa-mir-95 → 0.125),(mmu-mir-100 → 0.125)]
suggest top-k terms
για k=2:- hsa-let-7i- hsa-mir-95
Παροχή προτάσεων – microRNA ονόματα
Φωτοπούλου Γεωργία 11
βασική μορφή- Κωδικός ΜΙΜΑ: ΜΙΜΑΤ ή ΜΙ + 7 ψηφία - Κωδικός ENSEMBL: ΕNSG ή ENSMUSG + 11 ψηφία - Κωδικός TRANSCRIPT: ENST ή ENSMUST + 11 ψηφία- Κωδικός Refseq: XM_ ή XR_ ή ΝΜ_ ή NR_ + ψηφία
tokenization - πχ ΜΙΜΑΤ0087 → MIMAT και 0087
σταθεροποίηση αριθμού ψηφίων- πχ 0087 → 0000087- πχ 00000000087 → 0000087
levenshtein -πχ 0000087 → 0000097, 0000017, 0000117 κοκ
concatenation0087 → ΜΙΜΑΤ0000097, ΜΙΜΑΤ0000017, ΜΙΜΑΤ0000117
Παροχή προτάσεων – κωδικοί
Φωτοπούλου Γεωργία 12
τελική περίπτωση
levenshtein
Παροχή προτάσεων – όνομα γονιδίου
Φωτοπούλου Γεωργία 13
Εμφάνιση κατάλληλου συνδέσμου στη λίστα αποτελεσμάτων
Δεν υποστηριζόταν στην προηγούμενη έκδοση
Προβολή στόχων άλλων αλγορίθμων
Φωτοπούλου Γεωργία 14
Προβολή λίστας χρηστών Τροποποίηση στοιχείων χρήστη
Διαγραφή χρήστη
Πρόσθεση νέου χρήστη
Ανέβασμα αρχείων στόχων
Περιβάλλον διαχείρισης
Φωτοπούλου Γεωργία 15
Εύχρηστο περιβάλλον διαχείρισης
Απλοποιημένος μηχανισμός αναζητήσεων
Βελτιωμένος μηχανισμός παροχής προτάσεων
Συγκριτική παρουσίαση προβλέψεων με βάση άλλους αλγορίθμους
Διευκόλυνση μελλοντικών επεκτάσεων λόγω τεκμηρίωσης
Συνεισφορά
Φωτοπούλου Γεωργία 16
Ακολουθεί επίδειξη της εφαρμογής DIANA 2.0 ...
Φωτοπούλου Γεωργία 17
Ερωτήσεις;
Φωτοπούλου Γεωργία 18
Ευχαριστώ!
top related