36th mtg in nibio

14
2014/9/30 36回統合DBミーティング Integrated MTG in NIBIO 1

Upload: maori-ito

Post on 14-Jul-2015

109 views

Category:

Science


4 download

TRANSCRIPT

Page 1: 36th mtg in NIBIO

2014/9/30

第36回統合DBミーティングIntegrated MTG in NIBIO

1

Page 2: 36th mtg in NIBIO

本日の予定

• Sagace

– アクセス解析

– 新規ファセット項目に加えるDBの是非について

– 進捗報告

• 医薬基盤研内のデータのRDF化

– 難病研究資源バンクのデータのRDF化について

– これまでRDF化したデータの疾患別傾向について

– 外部DBを繋げた検索について

2

Page 3: 36th mtg in NIBIO

新規ファセット項目に加えるDBの是非について

• メンバーの皆さんに調査結果をご報告頂きます。–担当したファセット分類の検索結果の印象

–各データベースの掲載の是非(特に非のものについて,その理由)

–その他気がついた点についての報告

3

Page 4: 36th mtg in NIBIO

医薬基盤研内のデータのRDF化

• 進捗報告–難病研究資源バンクのデータをRDF化

–難病研究資源バンク,実験動物研究資源バンク,希少疾病用医薬品にICD10を付与

– BioPortalのRay FergersonさんからICD10のttl

を入手

– DB毎にどの疾患が多いのか検索

– OMIMと統合して外部のデータを得る

4

Page 5: 36th mtg in NIBIO

難病研究資源バンクのRDF化

@prefix Medical_condition: <http://schema.org/MedicalCondition/> .

@prefix b2rv: <http://bio2rdf.org/bio2rdf_vocabulary:> .

@prefix BioLOD_property_pria315s16i: <http://purl.jp/bio/13/property/pria315s16i/> .

@prefix dbowl: <http://dbpedia.org/ontology/> .

@prefix NIBIO_raredis: <http://www.nibio.go.jp/rarediseaseVocabulary#> .

<http://raredis.nibio.go.jp/bioSample#27>

b2rv:namespace "rareDisease" ;

dbowl:icd10 "D44.1" ;

BioLOD_property_pria315s16i:Institute_Depositor

"京都医療センター"@ja ;

Medical_condition:name "非機能性副腎腫瘍"@ja , "Nonfunctioning adrenal tumor" ;

NIBIO_raredis:ID "0311" ;

NIBIO_raredis:bioSample "Plasma" .

5

Page 6: 36th mtg in NIBIO

難病研究資源バンクのRDF化

• 今後の予定– NIBIO_raredis:bioSample "Plasma" .

– 上記について適切なpredicate,objectのURIが見つかれば置き換えを検討する。

– データ構成,データの増大に合わせてRDFデータも作り変えていく。

– 今回は,ウェブページから表を取り出して作成

– 将来的にはウェブページにマークアップ,クローラーが同時にRDF作成が現実的?

6

Page 7: 36th mtg in NIBIO

ICD10の付与

例:希少疾病用医薬品の場合

以下の様なRDFをトリプルストアに入れると,既存のグラフ(下記ならば<http://www.nibio.go.jp/orphanDrugTarget#7>と統合してくれる。)

@prefix dbowl: <http://dbpedia.org/ontology/> .

@prefix Medical_condition: <http://schema.org/MedicalCondition/> .

<http://www.nibio.go.jp/orphanDrugTarget#7>

Medical_condition:name "動脈管開存症"@ja;

dbowl:icd10 "Q25.0".

7

Page 8: 36th mtg in NIBIO

BioPortal由来のICD10のttlファイル

@prefix skos: <http://www.w3.org/2004/02/skos/core#> .

@prefix owl: <http://www.w3.org/2002/07/owl#> .

@prefix rdfs: <http://www.w3.org/2000/01/rdf-schema#> .

@prefix xsd: <http://www.w3.org/2001/XMLSchema#> .

@prefix umls: <http://bioportal.bioontology.org/ontologies/umls/> .

<http://purl.bioontology.org/ontology/ICD10/S66.9>

a owl:Class ;

skos:prefLabel """Injury of unspecified muscle and tendon at wrist and hand level"""@en ;

skos:notation """S66.9"""^^xsd:string ;

rdfs:subClassOf <http://purl.bioontology.org/ontology/ICD10/S66> ;

umls:cui """C0478316"""^^xsd:string ;

umls:tui """T037"""^^xsd:string ;

umls:hasSTY <http://purl.bioontology.org/ontology/STY/T037> ;

8

Page 9: 36th mtg in NIBIO

検索例1つの疾患IDに幾つのデータが紐づくかデータベース毎に出力

prefix skos: <http://www.w3.org/2004/02/skos/core#>

prefix dbowl: <http://dbpedia.org/ontology/>

prefix b2rv: <http://bio2rdf.org/bio2rdf_vocabulary:>

select ?id ?name ?namespace (count(*) as ?count)

where

{

?s skos:prefLabel ?name;

skos:notation ?id.

?nibio_db dbowl:icd10 ?id;

b2rv:namespace ?namespace.

}

GROUP BY ?id ?name ?namespace

ORDER BY ?id

9

Page 10: 36th mtg in NIBIO

検索結果

10

Page 11: 36th mtg in NIBIO

OMIMとの統合ICD10をキーとしてOMIMのIDや疾患名,遺伝子名を出力

prefix dbowl: <http://dbpedia.org/ontology/>

prefix b2rv: <http://bio2rdf.org/bio2rdf_vocabulary:>

prefix b2ro: <http://bio2rdf.org/omim_vocabulary:>

PREFIX dcterms: <http://purl.org/dc/terms/>

select ?nibio_url ?icd10 ?omim_id ?title ?gene_name

where

{

?nibio_url dbowl:icd10 ?id.

BIND (xsd:string(?id) as ?icd10)

SERVICE<http://omim.bio2rdf.org/sparql>{

?s b2ro:x-icd10 ?o;

b2rv:identifier ?omim_id;

dcterms:title ?title;

b2ro:gene-name ?gene_name.

?o b2rv:identifier ?icd10.

}

}

11

Page 12: 36th mtg in NIBIO

検索結果

12

Page 13: 36th mtg in NIBIO

医薬基盤研内のデータのRDF化

• 外部DBを繋げた検索について– 特許のSPARQL Endpointは情報が不足している。

– Clinical Trialsは現状データを繋ぐとっかかりとなるIDがない。

– 実験動物研究資源バンクのデータとMGIのデータの統合• 系統名,遺伝子名ともにマッチするものが少ない。

• OMIM経由で繋ごうとしたが,一致するIDを見つけられず

– 複数のSPARQL Endpointを経由した検索は現状では難しい(調査継続)

13

Page 14: 36th mtg in NIBIO

今後の予定

• 次回– 10月24日(金)

• トーゴーの日– 10月5日(日)?

• BioHackathon 2014– 11月9日(日)〜14日(金)

• 分子生物学会– 11月25日(火)〜27日(木)

14