linked open dataチャレンジjapanを中心としたlodの事例紹介
TRANSCRIPT
Linked Open DataチャレンジJapanを中心とした LODの事例紹介
大阪大学産業科学研究所 古崎 晃司
第 1回 Linked Open Dataとオントロジー勉強会@大阪大学中之島センター, 2013年 4月 25日(木)
2013/4/25第 1回 LODとオントロジー勉強
会 1
自己紹介 古崎 晃司(こざき こうじ)
所属:大阪大学産業科学研究所 知識システム研究分野 准教授
専門分野 オントロジー工学 LODとのつながり
LODチャレンジ2011から実行委員として参加 実行委員参加のモチベーション
オントロジーは LODで用いる「語彙」の意味を定義する技術として“も”用いられる
LODをさらに高度化する技術としてオントロジー工学を活用したい 実施中の LOD関連プロジェクト
オントロジー構築環境「法造」の LOD対応 臨床医学オントロジーの LOD化 バイオミメティクデータベースの開発に LOD技術を利用
2013/4/25 第 1回 LODとオントロジー勉強会 2
講演内容 Linked Open Data( LOD)の概要
Linked Dataの技術的背景~ Semantic Web~
国内における LODおよびOpen Dataの動向 オープンガバメント 学術情報
LODチャレンジ Japanの紹介 開催の経緯 受賞作品の紹介 日本語で使える LOD
2013/4/25 第 1回 LODとオントロジー勉強会 3
Linked Open Data(LOD) Linked Data:Web上のデータを,つなぐ( linkする)ことで,新しい価値を生み出そうとする取り組み.Webの創始者Tim Berners-Lee氏が提唱
※ Linked Open Data(LOD):オープンな形で公開されたLinked Data
2013/4/25 第 1回 LODとオントロジー勉強会
http://linkeddata.org/
• 誰もが同じ方法で,「データをつなぐことができる仕組み」を提供している.• 技術的には, -データ公開の共通フォーマット( URIによる名前付け, RDFによるグラフ表現 -コンピュータが,データにアクセスする共通の仕組み が提供されている.→Web上に公開された膨大なデータを統合した1つのデータベースとして利用できる.
4
Linked Dataの技術的背景~ Semantic Webの概要~
Semantic Webとは 従来の「人が読む(理解する)ためのWeb」から,「コンピュータが理解(意味処理)可能なWeb」へ
技術的には, Web上のドキュメントにコンピュータによる意味処理に用いる「メタデータ」を付与する(タグを付ける)」
その際に用いるフォーマットが「RDF」 メタデータに用いる語彙を定義するのが「オントロジー」(RDFSやOWLで書かれる)
RDFで書かれたメタデータを検索するためのクエリー言語が「SPARQL」 ...
Semantic Webの学術的流れ The Semantic Web: Tim Berners-Lee, James Hendler and
Ora Lassila, Scientific American, May 17, 2001. Semantic Web Conference
Semantic Web分野のトップカンファレンス 2002~ 毎年開催2013/4/25 第 1回 LODとオントロジー勉強会 5
Layer Cake Semantic Webに必要な要素技術を階層状に表したもの
2013/4/25 第 1回 LODとオントロジー勉強会
http://www.w3.org/2001/09/06-ecdl/slide17-0.html
http://www.dajobe.org/talks/200905-redland/
6
Semantic Webの研究動向の変遷
研究動向(流行トピック)の変遷 語彙(オントロジー)に基づいたメタデータによる意味処理の実現 誰がメタデータを?→ Web2.0的共同構築 データ(インスタンス)の Linkの重視: Linked Data
2013/4/25 第 1回 LODとオントロジー勉強会
リッチな意味
記述
スケーラビリティ(大量データ)
Semantic Web (の理想 )
すぐに使えるタグを( RSS,FOAF)
SNS利用・ Web2.0
DBPedia× Linked Data
2004-2006
2007
2008-
7
TED Talk by Tim Berrners Lee (1) 2009/2 ~ Raw Data Now!~
2013/4/25 第 1回 LODとオントロジー勉強会
http://www.ted.com/talks/tim_berners_lee_on_the_next_web.html
データを抱え込むのでは無く,誰もが使えるように(オープンに)することを呼びかける= Raw Data Now !(生データをすぐに!)
8
TED Talk by Tim Berrners Lee (1) 2010/2 ~ LODの活用事例~
2013/4/25 第 1回 LODとオントロジー勉強会
http://www.ted.com/talks/tim_berners_lee_the_year_open_data_went_worldwide.html
オープンデータの活用事例を紹介・白人 / 黒人の住む家と水道管の整備状況 の相関を見える化→裁判で勝利へ・ Where does my money go? (税金はどこへ行った?)(英国) http://wheredoesmymoneygo.org/(横浜市) http://spending.jp/
9
Linked Dataが目指すこと WWW(World Wide Web)
文書を公開し,相互に接続(ハイパーリンクでつなぐ)ための革命的な仕組みを提供したことで,今日のWebの発展につながった.
Linked Data データを共有(公開)し,相互につなぐ仕組みを提供する. データ共有の3つの鍵
最も簡単に再利用可能なデータアクセスの提供方法は何か? 多数の使用可能なデータセット内で,関連するデータを発見可能にする方法は
何か? 以前は不明だった大量のデータ源からアプリケーションがデータ統合を行えるようにする方法は何か?
Linked Dataの原理 データの構造化
構造化されたデータはより洗練された処理を可能にする 分散したデータをつなぐハイパーリンク
文書単位では無く,データ単位のリンクを可能にする. データの島々から一つのグローバルデータ空間へ
データ間の接続の有無やデータの意味を具体化し共有する仕組みを導入することで,分散されたデータ群を1つのグローバルなデータ空間へ統合する
参考:「 Linked Data -Webをグローバルなデータ空間にする仕組み」 1 章.はじめに
2013/4/25 第 1回 LODとオントロジー勉強会 10
既に公開・リンクされている LOD~ LODクラウド~
2013/4/25 第 1回 LODとオントロジー勉強会
2007/5/12007/10/8
2008/9/182009/7/142010/9/22http://lod-cloud.net/
2011/9/19 時点
1つの丸が個別に公開された DBを表す.
参考:「 Linked Data-Webをグローバルなデータ空間にする仕組み」 3 章.データのWeb
マスメディア
地理情報
図書館・教育
ユーザ作成データ
政府情報クロス・ドメイン
ライフサイエンス
DBPedia
open.govopen.gov.uk
11
DBPedia
2013/4/25 第 1回 LODとオントロジー勉強会
Wikipediaの各記事のインフォボックスの情報を抽出して自動生成される LOD様々なデータをつなぐ LODのハブ的な存在となっている.
http://dbpedia.org/
日本語版の DBPediaはhttp://jp.dbpedia.org/
インフォボックスの例
12
2013/4/25 第 1回 LODとオントロジー勉強会
http://www.whitehouse.gov/open
アメリカ政府のオープンデータ公開サイト
13
2013/4/25 第 1回 LODとオントロジー勉強会
https://www.gov.uk/
イギリス政府のオープンデータ公開サイト
14
国内での LODに関する活動 学術的な取り組み
国立情報学研究所(NII) LODACプロジェクト:博物館情報,生物学辞書,など様々な学術術情報のLOD化 CiNii(文献DB),科研費DBをLODとして公開
JSTバイオサイエンスデータベースセンター(NBDC) Linked Dataの技術を用いたDBの公開を推進
理化学研究所 BioLOD:データベースをLODの形で公開 LinkData.org:LODを作成・公開する為の基盤を提供
オープンガバメント 電子行政オープンデータ戦略(2012/7/4) 経済産業省
オープンガバメントラボ,IT融合フォーラム 公共データワーキンググループ, Open Data METI(経産省のオープンデータ公開サイト)
総務省 オープンデータ流通推進コンソーシアム
地方自治体:地域情報のオープンデータ化 鯖江市,横浜市LOD,会津若松市,流山市,千葉市,...
その他:オープンデータを推進している団体 Linked Open Data Initiative Open Knowledge Foundation Japan Linked Open Data チャレンジ Japan
2013/4/25 第 1回 LODとオントロジー勉強会
日本では LODに関する学術的取り組みが先行
東日本大震災以降,政府のオープンデータへの取り組みが活発化
15
2013/4/25 第 1回 LODとオントロジー勉強会http://www.kantei.go.jp/jp/singi/it2/pdf/120704_siryou2.pdf 16
2013/4/25 第 1回 LODとオントロジー勉強会 17
2013/4/25 第 1回 LODとオントロジー勉強会
http://www.openlabs.go.jp/
18
2013/4/25 第 1回 LODとオントロジー勉強会
http://datameti.go.jp/
経済産業省が保有するデータをオープンデータとして公開することを実践するための試験サイト
LODチャレンジ Japan2012「オープンデータ推進賞」 19
2013/4/25 第 1回 LODとオントロジー勉強会
http://www.opendata.gr.jp/
オープンデータの流通を推進する環境を整備するために,産官学の共同で取り組む活動母体として設立されたコンソーシアム(2012年 7月 ) 20
2013/4/25 第 1回 LODとオントロジー勉強会
http://www.city.sabae.fukui.jp/pageview.html?id=11552
多くの行政情報をオープンデータとして公開し,それを用いたアプリケーションも多数開発されている.LODチャレンジ Japan2011「公共
LOD賞」LODチャレンジ Japan2012「人の流れ賞」
21
2013/4/25 第 1回 LODとオントロジー勉強会
http://www.facebook.com/yokohamaopendata
22
2013/4/25 第 1回 LODとオントロジー勉強会
ビッグデータ・オープンデータの活用に向けた協議会の設置:武雄市、千葉市、奈良市、福岡市( 50音順)( 2013年 4月 1日)
23
2013/4/25 第 1回 LODとオントロジー勉強会http://biosciencedbc.jp/ 24
2013/4/25 第 1回 LODとオントロジー勉強会http://biolod.org/
バイオインフォマティクスの様々なDBが LODの形で統合して提供されている.→ ダウンロードして詳細な分析も可能
25
2013/4/25 第 1回 LODとオントロジー勉強会 26
http://linkdata.org/
テーブル形式のデータからLODに変換・公開できるサイト
LODチャレンジ Japan2011「アプリケーション部門最優秀
賞」
2013/4/25 第 1回 LODとオントロジー勉強会
国内の博物館情報を LODの形で統合
「博物館の標本データ」と「種名・分類」を統合する試み→ 外部データとも連係
http://lod.ac/27
2013/4/25 第 1回 LODとオントロジー勉強会
http://www.catalogueoflife.org/
http://eol.org/
http://www.boldsystems.org/
http://www.freebase.com/
http://dbpedia.org
複数の外部データベースに対する統合検索を実現
28
2013/4/25 第 1回 LODとオントロジー勉強会 29
http://okfn.jp/
2013/4/25 第 1回 LODとオントロジー勉強会 30
Linked Open Data Initiative 特定非営利活動法人リンクト・オープン・データ・イニシアティブ
http://linkedopendata.jp/
LODチャレンジ Japan開催の経緯
2013/4/25 第 1回 LODとオントロジー勉強会 31
2006- Linked (Open) Dataに関する活動が欧米を中心に活性化 .
e.g. DBPedia was presented at ISWC2007 and WWW2007 2009-2010
セマンティックウェブ委員会にて,Linked Dataの動向について調査. 日本が周回遅れの現状にあることを認識.
2011 Mar. セマンティックWebコンファレンス2011にて,Linked Open Data チャレンジ Japan2011の開催を宣言.同時に実行委員の募集.
2011 June 第1回LODチャレンジ実行委員会開催 .
2011 Oct. LODチャレンジ Japanの募集開始 !
2012 Mar. Linked Open Data チャレンジ Japan2011表彰式 .
→Linked Open Data チャレンジ Japan2012の開催決定 .…
2013/4/25 第 1回 LODとオントロジー勉強会http://lod.sfc.keio.ac.jp/challenge2011/
様々な分野から 73件の作品が応募される
LODによる,領域を超えたデータの相互連携に向けたショウケースとなることが期待される
32
31 34 18
Numbers of Submissions
Total 73 submissions by 84 persons/groups Cf. Open Data Challenge 2011 in Europe
430 submissions from 24 countries = 20 / country
05/01/2023
Dataset track31
Idea track34
Application track18
Linked Open Data チャレンジ Japan 2011 受賞作品(一部) アプリケーション部門最優秀賞
最優秀賞 LinkData.jp 優秀賞 ミュージアムへ行こう!
データセット部門最優秀賞 最優秀賞 saveMLAK 優秀賞 Location Site of Japanimation
アイデア部門最優秀賞 最優秀賞 つながる教科書 優秀賞 地域サービス LOD
2013/4/25 第 1回 LODとオントロジー勉強会 34
2013/4/25 第 1回 LODとオントロジー勉強会
アプリケーション部門優秀賞ミュージアムへ行こう!上田 洋
35
Dataset Track: The best Prize saveMLAK
05/01/2023
Information of rescue and support for the Museums, Libraries, Archives and Kominkans (MLAK) in Japan saveMLAK is a website about the
Museums (including art galleries, science centers, aquariums, zoos, botanical gardens, etc.), Libraries, Archives and Kouminkans(community centers) (MLAK) in Japan stricken by 2011 Tōhoku earthquake and tsunami.
We are gathering the information on the damages of those facilities in the disaster area and publishing the requests for assistance from the victims.( http://savemlak.jp/)
2013/4/25 第 1回 LODとオントロジー勉強会
goo賞Yokohama Art Spot松村 冬子
37
Idea Track: The best Prize Linkable Textbook (つながる教科書 )
05/01/2023
Plant
Technology
News
History Food
EventTransportation
Textbook which provides links with all related information based on geographical information.
Basic Idea: Learn as linked information.
LOD Challenge Japan2012
05/01/2023
What’s New A New Track
ビジュアライゼーション部門の新設 New Sponsors
Platinum Sponsors: 3 → 5 Gold Sponsors: 5 → 9 データ提供パートナー: 3 → 9 基盤提供パートナー :(NEW) 3 メディアパートナー: 1 → 2
賞金総額 100 万円 → 160 万円
LOD チャレンジデー 4 events (3 in 東京 , 1 in 大阪 ) →10 events ( 東京 , 名古屋 , 鯖江 , 横浜 , 奈良 , 函館 )
05/01/2023
Linked Open Data チャレンジ Japan 2012 受賞作品(一部)
アプリケーション部門 最優秀賞
SparqlEPCU,WebDocManager,LOD Browser 優秀賞
Where Does My Money Go? 日本語版 データセット部門
最優秀賞 depicts.azurewebsites.net 優秀賞 日本語Wikipediaオントロジー
アイデア部門 最優秀賞
函館の歴史資料を用いた市民に新たな発見がある写真検索システム 優秀賞 猫の手も借り隊
ビジュアライゼーション部門 最優秀賞 東日本大震災アーカイブ 優秀賞 エレクトリカル・ジャパン2013/4/25 第 1回 LODとオントロジー勉強会 41
http://lod.sfc.keio.ac.jp/blog/?p=1071
2013/4/25 第 1回 LODとオントロジー勉強会 42
http://lodcu.cs.chubu.ac.jp/SparqlEPCU/
JavaScriptを用いてLODを活用したアプリケーションが開発できるサイト
LODチャレンジ Japan2012「アプリケーション部門最優秀
賞」
LODチャレンジ Japan 2012疾患連鎖 LOD「異常状態の因果連鎖」に基づいた疾患定義と,その患者に典型的に見られる異常状態(原因や症状)の因果連鎖について,臨床医によって記述されたデータセットです.・各疾患がどのような原因で発症し,どのような症状を引き起こすか?・異常がどのような因果連鎖を経て,どのような状態を引き起こし,どのような疾患となるか? … といった情報を得ることが出来ます.
古崎 晃司,加藤 敦丈(大阪大学)今井 健,大江 和彦(東京大学) 溝口 理一郎(北陸先端科学技術大学院大学)
Linked Open Data チャレンジ Japan 2012において「ライフサイエンス賞」を受賞!
データ数・ 6つの診療科の代表的な 約 1,800の疾患定義・それらの弛緩に含まれる, 約 11,500の異常状態の 間の因果関係公開サービスhttp://lodc.med-ontology.jp/・疾患連鎖 LOD Viewer・ SPARQL Endpoint
疾患連鎖 LOD Viewer・疾患連鎖の可視化システム・疾患名,含まれる異常状態名での疾患検索 +可視化が可能疾患定義
因果関係因果関係異常状態
日本語で“今”使える LOD DBPedia Japanense
http://ja.dbpedia.org/ 日本語LODのハブとして多くのデータから参照されている.
DBPedia(英語版) http://dbpedia.org/ 各言語版のDBPediaとのリンクの活用が可能
日本語Wikipediaオントロジー http://www.wikipediaontology.org/index.html インフォボックスに加え,よりリッチな情報を含んだオントロジーを提供.
CiNii http://ci.nii.ac.jp/ 日本語文献の情報をLODとして取得可能
KAKEN - 科学研究費助成事業データベース http://kaken.nii.ac.jp/ 研究者・研究課題の情報をLODとして取得可能
CKAN日本語 http://data.linkedopendata.jp/ 日本のオープンデータのカタログサイト.
LinkData.org http://linkdata.org/ 簡単な操作でRDFを公開することがサイト.Web上でアプリケーションを開発する機能も有り.
2013/4/25 第 1回 LODとオントロジー勉強会 44
既に多くのデータが LODとして
まとめに変えて 国内におけるLODの現状
既に多くのLODが日本語で公開されており,その活用の基盤が整ってきたと言える段階にあると言える.
今後,オープンデータのLOD化もより推進されると期待される. これらのLODの「おもろい活用事例」が求められている!
LODへの関わり方(の一例) まずは公開されているLODを眺めてみる.
SPARQLエンドポイント,簡易検索ツールの利用 おもろいデータの組み合わせを考えてみる おもろいアイデアが思いつけば何か作ってみる.
LinkDataApps,SparqlEPCU (LODチャレンジ Japan2013が開催されることになれば…)
LODチャレンジデー in大阪の開催(参加,運営) LODチャレンジへのエントリー! ...願わくば,賞を獲得!
2013/4/25 第 1回 LODとオントロジー勉強会 45
参考資料 Semantic WebからLinked Dataへの変遷
Linked Open Dataで広がるデータ統合 萩野 達也,トーゴーの日シンポジウム2011,2011/10/5 http://events.biosciencedbc.jp/sympo/togo2011/program/2
Semantic Web Conferenceに見るLinked Open Dataの国際動向 古崎晃司,第1回LODチャレンジデー in大阪,2011/12/3 http://www.slideshare.net/KoujiKozaki/semantic-web-conferencelinked-open-data
経済産業省のオープンデータに関する取り組み ウェブ・データ利活用の高度化による新しい公共の姿について
守谷 学 (経済産業省 商務情報政策局 情報政策課情報プロジェクト室 ),セマンティックWebコンファレンス2012, 2012/3/8
http://s-web.sfc.keio.ac.jp/conference2012/index.html 「オープンデータに関する経済産業省の取組について」
岡田 武 (経済産業省 商務情報政策局 情報政策課情報プロジェクト室 ),セマンティックWebコンファレンス2013, 2013/3/7
http://s-web.sfc.keio.ac.jp/conference2013/index.html LODに関する入門資料
LOD技術解説(LODチャレンジ2012サイト内) http://lod.sfc.keio.ac.jp/challenge2012/slideresources2.html
Linked Dataでつながるデータ(東京地方でのLinked Data勉強会の資料あり) http://linkeddata.jp/
2013/4/25 第 1回 LODとオントロジー勉強会 46