140201josoken linkeddata
DESCRIPTION
TRANSCRIPT
レビュー『Linked Data: Webをグローバルなデータ空間にする仕組み』
小村 愛美(神戸大学)
• 自己紹介
神戸大学附属図書館 所属
• 業務経験:サービス担当
リポジトリ・デジタルアーカイブ担当
・目録経験:なし
・コーディング?プログラミング??
・LODの理解: ・ ・ ・
技術的な解説はできない
・勉強中。LOD関連の情報紹介、疑問の共有など
できれば
・会場からも補足などいただきたい
本日のお話1.勉強会紹介
2.『Linked Data: Webをグローバルなデータ空間にする仕組み』 紹介
休憩
3. Linked Dataに関する + α
4. 質疑・ディスカッション
勉強会『Linked Data』輪読• 2013年7月~ 月1回ペース(全6回)
• 2~3ページずつ輪読
• 開催記録:
情報組織化研究グループ勉強会記録(2013年度)
http://josoken.digick.jp/study/2013/2013.html#06
『Linked Data: Webをグローバルなデータ空間にする仕組み』 近代科学社,2013.1
!原書:
『Linked Data: Evolving the Web into a Global Data
Space』 2011.1
著者:
Tom Heath (Head of Research / The Open Data Institute / UK) Christian Bizer (Freie Universität Berlin/ Germany)
『Linked Data』 紹介
『Linked Data』 紹介• 1章 はじめに
• 2章 Linked Dataの基本原則
• 3章 データのWeb
• 4章 つながるデータをデザインしよう
• 5章 Linked Data公開のレシピ
• 6章 Linked Dataを利用する
• 7章 まとめと展望
!➢架空企業“BIG LYNX社”をシナリオにRDF記述例
➢実際の公開データセットetc.紹介
➢図書館のデータへの言及も(p.38 3.2.5)
1章 はじめに➢ データの氾濫:Web企業 マスメディア
公的機関 研究団体etc. の
データ公開・共有
⇒ データの大洪水
第三者のビジネス ⇒ データへの需要
➢ Linked Dataの原理
構造化データ:
定型的な構造=簡単に再利用
公開方法(既存):
microformats, Web API(XML, JSON)
⇒ それぞれに制約
1章 はじめに➢よりよいデータモデル:
RDF(Resource Description Framework) ・異なるデータ源にあるデータ同士を
リンク可能
・データとデータの関係性を記述できる
2章 Linked Dataの基本原則1. あらゆる事物にURIを付与すること。
2. 誰でも事物の内容が確認できるように、URIはHTTP経由で参照できること。
3. URIを参照した時は、標準の技術(RDFやSPARQL等)
を使用して関係する有用な情報を利用できるようにすること。
4. より多くの事物を発見できるように他のURIへのリンクを含めること。
2章 Linked Dataの基本原則
➢Webの仕組みを構成する標準
URI・HTTP・HTML・ハイパーリンク
➢Linked Dataは、Webの構成をデータ共有に
適用したもの。
Webと異なるもの/Webに存在しなかった
ものを新たに追加するものではない。
原則1. あらゆる事物にURIを付与すること。
➢ 記述するデータ・事物・概念などをURIで
同定
!原則2. 誰でも事物の内容が確認できるように、
URIはHTTP経由で参照できること。
➢ HTTP:WebでHTML文書の同定に使用。
Linked Dataでは記述する対象の同定に使用。
2章 Linked Dataの基本原則
原則3. URIを参照した時は、標準の技術(RDF
やSPARQL等)を使用して関係する有用な情報を利用できるようにすること。
!➢構造化データの公開:RDFの使用を推奨
2章 Linked Dataの基本原則
原則3.
➢RDFのシリアル化形式:
・RDF/XML
・RDFa
・Turtle
・N-Triples
・RDF/JSON
cf. DBpediaリソース“Raw Data”(各形式のサンプル)
2章 Linked Dataの基本原則
原則4. より多くの事物を発見できるように他のURIへのリンクを含めること。
➢他のデータ源へのリンクを含める
=データ源同士をつなぐ
➢リンクの種類
1. 関係リンク
2. 同一性リンク
3. 語彙リンク
2章 Linked Dataの基本原則
2章 Linked Dataの基本原則
➢ Linked Data 公開の段階
オープンライセンス
(データ形式不問)
機械可読の構造化形式
汎用的な形式
☆3+
RDFを使用
☆4+
他のデータ源とリンク
3章 データのWeb
➢データのWeb ⇔ 文書のWeb(従来のWeb)
➢「何十億ものRDF文から成る巨大でグローバルなグラフ」
➢データのトピック:
地理情報・人物・企業・出版物・画像・音楽・映像・化学物質・薬物・統計・コミュニティ・・・
→ あらゆる分野
3章 データのWeb
The Linking Open Data cloud diagram(http://lod-cloud.net/) 2011年9月時点
4章 つながるデータをデザインしよう
➢URIを発行
➢URIの例
・事物を表現する=3つのURIが必要(2.3.1項)
1. 事物そのものを表現するURI
2. 事物をHTMLによって記述した文書のURI
3. 事物をRDF/XMLによって記述したデータのURI
➢DBpediaの例
1.http://dbpedia.org/resource/Wildlife_photography
2.http://dbpedia.org/page/Wildlife_photography
3.http://dbpedia.org/data/Wildlife_photography
※RDF形式とHTML形式の区別がつきにくい
➢拡張子を付与するパターン(一般的)
1. http://biglinx.co.uk/people/dave-smith 2. http://biglinx.co.uk/people/dave-smith.html 3. http://biglinx.co.uk/people/dave-smith.rdf
4章 つながるデータをデザインしよう
Wikipedia → DBpediainfobox
DBpedia Japanese
DBpedia Japanese(RDF/XML)
➢データセットの記述
製作者・更新状況・適用ライセンス
・データの利用者にとって重要
➢ライセンス・権利放棄の重要性
・ライセンスが明示されていない
= データの再利用を妨げる
・Web上の一般的なライセンス
= クリエイティブ・コモンズ・ライセンス
4章 つながるデータをデザインしよう
• データ記述の語彙
RDFS:基本。RDFSだけで十分なことも多い
OWL: sameAs 重要。2つのURIが同じ事物を指していることを記述する時に使用。
cf. 2.5.2節(p.24)
"25
4章 つながるデータをデザインしよう
• 既存用語・語彙の再利用
• 既存用語を使う=データが使われやすくなる
• 推奨語彙:
DCMI:Dublin Core Metadata Initiative Metadata Terms Vocabulary FOAF:Friend-of-a-friend Vocabulary etc.
"26
4章 つながるデータをデザインしよう
5章 Linked Data公開のレシピ➢公開パターン
・リレーショナルデータベースから
ラッパを用いてRDF変換
代表的なラッパ:D2R Server
・静的な構造化データから
CSV, Excel, XML etc. RDF化ツール 参照ページ:
ConverterToRdf, RDFizers
ConverterToRdf
RDFizers
• Linked Data公開時のチェック事項
• 他のデータセットにリンクしているか?
• 一次情報源データと由来のメタデータを提供しているか?
• 普及している既存の語彙から用語を採っているか?
• データセットのメタデータを提供しているか?
"30
5章 Linked Data公開のレシピ
6章 Linked Dataを利用する➢既存のアプリケーション
•汎用的アプリケーション
• Linked Dataブラウザ
Disco Hyperdata Browser, Tabulator, Marbles
• Linked Data検索エンジン
Sig.ma, Falcons, SWSE etc. Google, Yahoo! etc. – リッチスニペット
➢既存のアプリケーション
•分野に特化したアプリケーション
•政府データ関連のアプリケーションリスト:data.gov, data.gov.uk
サイト上にリスト
• DBpedia Mobile:スマートフォンのGPS情報 × DBpediaの近隣情報
6章 Linked Dataを利用する
data.gov
"33
data.gov.uk
"34
➢読み終えて…
•Linked Dataの概念はわかった
「データをより使いやすい形で公開・共有する方法論」
•技術に関する部分はまだ難しい
•実際にデータを触りながら読んだ方が理解が進む図書では
➢勉強会:今後どう進める?
RDA、FRBR関連の文献輪読BIBFRAME関係の文献輪読
文献リストのLOD化
などのアイデア
*会場・作業環境が課題?
➢図書館のデータ:高度に構造化(3.2.5)
Linked Dataと親和性は高い
•VIAF (Virtual International Authority File) •RDA (Resource Description and Access) •国立国会図書館:Web NDL Authorities
•大学図書館:「NII 総合目録データベースのデータ公開に関するパブリックコメント募集」
http://www.nii.ac.jp/CAT-ILL/about/project/od2013/
VIAF
"38
Web NDL Authorities
"39
Linked Dataに関する + α
➢第2回 Linked Open Data(LOD)とオントロジー勉強会
2013.8.5 (http://kokucheese.com/event/index/101729/) ➢情報組織化研究グループ月例研究会
「Linked Open Dataの基礎とこれからの情報活用」
2013.9.21 (http://josoken.digick.jp/meeting/2013/201309.html) ➢第2回Linked Open Dataハッカソン関西 in 大阪
2013.12.6 (http://peatix.com/event/23486)
Linked Dataに関する + α
• Linked Dataを使い始めるにあたって
公開ずみのデータを眺める
ex.) DBpedia Japanese, 日本語Wikipediaオントロジー研究ページ,CKAN日本語
• Linked Data公開・活用支援
• LinkData.org:データをアップ→オープンデータ化
アプリケーションの作成も
• OPEN Refine:数万件規模のデータをLinked Data化"43
DBpedia Japanese(RDF/XML)
"45
"46
"47
"48
"49
"50
"51
Linked Dataに関する + α
• 関連の研究会・イベントは増えている
ex.)LODチャレンジ
インターナショナルオープンデータデイ
• 公的機関情報のオープンデータ化の加速
cf.) G8オープンデータ憲章 (2013.6)
data.go.jp •図書館データのオープン化:大きくはこれらの流れとつながる "52
"53
"54
Linked Dataに関する + α
• 研究会参加で感じること
間口を広げ、より普及させよう
ex.) 公開・活用支援サイト
•初期の関係者から、一般へと拡大
素人でも入っていきやすくなっている
"55
ご清聴ありがとうございました
"56