140201josoken linkeddata

54
レビュー Linked Data: Webをグローバ ルなデータ空間にする仕組み』 小村 愛美(神戸大学)

Upload: itsumi-komura

Post on 14-Dec-2014

1.231 views

Category:

Technology


2 download

DESCRIPTION

 

TRANSCRIPT

Page 1: 140201josoken linkeddata

レビュー『Linked Data: Webをグローバルなデータ空間にする仕組み』

小村 愛美(神戸大学)

Page 2: 140201josoken linkeddata

• 自己紹介

  神戸大学附属図書館 所属

• 業務経験:サービス担当

      リポジトリ・デジタルアーカイブ担当

・目録経験:なし

・コーディング?プログラミング??

・LODの理解: ・ ・ ・

技術的な解説はできない

・勉強中。LOD関連の情報紹介、疑問の共有など

できれば

・会場からも補足などいただきたい

Page 3: 140201josoken linkeddata

本日のお話1.勉強会紹介

2.『Linked Data: Webをグローバルなデータ空間にする仕組み』 紹介

    休憩

3. Linked Dataに関する + α

4. 質疑・ディスカッション

Page 4: 140201josoken linkeddata

勉強会『Linked Data』輪読• 2013年7月~ 月1回ペース(全6回)

• 2~3ページずつ輪読

• 開催記録:

情報組織化研究グループ勉強会記録(2013年度)

http://josoken.digick.jp/study/2013/2013.html#06

Page 5: 140201josoken linkeddata

『Linked Data: Webをグローバルなデータ空間にする仕組み』 近代科学社,2013.1

!原書:

『Linked Data: Evolving the Web into a Global Data

Space』 2011.1

著者:

Tom Heath (Head of Research / The Open Data Institute / UK) Christian Bizer (Freie Universität Berlin/ Germany)

『Linked Data』 紹介

Page 6: 140201josoken linkeddata

『Linked Data』 紹介• 1章 はじめに

• 2章 Linked Dataの基本原則

• 3章 データのWeb

• 4章 つながるデータをデザインしよう

• 5章 Linked Data公開のレシピ

• 6章 Linked Dataを利用する

• 7章 まとめと展望

!➢架空企業“BIG LYNX社”をシナリオにRDF記述例

➢実際の公開データセットetc.紹介

➢図書館のデータへの言及も(p.38 3.2.5)

Page 7: 140201josoken linkeddata

1章 はじめに➢ データの氾濫:Web企業 マスメディア 

         公的機関 研究団体etc. の

         データ公開・共有

                 ⇒ データの大洪水

    第三者のビジネス ⇒ データへの需要

➢ Linked Dataの原理

   構造化データ: 

    定型的な構造=簡単に再利用

公開方法(既存):

     microformats, Web API(XML, JSON)

     ⇒ それぞれに制約

Page 8: 140201josoken linkeddata

1章 はじめに➢よりよいデータモデル:

 RDF(Resource Description Framework)  ・異なるデータ源にあるデータ同士を

リンク可能

 ・データとデータの関係性を記述できる

Page 9: 140201josoken linkeddata

2章 Linked Dataの基本原則1. あらゆる事物にURIを付与すること。

2. 誰でも事物の内容が確認できるように、URIはHTTP経由で参照できること。

3. URIを参照した時は、標準の技術(RDFやSPARQL等)

を使用して関係する有用な情報を利用できるようにすること。

4. より多くの事物を発見できるように他のURIへのリンクを含めること。

Page 10: 140201josoken linkeddata

2章 Linked Dataの基本原則

➢Webの仕組みを構成する標準

  URI・HTTP・HTML・ハイパーリンク

➢Linked Dataは、Webの構成をデータ共有に

 適用したもの。

 Webと異なるもの/Webに存在しなかった

 ものを新たに追加するものではない。

Page 11: 140201josoken linkeddata

原則1. あらゆる事物にURIを付与すること。

➢  記述するデータ・事物・概念などをURIで

同定

!原則2. 誰でも事物の内容が確認できるように、  

   URIはHTTP経由で参照できること。

➢ HTTP:WebでHTML文書の同定に使用。

  Linked Dataでは記述する対象の同定に使用。

  

2章 Linked Dataの基本原則

Page 12: 140201josoken linkeddata

原則3. URIを参照した時は、標準の技術(RDF

やSPARQL等)を使用して関係する有用な情報を利用できるようにすること。

!➢構造化データの公開:RDFの使用を推奨

2章 Linked Dataの基本原則

Page 13: 140201josoken linkeddata

原則3.

➢RDFのシリアル化形式:

・RDF/XML

・RDFa

・Turtle

・N-Triples

・RDF/JSON

cf. DBpediaリソース“Raw Data”(各形式のサンプル)

2章 Linked Dataの基本原則

Page 14: 140201josoken linkeddata

原則4. より多くの事物を発見できるように他のURIへのリンクを含めること。

➢他のデータ源へのリンクを含める

  =データ源同士をつなぐ

➢リンクの種類

 1. 関係リンク

 2. 同一性リンク

 3. 語彙リンク

2章 Linked Dataの基本原則

Page 15: 140201josoken linkeddata

2章 Linked Dataの基本原則

➢ Linked Data 公開の段階

オープンライセンス

(データ形式不問)

機械可読の構造化形式

汎用的な形式

☆3+

RDFを使用

☆4+

他のデータ源とリンク

Page 16: 140201josoken linkeddata

3章 データのWeb

➢データのWeb ⇔ 文書のWeb(従来のWeb)

➢「何十億ものRDF文から成る巨大でグローバルなグラフ」

➢データのトピック:

地理情報・人物・企業・出版物・画像・音楽・映像・化学物質・薬物・統計・コミュニティ・・・

→ あらゆる分野

Page 17: 140201josoken linkeddata

3章 データのWeb

The Linking Open Data cloud diagram(http://lod-cloud.net/) 2011年9月時点

Page 18: 140201josoken linkeddata

4章 つながるデータをデザインしよう

➢URIを発行

➢URIの例

・事物を表現する=3つのURIが必要(2.3.1項)

1. 事物そのものを表現するURI

2. 事物をHTMLによって記述した文書のURI

3. 事物をRDF/XMLによって記述したデータのURI

Page 19: 140201josoken linkeddata

➢DBpediaの例

1.http://dbpedia.org/resource/Wildlife_photography

2.http://dbpedia.org/page/Wildlife_photography

3.http://dbpedia.org/data/Wildlife_photography

  ※RDF形式とHTML形式の区別がつきにくい

➢拡張子を付与するパターン(一般的)

1. http://biglinx.co.uk/people/dave-smith 2. http://biglinx.co.uk/people/dave-smith.html 3. http://biglinx.co.uk/people/dave-smith.rdf

4章 つながるデータをデザインしよう

Page 20: 140201josoken linkeddata

DBpedia:Wikipediaの情報をLiked Dataへ変換

DBpedia Japanese

Page 21: 140201josoken linkeddata

Wikipedia → DBpediainfobox

Page 22: 140201josoken linkeddata

DBpedia Japanese

Page 23: 140201josoken linkeddata

DBpedia Japanese(RDF/XML)

Page 24: 140201josoken linkeddata

➢データセットの記述

 製作者・更新状況・適用ライセンス

 ・データの利用者にとって重要

➢ライセンス・権利放棄の重要性

 ・ライセンスが明示されていない

  = データの再利用を妨げる

 ・Web上の一般的なライセンス

  = クリエイティブ・コモンズ・ライセンス

4章 つながるデータをデザインしよう

Page 25: 140201josoken linkeddata

• データ記述の語彙

RDFS:基本。RDFSだけで十分なことも多い

OWL: sameAs 重要。2つのURIが同じ事物を指していることを記述する時に使用。

cf. 2.5.2節(p.24)

"25

4章 つながるデータをデザインしよう

Page 26: 140201josoken linkeddata

• 既存用語・語彙の再利用

• 既存用語を使う=データが使われやすくなる

• 推奨語彙:

DCMI:Dublin Core Metadata Initiative Metadata Terms Vocabulary FOAF:Friend-of-a-friend Vocabulary etc.

"26

4章 つながるデータをデザインしよう

Page 27: 140201josoken linkeddata

5章 Linked Data公開のレシピ➢公開パターン

・リレーショナルデータベースから

ラッパを用いてRDF変換

代表的なラッパ:D2R Server

・静的な構造化データから

CSV, Excel, XML etc. RDF化ツール 参照ページ:

ConverterToRdf, RDFizers

Page 28: 140201josoken linkeddata

ConverterToRdf

Page 29: 140201josoken linkeddata

RDFizers

Page 30: 140201josoken linkeddata

• Linked Data公開時のチェック事項

• 他のデータセットにリンクしているか?

• 一次情報源データと由来のメタデータを提供しているか?

• 普及している既存の語彙から用語を採っているか?

• データセットのメタデータを提供しているか?

"30

5章 Linked Data公開のレシピ

Page 31: 140201josoken linkeddata

6章 Linked Dataを利用する➢既存のアプリケーション

•汎用的アプリケーション

• Linked Dataブラウザ

Disco Hyperdata Browser, Tabulator, Marbles

• Linked Data検索エンジン

Sig.ma, Falcons, SWSE etc. Google, Yahoo! etc. – リッチスニペット

Page 32: 140201josoken linkeddata

➢既存のアプリケーション

•分野に特化したアプリケーション

•政府データ関連のアプリケーションリスト:data.gov, data.gov.uk   

サイト上にリスト

• DBpedia Mobile:スマートフォンのGPS情報 × DBpediaの近隣情報

6章 Linked Dataを利用する

Page 33: 140201josoken linkeddata

data.gov

"33

Page 34: 140201josoken linkeddata

data.gov.uk

"34

Page 35: 140201josoken linkeddata

➢読み終えて…

•Linked Dataの概念はわかった

「データをより使いやすい形で公開・共有する方法論」

•技術に関する部分はまだ難しい

•実際にデータを触りながら読んだ方が理解が進む図書では

Page 36: 140201josoken linkeddata

➢勉強会:今後どう進める?

RDA、FRBR関連の文献輪読BIBFRAME関係の文献輪読

文献リストのLOD化

などのアイデア

*会場・作業環境が課題?

Page 37: 140201josoken linkeddata

➢図書館のデータ:高度に構造化(3.2.5)

Linked Dataと親和性は高い

•VIAF (Virtual International Authority File) •RDA (Resource Description and Access) •国立国会図書館:Web NDL Authorities

•大学図書館:「NII 総合目録データベースのデータ公開に関するパブリックコメント募集」

http://www.nii.ac.jp/CAT-ILL/about/project/od2013/

Page 38: 140201josoken linkeddata

VIAF

"38

Page 39: 140201josoken linkeddata

Web NDL Authorities

"39

Page 40: 140201josoken linkeddata

Linked Dataに関する + α

➢第2回 Linked Open Data(LOD)とオントロジー勉強会

  2013.8.5 (http://kokucheese.com/event/index/101729/) ➢情報組織化研究グループ月例研究会

  「Linked Open Dataの基礎とこれからの情報活用」

2013.9.21 (http://josoken.digick.jp/meeting/2013/201309.html) ➢第2回Linked Open Dataハッカソン関西 in 大阪

  2013.12.6 (http://peatix.com/event/23486)

Page 41: 140201josoken linkeddata

Linked Dataに関する + α

• Linked Dataを使い始めるにあたって

公開ずみのデータを眺める

ex.) DBpedia Japanese, 日本語Wikipediaオントロジー研究ページ,CKAN日本語

• Linked Data公開・活用支援

• LinkData.org:データをアップ→オープンデータ化   

 アプリケーションの作成も

• OPEN Refine:数万件規模のデータをLinked Data化"43

Page 42: 140201josoken linkeddata

DBpedia Japanese(RDF/XML)

Page 43: 140201josoken linkeddata

"45

Page 44: 140201josoken linkeddata

"46

Page 45: 140201josoken linkeddata

"47

Page 46: 140201josoken linkeddata

"48

Page 47: 140201josoken linkeddata

"49

Page 48: 140201josoken linkeddata

"50

Page 49: 140201josoken linkeddata

"51

Page 50: 140201josoken linkeddata

Linked Dataに関する + α

• 関連の研究会・イベントは増えている

ex.)LODチャレンジ

 インターナショナルオープンデータデイ

• 公的機関情報のオープンデータ化の加速

cf.) G8オープンデータ憲章 (2013.6)

  data.go.jp •図書館データのオープン化:大きくはこれらの流れとつながる "52

Page 51: 140201josoken linkeddata

"53

Page 52: 140201josoken linkeddata

"54

Page 53: 140201josoken linkeddata

Linked Dataに関する + α

• 研究会参加で感じること

間口を広げ、より普及させよう

ex.) 公開・活用支援サイト

•初期の関係者から、一般へと拡大

素人でも入っていきやすくなっている

"55

Page 54: 140201josoken linkeddata

ご清聴ありがとうございました

"56