「つながるデータ」へ向けた研究情報の提供 : 農業情報を事例として

49
「つながるデータ」へ向けた 研究情報の提供: 農業情報を事例として 国際農林水産業研究センター 林賢紀 [email protected] 情報組織化研究グループ 2014年10月月例研究会 2014年10月25日(土)14:30-17:00 弁天町ORC200生涯学習センター 第2研修室

Upload: takanori-hayashi

Post on 05-Jul-2015

483 views

Category:

Science


4 download

DESCRIPTION

情報組織化研究グループ 2014年10月月例会発表資料 国際連合食糧農業機関(FAO)においては、文献データベースAGRISやシソーラスAGROVOCの提供をはじめとする農業関連の科学技術情報の提供を行っており、近年ではLinked Open Data(LOD)を活用した事例も見られる。 本発表においては、FAOによる書誌データのLOD化への勧告、LODE-BD(Linked Open Data(LOD)-enabled bibliographical data)などの事例を紹介するほか、国内の書誌データ、研究データ等との連係の可能性について検討する。

TRANSCRIPT

Page 1: 「つながるデータ」へ向けた研究情報の提供 : 農業情報を事例として

「つながるデータ」へ向けた研究情報の提供:

農業情報を事例として

国際農林水産業研究センター

林賢紀

[email protected]

情報組織化研究グループ 2014年10月月例研究会 2014年10月25日(土)14:30-17:00弁天町ORC200生涯学習センター 第2研修室

Page 2: 「つながるデータ」へ向けた研究情報の提供 : 農業情報を事例として

私事

• 2014年4月から独立行政法人国際農林水産業研究センター企画調整部情報広報室情報管理科で勤務しています

• 図書館業務全般とWebサイトを担当しています

• 絵に描いたようなワンパーソンライブラリーです

• 引き続きよろしくお願いいたします

情報組織化研究グループ 2014年10月月例研究会

2014/10/25 2

Page 3: 「つながるデータ」へ向けた研究情報の提供 : 農業情報を事例として

国際農林水産業研究センター?

• 茨城県つくば市と沖縄県石垣市に所在

• 熱帯又は亜熱帯に属する地域その他開発途上地域における農林水産業の研究を包括的に行う研究機関

–国際的な食料・環境問題の解決に向けた農林水産技術の研究開発

–国際的な食料・農林水産業及び農山漁村に関する動向把握のための情報の収集・分析及び提供

情報組織化研究グループ 2014年10月月例研究会

2014/10/25 3

Page 4: 「つながるデータ」へ向けた研究情報の提供 : 農業情報を事例として

研究成果の例

パパイヤ品種「石垣珊瑚」の

開発

オイルパーム廃棄木からのバイオエタノールの抽出

熱帯アジアのイネの収量を増加する遺伝資源の発見

屋内型エビ生産システムで飼育されたバナメイエビの

おいしさ

情報組織化研究グループ 2014年10月月例研究会

2014/10/25 4

Page 5: 「つながるデータ」へ向けた研究情報の提供 : 農業情報を事例として

今日の概要

農業情報とLinked Open Data

• LODにするためのツールや勧告を概説

• 主として農学分野を対象としているが、LOD化の手法は他分野でも参考となる

FAO(国際連合食糧農業機関)などにおける取組

• AGRIS

• AGROVOC

• LODE-BD(Linked Open Data (LOD)-Enabled Bibliographical Data)

情報組織化研究グループ 2014年10月月例研究会

2014/10/25 5

Page 6: 「つながるデータ」へ向けた研究情報の提供 : 農業情報を事例として

AGRIS

情報組織化研究グループ 2014年10月月例研究会

2014/10/25 6

Page 7: 「つながるデータ」へ向けた研究情報の提供 : 農業情報を事例として

AGRISとは?

農業関連の科学技術情報の共有のための国際的な書誌情報データベース

• 1979年から構築、760万件以上が蓄積

•世界65か国の150以上の機関による共同構築

•日本では農林水産研究情報総合センターから国内文献を年間約7,000件の書誌情報を送信

学術論文のほか、書籍、会議録、学位論文、灰色文献が含まれる

情報組織化研究グループ 2014年10月月例研究会

2014/10/25 7

Page 8: 「つながるデータ」へ向けた研究情報の提供 : 農業情報を事例として

AGRIS構築のしくみ

A国インプットセンターA国インプットセンター

A国インプットセンター各国のインプットセンター

各国のインプットセンターのデータをFAOで集約、DB構築

自国の農業関連の科学技術情報を収集、目録データを作成

http://agris.fao.org/

情報組織化研究グループ 2014年10月月例研究会

2014/10/25 8

Page 9: 「つながるデータ」へ向けた研究情報の提供 : 農業情報を事例として

AGRISが目指すもの

各国のインプットセンター

FAOでDBの構築とインプットセ

ンター上の全文、他の関連する情報資源へリンク

インプットセンターで書誌情報と全文を収集、

リポジトリを構築

リポジトリ

GBIF

世界銀行

DBpedia

農業情報へのアクセスを容易にし、特に発展途上国における農業研究へ貢献

情報組織化研究グループ 2014年10月月例研究会

2014/10/25 9

Page 10: 「つながるデータ」へ向けた研究情報の提供 : 農業情報を事例として

AGRISの検索結果例

該当文献と抄録

GBIF上の遺伝資源情報

IFPRI(国際食料政

策研究所)上の各国概要

Googleによる関連文献

情報組織化研究グループ 2014年10月月例研究会

2014/10/25 10

Page 11: 「つながるデータ」へ向けた研究情報の提供 : 農業情報を事例として

FAOの役割

ルール整備

• メタデータ語彙(AGRIS Application Profile)

•シソーラス(AGROVOC)

•書誌記述の勧告(LODE-BD)

ツール提供

• AgriMetamaker(小規模なメタデータ作成)

• AgriDrupal(Webサイト構築)

• AgriOceanDspace(リポジトリ構築)

ポータル構築

• AIMS (Agricultural Information Management Standards)

情報組織化研究グループ 2014年10月月例研究会

2014/10/25 11

Page 12: 「つながるデータ」へ向けた研究情報の提供 : 農業情報を事例として

AGRIS Application Profile

農業情報の標準化のために、FAOがこれまでのAGRISのデータフォーマットを再構成

• Dublin Core (DC)

• Australian Government Locator Service Metadata (AGLS)

• Agricultural Metadata Element Set (AgMES)

標準的な語彙はDublinCore、AGRIS特有の語彙はAgMES(FAOで定義)を使用

過去の資産をできるだけ生かす

http://www.fao.org/docrep/008/ae909e/ae909e00.htm情報組織化研究グループ 2014年10月

月例研究会2014/10/25 12

Page 13: 「つながるデータ」へ向けた研究情報の提供 : 農業情報を事例として

Mappingの例

• “Appendix B: AGRIS to AGRIS AP mapping”より

情報組織化研究グループ 2014年10月月例研究会

2014/10/25 13

Page 14: 「つながるデータ」へ向けた研究情報の提供 : 農業情報を事例として

AGROVOC

情報組織化研究グループ 2014年10月月例研究会

2014/10/25 14

Page 15: 「つながるデータ」へ向けた研究情報の提供 : 農業情報を事例として

AGROVOC

農学分野のシソーラスとして1980年代から運用

• 2009年にLOD化

多言語への対応

•当初は英語、フランス語、スペイン語(国連公用語の一部)

•その後、日本語を含む21言語3.2万ワードまで拡大

情報組織化研究グループ 2014年10月月例研究会

2014/10/25 15

Page 16: 「つながるデータ」へ向けた研究情報の提供 : 農業情報を事例として

AGROVOCからつながるデータ

LCSH

NAL Thesaurus

DDC

DBpedia

GeoNamesGeopolicalOntology

AGROVOC

http://aims.fao.org/standards/agrovoc/linked-open-dataを元に作成情報組織化研究グループ 2014年10月

月例研究会2014/10/25 16

Page 17: 「つながるデータ」へ向けた研究情報の提供 : 農業情報を事例として

2014/10/25情報組織化研究グループ 2014年10月

月例研究会17

NHK. NHK連続テレビ小説「マッサン」http://www.nhk.or.jp/massan/ 背景画像より(accessed 2014-10-24)

Page 18: 「つながるデータ」へ向けた研究情報の提供 : 農業情報を事例として

https://twitter.com/Dominique_Domon/status/517307378488709120

AGROVOCのリンクの例

2014/10/25情報組織化研究グループ 2014年10月

月例研究会18

Page 19: 「つながるデータ」へ向けた研究情報の提供 : 農業情報を事例として

「オオムギ」で検索してみた

2014/10/25情報組織化研究グループ 2014年10月

月例研究会19

http://aims.fao.org/standards/agrovoc/functionalities/search

Page 20: 「つながるデータ」へ向けた研究情報の提供 : 農業情報を事例として

HTMLでの表示例

2014/10/25情報組織化研究グループ 2014年10月

月例研究会20

http://aims.fao.org/aos/agrovoc/c_823.html

Page 21: 「つながるデータ」へ向けた研究情報の提供 : 農業情報を事例として

上位語、下位語、多言語の表現

2014/10/25情報組織化研究グループ 2014年10月

月例研究会21

AV:c_1474

穀物@ja

Cereals@en

skosxl:prefLabel

AV:c_823

オオムギ@ja

Barley@en

skosxl:prefLabel

AV: c_25485

麦芽用大麦@ja

Malting barley@en

skosxl:prefLabel

skos:narrower

skos:broader

Page 22: 「つながるデータ」へ向けた研究情報の提供 : 農業情報を事例として

SKOSによるAGROVOCの表現例

下位

トウモロコシ

デントコーン

異名

http://aims.fao.org/standards/agrovoc/concept-schemeより情報組織化研究グループ 2014年10月月例研究会

2014/10/25 22

Page 23: 「つながるデータ」へ向けた研究情報の提供 : 農業情報を事例として

入力ツール

情報組織化研究グループ 2014年10月月例研究会

2014/10/25 23

Page 24: 「つながるデータ」へ向けた研究情報の提供 : 農業情報を事例として

様々なツールを提供

AGRIMetamaker

• AGRISへのデータ搭載用のメタデータ作成ツール

• FAOがホスティング

AgriOcean Dspace

• 機関リポジトリ構築ツール

• DspaceをFAOとUNESCO-IOC/IODEでカスタマイ

AgriDrupal

• CMS(Contents Management System)

• DrupalにRDFやAGROVOC対応のモジュールを付与

2014/10/25情報組織化研究グループ 2014年10月

月例研究会24

いずれもメタデータにはAGRIS AP、統制語彙としてAGROVOCが容易に付与できるようカスタマイズされている

Page 25: 「つながるデータ」へ向けた研究情報の提供 : 農業情報を事例として

ツールの例:AgriDrupal

• FAO,CGIAR(国際農業研究協議グループ)等が開発・パッケージングしたDrupalの拡張モジュール

• Drupalのコアモジュールに加えてインストールするだけで使用可能

• 農学分野のコミュニティにおける基礎的な情報交換用のプラットフォームとして開発– 標準的なメタデータと統制語彙(AGROVOCなど)の採用– 文献データベース AGRIS の入力とFAOへのデータ送信ツールとして使用できる

• CMSであるDrupalでのWebサイト管理と,文献情報,ニュース,求人,会議などの情報の組織化,管理,発信ツールとして利用できる

• ダウンロード: http://aims.fao.org/tools/agridrupal• 参考:AgriDrupal: general presentation

http://www.slideshare.net/valeriap/agridrupal-general-presentation

情報組織化研究グループ 2014年10月月例研究会

2014/10/25 25

Page 26: 「つながるデータ」へ向けた研究情報の提供 : 農業情報を事例として

図書の入力例(1)

• Drupal標準の入力画面

• 資料種別、タイトルとタイトル言語を入力

情報組織化研究グループ 2014年10月月例研究会

2014/10/25 26

Page 27: 「つながるデータ」へ向けた研究情報の提供 : 農業情報を事例として

図書の入力例(2)

• 著者、出版事項などを入力

• 著者はシステム内の典拠データを参照あるいは作成してリンク

情報組織化研究グループ 2014年10月月例研究会

2014/10/25 27

Page 28: 「つながるデータ」へ向けた研究情報の提供 : 農業情報を事例として

図書の入力例(3)• AGROVOCのキーワード(自動検索)とAGRIS

Subject Category code(分野コード)を入力

情報組織化研究グループ 2014年10月月例研究会

2014/10/25 28

Page 29: 「つながるデータ」へ向けた研究情報の提供 : 農業情報を事例として

Webで見る

情報組織化研究グループ 2014年10月月例研究会

2014/10/25 29

Page 30: 「つながるデータ」へ向けた研究情報の提供 : 農業情報を事例として

RDF的に見る

http://192.168.50.129/agridrupal/node/47135

「沖縄シマ豆腐」物語dcterm:title

Subject Property Object

情報組織化研究グループ 2014年10月月例研究会

2014/10/25 30

Page 31: 「つながるデータ」へ向けた研究情報の提供 : 農業情報を事例として

LODE-BE

情報組織化研究グループ 2014年10月月例研究会

2014/10/25 31

Page 32: 「つながるデータ」へ向けた研究情報の提供 : 農業情報を事例として

LODE-BDとは

• Linked Open Data (LOD)-Enabled Bibliographical Data

• LODE-BD Recommendations 2.0として公開• http://aims.fao.org/lode/bd

• 共有可能な書誌データ作成に適したLODによる符号化を支援

• 冊子体、電子媒体、論文、報告書など書誌情報の記述に適用

情報組織化研究グループ 2014年10月月例研究会

2014/10/25 32

Page 33: 「つながるデータ」へ向けた研究情報の提供 : 農業情報を事例として

LODE-BD Recommendationsの構成

•問題意識、この文書の目的、LODE-BDの原則概要

•議論の対象、メタデータ語彙の概要General

Recommendations

• フローチャートによる語彙やプロパティの判断手法Decision Trees

•今後の展開、参考文献References

•用語説明、schema.orgとのクロスウォークなどAppendixes

情報組織化研究グループ 2014年10月月例研究会

2014/10/25 33

Page 34: 「つながるデータ」へ向けた研究情報の提供 : 農業情報を事例として

問題意識

書誌データをLODとして公開するためには、どのようなメタデータ基準に準拠すればよいか

データを共有するために書誌データセットに組み込む最低限のプロパティは何か

書誌データの作成に直接利用できるメタデータモデルやアプリケーションプロファイルはあるか

これまで使用してきた統制語彙がLinked Dataで利用できる場合、どのような値で概念を交換すればよいか

Linked Dataのデータセットに移行するためには、どのようにデータを符号化すればよいか

情報組織化研究グループ 2014年10月月例研究会

2014/10/25 34

Page 35: 「つながるデータ」へ向けた研究情報の提供 : 農業情報を事例として

LODE-BD Recommendationsの原則

1. 既定のメタデータ基準やLODで用いられる語彙の利用を促進

2. 典拠データ、統制語彙の適用

3. 可能であれば資源のURIをデータ値として適用

4. データ交換や再利用が可能な符号化のための選択プロセスを簡易化

5. Linked Dataコミュニティのニーズから発生した、新たなプロパティやメタデータ語彙へのリファレンスの提供

情報組織化研究グループ 2014年10月月例研究会

2014/10/25 35

Page 36: 「つながるデータ」へ向けた研究情報の提供 : 農業情報を事例として

議論の対象

1. 書誌情報の記述やアクセスに関する実態、関係

– 3つの実体をベースとする簡易なモデルを使用

Resource

• 論文など実体

Agent

• コンテンツの作成などに責任を持つ主体

Thema

• 記事の主題や論題

情報組織化研究グループ 2014年10月月例研究会

2014/10/25 36

Page 37: 「つながるデータ」へ向けた研究情報の提供 : 農業情報を事例として

議論の対象

2. 検討すべきプロパティ

–すでに標準化されているプロパティについて検討し、9つのグループを構築

タイトル 責任表示 物理的特性

配架・位置情報

主題に関する情報

コンテンツの詳細情報

権利情報 利用方法 相互の関係

情報組織化研究グループ 2014年10月月例研究会

2014/10/25 37

Page 38: 「つながるデータ」へ向けた研究情報の提供 : 農業情報を事例として

議論の対象

3. プロパティに適したメタデータ語彙

–広く利用されているメタデータ語彙を選定

– フローチャートによる決定方法の提示

情報組織化研究グループ 2014年10月月例研究会

2014/10/25 38

Page 39: 「つながるデータ」へ向けた研究情報の提供 : 農業情報を事例として

タイトル

• 本タイトル、並列タイトル、翻訳タイトルなどの別にプロパティを決定

情報組織化研究グループ 2014年10月月例研究会

2014/10/25 39

Page 40: 「つながるデータ」へ向けた研究情報の提供 : 農業情報を事例として

責任表示(例は著者)

• 典拠データの有無を判断

• 典拠データがあり、かつLinked Dataである場合はURIで記述

• 寄与者、出版者も同様に判断

情報組織化研究グループ 2014年10月月例研究会

2014/10/25 40

Page 41: 「つながるデータ」へ向けた研究情報の提供 : 農業情報を事例として

物理的特性(例は識別子)

• ローカル/グローバルのいずれの識別子についても考慮

–値が同じでも共存できるように

• 記述規則にのっとっているか否か

• 識別子の種類を区別するか

情報組織化研究グループ 2014年10月月例研究会

2014/10/25 41

Page 42: 「つながるデータ」へ向けた研究情報の提供 : 農業情報を事例として

配架・位置情報

• 配架場所、住所などを想定

• 標準的な語彙に準拠しているか否か

情報組織化研究グループ 2014年10月月例研究会

2014/10/25 42

Page 43: 「つながるデータ」へ向けた研究情報の提供 : 農業情報を事例として

主題に関する情報

• 統制語彙か否か、すでにLinked Dataに

なっているか否かで文字列かURIで表す

かを、またプロパティを選択

情報組織化研究グループ 2014年10月月例研究会

2014/10/25 43

Page 44: 「つながるデータ」へ向けた研究情報の提供 : 農業情報を事例として

コンテンツの詳細情報

• 目次、要約、注釈など内容の表示とこれらを識別するプロパティを選択

情報組織化研究グループ 2014年10月月例研究会

2014/10/25 44

Page 45: 「つながるデータ」へ向けた研究情報の提供 : 農業情報を事例として

権利情報

• 権利の主体やライセンスの種類の記述を想定

情報組織化研究グループ 2014年10月月例研究会

2014/10/25 45

Page 46: 「つながるデータ」へ向けた研究情報の提供 : 農業情報を事例として

利用方法

• 利用対象や教育レベルなどのプロパティを選択

情報組織化研究グループ 2014年10月月例研究会

2014/10/25 46

Page 47: 「つながるデータ」へ向けた研究情報の提供 : 農業情報を事例として

相互の関係(例はresource間)

• resourceそのもの、

また相互の関係を表すプロパティを選択

• agentについては所属やfounderの記述を想定

情報組織化研究グループ 2014年10月月例研究会

2014/10/25 47

Page 48: 「つながるデータ」へ向けた研究情報の提供 : 農業情報を事例として

まとめ

情報組織化研究グループ 2014年10月月例研究会

2014/10/25 48

Page 49: 「つながるデータ」へ向けた研究情報の提供 : 農業情報を事例として

今日のまとめ

• 農業情報提供に関するFAOの取り組みを概観した• シソーラスAGROVOCを介して様々な情報資源とのリンクを実現している– LCSH、DBpediaなど既存のデータセットを介してさらに連携が可能では

• Drupalなど既存のCMSを利用し、構造化された情報の構築環境を提供– AgriDrupalはLODの学習や評価などに利用できるのでは

• LODE-BDのようなLOD化の手法、手段も検討されている– Decision Treesによるプロパティの設定などの手法は汎用性がある

情報組織化研究グループ 2014年10月月例研究会

2014/10/25 49