web標準: lodによるオープンデータ・オーブンガバメント
TRANSCRIPT
These slides are copyright © 2012 W3C (MIT, ERCIM & Keio). Stata Center photo by See-Ming Lee available under a Creative Commons Attribution Share-Alike 2.0 License http://www.flickr.com/photos/seeminglee/3791607622/
Web標準: LODによるオープンデータ・オーブンガバメント
の効果と始めかた(updated)
2012年5月17日 W3C/Keio
慶應義塾大学大学院 政策・メディア研究科
特任助教 深見嘉明
@rhys_no1
These slides are copyright © 2012 W3C (MIT, ERCIM & Keio). Stata Center photo by See-Ming Lee available under a Creative Commons Attribution Share-Alike 2.0 License http://www.flickr.com/photos/seeminglee/3791607622/
W3Cの概要 • 世界中の企業・研究機関・団体によって構成される、ウェブ標準規格を策定する団体
• 加入企業・研究機関・団体の数は300以上。 – http://www.w3.org/Consortium/
Member/List • 加入企業・団体から参加するエンジニアによって議論が進められ、標準規格が策定される。
• 今この瞬間も、電話会議で、メールで、 仕様に関する議論が進められています。
1
These slides are copyright © 2012 W3C (MIT, ERCIM & Keio). Stata Center photo by See-Ming Lee available under a Creative Commons Attribution Share-Alike 2.0 License http://www.flickr.com/photos/seeminglee/3791607622/
「オープンガバメント」 「オープンデータ」 という用語を よく耳にするように なりました
2
These slides are copyright © 2012 W3C (MIT, ERCIM & Keio). Stata Center photo by See-Ming Lee available under a Creative Commons Attribution Share-Alike 2.0 License http://www.flickr.com/photos/seeminglee/3791607622/
はじめに考えるべきこと
• 何のためのオープン?
• 誰のためのオープン?
3
These slides are copyright © 2012 W3C (MIT, ERCIM & Keio). Stata Center photo by See-Ming Lee available under a Creative Commons Attribution Share-Alike 2.0 License http://www.flickr.com/photos/seeminglee/3791607622/
これまでの「オープン」 • 議会や審議会、研究会といった政策形成プロセスの公開 – 動画配信や議事録のウェブ公開等
• 施策立案担当者や議員、首長との、直接的な意見交換 – TwitterやFacebookといったソーシャル メディアを介した交流
4
These slides are copyright © 2012 W3C (MIT, ERCIM & Keio). Stata Center photo by See-Ming Lee available under a Creative Commons Attribution Share-Alike 2.0 License http://www.flickr.com/photos/seeminglee/3791607622/
「オープン」に期待されていること
• 行政執行や施策立案に透明性が確保できる
• 公開されたデータを民間が活用することによる効率性の向上と経済の活性化
5
These slides are copyright © 2012 W3C (MIT, ERCIM & Keio). Stata Center photo by See-Ming Lee available under a Creative Commons Attribution Share-Alike 2.0 License http://www.flickr.com/photos/seeminglee/3791607622/
今までの「オープン」はどこまで有効だったのか?
• 平日昼間やっている議会や審議会、誰が見るの?
• 長時間の審議、議論を全部聞くの? • 議事録などの全文採録を読んで、価値のある情報を容易に取り出せるのか?
• 特定の個人間のやりとりを一般化して、政策形成や施策立案に落としこむことは、本当に効率的なのか?
6
These slides are copyright © 2012 W3C (MIT, ERCIM & Keio). Stata Center photo by See-Ming Lee available under a Creative Commons Attribution Share-Alike 2.0 License http://www.flickr.com/photos/seeminglee/3791607622/
今までの「オープン」はどこまで有効だったのか?
• 似たようなデータが各省庁・部局・外郭団体・自治体等からバラバラに開示されていて、活用したいデータがすぐに見つからない。
• PDFにデータが記載されていると、それを入力し直さなければ分析・活用できない。
7
These slides are copyright © 2012 W3C (MIT, ERCIM & Keio). Stata Center photo by See-Ming Lee available under a Creative Commons Attribution Share-Alike 2.0 License http://www.flickr.com/photos/seeminglee/3791607622/
必要とされる「オープン」のかたち • 議論の中身だけではなく、議論の前提となるデータが開示されること。
• データの活用が効率的に進むよう、 – 探しやすく、重複がないような体制でデータが開示されること。
– 最初から分析プログラムやアプリケーションで活用可能なデータ形式・粒度で開示されること。
8
These slides are copyright © 2012 W3C (MIT, ERCIM & Keio). Stata Center photo by See-Ming Lee available under a Creative Commons Attribution Share-Alike 2.0 License http://www.flickr.com/photos/seeminglee/3791607622/
具体的にどうするか • 分析・加工する前の生データ
(raw data)、もしくはそれに近いデータを公開する。
• コンピュータ/プログラムで扱いやすい形式・フォーマットで公開する。
• 適切な著作権・情報保護の設定の元、公開する。
9
These slides are copyright © 2012 W3C (MIT, ERCIM & Keio). Stata Center photo by See-Ming Lee available under a Creative Commons Attribution Share-Alike 2.0 License http://www.flickr.com/photos/seeminglee/3791607622/
回答:Linked Data • データ公開時のルール
– IDはURI – RDF (Resource Description Framework)に従った要素を含む
– データフォーマットは標準的な計算機可読なものであればよい。具体的には、RDF/XML、JSONなど。
– 分類項目や項目の定義=データ構造は、既存の標準があればそれを用いる。無ければ、自由に定義してよいが、その定義も公開し、標準化に向けて提案することが理想。
10
These slides are copyright © 2012 W3C (MIT, ERCIM & Keio). Stata Center photo by See-Ming Lee available under a Creative Commons Attribution Share-Alike 2.0 License http://www.flickr.com/photos/seeminglee/3791607622/
ID=URI • URI
– Uniform Resource Identifier – URLとほぼ同義。「http://」ではじまるアドレス(注)。
• なぜURI? – ウェブ上の公開に適している – どこからでも、誰でもアクセス可能 – IDのつけ方に自由度が高い – 固有性を維持するのが容易
11
注:厳密には、ウェブサイトのアドレスはURIの一種
These slides are copyright © 2012 W3C (MIT, ERCIM & Keio). Stata Center photo by See-Ming Lee available under a Creative Commons Attribution Share-Alike 2.0 License http://www.flickr.com/photos/seeminglee/3791607622/
RDF: Resource Description Framework • 主語・述語・目的語という単純な組み合わせ=triple/三つ組
• 他のURI(データリソース)とリンクする
http://www.w3.org
World Wide Web
Consortium
主語 目的語
述語:名前
12
These slides are copyright © 2012 W3C (MIT, ERCIM & Keio). Stata Center photo by See-Ming Lee available under a Creative Commons Attribution Share-Alike 2.0 License http://www.flickr.com/photos/seeminglee/3791607622/
Linked Dataの記述のしかた • 例:Turtleでの記述 <http://d.hatena.ne.jp/yofukami/about> rdf:type foaf:Person . <http://d.hatena.ne.jp/yofukami/about> foaf:name "深見嘉明" . <http://d.hatena.ne.jp/yofukami/about> foaf:gender "mail" . <http://d.hatena.ne.jp/yofukami/about> foaf:knows <http://www-kasm.nii.ac.jp/~takeda#me>
<http://d.hatena.ne.jp/
yofukami/about> <http://www-kasm.nii.ac.jp/~takeda#me>
foaf:knows
<foaf:Person> rdfs:type
“深見嘉明” “male”
foaf:name foaf:gender
13
These slides are copyright © 2012 W3C (MIT, ERCIM & Keio). Stata Center photo by See-Ming Lee available under a Creative Commons Attribution Share-Alike 2.0 License http://www.flickr.com/photos/seeminglee/3791607622/
データフォーマットと構造 • コンピュータが処理できれば(machine
readable)、何でも良い、が、RDF/XMLやJSONが推奨される。
• 構造を示すのは前スライドの “foaf:Person” などの部分。
• foaf、dc (Dublin Core)等、既存の標準的なフォーマットがあれば、それに従う。
• Google、Yahoo!、Microsoftが提唱するschema.orgなど、大手企業も積極的に標準を提唱・実装。
14
These slides are copyright © 2012 W3C (MIT, ERCIM & Keio). Stata Center photo by See-Ming Lee available under a Creative Commons Attribution Share-Alike 2.0 License http://www.flickr.com/photos/seeminglee/3791607622/
Linked DataとLOD • LOD= Linked Open Data • 標準に従って生成・公開されたデータであれば、マッシュアップして活用することが可能
• だから、フォーマットも、データ構造も、標準ベースで
• 多様な形態での利用が前提なので、適切な著作権処理(例えば、CC-BY)がなされることが望ましい。
15
These slides are copyright © 2012 W3C (MIT, ERCIM & Keio). Stata Center photo by See-Ming Lee available under a Creative Commons Attribution Share-Alike 2.0 License http://www.flickr.com/photos/seeminglee/3791607622/
データ共有プラットフォームとしてのLOD • 既に各分野でリンクされたデータセットが多数生成されています – 203のデータセット – 2500万の RDF triples – 3億9500万の RDF links
16
(http://www4.wiwiss.fu-berlin.de/lodcloud/state/)
These slides are copyright © 2012 W3C (MIT, ERCIM & Keio). Stata Center photo by See-Ming Lee available under a Creative Commons Attribution Share-Alike 2.0 License http://www.flickr.com/photos/seeminglee/3791607622/
Linked Dataの本質 • 世界共通の識別子(Identifier) • 世界共通の標準フォーマット・構造の採用
Web全体を データリソースとして アプリケーションが
作れる
17
These slides are copyright © 2012 W3C (MIT, ERCIM & Keio). Stata Center photo by See-Ming Lee available under a Creative Commons Attribution Share-Alike 2.0 License http://www.flickr.com/photos/seeminglee/3791607622/
1) データを提供する
2) アプリケーションを創る
3) サービスを創る
エコシステムの構造
標準仕様に則っていることにより、より広い層からの利用を見込むことができる
18
These slides are copyright © 2012 W3C (MIT, ERCIM & Keio). Stata Center photo by See-Ming Lee available under a Creative Commons Attribution Share-Alike 2.0 License http://www.flickr.com/photos/seeminglee/3791607622/
情報開示とオープンデータの差 • 既存の「情報開示」
– 開示までにかかるコストが大きい
– 特定の分析視点に基づいてデータが提示される
– 「データそのもの」が必要な場合、それを取り出すコストがかかる
加工 された データ
データ収集
分析
プレゼンテーション
19
These slides are copyright © 2012 W3C (MIT, ERCIM & Keio). Stata Center photo by See-Ming Lee available under a Creative Commons Attribution Share-Alike 2.0 License http://www.flickr.com/photos/seeminglee/3791607622/
情報開示とオープンデータの差 • LODによるオープンデータ
データ
ニーズ
データ
ニーズ
データ
ニーズ
データ
ニーズ
20
These slides are copyright © 2012 W3C (MIT, ERCIM & Keio). Stata Center photo by See-Ming Lee available under a Creative Commons Attribution Share-Alike 2.0 License http://www.flickr.com/photos/seeminglee/3791607622/
情報開示とオープンデータの差 • LODによるオープンデータ
– データ生成・公開/利用の分離 – データ利用に伴う負担の分散化 – 必要なデータを各所から収集して用いる(マッシュアップ)が容易
– ニーズがある場所で、効率的にアプリケーションやサービスが開発される
21
These slides are copyright © 2012 W3C (MIT, ERCIM & Keio). Stata Center photo by See-Ming Lee available under a Creative Commons Attribution Share-Alike 2.0 License http://www.flickr.com/photos/seeminglee/3791607622/
LODによるオープンガバメントの意義
• 負荷分散効果による、データ提供側・利用者側の負荷低減
• アプリケーションやサービスのDIY・地産地消を実現
• スケーラビリティ効果 – 効率的な情報発信、サービス提供範囲拡大 – 他所の成功事例を簡単に導入
22
These slides are copyright © 2012 W3C (MIT, ERCIM & Keio). Stata Center photo by See-Ming Lee available under a Creative Commons Attribution Share-Alike 2.0 License http://www.flickr.com/photos/seeminglee/3791607622/
標準という観点から見たLOD • W3CはRDFという基本コンセプトと、RDF/XMLなどのデータ フォーマットの一部のみを標準として策定
• データ構造はユーザや企業からの提案がデファクトスタンダードになるのが普通。
23
データ構造
データ フォーマット
RDF W3C (&others)
ユーザ からの 提案
These slides are copyright © 2012 W3C (MIT, ERCIM & Keio). Stata Center photo by See-Ming Lee available under a Creative Commons Attribution Share-Alike 2.0 License http://www.flickr.com/photos/seeminglee/3791607622/
標準という観点から見たLOD
• 車輪の再発明は避けるべし • 自身の使い勝手のよいデータ構造を、どんどん世界標準にするための提案をすべき
24
These slides are copyright © 2012 W3C (MIT, ERCIM & Keio). Stata Center photo by See-Ming Lee available under a Creative Commons Attribution Share-Alike 2.0 License http://www.flickr.com/photos/seeminglee/3791607622/
ありがとうございました。 [email protected] http://www.w3.org
@rhys_no1