lodを始めるにあたって「最初に試すとよい」ツールの紹介
TRANSCRIPT
Linked Open Dataとオントロジー勉強会(第2回)
LODを始めるにあたって
“ 初に試すとよい”ツールの紹介
大阪大学産業科学研究所
古崎晃司
2013年8月5日(月)於:大阪大学中之島センター
2013/8/5 第2回LODとオントロジー勉強会 1
発表概要
発表目的
LODを使い始めるにあたって,「 初に試して見ると良いツール」の紹介
発表概要
公開されているLODを“眺める”
SPARQLを用いた簡単な検索
LODを“作る”
手持ちのデータを“LOD化”するツール
LODを“公開する”
LODを公開する為のデータベース(トリプルストア)
2013/8/5 第2回LODとオントロジー勉強会 2
SPARQL
SPARQL RDFデータに対するクエリ言語
「指定したグラフ構造」に一致するトリプルを検索する
例
select distinct * where { ?s ?p ?o . } LIMIT 100
select distinct * where { <http://ja.dbpedia.org/resource/東京都> ?p ?o . } LIMIT 100
select distinct ?s where {?s <http://www.w3.org/2000/01/rdf-schema#label> ?o FILTER(regex(str(?o), “Osaka", "m")) .}
2013/8/5 第2回LODとオントロジー勉強会 3
日本語DBPediaでのクエリ検索例 http://ja.dbpedia.org/で指定したパターンに一致するトリプルを検索する.
←取得する数
↑同じパターンは除外する
↓返す要素(*は全て)
全トリプルの組み合わせ
東京都を主語(Subject)に含むトリプル
ラベルに“Osaka”を含むトリプル
※日本語DBPediaでは日本語のラベル検索が上手く動かない?
日本語で“今”使えるLOD DBPedia Japanense
http://ja.dbpedia.org/ 日本語LODのハブとして多くのデータから参照されている.
DBPedia(英語版) http://dbpedia.org/ 各言語版のDBPediaとのリンクの活用が可能
日本語Wikipediaオントロジー http://www.wikipediaontology.org/index.html インフォボックスに加え,よりリッチな情報を含んだオントロジーを提供.
CiNii http://ci.nii.ac.jp/ 日本語文献の情報をLODとして取得可能
KAKEN - 科学研究費助成事業データベース http://kaken.nii.ac.jp/ 研究者・研究課題の情報をLODとして取得可能
CKAN日本語 http://data.linkedopendata.jp/ 日本のオープンデータのカタログサイト.
2013/4/25 第1回LODとオントロジー勉強会 4
SPARQLエンドポイントあり
簡易SPARQL検索ツール コンセプト
SPARQLを全く知らない人でも,公開されている任意のLODのSPARQLエンドポイントをつかった「キーワード検索」ができるツール
公開されているLODに“どんなデータが含まれているか”を簡単に調べることが出来る
http://www.facebook.com/LodOnt にて公開中
LODを用いた基本的な操作を実現するプログラムのサンプルとするため,ソースコードも公開.(※フィードバックを歓迎します!)
できること 簡易検索機能
キワードに“URI”/“ラベル”が一致する(部分一致・完全一致)リソースを検索
検索結果の一覧から選択したリソースを主語(subject)とする全トリプルの検索
任意のSPARQLクエリを用いた検索
検索結果の保存
DBに格納されているトリプルの簡易編集(AllegroGraphのみ対応)
2013/8/5 第2回LODとオントロジー勉強会 5
簡易SPARQL検索ツールの画面例
2013/8/5 第2回LODとオントロジー勉強会 6
SPARQLエンドポイントの選択・追加
検索キーワードの入力
検索実行
検索キーワードに一致したリソース一覧
検索オプション
選択したリーソースを主語とするトリプル一覧
検索に用いたSPARQLクエリ
任意のSPARQLクエリ検索への切り替え
※注意DBPedia(英語版)に対して「部分一致検索」を行うと結果が帰ってくるまで数分かかるので注意.
SPARQLについての参考資料
LOD技術解説 LODチャレンジJapanサイト
http://lod.sfc.keio.ac.jp/challenge2013/slideresources2.html
第4回AIツール入門講座:LOD : Linked Open Data 入門の資料 加藤 文彦さん(情報・システム研究機構 新領域融合研究セン
ター 国立情報学研究所)
http://fumi.me/aitool_4/sparql.html
2013/8/5 第2回LODとオントロジー勉強会 7
参考情報:RDFデータベースでの文字列検索
トリプルストアの文字列検索は遅い? 日本語DBPediaくらいの規模なら大丈夫?
英語版DBPediaだとかなり厳しい...
一部のトリプルストアでは,文字列検索用の拡張コマンドをサポートしている.
例)Virtuso ただし日本語がうまく通らない?SELECT * WHERE {
?subject <http://www.w3.org/2000/01/rdf-schema#label> ?Literal .
FILTER bif:contains(?Literal, "Japan")}※ DBpedia Lookup Serviceではかなり高速.何か特別な実装をしている?
http://wiki.dbpedia.org/lookup/
2013/8/5 第2回LODとオントロジー勉強会 8
LODを「作る」手持ちのデータを「LOD化」するツール
LinkData.org http://linkdata.org/ 簡単な操作でRDFを公開することがサイト.Web上でアプリケーションを開発する機能も有り.
始めてLODを作るツールとしてオススメ.
LODRefine http://code.zemanta.com/sparkica/ 様々な形式のデータを読み込み,データの整形・公開に必要な様々な処理を行うことが出来るツール.RDF extensionを用いることで,手持ちのデータをRDFに変換することが可能.
DBPediaなどとのリンク付けを支援するツールもあり. 本格的なLODの公開に利用可能なツール
2013/8/5 第2回LODとオントロジー勉強会 9
LODを「公開する」:LODを公開する為のDB(トリプルストア)
Virtuoso http://virtuoso.openlinksw.com/ 商用版とオープンソース版がある DBPediaを初め, 近は,このソフトを試用しているプロジェクトが
多い? 日本語のドキュメントも探せば割と見つかる.
OWLIM http://www.ontotext.com/owlim OWLIM Liteは申請するとフリーで使用可能.(改変等は不可)
AllegroGraph http://www.franz.com/agraph/allegrograph/ 商用データベース. フリー版では500万トリプルまで格納可能. Gruffという可視化ツールも使える 本勉強会のFBページで,日本語インストール手順書を公開予定
2013/8/5 第2回LODとオントロジー勉強会 10
LODを用いたソフト開発
Jena RDFを処理するためのJavaライブラリ
その他,各言語向けのRDFライブラリがあるので,必要に応じて利用するとよい
参考資料
人工知能学会誌
私のブックマーク Linked Open Data 加藤 文彦さん(情報・システム研究機構)
http://www.ai-gakkai.or.jp/my-bookmark_vol28-no5
2013/8/5 第2回LODとオントロジー勉強会 11
アナウンス
2013/8/5 第2回LODとオントロジー勉強会 12
http://lod.sfc.keio.ac.jp/challenge2013/