code4lib 2010報告会・発表ダイジェスト

32
Code4Lib 2010報告 (発表ダイジェスト) Code4Lib 2010 報告会 2010320たかくまさお [email protected] 1

Upload: masao-takaku

Post on 13-Nov-2014

1.842 views

Category:

Business


0 download

DESCRIPTION

 

TRANSCRIPT

Page 1: Code4Lib 2010報告会・発表ダイジェスト

Code4Lib 2010報告(発表ダイジェスト)

Code4Lib 2010 報告会

2010年3月20日

たかくまさお

[email protected]

1

Page 2: Code4Lib 2010報告会・発表ダイジェスト

Code4Lib 2010全体プログラム

• 0日目– チュートリアル

• OCLC Web Services

• 1日目– 発表セッション

• 「クラウド」×5• 「メタデータ」×4

– 基調講演

– ライトニングトーク

– ブレイクアウトセッション

• 2日目– 発表セッション

• 「開発環境」×3• 「マイグレーション」×2• 「検索」×4

– ライトニングトーク

– ブレイクアウトセッション

• 3日目– 発表セッション

• 「モバイル」×3– 基調講演

– ライトニングトーク

発表セッションの要約をひたすらやります…3

Page 3: Code4Lib 2010報告会・発表ダイジェスト

OCLC Web Services(Pre‐Conferenece session)

• OCLC Web Services Tour• OCLC xID• WorldCat Basic and Search APIs• WorldCat Registry• WorldCat Identities• Sample code and demos

4

Page 4: Code4Lib 2010報告会・発表ダイジェスト

5

Page 5: Code4Lib 2010報告会・発表ダイジェスト

7

http://www.worldcat.org/xissn/titlehistory?issn=1532‐2882

Page 6: Code4Lib 2010報告会・発表ダイジェスト

8

http://www.oclc.org/worldcat/newgrow.htm

Page 7: Code4Lib 2010報告会・発表ダイジェスト
Page 8: Code4Lib 2010報告会・発表ダイジェスト

国内では…

• NII国立情報学研究所による NACSIS‐CAT– 雑誌変遷マップ

• http://www.tulips.tsukuba.ac.jp/misc/export/cat/show‐family.html

– 所蔵図書館マップ

• http://myrmecoleon.sytes.net/map/

• あとは API があれば…→ WebcatPlus APIに期待… (4月にリリース予定)

10

Page 9: Code4Lib 2010報告会・発表ダイジェスト

国内では…

• NII国立情報学研究所による NACSIS‐CAT– 雑誌変遷マップ

• http://www.tulips.tsukuba.ac.jp/misc/export/cat/show‐family.html

– 所蔵図書館マップ

• http://myrmecoleon.sytes.net/map/

• あとは API があれば…→ WebcatPlus APIに期待… (4月にリリース予定)

11

http://www.tulips.tsukuba.ac.jp/scripts/show‐family?id=AA00240495

Page 10: Code4Lib 2010報告会・発表ダイジェスト

12

http://myrmecoleon.sytes.net/map/?isbn=4‐7571‐0245‐3

Page 11: Code4Lib 2010報告会・発表ダイジェスト

1日目・発表セッション「クラウド」

• Cloud4Lib• The Linked Library Data Cloud: Stop talking and start doing

• Do It Yourself Cloud Computing with Apache and R

• Public Datasets in the Cloud• 7++ Ways to Enhance Library Interfaces with OCLC Web Services

13

Page 12: Code4Lib 2010報告会・発表ダイジェスト

Public Datasets in the Cloud

• 公的情報のオープン化

• クラウドの中でいわゆるGov2.0のようなデータを扱う方法。

– たとえば:http://www.socrata.com/government/White‐House‐Visitor‐Records‐Requests/644b‐gaut にあるホワイトハウスの訪問者リスト、から時系列に可視化…。など

• アーカイブス(公文書館)

• 書誌以外のデータ

18

Page 13: Code4Lib 2010報告会・発表ダイジェスト

7++ Ways to Enhance Library Interfaces with OCLC Web Services

• おおむね前日のOCLCセッションで見たデモ

• ニューヨークタイムズ紙のAPI(ベストセラー、書評)とのマッシュアップなど

• (日本でも)– Amazonだけでなく、出版社など、ベストセラー、レビュー情報APIがあると、図書館サイトでの発展的な情報提供のタネになりうる。

– → だれかやってください!

19

Page 14: Code4Lib 2010報告会・発表ダイジェスト

1日目午後・発表セッション「メタデータ」

• Taking Control of Library Metadata and Websites Using the eXtensible Catalog

• Matching Dirty Data Yet Another Wheel• HIVE: A New Tool for working with Vocabularies

• Metadata Editing, a truly extensible solution: Trident

20

Page 15: Code4Lib 2010報告会・発表ダイジェスト

Taking Control of Library Metadata and Websites Using the eXtensible Catalog• XC (eXtensible Catalog)

– ここ数年注目の「次世代OPAC」の代表格• オープンソースOPACソフトウェア

• かなりまとまってはいたけど、20分では足りないほどの機能満載ぶりに圧倒された。

• (日本では)今年度に九州大で導入され、国内初の試みと評判に。→ 詳しくご存じの方いれば補足お願いします。

21

Page 16: Code4Lib 2010報告会・発表ダイジェスト

Matching Dirty Data Yet Another Wheel

• 名寄せのお話。

• MARCデータ、Dspace機関リポジトリアイテム、学位論文アイテム

– 名寄せ用フィールドにどこを使えばよいか等

• 複数の書誌マッチングのためのデータ作成

• それら同士の比較照合用の文字列比較関数の工夫により、人手判定の手間を減らす方式の紹介

22

Page 17: Code4Lib 2010報告会・発表ダイジェスト

1日目・ライトニングトーク• UW Forward ‐ Steve Meyer• MODS4Ruby & Opinionated XML ‐Matt Zumwalt• The Digital Archaeological Record ‐Matt Cordial• Hydra: Blacklight + ActiveFedora + Rails ‐Willy Mene• Why CouchDB? ‐ Benjamin Young• Data integrity (cheap, fast, and easy) ‐ Gwen Exner• HathiTrust Large Scale Search update ‐ Tom Burton‐West• EAD and MARC Sitting in a Tree: Archival Description in Drupal ‐Mark 

Matienzo• EZproxy Wondertool ‐ Paul Joseph• HathiTrust APIs ‐ Albert Bertram• Repository of MARC Abominations ‐ Simon Spero and J‐Rock• Mystery Meat ‐ Joe Atzberger• Fuwatto Search ‐Masao Takaku

25

Page 18: Code4Lib 2010報告会・発表ダイジェスト

Fuwatto Search• 「ふわっと関連検索」

• マッシュアップツール

– 国立情報学研究所(NII)が提供するCiNii API– コンテンツマッチによるマッシュアップ

• OCLCチュートリアルセッションにて、説明を受けたWorldCat Basic APIを使ったサービスをデモ

– 意外と受けが良かったので、会議本体のライトニングトークに申し込み。

• 帰国後も、ウィジェット化など、随時開発中!

26

http://fuwat.to/ciniihttp://fuwat.to/worldcat

Page 19: Code4Lib 2010報告会・発表ダイジェスト

2日目午前・発表セッション「開発環境」

• Iterative Development Done Simply• Vampires vs. Werewolves: Ending the War Between Developers and Sysadmins with Puppet

• I Am Not Your Mother: Write Your Test Code

27

Page 20: Code4Lib 2010報告会・発表ダイジェスト

Iterative Development Done Simply

• アジャイル開発:– ノースカロライナ州立大学 図書館システム開発チーム

– 6週を1サイクルとして動かすアジャイル開発

– ボード、チケット管理、開発担当者の割り当て

• 問題点提起:– 図書館員の動きが遅い

– 文書化された仕様が少ない

– 優先順位付けが難しい

• (感想)モダンな開発手法をどのように図書館実践の中に用意していくか?そこが問題かも、と読んだ。

28

Page 21: Code4Lib 2010報告会・発表ダイジェスト

2日目午前・発表セッション「マイグレーション」

• Media, Blacklight, and Viewers• Becoming Truly Innovative: Migrating from Millennium to Koha

31

Page 22: Code4Lib 2010報告会・発表ダイジェスト

Becoming Truly Innovative: Migrating from Millennium to Koha

• 図書館システムの移行– 商用の図書館システムIIIから– オープンソースソフトウェアKohaへ

• 移行が必要な書誌レコード、利用者レコード、貸出レコードなど種別毎に、複数の移行方式を比較検討– それぞれの労力とコードを解説

• たとえば、– CSVでは、入れ子・繰り返しデータを扱えないので、無理が出る

– XSLTは変数指定といったプログラミング環境に欠けているので、メンテナンス性に欠けるし、実質的に無理

• かなり実際的で、非常に参考になった。

33

Page 23: Code4Lib 2010報告会・発表ダイジェスト

2日目午前「Ask Everything!」セッション• 「Human Search Engine」のセッション

– 「だれか、うちで持ってる問題を解決する方法を知ってるいるかい?と会場中に呼びかけて、必要な人を見つけて、ランチの間に話をしてください」というもの

• 質問が尽きないのがすごいところ。• 全部で30人くらい質問が出た。• 質問の一部:

– わたしが次に学んだほうがよいプログラミング言語は?→ Ruby, Python, Java, …

– MySQLの大規模データ対応・高速化の仕方?– WorldCat APIキーの隠蔽方式?– BlackRay? SharePoint?– Code4Lib Journal次号で普通の図書館員に送るシステム周りで知っておくべ

きことリストみたいな特集で記事を書いてくれる人?– ログ分析?– アカウント制御?– Facebookアプリの経験のある人?– Unicode の正規化?– などなど 34

Page 24: Code4Lib 2010報告会・発表ダイジェスト

2日目午後・発表セッション「検索環境の改善」

• A Better Advanced Search• Drupal 7: A more powerful platform for building library applications

• Enhancing Discoverability With Virtual Shelf Browse

• How to Implement A Virtual Bookshelf With Solr

35

Page 25: Code4Lib 2010報告会・発表ダイジェスト

Enhancing Discoverability With Virtual Shelf Browse

38

Page 26: Code4Lib 2010報告会・発表ダイジェスト

Enhancing Discoverability With Virtual Shelf Browse

• 本日2度目のNCSU登場。

• 正統派図書館システムの拡張としての仮想書架サービスの実装を解説。– 仮想書架サービスとは、ここでは書架に並んでいる順番での

OPAC書誌のブラウジング支援

• ex.http://www2.lib.ncsu.edu/catalog/record/NCSU600111• 実サービスとして運用するには、インデックスの作り方など、

高速化の工夫が必要(らしい)

• また、どうやってそのためのデータを作るのか、というところから解説。

• http://www.lib.ncsu.edu/dli/projects/virtualshelfindex/– 仮想書架サービスについてのドキュメントもある。

39

Page 27: Code4Lib 2010報告会・発表ダイジェスト

How to Implement A Virtual Bookshelf With Solr

• (3度目のStanfordチーム登場)

• NCSUと同様、仮想書架サービスとしてSolrでの分類記号ブラウズの実装を解説。

• (感想)純実装的には、なんとなくSuffixArrayを使ったほうがよさげ、と思わなくもない。

40

Page 28: Code4Lib 2010報告会・発表ダイジェスト

41http://searchworks.stanford.edu/view/2179288

Page 29: Code4Lib 2010報告会・発表ダイジェスト

3日目・発表セッション「モバイル」

• You Either Surf or You Fight: Integrating Library Services With Google Wave

• library/mobile: Developing a Mobile Catalog

• Mobile Web App Design: Getting Started

42

Page 30: Code4Lib 2010報告会・発表ダイジェスト

library/mobile: Developing a Mobile Catalog

• モバイル用OPACシステムに求められる要件とテストケースを設定して、モバイルOPACの簡易ユーザビリティテストを実施した結果を報告。

– cf.http://www.slideshare.net/kimberlygriggs/librarymobile‐developing‐mobile‐catalogs

• (感想)マトリックスによる表現は圧巻! GJ! 今回の発表セッション中では、最も感銘を受けた報告の一つ。

44

Page 31: Code4Lib 2010報告会・発表ダイジェスト

Mobile Web App Design: Getting Started

• Mobileウェブアプリケーション構築用のツールキットと、エミュレータ群の紹介

– iPhone– Andoroid– Palm– OperaMini

• 書架情報をモバイルで一覧表示させるShelfListerツールを公開中

45

Page 32: Code4Lib 2010報告会・発表ダイジェスト

おわりに

• 参加者は、コード書き(システム開発者・管理者)と図書館員とが半々くらい

• 図書館員はプロジェクトマネージメント

• (国内の視点で考えると)– 米国は図書館先進国

• 人材、資金

– ただし、日本でも似たような事例はたくさん…– 来年は日本からの発表もあるでしょう!

• Next‐L Enju• …

46