z39.50 とその動向
DESCRIPTION
Z39.50 とその動向. インテック・ウェブ・アンド・ゲノム・インフォマティクス株式会社 技術部 石田 茂. 内容. Z39.50 とは何か? Z39.50 はどのように使用するのか? 市場動向 Z39.50 はどのように機能するのか? Z39.50 と ILL (図書館間相互貸借) 国内利用に向けて必要な環境(合意) Z39.50 の将来. Z39.50 とは何か?. ネットワークベースの情報検索プロトコル OSI 参照モデル7層 - ASN.1 、 BER サーバ / クライアント型 - PowerPoint PPT PresentationTRANSCRIPT
2001.9.21 Web & Genome2
内容
Z39.50 とは何か? Z39.50 はどのように使用するのか? 市場動向 Z39.50 はどのように機能するのか? Z39.50 と ILL (図書館間相互貸借) 国内利用に向けて必要な環境(合意) Z39.50 の将来
2001.9.21 Web & Genome3
Z39.50 とは何か?
ネットワークベースの情報検索プロトコル OSI 参照モデル7層 - ASN.1 、 BER サーバ / クライアント型
ANSI/NISO Z39.50-1995 (ISO 23950:1998) NISO - National Information Standards Organization ISO - International Standards Organization
米国議会図書館に Maintenance Agency 設置 Ray Denenberg がまとめ役
2001.9.21 Web & Genome4
ZIG - Z39.50 Implementors Group
Z39.50 システムの開発者グループ 改正、修正、問題認識ならびに提起等を議論 実装者合意を作成 5ヶ月に一度の会合(北米、 EU 、ワシントン
DC ) コンセンサス主導の作業方針
2001.9.21 Web & Genome5
開発経緯 1978-82
初期の開発 / 調査研究 1982-83
Linked Systems Project Protocol 1983-84
ANSI Z39 に提出 .Z39.50-1984. 承認投票に失敗 1984-87
開発継続 1988
NISO に再提出。 Z39.50-1988 として承認 1979-89
Z39 SC D
2001.9.21 Web & Genome6
開発経緯 1984-91
ISO SR → ISO 10162/10163 Search & Retrieve (1993) 1990
ZIG (実装者グループ)設立 1989-90
Z39.50 Maintenance Agency 設立 1992
Z39.50-1992 (version 2) 1990-95
version 3 開発 1995
Z39.50-1995 1998
ISO 23950
2001.9.21 Web & Genome7
目的
クライアント・サーバシステム間で情報検索の相互連携性を確保する ベンダー間の相互連携
様々な DB とユーザ IF
組織間の相互連携 様々な図書フォーマット
ユーザグループ間の相互連携 公共図書館と大学図書館 様々なコミュニティにおける図書館
コミュニティ間の相互連携 図書館、出版社、 DB サービス、美術・博物館等
2001.9.21 Web & Genome8
どのように使用するか?
抽象化 DB 標準化されたアクセスポイント
属性集合 標準化された検索式 標準化された返戻形式
スキーマ 選択可能なレコード構文 返戻時にレコードの選択が可能
レコード内容に左右されない検索処理
2001.9.21 Web & Genome9
どのように使用するか?
抽象化された DB は、実際の DB のフロントエンドとして実装される。
アプリ機能
Z39.50クライアント
Z39.50サーバ DB
Z39.50 クライアント Z39.50 サーバ
2001.9.21 Web & Genome11
相互連携にみる特徴
DB 毎に異なる機能 アクセスポイント等の属性集合、実装特徴
DB 毎に異なる情報形式 US MARC, UNIMARC, SUTRS, GRS-1 所蔵情報の内包、分離
2001.9.21 Web & Genome12
Profile
標準仕様の使用方法に関する合意規定 どのアクセスポイントが有効? どの属性が有効? レコード構文には何が指定できる? どの(補足)機能が一般に利用できる? どのオプションが利用できる? 特定分野向けのデータは許容される?
2001.9.21 Web & Genome13
Profile例
ATS-1 Author, Title, Subject 初期の図書向け簡易仕様 (廃止)
GILS 行政情報所在案内サービス 汎用的な情報所在案内サービスの参照モデル
2001.9.21 Web & Genome14
Profile例
CIMI 美術館情報をコンピュータ上で交換するため
のコンソーシアムが作成 テキスト以外に画像情報も検索対象とする
CIP Catalogue Interoperability Protocol 国際的な地球観測衛星委員会が作成 地理空間情報の検索にも利用される
2001.9.21 Web & Genome16
主要な図書館向け Profile
ONE OPAC Network Europe 1996年作成 ノルウェー、ドイツ、英国で利用 アクセスポイントと要素集合に関する最小規定
CENL Conference of European National Librarians 1997年作成、 1998年後半に批准 ONE profile の拡張版
2001.9.21 Web & Genome17
主要な図書館向け Profile
Finnish Z39.50 profile Danish Z39.50 profile
国際的な ONE profile に対して、分類方式に関する国内仕様を追加規定
CENL と ONE の拡張版
2001.9.21 Web & Genome18
主要な図書館向け Profile
Union Catalogue Profile Union catalogue 向けに要求仕様を定義 オーストラリアで作成 1998年に受理
2001.9.21 Web & Genome19
Z39.50 の難点
複雑なプロトコル 難解な用語 元は ISO/OSI 規格に準拠
TCP/IP上で実装 難解な理論ベースのプロトコル 様々な抽象化レベル
2001.9.21 Web & Genome20
Z39.50 の難点
機能的に収斂した製品が未だ無い 今後、 Mozilla の RDF 実装が該当?
適切な専門化が極少数 製品の長期的なサイクルを考慮 標準化の前に仕様上の十分な探索がされていない
広く普及させることで困難な問題点を解決!
2001.9.21 Web & Genome22
サーバ( Target )
抽象化 DB を実装 特殊な開発作業 ツールキットのカスタマイズ サーバモジュールの準備 DB コンフィグレーション
実際の DB を抽象化 DB としてどのように表現するか?
Z39.50サーバ DB
Z39.50 サーバ
2001.9.21 Web & Genome23
ゲートウェイ
IF に二つの顔を持つ Z39.50 サーバに対して、 Z39.50 クライ
アントとして通信する顔 一般的なクライアントと通信する顔
クライアントプロトコルには HTML, Telnet, Z39.50…
2001.9.21 Web & Genome25
横断的ゲートウェイ
Z39.50サーバ
ビジネスロジック
Z39.50クライアント
Z39.50クライアント
Z39.50 クライアント
Z39.50 サーバ
Z39.50クライアント
Z39.50 サーバ
Z39.50 サーバ
2001.9.21 Web & Genome26
高度なゲートウェイ
複数の Z39.50 サーバと接続する 並列検索 連続検索 検索結果のマージ
両方の IF に様々なプロトコルに対応する SQL, LDAP, HTML, DNS…
2001.9.21 Web & Genome27
高度なゲートウェイ
Z39.50サーバ
ビジネスロジック
Z39.50クライアント
SQLクライアント
Z39.50 クライアントZ39.50 サーバ
HTTPサーバ
専用プロトコル
サーバ
LDAPクライアント
Web ブラウザ
専用システム
SQL サーバ
LDAP サーバ
2001.9.21 Web & Genome28
クライアント( Origin )
グラフィカルなユーザ IF のプロトコル処理部 ユーザから複雑さは隠されている 拡張コンフィグレーションの必要性 同時に複数のサーバに接続する場合あり
アプリ機能
Z39.50クライアント
Z39.50 クライアント
2001.9.21 Web & Genome29
市場動向
統合システム 図書館システム
海外の主要なシステムは全て Z39.50 機能をもつ専用クライアントあるいは Web ゲートウェイ小規模システムにも Z39.50 を採用するものあり多くのシステムは Version 2 を採用する
INNOPAC 等の米国製システムに多い
2001.9.21 Web & Genome30
市場動向
スタンドアロン製品 ツールキットレベル製品 システムインテグレーション・コンサルタ
ント Crossnet (UK) Fretwell-Downing (UK) Indexdata (Denmark) Sunstone (Sweden) Blueangel Technologies (US) Finsiel (Italy)
2001.9.21 Web & Genome31
市場動向(国内)主な機能
メーカ /
サービスベンダー
ServerWeb G/W Proxy
Telnet G/W 採用機関 /特徴日本語 検索エンジン
NACSIS-ELS/ NII国立情報学研究所
○(NII内 ) 大学系図書館(多数)○
INNOPAC/ Innovative Interface Inc. 日本 IBM ○ ○ 早稲田大学○
LibCruiser Pro/ NTT 東日本
○ ○ ○ ○ OpenText東京工業大学、図書館情報大学、神戸大学
Gateway-CAT/ 丸善 ○
外部連携
RLG Zephyer Server 大学系図書館(多数)
JOIS with STN/ JST 科学技術振興事業団 CAS Server
InfoLib-Global Finder/ 日商岩井インフォコ
ム
○ ○ ○ ○ ○ OpenText
SiteSearch/
OCLC, 紀伊国屋○ ○
ERL/
Silver Platter, 紀伊国屋○ ○
Ovid/ Ovid Technologies Inc, ユサコ ○ ○ ○
○(NII内 )
○( 丸善内 )
○(JST内 )
○(JST内 )
○( 丸善経由 )
大学系図書館(多数)
LibVision V3(LVZ)/
日本 IBM、紀伊国屋、
新日鉄ソリューション大分
○ ○ ○
CharsetandLanguageNego(3)
UTF8/ISO2022-JP 対応
NACSIS-CAT,MARC21 対応
2001.9.21 Web & Genome33
初期化機能
初期化サービス Z- アソシエーションの確立
クライアント サーバ初期化要求Version 、 ID/パスワード、オプション、メッセージサイズ、実装情報
初期化応答結果、 Version 、オプション、メッセージサイズ、実装情報
2001.9.21 Web & Genome34
初期化機能
使用可能なサービスとオプションを交渉する クライアントは“初期化要求”内のリストで様々な
サービスを要求する サーバは自身の機能・能力と比較調整し、可能な
サービスならびにオプションを初期化応答でクライアントに返す
2001.9.21 Web & Genome35
検索機能
検索サービス
クライアント サーバ検索要求検索式タイプ、検索式、DB, 結果集合名
検索応答ヒット件数、返戻レコード件数、ステータス情報、(レコード)
2001.9.21 Web & Genome37
返戻機能
セグメントサービス レコードを“セグメント”することで、初期化
時に設定したメッセージサイズよりも大きいレコードを転送することができる
二つのレベル Level 1: 一つのセグメントに複数のレコードを格納
Level 2: 一つのレコードを細分化して各セグメントに格納
2001.9.21 Web & Genome39
アクセス制御機能
アクセス制御サービスクライアント サーバ
アクセス制御要求セキュリティ申請
応答(一般)
要求(一般)
アクセス制御応答セキュリティ申請応答
2001.9.21 Web & Genome40
課金・リソース制御機能
リソース制御サービス トリガリソース制御サービス リソース報告サービス
リソースの使用を制御、報告する複雑な機能 主に課金情報を作成するために使用される
2001.9.21 Web & Genome42
走査機能
走査サービス
クライアント サーバ走査要求DB 、単語リスト、開始位置、単語数、 ( ステップサイズ )
走査応答ステータス、単語数、 (単語 )
2001.9.21 Web & Genome43
拡張サービス機能
拡張サービス 永続的検索結果集合 永続的検索式 定期的検索実行 蔵書注文 DB 更新 仕様導出、発動
タスクパッケージ 拡張サービス要求を作成、修正、削除するために使
用
2001.9.21 Web & Genome48
BER
基本符号化規則 Basic Encoding Rules 転送データの符号化方式 可読形式のコードではない
コンピュータのみ解釈可能
型 長さ 値
2001.9.21 Web & Genome49
ASN.1
抽象構文記法1 Abstract Syntax Notation 1
データ型を定義する記述言語 実装方式とは独立した表現形式
Permissions ::= SEQUENCE OF SEQUENCE{ userId [1] IMPLICIT InternationalString, allowableFunctions [2] IMPLICIT SEQUENCE OF INTEGER{ delete (1), modifyContents (2), modifyPermissions (3), present (4),
invoke (5)}}
2001.9.21 Web & Genome50
APDU
Application Protocol Data Unit 要求と応答を含むデータパッケージ
InitializeRequest ::= SEQUENCE{ referenceId ReferenceId OPTIONAL, protocolVersion ProtocolVersion, options Options, preferredMessageSize [5] IMPLICIT INTEGER, exceptionalRecordSize [6] IMPLICIT INTEGER, idAuthentication [7] ANY OPTIONAL, -- see note below implementationId [110] IMPLICIT InternationalString OPTIONAL, implementationName [111] IMPLICIT InternationalString OPTIONAL, implementationVersion [112] IMPLICIT InternationalString OPTIONAL, userInformationField [11] EXTERNAL OPTIONAL, otherInfo OtherInformation OPTIONAL}
--Note:-- For idAuthentication, the type ANY is retained -- for compatibility with earlier versions. -- For interoperability, the following is recommended:-- IdAuthentication [7] CHOICE{-- open VisibleString,-- idPass SEQUENCE {-- groupId [0] IMPLICIT InternationalString OPTIONAL,-- userId [1] IMPLICIT InternationalString OPTIONAL,-- password [2] IMPLICIT InternationalString OPTIONAL },-- anonymous NULL,-- other EXTERNAL -- May use access control formats for 'other'. See Appendix 7 ACC.
2001.9.21 Web & Genome51
検索式
検索式タイプ Type-0: 二者間の専用タイプ Type-1: RPN ( 標準) Type-2: ISO 8777 Type-100: Z39.58 Type-101: 拡張 RPN (v 2) Type 102: Ranked List query
重み付け検索 Relevance Feedback (関連検索)
2001.9.21 Web & Genome52
Type-1 検索式
構成要素 AND,OR,NOT 論理演算子と連携した一つ以上のオペランド
オペランドは二項関係の再帰表現を構成する オペランドは7つの要素から構成される
2001.9.21 Web & Genome53
Type-1 オペランド
0. Term 検索語
1.Use Attributes アクセスポイント
2.Relation Attributes 各アクセスポイントにおける Term とデータの関係 <、=、接辞処理等
2001.9.21 Web & Genome54
Type-1 オペランド
3.Position Attributes Term のアクセスポイント中の位置 フィールドの先頭、サブフィールドの先頭等
4.Structure Attributes Term の扱い方 フレーズ、単語、日付、正規化名称等
2001.9.21 Web & Genome55
Type-1 オペランド
5.Truncation Attributes 短絡形等の適用方法 左側短絡、左右短絡、短絡なし、正規表現
6.Completeness Attributes Term が照合される対象 サブフィールドの一部、サブフィールド全体、
フィールド全体
2001.9.21 Web & Genome56
検索式の例
AND
George Alec Effinger Islam
1:1003
2:3
3:1
4:1
5:100
6:1
1:1035
2:3
3:3
4:101
5:100
6:2
2001.9.21 Web & Genome60
タグ集合
特定のデータ構造のための識別子の集合
1.schemaIdentifier datatype: OBJECT IDENTIFIER
2.elementsOrdered datatype: BOOLEAN
3.elementOrdering datatype: INTEGER
4.defaultTagType datatype: INTEGER
2001.9.21 Web & Genome62
実装と連携の現実
Z39.50 は幾つかのレベルで相互連携を許容する、情報検索の複雑な標準仕様である。
真の相互連携システムの実現には、多くの知識と実証作業が必要となる。
2001.9.21 Web & Genome63
Z39.50 と ILL (図書館間相互貸借)
Z39.50 と ISO ILL(ISO 10160/10161) を連携するための仕様 Z39.50/ILL Profile 1/2 検索、返戻、所蔵確認( Z39.50 )~注文、
貸出、返却( ILL )までの一連の処理をネットワーク経由で連携
2001.9.21 Web & Genome64
ILL プロトコル ISO 10160/10161-1 Peer-to-Peer 全サービスは非確認型
“要求”に対する“応答”を必要としない OSI プロトコル
ASN.1 、 BER または EDIFACT APDU転送
MIME-encoded SMTP または TCP/IP セキュリティ
Prompt-1応答 ディレクトリ情報
外部オブジェクト
2001.9.21 Web & Genome65
Z39.50で ILL
Z39.50 蔵書注文 拡張サービスによる要求・応答
ISO ILL と連携 Z39.50/ILL Profile 1
ISO ILL プロトコル APDU を転送するための Z39.50 蔵書注文拡張サービスを使用する Profile
ISO 10161 で定義される全トランザクション Z39.50/ILL Profile 2
Z39.50 蔵書注文で ILL-Request APDU でパラメータを指定するProfile
2001.9.21 Web & Genome66
使用手順
Z39.50 で検索 所蔵スキーマを用いて、 Z39.50 により所蔵情
報を返戻 Z39.50拡張サービスから ILL Request Z39.50拡張サービスから ILL Answer Z39.50/ILL Profile 1
2001.9.21 Web & Genome67
使用手順
Request後の使用手順 Status request:
STATUS-QUERY Z39.50 サーバのタスク DB からの応答:
STATUS-OR-ERROR-REPORT
2001.9.21 Web & Genome68
Harvard Law (RLG
ILL Manager) Brown U. (via OCLC
Central ILLsystem)
Colorado State U.
(RSS)
U. Penncatalogue
UnionCatalogue
(RLIN)
Directory1.1 Search 1.2 Retrieve
Holdings:U. of Penn
Colorado State
Brown U.
2.3.1 ILL-REQUEST
2.3.2 ILL-ANSWER:
will- supply
2.1.1 Z39.50 query
2.1.2 Response:
Checked Out
2.2.1
Z39.50 query
2.2.2 Response:
Item Available
2.2.3 ILL-
REQUEST
2.3.4 ILL-ANSWER
unfilled (n.o.s.)
貸出処理: ILL Protocol& Z39.50
2001.9.21 Web & Genome69
BLDSCISO ILL Gateway
RLGRLIN
NLM’sISO ILLGateway
LIBRIS(Sweden)
LocalISO ILL
Application
BLDSC ART SystemDocline
Communications Network
Kinetica(Australia)
Te Puna(N.Z.)
NAVIS (Canada)
LIDDAS
CICDistributed
System
Library Consortia
MnSCU/PALS
Bibliographic Utilities
OCLC Central ILL,DRSS
National Libraries
2001.9.21 Web & Genome71
言語面
現状の検索式、診断レコードの国際化 8 bitバイナリデータは扱える 文字集合の符号化方式と言語の交渉
ISO2022、 ISO10646-1 日本語の場合
複数の分かち書きの可能性 多くの異表記
ローマ字、片仮名、漢字 複雑な典拠コントロール
アクセスポイント、レコード構文の対応
2001.9.21 Web & Genome73
MARC
海外では“MARC= ISO2709 準拠” 日本語表現可能な MARC
Japan/MARC MARC21 ( UTF-8, ISO2022-JP )
書誌目録の観点から NACSIS/CAT
MARC ベンダー独自の MARC
2001.9.21 Web & Genome74
新規レコード構文を登録する場合
レコード構文の識別子( OID) 属性集合の定義、拡張(必要に応じて) 要素集合の定義( B… ) 書誌目録の場合
所蔵レコードの取り込み方法 ILL との連携の可能性
合意形成作業が(労多くとも)最も重要
2001.9.21 Web & Genome75
実運用システムの課題
ベンダー間で相互連携性を検証 NII の取り組みは、レコード数と将来の相互連携数の規模
から有望な実証事例 ネイティブなレコード構文による書誌目録の流通を促進 相互連携性テストスーツ・仕様を規定
日本語対応システム ユーザフレンドリな日本語クライアント(ゲートウェ
イ) Z39.50 の開発動機を思い起こしたい
ネットワーク経由の共同目録作成作業を支援する
2001.9.21 Web & Genome76
Z39.50 の将来
Z39.50-200x ( V4)Draft 現在作業中
ZNG - Z39.50 Next Generation XML,URI,SOAP,HTTP Stateless ASN.1,BER,RPN Query を使用しない Explain 機能を普及させたい 抽象構文、スキーマは使用し続ける Z39.50MA は公式には参加していない( LCボランティ
ア)
2001.9.21 Web & Genome77
Z39.50 の将来
Web と親和性の高い、実装の容易なプロトコルが欲しい
Stateless でいい、必要ならセッション管理を付けよう
各目録規則を適切に扱う前提は崩したくない
目録規則と流通方式(検索 / 返戻)の各技術を相互に独立して発展させたい
2001.9.21 Web & Genome78
Z39.50 の将来
現在の Z39.50 規格は、長年の図書館界における情報検索の研究成果
検索式、レコード構文の高度な、特筆すべき拡張性
ネットワーク図書館を構成する、現時点の有望な、洗練されたフレームワークであることに変わりはない!
2001.9.21 Web & Genome79
参照文献
August 1999 Z39.50 Tutorial in Stockholm January 2000 ZIG Meeting in San Antonio ANSI/NISO Z39.50-1995(JIS X 0806:1999) ISO 10160/10161-1 Interlibrary Loan Service
Definition and Protocol Specification Z39.50/ILL Profile ½ The ZNG Initiative “Z39.50 Next Generation”