研究者識別子の重要性とorcidアップデート

36
研研研研研研研研研研研 ORCID 研研研研研研 研研研 研研研研研研研研 orcid.org/0000-0002-7031-1846 研研研研研研研研研研研研研研研研研研研研研 2015 研 9 研 17,18 研 , 研研研研研研研研研研研研研研研研

Upload: national-institute-of-informatics

Post on 14-Apr-2017

878 views

Category:

Science


0 download

TRANSCRIPT

Page 1: 研究者識別子の重要性とORCIDアップデート

研究者識別子の重要性とORCID アップデート

蔵川圭国立情報学研究所

orcid.org/0000-0002-7031-1846

オープンサイエンスデータ推進ワークショップ2015 年 9 月 17,18 日 , 京都大学理学研究科セミナーハウス

Page 2: 研究者識別子の重要性とORCIDアップデート

発表の構成

• 研究者識別子の重要性• 研究者識別子 ORCID の紹介• 日本における研究者識別子への反応

2

Page 3: 研究者識別子の重要性とORCIDアップデート

名前の曖昧性の問題(Name Ambiguity Problem)

• 同姓同名• 旧姓• ペンネーム• 漢字異体字• ジャーナルごとに異なる姓名表記フォーマッ

ト– 姓名の順– イニシャル表記– 大文字・小文字

3

Page 4: 研究者識別子の重要性とORCIDアップデート

名前の翻字 (transliterate)

• ラテン文字への翻字によって、同姓同名が増える

4

“Which Wei Wang?”,Phys. Rev. Lett. 99, 230001 (2007) DOI:10.1103/PhysRevLett.99.230001

王伟 , 王薇 , 王维 , 王蔚 , 汪卫 , 汪玮 , 汪威 , 汪巍

Wei Wang

Page 5: 研究者識別子の重要性とORCIDアップデート

名寄せ (Name Disambiguation)• 名前の問題を解決して、同一性を判定することを「名

寄せ」という• 研究者の名寄せによって、

– 研究者ごとに正確に論文やその他研究成果をリスト化でき、リストは知識体系への貢献度を正確に測る情報源となる

– 正確な論文や研究成果のリストから、ある研究者の研究の展開を追認できる

– 研究者が正確に過去の業績によってプロファイルされることで、そのプロファイルは新たな研究チームを構成する際の正確な情報源として活用できる

– 学術コミュニケーションにおける様々な場面において、研究者を特定した情報交換が可能となる

5

Page 6: 研究者識別子の重要性とORCIDアップデート

同姓の分布• 同姓の数の分布はベキ乗則に

従うことが観測されている

–    は、文化的な振る舞いや社会的ダイナミクスに依存して決定される

• 同姓の数のランク順分布(同姓の数 / ランク)はベキ乗則に従う( Zipf の法則)

6

は、同姓の数を示し、 は定数

Baek, S., Kiet, H., Kim, B.: Family name distributions: master equation approach. Phys. Rev. E 76, 046113 (2007). doi:10. 1103/ PhysRevE. 76. 046113

[Baek, et.al. 2007]

Page 7: 研究者識別子の重要性とORCIDアップデート

日本の図書館目録• NACSIS-CAT

– 国立情報学研究所の運営– 日本の大学図書館の所蔵する図書・雑誌の総合目録– 洋書が多く含まれる– USMARC準拠– 日本目録規則,およびAACR2

• JAPAN/MARC– 国立国会図書館の運営– 国会図書館の所蔵する,日本で刊行された出版物および外国で刊行された日本語出版物

の目録– UNIMARC準拠– 日本目録規則

• TRC/MARC– 図書館流通センターの運営– 日本で刊行される出版物の目録– UNIMARC準拠– 日本目録規則

7

書誌 典拠

著者名 ( 統一 ) 書名

参照する

目録

参照する

Page 8: 研究者識別子の重要性とORCIDアップデート

図書館目録の著者名典拠• NACSIS-CAT著者名典拠ファイル

– 個人名,団体名の典拠– 個人名1,263,685件(西洋人著者名含む, 2008年12月18日)

• JAPAN/MARC典拠ファイル– 個人名,家名,団体名,および統一書名の典拠– 個人名681,924件(西洋人著者名含む, 2008年7月5日)

• TRC/MARC著者名典拠ファイル– 個人名,機関名の典拠– 個人名566,249件(西洋人著者名含む, 2009年3月29日)

8

人名データベース 登録件数( 漢字圏の東洋

人の統一形標目を抜粋 )

同一姓名が複数存在する登録件数

同一姓名が複数存在する異なり姓

名数

同一姓名に対する最大

登録件数

同一姓名が複数存在する登録件数

の割合NACSIS-CAT著者名典拠ファイル(2008 年 12 月 18

日 )329,864 32,034 13,344 20 9.71%

JAPAN/MARC典拠ファイル

(2008 年 7 月 5 日 ) 572,638 73,138 28,067 29 12.77%

TRC/MARC著者名典拠ファイル(2009 年 3 月 29

日 )464,962 58,979 22,969 27 12.68%

Page 9: 研究者識別子の重要性とORCIDアップデート

著者名典拠における異なり姓名ごとの登録件数の分

9

NACSIS-CAT

527,567

13,34420

JAPAN/MARC

TRC/MARC

29

27

28,067

22,969 428,952

311,174

異なり姓名順位

異なり姓名順位

異なり姓名順位

登録

件数

登録

件数

登録

件数

Page 10: 研究者識別子の重要性とORCIDアップデート

著者名典拠における異なり姓名順位トップ 20

NACSIS--CAT JAPAN/MARC TRC/MARC

順位 姓名 登録件数 姓名 登録件数 姓名 登録件数

1 高橋徹 20 鈴木博 29 鈴木博 272 鈴木博 17 田中実 29 田中実 263 佐藤進 17 伊藤博 28 小林茂 244 田中実 16 小林茂 26 高橋徹 235 伊藤博 16 鈴木一郎 24 鈴木実 226 高橋進 13 高橋一郎 22 佐藤進 217 高橋清 13 佐藤正 22 渡辺誠 198 鈴木一郎 13 高橋徹 21 佐藤正 199 小林茂 13 鈴木実 21 伊藤博 1910 吉田豊 13 田中豊 21 田中稔 1811 高橋誠 12 (李〓) 21 小林一郎 1812 田中宏 12 鈴木茂 20 鈴木隆 1713 渡辺誠 12 吉田稔 20 鈴木茂 1714 渡辺茂 12 田中宏 19 田中宏 1715 小林哲夫 12 佐藤進 19 吉田豊 1716 田中明 11 高橋和子 18 佐藤博 1717 佐藤正 11 渡辺誠 18 高橋進 1618 中村宏 11 渡辺宏 18 田中豊 1619 高橋豊 10 高橋清 17 田中茂 1620 高橋正明 10 (陳〓) 17 田中一郎 16

10

Page 11: 研究者識別子の重要性とORCIDアップデート

母集団の大きさに依存する同姓同名の割合

• 文献によると–田中康仁,同姓同名の発生頻度,計算言語学

10-1 , 1977–昭和 51 年当時の日本人の漢字姓名 107万人

の名簿を用いて機械的に数え上げ

110 20 40 60 80 100 120

010203040

同姓同名がいる人の割合 (%)

万人

%

母集団

Page 12: 研究者識別子の重要性とORCIDアップデート

研究者の名寄せの方法

• 図書館の目録のように、閉じたデータベースの中では人手で著者に英数字記号の識別子 (Identity: ID) を付けて区別した

• 学術論文のデータベースでは、 2つの方法がとられてきた–計算機による名寄せ–手動で登録

12

Page 13: 研究者識別子の重要性とORCIDアップデート

学術論文データベースにおけるこれまでの 2つのアプローチ

• 計算機による名寄せ– 論文書誌を対象に著者でまとめる– 論文情報システムの著者名検索結果として機能– プロダクションシステムとして必要な 99%以上の精度を求めるには程遠い

– 例• Scopus Author Identifier

(Elsevier 社の Scopus に実装 )• Distinct Author Identification System

(Thomson Reuters 社の Web of Science に実装 )• 手動で登録

– 著者を対象に論文書誌を集める– 研究者業績ショーケースとして機能– 簡単に著者と論文書誌を網羅できない– 例

• ResearcherID (Thomson Reuters 社 )13

Page 14: 研究者識別子の重要性とORCIDアップデート

研究者識別子 ORCID• Open Researcher and Contributor ID

– Open : 公開された– Researcher : 研究者– Contributor : 貢献者 /寄与者– ID : 本人証明

• 設立趣旨 (Mission Statement)– ORCIDは、学術コミュニケーションにおける著者 /貢献者の名前の曖昧性の問

題を解決することを目的とし、個々の研究者に対する固有の識別子の中央レジストリと、ORCIDと現存する他の著者 IDスキームとの間のオープンで透過的なリンクメカニズムを構築することによって実現する。これらの識別子及び識別子間の関係は研究者のアウトプットにリンクすることが可能であり、科学的発見プロセスを拡大させ、研究コミュニティにおける研究助成や協働の効率性を改善する。

• http://www.orcid.org/• 2011年より NPO 法人• 2012年 10月よりサービスを開始• 研究者個人の ORCID iD 登録は無料 14

Page 15: 研究者識別子の重要性とORCIDアップデート

15

ORCID では、世界有数の学術関連コミュニティがメンバーとなっている( 300 以上)

Page 16: 研究者識別子の重要性とORCIDアップデート

ORCID ID システム

• アイデンティティとして扱う基本的な情報– 研究者自身の記述– 研究者とその出版物間の関係の記述

• ハイブリッド型による登録– 研究者による登録–組織による登録

16

ORCID iD

プロファイル

出版物申告

Page 17: 研究者識別子の重要性とORCIDアップデート

ORCID ID システムのシナリオ

コアシステム(ORCID identity system)

パートナーシステム

エンドユーザー

17

だれが文書 X を書いたか?

ID Y の人が書いた、または査読した文書はどれか?

たとえば、原稿追跡システム( MTS : Manuscript Tracking System )にシングルサインオン( SSO )して、編集事務局、マーケティング部門、ロイヤルティ支払いシステムなどと連絡先情報を共有

Page 18: 研究者識別子の重要性とORCIDアップデート

ID の連携とデータの交換

18

200以上の Integration points

Page 19: 研究者識別子の重要性とORCIDアップデート

個人の ORCID iD 取得は無料

Page 20: 研究者識別子の重要性とORCIDアップデート

20

インポート元のリストを開く

Page 21: 研究者識別子の重要性とORCIDアップデート

21

プリセットされたインポート元のリスト

インポート元を選択してID 連携とデータ交換を開始

ID 連携とデータ交換サービスはORCID パートナーのサイトで提供されている場合もある

Page 22: 研究者識別子の重要性とORCIDアップデート

ORCID のここ 1 年の動き• 登録 iD数>1,500,000 (2015-08, 公開以来、線形に増加 )• メンバー数>300• システムインテグレーション数>200• Federated Identity に対応する予定

• アンバサダー制度– それぞれの地域での広報役

• アンバサダー組織 : 3組織• Asia Pacific Rim: 19名• Europe, Middle East, and Africa: 27名• North and South America: 40名

– アンバサダーへORCID資料の提供• スタッフの増加

– 19名 (2015-09-16)• Membership, Communications, Member supportの増強

– ORCIDメンバー会費やスポンサーシップ以外に、活動助成金獲得が主な要因

22

Page 23: 研究者識別子の重要性とORCIDアップデート

日本における研究者識別子への様々な立場からの反応

• 日本における代表的な研究者識別子– e-Rad 研究者番号– ORCID iD

• 日本における研究者識別子に関与する様々な立場– 日本の研究者– 日本の大学経営層– 日本の政府系助成機関– 論文雑誌出版者– 学術情報プロバイダー– 学会

• 立場によって、研究者識別子への反応は異なる23

Page 24: 研究者識別子の重要性とORCIDアップデート

日本の研究者の反応• 研究者は研究者識別子には興味はない• 研究成果の評価はされたくない

– そもそも科学的な知見を評価するのは簡単な話ではない– 科学的な発見は常に書き換えられるものだ– 評価はされたく無いが、褒章はされたい

• 科研費などの政府系研究助成に申請したい– e-Rad研究者番号を取得しなければならない– 説明責任として、e-Rad研究者番号で成果が公開されるのは致し方ない– e-Rad研究者番号で識別されて成果が公開されるのであれば、齟齬の無いよう公開して欲しい

• 地球観測の研究データを構築している研究者にとって、データの共有はコミュニティとして必然であるととらえている– データ作成にはコストがかかるので、次年度の予算申請根拠としてデータ利用の実績を出版

された論文の謝辞をチェックし測る– データ利用の論文謝辞はコミュニティとして義務付けている– 研究データにDOIをつけて、自動的に利用実績がわかるのは歓迎したい– 研究データそのものは研究成果ではないが、研究データ作成を科学への貢献としては認めて欲しい

– 研究データの貢献者として、e-Rad研究者番号ではなく、より国際的に認知されたORCID iDをつけ、貢献度合いをまとめてわかるようにするのは歓迎したい

Page 25: 研究者識別子の重要性とORCIDアップデート

日本の大学経営層の反応

• 自機関の研究者を業績評価・公開するために、 e-Rad 研究者番号で識別できるのは歓迎したい

• 自機関の研究者を業績評価・公開するために、国際的な ORCID iD で識別するのは歓迎したい

Page 26: 研究者識別子の重要性とORCIDアップデート

私は URA として研究者情報や ID の担当をしています。本学では組織的に ORCiD 取得を試みています。また研究者の学内 HP から各研究者情報のページにリンクを張れないか検討しています。日本の情報として最も効率的なのは研究者リゾルバー ID へのリンクかと思われますが、本学には、まとまった情報はないと思われます。そこで以下 2 点をお伺いしたくメールいたしました。1 .横浜国立大学の登録者の研究者リゾルバー ID の一括提供2. 研究者リゾルバー ID および研究者リゾルバー ID からリンクしている DB のロゴの提供ご多忙のところ恐縮ですが、ご返信いただけると幸いです。どうぞよろしくお願いいたします。

ある国立大学の研究者情報担当教員の声

2014 年 12 月 8 日、研究者リゾルバーへのお問い合わせから

Page 27: 研究者識別子の重要性とORCIDアップデート

27

国内学術データベースの研究者ページと ORCID へまとまったダイレクトリンクのリスト

研究者リゾルバーの研究者ページの例http://rns.nii.ac.jp/nr/10000{e-Rad 研究者番号 }

Page 28: 研究者識別子の重要性とORCIDアップデート

28

機関リポジトリに登録した論文の著者から研究者リゾルバーのページへリンク

Page 29: 研究者識別子の重要性とORCIDアップデート

日本の政府系研究助成機関の反応

• 研究者が申請する研究課題の審査と成果評価のために研究者を識別する必要があり、省庁横断型の e-Rad 研究者番号を付与する

• 研究成果を一般国民に公開する義務があり、研究者の反発がないのであれば、研究者を識別して公開したい

Page 30: 研究者識別子の重要性とORCIDアップデート

30

科学研究費助成事業データベースの研究者ページhttps://kaken.nii.ac.jp/r/{e-Rad 研究者番号 }

Page 31: 研究者識別子の重要性とORCIDアップデート

31

「科研費NEWS」で掲載された「最近の研究成果トピックス」

研究者リゾルバーへリンク

Page 32: 研究者識別子の重要性とORCIDアップデート

雑誌論文出版者の動き• 論文投稿者を自前で管理してきたが、研究者の

識別子の管理は膨大で競争的ビジネス環境には馴染みにくいので、雑誌論文業界全体として一元的に管理される研究者識別子を付与して管理する ORCID を運営する

• 論文投稿時に原稿追跡システム (MTS)上でORCID iD をオプションで入力できるようにしている

• ORCID iD に関連付けられた論文を雑誌論文電子図書館で名寄せして公開している

32

Page 33: 研究者識別子の重要性とORCIDアップデート

学術情報プロバイダーの動き

• 論文著者を自前で管理してきたが、研究者の識別子の管理は膨大で競争的ビジネス環境には馴染みにくいので、雑誌論文業界全体と協調して一元的に管理される研究者識別子を付与して管理する ORCID を運営する

• ORCID iD を用いて研究者を識別することができれば、経営層の期待する研究業績プロファイルを正確に作成することができコンサルテーションビジネスにつなげたい

33

Page 34: 研究者識別子の重要性とORCIDアップデート

学会の反応

• 学会においても、論文雑誌出版者と同様に、論文雑誌を刊行しており、 ORCID の必要性に賛同する

• 論文投稿時だけでなく、会議論文投稿時や会議参加申請時に ORCID iD をオプションで入力できるようにしている

• ORCID iD に関連付けられた論文を雑誌論文電子図書館で名寄せして公開している

34

Page 35: 研究者識別子の重要性とORCIDアップデート

35

AGU(American Geophysical Union 、米国地球物理連合 ) からアンケートORCID のパートナーである AGU から、アンケートのお願いがあります。 ORCID は名前の曖昧性の問題を解消するための組織です。このアンケートでは、 ORCID をご存知かどうか、どう思うかについてお答えいただきます。ORCID について詳しいかどうかにはかかわらず、 AGU の会員の皆様のお考えを重要と考えており、 ORCID の将来プランの参考にいたします。・・・・アンケートの結果は ORCID の blogに掲載されます。Brooks Hanson Director, Publications, AGU orcid.org/0000-0001-6230-7145 Alice Meadows Director of Communications, ORCID orcid.org/0000-0003-2161-3781

京都大学地磁気世界資料解析センター 能勢正仁氏より提供2015 年 9 月 2 日付

Page 36: 研究者識別子の重要性とORCIDアップデート

おわりに• 研究成果や研究データにかかわった研究者を特定するとき、

名前の表記を手がかりとするだけでは不十分であり、識別子が必要

• 国際的な研究者識別子として、 ORCID がある– 海外有力学術雑誌出版社、学会、大学などが参加– システム間連携の数は 200以上– iD 登録数は、線形に増加し、 1,500,000 を超えた

• 日本の研究者にとって関心のある研究者識別子は 2つ– e-Rad 研究者番号– ORCID iD

• 日本において、研究者識別子への反応は置かれた立場によりさまざま

36