平成25年度 特許出願技術動向調査報告書(概要)平成25年度...

60
平成25年度 特許出願技術動向調査報告書(概要) ビッグデータ分析技術 平成26年2月 問い合わせ先 特許庁総務部企画調査課 技術動向班 電話:03-3581-1101(内線2155)

Upload: others

Post on 17-Mar-2020

10 views

Category:

Documents


0 download

TRANSCRIPT

平成25年度 特許出願技術動向調査報告書(概要)

ビッグデータ分析技術

平成26年2月

特 許 庁 問い合わせ先

特許庁総務部企画調査課 技術動向班 電話:03-3581-1101(内線2155)

- 1 -

第第第第 1111 章章章章 調査概要調査概要調査概要調査概要

第 1 節 調査目的

特許情報から技術全体を俯瞰し、経済情報・産業情報を踏まえた技術開発の進展状況・

方向性を把握することは、特許庁における審査体制の構築や的確かつ効率的な審査等の

ための基礎資料を整備する上で必要である。また、特許情報は企業等の研究開発動向、

知財戦略の表れであり、企業等における戦略の方向性を決定していく上でも重要なもの

である。

本調査は、近年、特に注目されている「ビッグデータ分析技術」の分野について調査

分析を行うものである。

本調査の目的は、本調査結果に基づいて、以下の項目を明らかにすることにある。

(1) 本テーマにおける国内外の技術発展状況、研究開発状況

(2) 本テーマにおける日本及び外国の技術競争力、産業競争力

(3) 本テーマにおいて日本企業・政府機関が取り組むべき課題と、今後目指すべき研

究・技術開発の方向性

第 2 節 ビッグデータの置かれた環境

ビッグデータは、ボリューム(Volume:大量性)、バラエティ(Variety:多様性)、ベ

ロシティ(Velocity:高速性)という、3 つの「V」によって特徴づけられる。多様で大

量のデータが次々と高速に生成されてくる環境下で、データの中に秘められた価値ある

情報を引き出し、活用することの有用性が広く認識されてきた。欧米、そして日本を代

表する企業が技術開発と市場開拓にしのぎを削っている。

ビッグデータ活用の利点を真に享受するためには、数々の課題を解決する必要がある。

ビッグデータの分析・活用に関する期待と課題は、以下の 4 つの大きな枠組みの下に捉

えることができる。

1. データドリブン社会の到来

大量のデータから情報を引き出すことに価値があることが広く認識されてきた。異業

種間でデータを流通・連携させて分析することで、新たな知識を発見し、企業における

新たなビジネスの創出、社会システムの効率化の実現が可能となってきた。

個人情報保護やデータの流通・連携の促進を支える技術(匿名化等)や制度的な支援

の実現が重要と考えられている。

2. 分析対象データの多様化

従来、活用対象となるデータの主流は、POS から得られる販売データやインターネッ

トショッピングでの購買履歴データなどの定型のデータや、インターネット上の各種サ

イト(SNS サイトなど)で入手可能なテキストなどのコンテンツであった。これらは人

起源のデータであり、生成されるデータの総量は人口の規模で抑えられるオーダのもの

であった。

今後は、M2M サービスに代表されるように、センサや計測器が大量に社会に導入され、

それらから大量で多様なデータが時々刻々と生成されるようになる。データ加工技術の

進展に応じて、分析対象として活用できるデータ及び応用分野はさらに多様化が進展す

ると考えられる。

- 2 -

3. 付加価値の源泉は分析技術

前述のようにして、取り扱うべきデータ量の爆発とデータ種別の多様化が進むと、こ

れらから生じる課題に対応するビッグデータ処理技術が必要とされる。必要とされる技

術は、データの量と速度に対応するためのものと、データから価値を引き出すためのも

のの 2 系統に大別して捉えることができる。

量・速度への対応には、データを蓄積しないままで処理するストリーム処理、また、

ストック系のデータ処理基盤として膨大な量(ペタバイト、エクサバイト級)のデータ

を多数の処理サーバに分配して蓄積・処理する大容量データ処理技術が重要性を増して

くる。さらに、小さく細かいデータから大量のデータまでに柔軟に対応でき、また、急

激な量の変化に対応できる伸縮性のある処理技術も重要と考えられている。

価値抽出への対応の観点では、生データを分析に適した質の高いデータに加工する前

処理、データ分析者にとって使いやすく新たな気づきの得られるマイニング技術が重要

と考えられている。

4. データサイエンティストの確保が必須

目的とする分析結果を得るためには、明確な相関を有するとは断じられない多様なデ

ータ源の中から適切なデータ源を見極め、事業を成功に導く仮説を設定し、その仮説に

対してデータ分析ツールを駆使して検証することが必要となる。数理統計などの技術素

養を有し、この仮説設定・検証工程を推進できる能力を有する人材はデータサイエンテ

ィストと呼ばれており、世界的にも人材が不足していることが認識されている。

第 3 節 調査範囲

本調査では、ビッグデータ利活用の全体像を、データ発生源で生成されたデータがそ

の所有者によってデータ処理系に供給され、データ分析の実施者・利用者が処理系を活

用して新たな知見を引き出して活用する過程の全体を含む総体としての連鎖システムと

して捉えることとした。その構造を図 1-1 の俯瞰図に示す。

コンピュータによって処理が実行される一点鎖線枠内の機能ブロック「ビッグデータ

分析処理系」が特許・非特許の文献調査による技術分析の対象範囲である。それを取り

巻く全体像としての動向は市場環境及び政策動向の調査により分析する。

技術俯瞰図において、ビッグデータ分析処理系の技術を、ストック系分析技術(同図

の中段)、ストリーム系分析技術(同図の上段)、分析基盤技術(同図の下段)の 3 つの

技術領域に区分して捉える。ストック系分析技術はデータ処理の流れに着目すると、ス

トック系データ前処理技術、解析対象データベース(解析対象 DB)、データ解析技術に

大分類される。ストリーム系分析技術の内部構造は、ストック系の場合と同様に、スト

リーム前処理技術とストリーム解析技術に区分される。それらの分析処理の実行の大規

模化、高速化、高信頼化等を支える共通的な技術として分析基盤技術を位置付けた。

- 3 -

図 1-1 ビッグデータ分析技術の俯瞰図

データデータデータデータ

利用側利用側利用側利用側

データ提供側データ提供側データ提供側データ提供側

データ解析データ解析データ解析データ解析

・マイニング

・OLAP

・プライバシー保護マイニング

・時系列マイニング

・機械学習

・可視化

・解析履歴管理

データ前処理データ前処理データ前処理データ前処理

・データ変換

(データマイグレーション)

(データクレンジング)

・匿名化

ストック系分析技術ストック系分析技術ストック系分析技術ストック系分析技術

ストリーム系分析技術ストリーム系分析技術ストリーム系分析技術ストリーム系分析技術

解析対象解析対象解析対象解析対象DBDBDBDB

・RDB

・XMLDB

・DWH

・データマート

人手・機械による

繰り返し

ストリーム前処理ストリーム前処理ストリーム前処理ストリーム前処理ストリームストリームストリームストリーム解析解析解析解析

・ストリームデータ処理

・ストリームマイニング

ビッグデータ分析処理系(調査対象範囲)ビッグデータ分析処理系(調査対象範囲)ビッグデータ分析処理系(調査対象範囲)ビッグデータ分析処理系(調査対象範囲)

データデータデータデータ

発生源発生源発生源発生源

・既存DB

・センサ

・Webコンテンツ

・システムログ

・リンク情報

・オフィス文書

・マルチメディア

分析再試行・分析結果再利用分析再試行・分析結果再利用分析再試行・分析結果再利用分析再試行・分析結果再利用

分析分析分析分析基盤技術基盤技術基盤技術基盤技術

各種の

データ

サイエン

ティスト

・分散ファイルシステム/DB

・分散並列処理システム

・プライバシー保護

・データ改ざん防止

分析結果分析結果分析結果分析結果

利用シス利用シス利用シス利用シス

テムなどテムなどテムなどテムなど

第 4 節 調査方法

本調査では、特許動向、研究開発動向、市場環境及び政策動向の 4 つの側面から調査

を行う。特許動向調査の結果を主体とし、これと他の 3 つの調査結果に基づく総合分析

を行うことにより日本が目指すべき技術開発・研究開発に関する提言を導出する。

調査対象となる特許及び論文について、それぞれがどのような特徴を持つのかを分析

するための分類として、表 1-1~表 1-4 に示すように「技術」、「データ発生源」、「課題」

及び「応用分野」の 4 つの区分を設定し、網掛けした項目を分類付与項目とした。要素

技術に関する文献分析では、第 1 軸と第 2 軸の 2 つの観点で技術区分を展開し、調査し

た文献には双方の軸から記載内容に合致する分類を付与した。

- 4 -

表 1-1 技術区分

第 1 軸

第 2 軸

技術領域 大分類 中分類 小分類 細目

ストック

系分析技

データ

解析技

マイニング

データマイニング

テキストマイニング

リンクマイニング

プライバシ保護マイニング

時系列マイニング

可視化

機械学習

データ解析履歴管理

OLAP OLAP

その他 その他の解析技術

解析対象 DB

データウェアハウス

データマート

その他の解析対象 DB

解析対象 RDB

解析対象 NoSQL 一般

ストッ

ク系デ

ータ前

処理技

データ変換技

データマイグレーション

データクレンジング

その他のデータ変換

匿名化

単純匿名化

複合匿名化

その他の匿名化

その他 その他のデータ前処理

ストリー

ム系分析

技術

ストリ

ーム系

処理技

ストリーム前

処理

ストリームクレンジング

その他のストリーム前処理

ストリーム解

析技術

センサデータストリーム処理

テキストストリーム処理

ストリーム処理一般

ストリーム問合せ

ストリーム統計

ストリームマイニング

機械学習

分析基盤

技術

分析基

盤技術

分散データ蓄

積システム

分散ファイルシステム データ解析履歴管理

データ改ざん防止

プライバシ保護基盤

分散データベース

基盤 RDB

基盤 NoSQL

分散 DB 一般

分散ストレージ

分散並列処理 分散並列処理

その他 その他分析基盤技術

表 1-2 データ発生源区分

大分類 小分類

既存 DB

取引データ(POS データなど)

センサ

位置情報

建造物情報等

システムログ

Web コンテンツ

リンク(サイトリンク、ソーシャルリンク)

テキスト情報

マルチメディアデータ

通信サービス関連情報

経営情報

医療情報

金融情報

その他

- 5 -

表 1-3 課題区分

課題区分 該当する技術要件 課題例

経済性・収益性

スケーラビリティを確保しながらコストアップを回

避し収益性を確保し、ビッグデータ活用を経済的に実

現するための技術

低コスト、自動化、効率性

網羅性・柔軟性

臨機応変に分析手法を選択し、関係モデルで扱いにく

い多様で形態の異なる非構造データソースを組み合

わせて包括的な分析を行う技術

データ連携、非構造データ

大規模化・高速性・

リアルタイム性

データの発生・更新頻度の高さを克服し即時的処理を

行い、大規模なデータを高速に処理する技術

スケールアウト、リアルタイム、

高速処理

正確性

データの矛盾、曖昧さによる不確実性、近似値を積み

重ねた不正確さなどを排除し、データ分析処理の正確

性を実現する技術

ノイズ除去、欠陥排除

プライバシ保護

秘匿性と個人情報保護を確保し、かつ適正なプライバ

シ保護を実現する技術

プライバシ、匿名化、暗号化

ユーザの利便性

使いやすい、便利、分かりやすいなど、ユーザの利便

性を向上させる技術

操作性、認知性

信頼性・安全性

システム動作や情報管理において、部分的な障害や、

外部からの攻撃があっても動作を継続させることの

できる技術

セキュリティ、二重化

表 1-4 応用産業分野区分

大項目 中項目 小項目

公共ユース

災害分野

自然災害対策

防犯対策

政策・計画分野

交通管理

インフラ管理

電子政府

エネルギー管理

スマートシティ/スマートグリッド

その他公共 公共一般

企業ユース

企業ビジネス分野

情報推薦

マーケティング

電子商取引

通信

電力

農林水産支援

企業経営分野

生産管理

故障予知・予防保全

その他企業 企業一般

研究・教育ユース 研究・教育分野 科学技術分野

生活分野(個人ユース)

個人生活関連分野

医療・健康管理

ソーシャルネットワークサービス

行動管理

ゲーム・コンテンツ分野

個人ビジネス分野 金融情報

その他個人 生活分野一般

第 5 節 登録商標について

本要約では、原則的に商品名及びサービス名の表記は、登録商標に従った。なお、本

要約の図、表等に記載する会社名、商品名、サービス名は一般に各社の商標又は登録商

標である。本要約に現れる登録商標を表 1-5 に示す。

- 6 -

表 1-5 本報告書に現れる登録商標

商標名 権利者

DTS 株式会社 DTS

GOOGLE、グーグル グーグル・インコーポレイテッド

Hadoop Apache Software Foundation

IBM、アイ・ビー・エム インターナショナル・ビジネス・マシーンズ・コーポレーション

itelligence itelligence AG

Microsoft、マイクロソフト マイクロソフト コーポレイション

NETEZZA アイ・ビー・エム インターナショナル グループ ビー ヴイ

NTT データ 日本電信電話株式会社

Pig Apache Software Foundation

TWITTER、ツイッター トゥイッター インコーポレイテッド (ツイッターは商表登録出願中)

YAHOO!、ヤフー ヤフー!インコーポレイテッド

アクセンチュア アクセンチュア グローバル サービスィズ リミテッド

アップル アップル インコーポレイテッド

アマゾン アマゾン テクノロジーズ インコーポレイテッド

アルストム アルストム

インテル インテル・コーポレーション

ウイングアーク テクノロジーズ 1st ホールディングス株式会社

オラクル オラクル・インターナショナル・コーポレーション

サンディスク サンディスク コーポレイション

シーメンス ジーメンス アクチエンゲゼルシヤフト

ゼロックス ゼロックス・コーポレーション

ソニー ソニー株式会社

テラデータ テラデータ ユーエス インク

トムソン・ロイター トムソン ロイター グローバル リゾーシズ

ドコモ 日本電信電話株式会社

ノキア ノキア コーポレーション

パナソニック パナソニック株式会社

ヒューレット・パッカード ヒューレット-パッカード デベロップメント カンパニー エル.ピー.

フィリップス コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ

フェースブック フェイスブック・インコーポレイテッド

フランステレコム フランス テレコム

リコー 株式会社リコー

レクシスネクシス リード エルシヴィア プロパティーズ インコーポレイテッド

網屋 株式会社網屋

伊藤忠テクノソリューションズ 伊藤忠テクノソリューションズ株式会社

大阪大学 国立大学法人大阪大学

大林組 株式会社大林組

京都大学 国立大学法人京都大学

群馬銀行 株式会社群馬銀行

慶應義塾大学 慶應義塾

三星電子 三星電子株式会社

数理システム 株式会社 NTT データ数理システム

東京大学 国立大学法人東京大学

東芝 株式会社東芝

名古屋大学 国立大学法人名古屋大学

博報堂 株式会社博報堂

日立製作所 株式会社日立製作所

富士通 富士通株式会社

三井住友カード 三井住友カード株式会社

三菱重工 三菱重工業株式会社

楽天 楽天株式会社

- 7 -

第第第第 2222 章章章章 市場環境市場環境市場環境市場環境

第 1 節 データ量の推移と予測

ビッグデータが経済成長に寄与する可能性について、その寄与を具体的に分析するた

めには、その前提として、我が国においてどの程度のビッグデータが生成、流通、蓄積

されているのか、その実態を把握する必要がある。

日本におけるビッグデータ分析市場の規模を測る指標となる、データ流通量

1

のメディ

ア別推移を図 2-1 に、2012 年のデータ蓄積量

2

を図 2-2 に示す。

図 2-1 日本におけるデータの流通量

0 500 1,000 1,500 2,000 2,500

2005年

2008年

2011年

2012年

データ流通量

電子メール

238 PB

RFIDデータ

584 PB

GPSデータ

348 PB

固定IP電話

178 PB

POSデータ

765 PB

合計:2,217 PB

POSデータ

202 PB

合計:424 PB

(PB)

合計:1,034 PB

合計:1,536 PB

図 2-2 日本におけるデータ蓄積量(単位:TB)

製造業

826,069

建設

1,290,716

電力・ガス・

水道

5,613

商業

3,211,362金融・保険

823,833不動産

333,855

運輸

115,344

情報通信

583,345

サービス

2,517,932

合計

9,708,069 TB

(2012年)

1

流通量の出典:「平成 25 年版 情報通信白書」(総務省)

http://www.soumu.go.jp/johotsusintokei/whitepaper/ja/h25/pdf/25honpen.pdf p.159 図表

1-3-2-9 ビッグデータ流通量推移(メディア別) licensed under CC-BY 2.1 JP

http://creativecommons.org/licenses/by/2.1/jp/

2

蓄積量の出典:「平成 25 年版 情報通信白書」(総務省)

http://www.soumu.go.jp/johotsusintokei/whitepaper/ja/h25/pdf/25honpen.pdf p.160 図表

1-3-2-11 ビッグデータ蓄積量(産業別、2012 年) licensed under CC-BY 2.1 JP

http://creativecommons.org/licenses/by/2.1/jp/

- 8 -

2012 年のデータ流通量は 2.2 エクサバイト、蓄積量は 9.7 エクサバイトである。デー

タ流通量は 2005 年から 7 年間で約 5 倍に増加している。データ蓄積量は同年のデータ流

通量の約 5 倍となっており、蓄積量には過去からの累積が含まれることを考慮しても、

蓄積量に対する流通量の比率は小さく、同一企業内等でのデータ活用が多く、データ流

通が進んでいない状況に留まっていると考えられる。

図2-1に示したデータ流通量の推移を基に将来の伸びを予想した結果を図2-3に示す。

図 2-3 日本のデータ流通量の推移と予測

2.2

4.6

9.6

20.0

41.7

1.0 1.5

3.3

4.8

7.0

10.3

0

5

10

15

20

25

30

35

40

45

2008 2011 20122014(予測) 2016(予測) 2018(予測) 2020(予測)

西暦

2011年から2012年のデー

タ流通量の増加率で推定

2008年から2012年のデー

タ流通量の増加率で推定

(EB)

年間伸び率 1.4倍

年間伸び率 1.2倍

2008 年から 2012 年までの 4 年間の伸び率は約 1.21 倍/年、2011 年から 2012 年の 1

年間では約 1.44 倍/年となっている。これらの伸び率が続くと仮定すると、2020 年のデ

ータ流通量は、最小で約 10.3 エクサバイト(2012 年比 4.7 倍)、最大で約 41.7 エクサバ

イト(2012 年比 19.0 倍)となる。

- 9 -

第 2 節 活用事例の動向

業種別の事例件数比率を図 2-4 に、活用対象データ種別の事例件数比率を図 2-5 に示

1

。個々の事例に該当する業種あるいはデータ種別の分類を付与する際は、複数の分類

の付与を許した。

図 2-4 活用事例の業種別比率

0%

10%

20%

30%

40%

50%

60%

業種

日本の業種比率

海外の業種比率

合計の業種比率

図 2-5 活用事例の対象データ別比率

0%

10%

20%

30%

40%

50%

60%

対象データ

日本の対象データ比率

海外の対象データ比率

合計の対象データ比率

1

(出典) 日経 BP 社「ビッグデータ総覧 2013」の適用事例集に基づき集計した。

日本の事例は 100 件、海外の事例は 30 件

各事例への業種、利用データ区分の付与に当たっては、複数項目の付与を許した。

比率は各分類の事例数を日本の場合 100 件、海外の場合 30 件、合計の場合 130 件に対する比率として算

出した。

- 10 -

業種別に関しては、日本では製造、流通、海外では情報サービスの比率が高い。対象

データ別の活用事例数を見ると、日本ではその他行動ログ(50%)、購買行動(40%弱)の比

率が高い。海外では、オープンデータ(50%弱)、ソーシャルデータ(40%強)の比率が高い。

センサ・デバイスからのデータの活用事例比率は、日本・海外とも約 30%となっている。

第 3 節 企業の動向

米国企業を中心として、将来の事業展開に向けて不足する技術を獲得するなどの目的

で、企業買収により企業競争力を高める動向がみられる。大手 IT 企業の 2008 年以降の

買収企業の数とタイプの調査結果を図 2-6 に示す

1

図 2-6 主要 IT 企業の買収戦略(買収企業のタイプと数)(2008 年以降)

1

1

2

4

4

4

10

2

1

5

2

3

2

5

1

1

3

2

5

2

3

1

8

15

18

20

29

24

23

35

38

75

0 10 20 30 40 50 60 70 80 90

エスエイピー(ドイツ)

ヒューレット・

パッカード(米国)

イー・エム・シー(米国)

アマゾン(米国)

アクセンチュア

(アイルランド)

ヤフー(米国)

マイクロソフト(米国)

オラクル(米国)

アイ・ビー・エム(米国)

グーグル(米国)

データ分析技術 応用分野 その他分析支援 ビッグデータ以外

買収件数

(件)

3

1

3

4

4

9

35

0 10 20 30 40

日本電気

富士通

東芝

日立製作所

NTTデータ

買収件数

(件)

海外主要企業による買収企業の技術領域構成

(2008年~2013年7月)

日本主要企業による買収企業の技術領域構成

(2008年~2013年7月)

買収された企業のタイプは、データ分析技術保有企業、データの分析結果の応用が狙

える応用分野企業、データ分析の高速化など分析支援を期待できるその他分析支援企業

と、それ以外の企業に分類した。

ビッグデータ関連の買収が多い企業は、米国アイ・ビー・エム(18 社)、米国マイクロ

ソフト(12 社)、米国オラクル(8 社)、米国ヤフー(8 社)の順で米国アマゾン、米国グー

グル、米国イー・エム・シーがそれらに続いている。一方、日本の主要企業では、NTT

データに企業買収の動きがみられるが、他の企業には目立った動向は見られない。NTT

データの買収は、2010 年 5 月のドイツ子会社 itelligence 社による米国 RPF Consulting

社(BI 分野)、2012 年 2 月の数理システム社(BI 分野)などがある。

日本の主要企業の 2008 年以降のデータ分析技術関連の報道発表情報により、ビッグデ

ータに関連する企業の主要な動きを調査した。その結果を図 2-7 に示す

2

1

(出典) 各企業の HP のニュースリリース内容をもとに作成した。

2

(出典) 各企業の HP のニュースリリース内容をもとに作成した。

- 11 -

図 2-7 日本の主要 IT 企業のビッグデータ関連の報道発表(協業領域など)(2008 年以降)

企業名 協業企業等(協業内容)

楽天 洸陽電機、グローバルエンジニアリング(応用分野:エネルギー)

NTTデータ

中国科学院ソフトウェア研究所(データ分析技術)クリックテック・ジャパン(データ分析技術)米国テラデータ(データ分析技術)米国マークロジック(データ分析技術)マイクロストラテジー・ジャパン(データ分析技術)x2米国マイクロソフト(データ分析技術)網屋(データ分析技術)ドコモ、インテージ(応用分野:購買行動と情報発信)三井住友カード(応用分野:加盟店審査業務)アイルランドICT研究機関TSSG(応用分野:電力予測)x2AutoGrid(応用分野:電力需要)群馬銀行(応用分野:マーケティング)リアライズ、インフォテリア(応用分野:企業マネジメント)米国Twitter(その他分析支援:データ提供プラットフォーム)数理システム(その他分析支援:データ・サイエンティスト)米国オラクル(その他分析支援:基盤技術)

富士通

ドイツ エスエイピー(データ分析技術)

佐賀県、福岡市(応用分野:オープンデータ)

米国セールスフォース・ドットコム(応用分野)

日本電気

ウィングアークテクノロジーズ(データ分析技術)x2米国アイ・ビー・エム、ネティーザ(データ分析技術)x2米国マイクロソフト(データ分析技術)三菱重工(応用分野:船舶向けエネルギ需要予測)大林組(応用分野:ビルエネルギー需要予測)中国重慶市(応用分野:スマートシティ)英国インペリアル大学(応用分野:スマートシティ)韓国新世界I&C(応用分野:顧客情報分析)米国SAS(その他分析支援:データサイエンティスト)米国シマンテック(その他分析支援:基盤技術)米国オラクル(その他分析支援)x2

日立製作所

ブレインパッド(データ分析技術)DTS(データ分析技術)x2インターシステムズ(応用分野:ヘルスケア、地域医療)

米国セールスフォース・ドットコム(応用分野)

博報堂(応用分野)x2国立遺伝学研究所(応用分野)米国オラクル(その他分析支援・製品)

注)表中の「x2」は、ニュースリリースが2回発表されており、2回としてカウントされている。

3

6

1

8

5

5

5

8

1

1

4

3

0 20 40 60

日立製作所

日本電気

富士通

東芝

NTTデータ

楽天

ヤフー

ジャパン

報道発表の件数

協業

データ分析技術

協業

応用分野

協業

その他分析支援

導入事例

製品・サービス

技術

その他

2件 (0,0,0)

2件 (0,1,0)

38件

(8,8,3)

2件 (0,0,0)

40件

(1,5,0)

39件

(6,5,4)

30件

(3,5,1)

(件)

( )内の数字は協業関連の報道発表件数で、

左から、

データ分析技術、応用分野、その他分析支援

の件数を示す。

報道発表を見ると、日本では企業買収数は少ないが、協業関係の構築は積極的に行わ

れており、協業により競争力を確保する方針がうかがわれる。協業関連の報道発表の内

容は、「データ分析技術」、「応用分野」、「その他分析支援」に区分することができ、それ

らの合計数を見ると NTT データ、日本電気、日立製作所の順で多い。協業の分野別の件

数分布を見ると、データ分析技術と応用分野の協業件数がほぼ同数となっている。

第第第第 3333 章章章章 特許出願動向特許出願動向特許出願動向特許出願動向

第 1 節 調査の概要

1. 調査範囲

(1) 調査対象特許

調査対象特許は以下とした。

①特許協力条約(PCT)に基づく国際出願

②日本、米国、欧州

1

、中国、韓国、カナダ、オーストラリア、インドへの特許出願

③日本、米国、欧州、中国、韓国、カナダ、オーストラリア、インドでの登録特許

(2) 調査対象期間

1

欧州への特許出願とは、EPC(欧州特許条約)加盟国への出願及び欧州特許庁(EPO)への特許出願を意味する。

- 12 -

優先権主張年が、2000 年から 2011 年の特許出願、登録特許とした。

2. 検索方法と検索結果

(1) 使用データベース

特許文献情報の検索には、トムソン・ロイター社のトムソン・イノベーションを使

用した。

(2) 検索方針

特許文献情報の検索は、FI(ファイル・インデックス)及び CPC(共通特許分類:

Cooperative Patent Classification)を用いた検索と、IPC(国際特許分類)とキーワ

ードの AND 検索を併用した。

(3) 検索結果

検索件数は、出願単位で 29,885 件、INPADOC

1

ファミリ単位で 15,834 件であった。

読込調査を行った結果、分析対象外の特許出願を除く分析対象特許出願件数は、出願

単位で 23,262 件、INPADOC ファミリ単位で 13,023 件であった。検索日は 2013 年 7

月 31 日である。

3. 分析に当たっての留意点

(1) 出願人国籍別データの集計について

各特許の出願人国籍は、筆頭出願人の国籍とした。その際、「欧州国籍」は EPC 加

盟国の国籍とした。

(2) 技術区分への分類方法

本調査では、検索により抽出した特許文献をファミリ単位で読み込むことで、各技

術区分への分類を行った。その際、1 件の特許文献が複数の技術区分にまたがって属

するような分類を許している。なお、要素技術の技術区分においてどの項目にも分類

されなかった特許文献については、「該当なし」として検索ノイズと見なし、以降の

集計結果からは除外している。

(3) 調査対象特許出願について

調査対象とする母集団は、データ取得日(2013 年 7 月 31 日)までに公開等された

特許文献である。出願から公開までの期間、あるいは PCT 出願後の国内移行までの期

間、データベースへの収録の遅れの影響等から、2010 年以降の出願件数については

必ずしも全データを反映していない可能性がある点に注意が必要である。

登録件数については、データ収録の問題に加えて、審査中あるいは審査請求判断前

の特許が存在することから、近年のデータについては、今後増加する可能性がある点

に注意が必要である。

(4) 出願人について

今回の調査対象期間においては、米国における出願人は発明者本人であるが、本調

査では他地域との比較のために、譲受人を出願人としている。データベース収録の都

合上、譲受人が記載されていない場合にも、ファミリ情報等に基づいてできる限り企

業を特定している。また、企業名の変更、企業買収等により出願人(譲受人、権利者)

が変更になっているものについても、できる限り名寄せを実施し、2013 年 7 月末時

点における権利者の名称を採用している。

1

International Patent Documentation Center の略

- 13 -

第 2 節 ファミリ単位の出願動向

特許出願動向により新規技術の開発動向を知るために、特許出願を INPADOC ファミリ

単位で集計して分析する。

1. 全技術区分(第 1 軸:大分類)

図 3-1 に全技術区分総計と技術区分(大分類)別の出願件数推移を示す。

図 3-1 全技術区分及び技術区分別特許出願件数推移

896 937

1,012 982

1,112

1,000

1,121

1,208 1,233 1,218 1,203

1,100

0

200

400

600

800

1,000

1,200

1,400

2000 2001 2002 2003 2004 2005 2006 2007 2008 2009 2010 2011

出願年(優先権主張年)

全技術区分(合計) データ解析技術 解析対象DB

ストック系データ前処理技術 ストリーム系処理技術 分析基盤技術

全技術区分(合計)

優先権主張

2000-2011年

注)2010 年以降はデータベース収録の遅れ、PCT 出願の各国移行のずれ等で全出願データを反映し

ていない可能性がある。

出願件数は全体としては 2008 年まで増加傾向にあったが、その後横ばい状態である。

2. 技術区分別

技術区分(第 1 軸)の大分類ごとに小分類別の出願件数の推移を図 3-2~図 3-6 に示

す。

図 3-2 データ解析技術とその内訳の出願件数推移

457

427 475

439

488 471

517

608 620

589

533 500

0

100

200

300

400

500

600

700

2000 2001 2002 2003 2004 2005 2006 2007 2008 2009 2010 2011

出願年(優先権主張年)

データ解析技術(合計) データマイニング一般 テキストマイニング

リンクマイニング OLAP その他の解析技術

優先権主張

2000-2011年

- 14 -

図 3-3 解析対象 DB とその内訳の出願件数推移

102

111

81 84

102

79

98

126

137

111

97

79

0

20

40

60

80

100

120

140

160

2000 2001 2002 2003 2004 2005 2006 2007 2008 2009 2010 2011

出願年(優先権主張年)

解析対象DB(合計) データウェアハウス データマート その他の解析対象DB

優先権主張

2000-2011年

図 3-4 ストック系データ前処理技術とその内訳の出願件数推移

6974

82

103

127 122

138

153

178 182

193

179

0

50

100

150

200

250

2000 2001 2002 2003 2004 2005 2006 2007 2008 2009 2010 2011

出願年(優先権主張年)

ストック系データ前処理技術(合計) データマイグレーション

データクレンジング その他のデータ変換

匿名化技術 その他のデータ前処理

優先権主張

2000-2011年

図 3-5 ストリーム系処理技術とその内訳の出願件数推移

35

40

33

4643

6063

7776 77

84

62

0

10

20

30

40

50

60

70

80

90

2000 2001 2002 2003 2004 2005 2006 2007 2008 2009 2010 2011

出願年(優先権主張年)

ストリーム系処理技術(合計) ストリームクレンジング その他のストリーム前処理

センサデータストリーム処理 テキストストリーム処理 ストリーム処理一般

優先権主張

2000-2011年

- 15 -

図 3-6 分析基盤技術とその内訳の出願件数推移

286

338 385361

412

309

370

310

295

322

349

331

0

50

100

150

200

0

50

100

150

200

250

300

350

400

450

2000 2001 2002 2003 2004 2005 2006 2007 2008 2009 2010 2011

数(

訳(

類))

数(

計(

類))

出願年(優先権主張年)

分析基盤技術(合計) 分散ファイルシステム 分散データベース

分散ストレージ 分散並列処理 その他分析基盤技術

優先権主張

2000-2011年

注 1)2010 年以降はデータベース収録の遅れ、PCT 出願の各国移行のずれ等で全出願データを反映

していない可能性がある。

注 2)左縦軸は分析基盤技術の合計出願件数を示し、右縦軸は内訳の件数を示す。

3. 技術区分(第 2 軸)別-出願件数推移

技術区分(第 2 軸)別の出願件数推移を図 3-7 に示す。

図 3-7 技術区分(第 2 軸)別出願件数推移

データ解析技術

解析対象DB

ストリーム系処理技術

分析基盤技術

出願年( )

注)2010 年以降はデータベース収録の遅れ、PCT 出願の各国移行のずれ等で全出願データを反映し

ていない可能性がある。

- 16 -

4. データ発生源別-出願件数推移

データ発生源別出願件数推移を図 3-8 に示す。

図 3-8 データ発生源別出願件数推移

150 161 153 135 172 159 172 214 239 218 219 190

96 79 60 69 58 72 62 79 92 82 82 59

44 51 44 44 45 59 66 94 89 97 107 96

19 16 13 18 13 18 2035 29 25 29 28

76 64 62 57 70 65 78 94 111 90 88 76

9 1 3 10 12 5 7 7 14 7 12 9

51 51 77 86 115 95 96 106 113 122 104 88

32 42 36 35 53 50 47 50 60 35 52 36

19 13 24 22 17 22 24 29 29 20 36 23

9 15 15 16 16 9 14 21 13 16 23 13

12 19 22 27 20 20 21 24 14 20 10 19

7 6 4 10 7 15 12 21 14 17 13 10

86 87 76 85 91 97 96 120 122 132 99 104

1999 2000 2001 2002 2003 2004 2005 2006 2007 2008 2009 2010 2011 2012

出願年(優先権主張年)

既存DB

取引データ(POSデータなど)

センサ

システムログ

Webコンテンツ

リンク(サイトリンク、ソーシャルリンク)

テキスト情報

マルチメディアデータ

通信サービス関連情報

経営情報

医療情報

金融情報

その他

注)2010 年以降はデータベース収録の遅れ、PCT 出願の各国移行のずれ等で全出願データを反映し

ていない可能性がある。

5. 課題別出願件数推移

課題別出願件数推移を図 3-9 に示す。

図 3-9 課題別出願件数推移

注)2010 年以降はデータベース収録の遅れ、PCT 出願の各国移行のずれ等で全出願データを反映し

ていない可能性がある。

- 17 -

6. 応用産業分野別出願件数推移

応用産業分野別の出願件数推移を図 3-10 に示す。

図 3-10 応用産業分野別出願件数推移

2 2 3 2 2 5 2 4 6 7 5 11

5 7 8 8 8 15 9 11 15 11 8 10

3 3 3 3 1 4 8 11 12 17 5 14

2 2 5 5 1 4 9 12 8 7 4 11

1 2 1 2 2 6 2 2 1 4

1 1 2 1 1 4 5 2 5 6

1 1 1 1 1 5 2 3

16 28 19 22 20 27 31 36 41 45 37 32

49 37 35 31 29 29 38 48 63 55 54 55

80 63 57 48 58 49 59 75 75 69 74 55

37 19 19 20 12 19 18 17 22 29 17 14

14 17 20 22 28 30 48 42 36 35 49 47

1 1 2 1 1 3 1 4 5

3 1 1 1 1 1 1 4 2 2

23 23 23 26 33 18 16 35 28 36 18 12

10 11 11 20 14 15 19 33 22 26 22 14

135 133 138 146 161 137 141 163 184 180 177 140

19 26 44 24 24 30 31 25 31 32 26 22

21 42 39 31 45 45 49 64 49 45 39 40

3 3 1 6 3 3 2 8 9 9 9 11

4 8 10 7 4 12 9 15 17 18 17 23

20 25 17 23 21 24 15 21 24 14 18 13

16 14 14 17 12 24 23 29 23 26 28 22

33 34 25 26 34 31 38 26 48 35 44 37

1999 2000 2001 2002 2003 2004 2005 2006 2007 2008 2009 2010 2011 2012

出願年(優先権主張年)

自然災害対策

防犯対策

交通管理

インフラ管理

電子政府

エネルギー管理

スマートシティ/スマートグリッド

公共一般

情報推薦

マーケティング

電子商取引

通信

電力

農林水産支援

生産管理

故障予知・予防保全

企業一般

科学技術分野

医療・健康管理

ソーシャルネットワークサービス

行動管理

ゲーム・コンテンツ分野

金融情報

生活分野一般

注)2010 年以降はデータベース収録の遅れ、PCT 出願の各国移行のずれ等で全出願データを反映し

ていない可能性がある。

7. 技術区分と課題の相関

技術区分(第 1 軸:大分類)と課題の関係を図 3-11 に示す。

図 3-11 技術区分(第 1 軸)と課題の相関

- 18 -

第 3 節 出願先国別の出願動向

本節では、国・地域別の出願件数の調査を目的とするため、出願単位で件数を集計する。

1. 全体動向

1.1 [出願先:日米欧中韓]出願先国別件数推移及び件数比率

図 3-12 に日本、米国、欧州、中国、韓国への出願動向を示す。

図 3-12 [出願先:日米欧中韓]出願先国別出願件数推移及び出願件数比率

日本

5,562件

28.6%

米国

9,677件

49.7%

欧州

2,217件

11.4%

中国

1,520件

7.8%

韓国

496件

2.5%

合計

19,472件

1,428

1,597

1,639

1,739 1,833

1,680

1,674 1,673

1,758

1,657

1,542

1,252

0

500

1,000

1,500

2,000

2000 2001 2002 2003 2004 2005 2006 2007 2008 2009 2010 2011

出願年(優先権主張年)

日本 米国 欧州 中国 韓国 合計

優先権主張

2000-2011年

出願先国

注)2010 年以降はデータベース収録の遅れ、PCT 出願の各国移行のずれ等で全出願データを反映し

ていない可能性がある。

出願比率では、米国への出願が全体の 49.7%と最も大きく、次いで日本への出願が

28.6%で、日米合わせると全体の 3/4 を占める。次いで、欧州、中国、韓国と続く。

出願推移を見ると、米国は 2008 年以降、日本は 2009 年以降出願件数を減らしている。

これに対して、中国への出願は単調増加傾向を示しており、2011 年は 249 件と日本への

出願件数 331 件に近づいている。

図 3-13 に日本、米国、欧州、中国、韓国での登録件数の動向を示す。

図 3-13 [出願先:日米欧中韓]出願先国別登録件数推移及び登録件数比率

日本

1,953件

28.4%

米国

4,433件

64.5%

欧州での

登録

222件

3.2%

中国

32件

0.5%

韓国

230件

3.3%

合計

6,870件

111137 201 237 271 230 223 210 180 96

39 18

503 534 464 454 452 425 432 416 373 216129 35

31 39 20 35 22 17 24 16 10 4 3 1

1 1 3 1 4 3 3 3 6 5 2

3 15 13 39 36 25 13 23 22 14 14 13

1999 2000 2001 2002 2003 2004 2005 2006 2007 2008 2009 2010 2011 2012

出願年(優先権主張年)

日本での登録

米国での登録

欧州での登録

中国での登録

韓国での登録

注)2010 年以降はデータベース収録の遅れ、PCT 出願の各国移行のずれ等で全出願データを反映し

ていない可能性がある。

- 19 -

米国での登録比率が 64.5%と最も大きく、次いで日本での登録 28.4%と、日米で全体の

90%以上を占める。他は、韓国での登録 3.3%、欧州での登録 3.2%、中国での登録 0.5%と

微小である。出願比率と比較すると、米国での登録比率が大きいのに対し、欧州での登

録比率が小さい。日本は出願比率と登録比率が同等である。中国での比率が小さいのは、

近年の出願が多いことによるものと思われる。

1.2 [出願先:日米欧中韓]出願人国籍別出願件数推移及び件数比率

図 3-14 に日本、米国、欧州、中国、韓国への出願件数の出願人国籍別の動向を示す。

図 3-14 [出願先:日米欧中韓]出願人国籍別出願件数推移及び出願件数比率

日本国籍

6,134件

31.5%

米国籍

9,496件

48.8%

欧州国籍

1,905件

9.8%

中国籍

865件

4.4%

韓国籍

409件

2.1%

その他

663件

3.4%

合計

19,472件

1,428

1,597

1,639

1,739

1,833

1,680 1,674 1,673

1,758

1,657

1,542

1,252

0

500

1,000

1,500

2,000

2000 2001 2002 2003 2004 2005 2006 2007 2008 2009 2010 2011

出願年(優先権主張年)

日本 米国 欧州 中国 韓国 その他 合計

優先権主張

2000-2011年

出願人国籍

注)2010 年以降はデータベース収録の遅れ、PCT 出願の各国移行のずれ等で全出願データを反映し

ていない可能性がある。

米国籍出願人は 2003 年を頂点に、日本国籍出願人は 2004 年を頂点に出願件数を減少

させており、特に 2009 年以降減少が加速している。米国籍出願人の減少が著しい。これ

に対して、欧州国籍出願人は2001年から2009年までほぼ一定数の出願を維持している。

中国籍出願人の件数が急増しているのが注目される。

出願比率では、米国籍 48.8%、日本国籍 31.5%と、日米国籍の出願比率を合わせると全

体の 80%を超える。しかし、近年では中国籍の出願件数増加と、日米国籍の出願件数減

少のため、日米国籍出願人の出願比率は減少傾向にある。

図 3-15 に、日本、米国、欧州、中国、韓国での登録件数の出願人国籍別の動向を示す。

登録比率では、米国籍出願人が 58.8%と最も大きく、次いで日本国籍出願人の 27.6%

で、日米で全体の 86%を占める。次に欧州国籍出願人、韓国籍出願人、中国籍出願人と

続く。

- 20 -

図 3-15 [出願先:日米欧中韓]出願人国籍別登録件数推移及び登録件数比率

日本国籍

1,899件

27.6%

米国籍

4,042件

58.8%

欧州国籍

545件

7.9%

中国籍

43件

0.6%

韓国籍

165件

2.4%

その他

176件

2.6%

合計

6,870件

135151 169 191 265 227 209 199 197

105 38 13

452 474 434 508 416 388 390 357 303 175114 31

26 71 66 53 73 55 51 59 46 24 14 7

1 1 1 2 6 7 8 9 6 2

6 9 11 7 10 20 19 25 13 15 15 15

1999 2000 2001 2002 2003 2004 2005 2006 2007 2008 2009 2010 2011 2012

出願年(優先権主張年)

日本国籍

米国国籍

欧州国籍

中国国籍

韓国国籍

注)2010 年以降はデータベース収録の遅れ、PCT 出願の各国移行のずれ等で全出願データを反映し

ていない可能性がある。

1.3 [出願先:日米欧中韓]出願先国別-出願人国籍別出願件数収支

図 3-16 に、日本、米国、欧州、中国、韓国への出願の出願人国籍別出願件数収支を示

す。

図 3-16 [出願先:日米欧中韓]出願先国別-出願人国籍別出願件数収支

日本への出願

5,562件

日本国籍

4,332件

77.9%

米国籍

957件

17.2%

欧州国籍

150件

2.7%

中国籍

17件

0.3%

韓国籍

68件

1.2%

その他

38件

0.7%

28件

13件

24件

117件

1355件

957件

88件

284件150件

32件

68件

4件

76件

481件

34件

131件

17件

195件

888件

1044件

日本国籍

284件

12.8%

米国籍

1,044件

47.0%

欧州国籍

716件

32.3%

中国籍

28件

1.3%

韓国籍

24件

1.1%

その他

121件

5.5%

欧州への出願

2,217件

日本国籍

32件

6.5%

米国籍

195件

39.3%

欧州国籍

34件

6.9%

中国籍

4件

0.8%

韓国籍

216件

43.5%

その他

15件

3.0%

韓国への出願

496件

日本国籍

131件

8.6%

米国籍

481件

31.6%

欧州国籍

117件

7.7%

中国籍

740件

48.7%

韓国籍

13件

0.9%

その他

38件

2.5%

中国への出願

1,520件

日本国籍

1,355件

14.0%

米国籍

6,819件

70.4%

欧州国籍

888件

9.2%

中国籍

76件

0.8%

韓国籍

88件

0.9%

その他

451件

4.7%

米国への出願

9,677件

優先権主張

2000年-2011年

- 21 -

日本国籍出願人は、米国に 1,355 件、欧州に 284 件、中国に 131 件、韓国に 32 件出願

しており、米国への出願を主力に出願活動を行っている。また、対韓国を除いて特許出

願収支は出超となっている。日本国内出願に対する米国出願件数の割合は 31%となって

おり、積極的に外国出願を行っている。米国籍出願人は、日本に 957 件、欧州に 1,044

件、中国に 481 件、韓国に 195 件出願している。欧州、日本への出願が多いが、中国へ

も積極的に出願している。

2. 技術区分別動向

2.1 [出願先:日米欧中韓]技術区分別-出願人国籍別出願件数

図 3-17 に、日本、米国、欧州、中国、韓国への出願の技術区分別、出願人国籍別出願

件数を示す。

図 3-17 [出願先:日米欧中韓]技術区分別-出願人国籍別出願件数

2607 4080 776 377

190 308

252 1010

192 110 27 45

626 1161 336

14939

105

277 572 186

36

64

59

2567 3222 531 251

111 174

データ解析技術

解析対象DB

ストック系

データ前処理技術

ストリーム系処理技術

分析基盤技術

出願人国籍

全ての技術区分で、日本国籍出願人は米国籍出願人に次いで出願件数が多いが、解析

対象 DB の割合が米国籍や欧州国籍出願人に比べて低い。

- 22 -

2.2 技術区分別-出願人国籍別件数推移と比率

(1) データ解析技術

図 3-18 に、日本、米国、欧州、中国、韓国へのデータ解析技術に関する出願の出

願人国籍別出願件数推移と出願比率を示す。

図 3-18 [出願先:日米欧中韓]データ解析技術-出願人国籍別出願件数推移及び出願比率

日本国籍

2,607件

31.3%

米国籍

4,080件

48.9%

欧州国籍

776件

9.3%

中国籍

377件

4.5%

韓国籍

190件

2.3%

その他

308件

3.7%

合計

8,338件

661

688

714

682 699

708 698

770 769

746

657

546

0

200

400

600

800

2000 2001 2002 2003 2004 2005 2006 2007 2008 2009 2010 2011

出願年(優先権主張年)

日本 米国 欧州 中国 韓国 その他 合計

優先権主張

2000-2011年

出願人国籍

注)2010 年以降はデータベース収録の遅れ、PCT 出願の各国移行のずれ等で全出願データを反映し

ていない可能性がある。

(2) 解析対象 DB

図 3-19 に、日本、米国、欧州、中国、韓国への解析対象 DB に関する出願の出願人

国籍別出願件数推移と出願比率を示す。

図 3-19 [出願先:日米欧中韓]解析対象 DB-出願人国籍別出願件数推移及び出願比率

日本国籍

252件

15.4%

米国籍

1,010件

61.7%

欧州国籍

192件

11.7%

中国籍

110件

6.7%

韓国籍

27件

1.7%

その他

45件

2.8%

合計

1,636件

127

167

117

152 151 118

143

157

164

154

106

80

0

50

100

150

200

2000 2001 2002 2003 2004 2005 2006 2007 2008 2009 2010 2011

出願年(優先権主張年)

日本 米国 欧州 中国 韓国 その他 合計

優先権主張

2000-2011年

出願人国籍

注)2010 年以降はデータベース収録の遅れ、PCT 出願の各国移行のずれ等で全出願データを反映し

ていない可能性がある。

- 23 -

(3) ストック系データ前処理技術

図 3-20 に、日本、米国、欧州、中国、韓国へのストック系データ前処理技術に関

する出願の出願人国籍別出願件数推移と出願比率を示す。

図 3-20 [出願先:日米欧中韓]ストック系データ前処理技術-出願人国籍別出願件数推移及び出

願比率

日本国籍

626件

25.9%

米国籍

1,161件

48.1%

欧州国籍

336件

13.9%

中国籍

149件

6.2%

韓国籍

39件

1.6%

その他

105件

4.3%

合計

2,416件

112

123

163

191

262

208

196

217

262

241 244

197

0

50

100

150

200

250

300

2000 2001 2002 2003 2004 2005 2006 2007 2008 2009 2010 2011

出願年(優先権主張年)

日本 米国 欧州 中国 韓国 その他 合計

優先権主張

2000-2011年

出願人国籍

注)2010 年以降はデータベース収録の遅れ、PCT 出願の各国移行のずれ等で全出願データを反映し

ていない可能性がある。

(4) ストリーム系処理技術

図 3-21 に、日本、米国、欧州、中国、韓国へのストリーム系処理技術に関する

出願の出願人国籍別出願件数推移と出願比率を示す。

図 3-21 [出願先:日米欧中韓]ストリーム系処理技術-出願人国籍別出願件数推移及び出願比率

日本国籍

277件

23.2%

米国籍

572件

47.9%

欧州国籍

186件

15.6%

中国籍

36件

3.0%

韓国籍

64件

5.4%

その他

59件

4.9%

合計

1,194件

66

88

79

100

74

115

96

130 127

125

113

81

0

25

50

75

100

125

150

2000 2001 2002 2003 2004 2005 2006 2007 2008 2009 2010 2011

出願年(優先権主張年)

日本 米国 欧州 中国 韓国 その他 合計

優先権主張

2000-2011年

出願人国籍

注)2010 年以降はデータベース収録の遅れ、PCT 出願の各国移行のずれ等で全出願データを反映し

ていない可能性がある。

- 24 -

(5) 分析基盤技術

図 3-22 に、日本、米国、欧州、中国、韓国への分析基盤技術に関する出願の出願

人国籍別出願件数推移と出願比率を示す。

図 3-22 [出願先:日米欧中韓]分析基盤技術-出願人国籍別出願件数推移及び出願比率

日本国籍

2,567件

37.4%

米国籍

3,222件

47.0%

欧州国籍

531件

7.7%

中国籍

251件

3.7%

韓国籍

111件

1.6%

その他

174件

2.5%

合計

6,856件

531

628

652

708

737

601

633

481

517

477 487

404

0

200

400

600

800

2000 2001 2002 2003 2004 2005 2006 2007 2008 2009 2010 2011

出願年(優先権主張年)

日本 米国 欧州 中国 韓国 その他 合計

優先権主張

2000-2011年

出願人国籍

注)2010 年以降はデータベース収録の遅れ、PCT 出願の各国移行のずれ等で全出願データを反映し

ていない可能性がある。

3. 出願人別動向調査

3.1 [出願先:日米欧中韓]出願人別出願件数上位ランキング

表 3-1 に日本、米国、欧州、中国、韓国への出願の出願人別出願件数上位ランキング

を示す。全体では、アイ・ビー・エム(米国)、日立製作所、マイクロソフト(米国)、富

士通、日本電信電話、日本電気の順で、上位 10 社中日本国籍出願人が 6 社と最多である。

技術区分別でも、解析対象 DB を除いて上位の過半を日本国籍出願人が占めている。解析

対象 DB では、アイ・ビー・エム(米国)、マイクロソフト(米国)に次いでエスエイピー(ド

イツ)が入っている。日本国籍出願人は 3 社で、米国籍出願人が 6 社となっている。

表 3-1 [出願先:日米欧中韓]出願人別出願件数上位ランキング

出願人名称

出願件

出願人名称

出願件

出願人名称

出願件

出願人名称

出願件

出願人名称

出願件

出願人名称

出願件

1 アイ・ビー・エム(米国) 1,967 1 アイ・ビー・エム(米国) 833 1 アイ・ビー・エム(米国) 174 1 アイ・ビー・エム(米国) 302 1 アイ・ビー・エム(米国) 108 1 日立製作所 1,217

2 日立製作所 1,682 2 マイクロソフト(米国) 465 2 マイクロソフト(米国) 91 2 日立製作所 180 2 ソニー 86 2 アイ・ビー・エム(米国) 658

3 マイクロソフト(米国) 1,130 3 日本電信電話 356 3 エスエイピー(ドイツ) 74 3 マイクロソフト(米国) 112 3 日立製作所 71 3 マイクロソフト(米国) 464

4 富士通 610 4 富士通 269 4 オラクル(米国) 51 4 エスエイピー(ドイツ) 101 4 マイクロソフト(米国) 57 4 富士通 237

5 日本電信電話 548 5 日本電気 245 5 テラデータ(米国) 41 5 日本電気 75 5 東芝 34 5 日本電気 208

6 日本電気 542 6 東芝 227 6 日立製作所 39 6 富士通 72 6 オラクル(米国) 30 6 オラクル(米国) 190

7 エスエイピー(ドイツ) 471 7 日立製作所 223 7

エヌ・シー・アール(米国)

33 7 日本電信電話 55 7 エスエイピー(ドイツ) 27 7 日本電信電話 124

8 オラクル(米国) 434 8 エスエイピー(ドイツ) 186 8

ヒューレット-パッカード

(米国)

31 8 オラクル(米国) 44 8 三星電子(韓国) 25 8 エスエイピー(ドイツ) 116

9 東芝 415 9 オラクル(米国) 162 9 東芝 28 9 東芝 36 9 パナソニック 24 9

ヒューレット-パッカード

(米国)

110

10 ソニー 303 10 ソニー 130 9 富士通 28 10

ヒューレット-パッカード

(米国)

34 9 富士通 24 10 東芝 108

分析基盤技術全体 データ解析技術 解析対象DB ストック系データ前処理技術 ストリーム系処理技術

- 25 -

3.2 [出願先国別]出願人別 出願件数上位ランキング

表 3-2~表 3-6 に日米欧中韓の各国・地域への出願の出願人別出願件数上位ランキン

グを示す。

表 3-2 [日本への出願]出願人別出願件数上位ランキング

出願人名称

出願

件数

出願人名称

出願

件数

出願人名称

出願

件数

出願人名称

出願

件数

出願人名称

出願

件数

出願人名称

出願

件数

1 日立製作所 937 1 日本電信電話 354 1 日立製作所 27 1 日立製作所 77 1 日立製作所 34 1 日立製作所 652

2 日本電信電話 540 2 日本電気 186 2 日本電信電話 23 2 日本電信電話 54 2 ソニー 25 2 日本電気 155

3 日本電気 396 3 富士通 181 3 日本電気 21 3 日本電気 46 3 東芝 11 3 富士通 138

4 富士通 373 4 東芝 177 4 東芝 18 4 富士通 40 4 日本電信電話 10 4 日本電信電話 119

5 東芝 283 5 日立製作所 172 5 富士通 17 5 アイ・ビー・エム(米国) 23 4 富士通 10 5 アイ・ビー・エム(米国) 104

6 アイ・ビー・エム(米国) 219 6 富士ゼロックス 95 6 アイ・ビー・エム(米国) 9 6 東芝 19 6 アイ・ビー・エム(米国) 6 6 東芝 69

7 ソニー 146 7 アイ・ビー・エム(米国) 83 7 三菱電機 8 7 キヤノン 12 7 パナソニック 5 7 マイクロソフト(米国) 66

8 富士ゼロックス 135 8 三菱電機 81 8 マイクロソフト(米国) 5 7 ケイディーディーアイ 12 8 JVC KENWOOD 3 8 キヤノン 46

9 マイクロソフト(米国) 129 9 ソニー 74 8 富士ゼロックス 5 9 ソニー 10 8 日本電気 3 9 ソニー 37

10 三菱電機 123 10 マイクロソフト(米国) 50 10 ヤナセ 4 9 マイクロソフト(米国) 10 8

エリクソン(スウェーデ

ン)

3 10 リコー 35

8 フィリップス(オランダ) 3

8 三星電子(韓国) 3

分析基盤技術全体 データ解析技術 解析対象DB ストック系データ前処理 ストリーム系処理技術

表 3-3 [米国への出願]出願人別出願件数上位ランキング

出願人名称

出願件

出願人名称

出願

件数

出願人名称

出願

件数

出願人名称

出願

件数

出願人名称

出願

件数

出願人名称

出願

件数

1 アイ・ビー・エム(米国) 1,439 1 アイ・ビー・エム(米国) 638 1 アイ・ビー・エム(米国) 144 1 アイ・ビー・エム(米国) 220 1 アイ・ビー・エム(米国) 88 1 日立製作所 474

2 マイクロソフト(米国) 690 2 マイクロソフト(米国) 304 2 マイクロソフト(米国) 75 2 日立製作所 83 2 マイクロソフト(米国) 45 2 アイ・ビー・エム(米国) 438

3 日立製作所 623 3 エスエイピー(ドイツ) 136 3 エスエイピー(ドイツ) 57 3 マイクロソフト(米国) 71 3 ソニー 31 3 マイクロソフト(米国) 239

4 オラクル(米国) 332 4 オラクル(米国) 134 4 オラクル(米国) 41 4 エスエイピー(ドイツ) 55 3 日立製作所 31 4 オラクル(米国) 123

5 エスエイピー(ドイツ) 316 5

ヒューレット-パッカード

(米国)

64 4 テラデータ(米国) 41 5 オラクル(米国) 40 5 オラクル(米国) 30 5 富士通 84

6 富士通 187 5 富士通 64 6 ビザ(米国) 24 6 富士通 28 6 エスエイピー(ドイツ) 18 6 エスエイピー(ドイツ) 75

7

ヒューレット-パッカード

(米国)

178 7 日本電気 46 7

エヌ・シー・アール(米国)

22 7

ヒューレット-パッカード

(米国)

23 7

エイ・ティ・アンド・ティ(米

国)

15 7

ヒューレット-パッカード

(米国)

70

8 日本電気 105 8 シーメンス(ドイツ) 45 7

ヒューレット-パッカード

(米国)

22 8 イー・エム・シー(米国) 21 8 東芝 14 8 イー・エム・シー(米国) 61

9 東芝 96 9 東芝 44 9 日立製作所 12 9 日本電気 15 9 パナソニック 9 9 クレバーセーフ(米国) 47

10 ソニー 94 10 日立製作所 41 10

エイ・ティ・アンド・ティ(米

国)

11 9 シーメンス(ドイツ) 15 9 ヤフー(米国) 9 10 日本電気 39

9 ワシントン大学(米国) 9

分析基盤技術全体 データ解析技術 解析対象DB ストック系データ前処理 ストリーム系処理技術

表 3-4 [欧州への出願]出願人別出願件数上位ランキング

出願人名称

出願

件数

出願人名称

出願

件数

出願人名称

出願

件数

出願人名称

出願

件数

出願人名称

出願

件数

出願人名称

出願

件数

1 マイクロソフト(米国) 131 1 アイ・ビー・エム(米国) 56 1 エスエイピー(ドイツ) 17 1 エスエイピー(ドイツ) 33 1 ソニー 18 1 日立製作所 83

2 アイ・ビー・エム(米国) 130 2 エスエイピー(ドイツ) 46 2 アイ・ビー・エム(米国) 11 2 アイ・ビー・エム(米国) 26 2 エスエイピー(ドイツ) 7 2 マイクロソフト(米国) 70

3 エスエイピー(ドイツ) 122 3 マイクロソフト(米国) 45 2

エヌ・シー・アール(米

国)

11 3 日立製作所 15 3 パナソニック 5 3 アイ・ビー・エム(米国) 41

4 日立製作所 105 4

アクセンチュア(アイ

ルランド)

26 4

アクセンチュア(アイ

ルランド)

8 4 シーメンス(ドイツ) 12 3

ソフトウェア・エー・

ジー(ドイツ)

5 4 オラクル(米国) 28

5 シーメンス(ドイツ) 49 5 シーメンス(ドイツ) 21 5

ヒューレット-パッカー

ド(米国)

6 5 マイクロソフト(米国) 11 3

NETEZZA CORP(米

国)

5 4 ブラックベリー(カナダ) 28

6 オラクル(米国) 45 6 富士通 19 6 オラクル(米国) 4 6

AB INITIO

TECHNOLOGY

LLC(米国)

7 3 マイクロソフト(米国) 5 6 エスエイピー(ドイツ) 26

7

アクセンチュア(アイ

ルランド)

42 7

ヒューレット-パッカー

ド(米国)

16 6 マイクロソフト(米国) 4 6

ヒューレット-パッカー

ド(米国)

7 3 三星電子(韓国) 5 7 ノキア(フィンランド) 24

8

ヒューレット-パッカー

ド(米国)

40 8 ソニー 14 6 アルストム(フランス) 4 8 日本電気 6 8 富士通 4 8 シーメンス(ドイツ) 16

9 ソニー 39 9 オラクル(米国) 13 6 インフォマティカ(米国) 4 8

アクセンチュア(アイ

ルランド)

6 8

フランステレコム(フラ

ンス)

4 9 イー・エム・シー(米国) 15

9 富士通 39 10 ゼロックス(米国) 12 6

PROCLARITY

CORP(米国)

4 10

アルカテル・ルーセン

ト(フランス)

5 8 ノキア(フィンランド) 4 10

ヒューレット-パッカー

ド(米国)

13

10

フランステレコム(フラ

ンス) 5 8

COMPTEL

CORP(フィンランド)

4 10

FISHER

ROSEMOUNT

SYSTEMS(米国)

13

10

IMS SOFTWARE

SERVICES LTD(米

国)

5 8

フリアーシステムズ

(スウェーデン)

4

10

レクシスネクシス(米

国)

5 8

ROKE MANOR RES

LTD(英国)

4

分析基盤技術全体 データ解析技術 解析対象DB ストック系データ前処理 ストリーム系処理技術

(注)NETEZZA CORP は 2010 年にアイ・ビー・エム(米国)に買収されている。

- 26 -

表 3-5 [中国への出願]出願人別出願件数上位ランキング

出願人名称

出願

件数

出願人名称

出願

件数

出願人名称

出願

件数

出願人名称

出願

件数

出願人名称

出願

件数

出願人名称

出願

件数

1 アイ・ビー・エム(米国) 151 1 アイ・ビー・エム(米国) 43 1 アイ・ビー・エム(米国) 9 1 アイ・ビー・エム(米国) 29 1 ソニー 12 1 アイ・ビー・エム(米国) 66

2 マイクロソフト(米国) 110 2 マイクロソフト(米国) 38 2

BEIJING

OPPORTUNE

TECHNOLOGY DEV

CO LTD(中国)

8 2

アリババ グループ(中

国)

15 2 アイ・ビー・エム(米国) 10 2 マイクロソフト(米国) 55

3 中興通訊(中国) 44 3 シーメンス(ドイツ) 11 2

アリババ グループ(中

国)8 3 マイクロソフト(米国) 13 3 東芝 5 3 中興通訊(中国) 29

4

アリババ グループ(中

国)

36 4 南京大学(中国) 10 4 マイクロソフト(米国) 5 4 華為技術(中国) 11 4 パナソニック 4 4 オラクル(米国) 16

5 華為技術(中国) 31 4 中興通訊(中国) 10 5

CHINA MOBILE

COMMUNICATION

GROUP(中国)

4 5 日本電気 8 5 日立製作所 3 5 華為技術(中国) 14

6 浙江大学(中国) 27 4 中国移動通信(中国) 10 6 金蝶国際(中国) 3 6

AB INITIO

TECHNOLOGY

LLC(米国)

7 5 ノキア(フィンランド) 3 6 浙江大学(中国) 13

7 オラクル(米国) 23 7 浙江大学(中国) 9 6

SHANGHAI

SUCCESSFUL

TELECOM

TECHNOLOGY(中国)

3 7 日立製作所 5 5 マイクロソフト(米国) 3 7

DAWNING

INFORMATION

IND(中国)

10

8 中国移動通信(中国) 22 7

BEIJING

OPPORTUNE

TECHNOLOGY DEV

CO LTD(中国)

9 6 オラクル(米国) 3 7 フィリップス(オランダ) 5 5 インテル(米国) 3 8

アリババ グループ(中

国)

9

8 日本電気 22 7 北京大学(中国) 9 6 中興通訊(中国) 3 7 エスエイピー(ドイツ) 5 5

ソフトウェア・エー・

ジー(ドイツ)

3 8 エスエイピー(ドイツ) 9

10 ソニー 20 10 日本電気 8 10

アマゾン テクノロジー

ズ(米国)

2 7

INSPUR GROUP(中

国)

5 5 南京大学(中国) 3 10 日立製作所 8

10 テンセント(中国) 8 10 華為技術(中国) 2

10 中国移動通信(中国) 2

10

AB INITIO

TECHNOLOGY

LLC(米国)

2

10 アルストム(フランス) 2

10 中国工商銀行(中国) 2

10

中国科学院計算技術

研究所(中国)

2

10

ニールセン・カンパ

ニー(米国)

2

10

SIXTH INST CHINA

ELECTRONIC

INFORMATION(中国)

2

10 テンセント(中国) 2

10 用友軟件(中国) 2

10 北京大学(中国) 2

分析基盤技術全体 データ解析技術 解析対象DB ストック系データ前処理 ストリーム系処理技術

表 3-6 [韓国への出願]出願人別出願件数上位ランキング

出願人名称

出願

件数

出願人名称

出願

件数

出願人名称

出願

件数

出願人名称

出願

件数

出願人名称

出願

件数

出願人名称

出願

件数

1 マイクロソフト(米国) 70 1 マイクロソフト(米国) 28 1 三星電子(韓国) 4 1

韓国電子通信研究院

(韓国)

9 1 三星電子(韓国) 8 1 マイクロソフト(米国) 34

2

韓国電子通信研究院

(韓国) 31 2 アイ・ビー・エム(米国) 13 2 仁荷大学校(韓国) 3 2

AB INITIO

TECHNOLOGY

LLC(米国)

7 2

韓国電子通信研究院

(韓国) 5 2

韓国電子通信研究院

(韓国) 12

3 アイ・ビー・エム(米国) 28 3

Korea Institute of

Science and

Technology(韓国)

9 3 新韓銀行(韓国) 2 2 マイクロソフト(米国) 7 3 インテル(米国) 4 3 アイ・ビー・エム(米国) 9

4 三星電子(韓国) 24 4 三星電子(韓国) 8 3

アマゾン テクノロジー

ズ(米国)

2 4

QIYUAN

TECHNOLOGY CO

LTD(中国)

4 4

Korea Advanced

Institute of Science

and Technology(韓

国)

2 4 アップル(米国) 8

5 SKテレコム(韓国) 12 5

Korea Advanced

Institute of Science

and Technology(韓

国)

6 3 マイクロソフト(米国) 2 4 アイ・ビー・エム(米国) 4 4

UNIV KOREA IND &

ACAD COOP

FOUND(韓国)

2 5 三星電子(韓国) 7

6

Korea Institute of

Science and

Technology(韓国)

11 5 SKテレコム(韓国) 6 4 フィリップス(オランダ) 4 4 延世大学校(韓国) 2 6 SKテレコム(韓国) 5

7 エヌエイチエヌ(韓国) 9 5

韓国電子通信研究院

(韓国)

6 7

Korea Electronics

Technology

Institute(韓国)

2 4 ノキア(フィンランド) 2 6 エヌエイチエヌ(韓国) 5

7 フィリップス(オランダ) 9 8 韓国通信(韓国) 5 7 三星電子(韓国) 2 4 マイクロソフト(米国) 2 8 韓国通信(韓国) 4

7

AB INITIO

TECHNOLOGY

LLC(米国)

9 9 仁荷大学(韓国) 4 7 東芝 2 8 東芝 4

7

Korea Advanced

Institute of Science

and Technology(韓

国)

9 9 延世大学校(韓国) 4 10

エルジー エレクトロニ

クス(韓国)

3

7 韓国通信(韓国) 9 9 エヌエイチエヌ(韓国) 4 10 ソニー 3

10 フィリップス(オランダ) 3

10 サンディスク(米国) 3

10 忠南大学校(韓国) 3

全体 データ解析技術 解析対象DB ストック系データ前処理 ストリーム系処理技術 分析基盤技術

- 27 -

第 4 節 注目特許

1. 注目技術に関連する特許出願

研究開発動向調査で調査した論文の中で、被引用件数の多い論文及び委員会の委員や

ヒアリングを行った有識者から推薦のあった論文を総合的に勘案して、ビッグデータ分

析技術に関する注目論文を選定した(要約 第 4 章 第 5 節参照)。選定した論文に関連

する特許出願を注目特許として調査した。注目技術に関連する特許の一覧を表 3-7 に示

す。

表 3-7 注目技術に関連する特許の一覧

技術区

技術名 代表的関連特許 発明の名称

優先権

主張日

譲受人

1

データ

解析

技術

Apriori

(相関ルールマイニング

アルゴリズム)

US5794209A

System and method for quickly

mining association rules in

databases

1995-03-31

アイ・ビー・エム

(米国)

2

プライバシ保護マイニン

US6546389B1

Method and system for building

a decision-tree classifier

from privacy-preserving data

2000-01-19

アイ・ビー・エム

(米国)

3 頻出パターンマイニング US6665669B2

Method and system for mining

frequent patterns

2000-01-03

サイモン・フレー

ザー大学

(カナダ)

4

解析用

DB

Pig

(高級手続型クエリ言語)

US7805447B2

Generating example data for

testing database queries

2008-01-16 ヤフー(米国)

5 匿名化 k-匿名化 US20020169793A1

Systems and methods for

deidentifying entries in a data

source

2001-04-10

カーネギーメロ

ン大学(米国)

6

分析基

盤技術

Paxos

(分散処理用プロトコル)

US5261085A

Fault-tolerant system and

method for implementing a

distributed state machine

1989-06-23

ヒューレット・パ

ッカード(米国)

7

Google File System

(分散ファイルシステム)

US7065618B1

Leasing scheme for

data-modifying operations

2003-02-14 グーグル(米国)

8

MapReduce

(並列分散処理基盤)

US7650331B1

System and method for efficient

large-scale data processing

2004-06-18 グーグル(米国)

9

BigTable

(分散キー・バリュー・ス

トア)

US7428524B2

Large scale data storage in

sparse tables

2005-08-05 グーグル(米国)

10

Dynamo

(分散データベース)

US7925624B2

System and method for providing

high availability data

2006-03-31

アマゾン テクノ

ロジーズ(米国)

11

PNUTS

(分散データベース)

US20090144333A1

SYSTEM FOR MAINTAINING A

DATABASE

2007-11-30 ヤフー(米国)

12

Pregel

(グラフ処理)

US8510538B1

System and method for limiting

the impact of stragglers in

large-scale parallel data

processing

2009-04-13 グーグル(米国)

2. グーグル(米国)の MapReduce 技術などに関する知的財産戦略

グーグル(米国)は、MapReduce に関する特許出願 10 件をはじめとして、分散ストレー

ジ管理、分散データベース管理、ミドルウェアなどに関する多くの特許を「Open Patent

Non-Assertion Pledge(オープン特許非係争誓約)」宣言している

1

。フリーソフトウェ

ア及びオープンソースソフトウェアを開発、製造、使用、販売、販売のための提供、リ

ース、ライセンス、輸出、輸入する個人又は団体に対しても訴訟を行わないとしている。

ただし、ハードウェアや、企業内使用などオープンソースではない場合には、誓約が適

用されない。また、特許訴訟を起こされた場合に誓約を終了させる権利を留保するとし

ている。

1

http://www.google.com/patents/opnpledge/

- 28 -

第第第第 4444 章章章章 研究開発動向研究開発動向研究開発動向研究開発動向

第 1 節 調査の概要

(1) 調査方法

本報告では、ビッグデータ分析技術に関する研究開発動向を学会における論文発表の

調査により集計・分析する。

(2) 調査対象期間

発行年が 2000 年から 2012 年までの会議等の掲載論文とした

1

(3) 調査対象国際会議及び学会誌

グローバルな研究開発動向を分析するために、主要な国際会議での発表論文を主たる

対象とした。また、国内の研究機関等の研究開発動向を分析するために、主要な国内の

学会論文誌、研究会資料などを対象とした。調査対象とした会議等で発表される論文は

本調査の俯瞰図に示される技術領域に関するものがほとんどであると思われるため、調

査対象会議等で発表された全論文を詳細解析することとした。調査対象とした会議等の

名称と抽出した発表論文件数及び分析対象とした論文(対象外を除く)の一覧を表 4-1

に示す。

表 4-1 調査対象国際会議・国内論文誌等と論文件数一覧

会議等の名称 略称

抽出

論文数

分析対象

論文数

IEEE International Conference on Data Mining ICDM 2,017 1,486

IEEE International Conference on Data Engineering ICDE 2,002 1,541

ACM International Conference on Management of Data SIGMOD 1,467 1,175

ACM International Conference on Knowledge Discovery and Data

Mining

SIGKDD 1,628 1,528

International Conference on Very Large Data Bases VLDB 1,843 1,450

国際論文数小計 8,957 7,180

情報処理学会論文誌 データベース TOD 454 369

情報処理学会 データベースシステム研究会報告 DBS 1,344 1,081

電子情報通信学会技術研究報告 データ工学 DE 1,126 800

日本データベース学会 Letters/論文誌 DBSJ 588 494

国内論文数小計 (掲載数での集計) 3,512 2,744

(正味の論文数) (2,786) (2,136)

論文数総計 (掲載数での集計) 12,469 9,924

(正味の論文数) (11,743) (9,316)

(注 1)抽出論文数は調査期間内の対象会議等で発表された論文数であり、分析対象論文数は抽出論文か

ら対象技術に関連する論文のみに絞った論文数を意味する。

(注 2)DBS と DE に関しては、電子情報通信学会と情報処理学会の共催する会議が開催され、そこでの発

表論文が双方の学会から発行される場合がある。そのケースに対して本調査では、学会誌別の分

析ではそれぞれにおける「掲載数」を別個に集計し、技術区分別、研究者別、所属機関別の分析

では該当する 2 つの論文を 1 件として「正味の論文数」を集計した。

1

ICDM は 2001 年から開催が始まったため、2000 年の総論文件数(母集団)は他の年と比べて 1~2 割程度

目減りして見えるので、経年推移で動向を見る場合などに注意を要する。

- 29 -

第 2 節 全体動向調査

1. 国際会議発表論文の全体動向

図 4-1 に国際会議別の論文発表件数推移及び件数比率を示す。図 4-2 に研究者所属機

関国籍別の論文発表件数推移及び件数比率を示す。

図 4-1 国際会議別 論文の件数推移及び論文件数比率

ICDE

1,541件

21.5%

ICDM

1,486件

20.7%

SIGKDD

1,528件

21.3%

SIGMOD

1,175件

16.4%

VLDB

1,450件

20.2%

合計7,180件

266

358

429

445

518

565

587 598

670

685

650

677

732

0

200

400

600

800

2000 2001 2002 2003 2004 2005 2006 2007 2008 2009 2010 2011 2012

発表年

ICDE ICDM SIGKDD SIGMOD VLDB 合計

国際会議

発表年

2000-2012年

図 4-2 研究者所属機関国籍別 論文件数推移及び論文件数比率(国際会議)

日本国籍

156件

2.2%

米国籍

4,121件

57.4%

欧州国籍

1,295件

18.0%

中国籍

587件

8.2%

韓国籍

80件

1.1%

その他

941件

13.1%

合計7,180件

266

358

429

445

518

565

587 598

670

685

650

677

732

0

200

400

600

800

2000 2001 2002 2003 2004 2005 2006 2007 2008 2009 2010 2011 2012

発表年

日本 米国 欧州 中国 韓国 その他 合計

研究者所属機関国籍

発表年

2000-2012年

総発表論文数は、2000 年から 2012 年にかけて毎年約 40 件増加する傾向を示し、2012

年は 2000 年に対し約 2.8 倍の論文発表件数になっている。国籍別にみると、米国籍の発

表件数が他の地域・国に対し大きく差をつけて全体の 57%を占め、支配的な立場にある。

それに対し、日本が占める割合は 2.2%であり、ここ数年も増加する傾向を示していない。

一方、欧州は 20%程度、中国は 10%程度を調査期間全般にわたって維持している。

- 30 -

2. 国内論文件数の推移

図 4-3 に日本国内発行の学会誌等への論文件数推移を示す。

図 4-3 国内学会誌等別 論文の件数推移及び論文件数比率

DBS

1,081件

39.4%

DBSJ

494件

18.0%

DE

800件

29.2%

TOD

369件

13.4%

合計2,136件

143

157 153

204

211 208

192

217 218

110

132

112

79

0

100

200

300

2000 2001 2002 2003 2004 2005 2006 2007 2008 2009 2010 2011 2012

発表年

DBS DBSJ DE TOD 合計

(国内)論文誌・技術研究報告

発表年

2000-2012年

注 1)2011 年以降は DE の論文に関してデータベース収録の遅れがあるため、一部の論文データが反

映されていない。

注 2)円グラフの合計値は正味の論文数(折れ線グラフで示されるもの)を集計したものである。

各論文誌等への掲載数の延べ合計ではないため、円グラフの要素の合計値とは異なる。

論文件数は、2000 年から 2008 年にかけてわずかであるが漸増傾向にあったが、それ

以降、減少に転じている

1

第 3 節 技術区分別動向調査

1. 全体動向

1.1 国際会議論文

(1) 技術区分別全体動向

図 4-4 に技術区分(第 1 軸:大分類)別論文件数推移を、図 4-5 に技術区分(第 1 軸:

大分類)別研究者所属機関国籍別論文発表件数を示す。

図 4-4 技術区分(第 1 軸:大分類)別論文件数推移(国際会議)

266

358

429

445

518

565

587 598

670

685

650

677

732

0

200

400

600

800

2000 2001 2002 2003 2004 2005 2006 2007 2008 2009 2010 2011 2012

発表年

データ解析技術 解析対象DB ストック系データ前処理 ストリーム系処理技術 分析基盤技術 合計

技術区分

発表年

2000-2012年

1

国内の主要な研究ワークショップが非公開制となったことや、国際会議へ投稿する傾向が高まってきたこ

となどが影響していると考えられる。

- 31 -

図 4-5 技術区分(第 1 軸:大分類)別-研究者所属機関国籍別論文件数(国際会議)

121

2331 717 426

44

16

743

271 65 16

1

250

88 236

13

383

89 37 8

7

591

179 52 14

データ解析技術

解析対象DB

ストック系

データ前処理技術

ストリーム系処理技術

分析基盤技術

研究者所属機関国籍

データマイニングを含むデータ解析技術に関する論文発表が多い。また、全技術区分

で米国籍機関による発表が最多である。

(2) 技術区分(第 2 軸)別-発表件数推移

技術区分(第 2 軸)別の論文発表件数の推移を図 4-6 に示す。

図 4-6 技術区分(第 2 軸)別-論文発表件数推移

1 5 5 16 13 8 7 18 14 12 9 12

8 17 18 17 11 21 23 22 18 16 22 18 26

9 19 19 25 23 26 33 19 30 18 30 35 41

39 96 128 125 128 130 140 116 162 172 192 218 207

1 1 1 3 4 1 5 3 1 1 2

21 20 23 15 28 20 21 22 13 21 12 12 13

3 10 16 21 24 17 18 23 13 9 7 4 2

1 1 4 4 1 4 4 4 7 6 7

4 1 1 2 1 3 4 1 2

1 1 10 9 20 14 13 19 21 21 16 9 11

3 4 3 5 2 4 2 5 4 2 3 3

3 4 5 7 16 18 16 12 16 17 22 17 15

3 5 4 4 14 6 7 10 15 11 13 8 9

2 1 1 1 1 3 1 2

1 1 2 1 2 3 3 2 2 2

5 1 4 3 3 5 3 3

発表年

2000 2001 2002 2003 2004 2005 2006 2007 2008 2009 20102011 2012

可視化技術

機械学習(マイニング)

データ解析履歴管理

解析対象RDB

解析対象NoSQL一般

ストリーム問合せ

ストリーム統計

ストリームマイニング

機械学習(ストリーム系)

履歴管理(データ解析に関するもの)

データ改ざん防止(データ証明・認証)

プライバシー保護基盤

データ解析技術

解析対象DB

ストリーム系処理技術

分析基盤技術

プライバシー保護マイニング

時系列マイニング

解析対象XMLDB

解析対象グラフDB

- 32 -

(3) データ発生源別-発表件数推移

データ発生源別の論文発表件数の推移を図 4-7 に示す。

図 4-7 データ発生源別-発表件数推移

24 55 69 69 68 76 70 64 76 80 42 53 67

9 13 17 11 13 14 8 18 9 11 11 7 11

7 2 7 9 21 13 18 16 21 22 27 30 30

4 2 3 8 54

11 8 104

6 9 10

4 6 7 4 7 6 62

6 4 8 12 5

2 2 2 2 35

25 5 6 4 6 6

4 1 2 2 6 2 9 4 5 4 4 2 4

2 1 5 1

4 28 11 13 20 12 21 18 13 13 13

53

4 5 5 6 6 5 10 13 8 11 13

25 29 43 33 30 32 37 46 44 70 50 68 76

2 1 4 1 3 4 14 8 19 21 19 29

12 21 31 38 40 39 51 60 58 58 40 55 46

13 12 7 8 11 9 11 17 14 10 10 11 14

4 3 6 6 7 5 8 6 6 6 11 4 9

1 3 2 3 3 3 4 8 3 7 6 9 6

7 11 21 20 35 19 16 15 31 9 18 16 26

3 2 3 6 6 5 12 8 2 6 4 7 10

18 22 35 36 40 51 64 44 51 68 26 38 52

2000 2001 2002 2003 2004 2005 2006 2007 2008 2009 2010 2011 2012

発表年

既存DB

取引データ(POSデータなど)

位置情報

システムログ

Webコンテンツ

リンク(サイトリンク、ソーシャルリンク)

テキスト情報

マルチメディアデータ

通信サービス関連情報

経営情報

医療情報

金融情報

その他

自然現象関連情報

装置動作情報

医療センサ情報

モニタ映像情報

建造物情報

その他センサ

センサ

(4) 課題別発表件数推移

課題別の論文発表件数推移を図 4-8 に示す。

図 4-8 課題別論文発表件数推移(国際会議)

99 109 154 155 171 174 215 225 232 259 224 219 257

36 57 50 79 76 73 73 82 86 69 62 69 78

59 70 86 98 118 135 143 129 140 122 137 155 189

30 50 78 66 98 105 112 98 129 131 90 99 121

3 1 6 7 12 17 15 25 19 25 26 14 14

22 17 29 27 26 30 26 26 49 54 46 45 46

5 11 20 12 26 27 34 26 21 27 18 33 25

2000 2001 2002 2003 2004 2005 2006 2007 2008 2009 2010 2011 2012

発表年

経済性・収益性

網羅性・柔軟性

大規模化・高速性・

リアルタイム性

正確性

プライバシー保護

ユーザの利便性

信頼性・安全性

- 33 -

(6) 応用産業分野別の論文件数推移

応用産業分野別の論文発表件数の推移を図 4-9 に示す。

図 4-9 応用産業分野別-発表件数推移

3 1 3 1 27

3 1 1 3 3 2

5 6 5 7 10 8 6 5 62

10 6

1 34

35 5 7 5 11 5 8 12 11

1 2 2 3 1 24 2 2 5 4

3 1 2 1 3 3 5 52

3 1 2 1 2 2 2 7 2

2 1 1 1

4 4 3 5 3 3 7 7 4 7 3 5 5

5 5 14 12 17 8 15 16 27 29 22 28 32

11 12 18 5 12 9 9 17 12 16 14 22 20

7 11 13 8 14 5 10 12 9 4 2 9 13

5 6 6 7 11 4 6 11 8 16 9 7 5

1 1 1 1 3 1

1 2 1 1 1 1

5 4 3 3 4 5 3 5 3 3 1 4 3

1 2 43

6 51

5 6 2 36

14 18 18 16 21 23 20 25 25 30 24 24 32

10 19 27 25 40 35 37 38 45 28 26 22 39

7 9 10 14 19 14 10 12 23 12 18 20 25

4 1 2 1 4 69 14 16 37 37 45 67

2 3 2 2 3 5 4 3 3 8 4 8 14

6 1 3 5 4 4 3 3 3 2 4 7 7

3 3 4 6 4 4 8 16 6 7 5 6 6

4 5 6 4 4 3 7 4 6 7 11 17 13

2000 2001 2002 2003 2004 2005 2006 2007 2008 2009 2010 2011 2012

発表年

自然災害対策

防犯対策

交通管理

インフラ管理

電子政府

エネルギー管理

スマートシティ/スマートグリッド

公共一般

情報推薦

マーケティング

電子商取引

通信

電力

農林水産支援

生産管理

故障予知・予防保全

企業一般

科学技術研究分野

医療・健康管理

ソーシャルネットワークサービス

行動管理

ゲームコンテンツ分野

金融情報

生活分野一般

[公共分野公共分野公共分野公共分野]

[企業分野企業分野企業分野企業分野]

[生活分野生活分野生活分野生活分野]

1.2 国内論文誌等の発表論文

国内論文誌等に発表された論文件数を技術区分(第 1 軸:大分類)別に図 4-10 に示す。

図 4-10 技術区分別論文件数推移(国内学会誌等)

143

157 153

204

211 208

192

217 218

110

132

112

79

0

100

200

300

2000 2001 2002 2003 2004 2005 2006 2007 2008 2009 2010 2011 2012

発表年

データ解析技術 解析対象DB ストック系データ前処理 ストリーム系処理技術 分析基盤技術 合計

技術区分

発表年

2000-2012年

注)2011 年以降は DE の論文に関してデータベース収録の遅れがあるため、一部の論文データが反

映されていない。

- 34 -

2. 技術区分別-研究者所属機関国籍別件数推移と比率(国際会議)

(1) データ解析技術

図 4-11 に、データ解析技術に関する論文の研究者所属機関国籍別論文件数推移と論

文件数比率を示す。

図 4-11 データ解析技術-研究者所属機関国籍別論文件数推移及び論文件数比率

日本国籍

121件

2.8%

米国籍

2,331件

54.8%

欧州国籍

725件

17.1%

中国籍

426件

10.0%

韓国籍

44件

1.0%

合計4,251件

その他

604件

14.2%136

222

270 270

295

309

357

297

386393 396

435

485

0

200

400

600

2000 2001 2002 2003 2004 2005 2006 2007 2008 2009 2010 2011 2012

発表年

日本 米国 欧州 中国 韓国 その他 合計研究者所属機関国籍

発表年

2000-2012年

(2) 解析対象 DB 技術

図 4-12 に、解析対象 DB に関する研究者所属国籍別論文件数推移と論文件数比率を示

す。

図 4-12 解析対象 DB-研究者所属国籍別論文件数推移及び論文件数比率

日本国籍

16件

1.3%

米国籍

743件

60.2%

欧州国籍

271件

21.9%

中国籍

65件

5.3%

韓国籍

16件

1.3%

その他

124件

10.0%

合計1,235件

86 84 82

69

102

88 90

137

103

111

97

88

98

0

50

100

150

2000 2001 2002 2003 2004 2005 2006 2007 2008 2009 2010 2011 2012

発表年

日本 米国 欧州 中国 韓国 その他 合計研究者所属機関国籍

発表年

2000-2012年

(3) ストック系データ前処理技術

図 4-13 に、ストック系データ前処理技術に関する研究者所属機関国籍別論文件数推

移と論文件数比率を示す。

- 35 -

図 4-13 ストック系データ前処理技術-研究者所属機関国籍別論文件数推移及び論文件数比率

日本国籍

1件

0.2%

米国籍

250件

58.4%

欧州国籍

88件

20.6%

中国籍

23件

5.4%

韓国籍

6件

1.4%

合計428件

その他

60件

14.4%

13

18 18

19

20

34

41

39

50

46

53

43

34

0

20

40

60

2000 2001 2002 2003 2004 2005 2006 2007 2008 2009 2010 2011 2012

発表年

日本 米国 欧州 中国 韓国 その他 合計研究者所属機関国籍

発表年

2000-2012年

(4) ストリーム系処理技術

図 4-14 に、ストリーム系処理技術に関する研究者所属機関国籍別論文件数推移と論

文件数比率を示す。

図 4-14 ストリーム系処理技術-研究者所属機関国籍別論文件数推移及び論文件数比率

日本国籍

13件

2.2%

米国籍

362件

61.0%

欧州国籍

84件

14.2%

中国籍

34件

5.7%

韓国籍

8件

1.3%

合計593件

その他

92件

15.5%

10

7

27

33

61

54

6263

74

68

55

4039

0

20

40

60

80

2000 2001 2002 2003 2004 2005 2006 2007 2008 2009 2010 2011 2012

発表年

日本 米国 欧州 中国 韓国 その他 合計研究者所属機関国籍

発表年

2000-2012年

(5) 分析基盤技術

図 4-15 に、分析基盤技術に関する研究者所属機関国籍別論文件数推移と論文件数比

率を示す。

図 4-15 分析基盤技術-研究者所属機関国籍別論文件数推移及び論文件数比率

日本国籍

7件

0.7%

米国籍

591件

62.1%

欧州国籍

179件

18.8%

中国籍

52件

5.5%

韓国籍

14件

1.5%

合計952件

その他

109件

11.4%

30

43

49

67

55

94

60

90

88 88

84

97

107

0

20

40

60

80

100

120

2000 2001 2002 2003 2004 2005 2006 2007 2008 2009 2010 2011 2012

発表年

日本 米国 欧州 中国 韓国 その他 合計研究者所属機関国籍

発表年

2000-2012年

- 36 -

第 4 節 研究者所属機関別発表件数上位ランキング

1. 国際会議

表 4-2 に国際会議での研究者所属機関別論文件数上位ランキングを、全体及び技術区

分別に示す。

表 4-2 研究者所属機関別論文件数上位ランキング(国際会議)

順位

研究者所属

組織名称

論文

件数

順位

研究者所属組織

名称

論文

件数

順位

研究者所属組織

名称

論文

件数

順位

研究者所属組織

名称

論文

件数

順位

研究者所属組

織名称

論文

件数

順位

研究者所属組織

名称

論文

件数

1

アイ・ビー・エム

(米国)

602 1

アイ・ビー・エム

(米国)

343 1

アイ・ビー・エム

(米国)

117 1

エイ・ティ・アンド・

ティ(米国)

32 1

カリフォルニア

大学(米国)

59 1

アイ・ビー・エム

(米国)

90

2

カリフォルニア大

学(米国)

493 2

カリフォルニア

大学(米国)

239 2

マイクロソフト

(米国)

109 2

アイ・ビー・エム

(米国)

30 2

アイ・ビー・エム

(米国)

47 2

カリフォルニア

大学(米国)

82

3

マイクロソフト

(米国)

361 3

イリノイ大学

(米国)

204 3

カリフォルニア

大学(米国)

101 2

カリフォルニア

大学(米国)

30 3

エイ・ティ・アン

ド・ティ(米国)

26 3

マイクロソフト

(米国)

57

4

イリノイ大学

(米国)

270 4

マイクロソフト

(米国)

168 4

ウィスコンシン

大学(米国)

39 4

マイクロソフト

(米国)

26 4

イリノイ大学(米

国)

18 4

シンガポール

国立大学

(シンガポール)

32

5

シンガポール国

立大学(シンガ

ポール)

193 5 ヤフー(米国) 124 5

スタンフォード

大学(米国)

37 5

イリノイ大学

(米国)

15 4

スタンフォード

大学(米国)

18 5

ウィスコンシン

大学(米国)

31

6 ヤフー(米国) 177 6

カーネギーメロン

大学(米国)

121 6 オラクル(米国) 34 5

パデュー大学

(米国)

15 5

スイス連邦工

科大学(スイス)

17 6

エイ・ティ・アンド・

ティ(米国)

28

7

カーネギーメロン

大学(米国)

172 7

シンガポール

国立大学

(シンガポール)

105 7

シンガポール

国立大学

(シンガポール)

32 7

シンガポール

国立大学

(シンガポール)

13 5 ヤフー(米国) 17 6 オラクル(米国) 28

8

エイ・ティ・アンド・

ティ(米国)

170 8 清華大学(中国) 82 8

ミシガン大学

(米国)

31 7

ワシントン大学

(米国)

13 8

ワーチェスター

工芸研究所(米

国)

16 8 ヤフー(米国) 23

9

スタンフォード

大学(米国)

146 9

テキサス大学

(米国)

79 9

イリノイ大学

(米国)

30 9

エディンバラ

大学(英国)

11 9

パデュー大学

(米国)

15 9

スイス連邦工科

大学(スイス)

21

10

香港科技大学(中

国)

135 10

香港科技大学(中

国)

74 10

エイ・ティ・アンド・

ティ(米国)

29 9

トロント大学

(カナダ)

11 9

香港科技大学

(中国)

15 9

スタンフォード

大学(米国)

21

10

香港中文大学(中

国)

74 10

香港科技大学(中

国)

29 9

ワシントン大学(米

国)

21

40 日本電気 51 33 日本電気 32 46 日本電気 8 23 日本電気 7 87 日本電気 4

86 東京大学 23 61 東京大学 19 76 筑波大学 4 43 日本電信電話 4

96 日本電信電話 20 70 日本電信電話 16 122 東京大学 2

分析基盤技術全体 データ解析技術 解析対象DB ストック系データ前処理技術 ストリーム系処理技術

(注)論文件数が複数ある機関のみを抽出した。

米国の企業、大学が上位ランクを独占している。特にアイ・ビー・エム(米国)は全

体を含め、すべての技術区分で上位 1、2 位に位置しており、特許出願だけでなく論文発

表でも存在感を示している。その他、企業としてはマイクロソフト(米国)、ヤフー(米

国)及びエイ・ティ・アンド・ティ(米国)が上位 10 位以内にあり、米国大手企業がビ

ッグデータ分析技術全般に精力を注いでいるのが分かる。アジア勢では、シンガポール

国立大学(シンガポール)が全体を含め、データ解析技術、解析対象 DB、ストック系デ

ータ前処理技術、分析基盤技術の分野で上位に入っているのが注目される。他には、香

港科技大学(中国)、清華大学(中国)といった中国勢が上位に入っている。上位 10 位

以内に入る日本及び韓国の企業・大学は存在しない。また、欧州勢では、スイス連邦工

科大学(スイス)がストリーム系処理技術、分析基盤技術で上位に入っている。

2. 国内学会誌等

表 4-3に国内学会誌等に発表された論文の研究者所属機関別論文件数上位(10位まで)

ランキングを示す。大学からの発表が多く、すべての技術区分(全体を含める)におい

て京都大学、筑波大学がトップ近辺に位置している。一方、企業系では日本電信電話が

上位ランキングに登場している。

- 37 -

表 4-3 研究者所属機関別論文件数上位ランキング(国内学会誌等)

順位

研究者所属

組織名称

論文

件数

順位

研究者所属

組織名称

論文

件数

順位

研究者所属

組織名称

論文

件数

順位

研究者所属

組織名称

論文

件数

順位

研究者所属

組織名称

論文

件数

順位

研究者所属

組織名称

論文

件数

1 京都大学 251 1 京都大学 181 1 京都大学 27 1 筑波大学 24 1 筑波大学 29 1 東京工業大学 42

2 筑波大学 224 2 筑波大学 128 2 筑波大学 25 2 京都大学 21 2 京都大学 12 2 筑波大学 31

3 東京大学 158 3 東京大学 104 3 慶應義塾大学 24 3 東京大学 15 2 慶應義塾大学 12 3 慶應義塾大学 29

4 日本電信電話 145 4 日本電信電話 99 4

奈良先端科学技術

大学院大学

19 4 慶應義塾大学 11 4 大阪大学 10 4 東京大学 25

5 慶應義塾大学 143 5 慶應義塾大学 74 5 九州大学 18 5 日本電信電話 9 4 日本電信電話 10 5 大阪大学 24

6 大阪大学 110 6 大阪大学 62 6 東京大学 15 6 情報通信研究機構 8 4 名古屋大学 10 6 お茶の水女子大学 21

7 東京工業大学 102 7 国立情報学研究所 61 7 国立情報学研究所 14 6 神戸大学 8 7 科学技術振興機構 8 6 京都大学 21

8 国立情報学研究所 92 8 九州大学 53 7 日本電信電話 14 8 国立情報学研究所 7 7 東京大学 8 8 日本電信電話 19

9 九州大学 87 9 名古屋大学 48 9 大阪大学 13 9 九州大学 6 7 日立製作所 8 9

奈良先端科学技術

大学院大学

15

10 名古屋大学 83 10 神戸大学 46 10 名古屋大学 12 9 大阪大学 6 10 情報通信研究機構 7 10 日本放送協会 11

10 東京工業大学 46 9 東京工業大学 6 10 神戸大学 7 10 名古屋大学 11

9

奈良先端科学技術

大学院大学

6

9 名古屋大学 6

分析基盤技術全体 データ解析技術 解析対象DB ストック系データ前処理 ストリーム系処理技術

第 5 節 注目論文

調査した論文の中で被引用件数の多い論文及び委員会の委員やヒアリングを行った有

識者から推薦のあった論文を総合的に勘案して、ビッグデータ分析で影響力の大きいと

認められる注目論文を選定した。注目論文の一覧を表 4-4 に示す。

- 38 -

表 4-4 注目論文一覧

技術区分 技術名 論文名 著者/所属 発表先

1 データ解

Apriori

(相関ルールマイニング

アルゴリズム)

Fast algorithms for mining

association rules

R Agrawal, R Srikant

アイ・ビー・エム(米国)

Proc. 20th Int. Conf. Very Large

Data Bases, VLDB,1994

2 プライバシ保護データマ

イニング

Privacy-preserving data

mining

R Agrawal, R Srikant

アイ・ビー・エム(米国)

ACM Sigmod Record, 2000

3 頻出パターンマイニング Mining frequent patterns

without candidate

generation

Jiawei Han; Jian Pei; Yiwen Yin

サイモン・フレーザー大学(カナダ)

Proceedings of the 2000 ACM

SIGMOD international conference

on Management of data

4 PrefixSpan

(時系列マイニング)

PrefixSpan: mining

sequential patterns

efficiently by

prefix-projected pattern

growth

J. Pei, J. Han, B. Mortazavi-Asl,

et al.

サイモン・フレーザー大学(カナダ)

Proceedings of the 17th

International Conference on Data

Engineering, 2001

5 ソーシャルネットワーク

上の影響伝搬

Maximizing the spread of

influence through a social

network

David Kempe ; Jon Kleinberg ; et

al

コーネル大学(米国)

KDD '03 Proceedings of the ninth

ACM SIGKDD international

conference on Knowledge

discovery and data mining

6 Bayesian Nonparametrics

(機械学習)

Hierarchical Dirichlet

Processes

Y.W. Teh, M.I. Jordan, et al.

シンガポール国立大学(シンガポー

ル)、カリフォルニア大学バークレ

ー校ほか

Journal of the American

Statistical Association, 2004

7 Deep Learning(機械学習) Reducing the

dimensionality of data

with neural networks.

G. E. Hinton, and R. R.

Salakhutdinov

トロント大学(カナダ)

Science, Vol. 313. no. 5786, pp.

504 - 507, 28 July 2006.

8 解析対象

DB

スカイラインクエリ The Skyline operator S. Borzsony, D. Kossmann, K.

Stocker

パッサウ大学(ドイツ)

Proceedings of the 17th

International Conference on Data

Engineering, 2001

9 Pig(高級手続型クエリ言

語)

Pig latin: a

not-so-foreign language

for data processing

C. Olston, B. Reed, U. Srivastava,

et al.

ヤフー(米国)

Proceedings of the 2008 ACM

SIGMOD international conference

on Management of Data 2008

10 Hive

(データウェアハウス)

Hive: a warehousing

solution over a map-reduce

framework

Ashish Thusoo,Joydeep Sen Sarma,

Namit Jain, et. al

フェイスブック(米国)

Proceedings of the VLDB

Endowment, 2009

11 匿名化 k-匿名化 k-anonymity: A model for

protecting privacy

L Sweeney

カーネギーメロン大学(米国)

International Journal on

Uncertainty, Fuzziness and

Knowledge-based Systems, 10 (5),

2002

12 k-匿名化 Data privacy through

optimal k-anonymization

R.J. Bayardo, R. Agrawal

アイ・ビー・エム(米国)

Proceedings of the 21st

International Conference on Data

Engineering, 2005

13 l-多様性 l-diversity: Privacy

beyond k-anonymity

A Machanavajjhala, D Kifer, J

Gehrke, M. Venkitasubramaniam

コーネル大学(米国)

ACM Transactions on Knowledge

Discovery from Data, 2007

14 分析基盤 Paxos

(分散処理用プロトコ

ル)

The Part-Time Parliament L Lamport

デジタル・イクイップメント(米国)

ACM Transactions on Computer

Systems 16, 2 (May 1998)

15 Google File System

(分散ファイルシステ

ム)

The Google File System S. Ghemawat, H. Gobioff , S. Leung

グーグル(米国)

Proceedings of the nineteenth ACM

Symposium on Operating Systems

Principles, 2003

16 MapReduce

(並列分散処理基盤)

MapReduce: simplified data

processing on large

clusters

J Dean, S Ghemawat

グーグル(米国)

OSDI'04: Proceedings of the 6th

conference on Symposium on

Opearting Systems Design &

Implementation, USENIX

Association, 2004

17

BigTable

(分散キー・バリュー・

ストア)

Bigtable: A distributed

storage system for

structured data

F Chang, J Dean, S Ghemawat, WC

Hsieh, et al.

グーグル(米国)

OSDI'06: Proceedings of the 6th

conference on Symposium on

Opearting Systems Design &

Implementation, USENIX

Association, 2006

18 Chubby

(分散データベース)

The Chubby lock service for

loosely-coupled

distributed systems

M Burrows

グーグル(米国)

Proceedings of the 7th symposium

on Operating systems design and

implementation, 2006

19 Dynamo(分散キー・バリ

ュー・ストア)

Dynamo: amazon's highly

available key-value store

G DeCandia, D Hastorun, M Jampani,

G Kakulapati, et al.

アマゾン テクノロジーズ(米国)

SOSP 2007: Proceedings of

twenty-first ACM SIGOPS

symposium on Operating systems

principles

20 PNUTS

(分散データベース)

PNUTS: Yahoo!'s hosted

data serving platform

BF Cooper, R Ramakrishnan, U

Srivastava, et al.

ヤフー(米国)

Proceedings of the VLDB

Endowment, 2008

21 Cassandra

(分散データベース)

Cassandra: a decentralized

structured storage system

A Lakshman, P Malik

フェイスブック(米国)

ACM SIGOPS Operating Systems

Review, 2010

22 Pregel

(大規模グラフ処理基

盤)

Pregel: A System for

Large-Scale Graph

Processing

M. Malewicz, M. H. Austern, A. J.C

Bik, et al.

グーグル(米国)

Proceedings of the 2010 ACM

SIGMOD International Conference

on Management of Data

- 39 -

第第第第 5555 章章章章 政策動向政策動向政策動向政策動向

第 1 節 科学技術政策・産業政策の概要

日米欧中韓の各国・地域の各種政策を表 5-1 に示す。

表 5-1 日米欧中韓の各国・地域の各種政策

国・

地域

認識課題 施策の概要 出典

日本

・基盤技術確立

-収集・伝送、処理、

利活用・分析

・パーソナルデータの

利活用の枠組み

-保護の必要性と

保護範囲

-匿名化されたデータの

扱い

-プライバシ性の高低

や取得経緯の扱い

・産業成長戦略

-医療・介護情報の

電子化の促進

-インフラ点検・診断

システム

-渋滞抑制

【技術政策】

平成 25 年度科学技術関係予算(重点施策パッケージ)によると、異なる目的で収集された様々

なデータから意味のあるデータをリアルタイムに抽出できる基盤技術を確立することを目指し、そ

の実現に必要なビッグデータの①収集・伝送について、通信トラヒックの量が 2020 年に現在の

300 倍となってもビッグデータの多様な伝送要求にリアルタイムに対応可能なネットワーク仮想化

技術を 2017 年度までに確立、②処理について、ビッグデータ時代の新たな情報処理基盤技術と

して、時々刻々と生成される膨大なデータに対して逐次的に「高度な解析」を実行し、リアルタイム

に知識を抽出する技術を 2015 年度までに確立、③利活用・分析について、異なる目的で収集さ

れたデータから意味のある情報を抽出する技術の開発や基盤整備を 2015 年度までに実施するこ

とを目標としている。 ビッグデータ関連予算は、総額 42.1 億円+5.6 億円の内数(新規)(2013 年

度)で、ビッグデータ活用基盤構築事業(文科省)、次世代 IT 基盤構築のための研究開発(文科

省)、高効率・省エネ型センサ制御技術、リアルタイム大規模データ解析技術によるビッグデータ

処理基盤の研究開発(経産省)、ビッグデータ時代に対応するネットワーク基盤技術の確立等(総

務省)など、6 施策がある。

【制度政策】

パーソナルデータに関する検討会では、①パーソナルデータの利活用の基本的枠組みの明確

化(保護の必要性と保護範囲、保護の必要性と保護範囲)、②パーソナルデータの利活用ルール

の在り方(事業者の手続き、匿名化されたパーソナルデータの扱い、プライバシ性の高低や取得

経緯、ルールの共通化)、③パーソナルデータの保護を有効に機能させるための仕組みの在り

方、などが検討されている。

【産業政策】

2013 年 6 月に政府官邸で策定された「日本の成長戦略」では、テーマ 1(国民の「健康寿命」の

延伸)の中の<医療・介護情報の電子化の促進>、テーマ 3(安全・便利で経済的な次世代インフ

ラの構築)の中の<インフラ点検・診断システム>、<渋滞抑制>でのデータの活用を進めようと

している。

平成 25 年度

科学技術関係

予算(重点施策

パッケージの特

定について)、

平成 24 年 10

月、科学技術

政策担当大

臣、総合科学

技術会議有識

者議員

パーソナルデ

ータに関する検

討会、平成 25

年 9 月、IT 総合

戦略本部

第 12 回産業競

争力会議、平

成 25 年 6 月、

政府官邸

米国

・ビッグデータ関連の

技術開発

・ビッグデータ関連事業

創出、特に、保健福祉

省、国防省、エネルギー

省でのビッグデータ活用

【技術政策】

大統領府科学技術政策局(OSTP)が 2012 年 3 月 29 日に発表したビッグデータ研究開発イニシ

アティブ(Big Data Research and Development Initiative)によって、政府として戦略的に取り組む

姿勢を明らかにし、総額 2 億ドルの予算を研究開発に充てている。同イニシアティブでは、国立科

学財団(NSF)、国立衛生研究所(NIH)、国防総省(DoD)、エネルギー省(DoE)、国防高等研究計画

局(DARPA)及び地質調査所(USGS)の 6 機関が参加している。

このほか、連邦政府ではビッグデータ関連事業が実施されており、2012 年 11 月に行われた調

査では、連邦政府内で 163 の関連事業が実施されていることが報告されている。その中で、保健

福祉省(HHS)(34 件)、国防省(DoD)(31 件)、エネルギー省(DoE)(19 件)で半数の事業がある。な

お、同調査では、ビッグデータ関連予算は 57 億ドル(2014 年)から年率 8.2%で成長し、2017 年に

70 億ドル以上になると予測されている。

平成 25 年版

情報通信白書

欧州

・ビッグデータバリュー

チェーンの具体化

・技術トレンドのロード

マップ作成

・ビッグデータの適用分

野の明確化

・優先順位の決定

・次期研究枠組の策定

【技術政策】

第 7 次研究枠組計画(FP7)において、2012 年 9 月から 2014 年 10 月まで実施される予定の

BIG(Big Data Public Private Forum)がある。BIG はビッグデータバリューチェーンの具体化、技術

トレンドのロードマップ作成、ビッグデータの適用分野の明確化、予想インパクトに応じた優先順

位の決定、次期研究枠組計画である Horizon2020 策定等を目標に設定している。BIG の 5 つのフ

ォーラムには、金融・保険、医療、製造・リテール、エネルギー・輸送、公共、テレコム・メディア・エ

ンターテイメントを有し、作業部会には、データ取得、データ分析、データ・キュレーション、データ

保存、データ用途がある。

また、FP7 におけるビッグデータ関連計画として、Planet Data がある。実施期間は 2010 年 10

月から 2014 年 9 月までで、総予算は 372 万ユーロ(内 EU 補助金は 302 万ユーロ)となっている。

同計画の目標は、さまざまな組織が自らのデータを新たな有益なやり方で Web 上において提供す

る取組をサポートする学際的な持続的研究コミュニティを確立することである。

平成 25 年版

情報通信白書

中国

・ビッグデータ分析ソフト

ウェアの開発

・それを活用したサービス

の創出

・ネットワーク情報セキュ

リティ保護強化

【技術政策】

国家発展・改革委員会は、2012 年 12 月に「2012 年におけるハイテク・サービス業の研究開発と

産業化に関する通知」を発表し、その中の支援内容において、ビッグデータの処理技術の確立を

促進する一環として、ビッグデータ分析ソフトウェアの開発とそれを活用したサービスの創出が重

点的支援の対象と指定された。対象となっているのは、先進的な 14 省市で、各地方政府は、今

後 3 年間のプロジェクト実施方案と資金申請報告を策定・提出し、国家発展・改革委員会は 2013

年上半期に、優良プロジェクトに対して資金を支援することとしている。

【制度政策】

個人情報保護の観点からは、「ネットワーク情報セキュリティ保護強化に関する決定」が 2012 年

12 月に全人代常務委員会で可決され、ネット利用者の身分管理が一層強化されることになった。

平成 25 年版

情報通信白書

- 40 -

韓国

・ビッグデータ共有・活用

の政府内設備

・中核技術開発

・専門人材育成

・産学共同研究開発事業

・公共データ開放活性化

のための法令制定、個

人情報保護対策整備

【技術・制度政策】

李明博政権までの ICT 政策

政府横断的なビッグデータ戦略として、2011 年 11 月に国家情報化戦略委員会(注 1)が「スマー

ト国家具現のためのビッグデータ・マスタープラン」を発表した。予算は 2016 年までに政府と民間

合わせて約 5,000 億ウォンが投じられる。主な目標は、①ビッグデータ共有と活用のための政府

内共同設備の構築、②ビッグデータ技術開発ロードマップ策定と中核技術開発支援、③専門人

材育成のため大学にビッグデータ関連科目を開設し、産学共同研究開発事業を支援、④公共デ

ータ開放活性化のための法令制定推進、個人情報保護対策整備、であった。

朴槿恵政権

新設された ICT 政策の未来創造科学部は、前政権で廃止された科学技術部と情報通信部も合

わせた大型省庁で、2013 年 4 月に発表した 2013 年度政策方針には、2017 年までに科学技術と

ICT 融合(衛星映像ビッグデータ処理等)の 10 プロジェクト推進による新産業創出、クラウド法制

定、ビッグデータ分析・活用センター構築、M2M 試験事業推進を通じたインターネット新産業育成

等がある。

平成 25 年版

情報通信白書

(注 1)

政権交代後、

2013 年 3 月の

省庁再編によ

り廃止

1. 日本の政策動向

日本では、2000 年に高度情報通信ネットワーク社会推進戦略本部(IT 戦略本部)が設

置され、「5 年以内に世界最先端の IT 国家になること」を目指した「e-Japan 戦略」が策

定され、情報通信技術の開発推進が本格化した。

ビッグデータへの取組は、文部科学省科学研究費補助金(特定領域研究)「情報爆発時

代に向けた新しい IT 基盤技術の研究

1

」(2005 年~2010 年)や経済産業省「情報大航海

プロジェクト

2

」(2007 年~2009 年)が先鞭をつけ、2011 年 8 月 19 に閣議決定された「第

4 期科学技術基本計画

3

」の大枠の策定、IT 戦略本部が 2012 年 7 月 4 日に改定した「新

たな情報通信技術戦略工程表

4

」の公表で本格化した。

それと呼応して、各省庁からビッグデータを明記した、あるいはそれに焦点を絞った

施策が矢継ぎ早に打ち出されている。

① 日本再生戦略

5

(2012 年 7 月 30 日に閣議決定)

② IT 融合フォーラム(経済産業省が 2012 年 6 月に設置、2012 年 6 月 1 日に有識者会

議を開催し、「IT 融合フォーラム有識者会議 Kick-Off Statement」

6

を発表)

③ アカデミッククラウドに関する検討会(文部科学省が設置。「ビッグデータ時代にお

けるアカデミアの挑戦」と題した提言

7

を 2012 年 7 月に公表)

④ ビッグデータの活用に関するアドホックグループ(総務省が2012年2月に設置。2012

年 5 月 17 日に「ビッグデータの活用の在り方について

8

」を公表)

オープンデータに関する取組として、内閣に設置された「高度情報通信ネットワーク

社会推進戦略本部(IT 総合戦略本部)」により、2012 年 7 月に「電子行政オープンデー

タ戦略」がとりまとめられ、公共データの利用促進が推進されている。また、同時期に

「オープンデータ流通推進コンソーシアム」が設立され、産官学が共同でオープンデー

タ流通環境の実現に向けた基盤整備を目指している。

2. 米国の政策動向

2006 年に米国では全米科学財団(NSF:National Science Foundation)がサイバーフ

1

http://www.mext.go.jp/a_menu/shinkou/hojyo/chukan-jigohyouka/1316704.htm

2

http://www.meti.go.jp/policy/it_policy/daikoukai/igvp/index/index.html

3

http://www.mext.go.jp/a_menu/kagaku/kihon/main5_a4.htm

4

http://www.kantei.go.jp/jp/singi/it2/dai57/siryou1.pdf

5

http://www.cas.go.jp/jp/seisaku/npu/policy04/pdf/20120730/shiryo1.pdf

6

http://www.meti.go.jp/committee/summary/ipc0002/pdf/029_04_02.pdf

7

http://www.mext.go.jp/b_menu/shingi/chousa/shinkou/027/gaiyou/__icsFiles/

afieldfile/2012/07/10/1323376_1_2.pdf

8

http://www.soumu.go.jp/main_content/000160628.pdf

- 41 -

ィジカルシステムズの研究に着手し、同年 10 月 16 日と 17 日にワークショップ(NSF

Workshop on Cyber-Physical Systems)を開催している

1

。そこでは、実世界とサイバー

世界を密に連携することによって、実世界をより高度化することを目指すことが示され

た。

2011 年に大統領科学技術諮問委員会(PCAST)がオバマ大統領に提出した「ビッグデ

ータ関連技術に対する政府の投資を強化すべきである」という提言に応える形で、米科

学技術政策局(OSTP)は 2012 年 3 月に「ビッグデータ研究開発イニシアティブ」に関す

る公報

2

を発表した。これは、オバマ政権がビッグデータ関連 R&D 投資として、2 億ドル

をつぎ込むというものである。6 つの政府機関(NSF,NIH,DoD,DARPA,DoE,USGS)が

ビッグデータを取り扱うためのツールや技術の向上に向けた研究開発投資を行うとして

いる。また、2013 年 11 月には、進行中のプロジェクトの最新情報

3

が公開され、産学官

の連携の傾向が顕著に表れている。オープンデータに関する取組として、2009 年に「オ

ープンガバメント・イニシアティブ」を公表し、それに基づき Data.gov や IT ダッシュ

ボードが開設され、戦略的な取組が進展している。

3. 欧州の政策動向

欧州では、2007 年から 2013 年までの FP7(第 7 次研究枠組み計画)を策定し、その中

でビッグデータに関しては、2012 年 9 月から 2014 年 10 月まで実施される予定のプロジ

ェクトである BIG(ビックデータ官民プログラム Big Data Public Private Forum

4

)に

より推進している。FP7 は、2011 年 11 月 30 日に発表された「ホライズン 2020」に引き

継がれており、2014 年から 2020 年までの期間に以下の施策を行う

5

①成長と雇用の促進のために 800 億ユーロの研究・イノベーション投資を実施する。

②欧州イノベーション工科大学院(EIT)は、28 億ユーロの資金を受け取り、戦略的イ

ノベーション・アジェンダを実施する。

③中小企業における競争力とイノベーションの強化を図る新たな補足的プログラムに、

25 億ユーロを追加する。

オープンデータに関しては、英国において首相のリーダーシップによるオープンデー

タ戦略が進められており、政府のポータルサイトとして Data.gov.uk が 2010 年より運用

されている。これと並行して、EU の「欧州オープンデータ戦略」、フランス「単一ポー

タルによる PSI(公共部門情報)提供指針」などの取組が進展している。

4. 中国の政策動向

国家発展・改革委員会は、2012 年 12 月に「2012 年におけるハイテク・サービス業の

1

全米科学財団(NSF) Cyber-Physical Systems http://varma.ece.cmu.edu/cps/ p.1 NSF Workshop

on Cyber-Physical Systems 2006 年 10 月 16-17 日

2

Obama Administration unveils ”Big Data” Initiative: Announces $200 Million in new R&D Investments

(http://www.whitehouse.gov/sites/default/files/microsites/ostp/big_data_press_release_final

_2.pdf)

3

http://www.whitehouse.gov//sites/default/files/microsites/ostp/

Data2Action%20Announcements.pdf

4

http://big-project.eu/

5

http://www.euinjapan.jp/media/news/news2011/20111130/110000/

http://europa.eu/rapid/press-release_IP-11-1475_en.htm?locale=en

- 42 -

研究開発と産業化に関する通知」を発表し、その中の支援内容において、ビッグデータ

の処理技術の確立を促進する一環として、ビッグデータ分析ソフトウェアの開発とそれ

を活用したサービスの創出が重点的支援の対象と指定された。対象となっているのは、

先進的な 14 省市で、各地方政府は、今後 3 年間のプロジェクト実施方案と資金申請報告

を策定・提出し、国家発展・改革委員会は 2013 年上半期に、優良プロジェクトに対して

資金を支援することとしている

1

5. 韓国の政策動向

韓国では、2011 年 10 月に政府の国家情報化戦略委員会が「ビッグデータを活用した

スマート政府の実現(案)」を発表して推進中である。また、2012 年 4 月に国家主導で「ビ

ックデータ国家戦略フォーラム」を設立、韓国政府の国家情報化推進のシンクタンク韓

国情報化振興院にビックデータ戦略研究センターを新設して精力的にビックデータ利活

用の基盤を整えている。更に、2012 年 11 月末には国家情報化戦略委員会が「スマート

国家具現のためのビッグデータ・マスタープラン(以下、マスタープラン)」を発表し

た。2017 年までにビッグデータ強国となることを目標としている。

第 2 節 政策動向と特許動向、研究開発動向

特許出願件数、論文発表件数(主要国際会議発表)と主要な政策の年推移を図 5-1 に

示す。

1

総務省 平成 25 年版情報通信白書 p.151 (4)ビッグデータの戦略的活用に向けた諸外国の取組 エ中

国 licensed under CC-BY 2.1 JP http://creativecommons.org/licenses/by/2.1/jp/

- 43 -

図 5-1 主要な政策と特許出願件数、論文発表件数の推移

2000 2001 2002 2003 2004 2005 2006 2007 2008 2009 2010 2011 2012 2013 ~2015

日本

「e-Japan

戦略」発表

「i-Japan戦

略2015」

発表

米国

「競争力イニ

シアティブ」

発表

「イノベーショ

ン戦略」発表

「ビッグデー

タイニシア

ティブ」発表

欧州

中国

韓国

「u-Korea

推進戦略」

発表

「ニューIT

戦略」発表

「新成長動

力ビジョン」

発表

第2次科学技術基本計画(577イニシアティブ)(2008-2012)

国家情報化基本計画(2008-2012)

情報爆発時代に向けた新しいIT基盤技術の研究

情報大航海プロジェクト

第2期科学技術基本計画(2001-2005) 第3期科学技術基本計画(2006-2010)

国民経済と社会発展第10次5か年計画科技教育発展専門プ

ロジェクト(科技発展規画)(2001-2005)

第7次フレームワーク計画(2007-2013)

第4期科学技術基本計画(2011-2015)

第12次五か年計画(2011-2015)

国家中長期科学技術発展規画(2006-2020)

0

100

200

300

400

500

600

0

100

200

300

400

500

2000 2001 2002 2003 2004 2005 2006 2007 2008 2009 2010 2011 2012

日本 米国 欧州 中国 韓国出願人(研究者所属機関)国籍

調査期間

2000-2012年

優先権主張

2000-2011年

注)2010 年以降の特許出願件数はデータベース収録の遅れ、PCT 出願の各国移行のずれ等で全出願

データを反映していない可能性がある。

- 44 -

第第第第 6666 章章章章 総合分析と提言総合分析と提言総合分析と提言総合分析と提言

第 1 節 概要

第 2 章「市場環境」から第 5 章「政策動向」までの個別の観点からの解析データを総

合して、以下の課題領域を総合分析し、課題を明確化するとともに、今後目指すべき研

究・技術開発の方向性を提言する。

(1) 研究・技術開発の期待される企業等の属性

(2) ストック系データ前処理技術に関する方向性

(3) ストリーム系処理技術に関する方向性

(4) データ解析技術に関する方向性

(5) 分析基盤技術に関する方向性

なお、総合分析では、新規の技術開発の件数に基づいて分析することが目的に適合す

ると判断し、特許件数はファミリ単位で集計した。

第 2 節 研究・技術開発の期待される企業等の属性

1. 総合分析

ビッグデータの活用の進展に呼応して、特許出願を活発に行う企業等のタイプが変化

している可能性がある。このことを分析するために、2000 年から 2011 年までの期間中

に 30 件以上の特許出願を行っている企業・機関、及び特に注目すべき企業(アップル、

アマゾン、フェイスブック、楽天)を対象として、出願件数の推移を集計した。全期間

を4年ごとの3つの期間に区切り、各期間の出願件数及び件数比率を集計した。近年(2008

年から 2011 年までの 4 年間)の出願件数の多い順に並べた結果を図 6-1 に、近年の出願

件数比率の高い順に並べた結果を図 6-2 に示す。

なお、以下の 3 タイプの企業をユーザ系企業と定義し、企業名の頭にそれを識別する

記号を付した。

★: データ保有企業

□: 情報通信事業者

△: 情報通信機器ベンダ

記号の付されない企業は主として、データ処理関連のハードウェア製品、ソフトウェ

ア製品、あるいはプロフェッショナルサービスなどを提供するベンダ系の企業である。

出願件数順では、大手ベンダ企業がランキング上位を占めている。一方、出願件数比

率に着目すると、大量のデータを取得できる(取得している)企業がランキングの上位

を占め、近年、特許出願に注力してきていることが分かる。

記号を付した企業の特許の技術区分別の件数を図 6-3 に示す。データ保有企業はそれ

を解析するデータ解析技術に、情報通信事業者と情報通信機器ベンダはハードウェア技

術に根差した分析基盤技術にそれぞれ注力する傾向がある。これらの企業は、自企業の

強みである分析対象データを保有(利用)可能な環境を競争力の源泉とすべく、分析技

術関連の出願を増やしていると考えられる。

- 45 -

図 6-1 出願人属性別の出願動向(直近 4 年の出願件数順)

0 200 400 600 800 1,000 1,200 1,400

アイ・ビー・エム(米国)

日本電信電話

マイクロソフト(米国)

エスエイピー(ドイツ)

オラクル(米国)

ケイディーディーアイ

富士ゼロックス

ビザ(米国)

アリババ グループ(中国)

キヤノン

華為技術(中国)

韓国電子通信研究院(韓国)

エイ・ティ・アンド・ティ(米国)

アクセンチュア(アイルランド)

パナソニック

アルカテル・ルーセント(フランス)

三星電子(韓国)

リコー

沖電気

インテル(米国)

フィリップス(オランダ)

フェイスブック(米国)

出願件数

2008-2011年 2004-2007年 2000-2003年

アイ・ビー・エム(米国)

日本電気

□ 日本電信電話

日立製作所

マイクロソフト(米国)

富士通

エスエイピー(ドイツ)

東芝

オラクル(米国)

ソニー

□ ケイディーディーアイ

★ ヤフージャパン

富士ゼロックス

ヒューレット・パッカード(米国)

★ ビザ(米国)

△ 中興通訊(中国)

★ アリババ グループ(中国)

★ ヤフー(米国)

キヤノン

三菱電機

△ 華為技術(中国)

テラデータ(米国)

韓国電子通信研究院(韓国)

△ ノキア(フィンランド)

□ エイ・ティ・アンド・ティ(米国)

△ エリクソン(スウェーデン)

アクセンチュア(アイルランド)

★ グーグル(米国)

パナソニック

野村総合研究所

△ アルカテル・ルーセント(フランス)

シーメンス(ドイツ)

△ 三星電子(韓国)

ゼネラル・エレクトリック(米国)

リコー

★ アマゾン テクノロジーズ(米国)

沖電気

イー・エム・シー(米国)

インテル(米国)

△★アップル(米国)

フィリップス(オランダ)

★ 楽天

★ フェイスブック(米国)

エヌ・シー・アール(米国)

★: データ保有企業

□: 情報通信事業者

△: 情報通信機器ベンダ

出願年(優先権主張年)

注)2010 年以降の特許出願件数はデータベース収録の遅れ、PCT 出願の各国移行のずれ等で全出願

データを反映していない可能性がある。

- 46 -

図 6-2 出願人属性別の出願動向(直近 4 年の出願件数比率順)

5

42

46

37

58

46

61

33

37

41

22

504

547

74

42

277

15

405

56

68

52

36

41

635

3

172

95

138

31

1,269

43

30

57

238

307

133

1,004

183

82

71

77

71

46

56

-1,000 -500 0 500 1,000 1,500 2,000

0% 50% 100% 150% 200% 250% 300%

出願件数比率

出願件数

2008-2011年 2004-2007年 2000-2003年 総出願件数

2008年以降の出願が

50%以上

2008年以降の出願が

40%以上

★ 楽天

★ ビザ(米国)

△ 中興通訊(中国)

△ 華為技術(中国)

□ ケイディーディーアイ

★ アリババ グループ(中国)

★ ヤフージャパン

△ エリクソン(スウェーデン)

韓国電子通信研究院(韓国)

△ ノキア(フィンランド)

★ アマゾン テクノロジーズ(米国)

日本電気

□ 日本電信電話

★ ヤフー(米国)

★ グーグル(米国)

エスエイピー(ドイツ)

△★アップル(米国)

富士通

□ エイ・ティ・アンド・ティ(米国)

テラデータ(米国)

アクセンチュア(アイルランド)

△ 三星電子(韓国)

△ アルカテル・ルーセント(フランス)

マイクロソフト(米国)

★ フェイスブック(米国)

ソニー

キヤノン

富士ゼロックス

沖電気

アイ・ビー・エム(米国)

ゼネラル・エレクトリック(米国)

インテル(米国)

野村総合研究所

オラクル(米国)

東芝

三菱電機

日立製作所

ヒューレット・パッカード(米国)

パナソニック

シーメンス(ドイツ)

リコー

イー・エム・シー(米国)

フィリップス(オランダ)

エヌ・シー・アール(米国)

出願年(優先権主張年)

★: データ保有企業

□: 情報通信事業者

△: 情報通信機器ベンダ

注)2010 年以降の特許出願件数はデータベース収録の遅れ、PCT 出願の各国移行のずれ等で全出願

データを反映していない可能性がある。

- 47 -

図 6-3 ユーザ系企業の特許出願技術区分

26 9 7 6 29

54 3 2 2 3

15 8 16 11

23 4 5 1 11

24 21 1

6 2 2 1 11

1 1 1 12

4 1

1 1 2

360 23 54 10 120

26 2 15 16

21 8 10 11 8

11 3 3 1 30

15 4 4 8 13

10 5 3 23

3 2 11 4 18

12 4 3 10 12

8 5 5 6 11

★: データ保有企業

□: 情報通信事業者

△: 情報通信機器ベンダ

★ ヤフー(米国)

★ ヤフージャパン

★ アリババ グループ(中国)

★ グーグル(米国)

★ ビザ(米国)

★ アマゾン テクノロジーズ(米国)

★ アップル(米国)

★ 楽天

★ フェイスブック(米国)

□ 日本電信電話

□ ケイディーディーアイ

□ エイ・ティ・アンド・ティ(米国)

△ 中興通訊(中国)

△ アルカテル・ルーセント(フランス)

△ ノキア(フィンランド)

△ 華為技術(中国)

△ 三星電子(韓国)

△ エリクソン(スウェーデン)

データ解析 解析対象 ストック系 ストリーム系 分析基盤

技術 DB データ 処理技術 技術

前処理技術

2. 提言

『個々の企業の強みを活かせる分野でのビッグデータ分析技術の開発』

利用者にサービスを提供する企業では、日々の事業を推進する中で、利用者の行動や

サービス提供システムの運用状況などに関するデータの蓄積が、今後ますます進展して

いくことが確実である。そのようなデータは企業等の経営を推進する上での重要な資源

であり、ビッグデータを分析することが、新サービスの企画、事業運営の効率化につな

がる。ビッグデータの活用が企業の競争力の源となる。

近年は、ビッグデータを保有する企業、あるいは情報通信事業者、情報通信機器ベン

ダからの特許出願が増加する傾向を示している。特に、それぞれの企業は自社の強みを

活かせる分野(例えば、データ解析技術分野や分散基盤技術分野)に注力して、特許出

願を進めている様子がうかがえる。日本の産業が国際競争力を持つためには、これらの

事業分野の企業が利用可能なデータを活用する技術の開発を活発化する必要がある。

また、米国のビッグデータイニシアティブの下で進行中のプロジェクトは産官学の共

同の進展が明確に現れている。ビッグデータの活用の鍵の一つは多様なデータを連携さ

せた分析の実施であり、多角的な観点からのアプローチのできる推進体制の確立が日本

でも望まれる。

- 48 -

第 3 節 ストック系データ前処理技術に関する方向性

図 6-4 にストック系データ前処理技術に関する出願件数及びその内訳に関する出願件

数の推移を示す。データ変換技術は、データマイグレーション、データクレンジング、

その他のデータ変換に分類された特許の集計値である。

図 6-4 ストック系データ前処理技術-出願件数推移(技術区分別)

0

50

100

150

200

2000 2001 2002 2003 2004 2005 2006 2007 2008 2009 2010 2011

出願年(優先権主張年)

ストック系データ前処理技術(合計) データ変換技術 匿名化技術

優先権主張

2000-2011年

注)2010 年以降の特許出願件数はデータベース収録の遅れ、PCT 出願の各国移行のずれ等で全出願

データを反映していない可能性がある。

データ分析技術全体では出願件数が近年横ばい状態であるのに対し、ストック系デー

タ前処理技術に関する出願件数は 3 倍に増加している。その主要な構成要素であるデー

タ変換技術と匿名化技術の双方とも、出願件数が増加傾向にある。データ変換技術と匿

名化技術が今後も重要性を増すことを示している。

1. データ変換技術

1.1 総合分析

データ変換技術に関する出願人国籍別の特許出願件数推移、研究者所属機関国籍別論

文発表件数推移を図 6-5、図 6-6 に示す。

図 6-5 データ変換技術-出願件数推移(出願人国籍別)

0

20

40

60

80

2000 2001 2002 2003 2004 2005 2006 2007 2008 2009 2010 2011

出願年(優先権主張年)

日本 米国 欧州 中国 韓国

優先権主張

2000-2011年

出願人国籍

- 49 -

注)2010 年以降の特許出願件数はデータベース収録の遅れ、PCT 出願の各国移行のずれ等で全出願

データを反映していない可能性がある。

図 6-6 データ変換技術-論文発表件数推移(発表者所属機関国籍別)

0

5

10

15

20

2000 2001 2002 2003 2004 2005 2006 2007 2008 2009 2010 2011 2012

発表年

日本 米国 欧州 中国 韓国研究者所属機関国籍

発表年

2000-2012年

様々なデータソースからのビッグデータを分析することを考えるとデータ変換技術が

今後も重要になると考えられる。この技術分野において、特許に関しては、米国籍出願

人は出願件数を増加させており、中国籍出願人による出願件数は近年急増している。こ

れに対し、日本国籍出願人による出願件数は低迷している。国際会議での論文発表に関

しては、日本国籍機関の論文発表は極めて少なく、特許出願の低迷より更に深刻な低迷

がみられる。

1.2 提言

『多様なデータの特質を踏まえた解析のために、きめ細かなデータ前加工技術の展開』

種々のセンサなどから膨大に生成されてくる生のデータは、データ形式が不統一で、

不正確な内容(雑音)を含んだものとなる。一方で、多様なデータ源から取得したデー

タを統合して分析することで有用な知見を得ることが有望視されている。

ビッグデータ分析には、収集した生データを品質の高いデータに加工した上で解析用

データベースとして整備することが重要と認識されている。ビッグデータ分析に必要と

される労力の大半は、分析用データの整備に費やされるとされている。データ前処理に

は応用分野(ドメイン)ごとに個別の要件があり、その課題を解決する手段が必要とさ

れる。この分野での技術蓄積が、今後の応用のビジネス化に不可欠と考えられる。

出願件数では、米国籍出願人や中国籍出願人が増加し、論文発表では、米国籍、欧州

国籍が増加している中で、日本国籍は、特許、論文とも低迷している状況に鑑みると、

今後この分野の発展が望まれる。

- 50 -

2. 匿名化・秘密計算技術

2.1 総合分析

図 6-7 に匿名化技術に関する特許出願の出願人国籍別出願件数推移を示す。

図 6-7 匿名化技術-出願件数推移(出願人国籍別)

68

13 14 14

18

24

21

3028

35

27

8

14

11 11 12 12 1211 14

24

10

18

13

5

86

2

8 10

12 11

58

0 0 0 0 0 0 0 0 1 1

4

10 0 0 0 0 0 0 1

7

1 2 3

0

10

20

30

40

2000 2001 2002 2003 2004 2005 2006 2007 2008 2009 2010 2011

出願年(優先権主張年)

日本 米国 欧州 中国 韓国

優先権主張

2000-2011年

出願人国籍

注)2010 年以降の特許出願件数はデータベース収録の遅れ、PCT 出願の各国移行のずれ等で全出願

データを反映していない可能性がある。

日本国籍出願人による出願件数は増加傾向にあり、出願件数も首位を維持している。

上位出願人は、日本電気、日本電信電話、アイ・ビー・エム(米国)、日立製作所、富士

通の順である。

図 6-8 に論文発表件数の研究者所属機関国籍別発表件数推移を示す。

図 6-8 匿名化技術-論文発表件数推移(研究者所属機関国籍別)

0

2

4

6

8

10

12

2000 2001 2002 2003 2004 2005 2006 2007 2008 2009 2010 2011 2012

発表年

日本 米国 欧州 中国 韓国研究者所属機関国籍

発表年

2000-2012年

論文発表件数は特許出願の動向と異なり、日本国籍機関による論文発表は大きく低迷

- 51 -

している。上位の発表機関はパデュー大学(米国)、エイ・ティ・アンド・ティ(米国)、

ウィスコンシン大学(米国)、サイモン・フレーザー大学(カナダ)、香港中文大学(中国)、

アイ・ビー・エム(米国)である。

2.2 秘密計算技術

匿名化技術やプライバシ保護を実現するための技術として、秘密計算技術を適用した

プライバシ保護データマイニングの研究が進められている。秘密計算では、暗号技術を

用いて、暗号化データに対してデータを一切復号せずに処理・分析を行うことができる。

秘密計算を実現する有力な暗号技術として準同型暗号が知られている。このような背景

から、秘密計算・準同型暗号技術を取り上げ、その特許出願動向を調査した。

図 6-9 に秘密計算に関する特許出願件数推移を示す。なお、特許検索に当たっては該

当する特許分類コード(CPC コード)とキーワード(homomorphic encryption, secure

computation)で抽出した結果を合計した。

図 6-9 秘密計算-特許出願件数推移(出願人国籍別)

13 2 2

5

11 12

8 7

13

23

35

0

15

30

45

0

5

10

15

2000 2001 2002 2003 2004 2005 2006 2007 2008 2009 2010 2011

出願年(優先権主張年)

日本 米国 欧州 中国 韓国 全体

優先権主張

2000-2011年

出願人国籍

注)2010 年以降の特許出願件数はデータベース収録の遅れ、PCT 出願の各国移行のずれ等で全出願

データを反映していない可能性がある。

近年急速に出願件数が増加しており、日本国籍出願人が米国籍出願人、欧州国籍出願

人と共にトップ集団にいる。出願人上位には、三菱電機、マイクロソフト(米国)、日本

電気、エスエイピー(ドイツ)、日本電信電話、フィリップス(オランダ)、アイ・ビー・

エム(米国)が名を連ねている。

プライバシを保護したビッグデータ分析には秘密計算技術が重要と考えられるので、

現状の優位性を維持することが必要である。

- 52 -

2.3 提言

『ビッグデータ活用を支えるプライバシ保護技術の更なる開発強化』

データに含まれる個人情報を匿名化する技術、個人情報を開示することなくデータ処

理(マイニング)を可能とする秘密計算技術が、データの流通を活性化し、データ活用

ビジネスの拡大を促進する。

日本は匿名化技術の特許出願件数で他国をリードして 1 位を維持している。また、秘

密計算を可能とする準同型暗号技術でもトップクラスを維持している。我が国の利用者

がプライバシ保護に強い関心を示す特性

1

に呼応したものと考えられる。

現在、情報に匿名化を施して流通性を高めることを目的として、個人情報保護に関す

る法制度の整備が検討されつつある。日本では 2013 年 9 月に「パーソナルデータに関す

る検討会」が設立され、ビッグデータの利活用による新事業・新サービス創出の促進に

向けた制度やルールづくりについての検討が開始された。個人情報保護法の改正が視野

に据えられている中で、個人情報を含むビッグデータの活用の機運が高まってきている。

プライバシ保護技術の強さと法的規制のレベルが密接な関係を持つことが予想される。

匿名化レベルの多様化や流通可能な情報の増加などにより、今後、ますます重要性を増

す技術分野であり、現在の優位性をアドバンテージとして、さらに、技術開発、技術の

権利化を進めることが望まれる。

第 4 節 ストリーム系処理技術に関する方向性

1. 総合分析

図 6-10 にストリーム系処理技術に関する出願件数の推移を示す。

図 6-10 ストリーム系処理技術-出願件数推移(技術区分別)

35

40

33

4643

6063

7776 77

84

62

0

10

20

30

40

50

60

70

80

90

2000 2001 2002 2003 2004 2005 2006 2007 2008 2009 2010 2011

出願年(優先権主張年)

ストリーム系処理技術(合計) ストリームクレンジング その他のストリーム前処理

センサデータストリーム処理 テキストストリーム処理 ストリーム処理一般

優先権主張

2000-2011年

注)2010 年以降の特許出願件数はデータベース収録の遅れ、PCT 出願の各国移行のずれ等で全出願

データを反映していない可能性がある。

1

2013 年版の情報通信白書は、第 3 章第 1 節 2.(パーソナルデータの取扱いに関する利用者意識の国際比

較)において、『我が国利用者の意識の特徴をまとめると、パーソナルデータについて「どのような場合

でも公表したくない」と回答する割合は、米国・英国に比べると高めである』という調査結果を報告し

ている。

- 53 -

ストリーム系処理技術に関する出願件数は、2011 年を除いては概ね増加を続け、2000

年以降の 11 年間で 2 倍程度に増加している。数は少ないがセンサ系、テキスト系ストリ

ームの特許は、各 5 倍、10 倍となっている。

出願人国籍別の出願件数推移を図 6-11 に示す。

図 6-11 ストリーム系処理技術-出願件数推移(出願人国籍別)

13

10 10

6

12

17

12 12

16

20

13

10

16 1719

28

21

30

35

41 40

37

44

32

4

8

3

9

55 6

14

5

10 98

0 0 0 0 0 1 24 5

7 87

11

02 3 4 4

5

0

36 5

0

10

20

30

40

50

2000 2001 2002 2003 2004 2005 2006 2007 2008 2009 2010 2011

出願年(優先権主張年)

日本 米国 欧州 中国 韓国

優先権主張

2000-2011年

出願人国籍

注)2010 年以降の特許出願件数はデータベース収録の遅れ、PCT 出願の各国移行のずれ等で全出願

データを反映していない可能性がある。

米国籍出願人と中国籍出願人が出願件数の増加傾向を維持しているのに対して、他の

国・地域の出願人には伸びが認められない。件数では、米国籍出願人が他を引き離して

優位にある。日本国籍出願人は 2000 年にはほぼ米国籍出願人と同等であったが、2010

年には 3 倍強の差をつけられ、維持を続けていた 2 位の座が危うい状況になっている。

ストリーム系処理技術に関する国別の論文発表件数の推移を図 6-12 に示す。

図 6-12 ストリーム系処理技術-論文発表件数(研究者所属機関国籍別)

0

10

20

30

40

50

60

2000 2001 2002 2003 2004 2005 2006 2007 2008 2009 2010 2011 2012

発表年

日本 米国 欧州 中国 韓国研究者所属機関国籍

発表年

2000-2012年

米国籍機関からの発表が大半を占めているが、2004 年から 2009 年にかけて、40 件程

度の発表が継続した後、件数が減少傾向に転じている。

- 54 -

2. 提言

『今後の M2M、センサ時代の新たな応用に備えたストリーム系処理技術の先行開発』

今後、M2M 技術の進展やスマートシティ構想の現実化などに伴って、種々のセンサか

ら多様で膨大な量のデータが生成されることとなる。この種のデータはデータ発生源か

らリアルタイムにデータ処理系に流入する性格を持ち、データベースに蓄積されたデー

タに対する処理とは大きく異なる技術課題が存在する。課題解決に向けて、ストリーム

系処理技術として、本調査の対象期間の全般を通じて鋭意開発が進められており、特許

出願件数は増加を続けてきた。これに対し、論文発表件数は 2008 年以降減少傾向にあり、

基本技術の開発は一段落したと想定される。

ストリーム系処理技術はアプリケーション依存の要素が強いと考えられ、個別の現実

応用に向けた課題が顕在化してくることが予想される。ビッグデータ活用事例から分か

るように、今後、センサを起源とするデータの多様化と増加は不可避と考えられ、新た

なアプリケーションの出現に備えたストリーム系処理技術の開発が望まれる。

第 5 節 データ解析技術に関する方向性

1. 総合分析

図 6-13 にデータ解析技術に関する出願件数推移及びその内訳(データマイニング、テ

キストマイニング、リンクマイニング、OLAP、その他の解析技術)を示す。また、図 6-14

に出願人国籍別出願件数推移を示す。

図 6-13 データ解析技術-出願件数推移(技術区分別)

457

427 475

439

488 471

517

608 620

589

533 500

0

100

200

300

400

500

600

700

2000 2001 2002 2003 2004 2005 2006 2007 2008 2009 2010 2011

出願年(優先権主張年)

データ解析技術(合計) データマイニング一般 テキストマイニング

リンクマイニング OLAP その他の解析技術

優先権主張

2000-2011年

注)2010 年以降の特許出願件数はデータベース収録の遅れ、PCT 出願の各国移行のずれ等で全出願

データを反映していない可能性がある。

- 55 -

図 6-14 データ解析技術-出願件数推移(出願人国籍別)

214

154172

187201

185173

199

226214

170189202

220234

195 218210

246

276

248 225

202

147

1529 33 32 43 49 51 53

42 42 4834

1 3 2 3 4 9

20 33

5362

7186

5 7 8 64

810

2415

24 20 190

50

100

150

200

250

300

2000 2001 2002 2003 2004 2005 2006 2007 2008 2009 2010 2011

出願年(優先権主張年)

日本 米国 欧州 中国 韓国

優先権主張

2000-2011年

出願人国籍

注)2010 年以降の特許出願件数はデータベース収録の遅れ、PCT 出願の各国移行のずれ等で全出願

データを反映していない可能性がある。

データ解析技術に関する出願件数は、2006 年から 2008 年に 3 割増加したのち減少し

ている。出願人国籍別に見ると、米国籍出願人は 2006 年から 2007 年に増加した後減少

している。日本国籍出願人による出願件数は増減を繰り返しつつもほぼ一定数を維持し

ている。欧州国籍出願人による出願は 2007 年まで増加した後やや減少している。中国籍

出願人による出願件数が 2006 年以降急増しているのが注目される。データ解析技術に関

する出願件数が 2008 年以降減少している主な要因は、米国籍出願人による出願件数が減

少しているためである。

図 6-15 に研究者所属機関国籍別の論文発表件数推移を示す。他の技術区分と同様に、

日本国籍の機関からの発表は少ない。

図 6-15 データ解析技術-論文発表件数(研究者所属機関国籍別)

0

50

100

150

200

250

300

2000 2001 2002 2003 2004 2005 2006 2007 2008 2009 2010 2011 2012

発表年

日本 米国 欧州 中国 韓国

研究者所属機関国籍

発表年

2000-2012年

特許出願件数が 30 件以上の企業及び注目すべき企業(米国グーグル、楽天など)をベ

ンダ系及びデータを保有するユーザ系に区分して、それらの出願動向を図 6-16 及び図

6-17 に示す。

- 56 -

図 6-16 データ解析技術-ベンダ系企業の出願動向

48

41

46

53

4543

62

79

52

3845

33

47

13

29

39 40

28

34

2624 24

1213

59

13

8

18

25

30

52

36

20

15

0

20

40

60

80

100

2000 2001 2002 2003 2004 2005 2006 2007 2008 2009 2010 2011

出願年(優先権主張年)

アイ・ビー・エム(米国) マイクロソフト(米国) 日本電気

東芝 富士通 日立製作所

エスエイピー(ドイツ) 富士ゼロックス オラクル(米国)

優先権主張

2000-2011年

出願人

注)2010 年以降の特許出願件数はデータベース収録の遅れ、PCT 出願の各国移行のずれ等で全出願

データを反映していない可能性がある。

図 6-17 データ解析技術-データ保有企業の出願動向

0 0 0 0

1

2

4

6

10

8

13

10

0 0

1 1 1

0

5

6

7

1

2 2

0 0 0 0 0 0

1 1 1

9

11

1

0

5

10

15

2000 2001 2002 2003 2004 2005 2006 2007 2008 2009 2010 2011

出願年(優先権主張年)

ヤフージャパン ヤフー(米国) ビザ(米国)

グーグル(米国) アリババ グループ(中国) マスターカード(米国)

アマゾン テクノロジーズ(米国) 楽天

優先権主張

2000-2011年

出願人

注)2010 年以降の特許出願件数はデータベース収録の遅れ、PCT 出願の各国移行のずれ等で全出願

データを反映していない可能性がある。

ベンダ系企業では出願件数は多いが、経年推移でみると近年低迷傾向にある。一方、

ユーザ系の企業では、出願件数自体は少ないが、近年の出願件数が増加傾向にあり、デ

ータ解析分野の技術開発と特許出願に積極的に取り組んでいる傾向がうかがえる。

- 57 -

2. 提言

『ビッグデータ分析を広く普及させるためのデータ解析技術及び解析支援技術の開発』

大手のベンダ系企業の出願動向は停滞している状況にあるが、国際会議における論文

発表件数は概ね増加傾向を維持しており、データ保有企業等を中心として特許出願が活

発化している。この状況は、データ解析技術分野では、基本的なアルゴリズムに関する

技術の開発が一段落し、応用に関する多様な研究が進展する段階に至っていることを示

していると考えられる。

今後、データを保有する企業が自らデータ解析技術を応用していくことが望まれる。

そのためには、これらデータ解析技術に不慣れな企業がデータ解析技術を活用する際の

障壁を下げるような解析技術及び解析を支援する技術が必要となる。特に、ビッグデー

タから自動的に知識を引き出す、より高度なデータ解析技術の開発や、ビッグデータの

特性をわかりやすくデータ分析者に提示して解析を支援する技術の開発が重要性を増す

と考えられる。

日本がビッグデータ活用の産業競争で優位に立つためには、当該分野での技術開発・

特許出願の取組強化が望まれる。

第 6 節 分析基盤技術に関する方向性

1. 総合分析

図 6-18 に分析基盤技術に関する総出願件数及びその内訳の推移を示す。

図 6-18 分析基盤技術-出願件数推移(技術区分別)

286

338 385361

412

309

370

310

295

322

349

331

0

50

100

150

200

0

50

100

150

200

250

300

350

400

450

2000 2001 2002 2003 2004 2005 2006 2007 2008 2009 2010 2011

数(

訳(

類))

数(

計(

類))

出願年(優先権主張年)

分析基盤技術(合計) 分散ファイルシステム 分散データベース

分散ストレージ 分散並列処理 その他分析基盤技術

優先権主張

2000-2011年

注 1)2010 年以降の特許出願件数はデータベース収録の遅れ、PCT 出願の各国移行のずれ等で全出

願データを反映していない可能性がある。

注 2)左縦軸は分析基盤技術の合計出願件数を示し、右縦軸は内訳の件数を示す。

分析基盤技術に関する出願件数は、2004 年にピークを迎えた後減少傾向にあったが、

分散データベースと分散ファイルシステムの出願件数の伸びが支えとなって、2009 年以

- 58 -

降、増加傾向を回復している。

出願人国籍別の出願件数推移を図 6-19 に示す。

図 6-19 分析基盤技術-出願件数推移(出願人国籍別)

121

157

182

171

209

150158

129117 122 123

89

137142

171161

162

119147 129

139 129 128

110

21 23 16 19 2222 32

19 15 1928 29

0 0 2 1 2 3

7

20 1739

52

84

3 6 4 32

4

56 1

9 915

0

50

100

150

200

250

2000 2001 2002 2003 2004 2005 2006 2007 2008 2009 2010 2011

出願年(優先権主張年)

日本 米国 欧州 中国 韓国

優先権主張

2000-2011年

出願人国籍

注)2010 年以降の特許出願件数はデータベース収録の遅れ、PCT 出願の各国移行のずれ等で全出願

データを反映していない可能性がある。

他を大きく引き離して 1 位、2 位を占めていた日本と米国の出願数が減少している。

特に日本の減少が著しい。一方、中国からの出願が急増しており、日米に肉薄してきた。

国際会議への論文発表件数の要素技術区分別の推移を図 6-20 に示す。

図 6-20 分析基盤技術-論文発表件数推移(技術区分別)

30

4349

67

55

94

60

90 88 88

84

97

107

0

20

40

60

80

100

120

2000 2001 2002 2003 2004 2005 2006 2007 2008 2009 2010 2011 2012

発表年

分析基盤技術(合計) 分散データ蓄積システム 分散並列処理 その他分析基盤技術

発表年

2000-2012年

分散データ蓄積システム(分散データベース、分散ファイルシステムを含む)が年間

40 件の前後での推移を継続しているのに対し、分散並列処理技術に関する発表が増加傾

向を示している。

- 59 -

2. 提言

『ビッグデータ分析の土台となる分析基盤技術における競争力の挽回』

ビッグデータの量の増加は加速することが予想され、種々のデータ解析技術も増加へ

の対応が不可欠である。ハードウェアを多数連動させる分散並列処理に関しては、論文

発表件数が増加傾向を示しており、要の技術領域と考えられる。

分析基盤技術分野では、日本は 2004 年を頂点として米国をしのぐ特許出願件数があっ

た。その後、一転して減少傾向を示している。この背景には日本の企業がアプリケーシ

ョン提供寄りに路線を転換したことがあると推測される。しかし、基盤系は技術蓄積の

慣性が大きく、大きな後れをとると挽回は難しくなると考えられる。

特許出願件数の過去数年間の推移は微増に留まっているものの、論文発表件数の増加

を反映して、2012 年以降に出願が進展していることが推測される。データマイニングな

どのデータ解析技術を支える処理基盤として重要な意味を持つ分析基盤技術であり、こ

の領域の市場確保の観点から、特許出願件数でのトップ回帰に向けた強化が望まれる。