協調フィルタリングとコンテンツ分析を利用した 観光地推薦手法 … ·...

14
論文 協調フィルタリングとコンテンツ分析を利用した 観光地推薦手法の検討 Recommendation System of Tourist Site Using Collaborative Filtering Method and Contents Analysis Method 樽井勇之 TARUI Yuji 抄録 本論文では、協調フィルタリング法の利点とコンテンツ分析法の利点を組み合わせた観光地推 薦手法の基本的なアイデアについて述べた。本観光地推薦システムでは、(1)観光地の特徴を最 もよく表している観光特性を要素にもつ観光地特徴ベクトル、(2)利用者による旅行履歴を要素 にもつ利用者履歴ベクトル、(3)利用者が旅行先の選定に重視してきた観光特性を要素にもつ利 用者特徴ベクトルを利用している。観光地特徴ベクトルの生成では、コンテンツ分析法の考え方を 取り入れ、観光地のもつ観光特性の要素を試験的に16 の要素で表現してみた。利用者履歴ベクト ルの生成では、利用者にこれまでの旅行履歴を簡易に入力させるため、操作性を考慮したインタ フェースを Ajax の技術により試作した。利用者特徴ベクトルの生成では、観光地特徴ベクトルと 利用者履歴ベクトルから自動計算して求めるようにした。これらのベクトル生成をもとに、協調 フィルタリングの考え方を取り入れ、利用者間の類似度から旅行計画者の嗜好に合った観光地を 推薦するものである。 キーワード 観光地、情報推薦システム、協調フィルタリング法、コンテンツ分析法、Web アプリケーション (受付 2011 年 1 月 11 日、オンライン公開 2011 年 7 月 18 日) 1.はじめに 電子的な商取引(電子商取引)の急速な普及により、インターネット上の e コマースに おける商店では様々なサービスが展開されるようになってきている [1] 。中でも情報推薦シ ステムは、膨大な商品群の中から適当な商品を適切な時期に推薦してくれるサービスとし てその利用が期待されている。情報推薦システムは、リコメンダシステム(Recommender System)あるいはリコメンデーションシステム(Recommendation System)とも呼ばれ、 上武大学経営情報学部紀要 2011 第 36 号 p.1-14 1

Upload: others

Post on 08-Sep-2020

1 views

Category:

Documents


0 download

TRANSCRIPT

論文

協調フィルタリングとコンテンツ分析を利用した観光地推薦手法の検討

Recommendation System of Tourist SiteUsing Collaborative Filtering Method and Contents Analysis Method

樽井勇之TARUI Yuji

 

抄録

 本論文では、協調フィルタリング法の利点とコンテンツ分析法の利点を組み合わせた観光地推

薦手法の基本的なアイデアについて述べた。本観光地推薦システムでは、(1)観光地の特徴を最

もよく表している観光特性を要素にもつ観光地特徴ベクトル、(2)利用者による旅行履歴を要素

にもつ利用者履歴ベクトル、(3)利用者が旅行先の選定に重視してきた観光特性を要素にもつ利

用者特徴ベクトルを利用している。観光地特徴ベクトルの生成では、コンテンツ分析法の考え方を

取り入れ、観光地のもつ観光特性の要素を試験的に 16の要素で表現してみた。利用者履歴ベクト

ルの生成では、利用者にこれまでの旅行履歴を簡易に入力させるため、操作性を考慮したインタ

フェースをAjax の技術により試作した。利用者特徴ベクトルの生成では、観光地特徴ベクトルと

利用者履歴ベクトルから自動計算して求めるようにした。これらのベクトル生成をもとに、協調

フィルタリングの考え方を取り入れ、利用者間の類似度から旅行計画者の嗜好に合った観光地を

推薦するものである。

キーワード

 観光地、情報推薦システム、協調フィルタリング法、コンテンツ分析法、Webアプリケーション

(受付 2011 年 1月 11 日、オンライン公開 2011 年 7月 18 日)

1.はじめに

 電子的な商取引(電子商取引)の急速な普及により、インターネット上の eコマースに

おける商店では様々なサービスが展開されるようになってきている[1]。中でも情報推薦シ

ステムは、膨大な商品群の中から適当な商品を適切な時期に推薦してくれるサービスとし

てその利用が期待されている。情報推薦システムは、リコメンダシステム(Recommender

System)あるいはリコメンデーションシステム(Recommendation System)とも呼ばれ、

上武大学経営情報学部紀要 2011 第 36 号 p.1-14 1

CACM[2]で紹介され広く知られるようになった。情報推薦システムにおける典型的な情報

推薦手法として協調フィルタリング法(Collaborative Filtering Method)とコンテンツ分

析法(Contents Analysis Method)がある[3]。協調フィルタリング法は、消費者情報を重

視して同じ好みを持つコミュニティを生成し、利用する方式としてAmazon.com[4]などで

利用されている。コンテンツ分析法は、商品データの分析情報を重視して適切と思われる

商品を推薦する方式であり TwinFinder[5]への適用例が報告されている。協調フィルタリ

ング、コンテンツ分析ともにそれぞれ利点、欠点があるため、両者を融合したハイブリッ

ド法(Hybrid method)[6]なども提案されている。

 一方、eコマースにおける商店では扱う商品が多岐に渡ってきており、情報推薦の対象と

なる商品も書籍などの有形のものから、情報提供サービスなどの無形なものへとその広が

りを見せている。旅行計画や出張計画などで利用されるインターネット上の観光情報も、

無形な情報提供サービスとして広く有効活用されている。これらの観光情報には、各地の

観光協会により公式に提供されるものもあれば、旅行経験者によりブログなどを通じて非

公式に提供される情報などさまざまなものがある。これから旅行を計画する者(以下、旅

行計画者と呼ぶ)は、インターネット上のサーチエンジンなどを通じてこれらの情報を集

め、自らの判断により多くの時間を費やして旅行先や宿泊先を決めているのが現状である。

これらの問題に対処するため、具体的な願望をもたないユーザに適切な旅行先を薦める観

光地推薦システム[7]や、観光客や地域の個人が情報発信する情報をもとに、個人の嗜好を

考慮した情報推薦を実現する観光情報システム[8]なども研究されるようになってきた。

 本論文では、協調フィルタリング法の利点とコンテンツ分析法の利点を組み合わせた観

光地推薦手法の基本的なアイデアについて述べている。旅行計画者の嗜好に合った観光地

を推薦するためには、観光地の持つコンテンツ情報を正確に分析・表現しなければならな

い。本研究では、観光協会などの観光地提供者側に観光情報の入力を委ねることにより、

システムにおける観光情報の充実と信頼性を図る方針とした。一方、利用者による旅行経

験を重視して旅行計画者と同じ嗜好を持つコミュニティを生成・利用するためには、利用

者にこれまでの旅行履歴を入力してもらう必要がある。しかし、観光地にはあらゆる観光

特性が含まれ関連してくる場合があるので主観的な評価を詳細に入力させることは煩わし

い。本論文で観光特性とは、観光地が持つ歴史、文化、自然景観などの遊覧資産のことを

指す。また、システム利用を促進するためにはできるだけ入力項目を軽減する必要がある。

本研究において提案する観光地推薦システムでは、利用者にこれまでに旅行したことのあ

る観光地を、地方行政単位ごとにチェックしてもらうだけの簡単な入力とした。このよう

に、観光地提供者により入力された観光地情報と、利用者により入力された旅行履歴情報

上武大学経営情報学部紀要 2011 第 36 号 p.1-142

をもとに、旅行計画者と同じ嗜好を持つ利用者との類似度を利用することにより、適切な

観光地を推薦するものである。

 以下、2章では観光地推薦の目的や、推薦の対象となる観光地における観光特性を表す要

素について述べ、3章では本研究において利用するベクトル空間モデルにおける特徴表現、

4章では検討する観光地推薦システムのアイデアについて述べ、5章で試作実験と考察を

行い、6章でまとめを行う。

2.観光地推薦

2.1 本研究の目的

 本研究では、観光地を主な推薦先とする。観光地とは、ウィキペディア[9]で定義されて

いる「観光旅行、つまりツーリズムと呼ばれる保養、遊覧を目的とした旅行に対して、歴

史・文化・自然景観などの遊覧資産を持ち、交通機関や宿泊施設などで観光客の受け入れ

を行える地域」とする。旅行計画者は、旅行先となる観光地を決定後、観光地周辺に広が

る宿泊施設や娯楽施設、飲食施設などの利用先を決定するという手順を取るものとする。

従って、旅行計画者の趣味嗜好に合った観光地の推薦と併せて、観光地周辺の宿泊施設や

娯楽施設、飲食施設の推薦もできれば便利なサービスとなる。本研究では、手始めとして

観光地の推薦ができる観光地推薦システムのプロトタイプを開発することを目的とした。

2.2 観光地における観光特性

 本観光地推薦システムでは、観光地を主な推薦先とするため、観光地の情報を集めた観

光地データベースが必要となる。観光地の情報は観光地提供者に入力を促す仕組みを想定

するが、今回は、プロトタイプとしてウィキペディアにおける「日本の観光地の一覧」[10]

のデータを基本情報として利用する。ウィキペディアに掲載される日本の観光地の一覧は、

日本における観光地を地方行政単位ごとに分類しており、各観光地ごとに観光地の特徴を

最もよく表しているキーワードが括弧書きで付されている。そこで、この括弧書きで付さ

れているキーワードを観光地の特徴を最もよく表す観光特性の要素として利用することに

した。抽出した観光特性の要素を表 1に挙げる。

表 1 観光特性の要素一覧

自然 保養(地) 海水浴 レジャー

歴史遺産 文化(施設) スポーツ 農村風景

町並 温泉 山寺(社寺) 建造物

避暑地 別荘地 特産 グルメ(味覚)

上武大学経営情報学部紀要 2011 第 36 号 p.1-14 3

3.ベクトル空間モデルにおける特徴表現

3.1 概要

 本観光地推薦システムでは、観光地の特徴を最もよく表している観光特性を要素として

もつベクトルを観光地特徴ベクトルとして表現する。また、利用者による旅行経験を重視

して旅行計画者と同じ嗜好をもつ利用者の類似度を利用するため、利用者による旅行履歴

を利用者履歴ベクトルとして表現する。さらに、利用者が旅行先の選定にどのような観光

特性を重視してきたのかを表現する利用者特徴ベクトルを、利用者履歴ベクトルと観光地

特徴ベクトルをもとに自動計算して求める。以下では、観光地特徴ベクトル、利用者履歴

ベクトル、利用者特徴ベクトルの各特徴表現について詳しく述べる。

3.2 観光地特徴ベクトル

 本観光地推薦システムが旅行計画者に対して適切かつ有用な観光地を推薦するには、観

光地の特徴が正確かつ十分に表現されていなければならない。一方、観光地にはあらゆる

観光特性が含まれ関連してくる場合があるので、単純にその特徴を一つのキーワードで分

類することは難しい。そこで、観光地の特徴表現にベクトル空間モデル(多次元的表現)[11]

の考え方を導入する。ベクトル空間モデルは、情報検索における代表的な検索モデルとし

て知られており、文書および検索質問を多次元のベクトルという中間的な媒体により表現

したものである。例えば、観光地の特徴を表す要素として{自然、保養、レジャー、文化、

歴史遺産、グルメ}を採用した場合を考える。観光地の持つコンテンツ情報を正確に分析

してコンテンツ分析法による利点を取り入れるためには、観光地の特徴を把握している者

に特徴ベクトルを表現してもらう必要がある。本研究では、観光地の持つコンテンツ情報

の分析を、観光協会などの観光地提供者に委ねることにより、システムにおける観光地情

報の充実と観光地の特徴表現の信頼性を期する方針としている。観光地の一例として、関

東地方における草津[10]を考えたとき、観光地提供者が草津には自然と保養の二つの特徴が

代表的な要素であると分析したとする。観光地の特徴を表す各要素を 0(関係なし)と 1(関

係あり)の 2値で表現してみると、草津の観光地特徴ベクトルは(1,1,0,0,0,0)と表現で

きる。この 2値の表現により草津に含まれる代表的な観光特性をあらかじめ表現できたこ

とになる。観光地特徴行列を とすると、観光地 の観光特性を表す観光地特徴ベクトル

……(1)

と表現できる。ここで、 は観光地の観光特性を表す要素数を表す。観光地特徴行列の一例

を表 2に示す。

上武大学経営情報学部紀要 2011 第 36 号 p.1-144

表 2 観光地特徴行列( )

観光特性

観光地自然 1 保養 2 レジャー 3 文化 4 歴史遺産 5 グルメ 6

草津 1 1 1 0 0 0 0渋川 2 1 1 0 0 0 0佐野 3 1 0 0 0 1 0桐生 4 1 0 0 1 1 0山の内 5 1 1 1 0 0 0

3.3 利用者履歴ベクトル

 本観光地推薦システムは、利用者による旅行経験を重視して、旅行計画者と同じ嗜好を

持つ利用者の類似度を計算し、旅行先を推薦する。そこで、協調フィルタリングの手法を

導入する。類似度の計算に必要となる利用者履歴行列を とすると、利用者 による利用

者履歴ベクトル は

……(2)

と表現できる。ここで、 は観光地推薦システムに登録されている観光地の総数である。

( =1… )が取る値は 0(訪問なし)と 1(訪問あり)の 2値で表現することにした。

利用者履歴行列の利用により、旅行計画者と同じ嗜好を持つ利用者に訪問履歴があり、旅行

計画者が訪問したことのない観光地を推薦できる。利用者履歴行列の一例を表 3に示す。

表 3 利用者履歴行列( )

観光地

利用者草津 1 渋川 2 佐野 3 桐生 4 山の内 5

Aさん 1 1 1 0 1 0Bさん 2 0 1 1 1 1Cさん 3 1 1 1 0 1Dさん 4 0 1 1 1 1Eさん 5 1 1 1 1 1

3.4 利用者特徴ベクトル

 本観光地推薦システムが旅行計画者の嗜好に合った観光地を推薦するためには、利用者

の特徴をあらかじめ正確に分析して表現できなければならない。本研究では、利用者 によ

る利用者特徴ベクトル を、利用者履歴行列 と観光地特徴行列 をもとに自動的に計

上武大学経営情報学部紀要 2011 第 36 号 p.1-14 5

算することにした。ここで、利用者の特徴とは、訪れたことのある観光地に含まれる観光

特性のうち、今までどの観光特性を最も多く含んでいたかによって表現することにした。

つまり、訪れた観光地に含まれている観光特性が多ければ多いほど、利用者の意識とは関

係なく利用者の嗜好を表していると考えた。例えば、利用者 の利用者特徴ベクトル が

{自然、保養、レジャー、文化、歴史遺産、グルメ}={0.43, 0.29, 0.00, 0.14, 0.14, 0.00}

であれば、自然や保養を好み、レジャーやグルメを重視しない利用者であることが表現で

きる。このように利用者履歴行列 と観光地特徴行列 をもとに利用者特徴ベクトル

を計算することにより、利用者が旅行先を選定するに当たりどのような要素を重視してき

たのかを分析・表現することができる。利用者特徴ベクトル の計算手順を以下に述べる。

 まず、式(3)により利用履歴行列 と観光地特徴行列 から利用者特徴行列 を計算

する。

=  ……(3)

式(3)により各利用者ごとの、訪問した観光地の観光特性を表す各要素の頻度が計算でき

る。各利用者の特徴ベクトルを比較判断して、同じ嗜好を持つ利用者の類似度を計算する

ためには、各利用者による各要素の構成割合を計算して正規化する必要がある。そこで、

利用者 による利用者特徴ベクトル を式(4)~(5)により計算することにした。

……(4)

……(5)

ここで、 は観光地の観光特性を表す要素数を表す。利用者特徴行列の一例を表 4に示す。

表 4 利用者特徴行列( )

観光特性

利用者自然 1 保養 2 レジャー 3 文化 4 歴史遺産 5 グルメ 6

Aさん 1 0.43 0.29 0.00 0.14 0.14 0.00Bさん 2 0.40 0.20 0.10 0.10 0.20 0.00Cさん 3 0.44 0.33 0.11 0.00 0.11 0.00Dさん 4 0.40 0.20 0.10 0.10 0.20 0.00Eさん 5 0.42 0.25 0.08 0.08 0.17 0.00

上武大学経営情報学部紀要 2011 第 36 号 p.1-146

4.観光地推薦システムの検討

4.1 概要

 本観光地推薦システムは、Webアプリケーションとして設計し、観光地特徴ベクトル、

利用者履歴ベクトル、利用者特徴ベクトルにより、旅行計画者に対して適切かつ有用な観

光地を推薦する。本観光地推薦システムにおける処理の概念図を図 1に示す。まず、観光

情報提供者は観光地推薦システムに観光地情報を入力する。入力された観光地情報は観光

地データベース(観光地DB)に登録される。観光地推薦システムを利用する利用者は、こ

れまでの旅行履歴を入力する。入力された利用者情報は利用者データベース(利用者DB)

に登録される。観光地推薦システム内部では、利用者情報と観光地情報をもとに各種ベク

トル計算を行う。さらに、各利用者の利用者特徴ベクトルをもとに類似度計算を行う。旅

行計画者は、推薦先として希望する地方名などの条件を入力する。システム側は、旅行計

画者と同じ嗜好を持つ利用者の旅行履歴情報をもとに推薦する観光地を抽出し、観光地推

薦リストを生成する仕組みとなっている。

4.2 観光地情報入力

 観光地情報を入力する「観光情報入力フォーム」を図 2に示す。観光情報入力フォーム

は、観光地についての信頼度の高い情報を提供する観光協会等に入力してもらうことを想

定している。従って、地方名称、観光地名といった基本情報の他に、観光協会の名称や観

光協会の所在地情報、観光協会が公開しているWebページのURLを入力できるようにし

上武大学経営情報学部紀要 2011 第 36 号 p.1-14 7

図 1 観光地推薦システムにおける処理の概念図

ている。また、観光地を紹介するためのコメント欄を設けることにより、観光地推薦リス

トを生成する際に、観光地名と併せて、観光地の紹介文を付加することができる。これに

より、旅行計画者に分かりやすい観光地情報を提供できる。さらに、観光地が持つ観光特

性を表現するため、表 1に示した観光特性の要素をチェックボックスのインタフェースを

用いて入力してもらうことにした。観光情報提供者は、提供する観光地情報が持つ代表的

な要素にのみチェックマークを付けるだけでよい。このような方法により、観光地の持つ

観光特性を多次元的に表現できるので観光地特徴ベクトルを生成することができる。

4.3 利用者情報入力

 利用者にこれまでの旅行履歴を入力させることを考えた場合、観光地名や旅行地名を文

字で入力させることは煩わしく手間がかかる。また、日本全国にある観光地名や旅行地名

を何ら分類もせず、すべて表示させてチェックさせることも膨大にあるため非現実的であ

る。円滑な情報入力を促すためには、操作性を考慮したインタフェースを持ち、観光地情

報が分かりやすく整理・表示されていなければならない。

上武大学経営情報学部紀要 2011 第 36 号 p.1-148

図 2 観光情報入力フォーム

 本観光地推薦システムでは、4.2 で登録された観光地情報をもとに利用者への旅行履歴

入力を促す。操作性を考慮したインタフェースとするため、プルダウンメニューとチェッ

クボックスを基本インタフェースとして、Ajax(Asynchronous JavaScript + XML)[12]の

技術を使った画面遷移を伴わない「利用者情報入力フォーム」を設計した。まず、利用者

はプルダウンメニューを使って表 5に示す地方行政単位の 9分類された地方名称を選択

する。利用者情報入力フォームには、Ajax の非同期通信により地方名称の選択と同時に、

地方行政単位に分類された観光地一覧表が画面遷移なく表示される。次に利用者は、観光

地名とコメントにより旅行経験のある観光地名の「訪問」の列にあるチェックボックスに

チェックを付けてゆき、最後に「登録」ボタンを押すだけでよい。さらに、旅行経験のあ

る地方名称だけを繰り返し選択し、旅行経験のある観光地名にチェックを付けて登録して

ゆけば利用者履歴ベクトルが自動的に生成される。

表 5 地方行政単位

地方No 地方名称 都 道 府 県

1 北海道 北海道

2 東北地方 青森県、岩手県、宮城県、秋田県、山形県、福島県

3 関東地方 茨城県、栃木県、群馬県、埼玉県、千葉県、東京都、神奈川県

4 中部地方 新潟県、富山県、石川県、福井県、山梨県、長野県、岐阜県、静岡県、愛知県

5 近畿地方 滋賀県、京都府、奈良県、三重県、和歌山県、大阪府、兵庫県

6 中国地方 鳥取県、島根県、岡山県、広島県、山口県

7 四国地方 徳島県、香川県、愛媛県、高知県

8 九州地方 福岡県、佐賀県、長崎県、熊本県、大分県、宮崎県、鹿児島県

9 沖縄地方 沖縄県

4.4 観光地推薦アルゴリズム

 本システムにおける観光地推薦リストの生成は、観光地特徴ベクトルと利用者履歴ベク

トルをもとに、利用者特徴ベクトルを生成して行われる。観光地の推薦を希望する旅行計

画者の利用者特徴ベクトルが求められれば、旅行計画者の趣味嗜好に合った観光地の一覧

を表示することができる。

 観光地推薦リストを生成する観光地推薦アルゴリズムの手順を以下に説明する。

(1)観光地特徴行列 、利用者履歴行列 から、利用者特徴行列 を作成する。

 (1-1)観光地情報から観光地特徴行列 を作成

上武大学経営情報学部紀要 2011 第 36 号 p.1-14 9

 (1-2)利用者情報から利用者履歴行列 を作成

 (1-3)観光地特徴行列 と利用者履歴行列 から利用者特徴行列 を作成

 (1-4)利用者特徴行列 を正規化

(2)利用者特徴行列 をもとに類似度の高い利用者を探す。

 (2-1)式(6)により利用者 と利用者 の類似度 を計算

……(6)

 ここで、 と は、それぞれ利用者 と利用者 の利用者特徴ベクトルの平均を示す。

 (2-2)旅行計画者と、他の利用者との類似度を比較し、類似度の高い順にソートした配

列を作成

(3)類似度の高い利用者(以下、類似利用者)の情報をもとに、利用者履歴行列 から、

旅行計画者がまだ訪れたことのない観光地を推薦する。

 (3-1)旅行計画者に訪問履歴がなく、類似利用者に訪問履歴がある観光地を推薦観光地

として登録

 (3-2)類似利用者順に、順位を付けて観光地推薦リストをテーブル化して表示

 以上により、観光地推薦リストを生成し、推薦NO、地方名、観光地名、コメントを画面

上に出力する。

5.試作実験

5.1 観光地情報

 本実験では、提案システムの操作性を主に判断するため、ウィキペディアにおける「日

本の観光地の一覧」[10]のデータを利用する。本データは、日本における観光地を地方行政

単位ごとに 10分類してある。このうち、表 5に示す 9単位を大分類として利用する。各大

分類ごとに、30から 50の観光地名が小分類として入力されているので、各大分類ごとに

旅行履歴の入力を促すことを考えても、決して利用者の負担となるような数とはならない。

図 3に、4.3 で述べた「利用者情報入力フォーム」のユーザインタフェースを示す。

5.2 観光地推薦

 観光地推薦リストの試作実験では、観光地推薦リストのインタフェースデザインを検証

する。観光地の推薦は、4.4 で述べた観光地推薦アルゴリズムにより行う。図 4に示すよう

に旅行計画者に表示する観光地推薦リストは、表 5に示す地方行政単位ごとに推薦観光地

を出力できるように、チェックボックスを使ったインタフェースとした。観光地推薦リス

上武大学経営情報学部紀要 2011 第 36 号 p.1-1410

上武大学経営情報学部紀要 2011 第 36 号 p.1-14 11

図 3 利用者情報入力フォーム(地方名:「北海道」を選択したとき)

図 4 観光地推薦リスト

トについてもAjax の非同期通信の技術を利用する。推薦先を希望する地方名をチェック

ボックスで選択後、送信ボタンを押下することにより、推薦観光地一覧表が画面遷移なく

表示される。一覧表に表示される項目は、推薦NO、地方名、観光地名、コメントである。

観光地名にはリンクが張られているので、観光地が持つWebページを閲覧できる。

5.3 考察

 本試作実験では、観光地情報としてウィキペディアにおける「日本の観光地の一覧」[10]

のデータを利用し、利用者情報入力フォームと観光地推薦リストのインタフェースをデザ

インしてみた。

 利用者情報入力フォームについては、日本の観光地の一覧を表 5に示す 9分類として、

利用者の旅行履歴を入力させるように設計している。本実験で利用したウィキペディアの

観光情報は分かりやすく整理されていることもあり、各地方行政単位であれば利用者にス

クロール操作をあまりさせることなく入力を促すことができる。実運用においては、各地

の観光協会等に観光地情報を入力してもらうことを考えると、観光地情報の偏りや分類上

の粒度の問題が生ずる可能性がある。そのため、入力された観光地情報をもとに人手で分

類し直すか、アルゴリズムを使って分類するか、の 2つの方法を検討する必要がある。

 観光地推薦リストのユーザインタフェースについては、推薦リストを全国、地方行政単

位に分けて出力できるように設計してみた。本推薦アルゴリズムでは、観光地が持つ要素

をコンテンツ分析の考え方により利用し、嗜好の近い利用者の旅行履歴を協調フィルタリ

ングの考え方により利用しているため、登録されている観光地情報や、利用者情報の信頼

性や情報量に大きく左右される。そのため、利用者に入力を促す利用者情報入力フォーム

については、できるだけ多くの利用者に、旅行履歴を手軽に入力してもらうような工夫が

必要となる。最近は、旅行代理店なども顧客の旅行履歴を管理し、利用者が所有する携帯

電話などでも行動履歴を収集できるようになっている。しかし、旅行後に旅行者が満足し

たのか、そうでないのかの情報収集は難しい。そのため、このようなシステムを検討する

場合、旅行履歴のある観光地の満足度をどのように収集するかによって利用価値が左右さ

れるものと考えられる。

6.まとめ

 本論文では、協調フィルタリング法の利点とコンテンツ分析法の利点を組み合わせた観

光地推薦手法の基本的なアイデアについて述べた。本観光地推薦システムでは、(1)観光

地の特徴を最もよく表している観光特性を要素にもつ観光地特徴ベクトル、(2)利用者に

よる旅行履歴を要素にもつ利用者履歴ベクトル、(3)利用者が旅行先の選定に重視してき

上武大学経営情報学部紀要 2011 第 36 号 p.1-1412

た観光特性を要素にもつ利用者特徴ベクトルを利用している。観光地特徴ベクトルの生成

では、コンテンツ分析法の考え方を取り入れ、観光地のもつ観光特性の要素を試験的に 16

の要素で表現してみた。利用者履歴ベクトルの生成では、利用者にこれまでの旅行履歴を

簡易に入力させるため、操作性を考慮したインタフェースをAjax の技術により試作した。

利用者特徴ベクトルの生成では、観光地特徴ベクトルと利用者履歴ベクトルから自動計算

して求めるようにした。これらのベクトル生成をもとに、協調フィルタリングの考え方を

取り入れ、利用者間の類似度から旅行計画者の嗜好に合った観光地を推薦するものである。

 今後の課題として、

(1)観光地の特徴を表現するための観光特性の要素についての検討

(2)利用者の旅行満足度の収集と観光地情報の収集についての検討

(3)観光地推薦アルゴリズムの妥当性の検証と利用者テストの実施

が挙げられる。

参考文献

[1]菅坂玉美、横尾真、寺野隆雄、山口高平:eビジネスの理論と応用、東京電機大学出版局(2003).

[2]P. Resnick, and H. Varian,: Recommender Systems, Comm. Of the ACM, Vol.40, No.3,

pp.56-58 (1997).

[3]寺野隆雄:Web上の情報推薦システム、情報処理、Vol.44, No.7, pp.696-701(2003).

[4]Amazon.com : http://www.amazon.com

[5]Hirooka, Y., Terano, T. and Otsuka, Y.: Extending Content-Based Recommendation by

Order-Matching and Cross-Matching methods, In Bauknecht, K., Madria, S.K. and Per-

nul, G. (eds.) : Electronic Commerce and Web Technologies, 1st Int. Conf., EC-Web

2000, Springer Lecture Notes in Computer Science LNCS-1875, pp.177-190 (2000).

[6]Balabanovic, M. and Shoham, Y. : Fab: Content-based Collaborative Recommendation,

Comm. Of the ACM, Vol.40, No.3, pp.66-72 (1997).

[7]藤本和則、島津光伸:DSIU:ネットユーザのための意思決定支援、人工知能学会誌、17巻 2

号 SP-A, pp.162-165(2002).

[8]山下晃弘、川村秀憲、大内東:利用者主導による主観と客観を考慮した個人向け観光情報推

薦システム、観光と情報、4(1)(通号 4), pp.44-56(2008).

[9]ウィキペディア http://ja.wikipedia.org/ 「観光地」(2010 年 9月現在)

[10]ウィキペディア http://ja.wikipedia.org/ 「観光地一覧」(2010 年 9月現在)

[11]北研二、津田和彦、獅々堀正幹:情報検索アルゴリズム、共立出版、2002

[12]http://www.adaptivepath.com/ideas/essays/archives/000385.php(2011 年 1月 4日現在)

上武大学経営情報学部紀要 2011 第 36 号 p.1-14 13

Recommendation System of Tourist Site

Using Collaborative Filtering Method and Contents Analysis Method

TARUI Yuji

Abstract

  This paper describes a recommendation system of tourist site using collaborative filtering

method and contents analysis method. This system uses three vectors. (1) The tourist site

vector has elements which are expressed tourist resources such as nature, recreation, and so

on. (2) The travel history vector has elements which are weighted based on user's travel ex-

perience. (3) The feature vector of users has elements which are weighted based on user's

favorite tourist resources. The feature vector of user is calculated automatically using the

tourist site vector and the travel history vector. The system recommends tourist site from

similarity calculation between a travel planner and other users.

Key words and phrases

 Tourist site, Recommendation System, Collaborative Filtering Method, Contents Analysis

Method, Web application

上武大学経営情報学部紀要 2011 第 36 号 p.1-1414