コンサルが知らないとまずい データ活用のテクニック ·...
TRANSCRIPT
アウトライン
ITの進展、国などが公開している統計情報の拡充
データ活用の重要性が増している
┃課題の整理
儲けにつながる イメージができない
取り組み方が 分からない
ITツールの 選択・導入が分からない × ×
2
データ活用の目的
┃データ活用の目的
データと現場の知見から課題解決の仮説を立てて、 実行可能な方策に落とし込み、効果を最大化すること。
┃主なデータ活用の場面
①(Plan):現状の把握、課題の深堀、課題解決策の検討 ②(Check):各方策の効果を検証、評価
実践と検証
3
ポイント:定量的な裏付けができる
オープンデータとGIS
┃オープンデータ
二次利用が可能な利用ルールで公開されたデータ e-stat (政府統計の総合窓口)からダウンロードできる
┃GIS ( Geographical Information System )
地図上に様々な情報を重ね合わせて表示、分析するシステム
分類 原典 概要
地図の基盤 都市計画 行政の境界線、鉄道
人口・世帯数 国勢調査 年齢、性別ごとの人口、人員別世帯数
消費支出 家計調査 品目ごとの年間購買額
4
オープンデータとGISの活用
統計情報をダウンロードして、GISソフトで開くだけで、 土地勘のないところでも、地域特性を素早く把握できる
5
町丁目 世帯数 人口
@@町1丁目 1200 3150
@@町2丁目 450 920
@@町2丁目 600 1700
GISとは
いろいろな情報を地図上に重ね合わせ、 短時間に様々な角度から可視化、分析ができます
6
GISの主な機能
7
1 情報の可視化 地図は大量の情報を視覚的に、伝えることができます。
2 情報の整理、統合 「位置」を利用して、さまざまな情報を整理・統合します。
3 情報の検索、分析 「~の近く」や 「~と重なる」などの検索が可能
GISがどこで利用されているか
8
1 災害対策
2 福祉
3 ビジネス、地域の活性化
出典:「浦安市の統合GISの取組みについて」
出典:「GISを用いた津波ハザードマップ作成マニュアル」
オープンデータ ~どこに、何があるのか?
┃e-stat (政府統計の総合窓口)
国勢調査、家計調査、経済センサスなどの統計調査の結果 地図データ
┃国土数値地図情報
インフラ、都市計画のデータ
9
画像:「http://www.e-stat.go.jp/SG1/estat/eStatTopPortal.do」
1.データ分析がどのように役に立つのか?
1 オープンデータを活用して、地域特性を把握する
2 商圏内特性から、購買力を推計する
3 商圏特性に合わせた、販促計画を立てる
4 公開されていないデータを推計する
10
ケース1:オープンデータを活用して、地域特性を把握する
診断企業訪問前の下調べ 統計情報を地図上に表示する
┃統計情報を地図上に表示する
診断企業の業種や業態により必要な情報は異なる。 「どのような統計情報が公開されているか」主なモノを紹介します。
■手順 ・下調べしたい情報にあたりをつける ・オープンデータをダウンロードする ・ダウンロードしたデータをGISソフトで開く
※地図データと統計情報の関連付けが 必要なものがある
11
ケース1:オープンデータを活用して、地域特性を把握する
年齢別、男女別人口
国勢調査(平成22年)
「年齢別(5歳階級、4区分)、男女別人口」
人員別世帯数
国勢調査(平成22年) 「世帯人員別一般世帯数」
12
ケース1:オープンデータを活用して、地域特性を把握する
昼間人口 国勢調査(平成22年) 「町丁・字等別昼間人口」 東京都公開分
産業別分布 経済センサス 基礎調査(平成21年) 「産業大分類別事業所数及び従業員数」 東京都公開分
13
ケース1:オープンデータを活用して、地域特性を把握する
小売業 年間販売額
商業統計(平成19年) 「小売業 年間販売額」 東京都公開
鉄道
(平成25年)
14
ケース1:オープンデータを活用して、地域特性を把握する
┃ケース1のポイント
統計情報をダウンロードして、GISソフトで開くだけで、 土地勘のないところでも、地域特性を素早く把握できる
※地図データと統計情報の関連付けが必要なものがある
15
町丁目 世帯数 人口
@@町1丁目 1200 3150
@@町2丁目 450 920
@@町2丁目 600 1700
ケース2:商圏内特性から、購買力を推計する
品揃えの見直し 主要品目の商圏内需要額を推計する
┃商圏内特性から、主要品目の商圏内需要額を推計する
架空のスーパー(食料品が主要品目)の商圏内需要額を推計し、 品揃えを見直すための資料を作成する。
■手順 ・商圏を設定する ・商圏内の統計情報を抽出する
・抽出された統計情報から商圏内特性を把握する ・家計消費支出と商圏内の世帯数から、 商圏内需要額を推計する
16
ケース2:商圏内特性から、購買力を推計する
┃商圏の設定
商圏を半径3Kmに設定
17
ケース2:商圏内特性から、購買力を推計する
┃商圏内データの抽出
┃商圏内データの集計
34歳未満の割合が小さい 2~3人世帯が多い 昼間に人口流失している
18
ケース2:商圏内特性から、購買力を推計する
┃商圏内の特性 (年齢、性別の人口)
34歳未満の割合が小さい
19
ケース2:商圏内特性から、購買力を推計する
┃商圏内の特性 (人員別世帯数)
2~3人世帯が多い
20
ケース2:商圏内特性から、購買力を推計する
┃商圏内の特性 (昼間夜間人口)
昼間に人口が流失している
21
昼間人口
夜間人口
ケース2:商圏内特性から、購買力を推計する
┃商圏内需要額の推計
需要推計額 = 世帯数 × 品目ごとの消費支出
22
ケース2:商圏内特性から、購買力を推計する
┃ケース2のポイント
1 設定した商圏内の統計情報を抽出・集計することで、 商圏内の特性を把握できる
2 商圏内の世帯数と家計消費支出から、 品目ごとの需要額が推計できる
23
ケース3:商圏特性に合わせた、販促計画を立てる
チラシの効果的な配布 ターゲットエリアを特定する
┃既存顧客と商圏内のターゲットの分布を比較し、ターゲットエリアを特定する
自社保有のデータと統計情報を活用して、ターゲットエリアを特定する。 ターゲットは「2~4人世帯」とする。
■手順 ・商圏を設定する ・ターゲットを選定する
・既存顧客と商圏内のターゲットの分布を比較する ・チラシ配布エリアを特定する
・チラシ配布効果を地図上に表示し、改善策を検討する
24
ケース3:商圏特性に合わせた、販促計画を立てる
┃既存顧客と商圏内のターゲットの分布を比較する
・自社保有のデータも地図上に表示することができる。 ・統計情報の絞り込みや計算結果を表示することができる。
既存顧客の分布 2~4人世帯の分布
ここにチラシを配布する
25
ケース3:商圏特性に合わせた、販促計画を立てる
┃チラシ配布効果を地図上に表示し、改善策を検討する
チラシ配布効果を地図上に表示し、効果の評価や、改善策を検討する
広告の効果
効果が低い
26
ケース3:商圏特性に合わせた、販促計画を立てる
┃ケース3のポイント
1 自社保有のデータも地図上に表示することができる
2 統計情報の絞り込みや計算結果を表示することができる
27
ケース4:公開されていないデータを推計する
町丁目単位でのデータが欲しい
回帰分析で公開されていないデータを推計する
┃公開されていないデータを回帰分析により推計する 世帯年収は市町村単位では公開されているが、町丁目単位では公開されていない。 回帰分析を用いて、持ち家比率(町丁目単位で公開されている)から世帯年収を推定する。
■手順 ・住宅・土地統計調査から、持ち家比率と世帯年収の関係をモデル化する。 ・モデルを評価する ・モデルに当該地域の持ち家比率を代入し、
町丁目単位の世帯年収を地図上に表示する
28
ケース4:公開されていないデータを推計する
┃回帰分析による、関係性のモデル化 ┃モデルの評価
決定係数が0.9676で十分高く、 有意確率は0.001以下で統計的に有意。 このモデルは十分使える!
世帯年収の推計額
住宅・土地統計調査(平姓20年)
「世帯の年間収入階級、世帯の種類、住宅所有の関係」(八王子市)を加工
29
持ち家比率
世帯年収
ケース4:公開されていないデータを推計する
┃ケース4のポイント
公開されていないデータでも、 回帰分析により、公開されているデータから推計できることもある。
30
1.データ分析がどのように役に立つのか?
GIS(電子地図)
診断企業の保有データ
・既存顧客個人情報 ・店舗別売上データ ・実勢商圏データ ・その他保有データ
オープンデータ
・人口統計データ ・昼間人口データ ・消費支出データ
1 オープンデータを活用して、地域特性を把握する
2 商圏内特性から、購買力を推計する
3 商圏特性に合わせた、販促計画を立てる
31
2.データ分析を実施するために何が必要か?
1 データ分析の目的設定
2 データ分析手法の選定とデータ分析技術
3 情報収集、蓄積するためのITツール
32
データ分析方法の選定とデータ分析技術
┃データ分析手法の選定
「活用シーン」、「分析手法」、「必要なデータ」を事前に整理しておく
┃データ分析技術の習得
・「どこまで深堀りするか」見極めが重要! ・必要なとこだけ深堀りする。
分析手法の選定
分析 結果の
解釈
理解を
深める
分析ツールのマニュアル 専門書
33
情報分析・収集ツールの紹介
情報の蓄積
データ分析ツール ・GISソフト ・データ分析ソフト
データ収集ツール ・販売データの収集 ・アクセスログの収集 ・作業実績の収集
34
GISソフトの紹介
┃GISソフトの比較
MANDARA カシミール3D ArcExplore QGIS
無料 無料 無料 無料
教育目的 展望図の作成用 閲覧機能のみ オープンソースで 拡張性が高い
┃QGISの特徴
・国、地方公共団体のGISツールとしての事例、ノウハウが多い
35
データ分析ソフトの紹介
┃データ分析ソフトの比較
Excel SPSS R SAS
- 30万円から 無料 初期62万円
使い慣れている - デファクトスタンダード
-
複雑な分析は困難
- 操作に慣れが必要
-
┃Rの特徴
・多くの情報が公開され、学習コストが低い ・分析プログラムの再利用性が高い ・操作には慣れが必要
36