webで使えるやさしい統計学
DESCRIPTION
売上報告、A/Bテストの結果検証、相関関係の数値化など、ウェブで使える統計学のご紹介!TRANSCRIPT
![Page 1: Webで使えるやさしい統計学](https://reader035.vdocuments.site/reader035/viewer/2022062405/555e7f36d8b42abd468b4a74/html5/thumbnails/1.jpg)
Webで使えるやさしい統計学2014/8/23 俺聞け9
![Page 2: Webで使えるやさしい統計学](https://reader035.vdocuments.site/reader035/viewer/2022062405/555e7f36d8b42abd468b4a74/html5/thumbnails/2.jpg)
SE、Webプログラマ、ディレクターを経てWebマーケターに。
最近の流行に乗って統計学を一から勉強中。これまで勉強してきたことを発表します。
Mharu
![Page 3: Webで使えるやさしい統計学](https://reader035.vdocuments.site/reader035/viewer/2022062405/555e7f36d8b42abd468b4a74/html5/thumbnails/3.jpg)
運営ブログ書評 日本酒
マーケティングnew!
io-diary.com sakeben.com
marketing-pandora.com
![Page 4: Webで使えるやさしい統計学](https://reader035.vdocuments.site/reader035/viewer/2022062405/555e7f36d8b42abd468b4a74/html5/thumbnails/4.jpg)
「統計学」について1. 全然わからん
2. ある程度知ってるよ
3. 結構詳しいよ
![Page 6: Webで使えるやさしい統計学](https://reader035.vdocuments.site/reader035/viewer/2022062405/555e7f36d8b42abd468b4a74/html5/thumbnails/6.jpg)
WARNING短時間で統計学の面白さを伝えるため、話をかなり単純化しています。
誤った解釈をしないためにも、後ほど紹介する参考書などを読んで、しっかり理解してから活用する事をおすすめします。
![Page 7: Webで使えるやさしい統計学](https://reader035.vdocuments.site/reader035/viewer/2022062405/555e7f36d8b42abd468b4a74/html5/thumbnails/7.jpg)
あなたはお菓子のショッピングサイト「Amaizon」のマーケティングを担当しています。広告出稿やデータ分析、売上報告などが主な業務です。
STORY
![Page 8: Webで使えるやさしい統計学](https://reader035.vdocuments.site/reader035/viewer/2022062405/555e7f36d8b42abd468b4a74/html5/thumbnails/8.jpg)
第一話平均だけで大丈夫?
![Page 9: Webで使えるやさしい統計学](https://reader035.vdocuments.site/reader035/viewer/2022062405/555e7f36d8b42abd468b4a74/html5/thumbnails/9.jpg)
製品名 総売上数 平均値
もっちり煎餅 100 10
どっしりアイス 100 10
売上報告書
2つのお菓子は同じように売れている??2014/8/1~8/10
![Page 10: Webで使えるやさしい統計学](https://reader035.vdocuments.site/reader035/viewer/2022062405/555e7f36d8b42abd468b4a74/html5/thumbnails/10.jpg)
日別の売上個数もっちり煎餅 どっしりアイス
8/1 10 28/2 10 28/3 10 78/4 10 28/5 10 28/6 10 58/7 10 08/8 10 58/9 10 108/10 10 65
![Page 11: Webで使えるやさしい統計学](https://reader035.vdocuments.site/reader035/viewer/2022062405/555e7f36d8b42abd468b4a74/html5/thumbnails/11.jpg)
「平均値」の注意点
極端に大きな値や小さな値があった場合、その影響を受けやすい
![Page 12: Webで使えるやさしい統計学](https://reader035.vdocuments.site/reader035/viewer/2022062405/555e7f36d8b42abd468b4a74/html5/thumbnails/12.jpg)
中央値とはデータを小さい順に並べ替えて、ちょうど真ん中になる数値。極端に大きい値や小さい値があっても影響を受けにくい
![Page 13: Webで使えるやさしい統計学](https://reader035.vdocuments.site/reader035/viewer/2022062405/555e7f36d8b42abd468b4a74/html5/thumbnails/13.jpg)
0 2 2 2 2 5 5 7 10 65
(2 + 5) ÷ 2 = 3.5
中央値の求め方
0 2 5 10 20
例)小 大
「どっしりアイス」の中央値
![Page 14: Webで使えるやさしい統計学](https://reader035.vdocuments.site/reader035/viewer/2022062405/555e7f36d8b42abd468b4a74/html5/thumbnails/14.jpg)
最頻値とは
データの中で最も頻繁に出現する値。一つであるとは限らない。
![Page 15: Webで使えるやさしい統計学](https://reader035.vdocuments.site/reader035/viewer/2022062405/555e7f36d8b42abd468b4a74/html5/thumbnails/15.jpg)
どっしりアイス
8/1 28/2 28/3 78/4 28/5 28/6 58/7 08/8 58/9 108/10 65
10日間の内「2」が4日を占めており、最も出現頻度が高い
最頻値の求め方
![Page 16: Webで使えるやさしい統計学](https://reader035.vdocuments.site/reader035/viewer/2022062405/555e7f36d8b42abd468b4a74/html5/thumbnails/16.jpg)
エクセルで算出
平均値 AVERAGE
中央値 MEDIAN
最頻値 MODE
![Page 17: Webで使えるやさしい統計学](https://reader035.vdocuments.site/reader035/viewer/2022062405/555e7f36d8b42abd468b4a74/html5/thumbnails/17.jpg)
データの全体像がより明確に!
売上報告書(改)製品名 総売上数 平均値 中央値 最頻値
もっちり煎餅 100個 10個 10個 10個
どっしりアイス 100個 10個 3.5個 2個
![Page 18: Webで使えるやさしい統計学](https://reader035.vdocuments.site/reader035/viewer/2022062405/555e7f36d8b42abd468b4a74/html5/thumbnails/18.jpg)
平均値と中央値に大きな差があるから、売上に偏りがあって安定していないという事か。
何が原因なのか調べてみよう。
![Page 19: Webで使えるやさしい統計学](https://reader035.vdocuments.site/reader035/viewer/2022062405/555e7f36d8b42abd468b4a74/html5/thumbnails/19.jpg)
平均値:537.2万円
中央値:432万円
平均以下60.8%
最頻値:200-300万円
参考:世帯所得の統計値
出典:平成25年 国民生活基礎調査の概況
![Page 20: Webで使えるやさしい統計学](https://reader035.vdocuments.site/reader035/viewer/2022062405/555e7f36d8b42abd468b4a74/html5/thumbnails/20.jpg)
データの散らばり具合を数値化する
標準偏差各データと平均値との差の2乗を
平均したものの平方根
![Page 21: Webで使えるやさしい統計学](https://reader035.vdocuments.site/reader035/viewer/2022062405/555e7f36d8b42abd468b4a74/html5/thumbnails/21.jpg)
標準偏差 STDEV
エクセルで算出
もっちり煎餅 0
どっしりアイス 19.6
![Page 22: Webで使えるやさしい統計学](https://reader035.vdocuments.site/reader035/viewer/2022062405/555e7f36d8b42abd468b4a74/html5/thumbnails/22.jpg)
今日の参加者年齢の平均値・中央値・最頻値・標準偏差
を見てみよう!
![Page 23: Webで使えるやさしい統計学](https://reader035.vdocuments.site/reader035/viewer/2022062405/555e7f36d8b42abd468b4a74/html5/thumbnails/23.jpg)
平均値・中央値・最瀕値・標準偏差を算出することで、データの全体像をより詳しく表すことができる
第一話のポイント
![Page 24: Webで使えるやさしい統計学](https://reader035.vdocuments.site/reader035/viewer/2022062405/555e7f36d8b42abd468b4a74/html5/thumbnails/24.jpg)
第二話A/Bテストは効果アリ?
![Page 25: Webで使えるやさしい統計学](https://reader035.vdocuments.site/reader035/viewer/2022062405/555e7f36d8b42abd468b4a74/html5/thumbnails/25.jpg)
LPのA/Bテストの結果
Bの方が効果があったと言えるのか??
CV数 CV率 訪問数
Aパターン 9,500 9.5% 100,000
Bパターン 9,600 9.6% 100,000参考:統計学が最強の学問である
![Page 26: Webで使えるやさしい統計学](https://reader035.vdocuments.site/reader035/viewer/2022062405/555e7f36d8b42abd468b4a74/html5/thumbnails/26.jpg)
A/Bの差は偶然なのか否かを「検定」する
![Page 27: Webで使えるやさしい統計学](https://reader035.vdocuments.site/reader035/viewer/2022062405/555e7f36d8b42abd468b4a74/html5/thumbnails/27.jpg)
エクセルで算出カイ二乗検定 CHITEST
偶然で差が起きる確率 = 44.7%
偶然で差が起きる確率が小さければ(慣例的には5%以下)、意味のある差があるといえる。今回の例では44.7%もあるので、偶然生まれた差の可能性が高い。
![Page 28: Webで使えるやさしい統計学](https://reader035.vdocuments.site/reader035/viewer/2022062405/555e7f36d8b42abd468b4a74/html5/thumbnails/28.jpg)
微妙な差異が出た場合は感覚で判断するのではなく、
「検定」してみよう!
第二話のポイント
![Page 29: Webで使えるやさしい統計学](https://reader035.vdocuments.site/reader035/viewer/2022062405/555e7f36d8b42abd468b4a74/html5/thumbnails/29.jpg)
第三話年齢と売上は関係アリ?
![Page 30: Webで使えるやさしい統計学](https://reader035.vdocuments.site/reader035/viewer/2022062405/555e7f36d8b42abd468b4a74/html5/thumbnails/30.jpg)
年齢と煎餅の売上には関係性がある?
年齢 売上35 1,50022 1,00045 3,10033 2,50025 1,20060 3,00041 3,00024 1,10031 2,00038 2,400
「もっちり煎餅」購入者の年齢と売上額
![Page 31: Webで使えるやさしい統計学](https://reader035.vdocuments.site/reader035/viewer/2022062405/555e7f36d8b42abd468b4a74/html5/thumbnails/31.jpg)
エクセルで算出
年齢と売上の相関係数= 0.85
相関係数 CORREL
![Page 32: Webで使えるやさしい統計学](https://reader035.vdocuments.site/reader035/viewer/2022062405/555e7f36d8b42abd468b4a74/html5/thumbnails/32.jpg)
相関係数 相関の強さ
-1 ~ - 0.7 強い負の相関
-7 ~ - 0.5 負の相関
-0.5 ~ 0.5 相関なし
0.5 ~ 0.7 正の相関
0.7 ~ 1 強い正の相関※明確な定義はない
参考:それ、根拠あるの?と言わせない データ・統計分析ができる本
相関係数と相関の強さ
![Page 33: Webで使えるやさしい統計学](https://reader035.vdocuments.site/reader035/viewer/2022062405/555e7f36d8b42abd468b4a74/html5/thumbnails/33.jpg)
参考:フォロー数とアクティブ率の関係性
初日に5人以上フォローしたユーザーは継続してサービスを使い続ける
登録から10日以内に7人以上の友人と繋がると継続率が高くなる
参考:グロースハックとは何か ?グロースハックをマスターするための究極のガイド? http://growthhack.vasily.jp/2014/05/ultimate-guide-for-growthhack/
![Page 34: Webで使えるやさしい統計学](https://reader035.vdocuments.site/reader035/viewer/2022062405/555e7f36d8b42abd468b4a74/html5/thumbnails/34.jpg)
相関関係と因果関係相関関係は2つの値に関連性があるという事を示しているだけで、一方が原因となって一方が結果になるという「因果関係」を示すことにはならない。
早起きと年収には因果関係があるか?
![Page 35: Webで使えるやさしい統計学](https://reader035.vdocuments.site/reader035/viewer/2022062405/555e7f36d8b42abd468b4a74/html5/thumbnails/35.jpg)
関連性を数値化しよう!因果関係があるかはよく見極めて
第三話のポイント
![Page 36: Webで使えるやさしい統計学](https://reader035.vdocuments.site/reader035/viewer/2022062405/555e7f36d8b42abd468b4a74/html5/thumbnails/36.jpg)
統計学の知識があると…
![Page 37: Webで使えるやさしい統計学](https://reader035.vdocuments.site/reader035/viewer/2022062405/555e7f36d8b42abd468b4a74/html5/thumbnails/37.jpg)
見えなかったものが見えてくる
![Page 38: Webで使えるやさしい統計学](https://reader035.vdocuments.site/reader035/viewer/2022062405/555e7f36d8b42abd468b4a74/html5/thumbnails/38.jpg)
同じだと思っていたものが
違って見える
![Page 39: Webで使えるやさしい統計学](https://reader035.vdocuments.site/reader035/viewer/2022062405/555e7f36d8b42abd468b4a74/html5/thumbnails/39.jpg)
明確な判断基準を持つことができる
![Page 40: Webで使えるやさしい統計学](https://reader035.vdocuments.site/reader035/viewer/2022062405/555e7f36d8b42abd468b4a74/html5/thumbnails/40.jpg)
今回お話したのは統計学のほんの一部の内容です。応用範囲はまだまだこんなものではありません。
今日話した内容を含め、統計学の活用法を「Marketing Pandora」で発信していきますので、
よかったらチェックしてみてください!
統計学の可能性
![Page 41: Webで使えるやさしい統計学](https://reader035.vdocuments.site/reader035/viewer/2022062405/555e7f36d8b42abd468b4a74/html5/thumbnails/41.jpg)
参考書籍
・統計学が最強の学問である
・とある弁当屋の統計技師
・それ、根拠あるの?と言わせない データ・統計分析ができる本
・そのABテスト正しいですか? http://kengos.jp/2013/05/13/ab-test-1.html
・Excelで平均値・中央値・最頻値を算出する方法 http://allabout.co.jp/gm/gc/385277/
・平成25年 国民生活基礎調査の概況 http://www.mhlw.go.jp/toukei/saikin/hw/k-tyosa/k-tyosa13/
参考サイト
・グロースハックとは何か ?グロースハックをマスターするための究極のガイド? http://growthhack.vasily.jp/2014/05/ultimate-guide-for-growthhack/