【kskアナリティクス】 nysol 使い方 【後編】 オープンデータ 分析 -...

14
NYSOL Partner KSK Analytics 高速に前処理するNYSOL 株式会社KSKアナリティクス 使い方 【後編】オープンデータ分析 -頻出パターンの作成・可視化- 2016/03/18

Upload: ksk-analytics-inc

Post on 21-Apr-2017

2.320 views

Category:

Data & Analytics


2 download

TRANSCRIPT

Page 1: 【KSKアナリティクス】 NYSOL 使い方 【後編】 オープンデータ 分析 - 頻出パターン の作成・可視化 -

NYSOL Partner KSK Analytics

高速に前処理するNYSOL

株式会社KSKアナリティクス

使い方

【後編】オープンデータ分析

-頻出パターンの作成・可視化-2016/03/18

Page 2: 【KSKアナリティクス】 NYSOL 使い方 【後編】 オープンデータ 分析 - 頻出パターン の作成・可視化 -

NYSOL Partner KSK Analytics © KSK Analytics Inc. 2

後編では以下のような可視化を行います。

NYSOL Bloghttp://www.nysol.biz/#!blog/c1ysn

Page 3: 【KSKアナリティクス】 NYSOL 使い方 【後編】 オープンデータ 分析 - 頻出パターン の作成・可視化 -

NYSOL Partner KSK Analytics

前編をご覧になっていない方はまずは以下をご覧下さい。

© KSK Analytics Inc. 3

NYSOL 使い方 【前編】オープンデータ分析- XMLファイルからデータ抽出・整形-http://www.slideshare.net/ksk-ada/ksk-xml

Page 4: 【KSKアナリティクス】 NYSOL 使い方 【後編】 オープンデータ 分析 - 頻出パターン の作成・可視化 -

NYSOL Partner KSK Analytics © KSK Analytics Inc. 4

前回はXMLデータをCSVに変換し、

head menu1405.csvと入力して

データの中身を確認しました。

menu1405.csvの先頭から

10行を確認出来ます。

明石高専オープンデータ「学生食堂メニュー」http://www.akashi.ac.jp/guide/opendata#cafemenu

Page 5: 【KSKアナリティクス】 NYSOL 使い方 【後編】 オープンデータ 分析 - 頻出パターン の作成・可視化 -

NYSOL Partner KSK Analytics © KSK Analytics Inc. 5

よく出現する食堂メニューの組合せを探ります。

mtra2g.rb s=0.025 tid=Date item=Namei=menu1405.csv eo=pattern.csv

と入力して下さい。

Page 6: 【KSKアナリティクス】 NYSOL 使い方 【後編】 オープンデータ 分析 - 頻出パターン の作成・可視化 -

NYSOL Partner KSK Analytics © KSK Analytics Inc. 6

mtra2g.rb (アイテム類似度グラフの構築コマンド)

s=0.025 : 最小支持度

(全トランザクション数に対する割合)

sで指定する値以上の組合せを出力

tid=Date : 日付単位で、

item=Name : メニューの組合せを探る。

i=menu1405.csv : 入力ファイル

eo=pattern.csv :出力ファイル

Page 7: 【KSKアナリティクス】 NYSOL 使い方 【後編】 オープンデータ 分析 - 頻出パターン の作成・可視化 -

NYSOL Partner KSK Analytics © KSK Analytics Inc. 7

head pattern.csvと入力して下さい。

以下のようなCSVファイルが出力されていればOKです。

先頭から

10行分

Page 8: 【KSKアナリティクス】 NYSOL 使い方 【後編】 オープンデータ 分析 - 頻出パターン の作成・可視化 -

NYSOL Partner KSK Analytics © KSK Analytics Inc. 8

「node1」、「node2」、「support」の項目列だけ

抽出します。

mcut f=node1,node2,support i=pattern.csvo=edgelist.csv

と入力して下さい。

Page 9: 【KSKアナリティクス】 NYSOL 使い方 【後編】 オープンデータ 分析 - 頻出パターン の作成・可視化 -

NYSOL Partner KSK Analytics © KSK Analytics Inc. 9

head edgelist.csvと入力して下さい。

以下のようなCSVファイルが出力されていればOKです。

先頭から

10行分

Page 10: 【KSKアナリティクス】 NYSOL 使い方 【後編】 オープンデータ 分析 - 頻出パターン の作成・可視化 -

NYSOL Partner KSK Analytics © KSK Analytics Inc. 10

メニュー全体のつながりを可視化します。

mgv.rb ei=edgelist.csv ef=node1,node2ev=support o=graph.dot

と入力して下さい。

Page 11: 【KSKアナリティクス】 NYSOL 使い方 【後編】 オープンデータ 分析 - 頻出パターン の作成・可視化 -

NYSOL Partner KSK Analytics © KSK Analytics Inc. 11

環状レイアウトで、メニューのつながりを可視化します。

circo -Tpng graph.dot > graph.png

と入力して下さい。

ダブルクリックして下さい。

Page 12: 【KSKアナリティクス】 NYSOL 使い方 【後編】 オープンデータ 分析 - 頻出パターン の作成・可視化 -

NYSOL Partner KSK Analytics © KSK Analytics Inc. 12

以下のようなものが表示されるか確認して下さい。

NYSOL Bloghttp://www.nysol.biz/#!blog/c1ysn

Page 13: 【KSKアナリティクス】 NYSOL 使い方 【後編】 オープンデータ 分析 - 頻出パターン の作成・可視化 -

NYSOL Partner KSK Analytics © KSK Analytics Inc. 13

NYSOL Communityhttp://www.nysol.biz/#!community/csv0

ご不明な点はこちらへお気軽にご質問下さい

Page 14: 【KSKアナリティクス】 NYSOL 使い方 【後編】 オープンデータ 分析 - 頻出パターン の作成・可視化 -

NYSOL Partner KSK Analytics © KSK Analytics Inc. 14

NYSOL Bloghttp://www.nysol.biz/#!blog/c1ysn

BlogではNYSOLの使い方を連載中!!