mlct #1 lt pythonでカジュアルにdeeplearning!
DESCRIPTION
MLCT #1 LT 2014/6/6 @cookpadTRANSCRIPT
PythonでカジュアルにDeepLearning!
カジュアルやまかつ 2014/6/6
MLCT #1 @ふっふはっほ
おまだれ
• やまかつ(@yamakatu)
• やってること – 検索方面 – フルスタックイクメンエンジニア
• 開発、インフラ、統計、機械学習、育児
• やってたこと – 未踏(共同開発者だけど) – Gihyo.jp連載 「Mahoutで体感する機械学習の実践」
• おごりません
東京で尻を洗う人のblog Rで1行でディープラーニング
What’s H2O 1/4 • for 機械学習
• ミドルウェア
• 操作 – Web UI – API via HTTP
• REST, JSON
• 言語非依存!! – だからみんな大好きPythonでもつかえるよ!
What’s H2O 2/4 • Java製 – java -‐jar h2o.jar –name clusterName
• DeepLearingだけじゃない! – GLM – Random Forest – PCA – K-‐Means(beta) – NaiveBayse(beta) とかとか
What’s H2O 3/4 • Hadoop対応
– MapReduce v1, v2 対応 – hadoop jar h2odriver_cdh4.jar water.hadoop.h2odriver – Hadoopを使わないMul_NodeやStandaloneも可
• On Memory – 打倒Spark! – (旧)Mahoutより断然速い
• EC2で動かす用スクリプトもあるぜよ – spot instance は未対応だけど、pythonでboto使ってるから、自分で書けばお
k(白目
• GPUは未対応 – on outlookではある
What’s H2O 4/4 • data import 対応フォーマット – csv – Gzip-‐compressed CSV – MS Excel – ARFF – SVM-‐Light – HIVE file format
• ソースはGihtubにあるよ – hdps://github.com/0xdata/h2o
Web UI でできること
• 一通りはできる – データのアップロード、分析の実行、結果確認 – Job管理、クラスタ管理、ログ閲覧 – チュートリアル
• 見た方が早いのでデモ
• 実装できない人でもマウスクリッククリックで使えてうれしいね
おすすめ資料
• 公式サイト – hdp://docs.0xdata.com/index.html
• 中の人スライド – hdp://www.slideee.com/slide/webinar-‐deep-‐learning-‐with-‐h2o
Have a nice Deep Learning !!