akira shibata at developer summit 2016

37
エンジニアなら使える深層学習 TensorFlowDataRobotで機械学習がもっと身近に by シバタアキラ

Upload: akira-shibata

Post on 16-Apr-2017

3.488 views

Category:

Data & Analytics


1 download

TRANSCRIPT

Page 1: Akira shibata at developer summit 2016

エンジニアなら使える深層学習 TensorFlowやDataRobotで機械学習がもっと身近に

by シバタアキラ

Page 2: Akira shibata at developer summit 2016

copyright @2016 by DataRobot, Inc. All Rights Reserved

シバタアキラ, Ph.D. @madyagi

2004 - 2007::Ph.D. 高エネルギー物理学 @London大学● Pythonを使い始めた頃(C++もがっつり)

2007 - 2010::データサイエンティスト @NYU● ヒッグス粒子の発見のためのデータ解析 @LHC, CERN

2010 - 2013:戦略コンサル @BCG “ボスコン”

2013 - 2015:CEO @白ヤギコーポレーション● ニュースキュレーションアプリ「カメリオ」

2015 - :データサイエンティスト @ DataRobot2014 - :オーガナイザー @ PyData.Tokyo

Page 3: Akira shibata at developer summit 2016

copyright @2016 by DataRobot, Inc. All Rights Reserved 3

2012 2H 2013 1H 2013 2H 2014 1H 2014 2H 2015 1H 2015 2H 2016 1H

June ‘12Founded

June ‘13Seed Funding$3.3M

July ‘14Series A $21M

Nov ‘15Series B $33M

データロボット会社紹介

Page 4: Akira shibata at developer summit 2016

copyright @2016 by DataRobot, Inc. All Rights Reserved 4

世界で30万人以上が登録する、データサイエンティストのコンペプラットフォーム。

数多くの企業がデータを公開し、予測精度で上位成績者には賞金が渡される。

Jeremy Achin CEO & Co-Founder

Highest† 20th

Xavier ConortChief Data Scientist

Highest† 1st

Tom DeGody CTO & Co-Founder

Highest† 20th

Peter Prettenhofer Data Scientist

Highest† 14thCore Contributor

Owen Zhang Chief Product Officer

Highest† 1st

Sergey Yurgenson Data Scientist

Highest† 1st

Viktor Gal Data ScientistCore Contributor

トップKagglerが多数在籍

Page 5: Akira shibata at developer summit 2016

copyright @2016 by DataRobot, Inc. All Rights Reserved

データサイエンティストのたまり場

Python じゃない方もどうぞ

Page 6: Akira shibata at developer summit 2016

copyright @2016 by DataRobot, Inc. All Rights Reserved

PyData.Tokyoでは、開始当初から深層学習を追ってきた

Page 7: Akira shibata at developer summit 2016

copyright @2016 by DataRobot, Inc. All Rights Reserved

お仕事 オーガナイザー 連載

Page 8: Akira shibata at developer summit 2016

copyright @2016 by DataRobot, Inc. All Rights Reserved

Page 9: Akira shibata at developer summit 2016

copyright @2016 by DataRobot, Inc. All Rights Reserved

今日お伝えしたいこと

あなたも人工知能使えますつかってっください

Page 10: Akira shibata at developer summit 2016

copyright @2016 by DataRobot, Inc. All Rights Reserved

深層学習(ディープラーニング)アルゴリズムの画像処理における性能がすごすぎ

機械って人間超えちゃったりするんじゃね?人間置き換えちゃうんじゃね?

とりあえずその辺の技術全般を指すハイプ用語として成立

メディアもネタになって嬉しいし、そっち系のスタートアップなんかもとりあえず波にのることにした。

そもそも...人工知能ってなに?

Page 11: Akira shibata at developer summit 2016

copyright @2016 by DataRobot, Inc. All Rights Reserved

人工知能作ろうとしてる人、増えてます

Page 12: Akira shibata at developer summit 2016

copyright @2016 by DataRobot, Inc. All Rights Reserved

人工知能 機械学習 深層学習(ディープラーニング)

もう少しだけ正確に

Page 13: Akira shibata at developer summit 2016

copyright @2016 by DataRobot, Inc. All Rights Reserved

機械学習ってなに?

コンピューターアルゴリズムにデータを分析させ、パターンを学習させることで、予測や識別などの問題を解かせること。

種類● 教師あり● 教師なし

手法● 回帰● 決定木● ベイジアンモデル● クラスタリング● ニューラルネットワーク● 深層学習

Page 14: Akira shibata at developer summit 2016

copyright @2016 by DataRobot, Inc. All Rights Reserved

機械学習への入力データと解ける問題

分類● 2値分類:True/False● 多値分類:カテゴリー・タグ

回帰● 連続値:数値

時系列● 数値 x 時間

レコメンデーション● 数値 x アイテム

クラスタリング

● ブーリアン● 数値● カテゴリ● テキスト

Page 15: Akira shibata at developer summit 2016

copyright @2016 by DataRobot, Inc. All Rights Reserved

既に広くビジネスに応用されている

● 金融○ この人お金貸したら返ってくる?

● 保険○ この人が来年事故に遭う確率は?

● マーケティング○ この広告はどれくらいクリックされる?○ どのマーケティングキャンペーンが一番効果的?

● 人事・採用○ この候補者は自社で活躍できるか?○ どの従業員が辞めそう?

● スポーツ○ この選手はいくつの試合でヒットを打てる??

● ヘルスケア○ 退院した患者がまた悪くなって再入院する確率は?

Page 16: Akira shibata at developer summit 2016

copyright @2016 by DataRobot, Inc. All Rights Reserved

どんどん進化してる

研究者が自分でアルゴリズムを考案して論文を発表

オープンソースライブラリでコーディングができる人はつかえる

● Pythonならscikit-learn

ボタンをポチッと押すだけで、誰でも使える

● DataRobot

深層学習前の機械学習技術はイマココ

Page 17: Akira shibata at developer summit 2016

copyright @2016 by DataRobot, Inc. All Rights Reserved

深層学習ってなに?神経回路にインスパイアされたニューラルネットワーク型アルゴリズムの「隠れ層」を多段にすることで、学習能力を高めたもの。特に画像識別分野で高い精度を発揮している。

学習手法● オートエンコーダー● Restricted Boltzmann Machine などなど

ネットワークタイプ● Convolutional● Recurrent などなど

HWの進歩● GPUを使った効率化

そもそも...

Page 18: Akira shibata at developer summit 2016

copyright @2016 by DataRobot, Inc. All Rights Reserved

Page 19: Akira shibata at developer summit 2016

copyright @2016 by DataRobot, Inc. All Rights Reserved

Page 20: Akira shibata at developer summit 2016

copyright @2016 by DataRobot, Inc. All Rights Reserved

Page 21: Akira shibata at developer summit 2016

copyright @2016 by DataRobot, Inc. All Rights Reserved

● ブーリアン● 数値● カテゴリ● テキスト● 画像● 音声

深層学習への入力データと解ける問題

分類● 2値分類:True/False● 多値分類:カテゴリー

回帰● 連続値:数値

時系列● 数値 x 時間

レコメンデーション● 数値 x アイテム

クラスタリング

Page 22: Akira shibata at developer summit 2016

copyright @2016 by DataRobot, Inc. All Rights Reserved

Page 23: Akira shibata at developer summit 2016

copyright @2016 by DataRobot, Inc. All Rights Reserved

Page 24: Akira shibata at developer summit 2016

copyright @2016 by DataRobot, Inc. All Rights Reserved

TensorFlowとは

深層学習の構築に必要な線形代数を表現し、GPUなどの分散処理技術を使って高速に計算するためのライブラリ。

エンジニアならPython/C++からわりと簡単に使える。

Page 25: Akira shibata at developer summit 2016

copyright @2016 by DataRobot, Inc. All Rights Reserved

● 手書き文字の認識● テキストのベクトル化(Word2Vec)● 機械翻訳● 自然言語のモデリング● イメージ内にある物体の識別● などなど

TensorFlowで既にできる深層学習の応用例

Googleの物体識別アルゴリズム、Inception3は96%以上のtop5正答率で、世界最高精度かつ、人間よりも精度が高い。既にTensorFlowで使える。

Page 26: Akira shibata at developer summit 2016

copyright @2016 by DataRobot, Inc. All Rights Reserved

pip install --upgrade https://storage.googleapis.com/tensorflow/mac/tensorflow-0.7.0-py2-none-any.whl

プラス幾つかのコマンドで

デモ:

わりと簡単につかえる... エンジニアなら

Page 27: Akira shibata at developer summit 2016

copyright @2016 by DataRobot, Inc. All Rights Reserved

http://kivantium.hateblo.jp/entry/2015/11/18/233834

じぶんで応用すると...

Page 28: Akira shibata at developer summit 2016

copyright @2016 by DataRobot, Inc. All Rights Reserved

Deep Dreamも、もうすぐTensorFlowから使える

Page 29: Akira shibata at developer summit 2016

copyright @2016 by DataRobot, Inc. All Rights Reserved

Page 30: Akira shibata at developer summit 2016

copyright @2016 by DataRobot, Inc. All Rights Reserved

どんどん進化してる

研究者が自分でアルゴリズムを考案して論文を発表

オープンソースライブラリでコーディングができる人はつかえる

● TensorFlow!

ボタンをポチッと押すだけで、誰でも使える

● ???

深層学習はイマココ

Page 31: Akira shibata at developer summit 2016

copyright @2016 by DataRobot, Inc. All Rights Reserved

Page 32: Akira shibata at developer summit 2016

copyright @2016 by DataRobot, Inc. All Rights Reserved

みんなが使うとすごいことがおこる

Page 33: Akira shibata at developer summit 2016

copyright @2016 by DataRobot, Inc. All Rights Reserved

みんなが使うとすごいことがおこる

Page 34: Akira shibata at developer summit 2016

copyright @2016 by DataRobot, Inc. All Rights Reserved

Page 35: Akira shibata at developer summit 2016

copyright @2016 by DataRobot, Inc. All Rights Reserved

Page 36: Akira shibata at developer summit 2016

copyright @2016 by DataRobot, Inc. All Rights Reserved

Page 37: Akira shibata at developer summit 2016

copyright @2016 by DataRobot, Inc. All Rights Reserved