akira shibata at developer summit 2016
TRANSCRIPT
エンジニアなら使える深層学習 TensorFlowやDataRobotで機械学習がもっと身近に
by シバタアキラ
copyright @2016 by DataRobot, Inc. All Rights Reserved
シバタアキラ, Ph.D. @madyagi
2004 - 2007::Ph.D. 高エネルギー物理学 @London大学● Pythonを使い始めた頃(C++もがっつり)
2007 - 2010::データサイエンティスト @NYU● ヒッグス粒子の発見のためのデータ解析 @LHC, CERN
2010 - 2013:戦略コンサル @BCG “ボスコン”
2013 - 2015:CEO @白ヤギコーポレーション● ニュースキュレーションアプリ「カメリオ」
2015 - :データサイエンティスト @ DataRobot2014 - :オーガナイザー @ PyData.Tokyo
copyright @2016 by DataRobot, Inc. All Rights Reserved 3
2012 2H 2013 1H 2013 2H 2014 1H 2014 2H 2015 1H 2015 2H 2016 1H
June ‘12Founded
June ‘13Seed Funding$3.3M
July ‘14Series A $21M
Nov ‘15Series B $33M
データロボット会社紹介
copyright @2016 by DataRobot, Inc. All Rights Reserved 4
世界で30万人以上が登録する、データサイエンティストのコンペプラットフォーム。
数多くの企業がデータを公開し、予測精度で上位成績者には賞金が渡される。
Jeremy Achin CEO & Co-Founder
Highest† 20th
Xavier ConortChief Data Scientist
Highest† 1st
Tom DeGody CTO & Co-Founder
Highest† 20th
Peter Prettenhofer Data Scientist
Highest† 14thCore Contributor
Owen Zhang Chief Product Officer
Highest† 1st
Sergey Yurgenson Data Scientist
Highest† 1st
Viktor Gal Data ScientistCore Contributor
トップKagglerが多数在籍
copyright @2016 by DataRobot, Inc. All Rights Reserved
データサイエンティストのたまり場
Python じゃない方もどうぞ
copyright @2016 by DataRobot, Inc. All Rights Reserved
PyData.Tokyoでは、開始当初から深層学習を追ってきた
copyright @2016 by DataRobot, Inc. All Rights Reserved
お仕事 オーガナイザー 連載
copyright @2016 by DataRobot, Inc. All Rights Reserved
copyright @2016 by DataRobot, Inc. All Rights Reserved
今日お伝えしたいこと
あなたも人工知能使えますつかってっください
copyright @2016 by DataRobot, Inc. All Rights Reserved
深層学習(ディープラーニング)アルゴリズムの画像処理における性能がすごすぎ
機械って人間超えちゃったりするんじゃね?人間置き換えちゃうんじゃね?
とりあえずその辺の技術全般を指すハイプ用語として成立
メディアもネタになって嬉しいし、そっち系のスタートアップなんかもとりあえず波にのることにした。
そもそも...人工知能ってなに?
copyright @2016 by DataRobot, Inc. All Rights Reserved
人工知能作ろうとしてる人、増えてます
copyright @2016 by DataRobot, Inc. All Rights Reserved
人工知能 機械学習 深層学習(ディープラーニング)
もう少しだけ正確に
copyright @2016 by DataRobot, Inc. All Rights Reserved
機械学習ってなに?
コンピューターアルゴリズムにデータを分析させ、パターンを学習させることで、予測や識別などの問題を解かせること。
種類● 教師あり● 教師なし
手法● 回帰● 決定木● ベイジアンモデル● クラスタリング● ニューラルネットワーク● 深層学習
copyright @2016 by DataRobot, Inc. All Rights Reserved
機械学習への入力データと解ける問題
分類● 2値分類:True/False● 多値分類:カテゴリー・タグ
回帰● 連続値:数値
時系列● 数値 x 時間
レコメンデーション● 数値 x アイテム
クラスタリング
● ブーリアン● 数値● カテゴリ● テキスト
copyright @2016 by DataRobot, Inc. All Rights Reserved
既に広くビジネスに応用されている
● 金融○ この人お金貸したら返ってくる?
○
● 保険○ この人が来年事故に遭う確率は?
● マーケティング○ この広告はどれくらいクリックされる?○ どのマーケティングキャンペーンが一番効果的?
● 人事・採用○ この候補者は自社で活躍できるか?○ どの従業員が辞めそう?
● スポーツ○ この選手はいくつの試合でヒットを打てる??
● ヘルスケア○ 退院した患者がまた悪くなって再入院する確率は?
copyright @2016 by DataRobot, Inc. All Rights Reserved
どんどん進化してる
研究者が自分でアルゴリズムを考案して論文を発表
オープンソースライブラリでコーディングができる人はつかえる
● Pythonならscikit-learn
ボタンをポチッと押すだけで、誰でも使える
● DataRobot
深層学習前の機械学習技術はイマココ
copyright @2016 by DataRobot, Inc. All Rights Reserved
深層学習ってなに?神経回路にインスパイアされたニューラルネットワーク型アルゴリズムの「隠れ層」を多段にすることで、学習能力を高めたもの。特に画像識別分野で高い精度を発揮している。
学習手法● オートエンコーダー● Restricted Boltzmann Machine などなど
ネットワークタイプ● Convolutional● Recurrent などなど
HWの進歩● GPUを使った効率化
そもそも...
copyright @2016 by DataRobot, Inc. All Rights Reserved
copyright @2016 by DataRobot, Inc. All Rights Reserved
copyright @2016 by DataRobot, Inc. All Rights Reserved
copyright @2016 by DataRobot, Inc. All Rights Reserved
● ブーリアン● 数値● カテゴリ● テキスト● 画像● 音声
深層学習への入力データと解ける問題
分類● 2値分類:True/False● 多値分類:カテゴリー
回帰● 連続値:数値
時系列● 数値 x 時間
レコメンデーション● 数値 x アイテム
クラスタリング
copyright @2016 by DataRobot, Inc. All Rights Reserved
copyright @2016 by DataRobot, Inc. All Rights Reserved
copyright @2016 by DataRobot, Inc. All Rights Reserved
TensorFlowとは
深層学習の構築に必要な線形代数を表現し、GPUなどの分散処理技術を使って高速に計算するためのライブラリ。
エンジニアならPython/C++からわりと簡単に使える。
copyright @2016 by DataRobot, Inc. All Rights Reserved
● 手書き文字の認識● テキストのベクトル化(Word2Vec)● 機械翻訳● 自然言語のモデリング● イメージ内にある物体の識別● などなど
TensorFlowで既にできる深層学習の応用例
Googleの物体識別アルゴリズム、Inception3は96%以上のtop5正答率で、世界最高精度かつ、人間よりも精度が高い。既にTensorFlowで使える。
copyright @2016 by DataRobot, Inc. All Rights Reserved
pip install --upgrade https://storage.googleapis.com/tensorflow/mac/tensorflow-0.7.0-py2-none-any.whl
プラス幾つかのコマンドで
デモ:
わりと簡単につかえる... エンジニアなら
copyright @2016 by DataRobot, Inc. All Rights Reserved
http://kivantium.hateblo.jp/entry/2015/11/18/233834
じぶんで応用すると...
copyright @2016 by DataRobot, Inc. All Rights Reserved
Deep Dreamも、もうすぐTensorFlowから使える
copyright @2016 by DataRobot, Inc. All Rights Reserved
copyright @2016 by DataRobot, Inc. All Rights Reserved
どんどん進化してる
研究者が自分でアルゴリズムを考案して論文を発表
オープンソースライブラリでコーディングができる人はつかえる
● TensorFlow!
ボタンをポチッと押すだけで、誰でも使える
● ???
深層学習はイマココ
copyright @2016 by DataRobot, Inc. All Rights Reserved
copyright @2016 by DataRobot, Inc. All Rights Reserved
みんなが使うとすごいことがおこる
copyright @2016 by DataRobot, Inc. All Rights Reserved
みんなが使うとすごいことがおこる
copyright @2016 by DataRobot, Inc. All Rights Reserved
copyright @2016 by DataRobot, Inc. All Rights Reserved
copyright @2016 by DataRobot, Inc. All Rights Reserved
copyright @2016 by DataRobot, Inc. All Rights Reserved