ivs cto night & day 2016 tech talk - ai
TRANSCRIPT
⾃⼰紹介
• 名前– 榎並 利晃(えなみ としあき)– [email protected]
• 役割– Mobile & IoT Business Development Manager
• 好きなAWSのサービス– AWS IoT– Mobile Services– Amazon Kinesis Family
AIとIoTの関係
IoTで⽣成された⼤量かつ構造・⾮構造のデータから意味のある形に変えるのにAIの技術(識別・判断)を利⽤する。
© 2016, Amazon Web Services, Inc. or its Affiliates. All rights reserved.
4
よくあるケース
異常検知、故障予測、画像認識、異⾳・異常振動検知・⾳声認識、⾔語理解
歴史は古い
© 2016, Amazon Web Services, Inc. or its Affiliates. All rights reserved.
5
http://biography.sophia-it.com/content/%E3%82%B8%E3%83%A7%E3%83%B3%E3%83%BB%E3%83%9E%E3%83%83%E3%82%AB%E3%83%BC%E3%82%B7%E3%83%BC
John McCarthy
⼈⼯知能は、1956年にダートマス会議でジョン・マッカーシーにより命名された
© 2016, Amazon Web Services, Inc. or its Affiliates. All rights reserved.
2017年に注⽬すべき戦略的テクノロジ・トレンドのトップ10https://www.gartner.co.jp/press/html/pr20161031-01.html
1.⾼度な機械学習とAI2.インテリジェントなアプリ3.インテリジェントなモノ4.仮想現実と拡張現実5.デジタルツイン6.ブロックチェーンと分散型台帳7.会話型システム8.メッシュのアプリ&サービスアーキテクチャ9.デジタルテクノロジープラットフォーム10.アダプティブセキュリティアーキテクチャ
AIによって仕事が奪われる不安を感じるべき10の理由1. 現在では、基幹作業を担える⾃動システムがある2. ⼈やものとの接触があまりなければ⾃動化される3. 内容を伝えるだけの仕事は⾃動化される4. 複雑でない内容の分析は、⾃動化される5. データをもとに疑問に応える仕事は⾃動化される6. 計量分析は⾃動化される7. コンピュータ上でシミュレーションできる仕事は⾃動化される8. 機械は動作が⼀環している9. データに基づいた解説や説明は⾃動化される10. 明確な秩序だったルールがある仕事は⾃動化される
7
「AI時代の勝者と敗者」トーマス・H・ダベンポート (著), ジュリア・カービー (著)
認知テクノロジーの種類とその進化
作業の種類 ⼈間⽀援 反復作業の⾃動化 状況の認識・学習 ⾃⼰を認識した知性
数値分析 BI, 視覚化 作業分析、採点、モデル管理
機械学習、ニューラルネットワーク
未開発 最⾼融合機械
⾔葉や画像の理解
⽂字や⾳声の認識 画像認識、マシンビジョン
⾃然⾔語処理 未開発
デジタル作業の遂⾏
ビジネスプロセス管理
ルールエンジン、プロセス・オートメーション
未開発 未開発
物理的作業の進⾏
遠隔操作 産業ロボット 完全⾃律ロボット、⾃動運転⾞
未開発
「AI時代の勝者と敗者」トーマス・H・ダベンポート (著), ジュリア・カービー (著)
⼈⼯知能(AI)と機械学習(Machine Learning)
• ⼈⼯知能とは– コンピューターシステムに⼈間と同様の知能を持たせるための取り組み– 強いAIと弱いAI
• 強いAI– ⼈間の知能と同等またはそれを超えるようなコンピューターシステム
• 弱いAI– 特定の分野の問題解決や推論を⾏うソフトウェアの実装や研究
– ⼈⼯知能の主な研究分野• 基礎寄り
– 推論、探索、画像認識、⾳声認識、⾃然⾔語処理、ゲーム理論、感性処理• 応⽤寄り
– プランニング、エキスパートシステム、データマイニング、情報検索、マルチエージェント、ロボティクス、遺伝アルゴリズム
10
現在実現出来ているのはこちら
⼈⼯知能(AI)と機械学習(Machine Learning)• 機械学習とは
– (⼤量の)データを”学習”し、特定の事象についての知⾒(モデル)を獲得して、判断や予測を⾏うためのアルゴリズムとその実装
• データの真の分布を推定し、ルールを導出する• それ⾃⾝が⼈⼯知能の分野と位置づけられることもあるが、⼈⼯知能を実現するためのアプローチ
として利⽤されることが多い– 例)
データマイニング=データベース+機械学習画像認識におけるCNN
– 代表的な機械学習アルゴリズム• 線形回帰• ロジスティック回帰• k近傍法• 決定⽊• サポートベクトルマシン• ニューラルネットワーク※• ランダムフォレスト• クラスタリング
11
Machine Learning
最適化と
コントロール
ニューロサイエンスとニューラルネットワーク
統計的モデリング
情報理論
※ニューラルネットを機械学習の一部と取るか独立したものと
考えるかは人によって異なります。
⼈⼯知能関連テクノロジー機械学習
その他
ニューラルネットワーク
ディープラーニング その他
• 機械学習⼤量のデータを読み込む、その内容を学習しコンピュータが⾃動で判断できる様にする。⼤容量のデータ処理という観点でクラウドとの相性が良い
• ディープラーニング⼈間と似た⽅法で学習するニューラルネットワークの仕組みと機械学習の仕組みを組み合わせたもの
ニューラルネットとDeep Learning• ニューラルネットの栄枯盛衰
– ⼈間の神経組織(ニューロン)をモデル化した学習器– ⼗分なノード数の中間層があれば、3層ニューラルネットであらゆる関数を近似で
きる– 誤差逆伝播法の確⽴– 様々な要素によって⼀時的に衰退
• 次元の呪いによる計算量爆発• 誤差消失問題と局所収束問題• SVM等局所収束の無い学習器の登場
• Deep Learningの隆盛– CNN、DBM、DBN等4層以上でも学習が可能なアルゴリズムの登場– 画像認識において顕著な実績– ⾃然⾔語処理への応⽤– 計算機能⼒の⼤幅な向上+GPUの活⽤– クラウドとビッグデータ– 豊富なライブラリ
1960
yx0
x1
x2
2012
パーセプトロン
多層NN
1980
誤差逆伝播法
2006
ILSVRCにおいてCNNで大差での優勝
ボルツマンマシンを用いた
深層自己符号化器
SVM等他のアルゴリズムが隆盛
YouTubeの動画から猫の画像の認識
AWSでは、One-Click GPU Deep LearningAWS Deep Learning AMI
Up to~40k CUDA coresMXNetTensorFlowTheanoCaffeTorchPre-configured CUDA driversAnaconda, Python3
+ CloudFormation template
+ Container Image
Deep Learning Frameworkの普及
MXNet | Scalable Deep Learning § Open Source: Apache-2 Licensed Deep Learning Framework§ Founded by: U.Washington, Carnegie Mellon U.
§ State of the Art Model Support: Convolutional Neural Networks (CNN), Long Short-Term Memory (LSTM)
§ Ultra-scalable: Near-linear scaling equals fastest time to model§ Multi-language: Support for Scala, Python, R, etc.. for legacy code leverage
and easy integration with Spark§ Ecosystem: Vibrant community from Academia and Industry
機械学習における重要なポイント1• ノーフリーランチ定理
– コスト関数の局地を探索するあらゆるアルゴリズムは全ての可能なコスト関数に適⽤した結果を平均すると同じ性能となる
• 全ての問題に適したアルゴリズムは、特定の問題に特化したアルゴリズムよりも性能が良くない
– 問題に適したアルゴリズムを選択する必要がある• 汎化能⼒
– 学習したモデルが真の分布に近い事が望ましい(過学習に陥っていない)• トレーニングデータが多ければ多いほど真の分布に近づくが、その分学習が遅くなる
• 計算量– ⼀般的に取り扱うデータは多次元
• モデルの学習には⼤規模な⾏列演算が必要• 分散処理による並列計算
– 基本はトライ&エラー• 選択したアルゴリズム毎に、解きたい問題に最適なパラメーターを調整し、繰り返しモデル
を作成する必要がある(NNの層の数、活性化関数の種類、層ごとのノード数、重みの変化量、etc.)
– 現実的な時間で学習が完了するモデルを選定する必要がある
機械学習における重要なポイント2
• トレーニングデータが正確であり、解きたい問題と適⽤するアルゴリズムに適した特徴が含まれている
• 特徴量の抽出(⼊⼒次元の削減)– 特徴量が増えると計算量が爆発する
• より良い内部表現を得るための次元削減を⾏う事が多い– より良い特徴抽出に求められる要件
• 元の情報量を出来るだけ保持している• 個々の特徴同⼠ができるだけ独⽴している• ロバスト性を持っている(変動に左右されない)
Amazon Rekognition
ディープラーニングを利⽤した画像認識サービス
状況&物体の認識表情の解析
顔の⽐較と認識
Amazon Polly
フルマネージド型の”Text-to-speech” サービス
• APIを利⽤して⽂章をPollyに渡すと⾳声ストリームまたはファイルの形式で⾳声化
• ⽇本語を含む24の⾔語、47種類の⾳声(男性、⼥性)に対応
Amazon Lex
⾳声認識・アプリケーション実⾏サービス
⾳声認識、⾔語解析を⾏い、⾔語の意味に基づいてアプリケーションを実⾏
Amazon GoHow does Amazon Go work?Our checkout-free shopping experience is made possible by the same types of technologies used in self-driving cars: computer vision, sensor fusion, and deep learning. Our Just Walk Out technology automatically detects when products are taken from or returned to the shelves and keeps track of them in a virtual cart. When you’re done shopping, you can just leave the store. Shortly after, we’ll charge your Amazon account and send you a receipt.