deep learning · machine learning meetup michal illich. michal illich. obsah ... intermezzo 1...

41
Deep learning (a strojové učení obecně) Czech Internet Forum 2014 Tech Open Day DataConf.cz Machine Learning Meetup Michal Illich

Upload: others

Post on 19-Jul-2020

11 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: Deep learning · Machine Learning Meetup Michal Illich. Michal Illich. Obsah ... Intermezzo 1 Semantic hashing ... gbm, libsvm, vowpal wabbit, sofia-ml, sofia-kmeans word2vec, gensim,

Deep learning(a strojové učení obecně)

Czech Internet Forum 2014Tech Open Day

DataConf.czMachine Learning Meetup

Michal Illich

Page 2: Deep learning · Machine Learning Meetup Michal Illich. Michal Illich. Obsah ... Intermezzo 1 Semantic hashing ... gbm, libsvm, vowpal wabbit, sofia-ml, sofia-kmeans word2vec, gensim,

Michal Illich

Page 3: Deep learning · Machine Learning Meetup Michal Illich. Michal Illich. Obsah ... Intermezzo 1 Semantic hashing ... gbm, libsvm, vowpal wabbit, sofia-ml, sofia-kmeans word2vec, gensim,

Obsah

● Strojové učení– Kdo ho používá?

– Základní princip

● Deep learning– Běžné neuronové sítě

– Co je podstatou „deep“?

– Proč a kde je skvělý?

Page 4: Deep learning · Machine Learning Meetup Michal Illich. Michal Illich. Obsah ... Intermezzo 1 Semantic hashing ... gbm, libsvm, vowpal wabbit, sofia-ml, sofia-kmeans word2vec, gensim,

Produkty strojového učení používáte každý den.

Page 5: Deep learning · Machine Learning Meetup Michal Illich. Michal Illich. Obsah ... Intermezzo 1 Semantic hashing ... gbm, libsvm, vowpal wabbit, sofia-ml, sofia-kmeans word2vec, gensim,

Kde se používá na webu - I

Page 6: Deep learning · Machine Learning Meetup Michal Illich. Michal Illich. Obsah ... Intermezzo 1 Semantic hashing ... gbm, libsvm, vowpal wabbit, sofia-ml, sofia-kmeans word2vec, gensim,

Kde se používá na webu - II

Page 7: Deep learning · Machine Learning Meetup Michal Illich. Michal Illich. Obsah ... Intermezzo 1 Semantic hashing ... gbm, libsvm, vowpal wabbit, sofia-ml, sofia-kmeans word2vec, gensim,

Kde se používá na webu - III

Page 8: Deep learning · Machine Learning Meetup Michal Illich. Michal Illich. Obsah ... Intermezzo 1 Semantic hashing ... gbm, libsvm, vowpal wabbit, sofia-ml, sofia-kmeans word2vec, gensim,

Mimo web

Siri

OCR

Self-driving cars

Page 9: Deep learning · Machine Learning Meetup Michal Illich. Michal Illich. Obsah ... Intermezzo 1 Semantic hashing ... gbm, libsvm, vowpal wabbit, sofia-ml, sofia-kmeans word2vec, gensim,

Kde si s ním hrajeme my

Magictable

Brandiozo

Golem

a jeden neveřejný projekt

Page 10: Deep learning · Machine Learning Meetup Michal Illich. Michal Illich. Obsah ... Intermezzo 1 Semantic hashing ... gbm, libsvm, vowpal wabbit, sofia-ml, sofia-kmeans word2vec, gensim,

… a Brandiozo

a 2 další, zatím neveřejné projekty

Page 11: Deep learning · Machine Learning Meetup Michal Illich. Michal Illich. Obsah ... Intermezzo 1 Semantic hashing ... gbm, libsvm, vowpal wabbit, sofia-ml, sofia-kmeans word2vec, gensim,

Označkovanádata

Page 12: Deep learning · Machine Learning Meetup Michal Illich. Michal Illich. Obsah ... Intermezzo 1 Semantic hashing ... gbm, libsvm, vowpal wabbit, sofia-ml, sofia-kmeans word2vec, gensim,

Naučíte model:

Známá data → Model → Známý výsledek

Page 13: Deep learning · Machine Learning Meetup Michal Illich. Michal Illich. Obsah ... Intermezzo 1 Semantic hashing ... gbm, libsvm, vowpal wabbit, sofia-ml, sofia-kmeans word2vec, gensim,

Používáte model:

Nová data → Model → Nový výsledek

Page 14: Deep learning · Machine Learning Meetup Michal Illich. Michal Illich. Obsah ... Intermezzo 1 Semantic hashing ... gbm, libsvm, vowpal wabbit, sofia-ml, sofia-kmeans word2vec, gensim,

II. Deep learning

Page 15: Deep learning · Machine Learning Meetup Michal Illich. Michal Illich. Obsah ... Intermezzo 1 Semantic hashing ... gbm, libsvm, vowpal wabbit, sofia-ml, sofia-kmeans word2vec, gensim,

1970s

Page 16: Deep learning · Machine Learning Meetup Michal Illich. Michal Illich. Obsah ... Intermezzo 1 Semantic hashing ... gbm, libsvm, vowpal wabbit, sofia-ml, sofia-kmeans word2vec, gensim,

1970s

Page 17: Deep learning · Machine Learning Meetup Michal Illich. Michal Illich. Obsah ... Intermezzo 1 Semantic hashing ... gbm, libsvm, vowpal wabbit, sofia-ml, sofia-kmeans word2vec, gensim,

1975 - backpropagation

Page 18: Deep learning · Machine Learning Meetup Michal Illich. Michal Illich. Obsah ... Intermezzo 1 Semantic hashing ... gbm, libsvm, vowpal wabbit, sofia-ml, sofia-kmeans word2vec, gensim,

Co chceme, aby uměly?

Page 19: Deep learning · Machine Learning Meetup Michal Illich. Michal Illich. Obsah ... Intermezzo 1 Semantic hashing ... gbm, libsvm, vowpal wabbit, sofia-ml, sofia-kmeans word2vec, gensim,

Co je od tehdy nového?Čím je učení „deep“?

Page 20: Deep learning · Machine Learning Meetup Michal Illich. Michal Illich. Obsah ... Intermezzo 1 Semantic hashing ... gbm, libsvm, vowpal wabbit, sofia-ml, sofia-kmeans word2vec, gensim,

1. Hloubka

Umožněná vyšším výkonem CPU/GPU a pár triky.

Page 21: Deep learning · Machine Learning Meetup Michal Illich. Michal Illich. Obsah ... Intermezzo 1 Semantic hashing ... gbm, libsvm, vowpal wabbit, sofia-ml, sofia-kmeans word2vec, gensim,

2. Využití neoznačených dat

Page 22: Deep learning · Machine Learning Meetup Michal Illich. Michal Illich. Obsah ... Intermezzo 1 Semantic hashing ... gbm, libsvm, vowpal wabbit, sofia-ml, sofia-kmeans word2vec, gensim,
Page 23: Deep learning · Machine Learning Meetup Michal Illich. Michal Illich. Obsah ... Intermezzo 1 Semantic hashing ... gbm, libsvm, vowpal wabbit, sofia-ml, sofia-kmeans word2vec, gensim,

Intermezzo 1

● Semantic hashing● Aneb zpátky k Josefově problému

(hledání podobných dokumentů)

Page 24: Deep learning · Machine Learning Meetup Michal Illich. Michal Illich. Obsah ... Intermezzo 1 Semantic hashing ... gbm, libsvm, vowpal wabbit, sofia-ml, sofia-kmeans word2vec, gensim,

Tři přístupy

1. Podle podobnosti řetězce písmen?

2. Podle podobnosti významu slov?

3. Deep learning?

Page 25: Deep learning · Machine Learning Meetup Michal Illich. Michal Illich. Obsah ... Intermezzo 1 Semantic hashing ... gbm, libsvm, vowpal wabbit, sofia-ml, sofia-kmeans word2vec, gensim,

Salakhutdinov & Hinton, 2006

Page 26: Deep learning · Machine Learning Meetup Michal Illich. Michal Illich. Obsah ... Intermezzo 1 Semantic hashing ... gbm, libsvm, vowpal wabbit, sofia-ml, sofia-kmeans word2vec, gensim,

3. Triky

● odolnost proti přeučení DropOut, DropConnect

● jiné aktivační funkce ReLu místo sigmoidy

● učení po vrstvách● konvoluční sítě

Page 27: Deep learning · Machine Learning Meetup Michal Illich. Michal Illich. Obsah ... Intermezzo 1 Semantic hashing ... gbm, libsvm, vowpal wabbit, sofia-ml, sofia-kmeans word2vec, gensim,

Odolnost proti přeučeníDropOut, DropConnect, Denoising...

Page 28: Deep learning · Machine Learning Meetup Michal Illich. Michal Illich. Obsah ... Intermezzo 1 Semantic hashing ... gbm, libsvm, vowpal wabbit, sofia-ml, sofia-kmeans word2vec, gensim,

Výsledky

Kategorizace obrázků (22000 kategorií)● 9,5% (nejlepší v 2011)

● 18,3% (deep learning ze Stanfordu)

Page 29: Deep learning · Machine Learning Meetup Michal Illich. Michal Illich. Obsah ... Intermezzo 1 Semantic hashing ... gbm, libsvm, vowpal wabbit, sofia-ml, sofia-kmeans word2vec, gensim,

Výsledky

Rozpoznávání řeči (Switchboard, 300 hodin)● chybovost 27,4 % (tradiční metody)

● chybovost 18,5 % (deep learning)

Page 30: Deep learning · Machine Learning Meetup Michal Illich. Michal Illich. Obsah ... Intermezzo 1 Semantic hashing ... gbm, libsvm, vowpal wabbit, sofia-ml, sofia-kmeans word2vec, gensim,

Výsledky

Rozpoznávání číslic (MNIST)● chybovost 0,39 % (2006)

● chybovost 0,21 % (deep learning)

Page 31: Deep learning · Machine Learning Meetup Michal Illich. Michal Illich. Obsah ... Intermezzo 1 Semantic hashing ... gbm, libsvm, vowpal wabbit, sofia-ml, sofia-kmeans word2vec, gensim,

Open source knihovny

Neuronové sítě:

theano, cuda-convnet, fann

Další algoritmy:

gbm, libsvm, vowpal wabbit, sofia-ml, sofia-kmeans

word2vec, gensim, NLP knihovny

Nástroje s GUI:

weka, orange, rapid miner

Page 32: Deep learning · Machine Learning Meetup Michal Illich. Michal Illich. Obsah ... Intermezzo 1 Semantic hashing ... gbm, libsvm, vowpal wabbit, sofia-ml, sofia-kmeans word2vec, gensim,

Intermezzo 2

Page 33: Deep learning · Machine Learning Meetup Michal Illich. Michal Illich. Obsah ... Intermezzo 1 Semantic hashing ... gbm, libsvm, vowpal wabbit, sofia-ml, sofia-kmeans word2vec, gensim,

Máte projekt?

● Z oblasti dat nebo analytics?● Nejméně dva zakladatelé?● Potřebujete €30k?

Page 34: Deep learning · Machine Learning Meetup Michal Illich. Michal Illich. Obsah ... Intermezzo 1 Semantic hashing ... gbm, libsvm, vowpal wabbit, sofia-ml, sofia-kmeans word2vec, gensim,

Přihlašte se do StartupYardu

● Deadline už za 4 týdny 15.12.

● Tříměsíční program od března 2015

● Desítky mentorů● Demo Day pro investory● €30k cash investice za 10%● Plus až $250k v „perks“

kredit do AWS, Rackspace, Google App Engine,...

Page 35: Deep learning · Machine Learning Meetup Michal Illich. Michal Illich. Obsah ... Intermezzo 1 Semantic hashing ... gbm, libsvm, vowpal wabbit, sofia-ml, sofia-kmeans word2vec, gensim,

Závěr

Page 36: Deep learning · Machine Learning Meetup Michal Illich. Michal Illich. Obsah ... Intermezzo 1 Semantic hashing ... gbm, libsvm, vowpal wabbit, sofia-ml, sofia-kmeans word2vec, gensim,

1/3

Mít data nestačí. Používejte je.kreslit barevné grafy je základ, nikoliv plné využití dat

Page 37: Deep learning · Machine Learning Meetup Michal Illich. Michal Illich. Obsah ... Intermezzo 1 Semantic hashing ... gbm, libsvm, vowpal wabbit, sofia-ml, sofia-kmeans word2vec, gensim,

Strojové učení.nechte stroje samotné najít si vztahy v datech

2/3

Page 38: Deep learning · Machine Learning Meetup Michal Illich. Michal Illich. Obsah ... Intermezzo 1 Semantic hashing ... gbm, libsvm, vowpal wabbit, sofia-ml, sofia-kmeans word2vec, gensim,

3/3

Kde může student pracovat s ML na reálných problémech:- komunitní/soutěžní weby jako Kaggle.com- vlastní projekty – sami nebo v akcelerátoru- na univerzitě- v pár českých firmách

Page 39: Deep learning · Machine Learning Meetup Michal Illich. Michal Illich. Obsah ... Intermezzo 1 Semantic hashing ... gbm, libsvm, vowpal wabbit, sofia-ml, sofia-kmeans word2vec, gensim,

Díky!

[email protected]

@michalillich

PS: Přijímáme: C, Python, PHP

Page 40: Deep learning · Machine Learning Meetup Michal Illich. Michal Illich. Obsah ... Intermezzo 1 Semantic hashing ... gbm, libsvm, vowpal wabbit, sofia-ml, sofia-kmeans word2vec, gensim,

Apendix: Výsledky podrobněji

Kategorizace obrázků (22000 kategorií)● 9,5% (nejlepší v 2011, Weston+Bengio)● 18,3% (deep learning ze Stanfordu)

Rozpoznávání řeči (Switchboard, 300h)● chybovost 27,4 % (GMM-HMM)● chybovost 18,5 % (deep learning: DNN-HMM)

Rozpoznávání číslic (MNIST)● chybovost 0,39 % (energy based model, 2006)● chybovost 0,21 % (deep learning s DropConnectem)

Page 41: Deep learning · Machine Learning Meetup Michal Illich. Michal Illich. Obsah ... Intermezzo 1 Semantic hashing ... gbm, libsvm, vowpal wabbit, sofia-ml, sofia-kmeans word2vec, gensim,

Zdroje ilustračních obrázků:

http://www.cs.toronto.edu/~kriz/cifar.htmlhttp://cl.naist.jp/~kevinduh/notes/duh12deeplearn.pdfhttp://www.positscience.com/media-gallery/detail/161/94http://commons.wikimedia.org/wiki/File:Haystack_-_geograph.org.uk_-_462934.jpghttp://www.retrowaste.com/1970s/http://www.moderni-dejiny.cz/clanek/exteriery-z-obdobi-normalizace-soubor-fotografii-bohdana-holomicka/http://zlin.cz/503516n-zlinske-jaro-odstartovalo-vystavu-ritualy-normalizacehttp://www.cs.stanford.edu/people/ang//slides/DeepLearning-Mar2013.pptx

+ pozadí koupené ve fotobance

Semantic hashing: https://www.cs.toronto.edu/~hinton/absps/sh.pdf