prediktivní analytika pro rok 2020
TRANSCRIPT
ANALYTIKA PRO ROK 2020KONEC STAROVĚKU
…cílíme přesně
Jan Matoušek (Data Mind) – Hlavní Analytik
Zkušenosti v oblasti dataminingu od roku 2003
Např.: O2 Czech Republic, T-Mobile Ogilvy One Blažek Kasa.cz
Zakladatel a hlavní analytik Data Mind s.r.o.
Výsledky: Desítky prediktivních a segmentačních modelů
pro TELCO, RETAIL, eBusiness a Finance Spokojení klienti Vysoká návratnost projektů
Kde jste ve využití dat?
-2000 BC Hodnota zákazníka a měření (Babylon)
1960Předpověď nákupu a hodnoty zákazníka(Regrese a rozhodovací stromy)
1932Segmentace(Clustering)
1975RFM a Neuronové sítě
2000Automatické rozpoznání obličejů a řeči
2011Umělá inteligence jež vyhrává znalostní soutěž (IBM Watson)
2020Emulovaná lidskáinteligence za 1000 $(Deep learning)
Zdroje: Wikipedie, Ray Kurzweil
Co dále ?
Posuňte se alespoň do času Gagarina Sledujte trendy na období 2016-2020
Zdroj obrázku: www.rirt.ru
Proč prediktivní analytika
Prediktivní analytika umožňuje vědět dříve než zákazník (nebo alespoň souběžně se zákazníkem):
Zákazník
Co potřebuje koupit
Jaké má potřeby
Důvody k
odchoduŠpatné úmysly
Pravdě-podobno
st nákupu
Jak vzniká predikce na úrovni zákazníka
Modelování Nákupní charakteristiky, kategorie, zvyklosti
Model (efekty, účinky)
Nákupy
Budoucí nákupy
Použijeme zkušenosti z minulostipro předpověď budoucího chování
ModelVar2
Var3
Var1Predikce
Prediktory a výsledky
Zakoupené produkty v minulosti
Frekvence nákupů Výše útraty
Chování na webuReakce na reklamní kampaně
Nákupní chování
Chování
Pravděpodobnost dalšího
nákupunebo
Budoucí hodnota
PředpověďBudoucí hodnota: v CZK:
Počet kategorií * počet transakcí * 80 (interakce)+ Suma prodejní ceny * 0.07+ Nakoupil v posledních 6-ti měsících * 550+ Vzdálenost od posledního nákupu v měsících * (-20)
+ Nákup v x měsících *675…Pravděpodobnost nákupu: (1/(1+exp(+Počet měsíců * 0.15+Počet artiklů* 0.25+Počet velkých kategorií* 0.15)))
8
Obchodní použití - Výběr zákazníků
Výběrem 10% zákazníků získáme 41% nakupujících Výběrem 20% zákazníků získáme 54% nakupujících (reálný model ze skutečného projektu)
Zdroj: Data Mind
Case study - Vyplatí se to ?
Podíl nakupujících dle desetin databáze (decilů) vybraných prediktivním modelem Data Mind
Reálná konverze na papírový direct mailVýkon:
Nejlepší desetina - decil 10 - nakoupí ve 22% případůOslovením decilu 10 dosahujeme desetinásobné návratnosti oproti „průměrnému“ decilu 6
Decil – desetina zákazníků podle pravděpodobnosti nákupu, vybráno modelem Response rate
6 2%7 2%8 5%9 14%
10 22%
Zdroj: Data Mind reference Blažek Praha a.s.
Cvičení na dnešek: Jak udělat prediktivní model na kusu ubrousku
Rozdělte do několika kategorií zákazníky 2015 podle:a. Počtu transakcí b. Data posledního nákupu c. Výše útraty
• Podívejte se na útraty 2016 v každé skupině
• Který parametr je nejdůležitější ?
Cvičení na dnešek: Jak udělat prediktivní model na kusu ubrousku
• Prediktivní design funguje velice dobře i v primitivních podobách
• Frekvence nákupu na reálných datech navyšuje budoucí prodeje na 161%
• Pokročilé varianty stejného postupu dosahují běžně
• Až 200%-1.000% průměrných prodejů
Navýšení prodejů naNe Ano
Nejhorší třetina 82% 18% 100% 62%Prostřední třetina 75% 25% 100% 88%Nejlepší třetina 53% 47% 100% 161%
71% 29% 100%
Ne Ano
Nejhorší třetina 81% 19% 100% 65%Prostřední třetina 73% 27% 100% 93%Nejlepší třetina 59% 41% 100% 142%
71% 29% 100%
Útrata
Total
Total
Nakoupí do roka
Total
Nakoupí do roka
TotalFrekvence
2020: Trendy
Trendy v pokročilé analytice Open source SW v dominantním postavení Umělá inteligence na tahu Rozpoznání řeči, obličejů a lidí jako komodita
Funkce lidského mozku za 1000 $? Konec spamu ?
TREND1: Akcelerace open source analytiky
Akcelerace Open – source analytiky
Zdroj: Google Trends
0
20
40
60
80
100
120
2009 2010 2011 2012 2013 2014 2015
Google trends: Vybrané vyhledávací dotazy v oblasti analýzy velkých dat
R (open source prog. jazyk)SPSS (komerční software)SAS (komerční software)Data mining (odvětví)Big data (odvětví)
Korporáti vyhrávají (pokud podporují open-source)
Business model 1: Otevřenost k open source:(Microsoft SQL Server 2016)
Business model 2: Cloud (Azure ML)
Business model 3:
Freemium(RapidMiner)
Zdroj obrázku: Gartner, grafika KDNuggets
Hluboké neuronové sítě
Hluboké neuronové sítě dokáží strojově zpracovat obrázky i lidskou řeč Korporace a technologičtí šílenci je již mají a používají (GOOG, FB, MSFT,
KDNuggets komunita) Do 5-ti let budou levné a přípravné k použití
Pro střední business a jako moduly pro spotřebitele Obrázek: Zdroj Google
Konec spamu ? Válka robotů!
Konec SPAMu předpověděl Bill Gates na rok 2006 Nikdo nepřišel s novou předpovědí
Co víme: Umělá inteligence již bojuje na obou
frontách Bot-nets proti Neuronovým sítím a
bayesovským technikám Personalizace a segmentace výrazně
snižuje pocit spamu u lidí i robotů V roce 2020 nebudete s největší
pravděpodobností moci zdarma a lehce doručit miliony stejných emailů
Obrázek: US Navy, Spamcop.net
Data Mind s.r.o.U průhonu 466/22170 00 Praha 7
www.datamind.cz
Jan Matouš[email protected]
z+420 720 705 639
Logos and registered trademarks mentioned in this presentation are the property of their respective owners.