od big data do analityki 3.0
TRANSCRIPT
![Page 1: Od Big Data do Analityki 3.0](https://reader038.vdocuments.site/reader038/viewer/2022110200/55c820a7bb61eb27208b4709/html5/thumbnails/1.jpg)
Od Big Data do Analityki 3.0
Od chaosu danych do odkrycia potencjału informacji
Magdalena HoffmanZETO Katowice Sp. z o.o.
Kraków, 15 kwietnia 2023
![Page 2: Od Big Data do Analityki 3.0](https://reader038.vdocuments.site/reader038/viewer/2022110200/55c820a7bb61eb27208b4709/html5/thumbnails/2.jpg)
Opowiemy Kim jesteśmy
Skąd się wzięliśmy
O projekcie słów kilka:
KlientProblem
WyzwanieEfekty
…i potencjał
![Page 3: Od Big Data do Analityki 3.0](https://reader038.vdocuments.site/reader038/viewer/2022110200/55c820a7bb61eb27208b4709/html5/thumbnails/3.jpg)
ZETO Katowice
![Page 4: Od Big Data do Analityki 3.0](https://reader038.vdocuments.site/reader038/viewer/2022110200/55c820a7bb61eb27208b4709/html5/thumbnails/4.jpg)
ZETO INNOVATIONS• Skupiamy się na zaawansowanej analityce• Wykorzystujemy Internet Rzeczy• Stosujemy podejście big data’owe w pracy z danymi• Produkty rozwijamy w modelu Customer Development• Dostarczamy Klientom wiedzy
niezbędnej do podejmowania decyzji biznesowych
w czasie rzeczywistym
![Page 5: Od Big Data do Analityki 3.0](https://reader038.vdocuments.site/reader038/viewer/2022110200/55c820a7bb61eb27208b4709/html5/thumbnails/5.jpg)
Start• Spedytor krajowy• Koszty paliwa to znacząca część kosztów operacyjnych
Cel – obniżyć zużycie paliwa – Eco Driving
Czy to w ogóle jest możliwe?
![Page 6: Od Big Data do Analityki 3.0](https://reader038.vdocuments.site/reader038/viewer/2022110200/55c820a7bb61eb27208b4709/html5/thumbnails/6.jpg)
Choć dysponujemy danymi i częściowo informacjami, to wciąż brakuje nam...
…wiedzy
Wiedza
Informacje
Dane
![Page 7: Od Big Data do Analityki 3.0](https://reader038.vdocuments.site/reader038/viewer/2022110200/55c820a7bb61eb27208b4709/html5/thumbnails/7.jpg)
Potr
zeba
Anal
iza
Wie
dza
Konc
epcja
Dane
Real
izacja
Wer
yfika
cja
Efek
ty
Pote
ncja
ł
![Page 8: Od Big Data do Analityki 3.0](https://reader038.vdocuments.site/reader038/viewer/2022110200/55c820a7bb61eb27208b4709/html5/thumbnails/8.jpg)
Praca z danymi
Model CRISP-DM
Język R
![Page 9: Od Big Data do Analityki 3.0](https://reader038.vdocuments.site/reader038/viewer/2022110200/55c820a7bb61eb27208b4709/html5/thumbnails/9.jpg)
Źródła danych
“Wygrywa nie ten, kto ma najlepszy algorytm, a ten, który ma najwięcej danych.”*
Źródło: Andrew Ng, Ekspert Machine Learning, prof. Stanford University
![Page 10: Od Big Data do Analityki 3.0](https://reader038.vdocuments.site/reader038/viewer/2022110200/55c820a7bb61eb27208b4709/html5/thumbnails/10.jpg)
Źródła danych
![Page 11: Od Big Data do Analityki 3.0](https://reader038.vdocuments.site/reader038/viewer/2022110200/55c820a7bb61eb27208b4709/html5/thumbnails/11.jpg)
Źródła danych, cd.• Strumienie danych
(online)• Listy przewozowe• Rozkłady jazdy• Baza infrastruktury
transportowej• Bazy systemów
dziedzinowych• Zbiory ograniczeń w ruchu
• Dane z systemów ERP / CMMS• Dane meteorologiczne• historyczne• bieżące
• Uzgodnione struktury pośrednie• Słowniki
![Page 12: Od Big Data do Analityki 3.0](https://reader038.vdocuments.site/reader038/viewer/2022110200/55c820a7bb61eb27208b4709/html5/thumbnails/12.jpg)
Najważniejsze procesy ETL
“Eksploracja danych polega na torturowaniu danych tak długo, aż zaczną zeznawać”*
Źródło: Mieczysław Muraszkiewicz, Instytut Informatyki Teoretycznej i Stosowanej PAN
![Page 13: Od Big Data do Analityki 3.0](https://reader038.vdocuments.site/reader038/viewer/2022110200/55c820a7bb61eb27208b4709/html5/thumbnails/13.jpg)
Najważniejsze procesy ETL
• Infrastruktura• Przejazdy• Tabor• Ludzie• Warunki zewnętrzne
![Page 14: Od Big Data do Analityki 3.0](https://reader038.vdocuments.site/reader038/viewer/2022110200/55c820a7bb61eb27208b4709/html5/thumbnails/14.jpg)
Czyszczenie i przetwarzanie
Przykład duplikowania się identyfikatora pojazdu
![Page 15: Od Big Data do Analityki 3.0](https://reader038.vdocuments.site/reader038/viewer/2022110200/55c820a7bb61eb27208b4709/html5/thumbnails/15.jpg)
Czyszczenie i przetwarzanie
Przykład błędnego profilu trasy
--- Kształt linii przed naprawą--- Kształt linii po naprawie
![Page 16: Od Big Data do Analityki 3.0](https://reader038.vdocuments.site/reader038/viewer/2022110200/55c820a7bb61eb27208b4709/html5/thumbnails/16.jpg)
Czyszczenie i przetwarzanie
Niedokładność wskaźnika zużycia paliwa
![Page 17: Od Big Data do Analityki 3.0](https://reader038.vdocuments.site/reader038/viewer/2022110200/55c820a7bb61eb27208b4709/html5/thumbnails/17.jpg)
Efekty• Zdefiniowana i zasilona Hurtownia danych• Moduł analityczny• Zintegrowana informacja o przejazdach• Prezentacja wizualna przejazdów• Możliwość wyznaczenia spalania chwilowego• Baza infrastruktury transportowej
tworzymy Adaptacyjny algorytm optymalizacji przejazdów uwzględniający bieżące ograniczenia
![Page 18: Od Big Data do Analityki 3.0](https://reader038.vdocuments.site/reader038/viewer/2022110200/55c820a7bb61eb27208b4709/html5/thumbnails/18.jpg)
Wchodzi Analityka 3.0
Wbudowujemy algorytm w aplikacje
![Page 19: Od Big Data do Analityki 3.0](https://reader038.vdocuments.site/reader038/viewer/2022110200/55c820a7bb61eb27208b4709/html5/thumbnails/19.jpg)
Potencjał
![Page 20: Od Big Data do Analityki 3.0](https://reader038.vdocuments.site/reader038/viewer/2022110200/55c820a7bb61eb27208b4709/html5/thumbnails/20.jpg)
Podsumowanie
![Page 21: Od Big Data do Analityki 3.0](https://reader038.vdocuments.site/reader038/viewer/2022110200/55c820a7bb61eb27208b4709/html5/thumbnails/21.jpg)
Pytania