vkrakowskakonferencjamatematyki finansowej: symulacjewr · knowledgeteam...
TRANSCRIPT
V Krakowska Konferencja MatematykiFinansowej Symulacje w R
Fundacja Rozwoju Zawodowego Quantitative Finance Maciej Nasinski
April 12 2016
R Markdown
Spis Tresci
1 Interesujace dane Finansowe i nie tylko2 Symulacje modeli VAR3 Symulacje handlu algorytmicznego na HFT
Fundacja Quantitative Finance - Kim jestesmy
Fundacja Rozwoju Zawodowego Quantitative Finance powstala wmaju 2012 jako odpowiedz na rozwijające się ilosciowe podejście do rynkoacutewfinansowych nazywane quantitative finance opierające się o wykorzystanienajnowszych osiągnięć ekonometrii inżynierii finansowej oraz informatykiprzy podejmowaniu decyzji inwestycyjnych oraz rozwiązywaniu problemoacutewbiznesowych Celem Fundacji jest wspieranie rozwoju rynku quantitativefinance w Polsce oraz zwiększanie świadomości tej branży śroacuted studentoacutewBudujemy wspoacutełpracę pomiędzy najbardziej innowacyjnymi pracodawcamiw Polsce ktoacuterzy poszukują osoacuteb kształcących się w quantitative financeoraz studentami i absolwentami
Prowadzone projekty
Cykl spotkan z praktykami rynku
umożliwia poznanie osoacuteb zawodowo związanych z rynkiem Studencidowiadują się o obecnych trendach w branży finansowej oraz najbardziejpożądanych umiejętnościach Każdy ma możliwość uczestnictwa wdyskusji a po spotkaniach nasi goście z chęcią odpowiadają na pytaniazadane w kuluarach Dotychczas gościliśmy min osoby odpowiedzialne zawdrożenie systemu UTP na polskiej giełdzie czy zarządzającychalgorytmicznymi funduszami inwestycyjnymi
Projekt L(a)unch your career
to cykl spotkań w formie kameralnego lunchu w ktoacuterym bierze udział kilkustudentoacutew oraz przedstawiciel top managementu firmy W przeciwieństwiedo publicznych wystąpień rozmowy mają kameralną formę dającstudentom szansę na zadanie dowolnego pytania Jest to roacutewnieżmożliwość na zaprezentowanie się jako potencjalny kandydat do pracykandydat do pracy
Knowledge Team
W ramach struktur Fundacji działa zespoacuteł Knowledge Team budującyzaplecze merytoryczne naszej działalności Dotychczas zespoacutełprzeprowadzał analizy rynku handlu algorytmicznego projekcje inflacjianalizy strategii pasywnego zarządzania portfelem wskaźnikoacutewkontrariańskich i wielu innych Obecnie rozszerzamy działalność oconsulting w pozostałych obszarach quantitative finance
1 Interesujące dane Finansowe i nie tylko
Notowania
I Google Finance (Reuters) - wysokie limity dane o wyskiejczestotliwości - max 15 dni
I Stooq - niskie limity
Naturalny popyt (modelowanie sprzedaży)
I Google Trends - skalowana przez Google liczba wyszukań danej frazyI Wunderground - dane pogodowe
11a Google Finance
source(GFR)nameslt-c(WSEWIG20)for(f in names)GoogleFinance(f6015)
Google Finance WIG20
CZAS UNIX - strefy czasowe
11b Dane Google Finance
WSEWIG20
time
Pric
e
2016minus04minus04 000000 2016minus04minus11 000000 2016minus04minus18 000000
1900
1920
1940
1960
1980
12a Google Trends
gconnect(usr psw)tlt-gtrends(c(wiedzmincall of duty)
start_date =(asDate(Systime())-1900)geo=PL)
source(GoogleTdayR)GoogleTrendDaliy(nam=c(wiedzmincall of duty)type=relativegeo=PLres=day)
12b Dane Google Trends
2011 2012 2013 2014 2015 2016
1020
3040
50
time
valu
e
name
wiedzmin call of duty
13a Wunderground
source(Weather_dayR)source(Weather_weekR)nlt-c(londonbirminghamglasgow)citylt-c(EGLCEGBBEGPF)source(Weather_weekR)
Wunderground LONDON
for(i in 1length(city))repeaturllt-paste0(httpswww )webpagelt-try(readcsv(url))if(class(webpage)==try-error)cat(connection problem restart downloading current iteration)res_city[[i]]lt-webpageif(class(webpage)=try-error) break
13b Dane Wunderground
GMT 2013-02-02 2013-02-03 MaxTemperatureC_london 5 9 MeanTemperatureC_london 3 4 MinTemperatureC_london 2 1 DewPointC_london 2 7 MeanDewPointC_london -1 2 MinDewpointC_london -3 -4 MaxHumidity_london 81 87 MeanHumidity_london 71 80 MinHumidity_london 57 70 MaxSeaLevelPressurehPa_london 1024 1024 MeanSeaLevelPressurehPa_london 1016 1018 MinSeaLevelPressurehPa_london 1003 1013 MaxVisibilityKm_london 10 10 MeanVisibilityKm_london 10 10
14a Ściaganie danych - API
Bazowanie na pustych sekwencjach czasowych
I eliminuje problem z brakujacymi obserwacjamiI ułatwia łącznie danych (cbind vs merge)I umożliwia łatwe skalowanie czasowe np dzienne na tygodniowe
Wykorzystanie funkcji typu try() oraz repeat() badz while()
I ogranicza błędy w komunikacji
21a Troacutejkąt Pascala
[1] 1 [1] 1 1 [1] 1 2 1 [1] 1 3 3 1 [1] 1 4 6 4 1 [1] 1 5 10 10 5 1 [1] 1 6 15 20 15 6 1 [1] 1 7 21 35 35 21 7 1 [1] 1 8 28 56 70 56 28 8 1
21b Troacutejkąt Pascala
[1] 1 1 [1] 2 1 1 [1] 4 1 2 1 [1] 8 1 3 3 1 [1] 16 1 4 6 4 1 [1] 32 1 5 10 10 5 1 [1] 64 1 6 15 20 15 6 1 [1] 128 1 7 21 35 35 21 7 1 [1] 256 1 8 28 56 70 56 28 8 1 [1] 512 1 9 36 84 126 126 84 36 9 1 [1] 1024 1 10 45 120 210 252 210 120 45 10 1
22a Model VAR
I szczegoacutelny przypadek modelu SUR (Seemingly UnrelatedRegressions)
I identyczne zmienne objasniajace na przestrzeni roacutewnań -gt MNKI możliowść implementacji IRF (Impulse Response Function) i FEVDI model dla zmiennych stacjonarnych - zmienne skointegrowane VECMI metoda zaliczana do Data MiningI brak wnioskowania ekonomicznego
22b Liczba iteracji - model VAR
0
2500000
5000000
7500000
10000000
5 10 15 20liczba zmiennych
n_ite
r
25
50
75
100lag
Liczba modeli VAR vs liczba zmiennych
22b2 Liczba regresji - model VAR
0
25000000
50000000
75000000
100000000
5 10 15 20liczba zmiennych
n_ite
r
25
50
75
100lag
Liczba regresji vs liczba zmiennych
22c Duża ilość zmiennych objasniających
Redukcja wymiaru macierzy
I PCA (Principal Components Anlysis)I LDA (Linear discriminan analysis)
PCA jest czysto techniczna operacja w przeciwieństwie do LDA ktoacuterezachowuje informacje służącą klasyfikacji zmiennych
Problemy
I Interpretacja zmiennychI Niestandardowy rozkład zmiennych
22d MODEL VAR - Data Mining
col_nameslt-c(CPIUS_MMPKBPL_PROC_RET1CommodityIndex_RET1M3_RET1USD_RET1UR_RET1SALDO_RET1FED_RET1BEZROB_RET1BRENT_RET1LIBOR3mEUR_RET1ZYWN_A_RET1PKBUS_RET1WIBOR3M_RET1)
comlt-(combn(length(col_names)2simplify = FALSE))for(i in 314)
comlt-c(comcombn(length(col_names)isimplify = FALSE))length(com)10
[1] 163690
Transformacje średnia ruchoma stopy zwrotu
22e MODEL VAR - Data Mining 2all_R2lt-array(NAc(length(com)2nr_lag))
for(g in 1nr_lag)
R2lt-vector(numericlength(com))SERIALlt-vector(numericlength(com))for(i in 1length(com))
model1lt-VAR(data_noLAG_NA[c(CPIPL_MMcol_names[com[[i]]])]p=gtype=const)
sum_VARlt-summary(model1$varresult$CPIPL_MM)
R2[i]lt-sum_VAR$adjrsquaredSERIAL[i]lt-serialtest(model1)$serial$pvalueprint(paste(ilength(com)g))
all_R2[1g]lt-R2all_R2[2g]lt-SERIAL
31a Dane Akcyjne HFT
I DLC
DLC (Dual Listed Companies) są efektem połączenia dwoacutech spoacutełekSpoacutełki posiadają osobną osobowość prawną dzięki czemu mogą byćjednocześnie jednak oddzielnie notowane na swoim macierzystym rynkuDochody dzielone są zgodnie z equalization agreement ratio- najczęściejdzielą się zyskami po roacutewno
I GRS
GRS klasyczne akcje notowane pod jednym numerem ISIN na całymświecie
I DR
DR można powiązać z polską definicją kwitu depozytowego
31b Przykład prostego kodu dla symulacji repeat breakStart Premia+diffcc = (price1-price2currency)price1
repeatrepeat
ilt-i+1if (dane[idiffcc]gt015)
shortlt-dane[iprice1]longlt-dane[iprice2]break
print(dane[ic(price1price2currencydiffcc)])blt-irepeat
ilt-i+1if ( dane[idiffcc]lt(-015))
long2lt-dane[iprice1]short2lt-dane[iprice2]break
print(dane[ic(price1price2currencydiffcc)])
31c SYMULACJE ARBITRAŻU
I market frictions (krotka sprzedaz koszty tranzakcyjne kosztalternatywny)
I prawdop zrealizowania zleceniaI ilość volumenu z danej minuty - czekamy na częściową realizacjeI poziom premii inicjujący startegie - EVTI jak długo czekamy z zamknięciem pozycji
31d Wyniki symulacji
SYMULACJA W PLIKU SymulacjaStrategyFromposR
KONIECCo zyskujesz angażując się w pracę Fundacji QF
Wiedzę z zakresu finansoacutew ilościowych i nauk pokrewnych Doświadczeniezawodowe i unikalne możliwości networkingowe Realizację projektoacutew dlanajwiększych instytucji finansowych w Polsce Swobodę w organizowaniuswojej pracy i doskonalenie umiejętności organizacyjnych Miłą atmosferę isatysfakcję Zapraszamy do kontaktu
wwwquantitativefinanceorgplfundacjaquantitativefinanceorgpl
Kontakt
Maciej Nasiński Lead Analystnasinskimaciejgmailcom
Piotr Cymcyk Prezes Zarządupiotrcymcykquantitativefinanceorgpl
Wojciech Zdunkiewicz Członek Zarząduwzdunkiewiczquantitativefinanceorgpl
BibliografiaPhilippe Massicotte and Dirk Eddelbuettel (2016) gtrendsR R Functionsto Perform and Display Google Trends Queries R package version 133httpsCRANR-projectorgpackage=gtrendsR
Hadley Wickham and Romain Francois (2015) dplyr A Grammar of DataManipulation R package version 043httpsCRANR-projectorgpackage=dplyr
Hadley Wickham (2015) tidyr Easily Tidy Data with spread() andgather() Functions R package version 031httpsCRANR-projectorgpackage=tidyr
Bernhard Pfaff (2008) VAR SVAR and SVEC Models ImplementationWithin R Package vars Journal of Statistical Software 27(4) URLhttpwwwjstatsoftorgv27i04
httpsmranmicrosoftcomopen
httpswwwwundergroundcom
httpswwwgooglepltrendshl=pl
R Markdown
Spis Tresci
1 Interesujace dane Finansowe i nie tylko2 Symulacje modeli VAR3 Symulacje handlu algorytmicznego na HFT
Fundacja Quantitative Finance - Kim jestesmy
Fundacja Rozwoju Zawodowego Quantitative Finance powstala wmaju 2012 jako odpowiedz na rozwijające się ilosciowe podejście do rynkoacutewfinansowych nazywane quantitative finance opierające się o wykorzystanienajnowszych osiągnięć ekonometrii inżynierii finansowej oraz informatykiprzy podejmowaniu decyzji inwestycyjnych oraz rozwiązywaniu problemoacutewbiznesowych Celem Fundacji jest wspieranie rozwoju rynku quantitativefinance w Polsce oraz zwiększanie świadomości tej branży śroacuted studentoacutewBudujemy wspoacutełpracę pomiędzy najbardziej innowacyjnymi pracodawcamiw Polsce ktoacuterzy poszukują osoacuteb kształcących się w quantitative financeoraz studentami i absolwentami
Prowadzone projekty
Cykl spotkan z praktykami rynku
umożliwia poznanie osoacuteb zawodowo związanych z rynkiem Studencidowiadują się o obecnych trendach w branży finansowej oraz najbardziejpożądanych umiejętnościach Każdy ma możliwość uczestnictwa wdyskusji a po spotkaniach nasi goście z chęcią odpowiadają na pytaniazadane w kuluarach Dotychczas gościliśmy min osoby odpowiedzialne zawdrożenie systemu UTP na polskiej giełdzie czy zarządzającychalgorytmicznymi funduszami inwestycyjnymi
Projekt L(a)unch your career
to cykl spotkań w formie kameralnego lunchu w ktoacuterym bierze udział kilkustudentoacutew oraz przedstawiciel top managementu firmy W przeciwieństwiedo publicznych wystąpień rozmowy mają kameralną formę dającstudentom szansę na zadanie dowolnego pytania Jest to roacutewnieżmożliwość na zaprezentowanie się jako potencjalny kandydat do pracykandydat do pracy
Knowledge Team
W ramach struktur Fundacji działa zespoacuteł Knowledge Team budującyzaplecze merytoryczne naszej działalności Dotychczas zespoacutełprzeprowadzał analizy rynku handlu algorytmicznego projekcje inflacjianalizy strategii pasywnego zarządzania portfelem wskaźnikoacutewkontrariańskich i wielu innych Obecnie rozszerzamy działalność oconsulting w pozostałych obszarach quantitative finance
1 Interesujące dane Finansowe i nie tylko
Notowania
I Google Finance (Reuters) - wysokie limity dane o wyskiejczestotliwości - max 15 dni
I Stooq - niskie limity
Naturalny popyt (modelowanie sprzedaży)
I Google Trends - skalowana przez Google liczba wyszukań danej frazyI Wunderground - dane pogodowe
11a Google Finance
source(GFR)nameslt-c(WSEWIG20)for(f in names)GoogleFinance(f6015)
Google Finance WIG20
CZAS UNIX - strefy czasowe
11b Dane Google Finance
WSEWIG20
time
Pric
e
2016minus04minus04 000000 2016minus04minus11 000000 2016minus04minus18 000000
1900
1920
1940
1960
1980
12a Google Trends
gconnect(usr psw)tlt-gtrends(c(wiedzmincall of duty)
start_date =(asDate(Systime())-1900)geo=PL)
source(GoogleTdayR)GoogleTrendDaliy(nam=c(wiedzmincall of duty)type=relativegeo=PLres=day)
12b Dane Google Trends
2011 2012 2013 2014 2015 2016
1020
3040
50
time
valu
e
name
wiedzmin call of duty
13a Wunderground
source(Weather_dayR)source(Weather_weekR)nlt-c(londonbirminghamglasgow)citylt-c(EGLCEGBBEGPF)source(Weather_weekR)
Wunderground LONDON
for(i in 1length(city))repeaturllt-paste0(httpswww )webpagelt-try(readcsv(url))if(class(webpage)==try-error)cat(connection problem restart downloading current iteration)res_city[[i]]lt-webpageif(class(webpage)=try-error) break
13b Dane Wunderground
GMT 2013-02-02 2013-02-03 MaxTemperatureC_london 5 9 MeanTemperatureC_london 3 4 MinTemperatureC_london 2 1 DewPointC_london 2 7 MeanDewPointC_london -1 2 MinDewpointC_london -3 -4 MaxHumidity_london 81 87 MeanHumidity_london 71 80 MinHumidity_london 57 70 MaxSeaLevelPressurehPa_london 1024 1024 MeanSeaLevelPressurehPa_london 1016 1018 MinSeaLevelPressurehPa_london 1003 1013 MaxVisibilityKm_london 10 10 MeanVisibilityKm_london 10 10
14a Ściaganie danych - API
Bazowanie na pustych sekwencjach czasowych
I eliminuje problem z brakujacymi obserwacjamiI ułatwia łącznie danych (cbind vs merge)I umożliwia łatwe skalowanie czasowe np dzienne na tygodniowe
Wykorzystanie funkcji typu try() oraz repeat() badz while()
I ogranicza błędy w komunikacji
21a Troacutejkąt Pascala
[1] 1 [1] 1 1 [1] 1 2 1 [1] 1 3 3 1 [1] 1 4 6 4 1 [1] 1 5 10 10 5 1 [1] 1 6 15 20 15 6 1 [1] 1 7 21 35 35 21 7 1 [1] 1 8 28 56 70 56 28 8 1
21b Troacutejkąt Pascala
[1] 1 1 [1] 2 1 1 [1] 4 1 2 1 [1] 8 1 3 3 1 [1] 16 1 4 6 4 1 [1] 32 1 5 10 10 5 1 [1] 64 1 6 15 20 15 6 1 [1] 128 1 7 21 35 35 21 7 1 [1] 256 1 8 28 56 70 56 28 8 1 [1] 512 1 9 36 84 126 126 84 36 9 1 [1] 1024 1 10 45 120 210 252 210 120 45 10 1
22a Model VAR
I szczegoacutelny przypadek modelu SUR (Seemingly UnrelatedRegressions)
I identyczne zmienne objasniajace na przestrzeni roacutewnań -gt MNKI możliowść implementacji IRF (Impulse Response Function) i FEVDI model dla zmiennych stacjonarnych - zmienne skointegrowane VECMI metoda zaliczana do Data MiningI brak wnioskowania ekonomicznego
22b Liczba iteracji - model VAR
0
2500000
5000000
7500000
10000000
5 10 15 20liczba zmiennych
n_ite
r
25
50
75
100lag
Liczba modeli VAR vs liczba zmiennych
22b2 Liczba regresji - model VAR
0
25000000
50000000
75000000
100000000
5 10 15 20liczba zmiennych
n_ite
r
25
50
75
100lag
Liczba regresji vs liczba zmiennych
22c Duża ilość zmiennych objasniających
Redukcja wymiaru macierzy
I PCA (Principal Components Anlysis)I LDA (Linear discriminan analysis)
PCA jest czysto techniczna operacja w przeciwieństwie do LDA ktoacuterezachowuje informacje służącą klasyfikacji zmiennych
Problemy
I Interpretacja zmiennychI Niestandardowy rozkład zmiennych
22d MODEL VAR - Data Mining
col_nameslt-c(CPIUS_MMPKBPL_PROC_RET1CommodityIndex_RET1M3_RET1USD_RET1UR_RET1SALDO_RET1FED_RET1BEZROB_RET1BRENT_RET1LIBOR3mEUR_RET1ZYWN_A_RET1PKBUS_RET1WIBOR3M_RET1)
comlt-(combn(length(col_names)2simplify = FALSE))for(i in 314)
comlt-c(comcombn(length(col_names)isimplify = FALSE))length(com)10
[1] 163690
Transformacje średnia ruchoma stopy zwrotu
22e MODEL VAR - Data Mining 2all_R2lt-array(NAc(length(com)2nr_lag))
for(g in 1nr_lag)
R2lt-vector(numericlength(com))SERIALlt-vector(numericlength(com))for(i in 1length(com))
model1lt-VAR(data_noLAG_NA[c(CPIPL_MMcol_names[com[[i]]])]p=gtype=const)
sum_VARlt-summary(model1$varresult$CPIPL_MM)
R2[i]lt-sum_VAR$adjrsquaredSERIAL[i]lt-serialtest(model1)$serial$pvalueprint(paste(ilength(com)g))
all_R2[1g]lt-R2all_R2[2g]lt-SERIAL
31a Dane Akcyjne HFT
I DLC
DLC (Dual Listed Companies) są efektem połączenia dwoacutech spoacutełekSpoacutełki posiadają osobną osobowość prawną dzięki czemu mogą byćjednocześnie jednak oddzielnie notowane na swoim macierzystym rynkuDochody dzielone są zgodnie z equalization agreement ratio- najczęściejdzielą się zyskami po roacutewno
I GRS
GRS klasyczne akcje notowane pod jednym numerem ISIN na całymświecie
I DR
DR można powiązać z polską definicją kwitu depozytowego
31b Przykład prostego kodu dla symulacji repeat breakStart Premia+diffcc = (price1-price2currency)price1
repeatrepeat
ilt-i+1if (dane[idiffcc]gt015)
shortlt-dane[iprice1]longlt-dane[iprice2]break
print(dane[ic(price1price2currencydiffcc)])blt-irepeat
ilt-i+1if ( dane[idiffcc]lt(-015))
long2lt-dane[iprice1]short2lt-dane[iprice2]break
print(dane[ic(price1price2currencydiffcc)])
31c SYMULACJE ARBITRAŻU
I market frictions (krotka sprzedaz koszty tranzakcyjne kosztalternatywny)
I prawdop zrealizowania zleceniaI ilość volumenu z danej minuty - czekamy na częściową realizacjeI poziom premii inicjujący startegie - EVTI jak długo czekamy z zamknięciem pozycji
31d Wyniki symulacji
SYMULACJA W PLIKU SymulacjaStrategyFromposR
KONIECCo zyskujesz angażując się w pracę Fundacji QF
Wiedzę z zakresu finansoacutew ilościowych i nauk pokrewnych Doświadczeniezawodowe i unikalne możliwości networkingowe Realizację projektoacutew dlanajwiększych instytucji finansowych w Polsce Swobodę w organizowaniuswojej pracy i doskonalenie umiejętności organizacyjnych Miłą atmosferę isatysfakcję Zapraszamy do kontaktu
wwwquantitativefinanceorgplfundacjaquantitativefinanceorgpl
Kontakt
Maciej Nasiński Lead Analystnasinskimaciejgmailcom
Piotr Cymcyk Prezes Zarządupiotrcymcykquantitativefinanceorgpl
Wojciech Zdunkiewicz Członek Zarząduwzdunkiewiczquantitativefinanceorgpl
BibliografiaPhilippe Massicotte and Dirk Eddelbuettel (2016) gtrendsR R Functionsto Perform and Display Google Trends Queries R package version 133httpsCRANR-projectorgpackage=gtrendsR
Hadley Wickham and Romain Francois (2015) dplyr A Grammar of DataManipulation R package version 043httpsCRANR-projectorgpackage=dplyr
Hadley Wickham (2015) tidyr Easily Tidy Data with spread() andgather() Functions R package version 031httpsCRANR-projectorgpackage=tidyr
Bernhard Pfaff (2008) VAR SVAR and SVEC Models ImplementationWithin R Package vars Journal of Statistical Software 27(4) URLhttpwwwjstatsoftorgv27i04
httpsmranmicrosoftcomopen
httpswwwwundergroundcom
httpswwwgooglepltrendshl=pl
Fundacja Quantitative Finance - Kim jestesmy
Fundacja Rozwoju Zawodowego Quantitative Finance powstala wmaju 2012 jako odpowiedz na rozwijające się ilosciowe podejście do rynkoacutewfinansowych nazywane quantitative finance opierające się o wykorzystanienajnowszych osiągnięć ekonometrii inżynierii finansowej oraz informatykiprzy podejmowaniu decyzji inwestycyjnych oraz rozwiązywaniu problemoacutewbiznesowych Celem Fundacji jest wspieranie rozwoju rynku quantitativefinance w Polsce oraz zwiększanie świadomości tej branży śroacuted studentoacutewBudujemy wspoacutełpracę pomiędzy najbardziej innowacyjnymi pracodawcamiw Polsce ktoacuterzy poszukują osoacuteb kształcących się w quantitative financeoraz studentami i absolwentami
Prowadzone projekty
Cykl spotkan z praktykami rynku
umożliwia poznanie osoacuteb zawodowo związanych z rynkiem Studencidowiadują się o obecnych trendach w branży finansowej oraz najbardziejpożądanych umiejętnościach Każdy ma możliwość uczestnictwa wdyskusji a po spotkaniach nasi goście z chęcią odpowiadają na pytaniazadane w kuluarach Dotychczas gościliśmy min osoby odpowiedzialne zawdrożenie systemu UTP na polskiej giełdzie czy zarządzającychalgorytmicznymi funduszami inwestycyjnymi
Projekt L(a)unch your career
to cykl spotkań w formie kameralnego lunchu w ktoacuterym bierze udział kilkustudentoacutew oraz przedstawiciel top managementu firmy W przeciwieństwiedo publicznych wystąpień rozmowy mają kameralną formę dającstudentom szansę na zadanie dowolnego pytania Jest to roacutewnieżmożliwość na zaprezentowanie się jako potencjalny kandydat do pracykandydat do pracy
Knowledge Team
W ramach struktur Fundacji działa zespoacuteł Knowledge Team budującyzaplecze merytoryczne naszej działalności Dotychczas zespoacutełprzeprowadzał analizy rynku handlu algorytmicznego projekcje inflacjianalizy strategii pasywnego zarządzania portfelem wskaźnikoacutewkontrariańskich i wielu innych Obecnie rozszerzamy działalność oconsulting w pozostałych obszarach quantitative finance
1 Interesujące dane Finansowe i nie tylko
Notowania
I Google Finance (Reuters) - wysokie limity dane o wyskiejczestotliwości - max 15 dni
I Stooq - niskie limity
Naturalny popyt (modelowanie sprzedaży)
I Google Trends - skalowana przez Google liczba wyszukań danej frazyI Wunderground - dane pogodowe
11a Google Finance
source(GFR)nameslt-c(WSEWIG20)for(f in names)GoogleFinance(f6015)
Google Finance WIG20
CZAS UNIX - strefy czasowe
11b Dane Google Finance
WSEWIG20
time
Pric
e
2016minus04minus04 000000 2016minus04minus11 000000 2016minus04minus18 000000
1900
1920
1940
1960
1980
12a Google Trends
gconnect(usr psw)tlt-gtrends(c(wiedzmincall of duty)
start_date =(asDate(Systime())-1900)geo=PL)
source(GoogleTdayR)GoogleTrendDaliy(nam=c(wiedzmincall of duty)type=relativegeo=PLres=day)
12b Dane Google Trends
2011 2012 2013 2014 2015 2016
1020
3040
50
time
valu
e
name
wiedzmin call of duty
13a Wunderground
source(Weather_dayR)source(Weather_weekR)nlt-c(londonbirminghamglasgow)citylt-c(EGLCEGBBEGPF)source(Weather_weekR)
Wunderground LONDON
for(i in 1length(city))repeaturllt-paste0(httpswww )webpagelt-try(readcsv(url))if(class(webpage)==try-error)cat(connection problem restart downloading current iteration)res_city[[i]]lt-webpageif(class(webpage)=try-error) break
13b Dane Wunderground
GMT 2013-02-02 2013-02-03 MaxTemperatureC_london 5 9 MeanTemperatureC_london 3 4 MinTemperatureC_london 2 1 DewPointC_london 2 7 MeanDewPointC_london -1 2 MinDewpointC_london -3 -4 MaxHumidity_london 81 87 MeanHumidity_london 71 80 MinHumidity_london 57 70 MaxSeaLevelPressurehPa_london 1024 1024 MeanSeaLevelPressurehPa_london 1016 1018 MinSeaLevelPressurehPa_london 1003 1013 MaxVisibilityKm_london 10 10 MeanVisibilityKm_london 10 10
14a Ściaganie danych - API
Bazowanie na pustych sekwencjach czasowych
I eliminuje problem z brakujacymi obserwacjamiI ułatwia łącznie danych (cbind vs merge)I umożliwia łatwe skalowanie czasowe np dzienne na tygodniowe
Wykorzystanie funkcji typu try() oraz repeat() badz while()
I ogranicza błędy w komunikacji
21a Troacutejkąt Pascala
[1] 1 [1] 1 1 [1] 1 2 1 [1] 1 3 3 1 [1] 1 4 6 4 1 [1] 1 5 10 10 5 1 [1] 1 6 15 20 15 6 1 [1] 1 7 21 35 35 21 7 1 [1] 1 8 28 56 70 56 28 8 1
21b Troacutejkąt Pascala
[1] 1 1 [1] 2 1 1 [1] 4 1 2 1 [1] 8 1 3 3 1 [1] 16 1 4 6 4 1 [1] 32 1 5 10 10 5 1 [1] 64 1 6 15 20 15 6 1 [1] 128 1 7 21 35 35 21 7 1 [1] 256 1 8 28 56 70 56 28 8 1 [1] 512 1 9 36 84 126 126 84 36 9 1 [1] 1024 1 10 45 120 210 252 210 120 45 10 1
22a Model VAR
I szczegoacutelny przypadek modelu SUR (Seemingly UnrelatedRegressions)
I identyczne zmienne objasniajace na przestrzeni roacutewnań -gt MNKI możliowść implementacji IRF (Impulse Response Function) i FEVDI model dla zmiennych stacjonarnych - zmienne skointegrowane VECMI metoda zaliczana do Data MiningI brak wnioskowania ekonomicznego
22b Liczba iteracji - model VAR
0
2500000
5000000
7500000
10000000
5 10 15 20liczba zmiennych
n_ite
r
25
50
75
100lag
Liczba modeli VAR vs liczba zmiennych
22b2 Liczba regresji - model VAR
0
25000000
50000000
75000000
100000000
5 10 15 20liczba zmiennych
n_ite
r
25
50
75
100lag
Liczba regresji vs liczba zmiennych
22c Duża ilość zmiennych objasniających
Redukcja wymiaru macierzy
I PCA (Principal Components Anlysis)I LDA (Linear discriminan analysis)
PCA jest czysto techniczna operacja w przeciwieństwie do LDA ktoacuterezachowuje informacje służącą klasyfikacji zmiennych
Problemy
I Interpretacja zmiennychI Niestandardowy rozkład zmiennych
22d MODEL VAR - Data Mining
col_nameslt-c(CPIUS_MMPKBPL_PROC_RET1CommodityIndex_RET1M3_RET1USD_RET1UR_RET1SALDO_RET1FED_RET1BEZROB_RET1BRENT_RET1LIBOR3mEUR_RET1ZYWN_A_RET1PKBUS_RET1WIBOR3M_RET1)
comlt-(combn(length(col_names)2simplify = FALSE))for(i in 314)
comlt-c(comcombn(length(col_names)isimplify = FALSE))length(com)10
[1] 163690
Transformacje średnia ruchoma stopy zwrotu
22e MODEL VAR - Data Mining 2all_R2lt-array(NAc(length(com)2nr_lag))
for(g in 1nr_lag)
R2lt-vector(numericlength(com))SERIALlt-vector(numericlength(com))for(i in 1length(com))
model1lt-VAR(data_noLAG_NA[c(CPIPL_MMcol_names[com[[i]]])]p=gtype=const)
sum_VARlt-summary(model1$varresult$CPIPL_MM)
R2[i]lt-sum_VAR$adjrsquaredSERIAL[i]lt-serialtest(model1)$serial$pvalueprint(paste(ilength(com)g))
all_R2[1g]lt-R2all_R2[2g]lt-SERIAL
31a Dane Akcyjne HFT
I DLC
DLC (Dual Listed Companies) są efektem połączenia dwoacutech spoacutełekSpoacutełki posiadają osobną osobowość prawną dzięki czemu mogą byćjednocześnie jednak oddzielnie notowane na swoim macierzystym rynkuDochody dzielone są zgodnie z equalization agreement ratio- najczęściejdzielą się zyskami po roacutewno
I GRS
GRS klasyczne akcje notowane pod jednym numerem ISIN na całymświecie
I DR
DR można powiązać z polską definicją kwitu depozytowego
31b Przykład prostego kodu dla symulacji repeat breakStart Premia+diffcc = (price1-price2currency)price1
repeatrepeat
ilt-i+1if (dane[idiffcc]gt015)
shortlt-dane[iprice1]longlt-dane[iprice2]break
print(dane[ic(price1price2currencydiffcc)])blt-irepeat
ilt-i+1if ( dane[idiffcc]lt(-015))
long2lt-dane[iprice1]short2lt-dane[iprice2]break
print(dane[ic(price1price2currencydiffcc)])
31c SYMULACJE ARBITRAŻU
I market frictions (krotka sprzedaz koszty tranzakcyjne kosztalternatywny)
I prawdop zrealizowania zleceniaI ilość volumenu z danej minuty - czekamy na częściową realizacjeI poziom premii inicjujący startegie - EVTI jak długo czekamy z zamknięciem pozycji
31d Wyniki symulacji
SYMULACJA W PLIKU SymulacjaStrategyFromposR
KONIECCo zyskujesz angażując się w pracę Fundacji QF
Wiedzę z zakresu finansoacutew ilościowych i nauk pokrewnych Doświadczeniezawodowe i unikalne możliwości networkingowe Realizację projektoacutew dlanajwiększych instytucji finansowych w Polsce Swobodę w organizowaniuswojej pracy i doskonalenie umiejętności organizacyjnych Miłą atmosferę isatysfakcję Zapraszamy do kontaktu
wwwquantitativefinanceorgplfundacjaquantitativefinanceorgpl
Kontakt
Maciej Nasiński Lead Analystnasinskimaciejgmailcom
Piotr Cymcyk Prezes Zarządupiotrcymcykquantitativefinanceorgpl
Wojciech Zdunkiewicz Członek Zarząduwzdunkiewiczquantitativefinanceorgpl
BibliografiaPhilippe Massicotte and Dirk Eddelbuettel (2016) gtrendsR R Functionsto Perform and Display Google Trends Queries R package version 133httpsCRANR-projectorgpackage=gtrendsR
Hadley Wickham and Romain Francois (2015) dplyr A Grammar of DataManipulation R package version 043httpsCRANR-projectorgpackage=dplyr
Hadley Wickham (2015) tidyr Easily Tidy Data with spread() andgather() Functions R package version 031httpsCRANR-projectorgpackage=tidyr
Bernhard Pfaff (2008) VAR SVAR and SVEC Models ImplementationWithin R Package vars Journal of Statistical Software 27(4) URLhttpwwwjstatsoftorgv27i04
httpsmranmicrosoftcomopen
httpswwwwundergroundcom
httpswwwgooglepltrendshl=pl
Prowadzone projekty
Cykl spotkan z praktykami rynku
umożliwia poznanie osoacuteb zawodowo związanych z rynkiem Studencidowiadują się o obecnych trendach w branży finansowej oraz najbardziejpożądanych umiejętnościach Każdy ma możliwość uczestnictwa wdyskusji a po spotkaniach nasi goście z chęcią odpowiadają na pytaniazadane w kuluarach Dotychczas gościliśmy min osoby odpowiedzialne zawdrożenie systemu UTP na polskiej giełdzie czy zarządzającychalgorytmicznymi funduszami inwestycyjnymi
Projekt L(a)unch your career
to cykl spotkań w formie kameralnego lunchu w ktoacuterym bierze udział kilkustudentoacutew oraz przedstawiciel top managementu firmy W przeciwieństwiedo publicznych wystąpień rozmowy mają kameralną formę dającstudentom szansę na zadanie dowolnego pytania Jest to roacutewnieżmożliwość na zaprezentowanie się jako potencjalny kandydat do pracykandydat do pracy
Knowledge Team
W ramach struktur Fundacji działa zespoacuteł Knowledge Team budującyzaplecze merytoryczne naszej działalności Dotychczas zespoacutełprzeprowadzał analizy rynku handlu algorytmicznego projekcje inflacjianalizy strategii pasywnego zarządzania portfelem wskaźnikoacutewkontrariańskich i wielu innych Obecnie rozszerzamy działalność oconsulting w pozostałych obszarach quantitative finance
1 Interesujące dane Finansowe i nie tylko
Notowania
I Google Finance (Reuters) - wysokie limity dane o wyskiejczestotliwości - max 15 dni
I Stooq - niskie limity
Naturalny popyt (modelowanie sprzedaży)
I Google Trends - skalowana przez Google liczba wyszukań danej frazyI Wunderground - dane pogodowe
11a Google Finance
source(GFR)nameslt-c(WSEWIG20)for(f in names)GoogleFinance(f6015)
Google Finance WIG20
CZAS UNIX - strefy czasowe
11b Dane Google Finance
WSEWIG20
time
Pric
e
2016minus04minus04 000000 2016minus04minus11 000000 2016minus04minus18 000000
1900
1920
1940
1960
1980
12a Google Trends
gconnect(usr psw)tlt-gtrends(c(wiedzmincall of duty)
start_date =(asDate(Systime())-1900)geo=PL)
source(GoogleTdayR)GoogleTrendDaliy(nam=c(wiedzmincall of duty)type=relativegeo=PLres=day)
12b Dane Google Trends
2011 2012 2013 2014 2015 2016
1020
3040
50
time
valu
e
name
wiedzmin call of duty
13a Wunderground
source(Weather_dayR)source(Weather_weekR)nlt-c(londonbirminghamglasgow)citylt-c(EGLCEGBBEGPF)source(Weather_weekR)
Wunderground LONDON
for(i in 1length(city))repeaturllt-paste0(httpswww )webpagelt-try(readcsv(url))if(class(webpage)==try-error)cat(connection problem restart downloading current iteration)res_city[[i]]lt-webpageif(class(webpage)=try-error) break
13b Dane Wunderground
GMT 2013-02-02 2013-02-03 MaxTemperatureC_london 5 9 MeanTemperatureC_london 3 4 MinTemperatureC_london 2 1 DewPointC_london 2 7 MeanDewPointC_london -1 2 MinDewpointC_london -3 -4 MaxHumidity_london 81 87 MeanHumidity_london 71 80 MinHumidity_london 57 70 MaxSeaLevelPressurehPa_london 1024 1024 MeanSeaLevelPressurehPa_london 1016 1018 MinSeaLevelPressurehPa_london 1003 1013 MaxVisibilityKm_london 10 10 MeanVisibilityKm_london 10 10
14a Ściaganie danych - API
Bazowanie na pustych sekwencjach czasowych
I eliminuje problem z brakujacymi obserwacjamiI ułatwia łącznie danych (cbind vs merge)I umożliwia łatwe skalowanie czasowe np dzienne na tygodniowe
Wykorzystanie funkcji typu try() oraz repeat() badz while()
I ogranicza błędy w komunikacji
21a Troacutejkąt Pascala
[1] 1 [1] 1 1 [1] 1 2 1 [1] 1 3 3 1 [1] 1 4 6 4 1 [1] 1 5 10 10 5 1 [1] 1 6 15 20 15 6 1 [1] 1 7 21 35 35 21 7 1 [1] 1 8 28 56 70 56 28 8 1
21b Troacutejkąt Pascala
[1] 1 1 [1] 2 1 1 [1] 4 1 2 1 [1] 8 1 3 3 1 [1] 16 1 4 6 4 1 [1] 32 1 5 10 10 5 1 [1] 64 1 6 15 20 15 6 1 [1] 128 1 7 21 35 35 21 7 1 [1] 256 1 8 28 56 70 56 28 8 1 [1] 512 1 9 36 84 126 126 84 36 9 1 [1] 1024 1 10 45 120 210 252 210 120 45 10 1
22a Model VAR
I szczegoacutelny przypadek modelu SUR (Seemingly UnrelatedRegressions)
I identyczne zmienne objasniajace na przestrzeni roacutewnań -gt MNKI możliowść implementacji IRF (Impulse Response Function) i FEVDI model dla zmiennych stacjonarnych - zmienne skointegrowane VECMI metoda zaliczana do Data MiningI brak wnioskowania ekonomicznego
22b Liczba iteracji - model VAR
0
2500000
5000000
7500000
10000000
5 10 15 20liczba zmiennych
n_ite
r
25
50
75
100lag
Liczba modeli VAR vs liczba zmiennych
22b2 Liczba regresji - model VAR
0
25000000
50000000
75000000
100000000
5 10 15 20liczba zmiennych
n_ite
r
25
50
75
100lag
Liczba regresji vs liczba zmiennych
22c Duża ilość zmiennych objasniających
Redukcja wymiaru macierzy
I PCA (Principal Components Anlysis)I LDA (Linear discriminan analysis)
PCA jest czysto techniczna operacja w przeciwieństwie do LDA ktoacuterezachowuje informacje służącą klasyfikacji zmiennych
Problemy
I Interpretacja zmiennychI Niestandardowy rozkład zmiennych
22d MODEL VAR - Data Mining
col_nameslt-c(CPIUS_MMPKBPL_PROC_RET1CommodityIndex_RET1M3_RET1USD_RET1UR_RET1SALDO_RET1FED_RET1BEZROB_RET1BRENT_RET1LIBOR3mEUR_RET1ZYWN_A_RET1PKBUS_RET1WIBOR3M_RET1)
comlt-(combn(length(col_names)2simplify = FALSE))for(i in 314)
comlt-c(comcombn(length(col_names)isimplify = FALSE))length(com)10
[1] 163690
Transformacje średnia ruchoma stopy zwrotu
22e MODEL VAR - Data Mining 2all_R2lt-array(NAc(length(com)2nr_lag))
for(g in 1nr_lag)
R2lt-vector(numericlength(com))SERIALlt-vector(numericlength(com))for(i in 1length(com))
model1lt-VAR(data_noLAG_NA[c(CPIPL_MMcol_names[com[[i]]])]p=gtype=const)
sum_VARlt-summary(model1$varresult$CPIPL_MM)
R2[i]lt-sum_VAR$adjrsquaredSERIAL[i]lt-serialtest(model1)$serial$pvalueprint(paste(ilength(com)g))
all_R2[1g]lt-R2all_R2[2g]lt-SERIAL
31a Dane Akcyjne HFT
I DLC
DLC (Dual Listed Companies) są efektem połączenia dwoacutech spoacutełekSpoacutełki posiadają osobną osobowość prawną dzięki czemu mogą byćjednocześnie jednak oddzielnie notowane na swoim macierzystym rynkuDochody dzielone są zgodnie z equalization agreement ratio- najczęściejdzielą się zyskami po roacutewno
I GRS
GRS klasyczne akcje notowane pod jednym numerem ISIN na całymświecie
I DR
DR można powiązać z polską definicją kwitu depozytowego
31b Przykład prostego kodu dla symulacji repeat breakStart Premia+diffcc = (price1-price2currency)price1
repeatrepeat
ilt-i+1if (dane[idiffcc]gt015)
shortlt-dane[iprice1]longlt-dane[iprice2]break
print(dane[ic(price1price2currencydiffcc)])blt-irepeat
ilt-i+1if ( dane[idiffcc]lt(-015))
long2lt-dane[iprice1]short2lt-dane[iprice2]break
print(dane[ic(price1price2currencydiffcc)])
31c SYMULACJE ARBITRAŻU
I market frictions (krotka sprzedaz koszty tranzakcyjne kosztalternatywny)
I prawdop zrealizowania zleceniaI ilość volumenu z danej minuty - czekamy na częściową realizacjeI poziom premii inicjujący startegie - EVTI jak długo czekamy z zamknięciem pozycji
31d Wyniki symulacji
SYMULACJA W PLIKU SymulacjaStrategyFromposR
KONIECCo zyskujesz angażując się w pracę Fundacji QF
Wiedzę z zakresu finansoacutew ilościowych i nauk pokrewnych Doświadczeniezawodowe i unikalne możliwości networkingowe Realizację projektoacutew dlanajwiększych instytucji finansowych w Polsce Swobodę w organizowaniuswojej pracy i doskonalenie umiejętności organizacyjnych Miłą atmosferę isatysfakcję Zapraszamy do kontaktu
wwwquantitativefinanceorgplfundacjaquantitativefinanceorgpl
Kontakt
Maciej Nasiński Lead Analystnasinskimaciejgmailcom
Piotr Cymcyk Prezes Zarządupiotrcymcykquantitativefinanceorgpl
Wojciech Zdunkiewicz Członek Zarząduwzdunkiewiczquantitativefinanceorgpl
BibliografiaPhilippe Massicotte and Dirk Eddelbuettel (2016) gtrendsR R Functionsto Perform and Display Google Trends Queries R package version 133httpsCRANR-projectorgpackage=gtrendsR
Hadley Wickham and Romain Francois (2015) dplyr A Grammar of DataManipulation R package version 043httpsCRANR-projectorgpackage=dplyr
Hadley Wickham (2015) tidyr Easily Tidy Data with spread() andgather() Functions R package version 031httpsCRANR-projectorgpackage=tidyr
Bernhard Pfaff (2008) VAR SVAR and SVEC Models ImplementationWithin R Package vars Journal of Statistical Software 27(4) URLhttpwwwjstatsoftorgv27i04
httpsmranmicrosoftcomopen
httpswwwwundergroundcom
httpswwwgooglepltrendshl=pl
Knowledge Team
W ramach struktur Fundacji działa zespoacuteł Knowledge Team budującyzaplecze merytoryczne naszej działalności Dotychczas zespoacutełprzeprowadzał analizy rynku handlu algorytmicznego projekcje inflacjianalizy strategii pasywnego zarządzania portfelem wskaźnikoacutewkontrariańskich i wielu innych Obecnie rozszerzamy działalność oconsulting w pozostałych obszarach quantitative finance
1 Interesujące dane Finansowe i nie tylko
Notowania
I Google Finance (Reuters) - wysokie limity dane o wyskiejczestotliwości - max 15 dni
I Stooq - niskie limity
Naturalny popyt (modelowanie sprzedaży)
I Google Trends - skalowana przez Google liczba wyszukań danej frazyI Wunderground - dane pogodowe
11a Google Finance
source(GFR)nameslt-c(WSEWIG20)for(f in names)GoogleFinance(f6015)
Google Finance WIG20
CZAS UNIX - strefy czasowe
11b Dane Google Finance
WSEWIG20
time
Pric
e
2016minus04minus04 000000 2016minus04minus11 000000 2016minus04minus18 000000
1900
1920
1940
1960
1980
12a Google Trends
gconnect(usr psw)tlt-gtrends(c(wiedzmincall of duty)
start_date =(asDate(Systime())-1900)geo=PL)
source(GoogleTdayR)GoogleTrendDaliy(nam=c(wiedzmincall of duty)type=relativegeo=PLres=day)
12b Dane Google Trends
2011 2012 2013 2014 2015 2016
1020
3040
50
time
valu
e
name
wiedzmin call of duty
13a Wunderground
source(Weather_dayR)source(Weather_weekR)nlt-c(londonbirminghamglasgow)citylt-c(EGLCEGBBEGPF)source(Weather_weekR)
Wunderground LONDON
for(i in 1length(city))repeaturllt-paste0(httpswww )webpagelt-try(readcsv(url))if(class(webpage)==try-error)cat(connection problem restart downloading current iteration)res_city[[i]]lt-webpageif(class(webpage)=try-error) break
13b Dane Wunderground
GMT 2013-02-02 2013-02-03 MaxTemperatureC_london 5 9 MeanTemperatureC_london 3 4 MinTemperatureC_london 2 1 DewPointC_london 2 7 MeanDewPointC_london -1 2 MinDewpointC_london -3 -4 MaxHumidity_london 81 87 MeanHumidity_london 71 80 MinHumidity_london 57 70 MaxSeaLevelPressurehPa_london 1024 1024 MeanSeaLevelPressurehPa_london 1016 1018 MinSeaLevelPressurehPa_london 1003 1013 MaxVisibilityKm_london 10 10 MeanVisibilityKm_london 10 10
14a Ściaganie danych - API
Bazowanie na pustych sekwencjach czasowych
I eliminuje problem z brakujacymi obserwacjamiI ułatwia łącznie danych (cbind vs merge)I umożliwia łatwe skalowanie czasowe np dzienne na tygodniowe
Wykorzystanie funkcji typu try() oraz repeat() badz while()
I ogranicza błędy w komunikacji
21a Troacutejkąt Pascala
[1] 1 [1] 1 1 [1] 1 2 1 [1] 1 3 3 1 [1] 1 4 6 4 1 [1] 1 5 10 10 5 1 [1] 1 6 15 20 15 6 1 [1] 1 7 21 35 35 21 7 1 [1] 1 8 28 56 70 56 28 8 1
21b Troacutejkąt Pascala
[1] 1 1 [1] 2 1 1 [1] 4 1 2 1 [1] 8 1 3 3 1 [1] 16 1 4 6 4 1 [1] 32 1 5 10 10 5 1 [1] 64 1 6 15 20 15 6 1 [1] 128 1 7 21 35 35 21 7 1 [1] 256 1 8 28 56 70 56 28 8 1 [1] 512 1 9 36 84 126 126 84 36 9 1 [1] 1024 1 10 45 120 210 252 210 120 45 10 1
22a Model VAR
I szczegoacutelny przypadek modelu SUR (Seemingly UnrelatedRegressions)
I identyczne zmienne objasniajace na przestrzeni roacutewnań -gt MNKI możliowść implementacji IRF (Impulse Response Function) i FEVDI model dla zmiennych stacjonarnych - zmienne skointegrowane VECMI metoda zaliczana do Data MiningI brak wnioskowania ekonomicznego
22b Liczba iteracji - model VAR
0
2500000
5000000
7500000
10000000
5 10 15 20liczba zmiennych
n_ite
r
25
50
75
100lag
Liczba modeli VAR vs liczba zmiennych
22b2 Liczba regresji - model VAR
0
25000000
50000000
75000000
100000000
5 10 15 20liczba zmiennych
n_ite
r
25
50
75
100lag
Liczba regresji vs liczba zmiennych
22c Duża ilość zmiennych objasniających
Redukcja wymiaru macierzy
I PCA (Principal Components Anlysis)I LDA (Linear discriminan analysis)
PCA jest czysto techniczna operacja w przeciwieństwie do LDA ktoacuterezachowuje informacje służącą klasyfikacji zmiennych
Problemy
I Interpretacja zmiennychI Niestandardowy rozkład zmiennych
22d MODEL VAR - Data Mining
col_nameslt-c(CPIUS_MMPKBPL_PROC_RET1CommodityIndex_RET1M3_RET1USD_RET1UR_RET1SALDO_RET1FED_RET1BEZROB_RET1BRENT_RET1LIBOR3mEUR_RET1ZYWN_A_RET1PKBUS_RET1WIBOR3M_RET1)
comlt-(combn(length(col_names)2simplify = FALSE))for(i in 314)
comlt-c(comcombn(length(col_names)isimplify = FALSE))length(com)10
[1] 163690
Transformacje średnia ruchoma stopy zwrotu
22e MODEL VAR - Data Mining 2all_R2lt-array(NAc(length(com)2nr_lag))
for(g in 1nr_lag)
R2lt-vector(numericlength(com))SERIALlt-vector(numericlength(com))for(i in 1length(com))
model1lt-VAR(data_noLAG_NA[c(CPIPL_MMcol_names[com[[i]]])]p=gtype=const)
sum_VARlt-summary(model1$varresult$CPIPL_MM)
R2[i]lt-sum_VAR$adjrsquaredSERIAL[i]lt-serialtest(model1)$serial$pvalueprint(paste(ilength(com)g))
all_R2[1g]lt-R2all_R2[2g]lt-SERIAL
31a Dane Akcyjne HFT
I DLC
DLC (Dual Listed Companies) są efektem połączenia dwoacutech spoacutełekSpoacutełki posiadają osobną osobowość prawną dzięki czemu mogą byćjednocześnie jednak oddzielnie notowane na swoim macierzystym rynkuDochody dzielone są zgodnie z equalization agreement ratio- najczęściejdzielą się zyskami po roacutewno
I GRS
GRS klasyczne akcje notowane pod jednym numerem ISIN na całymświecie
I DR
DR można powiązać z polską definicją kwitu depozytowego
31b Przykład prostego kodu dla symulacji repeat breakStart Premia+diffcc = (price1-price2currency)price1
repeatrepeat
ilt-i+1if (dane[idiffcc]gt015)
shortlt-dane[iprice1]longlt-dane[iprice2]break
print(dane[ic(price1price2currencydiffcc)])blt-irepeat
ilt-i+1if ( dane[idiffcc]lt(-015))
long2lt-dane[iprice1]short2lt-dane[iprice2]break
print(dane[ic(price1price2currencydiffcc)])
31c SYMULACJE ARBITRAŻU
I market frictions (krotka sprzedaz koszty tranzakcyjne kosztalternatywny)
I prawdop zrealizowania zleceniaI ilość volumenu z danej minuty - czekamy na częściową realizacjeI poziom premii inicjujący startegie - EVTI jak długo czekamy z zamknięciem pozycji
31d Wyniki symulacji
SYMULACJA W PLIKU SymulacjaStrategyFromposR
KONIECCo zyskujesz angażując się w pracę Fundacji QF
Wiedzę z zakresu finansoacutew ilościowych i nauk pokrewnych Doświadczeniezawodowe i unikalne możliwości networkingowe Realizację projektoacutew dlanajwiększych instytucji finansowych w Polsce Swobodę w organizowaniuswojej pracy i doskonalenie umiejętności organizacyjnych Miłą atmosferę isatysfakcję Zapraszamy do kontaktu
wwwquantitativefinanceorgplfundacjaquantitativefinanceorgpl
Kontakt
Maciej Nasiński Lead Analystnasinskimaciejgmailcom
Piotr Cymcyk Prezes Zarządupiotrcymcykquantitativefinanceorgpl
Wojciech Zdunkiewicz Członek Zarząduwzdunkiewiczquantitativefinanceorgpl
BibliografiaPhilippe Massicotte and Dirk Eddelbuettel (2016) gtrendsR R Functionsto Perform and Display Google Trends Queries R package version 133httpsCRANR-projectorgpackage=gtrendsR
Hadley Wickham and Romain Francois (2015) dplyr A Grammar of DataManipulation R package version 043httpsCRANR-projectorgpackage=dplyr
Hadley Wickham (2015) tidyr Easily Tidy Data with spread() andgather() Functions R package version 031httpsCRANR-projectorgpackage=tidyr
Bernhard Pfaff (2008) VAR SVAR and SVEC Models ImplementationWithin R Package vars Journal of Statistical Software 27(4) URLhttpwwwjstatsoftorgv27i04
httpsmranmicrosoftcomopen
httpswwwwundergroundcom
httpswwwgooglepltrendshl=pl
1 Interesujące dane Finansowe i nie tylko
Notowania
I Google Finance (Reuters) - wysokie limity dane o wyskiejczestotliwości - max 15 dni
I Stooq - niskie limity
Naturalny popyt (modelowanie sprzedaży)
I Google Trends - skalowana przez Google liczba wyszukań danej frazyI Wunderground - dane pogodowe
11a Google Finance
source(GFR)nameslt-c(WSEWIG20)for(f in names)GoogleFinance(f6015)
Google Finance WIG20
CZAS UNIX - strefy czasowe
11b Dane Google Finance
WSEWIG20
time
Pric
e
2016minus04minus04 000000 2016minus04minus11 000000 2016minus04minus18 000000
1900
1920
1940
1960
1980
12a Google Trends
gconnect(usr psw)tlt-gtrends(c(wiedzmincall of duty)
start_date =(asDate(Systime())-1900)geo=PL)
source(GoogleTdayR)GoogleTrendDaliy(nam=c(wiedzmincall of duty)type=relativegeo=PLres=day)
12b Dane Google Trends
2011 2012 2013 2014 2015 2016
1020
3040
50
time
valu
e
name
wiedzmin call of duty
13a Wunderground
source(Weather_dayR)source(Weather_weekR)nlt-c(londonbirminghamglasgow)citylt-c(EGLCEGBBEGPF)source(Weather_weekR)
Wunderground LONDON
for(i in 1length(city))repeaturllt-paste0(httpswww )webpagelt-try(readcsv(url))if(class(webpage)==try-error)cat(connection problem restart downloading current iteration)res_city[[i]]lt-webpageif(class(webpage)=try-error) break
13b Dane Wunderground
GMT 2013-02-02 2013-02-03 MaxTemperatureC_london 5 9 MeanTemperatureC_london 3 4 MinTemperatureC_london 2 1 DewPointC_london 2 7 MeanDewPointC_london -1 2 MinDewpointC_london -3 -4 MaxHumidity_london 81 87 MeanHumidity_london 71 80 MinHumidity_london 57 70 MaxSeaLevelPressurehPa_london 1024 1024 MeanSeaLevelPressurehPa_london 1016 1018 MinSeaLevelPressurehPa_london 1003 1013 MaxVisibilityKm_london 10 10 MeanVisibilityKm_london 10 10
14a Ściaganie danych - API
Bazowanie na pustych sekwencjach czasowych
I eliminuje problem z brakujacymi obserwacjamiI ułatwia łącznie danych (cbind vs merge)I umożliwia łatwe skalowanie czasowe np dzienne na tygodniowe
Wykorzystanie funkcji typu try() oraz repeat() badz while()
I ogranicza błędy w komunikacji
21a Troacutejkąt Pascala
[1] 1 [1] 1 1 [1] 1 2 1 [1] 1 3 3 1 [1] 1 4 6 4 1 [1] 1 5 10 10 5 1 [1] 1 6 15 20 15 6 1 [1] 1 7 21 35 35 21 7 1 [1] 1 8 28 56 70 56 28 8 1
21b Troacutejkąt Pascala
[1] 1 1 [1] 2 1 1 [1] 4 1 2 1 [1] 8 1 3 3 1 [1] 16 1 4 6 4 1 [1] 32 1 5 10 10 5 1 [1] 64 1 6 15 20 15 6 1 [1] 128 1 7 21 35 35 21 7 1 [1] 256 1 8 28 56 70 56 28 8 1 [1] 512 1 9 36 84 126 126 84 36 9 1 [1] 1024 1 10 45 120 210 252 210 120 45 10 1
22a Model VAR
I szczegoacutelny przypadek modelu SUR (Seemingly UnrelatedRegressions)
I identyczne zmienne objasniajace na przestrzeni roacutewnań -gt MNKI możliowść implementacji IRF (Impulse Response Function) i FEVDI model dla zmiennych stacjonarnych - zmienne skointegrowane VECMI metoda zaliczana do Data MiningI brak wnioskowania ekonomicznego
22b Liczba iteracji - model VAR
0
2500000
5000000
7500000
10000000
5 10 15 20liczba zmiennych
n_ite
r
25
50
75
100lag
Liczba modeli VAR vs liczba zmiennych
22b2 Liczba regresji - model VAR
0
25000000
50000000
75000000
100000000
5 10 15 20liczba zmiennych
n_ite
r
25
50
75
100lag
Liczba regresji vs liczba zmiennych
22c Duża ilość zmiennych objasniających
Redukcja wymiaru macierzy
I PCA (Principal Components Anlysis)I LDA (Linear discriminan analysis)
PCA jest czysto techniczna operacja w przeciwieństwie do LDA ktoacuterezachowuje informacje służącą klasyfikacji zmiennych
Problemy
I Interpretacja zmiennychI Niestandardowy rozkład zmiennych
22d MODEL VAR - Data Mining
col_nameslt-c(CPIUS_MMPKBPL_PROC_RET1CommodityIndex_RET1M3_RET1USD_RET1UR_RET1SALDO_RET1FED_RET1BEZROB_RET1BRENT_RET1LIBOR3mEUR_RET1ZYWN_A_RET1PKBUS_RET1WIBOR3M_RET1)
comlt-(combn(length(col_names)2simplify = FALSE))for(i in 314)
comlt-c(comcombn(length(col_names)isimplify = FALSE))length(com)10
[1] 163690
Transformacje średnia ruchoma stopy zwrotu
22e MODEL VAR - Data Mining 2all_R2lt-array(NAc(length(com)2nr_lag))
for(g in 1nr_lag)
R2lt-vector(numericlength(com))SERIALlt-vector(numericlength(com))for(i in 1length(com))
model1lt-VAR(data_noLAG_NA[c(CPIPL_MMcol_names[com[[i]]])]p=gtype=const)
sum_VARlt-summary(model1$varresult$CPIPL_MM)
R2[i]lt-sum_VAR$adjrsquaredSERIAL[i]lt-serialtest(model1)$serial$pvalueprint(paste(ilength(com)g))
all_R2[1g]lt-R2all_R2[2g]lt-SERIAL
31a Dane Akcyjne HFT
I DLC
DLC (Dual Listed Companies) są efektem połączenia dwoacutech spoacutełekSpoacutełki posiadają osobną osobowość prawną dzięki czemu mogą byćjednocześnie jednak oddzielnie notowane na swoim macierzystym rynkuDochody dzielone są zgodnie z equalization agreement ratio- najczęściejdzielą się zyskami po roacutewno
I GRS
GRS klasyczne akcje notowane pod jednym numerem ISIN na całymświecie
I DR
DR można powiązać z polską definicją kwitu depozytowego
31b Przykład prostego kodu dla symulacji repeat breakStart Premia+diffcc = (price1-price2currency)price1
repeatrepeat
ilt-i+1if (dane[idiffcc]gt015)
shortlt-dane[iprice1]longlt-dane[iprice2]break
print(dane[ic(price1price2currencydiffcc)])blt-irepeat
ilt-i+1if ( dane[idiffcc]lt(-015))
long2lt-dane[iprice1]short2lt-dane[iprice2]break
print(dane[ic(price1price2currencydiffcc)])
31c SYMULACJE ARBITRAŻU
I market frictions (krotka sprzedaz koszty tranzakcyjne kosztalternatywny)
I prawdop zrealizowania zleceniaI ilość volumenu z danej minuty - czekamy na częściową realizacjeI poziom premii inicjujący startegie - EVTI jak długo czekamy z zamknięciem pozycji
31d Wyniki symulacji
SYMULACJA W PLIKU SymulacjaStrategyFromposR
KONIECCo zyskujesz angażując się w pracę Fundacji QF
Wiedzę z zakresu finansoacutew ilościowych i nauk pokrewnych Doświadczeniezawodowe i unikalne możliwości networkingowe Realizację projektoacutew dlanajwiększych instytucji finansowych w Polsce Swobodę w organizowaniuswojej pracy i doskonalenie umiejętności organizacyjnych Miłą atmosferę isatysfakcję Zapraszamy do kontaktu
wwwquantitativefinanceorgplfundacjaquantitativefinanceorgpl
Kontakt
Maciej Nasiński Lead Analystnasinskimaciejgmailcom
Piotr Cymcyk Prezes Zarządupiotrcymcykquantitativefinanceorgpl
Wojciech Zdunkiewicz Członek Zarząduwzdunkiewiczquantitativefinanceorgpl
BibliografiaPhilippe Massicotte and Dirk Eddelbuettel (2016) gtrendsR R Functionsto Perform and Display Google Trends Queries R package version 133httpsCRANR-projectorgpackage=gtrendsR
Hadley Wickham and Romain Francois (2015) dplyr A Grammar of DataManipulation R package version 043httpsCRANR-projectorgpackage=dplyr
Hadley Wickham (2015) tidyr Easily Tidy Data with spread() andgather() Functions R package version 031httpsCRANR-projectorgpackage=tidyr
Bernhard Pfaff (2008) VAR SVAR and SVEC Models ImplementationWithin R Package vars Journal of Statistical Software 27(4) URLhttpwwwjstatsoftorgv27i04
httpsmranmicrosoftcomopen
httpswwwwundergroundcom
httpswwwgooglepltrendshl=pl
11a Google Finance
source(GFR)nameslt-c(WSEWIG20)for(f in names)GoogleFinance(f6015)
Google Finance WIG20
CZAS UNIX - strefy czasowe
11b Dane Google Finance
WSEWIG20
time
Pric
e
2016minus04minus04 000000 2016minus04minus11 000000 2016minus04minus18 000000
1900
1920
1940
1960
1980
12a Google Trends
gconnect(usr psw)tlt-gtrends(c(wiedzmincall of duty)
start_date =(asDate(Systime())-1900)geo=PL)
source(GoogleTdayR)GoogleTrendDaliy(nam=c(wiedzmincall of duty)type=relativegeo=PLres=day)
12b Dane Google Trends
2011 2012 2013 2014 2015 2016
1020
3040
50
time
valu
e
name
wiedzmin call of duty
13a Wunderground
source(Weather_dayR)source(Weather_weekR)nlt-c(londonbirminghamglasgow)citylt-c(EGLCEGBBEGPF)source(Weather_weekR)
Wunderground LONDON
for(i in 1length(city))repeaturllt-paste0(httpswww )webpagelt-try(readcsv(url))if(class(webpage)==try-error)cat(connection problem restart downloading current iteration)res_city[[i]]lt-webpageif(class(webpage)=try-error) break
13b Dane Wunderground
GMT 2013-02-02 2013-02-03 MaxTemperatureC_london 5 9 MeanTemperatureC_london 3 4 MinTemperatureC_london 2 1 DewPointC_london 2 7 MeanDewPointC_london -1 2 MinDewpointC_london -3 -4 MaxHumidity_london 81 87 MeanHumidity_london 71 80 MinHumidity_london 57 70 MaxSeaLevelPressurehPa_london 1024 1024 MeanSeaLevelPressurehPa_london 1016 1018 MinSeaLevelPressurehPa_london 1003 1013 MaxVisibilityKm_london 10 10 MeanVisibilityKm_london 10 10
14a Ściaganie danych - API
Bazowanie na pustych sekwencjach czasowych
I eliminuje problem z brakujacymi obserwacjamiI ułatwia łącznie danych (cbind vs merge)I umożliwia łatwe skalowanie czasowe np dzienne na tygodniowe
Wykorzystanie funkcji typu try() oraz repeat() badz while()
I ogranicza błędy w komunikacji
21a Troacutejkąt Pascala
[1] 1 [1] 1 1 [1] 1 2 1 [1] 1 3 3 1 [1] 1 4 6 4 1 [1] 1 5 10 10 5 1 [1] 1 6 15 20 15 6 1 [1] 1 7 21 35 35 21 7 1 [1] 1 8 28 56 70 56 28 8 1
21b Troacutejkąt Pascala
[1] 1 1 [1] 2 1 1 [1] 4 1 2 1 [1] 8 1 3 3 1 [1] 16 1 4 6 4 1 [1] 32 1 5 10 10 5 1 [1] 64 1 6 15 20 15 6 1 [1] 128 1 7 21 35 35 21 7 1 [1] 256 1 8 28 56 70 56 28 8 1 [1] 512 1 9 36 84 126 126 84 36 9 1 [1] 1024 1 10 45 120 210 252 210 120 45 10 1
22a Model VAR
I szczegoacutelny przypadek modelu SUR (Seemingly UnrelatedRegressions)
I identyczne zmienne objasniajace na przestrzeni roacutewnań -gt MNKI możliowść implementacji IRF (Impulse Response Function) i FEVDI model dla zmiennych stacjonarnych - zmienne skointegrowane VECMI metoda zaliczana do Data MiningI brak wnioskowania ekonomicznego
22b Liczba iteracji - model VAR
0
2500000
5000000
7500000
10000000
5 10 15 20liczba zmiennych
n_ite
r
25
50
75
100lag
Liczba modeli VAR vs liczba zmiennych
22b2 Liczba regresji - model VAR
0
25000000
50000000
75000000
100000000
5 10 15 20liczba zmiennych
n_ite
r
25
50
75
100lag
Liczba regresji vs liczba zmiennych
22c Duża ilość zmiennych objasniających
Redukcja wymiaru macierzy
I PCA (Principal Components Anlysis)I LDA (Linear discriminan analysis)
PCA jest czysto techniczna operacja w przeciwieństwie do LDA ktoacuterezachowuje informacje służącą klasyfikacji zmiennych
Problemy
I Interpretacja zmiennychI Niestandardowy rozkład zmiennych
22d MODEL VAR - Data Mining
col_nameslt-c(CPIUS_MMPKBPL_PROC_RET1CommodityIndex_RET1M3_RET1USD_RET1UR_RET1SALDO_RET1FED_RET1BEZROB_RET1BRENT_RET1LIBOR3mEUR_RET1ZYWN_A_RET1PKBUS_RET1WIBOR3M_RET1)
comlt-(combn(length(col_names)2simplify = FALSE))for(i in 314)
comlt-c(comcombn(length(col_names)isimplify = FALSE))length(com)10
[1] 163690
Transformacje średnia ruchoma stopy zwrotu
22e MODEL VAR - Data Mining 2all_R2lt-array(NAc(length(com)2nr_lag))
for(g in 1nr_lag)
R2lt-vector(numericlength(com))SERIALlt-vector(numericlength(com))for(i in 1length(com))
model1lt-VAR(data_noLAG_NA[c(CPIPL_MMcol_names[com[[i]]])]p=gtype=const)
sum_VARlt-summary(model1$varresult$CPIPL_MM)
R2[i]lt-sum_VAR$adjrsquaredSERIAL[i]lt-serialtest(model1)$serial$pvalueprint(paste(ilength(com)g))
all_R2[1g]lt-R2all_R2[2g]lt-SERIAL
31a Dane Akcyjne HFT
I DLC
DLC (Dual Listed Companies) są efektem połączenia dwoacutech spoacutełekSpoacutełki posiadają osobną osobowość prawną dzięki czemu mogą byćjednocześnie jednak oddzielnie notowane na swoim macierzystym rynkuDochody dzielone są zgodnie z equalization agreement ratio- najczęściejdzielą się zyskami po roacutewno
I GRS
GRS klasyczne akcje notowane pod jednym numerem ISIN na całymświecie
I DR
DR można powiązać z polską definicją kwitu depozytowego
31b Przykład prostego kodu dla symulacji repeat breakStart Premia+diffcc = (price1-price2currency)price1
repeatrepeat
ilt-i+1if (dane[idiffcc]gt015)
shortlt-dane[iprice1]longlt-dane[iprice2]break
print(dane[ic(price1price2currencydiffcc)])blt-irepeat
ilt-i+1if ( dane[idiffcc]lt(-015))
long2lt-dane[iprice1]short2lt-dane[iprice2]break
print(dane[ic(price1price2currencydiffcc)])
31c SYMULACJE ARBITRAŻU
I market frictions (krotka sprzedaz koszty tranzakcyjne kosztalternatywny)
I prawdop zrealizowania zleceniaI ilość volumenu z danej minuty - czekamy na częściową realizacjeI poziom premii inicjujący startegie - EVTI jak długo czekamy z zamknięciem pozycji
31d Wyniki symulacji
SYMULACJA W PLIKU SymulacjaStrategyFromposR
KONIECCo zyskujesz angażując się w pracę Fundacji QF
Wiedzę z zakresu finansoacutew ilościowych i nauk pokrewnych Doświadczeniezawodowe i unikalne możliwości networkingowe Realizację projektoacutew dlanajwiększych instytucji finansowych w Polsce Swobodę w organizowaniuswojej pracy i doskonalenie umiejętności organizacyjnych Miłą atmosferę isatysfakcję Zapraszamy do kontaktu
wwwquantitativefinanceorgplfundacjaquantitativefinanceorgpl
Kontakt
Maciej Nasiński Lead Analystnasinskimaciejgmailcom
Piotr Cymcyk Prezes Zarządupiotrcymcykquantitativefinanceorgpl
Wojciech Zdunkiewicz Członek Zarząduwzdunkiewiczquantitativefinanceorgpl
BibliografiaPhilippe Massicotte and Dirk Eddelbuettel (2016) gtrendsR R Functionsto Perform and Display Google Trends Queries R package version 133httpsCRANR-projectorgpackage=gtrendsR
Hadley Wickham and Romain Francois (2015) dplyr A Grammar of DataManipulation R package version 043httpsCRANR-projectorgpackage=dplyr
Hadley Wickham (2015) tidyr Easily Tidy Data with spread() andgather() Functions R package version 031httpsCRANR-projectorgpackage=tidyr
Bernhard Pfaff (2008) VAR SVAR and SVEC Models ImplementationWithin R Package vars Journal of Statistical Software 27(4) URLhttpwwwjstatsoftorgv27i04
httpsmranmicrosoftcomopen
httpswwwwundergroundcom
httpswwwgooglepltrendshl=pl
11b Dane Google Finance
WSEWIG20
time
Pric
e
2016minus04minus04 000000 2016minus04minus11 000000 2016minus04minus18 000000
1900
1920
1940
1960
1980
12a Google Trends
gconnect(usr psw)tlt-gtrends(c(wiedzmincall of duty)
start_date =(asDate(Systime())-1900)geo=PL)
source(GoogleTdayR)GoogleTrendDaliy(nam=c(wiedzmincall of duty)type=relativegeo=PLres=day)
12b Dane Google Trends
2011 2012 2013 2014 2015 2016
1020
3040
50
time
valu
e
name
wiedzmin call of duty
13a Wunderground
source(Weather_dayR)source(Weather_weekR)nlt-c(londonbirminghamglasgow)citylt-c(EGLCEGBBEGPF)source(Weather_weekR)
Wunderground LONDON
for(i in 1length(city))repeaturllt-paste0(httpswww )webpagelt-try(readcsv(url))if(class(webpage)==try-error)cat(connection problem restart downloading current iteration)res_city[[i]]lt-webpageif(class(webpage)=try-error) break
13b Dane Wunderground
GMT 2013-02-02 2013-02-03 MaxTemperatureC_london 5 9 MeanTemperatureC_london 3 4 MinTemperatureC_london 2 1 DewPointC_london 2 7 MeanDewPointC_london -1 2 MinDewpointC_london -3 -4 MaxHumidity_london 81 87 MeanHumidity_london 71 80 MinHumidity_london 57 70 MaxSeaLevelPressurehPa_london 1024 1024 MeanSeaLevelPressurehPa_london 1016 1018 MinSeaLevelPressurehPa_london 1003 1013 MaxVisibilityKm_london 10 10 MeanVisibilityKm_london 10 10
14a Ściaganie danych - API
Bazowanie na pustych sekwencjach czasowych
I eliminuje problem z brakujacymi obserwacjamiI ułatwia łącznie danych (cbind vs merge)I umożliwia łatwe skalowanie czasowe np dzienne na tygodniowe
Wykorzystanie funkcji typu try() oraz repeat() badz while()
I ogranicza błędy w komunikacji
21a Troacutejkąt Pascala
[1] 1 [1] 1 1 [1] 1 2 1 [1] 1 3 3 1 [1] 1 4 6 4 1 [1] 1 5 10 10 5 1 [1] 1 6 15 20 15 6 1 [1] 1 7 21 35 35 21 7 1 [1] 1 8 28 56 70 56 28 8 1
21b Troacutejkąt Pascala
[1] 1 1 [1] 2 1 1 [1] 4 1 2 1 [1] 8 1 3 3 1 [1] 16 1 4 6 4 1 [1] 32 1 5 10 10 5 1 [1] 64 1 6 15 20 15 6 1 [1] 128 1 7 21 35 35 21 7 1 [1] 256 1 8 28 56 70 56 28 8 1 [1] 512 1 9 36 84 126 126 84 36 9 1 [1] 1024 1 10 45 120 210 252 210 120 45 10 1
22a Model VAR
I szczegoacutelny przypadek modelu SUR (Seemingly UnrelatedRegressions)
I identyczne zmienne objasniajace na przestrzeni roacutewnań -gt MNKI możliowść implementacji IRF (Impulse Response Function) i FEVDI model dla zmiennych stacjonarnych - zmienne skointegrowane VECMI metoda zaliczana do Data MiningI brak wnioskowania ekonomicznego
22b Liczba iteracji - model VAR
0
2500000
5000000
7500000
10000000
5 10 15 20liczba zmiennych
n_ite
r
25
50
75
100lag
Liczba modeli VAR vs liczba zmiennych
22b2 Liczba regresji - model VAR
0
25000000
50000000
75000000
100000000
5 10 15 20liczba zmiennych
n_ite
r
25
50
75
100lag
Liczba regresji vs liczba zmiennych
22c Duża ilość zmiennych objasniających
Redukcja wymiaru macierzy
I PCA (Principal Components Anlysis)I LDA (Linear discriminan analysis)
PCA jest czysto techniczna operacja w przeciwieństwie do LDA ktoacuterezachowuje informacje służącą klasyfikacji zmiennych
Problemy
I Interpretacja zmiennychI Niestandardowy rozkład zmiennych
22d MODEL VAR - Data Mining
col_nameslt-c(CPIUS_MMPKBPL_PROC_RET1CommodityIndex_RET1M3_RET1USD_RET1UR_RET1SALDO_RET1FED_RET1BEZROB_RET1BRENT_RET1LIBOR3mEUR_RET1ZYWN_A_RET1PKBUS_RET1WIBOR3M_RET1)
comlt-(combn(length(col_names)2simplify = FALSE))for(i in 314)
comlt-c(comcombn(length(col_names)isimplify = FALSE))length(com)10
[1] 163690
Transformacje średnia ruchoma stopy zwrotu
22e MODEL VAR - Data Mining 2all_R2lt-array(NAc(length(com)2nr_lag))
for(g in 1nr_lag)
R2lt-vector(numericlength(com))SERIALlt-vector(numericlength(com))for(i in 1length(com))
model1lt-VAR(data_noLAG_NA[c(CPIPL_MMcol_names[com[[i]]])]p=gtype=const)
sum_VARlt-summary(model1$varresult$CPIPL_MM)
R2[i]lt-sum_VAR$adjrsquaredSERIAL[i]lt-serialtest(model1)$serial$pvalueprint(paste(ilength(com)g))
all_R2[1g]lt-R2all_R2[2g]lt-SERIAL
31a Dane Akcyjne HFT
I DLC
DLC (Dual Listed Companies) są efektem połączenia dwoacutech spoacutełekSpoacutełki posiadają osobną osobowość prawną dzięki czemu mogą byćjednocześnie jednak oddzielnie notowane na swoim macierzystym rynkuDochody dzielone są zgodnie z equalization agreement ratio- najczęściejdzielą się zyskami po roacutewno
I GRS
GRS klasyczne akcje notowane pod jednym numerem ISIN na całymświecie
I DR
DR można powiązać z polską definicją kwitu depozytowego
31b Przykład prostego kodu dla symulacji repeat breakStart Premia+diffcc = (price1-price2currency)price1
repeatrepeat
ilt-i+1if (dane[idiffcc]gt015)
shortlt-dane[iprice1]longlt-dane[iprice2]break
print(dane[ic(price1price2currencydiffcc)])blt-irepeat
ilt-i+1if ( dane[idiffcc]lt(-015))
long2lt-dane[iprice1]short2lt-dane[iprice2]break
print(dane[ic(price1price2currencydiffcc)])
31c SYMULACJE ARBITRAŻU
I market frictions (krotka sprzedaz koszty tranzakcyjne kosztalternatywny)
I prawdop zrealizowania zleceniaI ilość volumenu z danej minuty - czekamy na częściową realizacjeI poziom premii inicjujący startegie - EVTI jak długo czekamy z zamknięciem pozycji
31d Wyniki symulacji
SYMULACJA W PLIKU SymulacjaStrategyFromposR
KONIECCo zyskujesz angażując się w pracę Fundacji QF
Wiedzę z zakresu finansoacutew ilościowych i nauk pokrewnych Doświadczeniezawodowe i unikalne możliwości networkingowe Realizację projektoacutew dlanajwiększych instytucji finansowych w Polsce Swobodę w organizowaniuswojej pracy i doskonalenie umiejętności organizacyjnych Miłą atmosferę isatysfakcję Zapraszamy do kontaktu
wwwquantitativefinanceorgplfundacjaquantitativefinanceorgpl
Kontakt
Maciej Nasiński Lead Analystnasinskimaciejgmailcom
Piotr Cymcyk Prezes Zarządupiotrcymcykquantitativefinanceorgpl
Wojciech Zdunkiewicz Członek Zarząduwzdunkiewiczquantitativefinanceorgpl
BibliografiaPhilippe Massicotte and Dirk Eddelbuettel (2016) gtrendsR R Functionsto Perform and Display Google Trends Queries R package version 133httpsCRANR-projectorgpackage=gtrendsR
Hadley Wickham and Romain Francois (2015) dplyr A Grammar of DataManipulation R package version 043httpsCRANR-projectorgpackage=dplyr
Hadley Wickham (2015) tidyr Easily Tidy Data with spread() andgather() Functions R package version 031httpsCRANR-projectorgpackage=tidyr
Bernhard Pfaff (2008) VAR SVAR and SVEC Models ImplementationWithin R Package vars Journal of Statistical Software 27(4) URLhttpwwwjstatsoftorgv27i04
httpsmranmicrosoftcomopen
httpswwwwundergroundcom
httpswwwgooglepltrendshl=pl
12a Google Trends
gconnect(usr psw)tlt-gtrends(c(wiedzmincall of duty)
start_date =(asDate(Systime())-1900)geo=PL)
source(GoogleTdayR)GoogleTrendDaliy(nam=c(wiedzmincall of duty)type=relativegeo=PLres=day)
12b Dane Google Trends
2011 2012 2013 2014 2015 2016
1020
3040
50
time
valu
e
name
wiedzmin call of duty
13a Wunderground
source(Weather_dayR)source(Weather_weekR)nlt-c(londonbirminghamglasgow)citylt-c(EGLCEGBBEGPF)source(Weather_weekR)
Wunderground LONDON
for(i in 1length(city))repeaturllt-paste0(httpswww )webpagelt-try(readcsv(url))if(class(webpage)==try-error)cat(connection problem restart downloading current iteration)res_city[[i]]lt-webpageif(class(webpage)=try-error) break
13b Dane Wunderground
GMT 2013-02-02 2013-02-03 MaxTemperatureC_london 5 9 MeanTemperatureC_london 3 4 MinTemperatureC_london 2 1 DewPointC_london 2 7 MeanDewPointC_london -1 2 MinDewpointC_london -3 -4 MaxHumidity_london 81 87 MeanHumidity_london 71 80 MinHumidity_london 57 70 MaxSeaLevelPressurehPa_london 1024 1024 MeanSeaLevelPressurehPa_london 1016 1018 MinSeaLevelPressurehPa_london 1003 1013 MaxVisibilityKm_london 10 10 MeanVisibilityKm_london 10 10
14a Ściaganie danych - API
Bazowanie na pustych sekwencjach czasowych
I eliminuje problem z brakujacymi obserwacjamiI ułatwia łącznie danych (cbind vs merge)I umożliwia łatwe skalowanie czasowe np dzienne na tygodniowe
Wykorzystanie funkcji typu try() oraz repeat() badz while()
I ogranicza błędy w komunikacji
21a Troacutejkąt Pascala
[1] 1 [1] 1 1 [1] 1 2 1 [1] 1 3 3 1 [1] 1 4 6 4 1 [1] 1 5 10 10 5 1 [1] 1 6 15 20 15 6 1 [1] 1 7 21 35 35 21 7 1 [1] 1 8 28 56 70 56 28 8 1
21b Troacutejkąt Pascala
[1] 1 1 [1] 2 1 1 [1] 4 1 2 1 [1] 8 1 3 3 1 [1] 16 1 4 6 4 1 [1] 32 1 5 10 10 5 1 [1] 64 1 6 15 20 15 6 1 [1] 128 1 7 21 35 35 21 7 1 [1] 256 1 8 28 56 70 56 28 8 1 [1] 512 1 9 36 84 126 126 84 36 9 1 [1] 1024 1 10 45 120 210 252 210 120 45 10 1
22a Model VAR
I szczegoacutelny przypadek modelu SUR (Seemingly UnrelatedRegressions)
I identyczne zmienne objasniajace na przestrzeni roacutewnań -gt MNKI możliowść implementacji IRF (Impulse Response Function) i FEVDI model dla zmiennych stacjonarnych - zmienne skointegrowane VECMI metoda zaliczana do Data MiningI brak wnioskowania ekonomicznego
22b Liczba iteracji - model VAR
0
2500000
5000000
7500000
10000000
5 10 15 20liczba zmiennych
n_ite
r
25
50
75
100lag
Liczba modeli VAR vs liczba zmiennych
22b2 Liczba regresji - model VAR
0
25000000
50000000
75000000
100000000
5 10 15 20liczba zmiennych
n_ite
r
25
50
75
100lag
Liczba regresji vs liczba zmiennych
22c Duża ilość zmiennych objasniających
Redukcja wymiaru macierzy
I PCA (Principal Components Anlysis)I LDA (Linear discriminan analysis)
PCA jest czysto techniczna operacja w przeciwieństwie do LDA ktoacuterezachowuje informacje służącą klasyfikacji zmiennych
Problemy
I Interpretacja zmiennychI Niestandardowy rozkład zmiennych
22d MODEL VAR - Data Mining
col_nameslt-c(CPIUS_MMPKBPL_PROC_RET1CommodityIndex_RET1M3_RET1USD_RET1UR_RET1SALDO_RET1FED_RET1BEZROB_RET1BRENT_RET1LIBOR3mEUR_RET1ZYWN_A_RET1PKBUS_RET1WIBOR3M_RET1)
comlt-(combn(length(col_names)2simplify = FALSE))for(i in 314)
comlt-c(comcombn(length(col_names)isimplify = FALSE))length(com)10
[1] 163690
Transformacje średnia ruchoma stopy zwrotu
22e MODEL VAR - Data Mining 2all_R2lt-array(NAc(length(com)2nr_lag))
for(g in 1nr_lag)
R2lt-vector(numericlength(com))SERIALlt-vector(numericlength(com))for(i in 1length(com))
model1lt-VAR(data_noLAG_NA[c(CPIPL_MMcol_names[com[[i]]])]p=gtype=const)
sum_VARlt-summary(model1$varresult$CPIPL_MM)
R2[i]lt-sum_VAR$adjrsquaredSERIAL[i]lt-serialtest(model1)$serial$pvalueprint(paste(ilength(com)g))
all_R2[1g]lt-R2all_R2[2g]lt-SERIAL
31a Dane Akcyjne HFT
I DLC
DLC (Dual Listed Companies) są efektem połączenia dwoacutech spoacutełekSpoacutełki posiadają osobną osobowość prawną dzięki czemu mogą byćjednocześnie jednak oddzielnie notowane na swoim macierzystym rynkuDochody dzielone są zgodnie z equalization agreement ratio- najczęściejdzielą się zyskami po roacutewno
I GRS
GRS klasyczne akcje notowane pod jednym numerem ISIN na całymświecie
I DR
DR można powiązać z polską definicją kwitu depozytowego
31b Przykład prostego kodu dla symulacji repeat breakStart Premia+diffcc = (price1-price2currency)price1
repeatrepeat
ilt-i+1if (dane[idiffcc]gt015)
shortlt-dane[iprice1]longlt-dane[iprice2]break
print(dane[ic(price1price2currencydiffcc)])blt-irepeat
ilt-i+1if ( dane[idiffcc]lt(-015))
long2lt-dane[iprice1]short2lt-dane[iprice2]break
print(dane[ic(price1price2currencydiffcc)])
31c SYMULACJE ARBITRAŻU
I market frictions (krotka sprzedaz koszty tranzakcyjne kosztalternatywny)
I prawdop zrealizowania zleceniaI ilość volumenu z danej minuty - czekamy na częściową realizacjeI poziom premii inicjujący startegie - EVTI jak długo czekamy z zamknięciem pozycji
31d Wyniki symulacji
SYMULACJA W PLIKU SymulacjaStrategyFromposR
KONIECCo zyskujesz angażując się w pracę Fundacji QF
Wiedzę z zakresu finansoacutew ilościowych i nauk pokrewnych Doświadczeniezawodowe i unikalne możliwości networkingowe Realizację projektoacutew dlanajwiększych instytucji finansowych w Polsce Swobodę w organizowaniuswojej pracy i doskonalenie umiejętności organizacyjnych Miłą atmosferę isatysfakcję Zapraszamy do kontaktu
wwwquantitativefinanceorgplfundacjaquantitativefinanceorgpl
Kontakt
Maciej Nasiński Lead Analystnasinskimaciejgmailcom
Piotr Cymcyk Prezes Zarządupiotrcymcykquantitativefinanceorgpl
Wojciech Zdunkiewicz Członek Zarząduwzdunkiewiczquantitativefinanceorgpl
BibliografiaPhilippe Massicotte and Dirk Eddelbuettel (2016) gtrendsR R Functionsto Perform and Display Google Trends Queries R package version 133httpsCRANR-projectorgpackage=gtrendsR
Hadley Wickham and Romain Francois (2015) dplyr A Grammar of DataManipulation R package version 043httpsCRANR-projectorgpackage=dplyr
Hadley Wickham (2015) tidyr Easily Tidy Data with spread() andgather() Functions R package version 031httpsCRANR-projectorgpackage=tidyr
Bernhard Pfaff (2008) VAR SVAR and SVEC Models ImplementationWithin R Package vars Journal of Statistical Software 27(4) URLhttpwwwjstatsoftorgv27i04
httpsmranmicrosoftcomopen
httpswwwwundergroundcom
httpswwwgooglepltrendshl=pl
12b Dane Google Trends
2011 2012 2013 2014 2015 2016
1020
3040
50
time
valu
e
name
wiedzmin call of duty
13a Wunderground
source(Weather_dayR)source(Weather_weekR)nlt-c(londonbirminghamglasgow)citylt-c(EGLCEGBBEGPF)source(Weather_weekR)
Wunderground LONDON
for(i in 1length(city))repeaturllt-paste0(httpswww )webpagelt-try(readcsv(url))if(class(webpage)==try-error)cat(connection problem restart downloading current iteration)res_city[[i]]lt-webpageif(class(webpage)=try-error) break
13b Dane Wunderground
GMT 2013-02-02 2013-02-03 MaxTemperatureC_london 5 9 MeanTemperatureC_london 3 4 MinTemperatureC_london 2 1 DewPointC_london 2 7 MeanDewPointC_london -1 2 MinDewpointC_london -3 -4 MaxHumidity_london 81 87 MeanHumidity_london 71 80 MinHumidity_london 57 70 MaxSeaLevelPressurehPa_london 1024 1024 MeanSeaLevelPressurehPa_london 1016 1018 MinSeaLevelPressurehPa_london 1003 1013 MaxVisibilityKm_london 10 10 MeanVisibilityKm_london 10 10
14a Ściaganie danych - API
Bazowanie na pustych sekwencjach czasowych
I eliminuje problem z brakujacymi obserwacjamiI ułatwia łącznie danych (cbind vs merge)I umożliwia łatwe skalowanie czasowe np dzienne na tygodniowe
Wykorzystanie funkcji typu try() oraz repeat() badz while()
I ogranicza błędy w komunikacji
21a Troacutejkąt Pascala
[1] 1 [1] 1 1 [1] 1 2 1 [1] 1 3 3 1 [1] 1 4 6 4 1 [1] 1 5 10 10 5 1 [1] 1 6 15 20 15 6 1 [1] 1 7 21 35 35 21 7 1 [1] 1 8 28 56 70 56 28 8 1
21b Troacutejkąt Pascala
[1] 1 1 [1] 2 1 1 [1] 4 1 2 1 [1] 8 1 3 3 1 [1] 16 1 4 6 4 1 [1] 32 1 5 10 10 5 1 [1] 64 1 6 15 20 15 6 1 [1] 128 1 7 21 35 35 21 7 1 [1] 256 1 8 28 56 70 56 28 8 1 [1] 512 1 9 36 84 126 126 84 36 9 1 [1] 1024 1 10 45 120 210 252 210 120 45 10 1
22a Model VAR
I szczegoacutelny przypadek modelu SUR (Seemingly UnrelatedRegressions)
I identyczne zmienne objasniajace na przestrzeni roacutewnań -gt MNKI możliowść implementacji IRF (Impulse Response Function) i FEVDI model dla zmiennych stacjonarnych - zmienne skointegrowane VECMI metoda zaliczana do Data MiningI brak wnioskowania ekonomicznego
22b Liczba iteracji - model VAR
0
2500000
5000000
7500000
10000000
5 10 15 20liczba zmiennych
n_ite
r
25
50
75
100lag
Liczba modeli VAR vs liczba zmiennych
22b2 Liczba regresji - model VAR
0
25000000
50000000
75000000
100000000
5 10 15 20liczba zmiennych
n_ite
r
25
50
75
100lag
Liczba regresji vs liczba zmiennych
22c Duża ilość zmiennych objasniających
Redukcja wymiaru macierzy
I PCA (Principal Components Anlysis)I LDA (Linear discriminan analysis)
PCA jest czysto techniczna operacja w przeciwieństwie do LDA ktoacuterezachowuje informacje służącą klasyfikacji zmiennych
Problemy
I Interpretacja zmiennychI Niestandardowy rozkład zmiennych
22d MODEL VAR - Data Mining
col_nameslt-c(CPIUS_MMPKBPL_PROC_RET1CommodityIndex_RET1M3_RET1USD_RET1UR_RET1SALDO_RET1FED_RET1BEZROB_RET1BRENT_RET1LIBOR3mEUR_RET1ZYWN_A_RET1PKBUS_RET1WIBOR3M_RET1)
comlt-(combn(length(col_names)2simplify = FALSE))for(i in 314)
comlt-c(comcombn(length(col_names)isimplify = FALSE))length(com)10
[1] 163690
Transformacje średnia ruchoma stopy zwrotu
22e MODEL VAR - Data Mining 2all_R2lt-array(NAc(length(com)2nr_lag))
for(g in 1nr_lag)
R2lt-vector(numericlength(com))SERIALlt-vector(numericlength(com))for(i in 1length(com))
model1lt-VAR(data_noLAG_NA[c(CPIPL_MMcol_names[com[[i]]])]p=gtype=const)
sum_VARlt-summary(model1$varresult$CPIPL_MM)
R2[i]lt-sum_VAR$adjrsquaredSERIAL[i]lt-serialtest(model1)$serial$pvalueprint(paste(ilength(com)g))
all_R2[1g]lt-R2all_R2[2g]lt-SERIAL
31a Dane Akcyjne HFT
I DLC
DLC (Dual Listed Companies) są efektem połączenia dwoacutech spoacutełekSpoacutełki posiadają osobną osobowość prawną dzięki czemu mogą byćjednocześnie jednak oddzielnie notowane na swoim macierzystym rynkuDochody dzielone są zgodnie z equalization agreement ratio- najczęściejdzielą się zyskami po roacutewno
I GRS
GRS klasyczne akcje notowane pod jednym numerem ISIN na całymświecie
I DR
DR można powiązać z polską definicją kwitu depozytowego
31b Przykład prostego kodu dla symulacji repeat breakStart Premia+diffcc = (price1-price2currency)price1
repeatrepeat
ilt-i+1if (dane[idiffcc]gt015)
shortlt-dane[iprice1]longlt-dane[iprice2]break
print(dane[ic(price1price2currencydiffcc)])blt-irepeat
ilt-i+1if ( dane[idiffcc]lt(-015))
long2lt-dane[iprice1]short2lt-dane[iprice2]break
print(dane[ic(price1price2currencydiffcc)])
31c SYMULACJE ARBITRAŻU
I market frictions (krotka sprzedaz koszty tranzakcyjne kosztalternatywny)
I prawdop zrealizowania zleceniaI ilość volumenu z danej minuty - czekamy na częściową realizacjeI poziom premii inicjujący startegie - EVTI jak długo czekamy z zamknięciem pozycji
31d Wyniki symulacji
SYMULACJA W PLIKU SymulacjaStrategyFromposR
KONIECCo zyskujesz angażując się w pracę Fundacji QF
Wiedzę z zakresu finansoacutew ilościowych i nauk pokrewnych Doświadczeniezawodowe i unikalne możliwości networkingowe Realizację projektoacutew dlanajwiększych instytucji finansowych w Polsce Swobodę w organizowaniuswojej pracy i doskonalenie umiejętności organizacyjnych Miłą atmosferę isatysfakcję Zapraszamy do kontaktu
wwwquantitativefinanceorgplfundacjaquantitativefinanceorgpl
Kontakt
Maciej Nasiński Lead Analystnasinskimaciejgmailcom
Piotr Cymcyk Prezes Zarządupiotrcymcykquantitativefinanceorgpl
Wojciech Zdunkiewicz Członek Zarząduwzdunkiewiczquantitativefinanceorgpl
BibliografiaPhilippe Massicotte and Dirk Eddelbuettel (2016) gtrendsR R Functionsto Perform and Display Google Trends Queries R package version 133httpsCRANR-projectorgpackage=gtrendsR
Hadley Wickham and Romain Francois (2015) dplyr A Grammar of DataManipulation R package version 043httpsCRANR-projectorgpackage=dplyr
Hadley Wickham (2015) tidyr Easily Tidy Data with spread() andgather() Functions R package version 031httpsCRANR-projectorgpackage=tidyr
Bernhard Pfaff (2008) VAR SVAR and SVEC Models ImplementationWithin R Package vars Journal of Statistical Software 27(4) URLhttpwwwjstatsoftorgv27i04
httpsmranmicrosoftcomopen
httpswwwwundergroundcom
httpswwwgooglepltrendshl=pl
13a Wunderground
source(Weather_dayR)source(Weather_weekR)nlt-c(londonbirminghamglasgow)citylt-c(EGLCEGBBEGPF)source(Weather_weekR)
Wunderground LONDON
for(i in 1length(city))repeaturllt-paste0(httpswww )webpagelt-try(readcsv(url))if(class(webpage)==try-error)cat(connection problem restart downloading current iteration)res_city[[i]]lt-webpageif(class(webpage)=try-error) break
13b Dane Wunderground
GMT 2013-02-02 2013-02-03 MaxTemperatureC_london 5 9 MeanTemperatureC_london 3 4 MinTemperatureC_london 2 1 DewPointC_london 2 7 MeanDewPointC_london -1 2 MinDewpointC_london -3 -4 MaxHumidity_london 81 87 MeanHumidity_london 71 80 MinHumidity_london 57 70 MaxSeaLevelPressurehPa_london 1024 1024 MeanSeaLevelPressurehPa_london 1016 1018 MinSeaLevelPressurehPa_london 1003 1013 MaxVisibilityKm_london 10 10 MeanVisibilityKm_london 10 10
14a Ściaganie danych - API
Bazowanie na pustych sekwencjach czasowych
I eliminuje problem z brakujacymi obserwacjamiI ułatwia łącznie danych (cbind vs merge)I umożliwia łatwe skalowanie czasowe np dzienne na tygodniowe
Wykorzystanie funkcji typu try() oraz repeat() badz while()
I ogranicza błędy w komunikacji
21a Troacutejkąt Pascala
[1] 1 [1] 1 1 [1] 1 2 1 [1] 1 3 3 1 [1] 1 4 6 4 1 [1] 1 5 10 10 5 1 [1] 1 6 15 20 15 6 1 [1] 1 7 21 35 35 21 7 1 [1] 1 8 28 56 70 56 28 8 1
21b Troacutejkąt Pascala
[1] 1 1 [1] 2 1 1 [1] 4 1 2 1 [1] 8 1 3 3 1 [1] 16 1 4 6 4 1 [1] 32 1 5 10 10 5 1 [1] 64 1 6 15 20 15 6 1 [1] 128 1 7 21 35 35 21 7 1 [1] 256 1 8 28 56 70 56 28 8 1 [1] 512 1 9 36 84 126 126 84 36 9 1 [1] 1024 1 10 45 120 210 252 210 120 45 10 1
22a Model VAR
I szczegoacutelny przypadek modelu SUR (Seemingly UnrelatedRegressions)
I identyczne zmienne objasniajace na przestrzeni roacutewnań -gt MNKI możliowść implementacji IRF (Impulse Response Function) i FEVDI model dla zmiennych stacjonarnych - zmienne skointegrowane VECMI metoda zaliczana do Data MiningI brak wnioskowania ekonomicznego
22b Liczba iteracji - model VAR
0
2500000
5000000
7500000
10000000
5 10 15 20liczba zmiennych
n_ite
r
25
50
75
100lag
Liczba modeli VAR vs liczba zmiennych
22b2 Liczba regresji - model VAR
0
25000000
50000000
75000000
100000000
5 10 15 20liczba zmiennych
n_ite
r
25
50
75
100lag
Liczba regresji vs liczba zmiennych
22c Duża ilość zmiennych objasniających
Redukcja wymiaru macierzy
I PCA (Principal Components Anlysis)I LDA (Linear discriminan analysis)
PCA jest czysto techniczna operacja w przeciwieństwie do LDA ktoacuterezachowuje informacje służącą klasyfikacji zmiennych
Problemy
I Interpretacja zmiennychI Niestandardowy rozkład zmiennych
22d MODEL VAR - Data Mining
col_nameslt-c(CPIUS_MMPKBPL_PROC_RET1CommodityIndex_RET1M3_RET1USD_RET1UR_RET1SALDO_RET1FED_RET1BEZROB_RET1BRENT_RET1LIBOR3mEUR_RET1ZYWN_A_RET1PKBUS_RET1WIBOR3M_RET1)
comlt-(combn(length(col_names)2simplify = FALSE))for(i in 314)
comlt-c(comcombn(length(col_names)isimplify = FALSE))length(com)10
[1] 163690
Transformacje średnia ruchoma stopy zwrotu
22e MODEL VAR - Data Mining 2all_R2lt-array(NAc(length(com)2nr_lag))
for(g in 1nr_lag)
R2lt-vector(numericlength(com))SERIALlt-vector(numericlength(com))for(i in 1length(com))
model1lt-VAR(data_noLAG_NA[c(CPIPL_MMcol_names[com[[i]]])]p=gtype=const)
sum_VARlt-summary(model1$varresult$CPIPL_MM)
R2[i]lt-sum_VAR$adjrsquaredSERIAL[i]lt-serialtest(model1)$serial$pvalueprint(paste(ilength(com)g))
all_R2[1g]lt-R2all_R2[2g]lt-SERIAL
31a Dane Akcyjne HFT
I DLC
DLC (Dual Listed Companies) są efektem połączenia dwoacutech spoacutełekSpoacutełki posiadają osobną osobowość prawną dzięki czemu mogą byćjednocześnie jednak oddzielnie notowane na swoim macierzystym rynkuDochody dzielone są zgodnie z equalization agreement ratio- najczęściejdzielą się zyskami po roacutewno
I GRS
GRS klasyczne akcje notowane pod jednym numerem ISIN na całymświecie
I DR
DR można powiązać z polską definicją kwitu depozytowego
31b Przykład prostego kodu dla symulacji repeat breakStart Premia+diffcc = (price1-price2currency)price1
repeatrepeat
ilt-i+1if (dane[idiffcc]gt015)
shortlt-dane[iprice1]longlt-dane[iprice2]break
print(dane[ic(price1price2currencydiffcc)])blt-irepeat
ilt-i+1if ( dane[idiffcc]lt(-015))
long2lt-dane[iprice1]short2lt-dane[iprice2]break
print(dane[ic(price1price2currencydiffcc)])
31c SYMULACJE ARBITRAŻU
I market frictions (krotka sprzedaz koszty tranzakcyjne kosztalternatywny)
I prawdop zrealizowania zleceniaI ilość volumenu z danej minuty - czekamy na częściową realizacjeI poziom premii inicjujący startegie - EVTI jak długo czekamy z zamknięciem pozycji
31d Wyniki symulacji
SYMULACJA W PLIKU SymulacjaStrategyFromposR
KONIECCo zyskujesz angażując się w pracę Fundacji QF
Wiedzę z zakresu finansoacutew ilościowych i nauk pokrewnych Doświadczeniezawodowe i unikalne możliwości networkingowe Realizację projektoacutew dlanajwiększych instytucji finansowych w Polsce Swobodę w organizowaniuswojej pracy i doskonalenie umiejętności organizacyjnych Miłą atmosferę isatysfakcję Zapraszamy do kontaktu
wwwquantitativefinanceorgplfundacjaquantitativefinanceorgpl
Kontakt
Maciej Nasiński Lead Analystnasinskimaciejgmailcom
Piotr Cymcyk Prezes Zarządupiotrcymcykquantitativefinanceorgpl
Wojciech Zdunkiewicz Członek Zarząduwzdunkiewiczquantitativefinanceorgpl
BibliografiaPhilippe Massicotte and Dirk Eddelbuettel (2016) gtrendsR R Functionsto Perform and Display Google Trends Queries R package version 133httpsCRANR-projectorgpackage=gtrendsR
Hadley Wickham and Romain Francois (2015) dplyr A Grammar of DataManipulation R package version 043httpsCRANR-projectorgpackage=dplyr
Hadley Wickham (2015) tidyr Easily Tidy Data with spread() andgather() Functions R package version 031httpsCRANR-projectorgpackage=tidyr
Bernhard Pfaff (2008) VAR SVAR and SVEC Models ImplementationWithin R Package vars Journal of Statistical Software 27(4) URLhttpwwwjstatsoftorgv27i04
httpsmranmicrosoftcomopen
httpswwwwundergroundcom
httpswwwgooglepltrendshl=pl
13b Dane Wunderground
GMT 2013-02-02 2013-02-03 MaxTemperatureC_london 5 9 MeanTemperatureC_london 3 4 MinTemperatureC_london 2 1 DewPointC_london 2 7 MeanDewPointC_london -1 2 MinDewpointC_london -3 -4 MaxHumidity_london 81 87 MeanHumidity_london 71 80 MinHumidity_london 57 70 MaxSeaLevelPressurehPa_london 1024 1024 MeanSeaLevelPressurehPa_london 1016 1018 MinSeaLevelPressurehPa_london 1003 1013 MaxVisibilityKm_london 10 10 MeanVisibilityKm_london 10 10
14a Ściaganie danych - API
Bazowanie na pustych sekwencjach czasowych
I eliminuje problem z brakujacymi obserwacjamiI ułatwia łącznie danych (cbind vs merge)I umożliwia łatwe skalowanie czasowe np dzienne na tygodniowe
Wykorzystanie funkcji typu try() oraz repeat() badz while()
I ogranicza błędy w komunikacji
21a Troacutejkąt Pascala
[1] 1 [1] 1 1 [1] 1 2 1 [1] 1 3 3 1 [1] 1 4 6 4 1 [1] 1 5 10 10 5 1 [1] 1 6 15 20 15 6 1 [1] 1 7 21 35 35 21 7 1 [1] 1 8 28 56 70 56 28 8 1
21b Troacutejkąt Pascala
[1] 1 1 [1] 2 1 1 [1] 4 1 2 1 [1] 8 1 3 3 1 [1] 16 1 4 6 4 1 [1] 32 1 5 10 10 5 1 [1] 64 1 6 15 20 15 6 1 [1] 128 1 7 21 35 35 21 7 1 [1] 256 1 8 28 56 70 56 28 8 1 [1] 512 1 9 36 84 126 126 84 36 9 1 [1] 1024 1 10 45 120 210 252 210 120 45 10 1
22a Model VAR
I szczegoacutelny przypadek modelu SUR (Seemingly UnrelatedRegressions)
I identyczne zmienne objasniajace na przestrzeni roacutewnań -gt MNKI możliowść implementacji IRF (Impulse Response Function) i FEVDI model dla zmiennych stacjonarnych - zmienne skointegrowane VECMI metoda zaliczana do Data MiningI brak wnioskowania ekonomicznego
22b Liczba iteracji - model VAR
0
2500000
5000000
7500000
10000000
5 10 15 20liczba zmiennych
n_ite
r
25
50
75
100lag
Liczba modeli VAR vs liczba zmiennych
22b2 Liczba regresji - model VAR
0
25000000
50000000
75000000
100000000
5 10 15 20liczba zmiennych
n_ite
r
25
50
75
100lag
Liczba regresji vs liczba zmiennych
22c Duża ilość zmiennych objasniających
Redukcja wymiaru macierzy
I PCA (Principal Components Anlysis)I LDA (Linear discriminan analysis)
PCA jest czysto techniczna operacja w przeciwieństwie do LDA ktoacuterezachowuje informacje służącą klasyfikacji zmiennych
Problemy
I Interpretacja zmiennychI Niestandardowy rozkład zmiennych
22d MODEL VAR - Data Mining
col_nameslt-c(CPIUS_MMPKBPL_PROC_RET1CommodityIndex_RET1M3_RET1USD_RET1UR_RET1SALDO_RET1FED_RET1BEZROB_RET1BRENT_RET1LIBOR3mEUR_RET1ZYWN_A_RET1PKBUS_RET1WIBOR3M_RET1)
comlt-(combn(length(col_names)2simplify = FALSE))for(i in 314)
comlt-c(comcombn(length(col_names)isimplify = FALSE))length(com)10
[1] 163690
Transformacje średnia ruchoma stopy zwrotu
22e MODEL VAR - Data Mining 2all_R2lt-array(NAc(length(com)2nr_lag))
for(g in 1nr_lag)
R2lt-vector(numericlength(com))SERIALlt-vector(numericlength(com))for(i in 1length(com))
model1lt-VAR(data_noLAG_NA[c(CPIPL_MMcol_names[com[[i]]])]p=gtype=const)
sum_VARlt-summary(model1$varresult$CPIPL_MM)
R2[i]lt-sum_VAR$adjrsquaredSERIAL[i]lt-serialtest(model1)$serial$pvalueprint(paste(ilength(com)g))
all_R2[1g]lt-R2all_R2[2g]lt-SERIAL
31a Dane Akcyjne HFT
I DLC
DLC (Dual Listed Companies) są efektem połączenia dwoacutech spoacutełekSpoacutełki posiadają osobną osobowość prawną dzięki czemu mogą byćjednocześnie jednak oddzielnie notowane na swoim macierzystym rynkuDochody dzielone są zgodnie z equalization agreement ratio- najczęściejdzielą się zyskami po roacutewno
I GRS
GRS klasyczne akcje notowane pod jednym numerem ISIN na całymświecie
I DR
DR można powiązać z polską definicją kwitu depozytowego
31b Przykład prostego kodu dla symulacji repeat breakStart Premia+diffcc = (price1-price2currency)price1
repeatrepeat
ilt-i+1if (dane[idiffcc]gt015)
shortlt-dane[iprice1]longlt-dane[iprice2]break
print(dane[ic(price1price2currencydiffcc)])blt-irepeat
ilt-i+1if ( dane[idiffcc]lt(-015))
long2lt-dane[iprice1]short2lt-dane[iprice2]break
print(dane[ic(price1price2currencydiffcc)])
31c SYMULACJE ARBITRAŻU
I market frictions (krotka sprzedaz koszty tranzakcyjne kosztalternatywny)
I prawdop zrealizowania zleceniaI ilość volumenu z danej minuty - czekamy na częściową realizacjeI poziom premii inicjujący startegie - EVTI jak długo czekamy z zamknięciem pozycji
31d Wyniki symulacji
SYMULACJA W PLIKU SymulacjaStrategyFromposR
KONIECCo zyskujesz angażując się w pracę Fundacji QF
Wiedzę z zakresu finansoacutew ilościowych i nauk pokrewnych Doświadczeniezawodowe i unikalne możliwości networkingowe Realizację projektoacutew dlanajwiększych instytucji finansowych w Polsce Swobodę w organizowaniuswojej pracy i doskonalenie umiejętności organizacyjnych Miłą atmosferę isatysfakcję Zapraszamy do kontaktu
wwwquantitativefinanceorgplfundacjaquantitativefinanceorgpl
Kontakt
Maciej Nasiński Lead Analystnasinskimaciejgmailcom
Piotr Cymcyk Prezes Zarządupiotrcymcykquantitativefinanceorgpl
Wojciech Zdunkiewicz Członek Zarząduwzdunkiewiczquantitativefinanceorgpl
BibliografiaPhilippe Massicotte and Dirk Eddelbuettel (2016) gtrendsR R Functionsto Perform and Display Google Trends Queries R package version 133httpsCRANR-projectorgpackage=gtrendsR
Hadley Wickham and Romain Francois (2015) dplyr A Grammar of DataManipulation R package version 043httpsCRANR-projectorgpackage=dplyr
Hadley Wickham (2015) tidyr Easily Tidy Data with spread() andgather() Functions R package version 031httpsCRANR-projectorgpackage=tidyr
Bernhard Pfaff (2008) VAR SVAR and SVEC Models ImplementationWithin R Package vars Journal of Statistical Software 27(4) URLhttpwwwjstatsoftorgv27i04
httpsmranmicrosoftcomopen
httpswwwwundergroundcom
httpswwwgooglepltrendshl=pl
14a Ściaganie danych - API
Bazowanie na pustych sekwencjach czasowych
I eliminuje problem z brakujacymi obserwacjamiI ułatwia łącznie danych (cbind vs merge)I umożliwia łatwe skalowanie czasowe np dzienne na tygodniowe
Wykorzystanie funkcji typu try() oraz repeat() badz while()
I ogranicza błędy w komunikacji
21a Troacutejkąt Pascala
[1] 1 [1] 1 1 [1] 1 2 1 [1] 1 3 3 1 [1] 1 4 6 4 1 [1] 1 5 10 10 5 1 [1] 1 6 15 20 15 6 1 [1] 1 7 21 35 35 21 7 1 [1] 1 8 28 56 70 56 28 8 1
21b Troacutejkąt Pascala
[1] 1 1 [1] 2 1 1 [1] 4 1 2 1 [1] 8 1 3 3 1 [1] 16 1 4 6 4 1 [1] 32 1 5 10 10 5 1 [1] 64 1 6 15 20 15 6 1 [1] 128 1 7 21 35 35 21 7 1 [1] 256 1 8 28 56 70 56 28 8 1 [1] 512 1 9 36 84 126 126 84 36 9 1 [1] 1024 1 10 45 120 210 252 210 120 45 10 1
22a Model VAR
I szczegoacutelny przypadek modelu SUR (Seemingly UnrelatedRegressions)
I identyczne zmienne objasniajace na przestrzeni roacutewnań -gt MNKI możliowść implementacji IRF (Impulse Response Function) i FEVDI model dla zmiennych stacjonarnych - zmienne skointegrowane VECMI metoda zaliczana do Data MiningI brak wnioskowania ekonomicznego
22b Liczba iteracji - model VAR
0
2500000
5000000
7500000
10000000
5 10 15 20liczba zmiennych
n_ite
r
25
50
75
100lag
Liczba modeli VAR vs liczba zmiennych
22b2 Liczba regresji - model VAR
0
25000000
50000000
75000000
100000000
5 10 15 20liczba zmiennych
n_ite
r
25
50
75
100lag
Liczba regresji vs liczba zmiennych
22c Duża ilość zmiennych objasniających
Redukcja wymiaru macierzy
I PCA (Principal Components Anlysis)I LDA (Linear discriminan analysis)
PCA jest czysto techniczna operacja w przeciwieństwie do LDA ktoacuterezachowuje informacje służącą klasyfikacji zmiennych
Problemy
I Interpretacja zmiennychI Niestandardowy rozkład zmiennych
22d MODEL VAR - Data Mining
col_nameslt-c(CPIUS_MMPKBPL_PROC_RET1CommodityIndex_RET1M3_RET1USD_RET1UR_RET1SALDO_RET1FED_RET1BEZROB_RET1BRENT_RET1LIBOR3mEUR_RET1ZYWN_A_RET1PKBUS_RET1WIBOR3M_RET1)
comlt-(combn(length(col_names)2simplify = FALSE))for(i in 314)
comlt-c(comcombn(length(col_names)isimplify = FALSE))length(com)10
[1] 163690
Transformacje średnia ruchoma stopy zwrotu
22e MODEL VAR - Data Mining 2all_R2lt-array(NAc(length(com)2nr_lag))
for(g in 1nr_lag)
R2lt-vector(numericlength(com))SERIALlt-vector(numericlength(com))for(i in 1length(com))
model1lt-VAR(data_noLAG_NA[c(CPIPL_MMcol_names[com[[i]]])]p=gtype=const)
sum_VARlt-summary(model1$varresult$CPIPL_MM)
R2[i]lt-sum_VAR$adjrsquaredSERIAL[i]lt-serialtest(model1)$serial$pvalueprint(paste(ilength(com)g))
all_R2[1g]lt-R2all_R2[2g]lt-SERIAL
31a Dane Akcyjne HFT
I DLC
DLC (Dual Listed Companies) są efektem połączenia dwoacutech spoacutełekSpoacutełki posiadają osobną osobowość prawną dzięki czemu mogą byćjednocześnie jednak oddzielnie notowane na swoim macierzystym rynkuDochody dzielone są zgodnie z equalization agreement ratio- najczęściejdzielą się zyskami po roacutewno
I GRS
GRS klasyczne akcje notowane pod jednym numerem ISIN na całymświecie
I DR
DR można powiązać z polską definicją kwitu depozytowego
31b Przykład prostego kodu dla symulacji repeat breakStart Premia+diffcc = (price1-price2currency)price1
repeatrepeat
ilt-i+1if (dane[idiffcc]gt015)
shortlt-dane[iprice1]longlt-dane[iprice2]break
print(dane[ic(price1price2currencydiffcc)])blt-irepeat
ilt-i+1if ( dane[idiffcc]lt(-015))
long2lt-dane[iprice1]short2lt-dane[iprice2]break
print(dane[ic(price1price2currencydiffcc)])
31c SYMULACJE ARBITRAŻU
I market frictions (krotka sprzedaz koszty tranzakcyjne kosztalternatywny)
I prawdop zrealizowania zleceniaI ilość volumenu z danej minuty - czekamy na częściową realizacjeI poziom premii inicjujący startegie - EVTI jak długo czekamy z zamknięciem pozycji
31d Wyniki symulacji
SYMULACJA W PLIKU SymulacjaStrategyFromposR
KONIECCo zyskujesz angażując się w pracę Fundacji QF
Wiedzę z zakresu finansoacutew ilościowych i nauk pokrewnych Doświadczeniezawodowe i unikalne możliwości networkingowe Realizację projektoacutew dlanajwiększych instytucji finansowych w Polsce Swobodę w organizowaniuswojej pracy i doskonalenie umiejętności organizacyjnych Miłą atmosferę isatysfakcję Zapraszamy do kontaktu
wwwquantitativefinanceorgplfundacjaquantitativefinanceorgpl
Kontakt
Maciej Nasiński Lead Analystnasinskimaciejgmailcom
Piotr Cymcyk Prezes Zarządupiotrcymcykquantitativefinanceorgpl
Wojciech Zdunkiewicz Członek Zarząduwzdunkiewiczquantitativefinanceorgpl
BibliografiaPhilippe Massicotte and Dirk Eddelbuettel (2016) gtrendsR R Functionsto Perform and Display Google Trends Queries R package version 133httpsCRANR-projectorgpackage=gtrendsR
Hadley Wickham and Romain Francois (2015) dplyr A Grammar of DataManipulation R package version 043httpsCRANR-projectorgpackage=dplyr
Hadley Wickham (2015) tidyr Easily Tidy Data with spread() andgather() Functions R package version 031httpsCRANR-projectorgpackage=tidyr
Bernhard Pfaff (2008) VAR SVAR and SVEC Models ImplementationWithin R Package vars Journal of Statistical Software 27(4) URLhttpwwwjstatsoftorgv27i04
httpsmranmicrosoftcomopen
httpswwwwundergroundcom
httpswwwgooglepltrendshl=pl
21a Troacutejkąt Pascala
[1] 1 [1] 1 1 [1] 1 2 1 [1] 1 3 3 1 [1] 1 4 6 4 1 [1] 1 5 10 10 5 1 [1] 1 6 15 20 15 6 1 [1] 1 7 21 35 35 21 7 1 [1] 1 8 28 56 70 56 28 8 1
21b Troacutejkąt Pascala
[1] 1 1 [1] 2 1 1 [1] 4 1 2 1 [1] 8 1 3 3 1 [1] 16 1 4 6 4 1 [1] 32 1 5 10 10 5 1 [1] 64 1 6 15 20 15 6 1 [1] 128 1 7 21 35 35 21 7 1 [1] 256 1 8 28 56 70 56 28 8 1 [1] 512 1 9 36 84 126 126 84 36 9 1 [1] 1024 1 10 45 120 210 252 210 120 45 10 1
22a Model VAR
I szczegoacutelny przypadek modelu SUR (Seemingly UnrelatedRegressions)
I identyczne zmienne objasniajace na przestrzeni roacutewnań -gt MNKI możliowść implementacji IRF (Impulse Response Function) i FEVDI model dla zmiennych stacjonarnych - zmienne skointegrowane VECMI metoda zaliczana do Data MiningI brak wnioskowania ekonomicznego
22b Liczba iteracji - model VAR
0
2500000
5000000
7500000
10000000
5 10 15 20liczba zmiennych
n_ite
r
25
50
75
100lag
Liczba modeli VAR vs liczba zmiennych
22b2 Liczba regresji - model VAR
0
25000000
50000000
75000000
100000000
5 10 15 20liczba zmiennych
n_ite
r
25
50
75
100lag
Liczba regresji vs liczba zmiennych
22c Duża ilość zmiennych objasniających
Redukcja wymiaru macierzy
I PCA (Principal Components Anlysis)I LDA (Linear discriminan analysis)
PCA jest czysto techniczna operacja w przeciwieństwie do LDA ktoacuterezachowuje informacje służącą klasyfikacji zmiennych
Problemy
I Interpretacja zmiennychI Niestandardowy rozkład zmiennych
22d MODEL VAR - Data Mining
col_nameslt-c(CPIUS_MMPKBPL_PROC_RET1CommodityIndex_RET1M3_RET1USD_RET1UR_RET1SALDO_RET1FED_RET1BEZROB_RET1BRENT_RET1LIBOR3mEUR_RET1ZYWN_A_RET1PKBUS_RET1WIBOR3M_RET1)
comlt-(combn(length(col_names)2simplify = FALSE))for(i in 314)
comlt-c(comcombn(length(col_names)isimplify = FALSE))length(com)10
[1] 163690
Transformacje średnia ruchoma stopy zwrotu
22e MODEL VAR - Data Mining 2all_R2lt-array(NAc(length(com)2nr_lag))
for(g in 1nr_lag)
R2lt-vector(numericlength(com))SERIALlt-vector(numericlength(com))for(i in 1length(com))
model1lt-VAR(data_noLAG_NA[c(CPIPL_MMcol_names[com[[i]]])]p=gtype=const)
sum_VARlt-summary(model1$varresult$CPIPL_MM)
R2[i]lt-sum_VAR$adjrsquaredSERIAL[i]lt-serialtest(model1)$serial$pvalueprint(paste(ilength(com)g))
all_R2[1g]lt-R2all_R2[2g]lt-SERIAL
31a Dane Akcyjne HFT
I DLC
DLC (Dual Listed Companies) są efektem połączenia dwoacutech spoacutełekSpoacutełki posiadają osobną osobowość prawną dzięki czemu mogą byćjednocześnie jednak oddzielnie notowane na swoim macierzystym rynkuDochody dzielone są zgodnie z equalization agreement ratio- najczęściejdzielą się zyskami po roacutewno
I GRS
GRS klasyczne akcje notowane pod jednym numerem ISIN na całymświecie
I DR
DR można powiązać z polską definicją kwitu depozytowego
31b Przykład prostego kodu dla symulacji repeat breakStart Premia+diffcc = (price1-price2currency)price1
repeatrepeat
ilt-i+1if (dane[idiffcc]gt015)
shortlt-dane[iprice1]longlt-dane[iprice2]break
print(dane[ic(price1price2currencydiffcc)])blt-irepeat
ilt-i+1if ( dane[idiffcc]lt(-015))
long2lt-dane[iprice1]short2lt-dane[iprice2]break
print(dane[ic(price1price2currencydiffcc)])
31c SYMULACJE ARBITRAŻU
I market frictions (krotka sprzedaz koszty tranzakcyjne kosztalternatywny)
I prawdop zrealizowania zleceniaI ilość volumenu z danej minuty - czekamy na częściową realizacjeI poziom premii inicjujący startegie - EVTI jak długo czekamy z zamknięciem pozycji
31d Wyniki symulacji
SYMULACJA W PLIKU SymulacjaStrategyFromposR
KONIECCo zyskujesz angażując się w pracę Fundacji QF
Wiedzę z zakresu finansoacutew ilościowych i nauk pokrewnych Doświadczeniezawodowe i unikalne możliwości networkingowe Realizację projektoacutew dlanajwiększych instytucji finansowych w Polsce Swobodę w organizowaniuswojej pracy i doskonalenie umiejętności organizacyjnych Miłą atmosferę isatysfakcję Zapraszamy do kontaktu
wwwquantitativefinanceorgplfundacjaquantitativefinanceorgpl
Kontakt
Maciej Nasiński Lead Analystnasinskimaciejgmailcom
Piotr Cymcyk Prezes Zarządupiotrcymcykquantitativefinanceorgpl
Wojciech Zdunkiewicz Członek Zarząduwzdunkiewiczquantitativefinanceorgpl
BibliografiaPhilippe Massicotte and Dirk Eddelbuettel (2016) gtrendsR R Functionsto Perform and Display Google Trends Queries R package version 133httpsCRANR-projectorgpackage=gtrendsR
Hadley Wickham and Romain Francois (2015) dplyr A Grammar of DataManipulation R package version 043httpsCRANR-projectorgpackage=dplyr
Hadley Wickham (2015) tidyr Easily Tidy Data with spread() andgather() Functions R package version 031httpsCRANR-projectorgpackage=tidyr
Bernhard Pfaff (2008) VAR SVAR and SVEC Models ImplementationWithin R Package vars Journal of Statistical Software 27(4) URLhttpwwwjstatsoftorgv27i04
httpsmranmicrosoftcomopen
httpswwwwundergroundcom
httpswwwgooglepltrendshl=pl
21b Troacutejkąt Pascala
[1] 1 1 [1] 2 1 1 [1] 4 1 2 1 [1] 8 1 3 3 1 [1] 16 1 4 6 4 1 [1] 32 1 5 10 10 5 1 [1] 64 1 6 15 20 15 6 1 [1] 128 1 7 21 35 35 21 7 1 [1] 256 1 8 28 56 70 56 28 8 1 [1] 512 1 9 36 84 126 126 84 36 9 1 [1] 1024 1 10 45 120 210 252 210 120 45 10 1
22a Model VAR
I szczegoacutelny przypadek modelu SUR (Seemingly UnrelatedRegressions)
I identyczne zmienne objasniajace na przestrzeni roacutewnań -gt MNKI możliowść implementacji IRF (Impulse Response Function) i FEVDI model dla zmiennych stacjonarnych - zmienne skointegrowane VECMI metoda zaliczana do Data MiningI brak wnioskowania ekonomicznego
22b Liczba iteracji - model VAR
0
2500000
5000000
7500000
10000000
5 10 15 20liczba zmiennych
n_ite
r
25
50
75
100lag
Liczba modeli VAR vs liczba zmiennych
22b2 Liczba regresji - model VAR
0
25000000
50000000
75000000
100000000
5 10 15 20liczba zmiennych
n_ite
r
25
50
75
100lag
Liczba regresji vs liczba zmiennych
22c Duża ilość zmiennych objasniających
Redukcja wymiaru macierzy
I PCA (Principal Components Anlysis)I LDA (Linear discriminan analysis)
PCA jest czysto techniczna operacja w przeciwieństwie do LDA ktoacuterezachowuje informacje służącą klasyfikacji zmiennych
Problemy
I Interpretacja zmiennychI Niestandardowy rozkład zmiennych
22d MODEL VAR - Data Mining
col_nameslt-c(CPIUS_MMPKBPL_PROC_RET1CommodityIndex_RET1M3_RET1USD_RET1UR_RET1SALDO_RET1FED_RET1BEZROB_RET1BRENT_RET1LIBOR3mEUR_RET1ZYWN_A_RET1PKBUS_RET1WIBOR3M_RET1)
comlt-(combn(length(col_names)2simplify = FALSE))for(i in 314)
comlt-c(comcombn(length(col_names)isimplify = FALSE))length(com)10
[1] 163690
Transformacje średnia ruchoma stopy zwrotu
22e MODEL VAR - Data Mining 2all_R2lt-array(NAc(length(com)2nr_lag))
for(g in 1nr_lag)
R2lt-vector(numericlength(com))SERIALlt-vector(numericlength(com))for(i in 1length(com))
model1lt-VAR(data_noLAG_NA[c(CPIPL_MMcol_names[com[[i]]])]p=gtype=const)
sum_VARlt-summary(model1$varresult$CPIPL_MM)
R2[i]lt-sum_VAR$adjrsquaredSERIAL[i]lt-serialtest(model1)$serial$pvalueprint(paste(ilength(com)g))
all_R2[1g]lt-R2all_R2[2g]lt-SERIAL
31a Dane Akcyjne HFT
I DLC
DLC (Dual Listed Companies) są efektem połączenia dwoacutech spoacutełekSpoacutełki posiadają osobną osobowość prawną dzięki czemu mogą byćjednocześnie jednak oddzielnie notowane na swoim macierzystym rynkuDochody dzielone są zgodnie z equalization agreement ratio- najczęściejdzielą się zyskami po roacutewno
I GRS
GRS klasyczne akcje notowane pod jednym numerem ISIN na całymświecie
I DR
DR można powiązać z polską definicją kwitu depozytowego
31b Przykład prostego kodu dla symulacji repeat breakStart Premia+diffcc = (price1-price2currency)price1
repeatrepeat
ilt-i+1if (dane[idiffcc]gt015)
shortlt-dane[iprice1]longlt-dane[iprice2]break
print(dane[ic(price1price2currencydiffcc)])blt-irepeat
ilt-i+1if ( dane[idiffcc]lt(-015))
long2lt-dane[iprice1]short2lt-dane[iprice2]break
print(dane[ic(price1price2currencydiffcc)])
31c SYMULACJE ARBITRAŻU
I market frictions (krotka sprzedaz koszty tranzakcyjne kosztalternatywny)
I prawdop zrealizowania zleceniaI ilość volumenu z danej minuty - czekamy na częściową realizacjeI poziom premii inicjujący startegie - EVTI jak długo czekamy z zamknięciem pozycji
31d Wyniki symulacji
SYMULACJA W PLIKU SymulacjaStrategyFromposR
KONIECCo zyskujesz angażując się w pracę Fundacji QF
Wiedzę z zakresu finansoacutew ilościowych i nauk pokrewnych Doświadczeniezawodowe i unikalne możliwości networkingowe Realizację projektoacutew dlanajwiększych instytucji finansowych w Polsce Swobodę w organizowaniuswojej pracy i doskonalenie umiejętności organizacyjnych Miłą atmosferę isatysfakcję Zapraszamy do kontaktu
wwwquantitativefinanceorgplfundacjaquantitativefinanceorgpl
Kontakt
Maciej Nasiński Lead Analystnasinskimaciejgmailcom
Piotr Cymcyk Prezes Zarządupiotrcymcykquantitativefinanceorgpl
Wojciech Zdunkiewicz Członek Zarząduwzdunkiewiczquantitativefinanceorgpl
BibliografiaPhilippe Massicotte and Dirk Eddelbuettel (2016) gtrendsR R Functionsto Perform and Display Google Trends Queries R package version 133httpsCRANR-projectorgpackage=gtrendsR
Hadley Wickham and Romain Francois (2015) dplyr A Grammar of DataManipulation R package version 043httpsCRANR-projectorgpackage=dplyr
Hadley Wickham (2015) tidyr Easily Tidy Data with spread() andgather() Functions R package version 031httpsCRANR-projectorgpackage=tidyr
Bernhard Pfaff (2008) VAR SVAR and SVEC Models ImplementationWithin R Package vars Journal of Statistical Software 27(4) URLhttpwwwjstatsoftorgv27i04
httpsmranmicrosoftcomopen
httpswwwwundergroundcom
httpswwwgooglepltrendshl=pl
22a Model VAR
I szczegoacutelny przypadek modelu SUR (Seemingly UnrelatedRegressions)
I identyczne zmienne objasniajace na przestrzeni roacutewnań -gt MNKI możliowść implementacji IRF (Impulse Response Function) i FEVDI model dla zmiennych stacjonarnych - zmienne skointegrowane VECMI metoda zaliczana do Data MiningI brak wnioskowania ekonomicznego
22b Liczba iteracji - model VAR
0
2500000
5000000
7500000
10000000
5 10 15 20liczba zmiennych
n_ite
r
25
50
75
100lag
Liczba modeli VAR vs liczba zmiennych
22b2 Liczba regresji - model VAR
0
25000000
50000000
75000000
100000000
5 10 15 20liczba zmiennych
n_ite
r
25
50
75
100lag
Liczba regresji vs liczba zmiennych
22c Duża ilość zmiennych objasniających
Redukcja wymiaru macierzy
I PCA (Principal Components Anlysis)I LDA (Linear discriminan analysis)
PCA jest czysto techniczna operacja w przeciwieństwie do LDA ktoacuterezachowuje informacje służącą klasyfikacji zmiennych
Problemy
I Interpretacja zmiennychI Niestandardowy rozkład zmiennych
22d MODEL VAR - Data Mining
col_nameslt-c(CPIUS_MMPKBPL_PROC_RET1CommodityIndex_RET1M3_RET1USD_RET1UR_RET1SALDO_RET1FED_RET1BEZROB_RET1BRENT_RET1LIBOR3mEUR_RET1ZYWN_A_RET1PKBUS_RET1WIBOR3M_RET1)
comlt-(combn(length(col_names)2simplify = FALSE))for(i in 314)
comlt-c(comcombn(length(col_names)isimplify = FALSE))length(com)10
[1] 163690
Transformacje średnia ruchoma stopy zwrotu
22e MODEL VAR - Data Mining 2all_R2lt-array(NAc(length(com)2nr_lag))
for(g in 1nr_lag)
R2lt-vector(numericlength(com))SERIALlt-vector(numericlength(com))for(i in 1length(com))
model1lt-VAR(data_noLAG_NA[c(CPIPL_MMcol_names[com[[i]]])]p=gtype=const)
sum_VARlt-summary(model1$varresult$CPIPL_MM)
R2[i]lt-sum_VAR$adjrsquaredSERIAL[i]lt-serialtest(model1)$serial$pvalueprint(paste(ilength(com)g))
all_R2[1g]lt-R2all_R2[2g]lt-SERIAL
31a Dane Akcyjne HFT
I DLC
DLC (Dual Listed Companies) są efektem połączenia dwoacutech spoacutełekSpoacutełki posiadają osobną osobowość prawną dzięki czemu mogą byćjednocześnie jednak oddzielnie notowane na swoim macierzystym rynkuDochody dzielone są zgodnie z equalization agreement ratio- najczęściejdzielą się zyskami po roacutewno
I GRS
GRS klasyczne akcje notowane pod jednym numerem ISIN na całymświecie
I DR
DR można powiązać z polską definicją kwitu depozytowego
31b Przykład prostego kodu dla symulacji repeat breakStart Premia+diffcc = (price1-price2currency)price1
repeatrepeat
ilt-i+1if (dane[idiffcc]gt015)
shortlt-dane[iprice1]longlt-dane[iprice2]break
print(dane[ic(price1price2currencydiffcc)])blt-irepeat
ilt-i+1if ( dane[idiffcc]lt(-015))
long2lt-dane[iprice1]short2lt-dane[iprice2]break
print(dane[ic(price1price2currencydiffcc)])
31c SYMULACJE ARBITRAŻU
I market frictions (krotka sprzedaz koszty tranzakcyjne kosztalternatywny)
I prawdop zrealizowania zleceniaI ilość volumenu z danej minuty - czekamy na częściową realizacjeI poziom premii inicjujący startegie - EVTI jak długo czekamy z zamknięciem pozycji
31d Wyniki symulacji
SYMULACJA W PLIKU SymulacjaStrategyFromposR
KONIECCo zyskujesz angażując się w pracę Fundacji QF
Wiedzę z zakresu finansoacutew ilościowych i nauk pokrewnych Doświadczeniezawodowe i unikalne możliwości networkingowe Realizację projektoacutew dlanajwiększych instytucji finansowych w Polsce Swobodę w organizowaniuswojej pracy i doskonalenie umiejętności organizacyjnych Miłą atmosferę isatysfakcję Zapraszamy do kontaktu
wwwquantitativefinanceorgplfundacjaquantitativefinanceorgpl
Kontakt
Maciej Nasiński Lead Analystnasinskimaciejgmailcom
Piotr Cymcyk Prezes Zarządupiotrcymcykquantitativefinanceorgpl
Wojciech Zdunkiewicz Członek Zarząduwzdunkiewiczquantitativefinanceorgpl
BibliografiaPhilippe Massicotte and Dirk Eddelbuettel (2016) gtrendsR R Functionsto Perform and Display Google Trends Queries R package version 133httpsCRANR-projectorgpackage=gtrendsR
Hadley Wickham and Romain Francois (2015) dplyr A Grammar of DataManipulation R package version 043httpsCRANR-projectorgpackage=dplyr
Hadley Wickham (2015) tidyr Easily Tidy Data with spread() andgather() Functions R package version 031httpsCRANR-projectorgpackage=tidyr
Bernhard Pfaff (2008) VAR SVAR and SVEC Models ImplementationWithin R Package vars Journal of Statistical Software 27(4) URLhttpwwwjstatsoftorgv27i04
httpsmranmicrosoftcomopen
httpswwwwundergroundcom
httpswwwgooglepltrendshl=pl
22b Liczba iteracji - model VAR
0
2500000
5000000
7500000
10000000
5 10 15 20liczba zmiennych
n_ite
r
25
50
75
100lag
Liczba modeli VAR vs liczba zmiennych
22b2 Liczba regresji - model VAR
0
25000000
50000000
75000000
100000000
5 10 15 20liczba zmiennych
n_ite
r
25
50
75
100lag
Liczba regresji vs liczba zmiennych
22c Duża ilość zmiennych objasniających
Redukcja wymiaru macierzy
I PCA (Principal Components Anlysis)I LDA (Linear discriminan analysis)
PCA jest czysto techniczna operacja w przeciwieństwie do LDA ktoacuterezachowuje informacje służącą klasyfikacji zmiennych
Problemy
I Interpretacja zmiennychI Niestandardowy rozkład zmiennych
22d MODEL VAR - Data Mining
col_nameslt-c(CPIUS_MMPKBPL_PROC_RET1CommodityIndex_RET1M3_RET1USD_RET1UR_RET1SALDO_RET1FED_RET1BEZROB_RET1BRENT_RET1LIBOR3mEUR_RET1ZYWN_A_RET1PKBUS_RET1WIBOR3M_RET1)
comlt-(combn(length(col_names)2simplify = FALSE))for(i in 314)
comlt-c(comcombn(length(col_names)isimplify = FALSE))length(com)10
[1] 163690
Transformacje średnia ruchoma stopy zwrotu
22e MODEL VAR - Data Mining 2all_R2lt-array(NAc(length(com)2nr_lag))
for(g in 1nr_lag)
R2lt-vector(numericlength(com))SERIALlt-vector(numericlength(com))for(i in 1length(com))
model1lt-VAR(data_noLAG_NA[c(CPIPL_MMcol_names[com[[i]]])]p=gtype=const)
sum_VARlt-summary(model1$varresult$CPIPL_MM)
R2[i]lt-sum_VAR$adjrsquaredSERIAL[i]lt-serialtest(model1)$serial$pvalueprint(paste(ilength(com)g))
all_R2[1g]lt-R2all_R2[2g]lt-SERIAL
31a Dane Akcyjne HFT
I DLC
DLC (Dual Listed Companies) są efektem połączenia dwoacutech spoacutełekSpoacutełki posiadają osobną osobowość prawną dzięki czemu mogą byćjednocześnie jednak oddzielnie notowane na swoim macierzystym rynkuDochody dzielone są zgodnie z equalization agreement ratio- najczęściejdzielą się zyskami po roacutewno
I GRS
GRS klasyczne akcje notowane pod jednym numerem ISIN na całymświecie
I DR
DR można powiązać z polską definicją kwitu depozytowego
31b Przykład prostego kodu dla symulacji repeat breakStart Premia+diffcc = (price1-price2currency)price1
repeatrepeat
ilt-i+1if (dane[idiffcc]gt015)
shortlt-dane[iprice1]longlt-dane[iprice2]break
print(dane[ic(price1price2currencydiffcc)])blt-irepeat
ilt-i+1if ( dane[idiffcc]lt(-015))
long2lt-dane[iprice1]short2lt-dane[iprice2]break
print(dane[ic(price1price2currencydiffcc)])
31c SYMULACJE ARBITRAŻU
I market frictions (krotka sprzedaz koszty tranzakcyjne kosztalternatywny)
I prawdop zrealizowania zleceniaI ilość volumenu z danej minuty - czekamy na częściową realizacjeI poziom premii inicjujący startegie - EVTI jak długo czekamy z zamknięciem pozycji
31d Wyniki symulacji
SYMULACJA W PLIKU SymulacjaStrategyFromposR
KONIECCo zyskujesz angażując się w pracę Fundacji QF
Wiedzę z zakresu finansoacutew ilościowych i nauk pokrewnych Doświadczeniezawodowe i unikalne możliwości networkingowe Realizację projektoacutew dlanajwiększych instytucji finansowych w Polsce Swobodę w organizowaniuswojej pracy i doskonalenie umiejętności organizacyjnych Miłą atmosferę isatysfakcję Zapraszamy do kontaktu
wwwquantitativefinanceorgplfundacjaquantitativefinanceorgpl
Kontakt
Maciej Nasiński Lead Analystnasinskimaciejgmailcom
Piotr Cymcyk Prezes Zarządupiotrcymcykquantitativefinanceorgpl
Wojciech Zdunkiewicz Członek Zarząduwzdunkiewiczquantitativefinanceorgpl
BibliografiaPhilippe Massicotte and Dirk Eddelbuettel (2016) gtrendsR R Functionsto Perform and Display Google Trends Queries R package version 133httpsCRANR-projectorgpackage=gtrendsR
Hadley Wickham and Romain Francois (2015) dplyr A Grammar of DataManipulation R package version 043httpsCRANR-projectorgpackage=dplyr
Hadley Wickham (2015) tidyr Easily Tidy Data with spread() andgather() Functions R package version 031httpsCRANR-projectorgpackage=tidyr
Bernhard Pfaff (2008) VAR SVAR and SVEC Models ImplementationWithin R Package vars Journal of Statistical Software 27(4) URLhttpwwwjstatsoftorgv27i04
httpsmranmicrosoftcomopen
httpswwwwundergroundcom
httpswwwgooglepltrendshl=pl
22b2 Liczba regresji - model VAR
0
25000000
50000000
75000000
100000000
5 10 15 20liczba zmiennych
n_ite
r
25
50
75
100lag
Liczba regresji vs liczba zmiennych
22c Duża ilość zmiennych objasniających
Redukcja wymiaru macierzy
I PCA (Principal Components Anlysis)I LDA (Linear discriminan analysis)
PCA jest czysto techniczna operacja w przeciwieństwie do LDA ktoacuterezachowuje informacje służącą klasyfikacji zmiennych
Problemy
I Interpretacja zmiennychI Niestandardowy rozkład zmiennych
22d MODEL VAR - Data Mining
col_nameslt-c(CPIUS_MMPKBPL_PROC_RET1CommodityIndex_RET1M3_RET1USD_RET1UR_RET1SALDO_RET1FED_RET1BEZROB_RET1BRENT_RET1LIBOR3mEUR_RET1ZYWN_A_RET1PKBUS_RET1WIBOR3M_RET1)
comlt-(combn(length(col_names)2simplify = FALSE))for(i in 314)
comlt-c(comcombn(length(col_names)isimplify = FALSE))length(com)10
[1] 163690
Transformacje średnia ruchoma stopy zwrotu
22e MODEL VAR - Data Mining 2all_R2lt-array(NAc(length(com)2nr_lag))
for(g in 1nr_lag)
R2lt-vector(numericlength(com))SERIALlt-vector(numericlength(com))for(i in 1length(com))
model1lt-VAR(data_noLAG_NA[c(CPIPL_MMcol_names[com[[i]]])]p=gtype=const)
sum_VARlt-summary(model1$varresult$CPIPL_MM)
R2[i]lt-sum_VAR$adjrsquaredSERIAL[i]lt-serialtest(model1)$serial$pvalueprint(paste(ilength(com)g))
all_R2[1g]lt-R2all_R2[2g]lt-SERIAL
31a Dane Akcyjne HFT
I DLC
DLC (Dual Listed Companies) są efektem połączenia dwoacutech spoacutełekSpoacutełki posiadają osobną osobowość prawną dzięki czemu mogą byćjednocześnie jednak oddzielnie notowane na swoim macierzystym rynkuDochody dzielone są zgodnie z equalization agreement ratio- najczęściejdzielą się zyskami po roacutewno
I GRS
GRS klasyczne akcje notowane pod jednym numerem ISIN na całymświecie
I DR
DR można powiązać z polską definicją kwitu depozytowego
31b Przykład prostego kodu dla symulacji repeat breakStart Premia+diffcc = (price1-price2currency)price1
repeatrepeat
ilt-i+1if (dane[idiffcc]gt015)
shortlt-dane[iprice1]longlt-dane[iprice2]break
print(dane[ic(price1price2currencydiffcc)])blt-irepeat
ilt-i+1if ( dane[idiffcc]lt(-015))
long2lt-dane[iprice1]short2lt-dane[iprice2]break
print(dane[ic(price1price2currencydiffcc)])
31c SYMULACJE ARBITRAŻU
I market frictions (krotka sprzedaz koszty tranzakcyjne kosztalternatywny)
I prawdop zrealizowania zleceniaI ilość volumenu z danej minuty - czekamy na częściową realizacjeI poziom premii inicjujący startegie - EVTI jak długo czekamy z zamknięciem pozycji
31d Wyniki symulacji
SYMULACJA W PLIKU SymulacjaStrategyFromposR
KONIECCo zyskujesz angażując się w pracę Fundacji QF
Wiedzę z zakresu finansoacutew ilościowych i nauk pokrewnych Doświadczeniezawodowe i unikalne możliwości networkingowe Realizację projektoacutew dlanajwiększych instytucji finansowych w Polsce Swobodę w organizowaniuswojej pracy i doskonalenie umiejętności organizacyjnych Miłą atmosferę isatysfakcję Zapraszamy do kontaktu
wwwquantitativefinanceorgplfundacjaquantitativefinanceorgpl
Kontakt
Maciej Nasiński Lead Analystnasinskimaciejgmailcom
Piotr Cymcyk Prezes Zarządupiotrcymcykquantitativefinanceorgpl
Wojciech Zdunkiewicz Członek Zarząduwzdunkiewiczquantitativefinanceorgpl
BibliografiaPhilippe Massicotte and Dirk Eddelbuettel (2016) gtrendsR R Functionsto Perform and Display Google Trends Queries R package version 133httpsCRANR-projectorgpackage=gtrendsR
Hadley Wickham and Romain Francois (2015) dplyr A Grammar of DataManipulation R package version 043httpsCRANR-projectorgpackage=dplyr
Hadley Wickham (2015) tidyr Easily Tidy Data with spread() andgather() Functions R package version 031httpsCRANR-projectorgpackage=tidyr
Bernhard Pfaff (2008) VAR SVAR and SVEC Models ImplementationWithin R Package vars Journal of Statistical Software 27(4) URLhttpwwwjstatsoftorgv27i04
httpsmranmicrosoftcomopen
httpswwwwundergroundcom
httpswwwgooglepltrendshl=pl
22c Duża ilość zmiennych objasniających
Redukcja wymiaru macierzy
I PCA (Principal Components Anlysis)I LDA (Linear discriminan analysis)
PCA jest czysto techniczna operacja w przeciwieństwie do LDA ktoacuterezachowuje informacje służącą klasyfikacji zmiennych
Problemy
I Interpretacja zmiennychI Niestandardowy rozkład zmiennych
22d MODEL VAR - Data Mining
col_nameslt-c(CPIUS_MMPKBPL_PROC_RET1CommodityIndex_RET1M3_RET1USD_RET1UR_RET1SALDO_RET1FED_RET1BEZROB_RET1BRENT_RET1LIBOR3mEUR_RET1ZYWN_A_RET1PKBUS_RET1WIBOR3M_RET1)
comlt-(combn(length(col_names)2simplify = FALSE))for(i in 314)
comlt-c(comcombn(length(col_names)isimplify = FALSE))length(com)10
[1] 163690
Transformacje średnia ruchoma stopy zwrotu
22e MODEL VAR - Data Mining 2all_R2lt-array(NAc(length(com)2nr_lag))
for(g in 1nr_lag)
R2lt-vector(numericlength(com))SERIALlt-vector(numericlength(com))for(i in 1length(com))
model1lt-VAR(data_noLAG_NA[c(CPIPL_MMcol_names[com[[i]]])]p=gtype=const)
sum_VARlt-summary(model1$varresult$CPIPL_MM)
R2[i]lt-sum_VAR$adjrsquaredSERIAL[i]lt-serialtest(model1)$serial$pvalueprint(paste(ilength(com)g))
all_R2[1g]lt-R2all_R2[2g]lt-SERIAL
31a Dane Akcyjne HFT
I DLC
DLC (Dual Listed Companies) są efektem połączenia dwoacutech spoacutełekSpoacutełki posiadają osobną osobowość prawną dzięki czemu mogą byćjednocześnie jednak oddzielnie notowane na swoim macierzystym rynkuDochody dzielone są zgodnie z equalization agreement ratio- najczęściejdzielą się zyskami po roacutewno
I GRS
GRS klasyczne akcje notowane pod jednym numerem ISIN na całymświecie
I DR
DR można powiązać z polską definicją kwitu depozytowego
31b Przykład prostego kodu dla symulacji repeat breakStart Premia+diffcc = (price1-price2currency)price1
repeatrepeat
ilt-i+1if (dane[idiffcc]gt015)
shortlt-dane[iprice1]longlt-dane[iprice2]break
print(dane[ic(price1price2currencydiffcc)])blt-irepeat
ilt-i+1if ( dane[idiffcc]lt(-015))
long2lt-dane[iprice1]short2lt-dane[iprice2]break
print(dane[ic(price1price2currencydiffcc)])
31c SYMULACJE ARBITRAŻU
I market frictions (krotka sprzedaz koszty tranzakcyjne kosztalternatywny)
I prawdop zrealizowania zleceniaI ilość volumenu z danej minuty - czekamy na częściową realizacjeI poziom premii inicjujący startegie - EVTI jak długo czekamy z zamknięciem pozycji
31d Wyniki symulacji
SYMULACJA W PLIKU SymulacjaStrategyFromposR
KONIECCo zyskujesz angażując się w pracę Fundacji QF
Wiedzę z zakresu finansoacutew ilościowych i nauk pokrewnych Doświadczeniezawodowe i unikalne możliwości networkingowe Realizację projektoacutew dlanajwiększych instytucji finansowych w Polsce Swobodę w organizowaniuswojej pracy i doskonalenie umiejętności organizacyjnych Miłą atmosferę isatysfakcję Zapraszamy do kontaktu
wwwquantitativefinanceorgplfundacjaquantitativefinanceorgpl
Kontakt
Maciej Nasiński Lead Analystnasinskimaciejgmailcom
Piotr Cymcyk Prezes Zarządupiotrcymcykquantitativefinanceorgpl
Wojciech Zdunkiewicz Członek Zarząduwzdunkiewiczquantitativefinanceorgpl
BibliografiaPhilippe Massicotte and Dirk Eddelbuettel (2016) gtrendsR R Functionsto Perform and Display Google Trends Queries R package version 133httpsCRANR-projectorgpackage=gtrendsR
Hadley Wickham and Romain Francois (2015) dplyr A Grammar of DataManipulation R package version 043httpsCRANR-projectorgpackage=dplyr
Hadley Wickham (2015) tidyr Easily Tidy Data with spread() andgather() Functions R package version 031httpsCRANR-projectorgpackage=tidyr
Bernhard Pfaff (2008) VAR SVAR and SVEC Models ImplementationWithin R Package vars Journal of Statistical Software 27(4) URLhttpwwwjstatsoftorgv27i04
httpsmranmicrosoftcomopen
httpswwwwundergroundcom
httpswwwgooglepltrendshl=pl
22d MODEL VAR - Data Mining
col_nameslt-c(CPIUS_MMPKBPL_PROC_RET1CommodityIndex_RET1M3_RET1USD_RET1UR_RET1SALDO_RET1FED_RET1BEZROB_RET1BRENT_RET1LIBOR3mEUR_RET1ZYWN_A_RET1PKBUS_RET1WIBOR3M_RET1)
comlt-(combn(length(col_names)2simplify = FALSE))for(i in 314)
comlt-c(comcombn(length(col_names)isimplify = FALSE))length(com)10
[1] 163690
Transformacje średnia ruchoma stopy zwrotu
22e MODEL VAR - Data Mining 2all_R2lt-array(NAc(length(com)2nr_lag))
for(g in 1nr_lag)
R2lt-vector(numericlength(com))SERIALlt-vector(numericlength(com))for(i in 1length(com))
model1lt-VAR(data_noLAG_NA[c(CPIPL_MMcol_names[com[[i]]])]p=gtype=const)
sum_VARlt-summary(model1$varresult$CPIPL_MM)
R2[i]lt-sum_VAR$adjrsquaredSERIAL[i]lt-serialtest(model1)$serial$pvalueprint(paste(ilength(com)g))
all_R2[1g]lt-R2all_R2[2g]lt-SERIAL
31a Dane Akcyjne HFT
I DLC
DLC (Dual Listed Companies) są efektem połączenia dwoacutech spoacutełekSpoacutełki posiadają osobną osobowość prawną dzięki czemu mogą byćjednocześnie jednak oddzielnie notowane na swoim macierzystym rynkuDochody dzielone są zgodnie z equalization agreement ratio- najczęściejdzielą się zyskami po roacutewno
I GRS
GRS klasyczne akcje notowane pod jednym numerem ISIN na całymświecie
I DR
DR można powiązać z polską definicją kwitu depozytowego
31b Przykład prostego kodu dla symulacji repeat breakStart Premia+diffcc = (price1-price2currency)price1
repeatrepeat
ilt-i+1if (dane[idiffcc]gt015)
shortlt-dane[iprice1]longlt-dane[iprice2]break
print(dane[ic(price1price2currencydiffcc)])blt-irepeat
ilt-i+1if ( dane[idiffcc]lt(-015))
long2lt-dane[iprice1]short2lt-dane[iprice2]break
print(dane[ic(price1price2currencydiffcc)])
31c SYMULACJE ARBITRAŻU
I market frictions (krotka sprzedaz koszty tranzakcyjne kosztalternatywny)
I prawdop zrealizowania zleceniaI ilość volumenu z danej minuty - czekamy na częściową realizacjeI poziom premii inicjujący startegie - EVTI jak długo czekamy z zamknięciem pozycji
31d Wyniki symulacji
SYMULACJA W PLIKU SymulacjaStrategyFromposR
KONIECCo zyskujesz angażując się w pracę Fundacji QF
Wiedzę z zakresu finansoacutew ilościowych i nauk pokrewnych Doświadczeniezawodowe i unikalne możliwości networkingowe Realizację projektoacutew dlanajwiększych instytucji finansowych w Polsce Swobodę w organizowaniuswojej pracy i doskonalenie umiejętności organizacyjnych Miłą atmosferę isatysfakcję Zapraszamy do kontaktu
wwwquantitativefinanceorgplfundacjaquantitativefinanceorgpl
Kontakt
Maciej Nasiński Lead Analystnasinskimaciejgmailcom
Piotr Cymcyk Prezes Zarządupiotrcymcykquantitativefinanceorgpl
Wojciech Zdunkiewicz Członek Zarząduwzdunkiewiczquantitativefinanceorgpl
BibliografiaPhilippe Massicotte and Dirk Eddelbuettel (2016) gtrendsR R Functionsto Perform and Display Google Trends Queries R package version 133httpsCRANR-projectorgpackage=gtrendsR
Hadley Wickham and Romain Francois (2015) dplyr A Grammar of DataManipulation R package version 043httpsCRANR-projectorgpackage=dplyr
Hadley Wickham (2015) tidyr Easily Tidy Data with spread() andgather() Functions R package version 031httpsCRANR-projectorgpackage=tidyr
Bernhard Pfaff (2008) VAR SVAR and SVEC Models ImplementationWithin R Package vars Journal of Statistical Software 27(4) URLhttpwwwjstatsoftorgv27i04
httpsmranmicrosoftcomopen
httpswwwwundergroundcom
httpswwwgooglepltrendshl=pl
22e MODEL VAR - Data Mining 2all_R2lt-array(NAc(length(com)2nr_lag))
for(g in 1nr_lag)
R2lt-vector(numericlength(com))SERIALlt-vector(numericlength(com))for(i in 1length(com))
model1lt-VAR(data_noLAG_NA[c(CPIPL_MMcol_names[com[[i]]])]p=gtype=const)
sum_VARlt-summary(model1$varresult$CPIPL_MM)
R2[i]lt-sum_VAR$adjrsquaredSERIAL[i]lt-serialtest(model1)$serial$pvalueprint(paste(ilength(com)g))
all_R2[1g]lt-R2all_R2[2g]lt-SERIAL
31a Dane Akcyjne HFT
I DLC
DLC (Dual Listed Companies) są efektem połączenia dwoacutech spoacutełekSpoacutełki posiadają osobną osobowość prawną dzięki czemu mogą byćjednocześnie jednak oddzielnie notowane na swoim macierzystym rynkuDochody dzielone są zgodnie z equalization agreement ratio- najczęściejdzielą się zyskami po roacutewno
I GRS
GRS klasyczne akcje notowane pod jednym numerem ISIN na całymświecie
I DR
DR można powiązać z polską definicją kwitu depozytowego
31b Przykład prostego kodu dla symulacji repeat breakStart Premia+diffcc = (price1-price2currency)price1
repeatrepeat
ilt-i+1if (dane[idiffcc]gt015)
shortlt-dane[iprice1]longlt-dane[iprice2]break
print(dane[ic(price1price2currencydiffcc)])blt-irepeat
ilt-i+1if ( dane[idiffcc]lt(-015))
long2lt-dane[iprice1]short2lt-dane[iprice2]break
print(dane[ic(price1price2currencydiffcc)])
31c SYMULACJE ARBITRAŻU
I market frictions (krotka sprzedaz koszty tranzakcyjne kosztalternatywny)
I prawdop zrealizowania zleceniaI ilość volumenu z danej minuty - czekamy na częściową realizacjeI poziom premii inicjujący startegie - EVTI jak długo czekamy z zamknięciem pozycji
31d Wyniki symulacji
SYMULACJA W PLIKU SymulacjaStrategyFromposR
KONIECCo zyskujesz angażując się w pracę Fundacji QF
Wiedzę z zakresu finansoacutew ilościowych i nauk pokrewnych Doświadczeniezawodowe i unikalne możliwości networkingowe Realizację projektoacutew dlanajwiększych instytucji finansowych w Polsce Swobodę w organizowaniuswojej pracy i doskonalenie umiejętności organizacyjnych Miłą atmosferę isatysfakcję Zapraszamy do kontaktu
wwwquantitativefinanceorgplfundacjaquantitativefinanceorgpl
Kontakt
Maciej Nasiński Lead Analystnasinskimaciejgmailcom
Piotr Cymcyk Prezes Zarządupiotrcymcykquantitativefinanceorgpl
Wojciech Zdunkiewicz Członek Zarząduwzdunkiewiczquantitativefinanceorgpl
BibliografiaPhilippe Massicotte and Dirk Eddelbuettel (2016) gtrendsR R Functionsto Perform and Display Google Trends Queries R package version 133httpsCRANR-projectorgpackage=gtrendsR
Hadley Wickham and Romain Francois (2015) dplyr A Grammar of DataManipulation R package version 043httpsCRANR-projectorgpackage=dplyr
Hadley Wickham (2015) tidyr Easily Tidy Data with spread() andgather() Functions R package version 031httpsCRANR-projectorgpackage=tidyr
Bernhard Pfaff (2008) VAR SVAR and SVEC Models ImplementationWithin R Package vars Journal of Statistical Software 27(4) URLhttpwwwjstatsoftorgv27i04
httpsmranmicrosoftcomopen
httpswwwwundergroundcom
httpswwwgooglepltrendshl=pl
31a Dane Akcyjne HFT
I DLC
DLC (Dual Listed Companies) są efektem połączenia dwoacutech spoacutełekSpoacutełki posiadają osobną osobowość prawną dzięki czemu mogą byćjednocześnie jednak oddzielnie notowane na swoim macierzystym rynkuDochody dzielone są zgodnie z equalization agreement ratio- najczęściejdzielą się zyskami po roacutewno
I GRS
GRS klasyczne akcje notowane pod jednym numerem ISIN na całymświecie
I DR
DR można powiązać z polską definicją kwitu depozytowego
31b Przykład prostego kodu dla symulacji repeat breakStart Premia+diffcc = (price1-price2currency)price1
repeatrepeat
ilt-i+1if (dane[idiffcc]gt015)
shortlt-dane[iprice1]longlt-dane[iprice2]break
print(dane[ic(price1price2currencydiffcc)])blt-irepeat
ilt-i+1if ( dane[idiffcc]lt(-015))
long2lt-dane[iprice1]short2lt-dane[iprice2]break
print(dane[ic(price1price2currencydiffcc)])
31c SYMULACJE ARBITRAŻU
I market frictions (krotka sprzedaz koszty tranzakcyjne kosztalternatywny)
I prawdop zrealizowania zleceniaI ilość volumenu z danej minuty - czekamy na częściową realizacjeI poziom premii inicjujący startegie - EVTI jak długo czekamy z zamknięciem pozycji
31d Wyniki symulacji
SYMULACJA W PLIKU SymulacjaStrategyFromposR
KONIECCo zyskujesz angażując się w pracę Fundacji QF
Wiedzę z zakresu finansoacutew ilościowych i nauk pokrewnych Doświadczeniezawodowe i unikalne możliwości networkingowe Realizację projektoacutew dlanajwiększych instytucji finansowych w Polsce Swobodę w organizowaniuswojej pracy i doskonalenie umiejętności organizacyjnych Miłą atmosferę isatysfakcję Zapraszamy do kontaktu
wwwquantitativefinanceorgplfundacjaquantitativefinanceorgpl
Kontakt
Maciej Nasiński Lead Analystnasinskimaciejgmailcom
Piotr Cymcyk Prezes Zarządupiotrcymcykquantitativefinanceorgpl
Wojciech Zdunkiewicz Członek Zarząduwzdunkiewiczquantitativefinanceorgpl
BibliografiaPhilippe Massicotte and Dirk Eddelbuettel (2016) gtrendsR R Functionsto Perform and Display Google Trends Queries R package version 133httpsCRANR-projectorgpackage=gtrendsR
Hadley Wickham and Romain Francois (2015) dplyr A Grammar of DataManipulation R package version 043httpsCRANR-projectorgpackage=dplyr
Hadley Wickham (2015) tidyr Easily Tidy Data with spread() andgather() Functions R package version 031httpsCRANR-projectorgpackage=tidyr
Bernhard Pfaff (2008) VAR SVAR and SVEC Models ImplementationWithin R Package vars Journal of Statistical Software 27(4) URLhttpwwwjstatsoftorgv27i04
httpsmranmicrosoftcomopen
httpswwwwundergroundcom
httpswwwgooglepltrendshl=pl
31b Przykład prostego kodu dla symulacji repeat breakStart Premia+diffcc = (price1-price2currency)price1
repeatrepeat
ilt-i+1if (dane[idiffcc]gt015)
shortlt-dane[iprice1]longlt-dane[iprice2]break
print(dane[ic(price1price2currencydiffcc)])blt-irepeat
ilt-i+1if ( dane[idiffcc]lt(-015))
long2lt-dane[iprice1]short2lt-dane[iprice2]break
print(dane[ic(price1price2currencydiffcc)])
31c SYMULACJE ARBITRAŻU
I market frictions (krotka sprzedaz koszty tranzakcyjne kosztalternatywny)
I prawdop zrealizowania zleceniaI ilość volumenu z danej minuty - czekamy na częściową realizacjeI poziom premii inicjujący startegie - EVTI jak długo czekamy z zamknięciem pozycji
31d Wyniki symulacji
SYMULACJA W PLIKU SymulacjaStrategyFromposR
KONIECCo zyskujesz angażując się w pracę Fundacji QF
Wiedzę z zakresu finansoacutew ilościowych i nauk pokrewnych Doświadczeniezawodowe i unikalne możliwości networkingowe Realizację projektoacutew dlanajwiększych instytucji finansowych w Polsce Swobodę w organizowaniuswojej pracy i doskonalenie umiejętności organizacyjnych Miłą atmosferę isatysfakcję Zapraszamy do kontaktu
wwwquantitativefinanceorgplfundacjaquantitativefinanceorgpl
Kontakt
Maciej Nasiński Lead Analystnasinskimaciejgmailcom
Piotr Cymcyk Prezes Zarządupiotrcymcykquantitativefinanceorgpl
Wojciech Zdunkiewicz Członek Zarząduwzdunkiewiczquantitativefinanceorgpl
BibliografiaPhilippe Massicotte and Dirk Eddelbuettel (2016) gtrendsR R Functionsto Perform and Display Google Trends Queries R package version 133httpsCRANR-projectorgpackage=gtrendsR
Hadley Wickham and Romain Francois (2015) dplyr A Grammar of DataManipulation R package version 043httpsCRANR-projectorgpackage=dplyr
Hadley Wickham (2015) tidyr Easily Tidy Data with spread() andgather() Functions R package version 031httpsCRANR-projectorgpackage=tidyr
Bernhard Pfaff (2008) VAR SVAR and SVEC Models ImplementationWithin R Package vars Journal of Statistical Software 27(4) URLhttpwwwjstatsoftorgv27i04
httpsmranmicrosoftcomopen
httpswwwwundergroundcom
httpswwwgooglepltrendshl=pl
31c SYMULACJE ARBITRAŻU
I market frictions (krotka sprzedaz koszty tranzakcyjne kosztalternatywny)
I prawdop zrealizowania zleceniaI ilość volumenu z danej minuty - czekamy na częściową realizacjeI poziom premii inicjujący startegie - EVTI jak długo czekamy z zamknięciem pozycji
31d Wyniki symulacji
SYMULACJA W PLIKU SymulacjaStrategyFromposR
KONIECCo zyskujesz angażując się w pracę Fundacji QF
Wiedzę z zakresu finansoacutew ilościowych i nauk pokrewnych Doświadczeniezawodowe i unikalne możliwości networkingowe Realizację projektoacutew dlanajwiększych instytucji finansowych w Polsce Swobodę w organizowaniuswojej pracy i doskonalenie umiejętności organizacyjnych Miłą atmosferę isatysfakcję Zapraszamy do kontaktu
wwwquantitativefinanceorgplfundacjaquantitativefinanceorgpl
Kontakt
Maciej Nasiński Lead Analystnasinskimaciejgmailcom
Piotr Cymcyk Prezes Zarządupiotrcymcykquantitativefinanceorgpl
Wojciech Zdunkiewicz Członek Zarząduwzdunkiewiczquantitativefinanceorgpl
BibliografiaPhilippe Massicotte and Dirk Eddelbuettel (2016) gtrendsR R Functionsto Perform and Display Google Trends Queries R package version 133httpsCRANR-projectorgpackage=gtrendsR
Hadley Wickham and Romain Francois (2015) dplyr A Grammar of DataManipulation R package version 043httpsCRANR-projectorgpackage=dplyr
Hadley Wickham (2015) tidyr Easily Tidy Data with spread() andgather() Functions R package version 031httpsCRANR-projectorgpackage=tidyr
Bernhard Pfaff (2008) VAR SVAR and SVEC Models ImplementationWithin R Package vars Journal of Statistical Software 27(4) URLhttpwwwjstatsoftorgv27i04
httpsmranmicrosoftcomopen
httpswwwwundergroundcom
httpswwwgooglepltrendshl=pl
31d Wyniki symulacji
SYMULACJA W PLIKU SymulacjaStrategyFromposR
KONIECCo zyskujesz angażując się w pracę Fundacji QF
Wiedzę z zakresu finansoacutew ilościowych i nauk pokrewnych Doświadczeniezawodowe i unikalne możliwości networkingowe Realizację projektoacutew dlanajwiększych instytucji finansowych w Polsce Swobodę w organizowaniuswojej pracy i doskonalenie umiejętności organizacyjnych Miłą atmosferę isatysfakcję Zapraszamy do kontaktu
wwwquantitativefinanceorgplfundacjaquantitativefinanceorgpl
Kontakt
Maciej Nasiński Lead Analystnasinskimaciejgmailcom
Piotr Cymcyk Prezes Zarządupiotrcymcykquantitativefinanceorgpl
Wojciech Zdunkiewicz Członek Zarząduwzdunkiewiczquantitativefinanceorgpl
BibliografiaPhilippe Massicotte and Dirk Eddelbuettel (2016) gtrendsR R Functionsto Perform and Display Google Trends Queries R package version 133httpsCRANR-projectorgpackage=gtrendsR
Hadley Wickham and Romain Francois (2015) dplyr A Grammar of DataManipulation R package version 043httpsCRANR-projectorgpackage=dplyr
Hadley Wickham (2015) tidyr Easily Tidy Data with spread() andgather() Functions R package version 031httpsCRANR-projectorgpackage=tidyr
Bernhard Pfaff (2008) VAR SVAR and SVEC Models ImplementationWithin R Package vars Journal of Statistical Software 27(4) URLhttpwwwjstatsoftorgv27i04
httpsmranmicrosoftcomopen
httpswwwwundergroundcom
httpswwwgooglepltrendshl=pl
KONIECCo zyskujesz angażując się w pracę Fundacji QF
Wiedzę z zakresu finansoacutew ilościowych i nauk pokrewnych Doświadczeniezawodowe i unikalne możliwości networkingowe Realizację projektoacutew dlanajwiększych instytucji finansowych w Polsce Swobodę w organizowaniuswojej pracy i doskonalenie umiejętności organizacyjnych Miłą atmosferę isatysfakcję Zapraszamy do kontaktu
wwwquantitativefinanceorgplfundacjaquantitativefinanceorgpl
Kontakt
Maciej Nasiński Lead Analystnasinskimaciejgmailcom
Piotr Cymcyk Prezes Zarządupiotrcymcykquantitativefinanceorgpl
Wojciech Zdunkiewicz Członek Zarząduwzdunkiewiczquantitativefinanceorgpl
BibliografiaPhilippe Massicotte and Dirk Eddelbuettel (2016) gtrendsR R Functionsto Perform and Display Google Trends Queries R package version 133httpsCRANR-projectorgpackage=gtrendsR
Hadley Wickham and Romain Francois (2015) dplyr A Grammar of DataManipulation R package version 043httpsCRANR-projectorgpackage=dplyr
Hadley Wickham (2015) tidyr Easily Tidy Data with spread() andgather() Functions R package version 031httpsCRANR-projectorgpackage=tidyr
Bernhard Pfaff (2008) VAR SVAR and SVEC Models ImplementationWithin R Package vars Journal of Statistical Software 27(4) URLhttpwwwjstatsoftorgv27i04
httpsmranmicrosoftcomopen
httpswwwwundergroundcom
httpswwwgooglepltrendshl=pl
BibliografiaPhilippe Massicotte and Dirk Eddelbuettel (2016) gtrendsR R Functionsto Perform and Display Google Trends Queries R package version 133httpsCRANR-projectorgpackage=gtrendsR
Hadley Wickham and Romain Francois (2015) dplyr A Grammar of DataManipulation R package version 043httpsCRANR-projectorgpackage=dplyr
Hadley Wickham (2015) tidyr Easily Tidy Data with spread() andgather() Functions R package version 031httpsCRANR-projectorgpackage=tidyr
Bernhard Pfaff (2008) VAR SVAR and SVEC Models ImplementationWithin R Package vars Journal of Statistical Software 27(4) URLhttpwwwjstatsoftorgv27i04
httpsmranmicrosoftcomopen
httpswwwwundergroundcom
httpswwwgooglepltrendshl=pl