porównanie symulacyjne wybranych testów wielowymiarowej normalności w modelu liniowym
DESCRIPTION
Porównanie symulacyjne wybranych testów wielowymiarowej normalności w modelu liniowym. Zofia Hanusz i Joanna Tarasińska Uniwersytet Przyrodniczy w Lublinie WISŁA 2010. Testy do badania p - wymiarowej normalności. p= 2 (T. Ledwina, T. Inglot, M. Bogdan). p 2. Metody analityczne: - PowerPoint PPT PresentationTRANSCRIPT
![Page 1: Porównanie symulacyjne wybranych testów wielowymiarowej normalności w modelu liniowym](https://reader036.vdocuments.site/reader036/viewer/2022062423/568149ae550346895db6ed2d/html5/thumbnails/1.jpg)
11
Porównanie symulacyjne Porównanie symulacyjne wybranych testów wybranych testów wielowymiarowej wielowymiarowej
normalności w modelu normalności w modelu liniowym liniowym
Zofia Hanusz i Joanna Zofia Hanusz i Joanna TarasińskaTarasińska
Uniwersytet Przyrodniczy w Uniwersytet Przyrodniczy w LublinieLublinie
WISŁA 2010WISŁA 2010
![Page 2: Porównanie symulacyjne wybranych testów wielowymiarowej normalności w modelu liniowym](https://reader036.vdocuments.site/reader036/viewer/2022062423/568149ae550346895db6ed2d/html5/thumbnails/2.jpg)
22
Testy do badania p p - - wymiarowej wymiarowej normalnościnormalności
p=2 (T. Ledwina, T. Inglot, M. Bogdan)
p2
Metody graficzne:Q-QP-P
Metody analityczne:- uogólniające test Shapiro-Wilka
(Srivastava, Royston, Srivastava & Hui), - uogólniające testy oparte na kurtozie
i skośności (Mardia, Small, Malkovich,
Afifi)- oparte na funkcji charakterystycznej
(Arcones)
![Page 3: Porównanie symulacyjne wybranych testów wielowymiarowej normalności w modelu liniowym](https://reader036.vdocuments.site/reader036/viewer/2022062423/568149ae550346895db6ed2d/html5/thumbnails/3.jpg)
33
Tematyka badań Tematyka badań • Propozycja testu do badania wielowymiarowej
normalności, opartego na teście Shapiro-Wilka• Rozważenie wielowymiarowego liniowego
modelu obserwacji• Porównanie testu z dwoma innymi testami także
opartymi na teście Shapiro-Wilka zaproponowanymi przez Srivastavę i Hui
• Porównanie poziomu istotności i mocy powyższych testów z testem Henze-Zirklera
![Page 4: Porównanie symulacyjne wybranych testów wielowymiarowej normalności w modelu liniowym](https://reader036.vdocuments.site/reader036/viewer/2022062423/568149ae550346895db6ed2d/html5/thumbnails/4.jpg)
44
pnpnpn EBXY
33
333
222
111
nnn
nnn
nnn
100010001
X 321 μμμB
pn
pn
pn
pn
3
2
1
3
2
1
Y
Y
Y
Y
),(~ 1 ΣμpN
YXXXXYE 1 ˆH0: reszty niNpp
ppi ,,1,~
1
Σ0E
Poziom istotności Moc
ModelModel
),(~ 2 ΣμpN
),(~ 3 ΣμpN
MPII(0) – jednostajny na elipsie
MPVII(2) – wielowymiarowy t
Mieszanina rozkładów normalnych
![Page 5: Porównanie symulacyjne wybranych testów wielowymiarowej normalności w modelu liniowym](https://reader036.vdocuments.site/reader036/viewer/2022062423/568149ae550346895db6ed2d/html5/thumbnails/5.jpg)
55
Test Shapiro-Test Shapiro-WilkaWilka
Statystyka Shapiro-Wilka (Shapiro, Wilk, 1965) :
nxxx ,,, 21
)()2()1( nxxx
2210 , ~ ,,,: NxxxH n
2
1,
1
2
1
n
jjnjn
jj
xa
xx
W
- niezależne zmienne losowe o tym samym rozkładzie
- wartości uporządkowane
Wartości z tablic
![Page 6: Porównanie symulacyjne wybranych testów wielowymiarowej normalności w modelu liniowym](https://reader036.vdocuments.site/reader036/viewer/2022062423/568149ae550346895db6ed2d/html5/thumbnails/6.jpg)
66
1,01
ln ~0
NW
WWG
asH
Shapiro i Wilk (1968) zaproponowali przekształcenie
, , – stałe z tablic zależne od n.
Małe wartości statystyki wskazują brak normalności zmiennych.
![Page 7: Porównanie symulacyjne wybranych testów wielowymiarowej normalności w modelu liniowym](https://reader036.vdocuments.site/reader036/viewer/2022062423/568149ae550346895db6ed2d/html5/thumbnails/7.jpg)
77
Adaptacja statystyki Adaptacja statystyki GG((WW) do ) do zmiennych wielowymiarowychzmiennych wielowymiarowych
n
jjn 1
1xx
n
jjjn 1
1xxxxS
że takaa,ortogonaln macierz - ,,1 phhH HHΛS
jiijy xh pi ,,1 nj ,,1
Σμxxx , ~ ,,,: 210 pn NH
Srivastava i Hui (1987) zaproponowali uogólnienie testu Srivastava i Hui (1987) zaproponowali uogólnienie testu Shapiro – Wilka, wykorzystując składowe główne. Shapiro – Wilka, wykorzystując składowe główne.
![Page 8: Porównanie symulacyjne wybranych testów wielowymiarowej normalności w modelu liniowym](https://reader036.vdocuments.site/reader036/viewer/2022062423/568149ae550346895db6ed2d/html5/thumbnails/8.jpg)
88
Niech piyan
iWn
jjij
i,,1,
12
1
W(i) są asymptotycznie niezależne
)1,0(~ NiWGGas
i yjednostajnGi ~ 22~ln2 iG
Srivastava i Hui (1987) do testowania H0 zaproponowali
22
11
0
~ln2 p
asH
p
iiGM
Duże wartości M1 świadczą o braku normalności.
![Page 9: Porównanie symulacyjne wybranych testów wielowymiarowej normalności w modelu liniowym](https://reader036.vdocuments.site/reader036/viewer/2022062423/568149ae550346895db6ed2d/html5/thumbnails/9.jpg)
99
Srivastava i Hui (1987) zaproponowali także statystykę
iWMpi ,,1
2 min
pxGxM 11Pr 2
Test odrzuca normalność dla małych M2 .
która przy prawdziwości hipotezy H0 ma przybliżony rozkład:
![Page 10: Porównanie symulacyjne wybranych testów wielowymiarowej normalności w modelu liniowym](https://reader036.vdocuments.site/reader036/viewer/2022062423/568149ae550346895db6ed2d/html5/thumbnails/10.jpg)
1010
GpV
p
iiG
pG
1
1
Gi są asymptotycznie niezależne
1,0~0
NGasH
i 1,0
0
~ NGpVasH
iW
iWGi 1
ln
Nasza propozycjaNasza propozycja: :
Lewy „ogon” rozkładu normalnego standardowego wskazuje na brak normalności.
![Page 11: Porównanie symulacyjne wybranych testów wielowymiarowej normalności w modelu liniowym](https://reader036.vdocuments.site/reader036/viewer/2022062423/568149ae550346895db6ed2d/html5/thumbnails/11.jpg)
1111
Shapiro-Wilk Royston
-0,3964 -0,378623-0,2737 -0,281638-0,2368 -0,240640-0,2098 -0,213270-0,1878 -0,191068-0,1691 -0,172070-0,1526 -0,155252-0,1376 -0,140012-0,1237 -0,125959-0,1108 -0,112827-0,0986 -0,100422-0,0870 -0,088599-0,0759 -0,077247-0,0651 -0,066276-0,0546 -0,055611-0,0444 -0,045191-0,0343 -0,034961-0,0244 -0,024873-0,0146 -0,014885-0,0049 -0,0049550,0049 0,0049550,0146 0,0148850,0244 0,0248730,0343 0,0349610,0444 0,0451910,0546 0,0556110,0651 0,0662760,0759 0,0772470,0870 0,0885990,0986 0,1004220,1108 0,1128270,1237 0,1259590,1376 0,1400120,1526 0,1552530,1691 0,1720700,1878 0,1910680,2098 0,2132700,2368 0,2406400,2737 0,2816380,3964 0,378623
Shapiro-Wilk Royston
0,2737 0,2816380,3964 0,378623
RozbieżnościRozbieżności
0,02
0,025
0,03
0,035
0,04
0,045
0,05
1 2 3 4 5 6 7 8 9
M1
M2
V
H-Z
0,035
0,04
0,045
0,05
0,055
1 2 3 4 5 6 7 8 9
M1
M2
V
H-Z
20 10 1010 20 1010 10 20
20 10 1010 20 1010 10 20
20 10 1010 20 1010 10 20
20 10 1010 20 1010 10 20
20 10 1010 20 1010 10 20
20 10 1010 20 1010 10 20
322110
3
2
1
0,99,29,20,1
0,59,09,00,1
ΣΣIΣ p
![Page 12: Porównanie symulacyjne wybranych testów wielowymiarowej normalności w modelu liniowym](https://reader036.vdocuments.site/reader036/viewer/2022062423/568149ae550346895db6ed2d/html5/thumbnails/12.jpg)
1212
25994
8332
ΣΣIΣ p
0,035
0,04
0,045
0,05
0,055
1 2 3 4 5 6 7 8 9
M1
M2
V
H-Z
0,02
0,025
0,03
0,035
0,04
0,045
0,05
0,055
1 2 3 4 5 6 7 8 9
M1
M2
V
H-Z
30202010100
3
2
1
μ
μ
μ
ai według Roystona
ai z Tablicy Shapiro-Wilka
20 10 1010 20 1010 10 20
20 10 1010 20 1010 10 20
20 10 1010 20 1010 10 20
20 10 1010 20 1010 10 20
20 10 1010 20 1010 10 20
20 10 1010 20 1010 10 20
![Page 13: Porównanie symulacyjne wybranych testów wielowymiarowej normalności w modelu liniowym](https://reader036.vdocuments.site/reader036/viewer/2022062423/568149ae550346895db6ed2d/html5/thumbnails/13.jpg)
1313
MPII(0) – jednostajny na elipsieMPII(0) – jednostajny na elipsie
0
0,2
0,4
0,6
0,8
1
1 2 3 4 5 6 7 8 9
M1
M2
V
H-Z
0
0,2
0,4
0,6
0,8
1
1 2 3 4 5 6 7 8 9
M1
M2
V
H-Z
0,99,29,20,1
0,59,09,00,1
ΣΣIΣ p
ai według Roystona
ai z Tablicy Shapiro-Wilka
322110
3
2
1
μ
μ
μ
20 10 1010 20 1010 10 20
20 10 1010 20 1010 10 20
20 10 1010 20 1010 10 20
20 10 1010 20 1010 10 20
20 10 1010 20 1010 10 20
20 10 1010 20 1010 10 20
![Page 14: Porównanie symulacyjne wybranych testów wielowymiarowej normalności w modelu liniowym](https://reader036.vdocuments.site/reader036/viewer/2022062423/568149ae550346895db6ed2d/html5/thumbnails/14.jpg)
1414
0
0,2
0,4
0,6
0,8
1
1 2 3 4 5 6 7 8 9
M1
M2
V
H-Z
0
0,2
0,4
0,6
0,8
1
1 2 3 4 5 6 7 8 9
M1
M2
V
H-Z
ai według Roystona
ai z Tablicy Shapiro-Wilka
25994
8332
ΣΣIΣ p
30202010100
3
2
1
μ
μ
μ
20 10 1010 20 1010 10 20
20 10 1010 20 1010 10 20
20 10 1010 20 1010 10 20
20 10 1010 20 1010 10 20
20 10 1010 20 1010 10 20
20 10 1010 20 1010 10 20
![Page 15: Porównanie symulacyjne wybranych testów wielowymiarowej normalności w modelu liniowym](https://reader036.vdocuments.site/reader036/viewer/2022062423/568149ae550346895db6ed2d/html5/thumbnails/15.jpg)
1515
0,8
0,82
0,84
0,86
0,88
0,9
1 2 3 4 5 6 7 8 9
M1
M2
V
H-Z
MPVII – wielowymiarowy tMPVII – wielowymiarowy t
0,75
0,8
0,85
0,9
1 2 3 4 5 6 7 8 9
M1
M2
V
H-Z
ai według Roystona
ai z Tablicy Shapiro-Wilka
99,29,21
59,09,01
ΣΣIΣ p
322110
3
2
1
μ
μ
μ
20 10 1010 20 1010 10 20
20 10 1010 20 1010 10 20
20 10 1010 20 1010 10 20
20 10 1010 20 1010 10 20
20 10 1010 20 1010 10 20
20 10 1010 20 1010 10 20
![Page 16: Porównanie symulacyjne wybranych testów wielowymiarowej normalności w modelu liniowym](https://reader036.vdocuments.site/reader036/viewer/2022062423/568149ae550346895db6ed2d/html5/thumbnails/16.jpg)
1616
0,78
0,8
0,82
0,84
0,86
0,88
0,9
1 2 3 4 5 6 7 8 9
M1
M2
V
H-Z
0,8
0,82
0,84
0,86
0,88
0,9
1 2 3 4 5 6 7 8 9
M1
M2
V
H-Zai według Roystona
ai z Tablicy Shapiro-Wilka
25994
8332
ΣΣIΣ p
30202010100
3
2
1
μ
μ
μ
20 10 1010 20 1010 10 20
20 10 1010 20 1010 10 20
20 10 1010 20 1010 10 20
20 10 1010 20 1010 10 20
20 10 1010 20 1010 10 20
20 10 1010 20 1010 10 20
![Page 17: Porównanie symulacyjne wybranych testów wielowymiarowej normalności w modelu liniowym](https://reader036.vdocuments.site/reader036/viewer/2022062423/568149ae550346895db6ed2d/html5/thumbnails/17.jpg)
1717
Mieszanina rozkładów normalnychMieszanina rozkładów normalnych
0
0,2
0,4
0,6
0,8
1
1 2 3 4 5 6 7 8 9
M1
M2
V
H-Z
0
0,2
0,4
0,6
0,8
1
1 2 3 4 5 6 7 8 9
M1
M2
V
H-Z
ai według Roystona
ai z Tablicy Shapiro-Wilka
99,29,21
59,09,01
ΣΣIΣ p
322110
3
2
1
μ
μ
μ
20 10 1010 20 1010 10 20
20 10 1010 20 1010 10 20
20 10 1010 20 1010 10 20
20 10 1010 20 1010 10 20
20 10 1010 20 1010 10 20
20 10 1010 20 1010 10 20
![Page 18: Porównanie symulacyjne wybranych testów wielowymiarowej normalności w modelu liniowym](https://reader036.vdocuments.site/reader036/viewer/2022062423/568149ae550346895db6ed2d/html5/thumbnails/18.jpg)
1818
0
0,2
0,4
0,6
0,8
1
1 2 3 4 5 6 7 8 9
M1
M2
V
H-Z
0
0,2
0,4
0,6
0,8
1
1 2 3 4 5 6 7 8 9
M1
M2
V
H-Z
30202010100
3
2
1
μ
μ
μ
25994
8332
ΣΣIΣ p
ai według Roystona
ai z Tablicy Shapiro-Wilka
20 10 1010 20 1010 10 20
20 10 1010 20 1010 10 20
20 10 1010 20 1010 10 20
20 10 1010 20 1010 10 20
20 10 1010 20 1010 10 20
20 10 1010 20 1010 10 20
![Page 19: Porównanie symulacyjne wybranych testów wielowymiarowej normalności w modelu liniowym](https://reader036.vdocuments.site/reader036/viewer/2022062423/568149ae550346895db6ed2d/html5/thumbnails/19.jpg)
1919
59,09,01
Σ
99,29,21
Σ
322110
3
2
1
μ
μ
μ
![Page 20: Porównanie symulacyjne wybranych testów wielowymiarowej normalności w modelu liniowym](https://reader036.vdocuments.site/reader036/viewer/2022062423/568149ae550346895db6ed2d/html5/thumbnails/20.jpg)
2020
Empiryczny poziom istotności dla Empiryczny poziom istotności dla różnych liczebności (różnych liczebności (=0,05)=0,05)
0,02
0,03
0,04
0,05
0,06
15 18 21 24 27 30 33 36 39 42 45 48
M1
M2
V
H-Z
2IΣ
3
221
10
321 μμμp=2
![Page 21: Porównanie symulacyjne wybranych testów wielowymiarowej normalności w modelu liniowym](https://reader036.vdocuments.site/reader036/viewer/2022062423/568149ae550346895db6ed2d/html5/thumbnails/21.jpg)
2121
Moc dla różnych liczebności (Moc dla różnych liczebności (=0,05)=0,05)
00,10,20,30,40,50,60,70,80,9
15 18 21 24 27 30 33 36 39 42 45 48
M1
M2
V
H-Z
0
0,2
0,4
0,6
0,8
1
15 18 21 24 27 30 33 36 39 42 45 48
M1
M2
V
H-Z
0
0,05
0,1
0,15
0,2
0,25
0,3
0,35
15 18 21 24 27 30 33 36 39 42 45 48
M1
M2
V
H-Z
MPII
MPVII
Mieszanina
![Page 22: Porównanie symulacyjne wybranych testów wielowymiarowej normalności w modelu liniowym](https://reader036.vdocuments.site/reader036/viewer/2022062423/568149ae550346895db6ed2d/html5/thumbnails/22.jpg)
2222
WnioskiWnioski
− Test Henze-Zirklera najlepiej zachowuje poziom istotności
- W testach bazujących na wartościach obliczanych według Roystona (1992), test Henze-Zirklera okazał się lepszy od trzech pozostałych dla MPII i MPVII
- Dla MPII test oparty na średniej statystyk G(W) wykazywał się wyższą mocą niż M1 i M2
- Małą moc wszystkich testów uzyskano dla mieszaniny rozkładów normalnym dla danych o niskiej korelacji
![Page 23: Porównanie symulacyjne wybranych testów wielowymiarowej normalności w modelu liniowym](https://reader036.vdocuments.site/reader036/viewer/2022062423/568149ae550346895db6ed2d/html5/thumbnails/23.jpg)
2323
LiteraturaLiteratura1. Hanusz Z., Tarasińska J. (2009). Simulation study for a test of
multivariate normality based on Shapiro-Wilk’s statistic. Colloquium Biometricum 39, 45-51.
2. Johnson M.E.(1987). Multivariate Statistical Simulation, J. Wiley and Sons.
3. Royston P. (1992). Approximation the Shapiro-Wilk W- test for non-normality, Statistics and Computing 2, 117-119.
4. Shapiro S.S., Wilk M.B. (1965). An analysis of variance test for normality (complete samples). Biometrika 52, 591-611.
5. Shapiro S.S., Wilk M.B. (1968). Approximations for the null distribution of the W statistic. Technometrics 10, 861-866.
6. Srivastava M.S., Hui T.K. (1987). On assessing multivariate normality based on Shapiro-Wilk W statistic. Statistics & Probability Letters 5, 15-18.