plan na dziś
DESCRIPTION
Plan na dziś. Ogólny model liniowy (GLM) Model mieszany (MIXED). Ogólny model liniowy. OML ł ączy zalety ANOVA i analizy regresji. gr. słoniny = stado + masa półtuszy + reszta. zm. klasyfikująca. zm. ciągła. Parametry modelu. β 0 = efekt wspólny β 1 = efekt stada A - PowerPoint PPT PresentationTRANSCRIPT
Plan na dziś
• Ogólny model liniowy (GLM)• Model mieszany (MIXED)
Ogólny model liniowy
• OML łączy zalety ANOVA i analizy regresji
gr. słoniny = stado + masa półtuszy + reszta
zm. klasyfikująca
zm. ciągła
β0 = efekt wspólny
β1 = efekt stada Aβ2 = efekt stada B efekt stada C = 0
β3 = regr. na masę półtuszy
Parametry modelu
Jeden poziom efektu stałego jest zawsze wyzerowany!
24 = 1β0 + 0β1 + 1β2 + 40β3 + e2
22 = 1β0 + 0β1 + 0β2 + 41β3 + e3
23 = 1β0 + 1β1 + 0β2 + 42β3 + e1
23 mmstado A42 kg
24 mmstado B40 kg
22 mmstado C41 kg
2324 =22
1 1 0 421 0 1 40 1 0 0 41
β0 β1
β2
β3
e1
+ e2
e3
y = X + e
Zapis macierzowy
General Linear Model
data swinie ; infile “C:\...\mojplik.txt” ; input slonina stado $ waga ;proc GLM data=swinie; class stado ; model slonina = stado waga ;run ;
Sumy kwadratów
• Typu I-ego: zależą od pozycji efektu w modelu! Oszacowany efekt masy półtuszy uzględnia wpływ stada, ale nie odwrotnie.
• Typu III-ego: nie zależne od pozycji efektu w modelu! Każdy efekt jest poprawiony względem pozostałych.
Rozwiązania
proc GLM data=swinie; class stado ; model slonina = stado waga / solutions;run ;
Testowanie efektów: H0 1 = 0 H1 1 0 (test dwustronny) poziom istotności w kolumnie Pr > |t|
Jeden poziom wyzerowany!
Średnie NK
stado
rok
A B C średniebrzegow
e
2005 5 5 5 4
2006 5 5 1 5
średnie 1 2 3
Układ niezbalanowany
Tu brakuje obserwacji
Średnie najmniejszych kwadratów to średnie jakich byśmy oczekiwali dla zbalansowanych danych.
Średnie NK
proc GLM data=swinie; class stado ; model slonina = stado waga ; lsmeans stado / stderr ;run ;
Oblicza błąd standardowy i testuje hipotezę średnia=0
Oblicza średnie least-squares
Interakcja
A1 A2 B1 B2 A1B1 A1B2 A2B1 A2B2
Interakcja
Y = A B A*B
Efekty zagnieżdżone
A1 A2 B1 B2 A1B1 A1B2 A2B1 A2B2
B nie występuje jako efekt główny.
A1 A2
B1 B2
B1 B2
Y = A B(A)
Porównania wielokrotneproc GLM data=swinie; class stado ; model slonina = stado waga ;
means stado / opcja;run ;Means oblicza nie poprawione średnie,
DUNCAN
LSD – najmniejsza istotna różnica
TUKEY
SNK Student-Newman-Keuls
Porównania średnich NK
lsmeans stado / pdiff=all adjust=tukey;
Testuje hipotezęH0: LSM(i)=LSM(j)
23 mm23 mm22 mmstado A42 kg
19 mm18 mm17 mmstado B40 kg
22 mm21 mm22 mmstado C41 kg
Pomiary powtarzane
Pomiary wykonywane na tych samych obiektach (świniach) mogą być skorelowane!
Pomiary powtarzane – c.d
y1 y2 y3 stado waga
• 23 22 A 4219 18 17 B 4022 21 22 C 41
proc GLM; class stado ; model y1-y3 = stado waga ;
repeated czas ; run ;
Dowolna nazwa dla czynnika wewnątrz-
obiektowego
Model mieszany
y = X + Zu + eZawiera zarówno efekty
stałe jak i losowe u
Kiedy efekt losowy?Efekt jest losowy, jeżeli po powtórzeniu
próbkowania możemy wylosować inne jego poziomy.
Np. losowanie 30 koniI próbkowanie:
umaszczenie gniade 20 koni.umaszczenie pstrokate 10 koni
II próbkowanieumaszczenie gniade 15umaszczenie myszate 15
Kiedy efekt losowy?
Gdy chcemy wnioskować o czynniku, ale nie mamy wszystkich jego poziomów.
Np. Analizujemy wpływ pór roku, ale
mamy dane tylko z lata i jesieni.
Kiedy efekt losowy?
Gdy chcemy uwględnić fakt, że obserwacje są skorelowane
...lub gdy efekty skorelowane są naszym przedmiotem zainteresowania.
Np. Wartość hodowlana świni A jest skorelowana z w.h. świni B, bo A i B są spokrewnione.
Zależności między efektami
y = X + Zu + e
Zależności między efektami
zdefiniowane w macierzy GZależności między resztamizdefiniowane w
macierzy R
Przykładbuhaj 1
krowa 1 krowa 2stado A stado B
y=9 y=12
buhaj 2
krowa 3 krowa 4stado A stado B
y=11 y=6
buhaj 3
krowa 5 krowa 6stado A stado B
y=7 y=14
V = R = 6
1 0 0 0 0 00 1 0 0 0 00 0 1 0 0 00 0 0 1 0 00 0 0 0 1 00 0 0 0 0 1
1 00 11 01 01 00 1
= stado Astado B
912116714
Y = X =
y = X + e
Zakładamy, że obserwacje nie są skorelowane, ale to nieprawda!
Przykładbuhaj 1
krowa 1 krowa 2stado A stado B
y=9 y=12
buhaj 2
krowa 3 krowa 4stado A stado B
y=11 y=6
buhaj 3
krowa 5 krowa 6stado A stado B
y=7 y=14
V = ZGZ`+ R =
8 2 0 0 0 02 8 0 0 0 00 0 8 2 0 00 0 2 8 0 00 0 0 0 8 20 0 0 0 2 8
y = X + Zu + e
Teraz obserwacje są skorelowane, ale błędy nie!
1 0 01 0 00 1 00 1 00 0 10 0 1
Z =
buhaj 1buhaj 2buhaj 3
u =
1 0 00 1 00 0 1
G = 2
Poziomy efektów losowych mogą być także skorelowane
ojciec matka córka ojciec 1 0 1/2
matka 0 1 1/2
córka 1/2 1/2 1
np. zależności między efektami proporcjonalne do spokrewnień (Animal Model)
ojciec matka
córkaG=A 2
A
Model mieszany w SASie
proc MIXED ; class A B ; model Y = A B ; random C ;run ;
BLUP AM
Krowa 1 Buhaj 2
Córka 3 Córka 4
stado Ay=3,1
stado By=3,5
stado By=3,3
Założenia:•wariancja add. 2
A = 1,0•wariancja reszt 2
E = 1,5
...czyliG = A×1,0R = I×1,5
Y = stado + animal + reszta
krowa 1 1 0 0,5 0buhaj 2 0 1 0,5 0,5córka 3 0,5 0,5 1 0,25córka 4 0 0,5 0,25 1
data G ;input Row Col1-Col4 ;cards ;1 1 0 0.5 02 0 1 0.5 0.53 0.5 0.5 1 0.254 0 0.5 0.25 1
;
data G ;input Row Col Value ;cards ;1 1 0 1 3 0.52 2 12 3 0.5itd.
BLUP AM
data mleko ; input stado $ animal $ Y ; cards ; A 1 3.1 A 2 . B 3 3.5 B 4 3.3;proc mixed data=mleko ; class stado animal ; model Y = stado ; random animal / type=un gdata=G s ; parms 1.5 / hold=1 ;run ;
BLUP AM
Zadanie 1
1 1 42 44 36 13 19 221 2 33 . 26 . 33 211 3 31 -3 . 25 25 242 1 28 . 23 34 42 132 2 . 34 33 31 . 362 3 3 26 28 32 4 163 1 . . 1 29 . 193 2 . 11 9 7 1 -63 3 21 1 . 9 3 .4 1 24 . 9 22 -2 154 2 27 12 12 -5 16 154 3 22 7 25 5 12 .
data a; input lek choroba @; do i=1 to 6; input y @; output; end; cards ;
Zbadaj wpływ leku (1-4) i choroby (1-3) oraz interakcji między nimi na wskaźnik wydajnościowy organizmu. Czy układ jest zbalansowany? Który efekt jest istotny? Porównaj średnie najmniejszych kwadratów w parach.
Dane: Procedura wczytania danych:
Zadanie 2
a 11 6 a 8 0 a 5 2 a 14 8 a 19 11a 6 4 a 10 13 a 6 1 a 11 8 a 3 0d 6 0 d 6 2 d 7 3 d 8 1 d 18 18d 8 4 d 19 14 d 8 9 d 5 1 d 15 9f 16 13 f 13 10 f 11 18 f 9 5 f 21 23f 16 12 f 12 5 f 12 16 f 7 1 f 12 20
Zbadaj skuteczność antybiotyku (a-f) na stopień zakażenia pacjentów (po) uwzględniając stopień zakażenia przed leczeniem (przed) jako drugi efekt w modelu. Wytłumacz różnicę między wynikiem dla antybiotyku obliczonym wg sum kw. typu I i III.
data AB; input anty $ przed po @@; cards;
Zadanie 3Analizowano wpływ mutacji w genie leptyny (CC, CG, GG) na ekspresję tego genu (poziom mRNA). Zbadano 14 świń i dla każdej wykonano 3 pomiary ekspresji genu. Zbadaj wpływ genu.
dane22.txtkol 1: genotyp Leptynykol 2: pomiar 1kol 3: pomiar 2kol 4: pomiar 3
http://jay.au.poznan.pl/~mcszyd/dyda/pakiety/index.html
Zadanie 4Analizowano wpływ genotypu w genie leptyny (CC, CG) na średnią grubość słoniny. Wykonaj obliczenia (a) ignorując wpływ ojca i (b) traktując wpływ ojca jako efekt losowy. Uwzględnij wiek uboju i masę półtuszy.
dane23.txtkol 1: kod rasykol 2: numer próbykol 3: numer ojcakol 4: genotyp RYRkol 5: genotyp Leptynykol 6: średnia gr. słoniny (cm)kol 7: wiek uboju (dni)kol 8: masa półtuszy (kg)
http://jay.au.poznan.pl/~mcszyd/dyda/pakiety/index.html
Zadanie dla chętnych
krowa stado %tłuszczu2 A 3,33 A 3,15 B 3,06 B 2,98 B 3,49 A 3,510 B 3,2
1 2 3 4 5
6 7 8
9 10
Oceń wartość hodowlaną buhajów i krów wzg. zawartości tłuszczu w mleku przyjmując, że wariancja genetyczna addytywna = 0,75, a wariancja reszt = 1,3.
zwierzęta ponumerowane rosnąco od najstarszych do najmłodszych