podstawy statystyki dla psychologów - zajęcia 7 - interpretacja korelacji i regresji

23
Podstawy statystyki dla psychologów Korelacja i regresja ciąg dalszy Karol Wolski

Upload: karol-wolski

Post on 07-Dec-2014

5.116 views

Category:

Education


1 download

DESCRIPTION

Statistics, linear regression

TRANSCRIPT

Page 1: Podstawy statystyki dla psychologów - zajęcia 7 - interpretacja korelacji i regresji

Podstawy statystyki dla psychologów

Korelacja i regresja ciąg dalszy

Karol Wolski

Page 2: Podstawy statystyki dla psychologów - zajęcia 7 - interpretacja korelacji i regresji

Zakres zmienności a korelacja

Page 3: Podstawy statystyki dla psychologów - zajęcia 7 - interpretacja korelacji i regresji

Zakres zmienności a korelacja

• 𝑺𝒀𝑿 = 𝑺𝒀 𝟏 − 𝒓𝟐 - standardowy błąd oszacowania czyli… zmienność wyników Y skupionych wokół linii regresji

– Bo 𝑺𝒀𝑿 jest rodzajem SD

• Po przekształceniu z tego wzoru możemy wyliczyć r

– 𝒓 = 𝟏 −𝑺𝒀𝑿

𝟐

𝑺𝒀𝟐

Page 4: Podstawy statystyki dla psychologów - zajęcia 7 - interpretacja korelacji i regresji

Zakres zmienności a korelacja

• Wartość współczynnika korelacji zależeć

będzie od stosunku 𝑺𝒀𝑿

𝑺𝒀 a nie tylko od wartości

błędu pomiaru

• Aby określić wielkość 𝑺𝒀𝑿 musimy odnieść ją do odchylenia standardowego Y

Page 5: Podstawy statystyki dla psychologów - zajęcia 7 - interpretacja korelacji i regresji

Zakres zmienności a korelacja

Page 6: Podstawy statystyki dla psychologów - zajęcia 7 - interpretacja korelacji i regresji

Zakres zmienności a korelacja

• 𝑺𝒀𝑼𝟐 = 𝟖

• 𝑺𝒀𝑹𝟐 = 𝟔

• 𝑺𝒀𝑿𝟐 = 𝟒

– Ta wartość nie ulegnie zmianie ponieważ zakładamy, że mamy do czynienia z homoskedastycznością

Page 7: Podstawy statystyki dla psychologów - zajęcia 7 - interpretacja korelacji i regresji

Zakres zmienności a korelacja

Zakres nieograniczony Zakres ograniczony

𝒓 = 𝟏 −𝑺𝒀𝑿

𝟐

𝑺𝒀𝟐 = 𝟏 −

𝟒

𝟖=

𝟏

𝟐= 𝟎, 𝟕𝟏

𝒓 = 𝟏 −𝑺𝒀𝑿

𝟐

𝑺𝒀𝟐 = 𝟏 −

𝟒

𝟔=

𝟏

𝟑= 𝟎, 𝟓𝟖

Page 8: Podstawy statystyki dla psychologów - zajęcia 7 - interpretacja korelacji i regresji

Zakres zmienności a korelacja

• Wartość r zależy zarówno od stopnia zmienności charakteryzującej każdą ze zmiennych, jak i od siły związku między nimi

• Jeśli pozostałe warunki pozostaną niezmienne, wraz z ograniczeniem zmienności X i/lub Y obniżeniu ulegnie współczynnik korelacji tych dwóch zmiennych

Page 9: Podstawy statystyki dla psychologów - zajęcia 7 - interpretacja korelacji i regresji

Korelacja w rozkładach nieciągłych

Page 10: Podstawy statystyki dla psychologów - zajęcia 7 - interpretacja korelacji i regresji

Korelacja w rozkładach nieciągłych

• Niezależnie czy nieciągłość dotyczy zmiennej X czy Y, czy też obu zmiennych jednocześnie, zazwyczaj współczynnik korelacji będzie wyższy niż w przypadku rozkładu ciągłego

Page 11: Podstawy statystyki dla psychologów - zajęcia 7 - interpretacja korelacji i regresji

Równanie regresji I

• Y=bX + a

• a- wyraz wolny

– Określa punkt, w którym linia regresji przecina oś Y

• b- współczynnik nachylenia

– Określa o ile wzrośnie/zmaleje wartość Y kiedy X wzrośnie o jedną jednostkę

– 𝑏 =𝑧𝑚𝑖𝑎𝑛𝑎 𝑛𝑎 𝑜𝑠𝑖 𝑌

𝑧𝑚𝑖𝑎𝑛𝑎 𝑛𝑎 𝑜𝑠𝑖 𝑋

Page 12: Podstawy statystyki dla psychologów - zajęcia 7 - interpretacja korelacji i regresji

Równanie regresji I

Page 13: Podstawy statystyki dla psychologów - zajęcia 7 - interpretacja korelacji i regresji

Równanie regresji I

• 𝒛′𝒀 = 𝒓𝒛𝑿 + 𝟎 • Interpretacja r dla danych standaryzowanych

– Określa o ile jednostek wzrośnie Y przy zmianie X o jedną jednostkę, wtedy gdy dane są wystandaryzowane czyli

– O ile SD zmieni się Y jeśli X zmieni się o 1SD

b a=0

Page 14: Podstawy statystyki dla psychologów - zajęcia 7 - interpretacja korelacji i regresji

Równanie regresji I

• 𝑌′ = 𝑟𝑆𝑌

𝑆𝑋𝑋 − 𝑟

𝑆𝑌

𝑆𝑋𝑋 + 𝑌

• b- współczynnik regresji

– Określa o ile przeciętnie wzrośnie Y kiedy X zmieni się o jedną jednostkę

b a

Page 15: Podstawy statystyki dla psychologów - zajęcia 7 - interpretacja korelacji i regresji

Równanie regresji II

Page 16: Podstawy statystyki dla psychologów - zajęcia 7 - interpretacja korelacji i regresji

Równanie regresji II

• Regresja do średniej – kiedy korelacja między zmiennymi jest <1, to im bardziej ekstremalny wynik na jednej zmiennej, tym bardziej prawdopodobne, że jest on związany z wynikiem mniej ekstremalnym na drugiej zmiennej

• Na podstawie 𝒛′𝒀 = 𝒓𝒛𝑿 + 𝟎 wiemy, że im wyższa wartość r tym mniejsza regresja do średniej

Page 17: Podstawy statystyki dla psychologów - zajęcia 7 - interpretacja korelacji i regresji

Regresja do średniej

• Kiedy osoby badane zostaną wybrane z powodu ekstremalnej lokalizacji wyników w danej zmiennej, to ich wyniki w innej zmiennej, skorelowanej z pierwszą wprost proporcjonalnie, będą prawdopodobnie również wysokie, ale będę mniej ekstremalne

Page 18: Podstawy statystyki dla psychologów - zajęcia 7 - interpretacja korelacji i regresji

Interpretacja r – współczynnik determinacji

• Całkowitą wariancję Y można potraktować jako sumę dwóch wariancji

– Związaną ze zmienną X

– Niezwiązaną ze zmienną X

Odchylenia wyników 𝑌 − 𝑌 = 𝑌 − 𝑌′ + (𝑌′ − 𝑌 )

Page 19: Podstawy statystyki dla psychologów - zajęcia 7 - interpretacja korelacji i regresji

Interpretacja r – współczynnik determinacji

Page 20: Podstawy statystyki dla psychologów - zajęcia 7 - interpretacja korelacji i regresji

Interpretacja r – współczynnik determinacji

• 𝑌 − 𝑌 - przekształcone na wariancję mierzy całkowitą wariancję Y, tak jak robiliśmy to na samym początku

𝑆2 = 𝑌−𝑌 2

𝑛

• 𝑌 − 𝑌′ - przekształcone na wariancję mierzy wariancję Y niezależną od X, czyli jest nasz błąd

oszacowania S𝒚𝒙𝟐 = (𝒀−𝒀′)𝟐

𝒏

• (𝑌′ − 𝑌 ) – przekształcona na wariancję mierzy wariancję Y zależną od zmiennej X

– 𝑺𝒀′𝟐 = (𝒀′−𝒀 )𝟐

𝒏

Page 21: Podstawy statystyki dla psychologów - zajęcia 7 - interpretacja korelacji i regresji

Interpretacja r – współczynnik determinacji

• Wiemy zatem, że

• 𝑆2 = S𝒚𝒙𝟐 + 𝑺𝒀′𝟐

• Dobrym sposobem na zrozumienie siły związku pomiędzy X i Y będzie poznanie proporcji

–𝑺𝒀′𝟐

𝑺𝒀𝟐 czyli stosunku wariancji zależnej od X do

całości wariacji Y

Page 22: Podstawy statystyki dla psychologów - zajęcia 7 - interpretacja korelacji i regresji

Interpretacja r – współczynnik determinacji

• Jeśli 𝑆2 = S𝒚𝒙𝟐 + 𝑺𝒀′𝟐 to

• 𝑺𝒀′𝟐 = 𝑺𝒀′𝟐 − S𝒚𝒙𝟐

• I jeśli 𝑺𝒀′𝟐

𝑺𝒀𝟐

• To po kilku przekształceniach…

• 𝑺𝒀′𝟐

𝑺𝒀𝟐= 𝒓𝟐 - współczynniki determinacji

Page 23: Podstawy statystyki dla psychologów - zajęcia 7 - interpretacja korelacji i regresji

Interpretacja r – współczynnik determinacji

• 𝑆2 = 𝑟2 + 𝑘2

• 𝑘2 - współczynnik indeterminacji, wskazuje nam jaki odsetek Y nie zależy od X, jest równy

1 − 𝑟2