ozsváth károly tf kommunikációs-informatikai és oktatástechnológiai tanszék

Post on 04-Jan-2016

19 Views

Category:

Documents

1 Downloads

Preview:

Click to see full reader

DESCRIPTION

StatSoft Statistica for Windows kezelése: korreláció és regresszióanalízis. Ozsváth Károly TF Kommunikációs-Informatikai és Oktatástechnológiai Tanszék. Vizsgálataink egyik gyakori kérdése, hogy van-e összefüggés a kapott eredmények között? - PowerPoint PPT Presentation

TRANSCRIPT

Ozsváth KárolyTF Kommunikációs-Informatikai és

Oktatástechnológiai Tanszék

• Vizsgálataink egyik gyakori kérdése, hogy van-e összefüggés a kapott eredmények

között?

• A változók közötti összefüggések kimutatására és elemzésére a korreláció számítás szolgál.

• Korrelációs koefficiens (r): két sztochasztikus változó kapcsolatának

mérőszáma.

• Korrelációs koefficiens értéke 0-1 között változhat, előjele negatív és pozitív egyaránt lehet. (Értékkészlete tehát -1 és +1 közötti.)

• Minél nagyobb az (abszolút) érték, annál szorosabb az összefüggés. Az r=0 körüli értékek függetlenséget jelentenek. Az r=±1 függvénykapcsolatot jelent.

• A pozitív együtthatók azonos irányú kapcsolatot jelentenek: egyik változó nagyobb értékei a másik változó nagyobb értékeivel járnak együtt. A negatív korreláció ellentétes kapcsolatot jelent: az egyik változó nagyobb értékei a másik változó kisebb értékeivel járnak együtt.

• A korrelációs együttható szignifikanciáját külön meg kell vizsgálni. A kritikus értékek (n-2) szabadságfok mellett kerülnek meghatározásra. A nullhipotézis szerint nincs összefüggés a két változó között.

• Magas elemszámok esetén alacsony korrelációk is szignifikánsak, míg kis elemszámú mintáknál szoros korrelációk sem feltétlenül érik el a kritikus értékeket. A statisztikai programok a szignifikancia szinteket pontosan jelzik.

• A korrelációszámítás „folytatása” a regresszió, regresszióanalízis (RA, MRA, MVRA): az összefüggést leginkább jellemző függvény meghatározása és elemzése, a függvény („görbe”) szerinti becslés „jóságának”, pontosságának analízise.

• Függő (y) és független (x) változó/k nem cserélhető/k fel! A függvény képlete szerinti értékek a „jósolt értékek” (y).

• A regressziós kapcsolat (illetve a függvények, görbék) fő típusai:

• lineáris• polinomiális (n-ed fokú)• parabolikus (másodfokú)• logaritmikus• exponenciális• hiperbolikus• hatvány

• Fábián Gy. – Zsidegh M.: A testnevelési és sporttudományos kutatások módszertana, 117-128., 158-184. p.

• Fájl: ergo.sta

• Többszörös regresszióanalízis (MRA) – „standard” és lépésenkénti („stepwise”) módszerrel

• Fájl: eufit2004 ccc.sta

• 1 függő változó (összpontszám)

• 9 független változó (motoros tesztek)

• Cél: az összpontszám becslésére szolgáló regressziós egyenlet meghatározása

• Stepwise változat

Bejelöljük az „Advanced” opciót

Válasszuk a módszerek közül a görgetősávnál valamelyik stepwise változatot.

Célszerű az „előre lépésenkénti” módszert választani.

Az eredmények megjelenítéséhez választhatjuk a „csak összegzés”,

vagy a „lépésről lépésre” lehetőségeket.

(Utóbbi esetben a következő képernyőkön az „OK” gomb helyett a „Next” jelenik meg az utolsó lépésig.)

A független változók a regressziós modellbe történő bevonás „erősorrendjében” szerepelnek. A lépések során az R egyre nő, de csökkenő mértékben. A bevonáshoz/visszavonáshoz figyelembe vett F-értékek elvileg csökkenő tendenciát szoktak követni, ami jelen esetben nem teljesen következetes.

A regressziós modell egyenlete.

• Jelen esetben a standard és a lépésenkénti MRA azonos eredményt adott, csak a stepwise változatnál a bevonás sorrendjében szerepelnek a független változók.

• A lépésenkénti eljárás lényegének megértéséhez nézzünk egy másik példát ugyanezen adatbázissal: ezúttal az állóképességi ingafutást tekintsük függő változónak.

Ha a standard változatot alkalmazzuk, akkor R=0,5015 mellett, F=1,22 p<0,3235 nem szignifikáns eredményt kapunk, a jósolt érték 22,571 hibája mellett.

(Azaz ez a regressziós modell nem használható.)

Ha viszont a lépésenkénti többszörös regresszióanalízist választjuk, akkor csak 3 független változó kerül be a modellbe R=0,4849 mellett, és…

… a regresszió fennállására vonatkozó F=3,48 p<0,0262 szignifikáns eredményt kapunk. A jósolt érték hibája ezúttal 21.

A gyakorlatban ez a modell sem használható, túl nagy a modell hibája.

A lépésenkénti MRA azonban a standard változathoz képest egyszerűbb és szignifikáns eredményt adott, majdnem azonos többszörös korreláció (R) mellett. (A korrigált determinációs együttható itt R2=0,1676 szemben az előző 0,045-tel.)

The End of MRA

top related