akademi merkonomer statistik aften 9
DESCRIPTION
Akademi Merkonomer Statistik Aften 9. 2011.11.22 [email protected]. Denne aften. Introduktion til dagen Afleveringen Lineær Regression Multipel Lineær Regression Evaluering. Lineær regression, data i to dim. Excell koder:DK = middel() and =varians(). - PowerPoint PPT PresentationTRANSCRIPT
Akademi MerkonomerStatistikAften 9
Introduktion til dagen Afleveringen Lineær Regression Multipel Lineær Regression Evaluering
Denne aften
Lineær regression, data i to dim.
Excell koder: DK =middel() and =varians()
Sælger Erfaring Salg Sælger Erfaring Salg 1 3 478 7 7 346 2 5 454 8 1 238 3 2 272 9 4 312 4 8 645 10 2 296 5 2 180 11 9 655 6 6 449 12 6 567
Gennemsnit
Varians
Erfaring 4,583 6,992 Salg 407,667 25103,52
Lineær regression, et billede
Kovarians:
Korrelation:
Hvor og
Excell Koder: =kovarians(;) og =korrelation(;)
0
100
200
300
400
500
600
700
0 2 4 6 8 10
Erfaring mod Salg
Lineær regression, korrelationr=0,833 ser ud som en positiv tendens, der kan testes.
Test for korrelation Vihar en stikprøve af størrelse bestående af observationspar
der er realisationer af de stokastiske variable og . Vi ønsker at test om og er korrelerede Forudsætning og er normal fordelte Hypotese
Teststørrelse er fordelt
p-værdi hvor er fordelt Forkast ikke hvis
Eller
Excel: DK p=TFORDELING(t;n-1;2)
Den simple lineære model
Altså vi ser på om der er en lineærsammenhæng, hvor de enkelte observationer opfattes som realisationer fra normalfordelinger og med
Linearitet:
Excell->Data->Dataanalyse->Regression
Skæring.: 179,0065
Hældning.: 49,8895
Excell->Data->Dataanalyse->RegressionRegressionsstatistik
Multipel R 0,832637 R-kvadreret 0,693284 Justeret R-
kvadreret 0,662613 Standardfejl 92,03046 Observationer 12
ANAVA
fg SK MK F Signifikans
F Regression 1 191442,606 191442,6 22,60348 0,00077517 Residual 10 84696,0607 8469,606
I alt 11 276138,667
Koefficienter Standardfejl t-stat P-værdi Nedre 95%
Øvre 95%
Skæring 179,0065 54,9450666 3,257918 0,008604 56,5812635 301,4317 X-variabel 1 49,88949 10,4935244 4,754312 0,000775 26,5084614 73,27052
Forklaringsgrad.Er modellen signifikant ?Parameter værdierTeststørrelser (er par=0)
Method of least squares.:http://www.dynamicgeometry.com/JavaSketchpad/Gallery.html
Linearitet:
Sum of Squares…
Sum of Squares Errors.:
Sum of Squares Regression.:
Sum of Squares Total (y) .:
Sum of Squares Total (x) .:
Sum of Squares Total (x,y) .:
Forklaringsgraden
Forklaringsgraden.: Da forklaringsgraden øges med antallet af parametre er der
indført en R-Adjusted, der straffer for øget antal parametre.Brug R-Adjusted i udskrifterne !
Holder modellen ?
-2,5
-2
-1,5
-1
-0,5
0
0,5
1
1,5
2
-200 -150 -100 -50 0 50 100 150 200
Normalfraktildiagram for residualer
-200
-150
-100
-50
0
50
100
150
200
0 2 4 6 8 10
Residualplot
0
100
200
300
400
500
600
700
0 2 4 6 8 10
Linietilpasningsplot
Det vil sige.:
Multipel Lineær Regression
Multiple regression345 12 297 3.456 456 14 502 2.456 356 13 340 3.600 605 16 450 3.500 209 14 350 2.400 306 10 340 2.890 457 15 401 3.457 259 12 340 2.590 540 14 400 3.240 460 16 440 3.560 378 14 348 2.460 456 16 518 3.679
Rejsebureau, Kolonner.:- Antal modtagneopkald-Antal annoncer sidste uge- Antal modtagne opkald forrige uge- Antal bestilte rejser følgende ugeExcell->Data->Datanalyse->KorrelationExcell->Data->Datanalyse->Regression
Opkald Annoncer Forrige Bestilte
Opkald 1
Annoncer 0,647742 1
Forrige 0,654483 0,718787 1
Bestilte 0,533973 0,376285 0,219988 1
Regression 3 variableRegressionsstatistik
Multipel R 0,778466 R-kvadreret 0,606009 Justeret R-
kvadreret 0,458263 Standardfejl 84,60053 Observationer 12
ANAVA
fg SK MK F Signifikans
F Regression 3 88070,26 29356,75 4,101681 0,04902 Residual 8 57257,99 7157,249
I alt 11 145328,3
Koefficienter Standardfejl t-stat P-værdi
Nedre 95%
Øvre 95%
Nedre 95,0%
Øvre 95,0%
Skæring -302,574 213,0912 -1,41993 0,193403 -793,963 188,8156 -
793,963 188,8156
X-variabel 1 12,59989 20,94039 0,601703 0,56403 -35,6887 60,88852 -
35,6887 60,88852
X-variabel 2 0,699586 0,522448 1,339055 0,217351 -0,50518 1,904353 -
0,50518 1,904353
X-variabel 3 0,082065 0,054269 1,512189 0,168938 -0,04308 0,207211 -
0,04308 0,207211
2 Regressions variable, reduceret
Regressionsstatistik Multipel R 0,766928 R-kvadreret 0,588179 Justeret R-
kvadreret 0,496663 Standardfejl 81,54702 Observationer 12
ANAVA
fg SK MK F Signifikans
F Regression 2 85479 42739,5 6,427073 0,018458 Residual 9 59849,25 6649,916
I alt 11 145328,3
Koefficienter Standardfejl t-stat P-værdi
Nedre 95%
Øvre 95%
Nedre 95,0%
Øvre 95,0%
Skæring -248,036 185,8928 -1,3343 0,214881 -668,555 172,4827 -668,555 172,4827 X-variabel 1 0,9208 0,3578 2,573506 0,030015 0,111401 1,7302 0,111401 1,7302 X-variabel 2 0,092569 0,04953 1,868948 0,094457 -0,01948 0,204615 -0,01948 0,204615
1 Regression variabel tilbage
Regressionsstatistik Multipel R 0,533973 R-kvadreret 0,285127 Justeret R-
kvadreret 0,21364 Standardfejl 101,927 Observationer 12
ANAVA
fg SK MK F Signifikans
F Regression 1 41437,06 41437,06 3,988506 0,07374 Residual 10 103891,2 10389,12
I alt 11 145328,3
Koefficienter Standardfejl t-stat P-værdi
Nedre 95%
Øvre 95%
Nedre 95,0%
Øvre 95,0%
Skæring 27,47299 189,9511 0,144632 0,887875 -395,764 450,7103 -
395,764 450,7103
X-variabel 1 0,12061 0,060392 1,997124 0,07374 -0,01395 0,255172 -
0,01395 0,255172