Download - 9.Sb Vezbi Cas9 Mt

Transcript
Page 1: 9.Sb Vezbi Cas9 Mt

СТАТИСТИКА ЗА БИЗНИС И

ЕКОНОМИЈА

ВЕЖБИ – ЧАС 9

9. ПРОСТА ПРАВОЛИНИСКА РЕГРЕСИЈА И КОРЕЛАЦИЈА

Page 2: 9.Sb Vezbi Cas9 Mt

Корелациона анализа- откривање на насоката и

јачината на квантитативното слагање на варијациите на

две или повеќе појави.

Корелациона анализа- откривање на насоката и

јачината на квантитативното слагање на варијациите на

две или повеќе појави.

Регресиона анализа - утврдување на законитоста во

варијациите на зависно променливата појава во

зависност од варијациите на независно променливата, со цел

да се предвидат непознатите вредности на зависно

променливата кога е позната независно променливата.

Регресиона анализа - утврдување на законитоста во

варијациите на зависно променливата појава во

зависност од варијациите на независно променливата, со цел

да се предвидат непознатите вредности на зависно

променливата кога е позната независно променливата.

Регресиона и корелациона анализа

Статистичкото проучување на врските помеѓу појавите се врши со мултиваријационата

анализа која се дели на:

Статистичкото проучување на врските помеѓу појавите се врши со мултиваријационата

анализа која се дели на:

Природата на многу појави укажува на нивна повеќекратна и разновидна меѓусебна поврзаност. Проучувањето на меѓусебните врски на појавите придонесува за откривање на суштината и законитостите на нивниот развој.

Природата на многу појави укажува на нивна повеќекратна и разновидна меѓусебна поврзаност. Проучувањето на меѓусебните врски на појавите придонесува за откривање на суштината и законитостите на нивниот развој.

Page 3: 9.Sb Vezbi Cas9 Mt

Функционална и стохастичка зависност

Функционална зависностЗа секоја вредност на едната

појава (како независна променлива), може да се утврди

вредноста на другата појава (како зависна променлива).

Функционална зависностЗа секоја вредност на едната

појава (како независна променлива), може да се утврди

вредноста на другата појава (како зависна променлива).

Стохастичка зависностЗа иста вредност на

независната променлива, може да очекуваме повеќе различни

вредности на зависната променлива.

Стохастичка зависностЗа иста вредност на

независната променлива, може да очекуваме повеќе различни

вредности на зависната променлива.

Меѓузависноста на масовните појави може да биде строго определена:

Меѓузависноста на масовните појави може да биде строго определена:

Y

X

а Директна, праволинискафункционална врска

)

Y

X

б Инверзна, праволинискафункционална врска

)

Y

в Криволинискафункционална врска

)

X

Y

X

г Директна праволинискастохастичка врска

) ,

Y

X

д Инверзна, праволинискастохастичка врска

)

Y

ѓ) Директна, криволинискастохастичка врска

X

Page 4: 9.Sb Vezbi Cas9 Mt

Функционална и стохастичка зависност

Отсуство на квантитативно слагањеОтсуство на квантитативно слагање

Y

X

Y

з Отсуствона квантитативно слагање

)

X

ж Отсуствона квантитативно слагање

)

Page 5: 9.Sb Vezbi Cas9 Mt

Проста праволиниска регресијаФренсис Галтон (1885 година) – истражување на наследните карактеристики на децата во однос на нивните родители. Висината на синовите спрема висината на татковците покажува назадување (регресија) спрема просечната висина (татковците повисоки од просекот имаат пониски синови од нив, но повисоки од просекот и обратно).

Френсис Галтон (1885 година) – истражување на наследните карактеристики на децата во однос на нивните родители. Висината на синовите спрема висината на татковците покажува назадување (регресија) спрема просечната висина (татковците повисоки од просекот имаат пониски синови од нив, но повисоки од просекот и обратно).

Регресија – статистички метод кој овозможува предвидување и оценување на една појава врз основа на вредноста на некоја друга појава или група појави.

Регресија – статистички метод кој овозможува предвидување и оценување на една појава врз основа на вредноста на некоја друга појава или група појави.

Проста праволиниска регресија – набљудување на две појави помеѓу кои постои праволиниска зависност.

Проста праволиниска регресија – набљудување на две појави помеѓу кои постои праволиниска зависност.

Зависната променлива (појава) ја бележиме со Y, додека независната променлива (појава) ја бележиме со X.

Зависната променлива (појава) ја бележиме со Y, додека независната променлива (појава) ја бележиме со X.

Статистичките модели на регресионата анализа се употребуваат за истражување на врските и односите помеѓу две или повеќе појави.

Статистичките модели на регресионата анализа се употребуваат за истражување на врските и односите помеѓу две или повеќе појави.

Page 6: 9.Sb Vezbi Cas9 Mt

Проста праволиниска регресија

Странски инвестицииСтрански инвестиции Бруто домашен производБруто домашен производ

Маркетинг кампањаМаркетинг кампања ПродажбаПродажба

Квалификација на вработенитеПлата

Квалификација на вработенитеПлата ПродуктивностПродуктивност

Независна променливаНезависна променлива Зависна променливаЗависна променлива

Page 7: 9.Sb Vezbi Cas9 Mt

Пример 1:

а) Врз основа на дијаграмот на растурање определете го соодветниот регресионен модел;б) Врз основа на методот на најмали квадрати оценете ги параметрите на моделот;в) Утврдете ја стандардната грешка и коефициентот на детерминација;г) Тестирајте ја значајноста на регресиониот коефициент β1, а со тоа и на регресионата врска (=0,05);д) Формирајте го интервалот на доверба за непознатиот параметар β1 со ризик на грешка =0,05;ѓ) Со исто ниво оценете колку во просек се очекува да изнесуваат вкупните трошоци, доколку обемот на производство изнесува 26 тони;е) Со ист ризик оценете колку се очекува да изнесуваат вкупните трошоци, при обем на производство од 26 тони.

Обем на производство во тони Вкупни трошоци во 106 денари

10 60

11 70

14 90

16 100

20 120

25 140

Податоците за обемот на производството и вкупните трошоци во Пивара-Скопје се прикажани во табелата:

Page 8: 9.Sb Vezbi Cas9 Mt

Пример 1 (решение (а)):

Обем на производство

во тони (X)

Вкупни трошоци во 106 денари

(Y)

10 60

11 70

14 90

16 100

20 120

25 140

Анализата ја започнуваме со утврдување на обликот на математичкиот модел на функцијата со која најдобро се искажува просечната врска на две појави.Анализата ја започнуваме со утврдување на обликот на математичкиот модел на функцијата со која најдобро се искажува просечната врска на две појави.

а) Со дијаграмот на растурање, емприските серии на парови на податоци (за маса или примерок) се прикажуваат графички.а) Со дијаграмот на растурање, емприските серии на парови на податоци (за маса или примерок) се прикажуваат графички.

Утврдуваме кој белег е независна променлива Х, а кој зависна променлива Y. Ако примерокот е со големина n, имаме n парови на податоци (x1, y1), (x2, y2), …, (xn, yn).

Утврдуваме кој белег е независна променлива Х, а кој зависна променлива Y. Ако примерокот е со големина n, имаме n парови на податоци (x1, y1), (x2, y2), …, (xn, yn).

262422201816141210

150

140

130

120

110

100

90

80

70

60

Обем на производство

Вкупни

трош

оци

Scatterplot of Вкупни трошоци vs Обем на производство

Од дијаграмот утврдуваме дали постои квантитативно слагање, кој е неговиот облик, насоката на слагањето (директна или инверзна).

Од дијаграмот утврдуваме дали постои квантитативно слагање, кој е неговиот облик, насоката на слагањето (директна или инверзна).

Page 9: 9.Sb Vezbi Cas9 Mt

Прост праволиниски регресионен модел – метод на најмали квадрати

XY 10 XY 10

00

Прост праволиниски модел на основната масаПрост праволиниски модел на основната маса

Отсечок на Y оската, вредноста на Y кога Х=0 (нема економска интерпретација)Слободен член

Отсечок на Y оската, вредноста на Y кога Х=0 (нема економска интерпретација)Слободен член

Детерминистичка компонентаДетерминистичка компонента Стохастичка компонентаСтохастичка компонента

Коефициент на нагиб, промената на зависната променлива Y кога независната променлива Х ќе се зголеми за своја единица (има економско толкување).Ако β1>0, правата има тенденција на порастАко β1 <0, правата има тенденција на опаѓање

Коефициент на нагиб, промената на зависната променлива Y кога независната променлива Х ќе се зголеми за своја единица (има економско толкување).Ако β1>0, правата има тенденција на порастАко β1 <0, правата има тенденција на опаѓање

11

Случајна грешка, единствена случајна компонента во моделот.Случајна грешка, единствена случајна компонента во моделот.

Page 10: 9.Sb Vezbi Cas9 Mt

• Линеарност - Помеѓу X и Y постои линеарна (праволиниска) врска.

• Независната променлива X не е случајна променлива.

• Случајната грешка или стохастичкиот член во просек е еднаква на нула Е(.

• Хомоскедастичност Сите случајни грешки имаат еднакви варијанси.

• Нема автокорелација помеѓу случајните грешки.• Случајната грешка i има нормален распоред со

средина 0 и варијанса 2. Така: ~ N(0,2)

• Линеарност - Помеѓу X и Y постои линеарна (праволиниска) врска.

• Независната променлива X не е случајна променлива.

• Случајната грешка или стохастичкиот член во просек е еднаква на нула Е(.

• Хомоскедастичност Сите случајни грешки имаат еднакви варијанси.

• Нема автокорелација помеѓу случајните грешки.• Случајната грешка i има нормален распоред со

средина 0 и варијанса 2. Така: ~ N(0,2)

Претпоставки на простиот праволиниски регресионен модел

Page 11: 9.Sb Vezbi Cas9 Mt

Прост праволиниски регресионен модел – метод на најмали квадрати

ixbby 10' ixbby 10

'

Прост праволиниски модел на примерокот

Прост праволиниски модел на примерокот

Како последица на стохастичката врска меѓу појавите, се појавуваат отстапувања на точките од правата.Како последица на стохастичката врска меѓу појавите, се појавуваат отстапувања на точките од правата.

Можно решение – да се повлече линија која е поблиска до сите емпириски податоци – линија на регресија.Можно решение – да се повлече линија која е поблиска до сите емпириски податоци – линија на регресија.

Наша задача е да ги најдеме коефициентите на таа права, b0 и b1. Тие се непознати параметри, оцени за β0 и β1, кои ги оценуваме врз основа на примерокот.

Наша задача е да ги најдеме коефициентите на таа права, b0 и b1. Тие се непознати параметри, оцени за β0 и β1, кои ги оценуваме врз основа на примерокот.

y’ – прилагодена или предвидена вредност заY

y’ – прилагодена или предвидена вредност заY

Page 12: 9.Sb Vezbi Cas9 Mt

Прост праволиниски регресионен модел – метод на најмали квадрати

За оценување на непознатите параметри го користиме методот на најмали квадрати кој се засновува на минимизирање на квадратните отстапувања на сите емпириски точки од линијата на регресија.Идејата на методот на најмали квадрати е да ја одбере онаа линија која има најмала сума (збир) на квадрати на вертикалните отстапувања.

За оценување на непознатите параметри го користиме методот на најмали квадрати кој се засновува на минимизирање на квадратните отстапувања на сите емпириски точки од линијата на регресија.Идејата на методот на најмали квадрати е да ја одбере онаа линија која има најмала сума (збир) на квадрати на вертикалните отстапувања.

min2

10

22 iiiii xbbyyye min2

10

22 iiiii xbbyyye

Page 13: 9.Sb Vezbi Cas9 Mt

Пример 1 (решение (б)):

67,966

580y 67,96

6

580y

Обем на производство во

тони (x)

Вкупни трошоци во 106 денари

(y)xy x2 y2

10 60 600 100 3600

11 70 770 121 4900

14 90 1260 196 8100

16 100 1600 256 10000

20 120 2400 400 14400

25 140 3500 625 19600

96 580 10130 1698 60600

67,121625,567,9610 xbyb 67,121625,567,9610 xbyb Оцена на отсечокот на регресионата линија на популацијата, β0

Оцена на отсечокот на регресионата линија на популацијата, β0

166

96x 16

6

96x

25,59616986

580961013062221

xxn

yxxynb 25,5

9616986

580961013062221

xxn

yxxynb

ii xxbby 25,567,1210' ii xxbby 25,567,1210

'

Оцена на коефициентот на нагиб на регресионата линија на популацијата, β1

Оцена на коефициентот на нагиб на регресионата линија на популацијата, β1

Оценет регресионен модел на примерокотОценет регресионен модел на примерокот

Page 14: 9.Sb Vezbi Cas9 Mt

Мерки на репрезентативноста на линијата на регресија

y y y y y y

SKV SKO SKNi i i i 2 2 2 y y y y y y

SKV SKO SKNi i i i 2 2 2

Вкупен варијабилитетВкупен варијабилитет Објаснет варијабилитетРегресиона сума на квадрати

Објаснет варијабилитетРегресиона сума на квадрати

Необјаснет варијабилитетРезидуална сума на квадрати

Необјаснет варијабилитетРезидуална сума на квадрати

Компоненти на варијабилитетот на регресионата анализаКомпоненти на варијабилитетот на регресионата анализа

Page 15: 9.Sb Vezbi Cas9 Mt

Мерки на репрезентативноста на линијата на регресија

S

SKN

n

y y

n

i ii

n

2

2

1

2 2

SSKN

n

y y

n

i ii

n

2

2

1

2 2

SKV

SKN

SKV

SKO

SKVSKNSKVSKO

SKVSKNSKOSKV

1

//1

/][

SKV

SKN

SKV

SKO

SKVSKNSKVSKO

SKVSKNSKOSKV

1

//1

/][

Стандардна грешка на регресијата (S)

Апсолутна мерка на отстапувањата на регресионите точки од регресионата

линија

Стандардна грешка на регресијата (S)

Апсолутна мерка на отстапувањата на регресионите точки од регресионата

линија

Резидуална варијансаРезидуална варијанса

Коефициент на детерминација (r2)Релативна мерка на репрезентативноста на

регресионата линија- Го покажува учеството на објаснетиот

варијабилитет во вкупниот

Коефициент на детерминација (r2)Релативна мерка на репрезентативноста на

регресионата линија- Го покажува учеството на објаснетиот

варијабилитет во вкупниот

22

2221

2

yny

xnxbr

22

2221

2

yny

xnxbr

10 2 r 10 2 r

(n – 2) – број на степени на слобода (се оценуваат два параметри β0 и β1)

(n – 2) – број на степени на слобода (се оценуваат два параметри β0 и β1)

22

1022

'

n

xybyby

n

yyS

22

1022

'

n

xybyby

n

yyS

Page 16: 9.Sb Vezbi Cas9 Mt

Пример 1 (решение (в)):

Стандардна грешка на регресијата (S)

Стандардна грешка на регресијата (S)

15,426

1013025,558067,12600.60

2210

22'

n

xybyby

n

yyS

15,426

1013025,558067,12600.60

2210

22'

n

xybyby

n

yyS

Просечното отстапување на емпириските точки од линијата на регресија е 4,15 единици.Просечното отстапување на емпириските точки од линијата на регресија е 4,15 единици.

Коефициент на детерминација (r2)Коефициент на детерминација (r2)

9858,067,96660600

166169825,5

2

22

22

2221

2

yny

xnxbr

9858,067,96660600

166169825,5

2

22

22

2221

2

yny

xnxbr

Варијациите меѓу Х и Y се објаснети со 98,58% преку факторот обем на производство, а остатокот од 1,42% се под дејство на други неидентификувани фактори.

Варијациите меѓу Х и Y се објаснети со 98,58% преку факторот обем на производство, а остатокот од 1,42% се под дејство на други неидентификувани фактори.

Page 17: 9.Sb Vezbi Cas9 Mt

Тестирање на значајноста на регресионата врска

Y

криволиниска врска

X

Испитуваме дали воопшто постои регресиона врска помеѓу независната променлива и зависната променлива во популацијата.

Испитуваме дали воопшто постои регресиона врска помеѓу независната променлива и зависната променлива во популацијата.

Ако променливите не се праволиниски поврзани, врз основа на моделот yi=β0+ β1xi+I, β1=0 и тоа:

Ако променливите не се праволиниски поврзани, врз основа на моделот yi=β0+ β1xi+I, β1=0 и тоа:

A) Y е константа за било која вредност на Х

A) Y е константа за било која вредност на Х

Б) Не постои квантитативна врска меѓу појавите

Б) Не постои квантитативна врска меѓу појавите

В) Постои криволиниска врска

В) Постои криволиниска врска

Page 18: 9.Sb Vezbi Cas9 Mt

Пример 1 (решение (г)):

слагање вноквантитати постои односно на Y, влијае X 0:

слагање вноквантитати постои не односно на Y, влијае не X 0:

11

10

H

Hслагање вноквантитати постои односно на Y, влијае X 0:

слагање вноквантитати постои не односно на Y, влијае не X 0:

11

10

H

H

ттестдвостран е бидејќивредност апсолутна зема Се

104,16326,0

25,5 на тeстот Статистика

1

1 bS

bt

ттестдвостран е бидејќивредност апсолутна зема Се

104,16326,0

25,5 на тeстот Статистика

1

1 bS

bt

326,01661698

15,4грешка Стандардна

2221

xnx

SSb

326,01661698

15,4грешка Стандардна

2221

xnx

SSb

Со ризик на грешка од 0,05 прифаќа алтернативната хипотеза дека постои праволиниска врска помеѓу обемот на производство и трошоците. Заклучуваме и дека X влијае на Y.Со ризик на грешка од 0,05 прифаќа алтернативната хипотеза дека постои праволиниска врска помеѓу обемот на производство и трошоците. Заклучуваме и дека X влијае на Y.

распоред- tкористиме примерок мал За

7765,226;2/05,02;2/ tt n

распоред- tкористиме примерок мал За

7765,226;2/05,02;2/ tt n

7765,2104,16 26;2/05,0 tt 7765,2104,16 26;2/05,0 tt

Page 19: 9.Sb Vezbi Cas9 Mt

Пример 1 (решение (д)):

1 за доверба на Интервал 1 за доверба на Интервал

b t S b t Sn b n b1 2 2 1 1 2 21 1 / ; / ;

b t S b t Sn b n b1 2 2 1 1 2 21 1 / ; / ;

Со ризик на грешка од 0,05 оценуваме дека со порастот на производството за единица, вкупните трошоци ќе се зголемат за вредност од интервалот 4,34 до 6,16.Со ризик на грешка од 0,05 оценуваме дека со порастот на производството за единица, вкупните трошоци ќе се зголемат за вредност од интервалот 4,34 до 6,16.

16,634,4

326,07765,225,5326,07765,225,5

1

1

16,634,4

326,07765,225,5326,07765,225,5

1

1

Page 20: 9.Sb Vezbi Cas9 Mt

Користење на регресиониот модел за оценување и предвидување на вредностите на Y

Мора да бидат исполнети два предуслови за да се врши оценување и предвидување:

Мора да бидат исполнети два предуслови за да се врши оценување и предвидување:

1) r2>0,5 – регресионата линија добро да ги репрезентира емпириските податоци;

1) r2>0,5 – регресионата линија добро да ги репрезентира емпириските податоци;

2) Да постои праволиниска врска, β10.2) Да постои праволиниска врска, β10.

Page 21: 9.Sb Vezbi Cas9 Mt

Користење на регресиониот модел за оценување и предвидување на вредностите на Y

При предвидување (поради стохастичкиот карактер на Y и X) за секоја поединечна вредност на Хi постои цел распоред на можни вредности за Yi. Нивната просечна вредност E(Yi) се наоѓа на регресионата линија на масата. Предвидувањето има двоен карактер.

При предвидување (поради стохастичкиот карактер на Y и X) за секоја поединечна вредност на Хi постои цел распоред на можни вредности за Yi. Нивната просечна вредност E(Yi) се наоѓа на регресионата линија на масата. Предвидувањето има двоен карактер.

За Yр да се оцени просечната вредност Е(Yp)

За Yр да се оцени просечната вредност Е(Yp)

За Yр да се предвидат индивидуалните вредности на Yp

За Yр да се предвидат индивидуалните вредности на Yp

Е(Yp) - константаЕ(Yp) - константа

Индивидуалните вредности на Yp – случајни променливи и зависат од случајната грешка р

Индивидуалните вредности на Yp – случајни променливи и зависат од случајната грешка р

Интервал на оцена - потесенИнтервал на оцена - потесен Интервал на доверба - поширокИнтервал на доверба - поширок

Page 22: 9.Sb Vezbi Cas9 Mt

Користење на регресиониот модел за оценување и предвидување на вредностите на Y

pp xbby 10' pp xbby 10'

pp xyE 10)( pp xyE 10)(

Интервал на оцена на просечната вредност

Интервал на оцена на просечната вредност

36,159)(98,138

67,37765,217,149)(67,37765,217,149

')(' '2;2/'2;2/

p

p

ynppynp

yE

yE

StyyEStypp

36,159)(98,138

67,37765,217,149)(67,37765,217,149

')(' '2;2/'2;2/

p

p

ynppynp

yE

yE

StyyEStypp

67,31661698

)1626(

6

115,4

)(1

променлива зависната на

вредност просечната на оцената за грешка Стандардна

2

2

22

2

'

xnx

xx

nSS p

y p67,3

1661698

)1626(

6

115,4

)(1

променлива зависната на

вредност просечната на оцената за грешка Стандардна

2

2

22

2

'

xnx

xx

nSS p

y p

Вистинската просечна вредност на зависната променлива Y во популацијата, за Х=хр

Вистинската просечна вредност на зависната променлива Y во популацијата, за Х=хр

За оцена на Е(yp) користиме:За оцена на Е(yp) користиме:

y’p (оценета просечна вредност) Е(yp) (вистинска просечна вредност) – се разликуваат

поради грешка во примерокот

y’p (оценета просечна вредност) Е(yp) (вистинска просечна вредност) – се разликуваат

поради грешка во примерокот

17,1492625,567,1210' pp xbby 17,1492625,567,1210

' pp xbby

Со ризик на грешка од 0,05, при обем на производство од 26 тони, вкупните трошоци во просек ќе изнесуваат од 138,98 до 159,36 во 106 денари.

Со ризик на грешка од 0,05, при обем на производство од 26 тони, вкупните трошоци во просек ќе изнесуваат од 138,98 до 159,36 во 106 денари.

Page 23: 9.Sb Vezbi Cas9 Mt

Интервал на оцена на индивидуална вредност:Интервал на оцена на индивидуална вредност:

543,51661698

)1626(

6

1115,4

)(11

променлива зависната на

вредност натаиндивидуал на оцената на грешка Стандардна

2

2

22

2

xnx

xx

nsS p

y p

543,51661698

)1626(

6

1115,4

)(11

променлива зависната на

вредност натаиндивидуал на оцената на грешка Стандардна

2

2

22

2

xnx

xx

nsS p

y p

56,16478,133

543,57765,217,149543,57765,217,149

'' 2;2/2;2/

p

p

ynppynp

Y

Y

StyYStypp

56,16478,133

543,57765,217,149543,57765,217,149

'' 2;2/2;2/

p

p

ynppynp

Y

Y

StyYStypp

Користење на регресиониот модел за оценување и предвидување на вредностите на Y

Со ризик на грешка од 0,05, при обем на производство од 26 тони, вкупните трошоци ќе изнесуваат 133,78 до 164,56 во 106 денари.

Со ризик на грешка од 0,05, при обем на производство од 26 тони, вкупните трошоци ќе изнесуваат 133,78 до 164,56 во 106 денари.

Page 24: 9.Sb Vezbi Cas9 Mt

Проста праволиниска корелацијаКорелационата анализа се состои во утврдување дали помеѓу варијациите на набљудуваните појави постои квантитативно слагање (корелациона врска) и ако постои во кој степен и интензитет.

Корелационата анализа се состои во утврдување дали помеѓу варијациите на набљудуваните појави постои квантитативно слагање (корелациона врска) и ако постои во кој степен и интензитет.

Странски инвестицииСтрански инвестиции Бруто домашен производБруто домашен производ

Квалификација на вработенитеПлата

Квалификација на вработенитеПлата ПродуктивностПродуктивност

Набљудуваме две појави – проста корелацијаНабљудуваме две појави – проста корелација

Набљудуваме повеќе од две појави – повеќекратна корелацијаНабљудуваме повеќе од две појави – повеќекратна корелација

Page 25: 9.Sb Vezbi Cas9 Mt

Коефициент на проста праволиниска корелација на примерокот

За разлика од регресионата анализа, кај простата праволиниска корелација двете набљудувани променливи се третираат како случајни променливи.

За разлика од регресионата анализа, кај простата праволиниска корелација двете набљудувани променливи се третираат како случајни променливи.

Стапка на морталитетСтапка на морталитет Стапка на наталитетСтапка на наталитет

Двете појави имаат еднаков статус, односно сеедно е која појава ќе ја означиме со X, а која со Y, бидејќи се добиваат идентични резултати.

Двете појави имаат еднаков статус, односно сеедно е која појава ќе ја означиме со X, а која со Y, бидејќи се добиваат идентични резултати.

XX YY

YY XX

Page 26: 9.Sb Vezbi Cas9 Mt

Коефициент на проста праволиниска корелација на примерокотЗадачата на корелационата анализа е да покаже дали помеѓу варијациите на две појави постои праволиниска врска.

Задачата на корелационата анализа е да покаже дали помеѓу варијациите на две појави постои праволиниска врска.

1. Се зема случаен примерок од n-елементи;1. Се зема случаен примерок од n-елементи;

2. Се прикажуваат емпириските точки на примерокот во дијаграм на растурање. Лоцираноста и групираноста на точките ни сугерира за постоење или непостоење на квантитативна врска;

2. Се прикажуваат емпириските точки на примерокот во дијаграм на растурање. Лоцираноста и групираноста на точките ни сугерира за постоење или непостоење на квантитативна врска;

3. Доколку точките приближно се групираат околу правата линија, има смисла да се испитува постоењето и јачината на праволиниска врска помеѓу две појави.

3. Доколку точките приближно се групираат околу правата линија, има смисла да се испитува постоењето и јачината на праволиниска врска помеѓу две појави.

Page 27: 9.Sb Vezbi Cas9 Mt

Пример 2:

а) Да се квантифицира интезитетот (јачината) на зависноста помеѓу вкупниот приход и бројот на продадените производи;б) Да се тестира значајноста на оцената на коефициентот на корелација (ризик на грешка од 0,01);в) Да се објасни мерката на објаснетиот варијабилитет.

Вкупен приход во 103 денари Број на продадени производи (во парчиња)

65 39

78 43

52 21

82 64

92 78

72 45

Вкупниот приход остварен со продажба на еден производ и бројот на продадени производи во шест продавници е прикажан во табелата:

Page 28: 9.Sb Vezbi Cas9 Mt

Пример 2 (решение):Исцртуваме дијаграм на растурање да утврдиме дали емпириските точки приближно се групираат околу права линија.

Вкупен приход во 103 денари

Број на продадени

производи (во парчиња)

65 39

78 43

52 21

82 64

92 78

72 45 9080706050

80

70

60

50

40

30

20

Вкупен приход

Продадени

произ

води

Scatterplot of Продадени производи vs Вкупен приход

Page 29: 9.Sb Vezbi Cas9 Mt

Пример 2 (решение (а)):

Вкупен приход во 103 денари

(X)

Број на продадени производи

(Y)XY X2 Y2

65 39 2535 4225 1521

78 43 3354 6084 1849

52 21 1092 2704 441

82 64 5248 6724 4096

92 78 7176 8464 6084

72 45 3240 5184 2025

441 290 22645 33385 16016

а) Како мерка за квантифицирање на интензитетот или јачината на простата праволиниска корелациона врска во примерокот го користиме Pearson-овиот коефициент на проста праволиниска корелација (релативна мерка). Тој го покажува степенот на праволиниското слагање на две појави, X и Y.

а) Како мерка за квантифицирање на интензитетот или јачината на простата праволиниска корелациона врска во примерокот го користиме Pearson-овиот коефициент на проста праволиниска корелација (релативна мерка). Тој го покажува степенот на праволиниското слагање на две појави, X и Y.

954,0

290160166441333856

290441226456222222

yynxxn

yxxynr

954,0290160166441333856

290441226456222222

yynxxn

yxxynr

r=0,954, помеѓу бројот на производи и приходот постои многу висока директна праволиниска врска.

r=0,954, помеѓу бројот на производи и приходот постои многу висока директна праволиниска врска.

Page 30: 9.Sb Vezbi Cas9 Mt

Проста праволиниска корелација

954,0

290160166441333856

290441226456222222

yynxxn

yxxynr

954,0290160166441333856

290441226456222222

yynxxn

yxxynr

11 r 11 r

- Бидејќи формулата е симетрична во однос на X и Y, независно е која од појавите ќе ја означиме како X, а која како Y.

- Бидејќи формулата е симетрична во однос на X и Y, независно е која од појавите ќе ја означиме како X, а која како Y.

- Коефициентот на корелација е еднаков на квадратен корен од коефициентот на детерминација како мерка на квалитетот на репрезентативноста на регресионата линија на емпириските податоци.

- Коефициентот на корелација е еднаков на квадратен корен од коефициентот на детерминација како мерка на квалитетот на репрезентативноста на регресионата линија на емпириските податоци.2rr

2rr

r > 0, директна или позитивна корелацијаr < 0, инверзна или негативна корелација

r > 0, директна или позитивна корелацијаr < 0, инверзна или негативна корелација

r=1 или r=-1, совршена или перфектна корелација (постои функционална, детерминистичка врска, сите емпириски точки се точно на регресионата линија).

r=1 или r=-1, совршена или перфектна корелација (постои функционална, детерминистичка врска, сите емпириски точки се точно на регресионата линија).

r0 врската меѓу појавите е послаба r=0, не постои праволиниска врска (може да постои криволиниско слагање, но врз основа на коефициентот на корелација не сме во состојба да заклучиме што е точно).

r0 врската меѓу појавите е послаба r=0, не постои праволиниска врска (може да постои криволиниско слагање, но врз основа на коефициентот на корелација не сме во состојба да заклучиме што е точно).

Page 31: 9.Sb Vezbi Cas9 Mt

Проста праволиниска корелацијаY

X

r= 0r= 0

Y

X

r= -0,8r= -0,8 Y

X

r= 0,8r= 0,8

Y

X

r= 0r= 0

Y

X

r = -1r = -1 Y

X

r= 1r= 1

Толкување на вредностите на r

r>0 r<0

0 – 0,70 Нема изразита врска

0,70 – 0,80 Изразита директна врска Изразита инверзна врска

0,80 – 0,90 Висока директна врска Висока инверзна врска

0,90 – 1 Многу висока директна врска Многу висока инверзна врска

1Совршена директна праволиниска

корелацијаСовршена инверзна праволиниска

корелација

Page 32: 9.Sb Vezbi Cas9 Mt

Тестирање на значајноста на оцената на коефициентот на простата праволиниска корелација

Бидејќи r се пресметува само врз основа на податоците од примерокот, тој укажува само на постоење на корелација во примерокот.

Бидејќи r се пресметува само врз основа на податоците од примерокот, тој укажува само на постоење на корелација во примерокот.

Дали во основната маса од која е избран примерокот постои корелациона врска?Дали во основната маса од која е избран примерокот постои корелациона врска?

r претставува оцена на непознатиот коефициент на корелација на основната маса или популација кој се означува со (ро) и означува степен на праволиниска врска помеѓу две појави во популацијата.

r претставува оцена на непознатиот коефициент на корелација на основната маса или популација кој се означува со (ро) и означува степен на праволиниска врска помеѓу две појави во популацијата.

Дополнителна претпоставка – заедничкиот распоред на променливите X и Y е нормален.

Дополнителна претпоставка – заедничкиот распоред на променливите X и Y е нормален.

Page 33: 9.Sb Vezbi Cas9 Mt

Пример 2 (решение (б)):

значајна истатистичк е оценaта ,корелација каправолинис постои ,0:

значајна истатистичк е не оцената ,корелација каправолинис постои не ,0:

1

0

H

Hзначајна истатистичк е оценaта ,корелација каправолинис постои ,0:

значајна истатистичк е не оцената ,корелација каправолинис постои не ,0:

1

0

H

H

тест- tна Статистика

364,61499,0

954,0

rS

rt

тест- tна Статистика

364,61499,0

954,0

rS

rt

корелација каправолинис

простата на оцената на грешка Стандардна

1499,026

954,01

2

1 22

n

rSr

корелација каправолинис

простата на оцената на грешка Стандардна

1499,026

954,01

2

1 22

n

rSr

Со ризик на грешка од 0,01 ја прифаќаме алтернативната хипотеза, односно заклучуваме дека меѓу појавите постои праволиниска корелација, односно оцената на е статистички значајна.

Со ризик на грешка од 0,01 ја прифаќаме алтернативната хипотеза, односно заклучуваме дека меѓу појавите постои праволиниска корелација, односно оцената на е статистички значајна.

604,426;2/01,02;2/ tt n604,426;2/01,02;2/ tt n

604,4364,6 26;2/01,0 tt 604,4364,6 26;2/01,0 tt

Page 34: 9.Sb Vezbi Cas9 Mt

Пример 2 (решение (в)):

91,0954,0 22 r 91,0954,0 22 r

91% од варијациите во вкупниот приход можат да се објаснат со варијациите во бројот на продадени производи, а остатокот од 9% е резултат на варијациите на други фактори.

91% од варијациите во вкупниот приход можат да се објаснат со варијациите во бројот на продадени производи, а остатокот од 9% е резултат на варијациите на други фактори.


Top Related