Мерки на варијацијата...3-5 години 4 84 336 2.73 7,4529 626,04 5-10...

33
Мерки на варијацијата Предавањe на проф. д-р Цане T. Мојаноски Факултет за безбедност СКОПЈЕ

Upload: others

Post on 04-Feb-2021

7 views

Category:

Documents


0 download

TRANSCRIPT

  • Мерки на варијацијата

    Предавањe на

    проф. д-р Цане T. Мојаноски

    Факултет за безбедност

    СКОПЈЕ

  • 2

    Средно апсолутно отстапување - So

    Средното апсолутно отстапување (се обележува со Sо) се определува на тој начин што збирот од апсолутните вредности на одделните отстапувања на секој член на низата (фреквенцијата) од средната вредност се дели со вкупниот број единици:

    𝑺𝟎 = 𝒙𝟏 − 𝒙

    𝑵

  • 3

    Варијансата

    • Просечно (приближно) квадратно отстапување на вредностите од средната аретметичка вредност

    • Формула за прсметување е:

    – N – 1 – број на степени на слобода

    (вкупен број јаваувања)

    1-N

    )x(x

    V

    n

    1i

    2

    i

  • 4

    Стандардна девијација

    • Најчесто користена мерка на варијацијата

    • Ја покажува варијацијата околу средната вредност

    • Квадратен корен од варијансата

    • Се изразува во исти единицаи како и основните податоци

    1-N

    )x(xN

    1i

    2

    i

    1N

    x2

    1

    2

    N

    i

    Nx

  • f

    xf x )2

    1(

    fd2

    Табела бр.

    Полнолтни лица прогласени за виновни во

    1983 година Должина

    на казната

    средна

    интер

    класа

    број на

    осудени

    лица

    (x1. f) отстапу

    ва од М

    квадратно

    отстапува

    x1 f

    до 2 години 1 2989 2989 -0.27 0,0729 217,89

    2-3 години 2,5 75 187,

    5

    1,23 1,5129 113,46

    3-5 години 4 84 336 2.73 7,4529 626,04

    5-10

    години

    7,5 57 427,

    5

    6,23 38,8129 2212,33

    10-15

    години

    12,5 19 237,

    5

    11,23 126,113 2396,14

    15-20

    години

    17,5 1 17,5 16,23 263,413 263,41

    Вкупно 3225 4104 5829,27

    (x1-𝒙 )2 = d2

    f

    f d2

  • 6

    σ – групирани податоци

    x f x1 x1*f x1-x ̅ (x1-x ̅)2*f

    4,0 - 5,9 3 4,95 14,85 -9,67 280,53 6,0 - 7,9 4 6,95 27,8 -7,67 235,32 8,0 - 9,9 9 8,95 80,55 -5,67 289,34

    10,0 - 11,9 13 10,95 142,35 -3,67 175,10 12,0 - 13,9 22 12,95 284,9 -1,67 61,36 14,0 - 15,9 26 14,95 388,7 0,33 2,83 16,0 - 17,9 18 16,95 305,1 2,33 97,72 18,0 - 19,9 12 18,95 227,4 4,33 224,99 20,0 - 21,9 8 20,95 167,6 6,33 320,55 22,0 - 23,9 5 22,95 114,75 8,33 346,94

    вкупно 120 1754 2034,67

    𝑥 =14,62 σ= 4,12

  • 7

    Стандардна девијација од разликите меѓу паровите

    N

    d

    2

    2

    0,157 = 0,024583 = 24

    0,59 =

    Во 12 примероци се утврдени

    следните вредности

    d d2

    проба x1 x2 x1-x2 (x1-x2)2

    1 4,5 4,7 -0,2 0,04

    2 6,7 6,9 -0,2 0,04

    3 5,6 5,3 0,3 0,09

    4 7,8 7,8 0 0

    5 5,3 5,2 0,1 0,01

    6 4,5 4,8 -0,3 0,09

    7 8,4 8,5 -0,1 0,01

    8 6,3 6,1 0,2 0,04

    9 5,7 5,8 -0,1 0,01

    10 9,2 9,6 -0,4 0,16

    11 4,3 4,2 0,1 0,01

    12 5,9 6,2 -0,3 0,09

    0,59

    (x1-x2)2 = d2

  • 8

    Значење на стандардната девијација

    мала стандардна девијација

    висока стандардна девијација

  • 9

    Споредување на стандардните девијации

    11 12 13 14 15 16 17 18 19 20 21

    11 12 13 14 15 16 17 18 19 20 21

    grupa B

    grupa A

    𝑥 = 15.5

    σ= 0,926

    11 12 13 14 15 16 17 18 19 20 21

    𝑥 = 15.5

    σ= 4,567

    Група В

    𝑥 = 15.5 σ= 3,338

    група Б

    група A

  • 10

    Особини на варијансата и стандардната девијација

    • Секоја вредност се користи за пресметување на

    – разликата во однос на распонот (размерот) и интерквартилната разлика

    • На нив вијаат екстремните вредности затоа се

    • пресметува квадрат на отстапувањата од средната вредност

  • 11

    Коефициент на варијација- Kv

    • Мерка на релативната варијација (во однос на

    средната вредност)

    • Секогаш се изразува во %

    • Овозможува споредување на повеќе групи

    податоци, дури и тогаш и кога се изразени во

    различни единици:

    100 x

    = Kv

  • 12

    Споредување на коефициентите на варијација

    • Група A:

    – Средна вредност = 50

    – Стандардна девијација = 5

    • група Б:

    – Средна вредност = 100

    – Стандардна девијација = 5

    5%100%100

    5100%

    x

    SdvK B

    %01100%50

    5100%

    x

    SdvK A

  • 13

    Нумерички мерки за популацијата и примерокот

    • Статистичките параметри кои се пресметуваат од популацијата ги опишуваат особините на популацијата

    • Статистичките параметри кои се пресметуваат од примерокот ги опишуваат особините на примерокот

    • Средна вредност на популацијата – μ

    • Средна вредност на примерокот –

    • Стандардна девијација на популацијата – σ

    • Стандардна девијација на примерокот – Sd

    x

  • 14

    Z-score – Стандарден скор

    • Отстапување од набљудуваната вредност од x изразено во бројот на Sd

    • z=(x -x)/Sd z =𝑥−𝑥

    𝜎

    • Мерки на релативното отстапување

    • Ako z e позитивен - значи e поголем од повеќето вредности во мноштвото

    • Ако z е негативен – значи е помал од повеќето вредности во збирот

  • 15

    Z-score

  • 16

    • Девојката е висока 160 cm и има z-score 0,7 во однос на просекот на висината на групата која изнесува x = 168 cm. Колкава е големината Sd?

    • 𝑧 =𝑥−𝑥

    𝑠𝑑 0,7=(160-168)/Sd

    Sd= - 0,0875

    z-score пример 2

  • Нормална распределба

  • Интервалот на сигурноста • Оценувањето, се заснива врз принципите на интервалот на

    сигурноста. Централната гранична теорема, како што забележавме и погоре, може да се дефинира на следниот начин: без разлика на обликот на популацијата, распоредот на аритметичките средни големини на мострите како што растат (по број и величина), така се повеќе се приближуваат кон нормалната дистрибуција. Затоа:

    • (1) 68% од аритметичките средни големини на мострите лежат на растојание од една стандардна девијација лево и десно од аритметичката средна големина на популацијата, односно -1

  • Отстапување на емпириската дистрибуција од нормалната

    • Отстапувањето на некоја дистрибуција од нормалната може да се процени и врз основа на мерките на просекот. На сликата 1.1. може да се види дека кај дистрибуцијата "а" (нормалната распределба) сите три мерки на просекот се поклопуваат: модусот (Мо), медијанта (Мd) и аритметичкта средина (М). Кај дистрибуцијата "б" (негативна асиметричност) најголема вредност има модусот, потоа медијаната, па потоа аритметичката срединам додека кај дистрибуцијата "в" е обратен случајот- аритметичката средина, медијаната и модусот. Значи на сликата 1.1. се гледа релативната положба намерката на просекот. Според извиениот крај аритметичката средина е навалена повеќе отколку модусот, а медијаната е поместена за две третини на тоа растојание (Guilford, 1968, стр.59).

    0

    5

    10

    15

    20

    Симетричен облик P ozi t i vna asi met r i ja

    0

    5

    10

    15

    0

    2

    4

    6

    8

    10

    12

    Негативна асиметрија

  • • Skjunis. Мерката на асиметричност (искривеност на дистрибуцијата) или Skjunis (Ѕк) може да се пресмта на различни начини. Овде се наведуваат следните:

    • а) Одност на асиметричноста и мерките на просекот • Ѕк: мерка на асиметричност (skjunis)Мd: медијанаМ: аритметичка средина:

    стандардна девијација • Да претпоставиме дека на учениците им се дадени три тестови и нивните

    резултати се изразени во оценките: Т1:М1=3,05; Мd1=3,00 и 1=0,96; Т2:М2=3,75; Мd2=4,00 и 2=0,98; Т3:М3=2,50, Мd3=2,00; 3=0,97.

    • Пресметаните индекси (мерки) на асиметричност изнесуваат: Ѕк1=+0,156; Ѕк2=-0,765 и Ѕк=+1,546. Значи "плус" и "минус" зборуваат дали асиметричноста е позитивна или негативна.

    • Врз основа на пресметаните мерки на асиметричност може да се заклучи дека тестот Т1 е најсоодветен и дека дистрибуцијата од неговите резултати се приближува кон нормалната. Најмногу е извиена дистрибцијата на тестот Т3 и таа е позитивно асиметрична. Кај него преовладуваат слабите резултаи, тестот е претежок за учениците. За тестот Т2 извисноста е помала и неговата дистрибуција е негативно асиметрична, т.е преовладуваат подобрите резултати, односно тестот е доста лесен за учениците.

    Ѕк: мерка на асиметричност (skjunis)

    Мd: медијана

    М: аритметичка средина

    : стандардна девијација

    MdMSk

    3

  • мерка на сплесканост

    (куртозис) • Асиметричноста не е единствен вид на отстапувањето од емпириската

    дистрибуција од нормалната. Многу сплеснати (платикуртични) дистрибуции, исто така отстапуваат од нормалната. За да би се знаело која статистичка постапка може да се примени, исто така е потребно да се пресмета мерката на куртичност (заобленоста на дистрибуцијата) или куртозис (Ku). Тој најчесто се пресметува на следниот начин:

    • Ku: мерка на сплесканост (куртозис)

    • Q: квартилна девијацијаP: соодветен перцентил

    • За нормалната дистрибуција статистичките параметри (наведени во образецот) изнесуваат: Q=0, 6745; P10=-1,28; P90=1,28. Овие вредности се изразени во стандардни единици. Ако се вклучат во погоренаведената формула се добива дека Кu=0,263. Доколку Кu е поголемо од 0,263 дистрибуцијата е плактикуртична, а доколку е помала од неа тогаш тааа е лептокуртична

    Obl i ci na spl o{ t enost

    0

    5

    10

    15

    20

    25

    30

    35

    40

    PPQ

    Ku

    1090

    Ku: мерка на сплесканост

    (куртозис)

    Q: квартилна девијација

    P: соодветен перцентил

  • Фи-коефициент () на корелација

    • Ако треба да се уврди поврзаноста меѓу појави со квалитативно обележје (полот на учениците на пример) и континуирана распределба (резултатите од тестот на знаења), тогаш се применува Фи- коефициентот на корелација. При примената на овој тест треба да се води сметка дека двете варијабли се дихомизирани: првата варијабла (Х) претставува пол. Таа по својата природа е поделена на две категории (машки и женски). Втората варијабла, успехот на учениците (Y) се јавува во вештачка дихомизирана форма: просечен (+) и подпросечен (-) резултат на тестот. Според тоа, се исполнети условите за пресметување на Фи- коефициентот на корелациија

  • Варијабли Пол (x)

    Успех (Y)

    Машки Женски Сума

    Над (+) 17 a 15 b 32 a+b

    Под (-) 13 c 15 d 28 c+d

    Сума 30 a+c 30 b+d 60 N

    ))()()(( dcdbcaba

    bcad

    22

    N

    ))()()((

    )(( )2

    2

    dcdadbca

    bcaddcba

    2885,0748800

    216000

    )26)(32)(30)(30(

    3600)(60( )2

    C=O,0692

  • 2-тест • Од непараметриските статистички тестови најчесто се

    употребува хи-квадрат (2) тестот. Хи-квадрат тестот ја користи фреквенцијата како и податоците што можат да се сведат на фреквенции.

    • Реалтивно едноставната примена на овој тест понекогаш може да не "заведе" и така да се појават различни грешки, првенствено во интерпретацијата. Затоа при примената на 2 тестот треба да се провери природата на податоците со кои се располага.

    • на пример, потребно е да се провери: оправданоста на претворање на податоците во фреквенции, смислата на категоризирањето на податоците, логичката заснованост на вештачките категории, можноста за интерпретација итн. Како и другите статистички тестови и 2-тестот служи за проверка и докажување на некоја поставена хипотеза.

  • f

    ff

    t

    ti

    2

    2

    95,39

    910(

    11

    1110(

    27

    2730(

    33

    3330(

    9

    95(

    11

    1115( ))))))222222

    2

    Тип на претап под 25 години

    26-49 години

    над 50 години

    Вкупно

    fi ft fi ft fi ft

    Насилнички 15 11 30 33 10 11 55

    Ненасилнички 5 9 30 27 10 9 45

    Вкупно 20 20 60 60 20 20 100

    Вредностите за ft се добиваат за 15=(20х55)/100=11; за 5: (20x 45)/100=9; за 30 се пресметува (60 x55)/100=33; потоа пак за 30 (60x 45)/100=27 итн.

    2-тест

    2

    2

    nC

    коефициентот на контингенција

    1,36 1,78 0,27 0,33 0,09 0,11 3,95

  • 2-тест • Со хипотезата се дефинира специфичниот однос

    на појавата така што поставениот однос може емпириски да се дефинира и провери, т.е мора да се докаже дека хипотезата е вејојатна или неверојатна.

    • Понекогаш, степенот на значајноста се смета за автоматски правила за донесување на одлука за "прифаќање" или "отфрлање" на нултата хипотеза. Доволно не се води сметка за големината на мострата и за останатите услови. На пример, доколку мострата е мала, 2 ќе е значаен само доколку нултата хипотеза е погрешна, кај големите мостри и малите отстапувања од нултата хипотеза можат да се покажат како статистички значајни.

  • 2-тест

    • Според Нејман-Писоновата теорија грешката од прв вид е отфрлањето на нултата хипотеза кога таа е точна, а грешка од втор вид е отфрлањето на нултата хипотеза кога таа не е точна. Затоа од посебна важност при отфрлањето и прифаќање на хипотезата, покрај специфичните резултати на статистичката значајност, да се има предвид целокупниот расположив доказен материјал

  • Табела бр. Работници според староста и работниот стаж

    работник

    Роза Соњ

    а

    Нел

    а

    Мел

    и

    Коки Асја Кате Ина

    старост 26 31 36 41 46 51 51 56

    стаж 7 10 13 25 30 27 22 40

    (произволен пример)

    ))2222

    (( yNxN

    yxxyN

    yxRxy

    91,050,8337,99

    6020

    17446568338150688

    17433881048

    )()(22

    r xy

  • Табела бр. Работници според староста и работниот стаж

    (произволен пример)

    ))2222

    (( yNxN

    yxxyN

    yxRxy

    91,050,8337,99

    6020

    17446568338150688

    17433881048

    )()(22

    r xy

    x y x2 y2 x*y 1 26 7 676 49 182 2 31 10 961 100 310 3 36 13 1296 169 468 4 41 25 1681 625 1025 5 46 30 2116 900 1380 6 51 27 2601 729 1377 7 51 22 2601 484 1122 8 56 40 3136 1600 2240 Вкупно 338 174 15068 4656 8104

    suma x2 114244

    suma y2 30276

    N 8

  • Табела бр. Односот меѓу сообраќајните прекршоци и

    дисциплинските мерки во една полициска станица

    (работна табела)

    (Произволен пример)

    rN

    d

    N

    1

    6

    1

    2

    2( )

    87,0)1(14

    5,5861

    142

    r

    р.бро

    ј Работник

    сообраќ

    ајни

    Дисц

    ипли

    нски ранг dx ранг dy (dx-dy) (dx-dy)2

    1 Сања 5 6 1 2 -1 1

    2 Николина 6 9 2 6,5 -4,5 20,25

    3 Христина 7 7 3 3 0 0

    4 Марко 8 5 4 1 3 9

    5 Мирко 9 8 5 4,5 0.5 0,25

    6 Јован 10 12 6 8 -2 4

    7 Зоран 11 8 7 4,5 2,5 6,25

    8 Никола 12 10 8 6 2 4

    9 Петар 13 9 9 6,5 2,5 6,25

    10 Здравка 14 15 10 11 -1 1

    11 Лилјана 15 16 11 12,5 -1,5 2,25

    12 Моника 16 14 12 10 2 4

    13 Марија 17 16 13 12,5 0,5 0,25

    14 Стефан 18 18 14 14 0 0

    N Σ50

  • Поимот мерење

    • во општествените науки било спорно дали може во нивни рамки да има мерење и дали употребата на методот на мерење значи нешто повеќе за нивниот севкупен развој или не.

    • Со поимот „мерење“ го опфаќаме секое споредување на величините кои оперираат со судовите на „помалку-повеќе", „поблиску-подалеку", итн. значи се што оперира со определени релациони судови. Останатите факти за мерењето на општествените и политичките појави со помош на строго квантитативните инструменати опфаќаат помал дел во современата истражувачка дејност;

    • Мерењето денес е составен дел на секоја општествена наука било да се работи за општа, или посебна општествена наука.

    • Ова, пак, од своја страна не значи дека денес општествените науки располагаат со квантитативни инструменти за мерење, онакви какви што ги имаме во природните науки и на кои веднаш помислуваме кога се спомене терминот мерење.

    • Во општествените науки терминот мерење се сфаќа многу пошироко, па и во посебните општествени науки се правени обиди мерењето на разни општествени елементи да се подигне на највисоко ниво на квантитативна обработка.

  • Мерки на скалите ВИДОВИ ПОДАТОТОЦИ

    Квантитативни Квалитативни

    обележја

    Номинална Пропорции Проценти Мода

    Тест на значајноста меѓу пропорциите

    Hi-квадрат тест на значајност на разликите

    на релативните фреквенции

    Биномен тест

    Хи- квадрат тест

    Cochranov Q тест

    Pearson-ов коефицијент на контигенцијата

    (С)

    Fi-коефициент

    ординална Централна вредност (Медијана)

    Рангови

    Kolmogor - Smirnov тест

    Wilcohon-ов тест на рангот

    Тест на медијаната U-тест (Mann -Whitny)

    Wald - Wolfowitz-ов тест Spearman-ов

    коефицијент на корелације на рангот (RO)

    Kendall-ов коефициент на конкордација (W)

    Анализа на варијансата (Fridman-овата

    варијанта) Walsh-ов тест

    Интервална Аритметичка средина Стандардна девијација Коефициент варијабилитетот

    Размерна –

    Ratio

    Тест значајноста на разликите меѓу

    стандардните девијации Тест z - вредностa

    Pearsonov косфициент корелације (R)

    Анализа на коваријансата

    Парцијална корелација

    Мултипла корелација

    Факторска анализа

    Мултиваријани техники

    Геометриска средина Хармонска средина

  • БЛАГОДАРИМЕ ЗА

    ВНИМАНИЕТО!

    ?