stat formuli

34
Уважаеми колеги, Курсът по базисната дисциплина “Статистика” съдържа сравнително голям брой формули. Нашата цел е те да не бъдат заучавани механически. Основното, което ще остане във Вашето съзнание трябва да бъдат познавателните възможности и изискванията при практическото приложение на серия от статистически измерители и методи за анализ. Когато във Вашата бъдеща практика възникне конкретен казус, свързан с набирането и възможностите за анализ на емпирична числова информация, следва да се досетите, че науката Статистика Ви дава множество възможности в тази област. Предлаганият учебник съдържа обстойно представяне на основните от тях. Нещо повече, след всяка глава е представена и допълнителна специализирана литература по съответната тема. За Вас оставяме само коректно да приложите необходимите измерители и методи за статистически анализ, за да достигнете да разкриване на статистически значими връзки и зависимости, за ги моделиране и измерите количествено. Получените от анализа резултати можете да използвате и за прогностични цели. Тези от Вас, които желаят, могат да си разпечатат предлагания свитък от основни формули, които са съпроводени и със съответни кратки описания и без каквито и да било допълнения от тяхна страна, да го използват по време на семестриалния изпит по дисциплината “Статистика”. Това би Ви спестило неудобството да правите “пищови” и би ви улеснило да акцентирате вниманието си върху съдържателната страна на изпитния тест, а не върху механичното запаметяване на конкретни формули. ОСНОВНИ ФОРМУЛИ, ИЗПОЛЗВАНИ В СТАТИСТИКАТА 1. СТАТИСТИЧЕСКИ ГРУПИРОВКИ

Upload: badbrink

Post on 10-Oct-2014

368 views

Category:

Documents


2 download

TRANSCRIPT

Page 1: Stat Formuli

Уважаеми колеги,

Курсът по базисната дисциплина “Статистика” съдържа сравнително голям

брой формули. Нашата цел е те да не бъдат заучавани механически. Основното,

което ще остане във Вашето съзнание трябва да бъдат познавателните

възможности и изискванията при практическото приложение на серия от

статистически измерители и методи за анализ.

Когато във Вашата бъдеща практика възникне конкретен казус, свързан с

набирането и възможностите за анализ на емпирична числова информация,

следва да се досетите, че науката Статистика Ви дава множество възможности в

тази област. Предлаганият учебник съдържа обстойно представяне на основните

от тях. Нещо повече, след всяка глава е представена и допълнителна

специализирана литература по съответната тема. За Вас оставяме само коректно

да приложите необходимите измерители и методи за статистически анализ, за да

достигнете да разкриване на статистически значими връзки и зависимости, за ги

моделиране и измерите количествено. Получените от анализа резултати можете

да използвате и за прогностични цели.

Тези от Вас, които желаят, могат да си разпечатат предлагания свитък от

основни формули, които са съпроводени и със съответни кратки описания и без

каквито и да било допълнения от тяхна страна, да го използват по време на

семестриалния изпит по дисциплината “Статистика”. Това би Ви спестило

неудобството да правите “пищови” и би ви улеснило да акцентирате вниманието

си върху съдържателната страна на изпитния тест, а не върху механичното

запаметяване на конкретни формули.

ОСНОВНИ ФОРМУЛИ, ИЗПОЛЗВАНИ В СТАТИСТИКАТА

1. СТАТИСТИЧЕСКИ ГРУПИРОВКИ

Page 2: Stat Formuli

1.1.Аритметична формула за определяне ширината на интервала при интервални

групировки с еднаква ширина на интервалите:

k

XXh minmax

h – ширина на интервала; Xmax – максимално значение на признака; Xmin –

минимално значение на признака; k – предварително определен брой на групите.

1.2. Относителни честоти, характеризиращи едномерни емпирични честотни

разпределения.

1.2.1. По отношение на цялата съвкупност:

N

fp i

i

fi – абсолютни честоти на i-то значение на статистическия признак Xi ; N – общ

брой на единиците в съвкупността

1.2.2. По отношение на броя на действително разпределените единици в

съвкупността:

i

ii

f

fp*

Σfi – сума от абслоютните честоти за всички значения на статистическия признак

Xi .

1.3. Кумулативни честоти, характеризиращи едномерни емпирични честотни

разпределения.

1.3.1. Кумулативна честота

i

1jji fC за i=1, …, k.

fj – абсолютни честоти на j-то значение на статистическия признак; k – брой на

значенията на признака Xi .

1.3.2. Относителна кумулативна честота:

i

j

ji

i pn

CC

1

(%)(%) %100. за i=1, …, k.

Page 3: Stat Formuli

Ci – кумулативна честота на i-то значение на статистическия признак Xi ; pj –

относителна честота на j-то значение на признака Xi ; k – брой на значенията на

признака Xi .

2. СТАТИСТИЧЕСКИ СРЕДНИ ВЕЛИЧИНИ

2.1. Алгебрични средни величини

2.1.1. Средна аритметична величина

2.1.1.1. Непретеглена средна аритметична величина

N

x

N

xxxx

N

i

i

N

121 ...

където: хi са индивидуалните значения на признака ; N- брой на наблюдаваните

единици.

2.1.1.2. Претеглена средна аритметична величина

ii

ii

ii

k

i

i

k

i

ii

pxN

fx

N

fx

f

fx

x

1

1

където: хi са индивидуалните значения на признака ; fi - абсолютни честоти

(тегла); pi - относителни честоти (тегла); k – брой на значенията на xi ; N- брой на

наблюдаваните единици.

Основни свойства на средната аритметична величина:

0)( XXi

min)( 2 XXi

Page 4: Stat Formuli

AX

f

fАX

k

i

i

k

i

ii

1

1

)(

AX

f

fАX

k

i

i

k

i

ii

1

1

)(

A

X

f

fA

X

k

i

i

k

i

i

i

1

1

)(

X

Af

АfX

k

i

i

k

i

ii

1

1

)(

)(

X

A

f

XA

f

k

i

i

k

i

i

i

1

1

)(

където А е произволна константа, А≠ 0.

2.1.2. Средна хармонична величина.

2.1.2.1. Непретеглена средна хармонична величина:

x

N

xxx

Nx

N

харм 11...

11

21

където: хi са индивидуалните значения на признака ; N- брой на наблюдаваните

единици.

2.1.2.2. Претеглена средна хармонична величина:

Fx

F

Fx

Fx

Fx

FFFx

k

N

k

харм

11...

11

...

2

2

1

1

21

където: Fi = xi fi ; хi са индивидуалните значения на признака ; k – брой на

значенията xi ; N- брой на наблюдаваните единици.

2.2. Неалгебрични (позиционни) средни величини.

2.2.1. Медиана (средна на положение) при интервални статистически редове:

Page 5: Stat Formuli

Me

MeMeMef

hCNLMe .1

където: MeL е долната граница на медианния интервал; NMe е номерът на единицата, носеща медианното значение:

2

1

NNMe

- N- общ брой на единиците в съвкупността.

1MeC е кумулативната честота на предмедианния интервал;

Mef е честотата на медианния интервал; h е ширината на медианния интервал.

2.2.2. Мода (най-често срещаното значение на признака) при интервални

статистически редове:

)()(

)(

11

1

MoMoMoMo

MoMoMo

ffff

hffLMo

където: LMo - долна граница на модалния интервал;

fMo - честота в модалния интервал;

fMo-1 - честота в предмодалния интервал;

fMo+1 - честота в следмодалния интервал;

h - ширина на модалния интервал.

2.3. Съотношение между средната аритметична, медианата и модата в едно

емпирично честотно разпределение:

)(3 MexMox

3. СТАТИСТИЧЕСКО РАЗСЕЙВАНЕ

3.1. Размах на разсейването.

3.1.1. Абсолютен размер:

R = xmax - xmin

3.1.2. Относителен размер (коефициент на вариация по размаха):

Page 6: Stat Formuli

100.minmax(%)

x

xxVR

където: xmax - максимално значение на признака ; xmin - минимално значение на признака; x е средната аритметична.

3.2. Средно аритметично (линейно) отклонение.

3.2.1. Абсолютен размер.

3.2.1.1. Непретеглена формула:

N

xxi

където: хi са индивидуалните значения на признака ; x е средната аритметична; N – брой на

наблюдаваните единици.

3.2.1.2. Претеглена формула:

i

ii

f

fxx

където: хi са индивидуалните значения на признака ; fi - абсолютни честоти

(тегла); x е средната аритметична.

3.2.2. Относителен размер (коефициент на вариация по средно аритметично

отклонение):

100.(%)x

V

3.3. Средно квадратично(стандартно) отклонение.

3.3.1. Абсолютен размер.

3.3.1.1. Непретеглена формула:

N

xxi

2

където: хi са индивидуалните значения на признака ; x е средната аритметична; N – брой на

наблюдаваните единици.

Page 7: Stat Formuli

3.3.1.2. Претеглена формула:

i

ii

f

fxx2

където: хi са индивидуалните значения на признака ; fi - абсолютни честоти

(тегла); x е средната аритметична.

3.3.2. Относителен размер (коефициент на вариация по средно квадратично

отклонение):

100.(%)x

V

3.4. Дисперсия.

3.4.1. Непретеглена формула:

N

xxi

2

2

3.4.2. Претеглена формула:

22

2

2 1xfx

Nf

fxxii

i

ii

3.5. Средно квадратично (стандартно ) отклонение при алтернативен

(дихотомен) признак:

pq

където р е относителен дял на единиците по едно от значенията на признака, а q

– по другото, т.е. q = 1- p.

3.6. Средна разлика на К.Джини.

3.6.1. Непретеглена формула:

2

1 1

N

xx

G

n

i

n

j

ji

където: хi и xj са индивидуални значения на признака; N – брой на наблюдаваните единици.

Page 8: Stat Formuli

3.6.2. Претеглена формула:

)1(

21

NN

CCfx

G

k

i

iiii

където: хi са индивидуални значения на признака; fi - абсолютни честоти (тегла);

iC е прогресивно-кумулативна честота, получена чрез сумиране на честотите от

първата до i–та група; iC е регресивно-кумулативна честота, получена чрез

кумулация на честотите от последната до i–та група; N – брой на наблюдаваните единици.

4. АСИМЕТРИЯ И ЕКСЦЕС

4.1. Коефициент на асиметрия на Пирсън.

MoxKP

a

където: x е средната аритметична; σ е стандартното отклонение; Мо е модата на разпределението.

4.2. Коефициент на асиметрия на Юл

Mex3KY

a

където: x е средната аритметична; σ е стандартното отклонение; Ме е медианата на разпределението.

4.3. Коефициент на асиметрия на Боули.

13

13Ba

QQ

Me.2QQK

където: Q1 и Q3 са съответно 1-ви и 3-ти квартил на разпределението; Ме е медианата на разпределението.

4.4. Моментен коефициент на асиметрия.

Page 9: Stat Formuli

3

3

aK

където 3 е 3-тия централен момент, който се изчислява по формулата:

i

ii

f

fxx3

3

Интерпретация на коефициентите на асиметрия

Когато Ка = 0 разпределението е симетрично;

Когато Ка < 0 разпределението е ляво асиметрично;

Когато Ка > 0 разпределението е дясно асиметрично.

4.5. Моментен коефициент на ексцес.

4.5.1. Обикновен коефициент на ексцес:

4

4

Е

където 4 е 4-тия централен момент, който се изчислява по формулата:

i

ii

f

fxx4

4

4.5.2. Стандартизиран коефициент на ексцес:

Еs = E – 3

Интерпретация на коефициентите на ексцес

Когато Е = 3 или Еs = 0 разпределението е с нормален ексцес;

Когато Е < 3 или Еs < 0 разпределението е приплеснато;

Когато Е > 3 или Еs > 0 разпределението е с връхна източеност.

5. ЕДНОМЕРНИ ТЕОРЕТИЧНИ РАЗПРЕДЕЛЕНИЯ

5.1. Функция на разпределението (интегрален закон на разпределението):

F(x) = P(X≤x)

където: х е произволна стойност от областта от значения на случайната величина Х; Р е вероятност.

Page 10: Stat Formuli

5.1.1. При прекъснати (дискретни) случайни величини:

F(x) = Σf(x)

5.1.2. При непрекъснати (индискретни) случайни величини:

а

dxxfаF )()(

където f(x) е функция на плътността.

5.2. Функция на плътността (честотна функция):

x

xFxf

)()(

където F(x) е интегралната функция.

5.2.1. При прекъснати (дискретни) случайни величини:

f(a) = P(х=a)

5.2.2. При непрекъснати (индискретни) случайни величини:

b

a

dxxfbxaP )()(

5.3. Нормално разпределение.

5.3.1. Функция на разпределението:

dxexF

xx

2

2

2

2

1)(

5.3.2. Функция на плътността:

2

2

2

2

1)(

xx

exf

където средната аритметична ( х ) и стандартното отклонение (σ) са параметри

на разпределението.

5.4. Стандартизирано нормално разпределение.

Page 11: Stat Formuli

5.4.1. Функция на разпределението:

dzeZF

Z z

2

2

2

1)(

5.4.2. Функция на плътността:

2

2

2

1)(

Z

eZf

където

xxz

са стандартизираните стойности на случайната величина х .

5.5. Логаритмично нормално (логнормално) разпределение.

5.5.1. Функция на разпределението:

)(ln.2

1)(ln

2

2

2

ln

ydeyF

y

5.5.2. Функция на плътността:

2

2

2

ln1

.2

1)(ln

y

ey

yf

където ln y = x и = E(ln y).

5.6. t – разпределение на Стюдънт.

5.6.1. Функция на плътността:

2

1

2

1

2

2

1

.1

)(

ttf

за -∞ < t < ∞,

Page 12: Stat Formuli

където

nxxt

:

; x e средна на случайната величина Х, наблюдавана от

извадка; х е средна на Х за генаралната съвкупност; n

е стандартното

отклонение на получените средни за извадките; Г е гама функция с общ вид:

2

2

1

ν е параметър на гама функцията, наричан степени на свобода, който може да

заема само положителни значения.

5.7. F – разпределение на Фишер.

5.7.1. Функция на плътността:

2

2

1

2

2

2

2

1

21

21

21

11

1

..

22

2)(

vv

vv

v

fv

f

v

v

vv

vv

Ff

където 2

2

y

xF

; x и y са дисперсиите на две независими случайни величини Х и

У, наблюдавани чрез извадки (-∞< Х <∞) и (-∞< У <∞); Г е гама функция с

параметри ν1 и ν2, наричани степени на свобода, които могат да заемат само

положителни значения.

5.8. 2 – разпределение на Пирсън.

5.8.1. Функция на плътността:

21

2

2

2 ..

2.2

1)(

xv

vex

vf

( 0 ≤ 2 < ∞ )

Page 13: Stat Formuli

където

v

i

iv xxxxxxxx

1

222

2

2

12 ........

; xi са стойности на

случайната величина Х, наблюдавани при случайна извадка; x и σ са съответно

средната и стандартното отклонение на случайната величина Х; Г е гама функция

с параметър ν (степени на свобода).

6. СТАТИСТИЧЕСКО ОЦЕНЯВАНЕ НА ПАРАМЕТРИ

НА ГЕНЕРАЛНА СЪВКУПНОСТ

6.1. Средно стохастично (стандартно) отклонение по данни от представителна (репрезентативна) извадка – формула на

Бесел:

1

2

n

xxS

i

x

където: хi са индивидуалните значения на признака; x е средната аритметична; n – обем на

извадката.

6.2. Средна стохастична (стандартна) грешка на оценката на средна

аритметична величина.

6.2.1. При възвратен подбор:

n

Sxx

където xS е оценка на стандартното отклонение.

6.2.2. При безвъзвратен подбор:

N

n

n

Sxx 1.

където N – обем на генералната съвкупност.

6.3. Средна стохастична (стандартна) грешка на оценката на относителен дял

при алтернативен признак:

6.3.1. При възвратен подбор:

Page 14: Stat Formuli

n

pqp

където р е относителният дял, получен от данни на извадката; q = 1 – p; n е

обемът на извадката.

6.3.2. При безвъзвратен подбор:

N

n

n

pqp 1.

където N – обем на генералната съвкупност.

6.4. Максимално допустима грешка на оценката на средна аритметична

величина.

xx Z .

където Z е гаранционен множител, който зависи от равнището на гаранционната

вероятност и се определя от таблицата на стандартизираното нормално

разпределение.

6.5. Максимално допустима грешка на оценката на относителен дял:

pp Z .

6.5. Доверителен интервал на средна аритметична величина:

xx xx

където е средна аритметична на генералната съвкупност.

6.6. Доверителен интервал на относителен дял:

pp pPp

където Р е относителен дял в генералната съвкупност.

6.7. Обем на извадката при оценка на средна аритметична и относителен дял.

6.7.1. При възвратен подбор

Page 15: Stat Formuli

2

22 .

SZn

където Z е гаранционният множител; S2 е оценка на дисперсията на величината,

чиято средна аритметична или относителен дял ще бъдат оценявани; Δ е

максимално допустимата грешка на оценката, която ще се оценява .

6.7.2. При безвъзвратен подбор

222

22

..

..

SZN

NSZn

където N е обема на генералната съвкупност.

7. СТАТИСТИЧЕСКА ПРОВЕРКА НА ХИПОТЕЗИ

7.1. Етапи на статистическата проверка на хипотези.

7.1.1. Дефиниране на нулевата (Но) и алтернативната (Н1) хипотези.

7.1.2. Фиксиране на риска за грешки от първи род ().

7.1.3. Избор на метод за проверка и съответния статистически критерий,

чрез който се проверяват дефинираните хипотези.

7.1.4. Набавяне на необходимата за проверката информация.

7.1.5. Изчисляване на емпиричната характеристика на статистическия

критерий въз основа на данни от представителната извадка.

7.1.6. Определяне на характера на критичната област, ако това е

необходимо, според използвания статистически критерий и начина на

дефиниране на Н1 .

7.1.7. Определяне на теоретичната характеристика на статистическия

критерий въз основа на необходимите параметри.

7.1.8. Вземане на решение относно това, да приемем или да отхвърлим

нулевата хипотеза.

Page 16: Stat Formuli

7.2. Емпирична характеристика за статистическа проверка на хипотези въз

основа на данни от една извадка.

7.2.1. Относно средна аритметична на генерална съвкупност.

7.2.1.1. При големи извадки (n ≥ 30):

n

xz

/

където x е оценка на средната аритметична на извадката; е средната

аритметична в генералната съвкупност; σ е стандартното отклонение в

генералната съвкупност; n е обем на извадката. Когато стойността на σ е

неизвестна, тя се замества с нейната оценка xS, получена от данните за

извадката, т.е.:

nS

xz

x /

7.2.1.2. При малки извадки (n < 30).

n

xt

или nS

xt

x

7.2.2. Относно относителен дял за генерална съвкупност.

7.2.2.1. При големи извадки (n ≥ 30):

npq

Ppz

където р е относителният дял, получен от данни на извадката; q = 1 – p; Р е

относителният дял за генералната съвкупност; n е обемът на извадката.

7.2.2.2. При малки извадки (n < 30).

npq

Ppt

7.3. Емпирична характеристика за статистическа проверка на хипотези въз

основа на данни от две независими извадки.

Page 17: Stat Formuli

7.3.1. Относно разлика между две средни аритметични величини.

7.3.1.1. При големи извадки (n1 ≥ 30 и n2 ≥ 30):

2

22

1

21

21

n

S

n

S

XXZ

където: 1X е средната на първата извадка; 2X е средната на втората извадка; 21S и

22S са оценки на дисперсиите в двете извадки; n1 и n2 са съответните

обеми на двете извадки. 7.3.1.2. При малки извадки (n1 < 30 и/или n2 < 30):

2

11...

2

1

2

2

21

2

1

2121

nnnSnS

nnХХt

7.3.2. Относно разлика между два относителни дяла.

7.3.2.1. При големи извадки (n1 ≥ 30 и n2 ≥ 30):

2

22

1

11

21

n

qp

n

qp

ррZ

където р1 е относителният дял, получен от данни на първата извадка; р2 е

относителният дял, получен от данни на втората извадка; q1 = 1 – p1; q2 = 1 – p2 ;

n1 и n2 са съответните обеми на двете извадки.

7.3.2.2. При малки извадки (n1 < 30 и/или n2 < 30):

21

222111

2121

11.

2.

nnnqpnqp

nnppt

8. ЕДНОФАКТОРЕН ДИСПЕРСИОНЕН АНАЛИЗ

Еднофакторния дисперсионен анализ е статистически метод за анализ на

корелационен тип зависимости между едно явление-фактор, представено на

Page 18: Stat Formuli

слаба(номинална или ординална) скала, и явление-следствие, представено на

силна(пропорционална или интервална) скала. Процедурата на дисперсионния

анализ представлява проверка на хипотеза за наличие на статистически значима

зависимост между разглежданите явления, основана на F-критерия на Фишер.

Изчисляването на емпиричния F- критерий преминава през следните етапи:

8.1. Измерване на разсейването на резултативната променлива Xij .

8.1.1. Обща девиация на Xij :

2

0 )( XXSS ijijo

където Xij са индивидуалните стойности на резултативната променлива; i са

номера на значенията на факторната променлива; j е номер на единиците от i-та

група; 0X e общата средна.

8.1.2. Междугрупова девиация на Xij :

jjjm nXXSS 2

0)(

където iX е средната аритметична за i-та извадка; ni брой на единиците в i-та

извадка.

8.1.3. Вътрегрупова девиация на Xij :

2)( jijijb XXSS

8.2. Независими оценки на общата дисперсията на Xij .

8.2.1. Междугрупова дисперсия:

1

)(

1

1

2

0

k

nXX

k

SS

k

j

jj

където k е броят на значенията (групите) на факторната променлива.

8.2.2. Вътрегрупова дисперсия:

kn

XX

kn

SS

k

j

n

i

jij

b

в

j

1 1

2)(

където n е обем на извадката.

Page 19: Stat Formuli

8.3. Емпирична характеристика на статистическия критерий:

2

2

в

мF

9. РЕГРЕСИОНЕН И КОРЕЛАЦИОНЕН АНАЛИЗ

Регресионният анализ е статистически метод за анализ на зависимости от

корелационен тип когато всички явления, включени в анализа са измерени на

силни скали – пропорционална или интервална. Основната задача на

регресионния анализ е да изведе формата на зависимостта в аналитичен вид и

да я измери количествено с помощта на регресионните коефициенти.

Корелационният анализ е статистически метод за измерване теснотата (силата)

на зависимости от корелационен тип.

Зависимост от корелационен тип е такава зависимост, при която на едно

значение на факторната променлива (Х) съответстват повече от едно значения

на резултативната променлива (У).

9.1. Регресионен модел.

9.1.1. Еднофакторни регресионни модели.

9.1.1.1. Линеен еднофакторен регресионен модел:

Yi = 0 + 1X1 + εi i=1,...,N

където Yi са фактическите (емпиричните) стойности на ендогенната

(резултативна/зависима) променлива; Xi са фактическите (емпиричните)

стойности на екзогенната (факторна/независима) променлива; 0 е параметър на

модела; 1 е регресионен коефициент; εi са случайни отклонения.

9.1.1.2. Нелинейни еднофакторни регресионни модели.

Полиномиален модел:

i

k

iкiii ХXXY ...2

210 i=1,...,N;

Мултипликативен модел:

10 .10

ji XY i i=1,...,N;

Page 20: Stat Formuli

Експоненциален модел:

iiX

i eY

10

i=1,...,N;

Логистичен модел:

i

i

iX

Y

10

i=1,...,N.

9.1.2. Многофакторни регресионни модели.

9.1.2.1. Линеен многофакторен регресионен модел:

Yi = 0 + 1X1i + 2X2i + ………+ kXki + εi i=1,...,N;

9.1.2.2. Нелинейни многофакторни регресионни модели:

Мултипликативен модел:

210

21 .10

iii XXY i

i=1,...,N;

Експоненциален модел:

ikikii XXX

i eY

...22110

i=1,...,N.

9.2. Метод на най-малките квадрати.

9.2.1. Функция измерваща разликата между фактическите и получените от

модела значения на зависимата променлива, която се минимизира:

N

i

ii

N

i

i YY1

2

1

2 min)(

9.2.2. Система от нормални уравнения при еднофакторен линеен регресионен

модел:

ΣYi = Nb0 + b1 ΣXi ΣXi Yi = b0 ΣXi + b1 ΣXi

2

където b0 и b1 са оценки на параметрите 0 и 1 ; N брой на единиците в

извадката.

Page 21: Stat Formuli

9.2.3. Параметри на еднофакторен линеен регресионен модел:

221)( ii

iiii

XXN

YXYXNb

N

Xa

N

Ya

ii 10

9.3. Измерване на разсейването на резултативната променлива Yi .

9.3.1. Обща девиация на Yi :

2)( YYSS io

където Yi са индивидуалните стойности на резултативната променлива; Y e

средната аритметична.

9.3.2. Обяснена девиация на Yi :

2

1 )( YYSS i

където iY

са теоретичните стойности на Yi , получени от регресионния модел.

9.3.3. Необяснена (остатъчна) девиация на Уj :

2

2 )( ii YYSS

9.4. Независими оценки на общата дисперсията на Уi .

9.4.1. Обяснена дисперсия:

1

)(

1

1

2

12

p

YY

p

SS

N

i

i

Y

където p е броят на факторните променливи в регресионния модел.

9.4.2. Необяснена дисперсия:

pN

YY

pN

SSS

N

i

ii

Y

1

2

22

)(

където N е обем на извадката.

Page 22: Stat Formuli

9.5. Стандартна грешка на регресионния модел:

pN

YY

S

N

i

ii

Y

1

2)(

9.6. Стохастични грешки на параметрите на еднофакторен линеен регресионен

модел:

22

2

0

XXN

XS

i

iY

22 1

1

XXS

i

Y

9.7. Коефициент на детерминация, който показва каква част от изменението на

резултативната променлива се обяснява с факторите в модела:

2

2

2

22

2

2

2 1Y

Y

Y

YY

Y

YYX

SSr

9.8. Коефициент на индетерминация:

I = (1-

2

YXr )

9.9. Единични коефициенти на корелация.

9.9.1. Коефициент на корелация на Пирсън (0сновава се на изведения

регресионен модел на зависимостта):

2

2

1Y

YYX

Sr

, 0 ≤ rYX ≤ 1

9.9.2. Коефициент на линейна корелация на Браве. Този коефициент измерва

достоверно силата на зависимост между две явления, когато тя е линейна:

22YYXX

YYXX

N

YYXXr

ii

ii

YX

iiYX

-1 ≤ rYX ≤ 1

Page 23: Stat Formuli

9.9.2. Скала на интерпретация на корелационните коефициенти:

При 0 ≤ rYX < 0,3 корелационната зависимост се смята за слаба;

При 0,3 ≤ rYX < 0,5 корелационната зависимост е умерена;

При 0,5 ≤ rYX < 0,7 корелационната зависимост е значителна;

При 0,7 ≤ rYX < 0,9 корелационната зависимост е силна;

При 0,9 ≤ rYX < 1,0 корелационната зависимост е много силна.

9.9.3. Стохастична точност на единичните корелационни коефициенти.

2

1 2

N

rYX

rYX

9.10. Множествени коефициенти на корелация.

9.10.1. Коефициент на множествена корелация:

2

2

...,

...,21

211

Y

XXXy

XXXYk

k

SR

където 2

...,, 21 kXXXYS е необяснената дисперсия на У при приложението на

съответния регресионен модел.

9.10.2. Чисти (частни) коефициенти на корелация:

)1)(1( 22.

323

3232

32

XXYX

XXYXYX

XYX

rr

rrrr

В индекса на коефициента, вляво от точката, се отбелязват явленията,

между които се измерва теснотата на зависимостта (в случая У и Х2 ), а вдясно от

нея – тези, чието влияние е елиминирано (в случая Х3 ). Броят на явленията,

чието влияние е елиминирано, определят порядъка на чистите коефициенти на

корелация.

9.11. Коефициенти на автокорелация.

Page 24: Stat Formuli

N

pt

N

pt

tt

pN

t

pN

t

tt

N

pt

t

pN

t

t

N

pt

ptt

YY

YpN

YYpN

Y

YYpN

YY

rptt

1 1

22

1 1

2

)

2

111

)(1

.)(1

1

където Yt е стойността на У в t-ия период; Yt-p е стойността на У в (t-р)-ия период;

p порядък на автокорелационния коефициент.

9.12. Критерии за наличие на автокорелация в остатъчните елементи около

регресионната линия.

9.12.1. Критерий на Нойман:

NNK

N

i

i

N

i

ii

1

2

2

2

1

:1

където εi са случайни остатъци в i-ия период; където εi-1 са случайни остатъци в (i-

1)-ия период.

9.12.2. Критерий на Дърбин – Уотсън:

N

i

i

N

i

ii

d

1

2

2

2

1

10. СТАТИСТИЧЕСКО ИЗУЧАВАНЕ НА РАЗВИТИЕ

10.1. Елементарни статистически показатели за развитие.

10.1.1. Общ абсолютен обем:

N

N

t

t YYYY

.....21

1

където Yt е абсолютния обем на явлението в t–ия период (момент); N е броя на

наблюдаваните периоди (моменти).

10.1.2. Среден абсолютен обем.

10.1.2.1. При периодни динамични редове.

Page 25: Stat Formuli

непретеглен метод – когато периодите на наблюдение са с еднаква

дължина:

N

Y

Y

N

t

t 1

претеглен метод – когато периодите на наблюдение са с различна

дължина:

N

i

i

N

i

ii

t

tY

Y

1

1

10.1.2.1. При моментни динамични редове.

непретеглен метод – когато моментите на наблюдение отстоят на

еднакво разстояние във времето:

1

2........

212

1

N

YYY

Y

Y

N

N

претеглен метод – когато моментите на наблюдение отстоят на

различно разстояние във времето:

1

1

2

1

1

1

2N

i

i

N

i

ii

N

i

ii

t

tYtY

Y

10.1.3. Абсолютен прираст.

10.1.3.1. При постоянна основа:

ΔYt/1 = Yt – Y1

където първият наблюдаван период е приет за основа.

10.1.3.2. При верижна основа:

ΔYt/t-1 = Yt – Yt-1

10.1.4. Среден абсолютен прираст:

Page 26: Stat Formuli

11

......... 11/2/31/2

N

YY

N

YYYY NNN

10.1.5. Темпове на растеж (индекси на динамика).

10.1.5.1. При постоянна основа:

1

21/2

Y

; 1

3

1/3Y

; ………… 1

1/Y

YТ N

N

където първият наблюдаван период е приет за основа.

10.1.5.2. При верижна основа:

1

21/2

Y

; 2

3

2/3Y

; ..................... 1

1/

N

NNN

Y

10.1.5.3. Връзка между темповете при постоянна и верижна основа:

112

1

3

4

2

3

1

2 *..........**Y

Y

Y

Y

Y

Y

Y

Y

Y

Y

Y

Y N

N

N

N

N

11

1

1

:

t

ttt

Y

Y

Y

Y

Y

Y

10.1.6. Темпове на прираст:

11

1/ Y

Yd t

t

или

11

1/

t

ttt

Y

Yd

10.1.7. Средногеомтричен темп на разтеж:

1

1

11/

11/3/42/31/2 ........ N

NNN

NNN

Y

YTTTTTT

10.2. Верижни (плъзгащи се) средни.

10.2.1. При нечетен брой елементи на усредняваната величина.

3-членни верижни средни:

3

321

2

YYYY

;

Page 27: Stat Formuli

3

432

3

YYYY

; .........................

3

12

1

NNNN

YYYY

5-членни верижни средни:

5

54321

3

YYYYYY

,

5

65432

4

YYYYYY

………………………….

5

1234

2

NNNNNN

YYYYYY

10.2.2. При нечетен брой елементи на усредняваната величина (центрирани

верижни средни).

4-членни верижни средни:

4

22

5

4321

3

YYYY

Y

Y

,

4

22

6

5432

4

YYYY

Y

Y

,

…………………………

4

22123

4

2

N

NNN

N

N

YYYY

Y

Y

10.3. Аналитичен метод за изследване на тренда (основната тенденция) на

развитие.

Трендът изразява основната закономерност в развитието на изследваното

явление. Графичното му изображение преставлява плавна линия (права,

парабола, хипербола и др.), минаваща възможно най-близко до всички емпирични

стойности на У. Аналитично трендът се описва чрез подходяща функция на

времето (t), т.е. Ŷt = f(t). Задачата на анализа се свежда до това, да се установи

Page 28: Stat Formuli

вида на функцията f, чрез която ще се осъществи най-добро описание на

съдържащата се в даден временен ред тендеция на развитие и да се оценят

нейните параметри.

10.3.1. Линеен трендови модел:

Ŷi = ao + a1ti ,

където Ŷi са теоретичните (изгладени) стойности на явлението в i-ия период; ti е

поредния номер на i-ия период; ao и a1 са параметри модела.

Случайни отклонения в модела:

εi = Yi – Ŷi

където Yi е абсолютния обем на явлението в i-ия период.

Система от нормални уравнения:

ii taNaY 10

2

10 iiii tataYt

10.3.2. Експоненциален трендови модел.

Общ вид на модела:

ita

i AY 010

Трансформиран вид на модела:

lg Ŷi = a0 + a1 ti ,

където a1 = lgA.

10.3.3. Двойнологаритмичен модел.

Общ вид на модела:

1010a

i

a

i tY

Трансформиран вид на модела:

lg Ŷi = a0 + a1 lgti

10.3.4. Полином от 2-ра степен:

Общ вид:

Page 29: Stat Formuli

Ŷi = a0 + a1ti + a2ti2 .

Система от нормални уравнения:

ΣYi = Na0 + a1Σti + a2Σti2

Σti Yi = a0Σti + a1Σti2 + a2Σti

3

Σti2 Yi = a0Σti

2 + a1Σti3 + a2Σti

4

10.5. Стандартна грешка на трендовия модел:

NN

YYS

iii

Y

22

10.6. Екстраполационна прогноза въз основа на трендови модел.

Прогноза за развитието на явлението;

Y*N+l = a0 + a1 tN+l

където Y*N+l е очаквана стойност за Y в (N+l)-тия период; l – хоризонт на

прогнозата, т.е. отдалеченост на периода, за който се разработва прогнозата по

отношение на последната година от базисния период.

Стохастична грешка на прогнозата:

N

i

i

lN

Yпр

tt

tt

NS

1

2

2

)(

)(11

10.7. Статистическо изучаване на сезонни колебания.

Сезонни колебания са периодично повтарящите се вътрешногодишни

колебания с еднаква амплитуда по едноименни подпериоди, които са

предизвикани от стопанските и климатичните особености на годишните времена

или на различните месеци в годината.

10.7.1. Метод на простите средни.

10.7.1.1. Абсолютни сезонни колобения:

YYD jj за j=1,..., k

Page 30: Stat Formuli

където jY е средния абсолютен обем на явлението за j-ия подпериод; Y е

средния абсолютен обем на явлението за целия изследван период; k е броя на

подпериодите в целия изследван период.

10.7.1.2. Индекси за сезонни колобения:

Y

YI

j

j за j=1,..., k

10.7.2. Метод на отношенията на фактическите към изгладениете стойности.

10.7.2.1. Отношения на фактическите към изгладениете стойности на явлението Y

.

11

11'

11Y

YS

, 12

12'

12Y

YS

, ………, nk

nknk

Y

YS '

където Ŷij са изгладените стойности на Yij за j-тия подпериод на i-тата година по

метода на 12-членните центрирани верижни средни; i = 1,...,n и j = 1,...,k; при

работа с месечни данни к = 12, а при тримесечни данни - к = 4.

10.7.2.2. Осреднени отношения на фактическите към изгладениете стойности:

n

i

iSn

S1

'

1

'

1

1

,

n

i

iSn

S1

'

2

'

2

1

,……………,

n

i

ikk Sn

S1

'' 1

10.7.2.3. Индекси за сезонни колебания

k

j

j

j

j

Sk

SI

1

'

'

1

за j = 1,...,k.

11. ИНДЕКСИ НА ДИНАМИКА И ИНДЕКСЕН ФАКТОРЕН АНАЛИЗ

11.1. Единични индекси на динамика.

11.1.1. Индекс на равнище.

при единични явления:

0

1

x

xix

Page 31: Stat Formuli

където x0 е равнище на явлението в базисния период; x1 е равнище на явлението

в индексирания период.

при еднородни съвкупности:

0

00

1

11

0

1 :y

yx

y

yx

x

xix

където y0 е обем на явлението в базисния период; y1 е обем на явлението в

индексирания период.

11.1.2. Индекс на обем.

при единични явления:

0

1

y

yiy

при еднородни съвкупности:

0

1

y

yiy

11.2. Множествени индекси на динамика.

11.2.1. Индекс на маса.

00

11

0

1

xy

xy

S

SI s

където S0 е обем на изследваното сложно съставно явление през базисния

период; S1 е обем на изследваното сложно съставно явление през индексирания

период.

11.2.2. Индекс на обем.

00

01

)( 0 xy

xyI xv

11.2.3. Индекс на равнище.

Индекс на Пааше:

10

11)( 1 yx

yxI vx

Индекс на Ласпер:

Page 32: Stat Formuli

00

01

)( 0 yx

yxI yx

11.2.4. Връзка между индекса на маса, индекса на обем и индекса на равнище:

)()( 10 yxxyS III

11.3. Индексен факторен анализ при зависимост от типа S = xy.

11.3.1. Мултипликативно разлагане:

xyS IIxy

xy

S

SI

00

11

0

1

,

където Iy е индекса на екстензивния фактор; Ix е индекса на интензивния фактор.

11.3.2. Адитивно разлагане:

xy

S

yx

S

xy

SS )()( 00

където )( 0xy

S е прираст, дължащ се само на изменението в обема на изучаваната

съвкупност (екстензивен фактор), при неизменно равнище на съответния

качествен признак (интензивния фактор); )( 0yx

S е прираст, дължащ се само на

изменеие в равнището на изучавания качествен признак, но при неизменен обем

на изследваната съвкупност; xy

S е прираст, дължащ се на съвместното действие

на двата фактора.

11.4. Индексен факторен анализ при зависимост от типа yxS

11.4.1. Мултипликативно разлагане:

str

S

yx

SyS IIII)( 0

където yI е относителното изменение в явлението S, настъпило само в резултат

на промени в обема на изучаваната съвкупност; )( 0yx

SI е факторен субиндекс,

който измерва относителното изменеие в явлението S, дължащо се само на

изменения в индивидуалните равнища на х по подсъвкупности; str

SI е факторен

субиндекс, който да измерва относителното изменение в явлението S, дължащо

се на настъпили структурни промени в у през индексирания период в сравнение с

базисния, във връзка с различните равнища на х през индексирания период.

Page 33: Stat Formuli

11.4.2. Адитивно разлагане:

yx

S

str

S

yx

S

xy

SS )()( 00

където )( 0xy

S е прираст, дължащ се на промени само в обема на изучаваната

съвкупност, при неизменно средно равнище на съответния качествен признак;

)( 0уx

S е прираст, дължащ се само на настъпили промени в средното равнище на

изучавания качествен признак; ΔSstr е абсолютният прираст на S, формиран под

въздействието на структурни изменения; yx

S е частта от абсолютния прираст на

явлението S, дължаща се на съвместното влияние на двата фактора.

11.5. Индексен факторен анализ при зависимост от типа S = Σ xy

11.5.1. Мултипликативно разлагане:

stryxxyS IIII ..00

където 0xyI е индекс на обем, изразяващ настъпилото относително изменение в

явлението S, дължащо се само на промени в обема на изучаваната съвкупност;

0yxI е индекс на равнище, изчислен по формулата на Ласпер, изразяващ

настъпилото относително изменение в явлението S, дължащо се само на

промени в значенията на изучавания качествен признак; strI е индекс на

структура, който се изчислява като отношение между индекса на равнище,

установен по формулата на Пааше, и този, установен по формулата на Ласпер.

11.5.2. Адитивно разлагане:

xy

S

str

S

yx

S

xy

SS )()( 00

където )( 0xy

S е прираст на сложното съставно явление S, предопределен от

промени в обема на изучаваната съвкупност; )( 0ух

S е прираст в сложното съставно явление S, дължащ се само на изменение в индивидуалните равнища на

изучавания качествен признак; str

S е прираст, дължащ се само на структурни

промени в обема на изучаваната съвкупност; ху

S е прираст, дължащ се само на съвместното влияние на двата фактора.

Page 34: Stat Formuli