Пословна статистика

23

Click here to load reader

Upload: ostojic-miodrag

Post on 08-Dec-2015

33 views

Category:

Documents


0 download

DESCRIPTION

Пословна статистика

TRANSCRIPT

Page 1: Пословна статистика

Дескриптивне статистичке мјере

Дескриптивне статистичке мјере представљају показатеље који на основу оригиналних података или распореда фреквенција на синтетизован начин описују посматране појаве. Смисао ових мјера је:

да једним бројем опишу битне карактеристике посматраних података и да нам омогуће поређење између више статистичких серија

Дескриптивне статистичке мјере класификујемо у 4 групе:

1. мјере централне тенденције2. мјере варијабилитета (дисперзије)3. мјере облика распореда и 4. релативно учешће

Дескриптивне статистичке мјере описују оригиналне нумеричке податке како на нивоу скупа, тако и на нивоу узорка. Све јединице скупа или узорка могу се замијенити једном параметром који репрезентује цијели скуп.

Мјере централне тенденције

Мјера централне тенденције је репрезентативна вредност која замјењује све податке посматране серије, без обзира да ли се ради о скупу или узорку. Мјере централне тенденције грубо делимо на израчунате и позиционе. Израчунате се добијају рачунским путем на основу формула, док с друге стране позиционе средње вредности се одређују према положају који дата средња вредност има унутар оригиналних података.

Најчешће коришћене израчунате средње вредности су: аритметичка средина, хармонијска средина и геометријска средина. У позиционе средње вредности убрајамо модус и медијану.

Аритметичка средина је најчешће коришћена мјера централне тенденције у пракси. Другачије се још назива просек. Рачуна се тако што се збир вредности посматраног обиљежја подијели њиховим бројем. Аритметичка средина је под утицајем свих вредности обиљежја зато што се рачуна на основу свих јединица. У случају постојања изразито екстремних вредности аритметичка средина представља искривљени приказ онога што садрже подаци о посматраним јединицама те с тога аритметичка средина није увек најбоља мјера централне тенденције.

1

Page 2: Пословна статистика

Проста аритметичка средина

μ= 1N∑ xi - за скуп; x=

1n∑ x i - за узорак

Пондерисана аритметичка средина

μ= 1N∑ xi f i - за скуп; x=

1n∑ x i f i - за узорак

Особине аритметичке средине:

1. аритметичка средина је средња вредност која је већа од најмање и мања од највеће

2. ако су вредности обиљежја међусобно једнаке, тада је и аритметичка вредност једнака вредности обиљежја

3. збир одступања свих вредности обиљежја од њихове аритметичке средине једнак је нули

4. збир квадрата одступања свих вредности обиљежја од аритметичке средине је минималан

5. ако су вредности два обиљежја повезане неком линеарном везом тада су и њихове аритметичке средине повезане истом том линеарном везом.

Геометријска средина представља мјеру централне тенденције која изравнава пропорционалне промјене између података посматране серије. Израчунава се тако што се вредности обиљежја међусобно помноже, а затим се из тог производа нађе корен са изложиоцем који је једнак броју посматраних јединица. Израчунавање ове средње вредности има смисла само ако су вредности веће од нуле.

G=antilog∗( 1N∑ log xi) - проста геометријска средина

G=antilog∗( 1N∑ f i∗log xi) - пондерисана геометријска средина

Хармонијска средина се користи када су обиљежја елемената из којих се израчунава изражена у виду реципрочних вредности. Она је нарочито значајна за истраживања показатеља продуктивности рада, показатеља брзине обрта средстава, брзине преласка пута и слично.

H= N

∑ 1x i

- проста хармонијска средина

2

Page 3: Пословна статистика

H= N

∑ f ix i

- пондерисана геометријска средина

Модус је вредност обиљежја која се најчешће јавља у серији, односно вредност обиљежија са највећом фреквенцијом. Уколико је дата негруписана серија података о појави у којој свака вредност има фреквенцију 1 онда модус не постоји, међутим ако се одређене фреквенције понављају више пута тада се модус утврђује проналажењем вредности која се најчешће јавља. Уколико постоји више модуса у 1 серији та серија се назива мултимодална серија. Када је серија распоредеђена у групне интервале модус се рачуна тако што се пронађе модални интервал те се врши интерполација помоћу формуле

Mo=L1+f 2−f 1¿¿¿

L1 – доња граница модалног интервала

f2 – фреквенција модалног интервала

f1 – фреквенција предмодалног интервала

f3 – фреквенција постподалног интервала

i – величина модалног интервала

Медијана је вредност обиљежја која се налази у средини серије чији су подаци сређени по величини. Медијана читав скуп дели на два једнака дела, половина јединица има већу вредност а половина мању вредност од медијане.

Me=N+12

Уколико је непаран број података серије медијана ће бити вредност која представља средишњи члан посматране серије. Уколико је број података паран медијана се одређује као просек две средишње вредности серије.

Међутим када су подаци груписани интервале тада се медија рачуна по следећој формули

Me=L1+

N2

−∑ f 1

f Me∗i

3

Page 4: Пословна статистика

L1 – доња граница медијалног интервала

N – број података у серији

∑ f 1 – сума фреквенција предмедијалног интервала

f Me – фреквенција медијалног интервала

Квартили су мјере које деле серију података на четири једнака дела. Вредности обиљежја која их деле називају се квартилима:

Q1 – 25% података је мање од ове вредности, а 75% је веће

Q1=N+14 – за податке поредане по величини

Q1=L1+

N+14

−∑ f 1

f Q 1

∗i – за податке који су распоређени у интервалима

Q2 – медијана, дели серију на два једнака дела

Q3 – 75% података је мање од ове вредности, а 25% је веће

Q3=3(N+1)4

– за податке поредане по величини

Q3=L1+

3 (N+1)4

−∑ f 1

f Q3∗i – за податке који су распоређени у интервалима

L1 – доња граница кварталног интервала

N – број чланова серије

∑ f 1– збир фреквенција предквартилног интервала

f Q1;f Q3 – фреквенције квартилних интервала

i – ширина квартилног интервала

4

Page 5: Пословна статистика

Појам, врста и употреба мјера варијације (дисперзије)

Варијабилитет представља распршеност података у серији. Утврђује се помоћу одговарајућих мјера варијације које могу бити позиционе и израчунате у односу на аритметичку средину скупа или узорка. Уколико су варијације изражене у јединицама вредности обиљежја, говори се о апсолутним мјерама за разлику од мјера које се изражавају релативним показатељима. Као апсолутне мјере варијације, које су истовремено и позиционе мјере, користи се интервал варијације и интерквартилна разлика, а ту још спада варијанса и стандардна девијација. Релативне мјере варијације су коефицијент варијације и стандардизовано одступање.

Интервал варијације је једнак разлици највеће и најмање вредности обиљежја. Може се израчунати само за коначне скупове.

I=X max−Xmin

Интерквартилна разлика представља разлику између трећег и првог квартила.

IQR=Q 3−Q1

Варијанса представља просјек суме квадрата одступања свих података од њихове аритметичке среди. За негруписане податке рачуна се по следећој формули

σ 2= 1N∑ (x¿¿ i−μ)2¿

Заподатке груписане у виду дистрибуције фреквенција рачуна се по следећој формули

σ 2=∑ x i2 f i

N−μ2

Стандардна девијација представља просечно одступање свих појединачних података од њихове аритметичке средине. Може се рачунати директно из варијансе.

σ=+√σ2 за скуп или s=+√s2 за узорак

Уколико варијанса није позната рачуна се на следећи начин:

σ=√ 1N∑ f i x i2−μ2 за скуп, или

5

Page 6: Пословна статистика

s=√∑ f i x i2−n x2

n−1 за узорак.

Коефицијент варијације представља релативни однос стандардне девијације и аритметичке средине. Израчунава се помоћу формуле

Kv=σμ

Коефицијент варијације се често изражава у процентима те се с тога добијени резултат множи са 100.

Стандардно одступање представља мјеру одступања неког појединачног податка од аритметичке средине изражена у јединицама стандардне девијације. Рачуна се на следећи начин:

Z=x i−μσ

Дефинисање вјероватноће догађаја

Нека је случајни догађај Е дефинисан у простору елементарних догађаја S. Вероватноћа догађаја Е је неки реалан број, који се обиљежава са P(E). Вјероватноћа је функција P дефинисана на случајним догађајима која их пресликава у реалне бројеве и има следеће особине:

сваком случајном догађају Е одговара ненегативан број P(E) који представља његову вјероватноћу тако да је P (E )≥0

вјероватноћа сигурног догађаја S је P (S )=1 за међусобно дисјуктивне догађаје Е1, Е2, ... , En вјероватноћа њихове уније једнака

је збиру њихових вјероватноћаP (E1∪E2∪…∪En )=P (E1 )+P (E2)+…+P (En )

Статистичка дефиниција вјероватноће

Статистичка или вјероватноћа ''а постериори'' одређује се након извршеног експеримента, на основу добијених емпиријски вредности, као гранична вредност релативног учешћа јављања догађаја Е приликом N понављања датог експеримента.

6

Page 7: Пословна статистика

P (E )=N E

N

Што се више пута експеримент изводи то се вјероватноћа приближава вјероватноћи ''а приори''. Приликом посматрања неког скупа што више елемената тог скупа буде опсервисано то ће закључци о скупу бити прецизнији, тачнији и поузданији.

Правило сабирања и множења вјероватноћа

Када имамо случајне догађаје Е1 и Е2 из скупа елементарних догађаја S тада је вјероватноћа њихове уније једнака збиру појединачних вјероватноћа тих догађаја умањеном за вјероватноћу њиховог истовременог остварења.

P (E1∪E2 )=P (E1 )+P (E2)−P (E1∩ E2 )

Ако су догађаји Е1 и Е2 међусобно дисјуктивни тада је вјероватноћа њихове уније једнака збирну њихових појединачних вјероватноћа

P (E1∪E2 )=P (E1 )+P (E2)

Правило множења вјероватноћа примјењује се за одређивање вјероватноће истовременог јављања два или више догађаја приликом извођења неког експеримента.

За два догађаја Е1 и Е2 вјероватноћа њиховог истовременог остварења добија се на основу израза:

P (E1∩E2 )=P (E1)∗P (E2/E1 )

P (E1∩E2 )=P (E2)∗P (E1/E2 )

За догађаје који су међусобно независни вјероватноћа њиховог истовременог остварења добија се као производ њихових појединачних вјероватноћа:

P (E1∩E2 )=P (E1)∗P (E2 )

Условна вјероватноћа и независност догађаја

Посебан аспект посматрања односа више догађаја огледа се у томе како реализација једног догађаја утиче на реализацију другог догађаја, односно у којој мјери реализација

7

Page 8: Пословна статистика

једног догађаја зависи од реализације другог. У овом случају ради се о зависности реализације догађаја. При томе је могуће да неки догађај доводи до сигурне реализације неког другог догађаја или да реализација једног догађаја искључује реализацију другог догађаја. Ови облици веза међу догађајима изражавају се помоћу условне вјероватноће. За два догађаја Е1 и Е2 условна вјероватноћа означава се са P (E2/E1 ) и представља вјероватноћу остварења догађаја Е2 под условом да се оствари догађај Е1. Ова вјероватноћа одређује се помоћу израза:

P (E2/E1 )=P (E1∩E2 )P (E1 )

Независни догађаји су они код којих остварење или неостварење једног догађаја нема утицаја на вјероватноћу остварења другог догађаја тако да је:

P (E2/E1 )=P (E2 ) ^ P (E1/E2 )=P (E1 )

Биномни распоред

Најчешће коришћени прекидни распоред у примењеној статистици јесте биномни распоред. Користи се ако су испуњени следећи услови:

1. Сваки опит резултира у једном од два могућа исхода, које технички класификујемо као успех (U) и неуспех (N)

2. Вјероватноћа успеха, p=P (U ), константа је од опита до опита. Вјероватноћа неуспеха, P (N )=1−p, означавамо са q тако да је p+q=1.

3. Опити су независни.

Формула за Биномни распоред је:

P ( x )=(nx ) px (1−p )n−x

Биномни распоред је прекидан јер случајна промењива може да узме само једну вредност из скупа изолованих коначних бројеваn .

Биномни распоред има два параметра, а то су n и p.

n – број опита

p – вјероватноћа ''успеха'' у сваком опиту

8

Page 9: Пословна статистика

Поисонов распоред

Уколико је вјероватноћа неког успеха веома мала ( p≤0.05) и када је n≥20 уместо Биномног распореда користимо Поисонов. Овај распоред се користи да би се одредила вјероватноћа броја јављања неког догађаја у јединици времена или простора. Потребно је да буду испуњена следећа 3 услова:

1. број јављања догађаја је назависан од једне до друге јединице времена или простора

2. вјероватноћа јављања неког догађаја је пропорционална дужини одређене јединице времена или простора

3. вјероватноћа истовременог јављања два или више догађаје у сасвим малој јединици времена или простора је занемарљиво мала

P (X=x )=e− λ λx

x !

Ова формула репрезентује вјероватноћу да прекидна случајна промењива Х узме неку произвољну вредност x. Број e представља базу природног логаритма и износ 2,71828. Поисонов распоред има само један параметар, λ. λ представља просјечан број јављања неког догађаја у јединици времена или простора.

λ=n∗p

Нормалан распоред

Нормалан распоред има централну улогу у статистичкој теорији и пракси, посебно у домену статистичког закључивања. За случајну промењиву X кажемо да има нормалан распоред ако је карактеришу непрекидне вредности, a њена функција густине вјероватноће има израз:

f ( x )= 1σ √2π

∗e−( x−μ)2 /2σ 2

π – математичка конснтанта, приближна вредност 3,14159

9

Page 10: Пословна статистика

e – математичка константа, приближна вредност 2,71828

μ – аритметичка средина нормалне случајно промењиве

σ – стандардна девијација нормалне случајне промењиве

Такву случајну промењиву означавамо са X :N (μ ,σ 2), што се чита X има нормалан распоред са параметрима μиσ2.

Особине нормалног распореда:

1. нормална крива има облик звона, унимодална је и симетрична у односу на вредност x=μ

2. с обзиром да је нормалан распоред симетричан, аритметичка средина, модус и медијана су једнаки

3. нормална крива протеже се од −∞до+∞4. релативна мјера асиметрије α 3=0, а релативна мјера спрољштености α 4=35. укупна површина испод криве једнака је један6. нормалан распоред је у потпуности дефинисан са два параметра, μиσ2

7. правило ''68 – 95 – 99,7''

P (μ−σ <X<μ+σ )≈0,68

P (μ−2σ<X<μ+2σ )≈0,95

P (μ−3σ<X<μ+3σ )≈0.997

Појам, особине и употреба стандардизованог нормалног распореда

Било који нормалан распоред, поступком стандардизације, сведе на стандардизован распоред и решење проблема, тј вјероватноћа пронађе се у таблицама. За нормалан распоред кажемо да је у стандардизованом облику ако је његова аритметичка средина једнака 0, а варијанса једнака 1. Уобичајено је да се стандардизована нормална промењива означава са Z, па се формула за њен распоред вјероватноће може написати у виду:

f ( z )= 1

√2π∗eZ

2/2

Краће се пише Z :N (0,1 ) .

10

Page 11: Пословна статистика

Трансформацијом X у Z добијамо за сваку вредност Х одговарајућу вредност Z, која показује одступање и смер одступања вредности нормалне промењиве од μ исказано у стандардним девијацијама σ .

Да би се одредила вјероватноћа да Z узме вредност између две симетричне тачке, довољно је користити функцију распореда од горње границе интервала.

P (−z<Z<z )=2 F ( z )−1

Без обзира на мјерне јединице и комбинацију параметара μиσ2 увек можемо податке превести у стандардизоване, исказане у стандардним девијацијама и да потребне вјероватноће одредимо коришћењем таблице стандардизованог нормалног распореда.

Интервал повјерења за оцјену пропорције скупа на основу узорка

Интервал поверења је распон вредности за које се верује да укључују непознату вредност параметра популације. Уз овај интервал иде и информација о мери поверења са којом очекујемо да овај интервал заиста садржи вредност посматраног параметра.

Често се истражује склоност ка потрошњи те у том смислу се истражује колика је заступљеност становника који користе одређене производе или ако је потребно установити учешће неисправних производа у укупној производњи тада је потребно оценити пропорцију популације π . Оцена пропорције популације π је пропорција узорка P . За велике узорке P има приближно нормалан распоред. Просечна вредност узорачке дистрибуције пропорцијеPје једнака вредности пропорције популацијеπ, а стандардна

грешка пропорције је √ π (1−π )n

. С обзиром да стандардна грешка пропорције зависи од

параметраπ није могуће одредити њену вредност на овај начин. У случају великих узорака уместо непознате вредности параметра популације користи се реализована вредност статистике узорка p тако да се стандардна девијација израчунава на основу израза

√ p (1−p )n

. Корективни фактор (√ N−nN−1 ) користимо уколико је

nN

>0.05. Велики узорци су

они који задовољавају услове (nπ )>5 i n (1−π )>5.

(1−α )∗100% интервал поверења пропорције популације π дат је изразом:

p−z α2

∗S p≤ π≤ p+z α2

S p

11

Page 12: Пословна статистика

Sp=√ p (1−p )n

p= xn

Појам и врста χ2 теста

χ2 тест је заснован на χ2 дистрибуцији и користи се типски за решавање неколико проблема. Први се односи на тестирање значајности разлике између опажених и теоријских фреквенција различитих распореда вјероватноће, тзв тест прилагођености. Други домен примене χ2 је код табела контигенције и односи се на тестирање међусобне повезаности различитих обиљежја посматране појаве. Као посебан случај издваја се и тестирање једнакости или разлике пропорција три или више скупова, што се означава као тестирање хомогености посматране појаве. Основни кораци приликом тестирања χ2

тестом:

1. установљава се нулта и алтернативна хипотеза2. израчунавају се теориске фреквенције појављивања неке особине код посматране

популације у складу са постављеном нултом хипотезом3. код табела контингенције, различите опсервације – фреквенције размештају се у

различите ћелије4. одређује се разлика између опаженог и очекиваног, тако да се израчунава

вредност χ2 статистике теста помоћу израза:

χ 2=∑ ( f i−f i¿)2

f i¿

У овом изразу са f i означене су опажене – емпиријске фреквенције, а са f i¿

очекиване, тј теориске фреквенције.5. установљава се одговарајућа p вредност, односно пореди се израчуната вредност

статистике теста са критичним (табличним) вредностима из χ2 дистрибуције уз одговарајући број степени слободе (ако је χ 2> χ 2df , α онда Ho одбацујемо) и изводи се закључак.

Утврђивање броја степени слободе код различитих врста χ2 теста

Број степени слободе код сваког метода примјене одређује се другачије.

12

Page 13: Пословна статистика

Приликом тестирања прилагођености неког емпиријског распореда униформном распореду, број степени слободе дређује се по формули df=k−m−1.

k – број група фреквенција

m – увек је једнако 0

Код тестирања једнакости или разлика у пропорцији три или више скупа број степени слободе утврђује се по формули df=(c−1 ) (r−1 ) .

c – број колона

r – број редова

Појам, значење и употреба коефицијента контигенције

Када су посматрана обиљежја мерена на номиналној скали и у случајевима када је могуће формирати табелу са два улаза, која се назива табела контигенције, уз помоћ χ2 теста можемо добити одговор да ли постоји веза између елемената два скупа и да ли је та веза статистички значајна. Табеле контигенције у ћелијама садрже податке који одговарају различитим унакрсним класификацијама посматраних скупова. Нулта и алтернативна хипотеза приликом анализе табела контингенције односе се на тестирање независности две класификације елемената једне популације и гласе:

Ho: два обиљежја међусобно су независне

H1: два обиљежја међусобно су зависне

Одређивање степена међусобне зависности два обиљежја једног скупа, мерена на номиналној скали, када су њихове вредности само речима класификоване у различите групе, може се установити на основу Пирсоновог коефицијента контигенције који се рачуна по следећој формули:

C=√ χ 2n+ χ 2

Коефицијент контигенције показује степен везе модалитета посматраних обиљежја и узима вредности од 0 до 1. Уколико су те вредности ближе јединици, то је веза модалитета више изражена. Недостатак овог коефицијента је што његова максимална вредност никад не може достићи вредност 1, осим ако табела нема бесконачно редова и

13

Page 14: Пословна статистика

колона. У случају када је број редова и колона исти може се израчунати максимална вредност коефицијента контингингенције по изразу:

cmax=√ (r−1 ) /r

Коефицијент контигенције нема смисла израчунавати у случајевима када се установи да су варијабле међусобно независне.

Коефицијент просте линеарне корелације

Код просте линеарне корелације се не прави разлика између зависне и независне промењиве, обе посматране појаве се третирају као случајно промењиве те није битно која се означава са X, а која са Y. Задатак просте линеарне корелације јесте да покаже да ли између варијација двије појаве постоји праволинијска веза. Као мјера јачине просте линеарне корелационе везе у узорку користи се релативна мјера, Пирсонов коефицијент просте линеарне корелације. Пирсонов коефицијент просте линеарне корелације показује степен линеарног квантитативног слагања варијација између две нумеричке промењиве. Рачуна се по формули:

r=n∑ xy−∑ x∑ y

√n∑ x2−(∑ x)2√n∑ y2−(∑ y )2

Коефицијент просте линеарне корелације узима вредности од -1 до 1. Уколико узима позитивне вредности корелација је директна или позитивна, а ако узима негативне вредност тада је корелација инверзна или негативна.

-0.7 до 0.7 није изражена корелација

-0.7 до -0.8 корелација инверзна изражена; 0.7до 0.8 корелација директно изражена

-0.8 до -0.9 корелација инверзно јака; 0.8 до 0.9 корелација директно јака

-0.9 до -1 корелација инверзно веома јака; 0.9 до 1 корелација директно веома јака

-1 савршена инверзна веза; 1 савршена директна веза

Појам, значење и употреба коефицијента детерминације

У пракси као индикатор квалитета регресионог модела, односно као мјера његове репрезентативности, скоро искључиво се користи коефицијент детерминације. Коефицијент детерминације је релативна мјера и показује учешће објашњеног

14

Page 15: Пословна статистика

варијабилитета у укупном, односно колико су варијације промењиве Y објашњене промењивом X. Предности коефицијента детерминације у односу на стандардну грешку су:

1. не зависи од мјерних јединица промењиве Y, односно он је релативна мјера2. много је лакши за тумачење и3. на једноставан начин омогућаа поређење више регресионих модела

Коефицијент детерминације се рачуна по формули:

r2=b12 ∑ x2−nx2

∑ y2−n y2

Вредност коефицијента детерминације варира од 0 до 1. Када је r2=1 тада су варијације промењиве Y у потпуности објашњене регресионом линијом и не постоји утицај других фактора, тј две промењиве су у функционалној вези. Приближавањем коефицијента детерминације нули све је мањи удео обашњеног варијабилитета и регресиона линија све слабије репрезентује податке. У случају када је r2=0 необјашњени варијабилитет се изједначава са укупним, нимало нисмо успели да објаснимо понашање Y те закључујемо да не постји линеарна регресија. Ако се коефицијент детерминације помножи са 100 тада се његове вредности тумаче у процентима. Коефицијент детерминације се може још рачунати ако нам је познат коефицијент корелације тако што ћемо квадрирати коефицијент корелације, јер је коефицијент корелације једнак квадратном корену коефицијента детерминације r=±√r2. Коефицијент детерминације је висок ако је већи од 0.5 али статистичари се слажу да би требало да буде релативно висок да би регресиони модел био адекватна слика описа стохастичке везе између две појаве.

Индекси

Индекси су релативни бројеви који показују однос нивоа једне или више појава у текућем (посматраном) пориоду у односу на базни период. Изражавају се у процентима. Период у коме се посматра ниво појаве представља текућу годину, квартал или месец а период са којим се ниво појаве упоређује назива се базни период.

Уколико се за базу изабере један период говоримо о базним иденксима, ако се пак база увек изнова бира податак говоримо о ланчаним индексима.

Поред поделе индекса на базне и ланчане, делимо их још и на индивидуалне и групне идексе. Индивиуални индекси показују однос нивоа појаве временске серије у текућем у

15

Page 16: Пословна статистика

односу на базни период. Ако са Y i означимо ниво појаве у текућем периоду, саY i−1 ниво појаве у претходном периоду и Y 0 ниво појаве у базном периоду индивидуалне индексе рачунамо:

Базни иденкси : I iB=Y iY 0

∗100

Ланчани индекси : I iL=

Y iY i−1

∗100

Групни индекси показују однос нивоа појаве две или више сродних појава у текућем периоду у односу на базни период.

Прерачунавање базних индекса у ланчане:

I iL=

I iB

I i−1B ∗100

Прерачунавање ланчаних индекса у базне:

период пре базног

I iB=I i+1B

I i+1L ∗100

период после базног

I iB=I i−1B I i

L

100

Појам, израчунавање и примјена просјечне годишње стопе раста

Просечна годишња стопа раста (геометријска стопа раста) представља стопу по којој се појава просечно годишње повећава или смањује у периоду обухваћеном временском серијом. Може се рачунати на два начина:

а) на основу геометријске средине ланчаних индекса и

G=N√ I1L∗I 2L∗…∗INL

r g=G−100

16

Page 17: Пословна статистика

б) преко директних података

r g=(N−1√Y N

Y 1−1)∗100

Примјена метода најмањих квадрата једначине линеарног тренда

Ако се нека временска серија сваке године повећава или смањује за приближно исти износ њену еволуцију најбоље можемо описати помоћу линеарног тренда. Модел линеарног тренда гласи:

Y t=β0+β1 x+ε

где је ε стохастички члан, а параметри β0 иβ1 су непознате величине које оцјењујемо помоћу узорка. Оцењена функција линеарног тренда гласи:

y t=b0+b1 x

где y t представља оцењену просечну вредност, b0иb1 су оцене параметара β0 иβ1, док x представља податке који означавају време. За израчунавање оцењених параметара тренда најчешће се користи метод најмањих квадрата. То значи да је потребно наћи такву праву линију која има најмању суму квадрата вертикалних одступања линије тренда од оригиналних података временске серије, тј:

∑ [ y i−(b0+b1 x i ) ]2=min .

Применом наведеног критеријума добијамо систем једначина са две непознате:

∑ yi=n∗b0+b1∑ x

∑ x y i=b0∑ x+b1∑ x2

Када се користи метод најмањих квадрата за израчунавање оцена параметара тренда, потребно је сваком податку временске серије придружити одговарајућу временску јединицу x. Тада имамо 2 случаја. Први случај је када имамо временску серију са непарним бројем података, тада средњем нивоу појаве доделићемо ознаку x=0, чиме тај период постаје исходишни. Подацима који му предходе додељују се негативни бројеви -1, -2, ... , -к, док се подацима иза исходишта додељују позитивни бројеви 1, 2, ... , к. Други случај је када серија има позитиван број података исходиште се смешта између два средишња нивоа појаве док се подацима пре исходишног додељују бројеви -0.5, -1.5 итд,

17

Page 18: Пословна статистика

а подацима који се налазе после исходишног позитивни бројеви 0.5, 1.5 итд. У оба случаја

∑ x=0. Као резултат ове процедуре поједноставићемо нормалне једначине и формуле за оцењивање b0иb1. Наведени поступак се назива скраћени метод најмањих квадрата. Када се он примени параметри линеарног тренда израчунавају се на следећи начин:

b1=∑ xy

∑ x2

b0=∑ y in

= y

18