miskolci egyetem gazdaságtudományi kar Üzleti...
Post on 16-Apr-2020
8 Views
Preview:
TRANSCRIPT
Miskolci Egyetem Gazdaságtudományi Kar
Üzleti Információgazdálkodási és Módszertani Intézet
Petra Petrovics
Descriptive Statistics
Miskolci Egyetem Gazdaságtudományi Kar
Üzleti Információgazdálkodási és Módszertani Intézet
DESCRIPTIVE STATISTICS
• Definition: Descriptive statistics is concerned only
with collecting and describing data
• Methods:
- statistical tables and graphs
- descriptive measures
Descriptive measure – a single number that
provides information about a set of data
Miskolci Egyetem Gazdaságtudományi Kar
Üzleti Információgazdálkodási és Módszertani Intézet
Description of a Population
I. Central Tendency
- mean
- mode
- median
II. Percentiles, Quartiles
III. Dispersion
IV. Shape
calculation
location
Miskolci Egyetem Gazdaságtudományi Kar
Üzleti Információgazdálkodási és Módszertani Intézet
I.1. Means
• Arithmetic mean (average)
• Geometric mean – the ratio of any two consecutive
numbers is constant
– e.g. compound interest rate
• Harmonic mean – units of measurement differ
between the numerator and denominator
– e.g. miles per hour
• Quadratic mean
– e.g. the form of standard deviation, mean of differences
Miskolci Egyetem Gazdaságtudományi Kar
Üzleti Információgazdálkodási és Módszertani Intézet
Arithmetic Mean
n
x
n
xxxx
n
i
i
n
121 ...
i
n
i
ii
f
xf
x 1
Raw Data Expressions (simple
formula):
Frequency Distribution
Expressions (weighted
formula):
• Typically referred to as mean.
• The most common measure of central tendency.
• It is the only common measure in which all the
values play an equal role.
• Symbol: , called X-barx
Miskolci Egyetem Gazdaságtudományi Kar
Üzleti Információgazdálkodási és Módszertani Intézet
Properties of Mean
• The sum of the differences from the mean is 0.
•
is minimal,
if a=
i=1
n
ix - x = 0
xi di=xi-
100 -100
150 -50
210 +10
240 +40
300 +100
Σ 1000 0
200
x
x
i=1
n
ix - a2
x
Miskolci Egyetem Gazdaságtudományi Kar
Üzleti Információgazdálkodási és Módszertani Intézet
xi xi+50 xi·1,1=y Z=x+y
100 150 110 210
150 200 165 315
210 260 231 441
240 290 264 504
300 350 330 630
Σ 1000 1250 1100 2100
200 250 220 420
x
Properties of Mean 2.
• If you add a
constant ‘a’ to
every xi, the mean
will be a+ x
• If you multiply
every xi by a
constant ‘b’, the
mean will be b*x
• x1, x2, ..., xn →
• y1, y2, ..., yn →
x1 + y1; ...; xn + yn
→
y
yx
Miskolci Egyetem Gazdaságtudományi Kar
Üzleti Információgazdálkodási és Módszertani Intézet
Geometric Mean
The rate of change of a variable over time. The nth root
of the product of n values.
x xg
n
in
i 1
n f
i
n
1ig
ixπx
Raw Data Expressions:
Frequency Distribution Expressions:
Miskolci Egyetem Gazdaságtudományi Kar
Üzleti Információgazdálkodási és Módszertani Intézet
GDP in Hungary
Period Previous quarter = 100%
2008. Q1 100.9
2008. Q2 99.8
2008. Q3 99.0
2008. Q4 98.1
Source: HCSO
%4.99994.0978.0981.099.0998.0009.1 44 gx
Average growth rate:
Miskolci Egyetem Gazdaságtudományi Kar
Üzleti Információgazdálkodási és Módszertani Intézet
Harmonic Mean
hx
=
n
xi=1
n
i
1
xh
n
f
xi=1
ni
i
, where n = f
i=1
k
i
=
The harmonic mean of a set of n numbers is found by
adding up the reciprocals of the numbers, and then
dividing n by this sum.
Frequency Distribution Expressions:
Raw Data Expressions:
Miskolci Egyetem Gazdaságtudományi Kar
Üzleti Információgazdálkodási és Módszertani Intézet
Relation between the Partitional Ratio
and Dynamic Ratio
FactoriesTurnover (MFt)
Partitional of
turnover (%)
Ratio (%)
t0 t1 t0 (%) t1 (%)
C 30 36 20 19 120
D 40 60 27 32 150
E 70 77 47 41 110
F 10 14.5 6 8 145
Total 150 187.5 100 100 125
0
1
t
t
Miskolci Egyetem Gazdaságtudományi Kar
Üzleti Információgazdálkodási és Módszertani Intézet
25.1
4.1
5.14
1.1
77
5.1
60
2.1
36
5,187
V
A
AV
25.11
45.106.01.147.05.127.02.12.0
B
VBV
25.1150
45.1101.1705.1402.130
B
VBV
25.1150
5.187
B
AV
i
i
i
i
ii
i
ii
Miskolci Egyetem Gazdaságtudományi Kar
Üzleti Információgazdálkodási és Módszertani Intézet
Quadratic Mean
n
x
x
n
i
i
q
1
2
k
i
i
k
i
ii
q
f
xf
x
1
1
2
k
i
iiq xgx1
2
Miskolci Egyetem Gazdaságtudományi Kar
Üzleti Információgazdálkodási és Módszertani Intézet
I.2. Median
• Statistic which has an equal number of variates above and below it
• Raw Data Expressions: ranked value
• Independent from extreme values
• Just from data in order
• The „middle term”
2
1n
I.3. Mode
• The value that occurs most frequently
• Typical value
Miskolci Egyetem Gazdaságtudományi Kar
Üzleti Információgazdálkodási és Módszertani Intézet
I.3. Mode
• The value that occurs most frequently
• Typical value
Miskolci Egyetem Gazdaságtudományi Kar
Üzleti Információgazdálkodási és Módszertani Intézet
Measurement ScaleBest Measure of the
‘Middle’
Nominal
(Categorical)Mode
Ordinal Median
IntervalSymmetrical data: Mean
Skewed data: Median
RatioSymmetrical data: Mean
Skewed data: Median
Miskolci Egyetem Gazdaságtudományi Kar
Üzleti Információgazdálkodási és Módszertani Intézet
II. Percentiles and Quartiles
• The Pth percentile of a group of members is thatvalue below which lie P% (P percent) of the numbersin the group.
• Q1 (lower quartile): The first quartile is the 25thpercentile. It is that point below which lie ¼ of thedata.
• Q2 (middle quartile): The median is the data belowwhich lie half the data. It is the 50th percentile.
• Q3 (upper quartile): The third quartile is the 75thpercentile point. It is that below which lie 75 percentof the data.
Miskolci Egyetem Gazdaságtudományi Kar
Üzleti Információgazdálkodási és Módszertani Intézet
III. Measures of Dispersion
1. Range
2. Interquartile Range
3. Population and Sample Standard Deviation
4. Population and Sample Variance
5. Coefficient of Variation
Miskolci Egyetem Gazdaságtudományi Kar
Üzleti Információgazdálkodási és Módszertani Intézet
III.1. Range
• The range of a set of observations is the
difference between the largest observation and
the smallest observation.
III.2. IQR
• Interquartile range: difference between the first
and third quartiles.
max minR X X
3 1IQR Q Q
Miskolci Egyetem Gazdaságtudományi Kar
Üzleti Információgazdálkodási és Módszertani Intézet
III.3. Standard Deviation
• The standard deviation is a measure of
dispersion around the mean.
• A low standard deviation indicates that the data
points tend to be very close to the mean, whereas
high standard deviation indicates that the data are
spread out over a large range of values.
• In a normal distribution, 68% of cases fall within
one standard deviation of the mean and 95% of
cases fall within 2 standard deviations.
Miskolci Egyetem Gazdaságtudományi Kar
Üzleti Információgazdálkodási és Módszertani Intézet
Properties of Standard Deviation
• 0, if x=constant
•
• 222 xxq
10 Nx
Miskolci Egyetem Gazdaságtudományi Kar
Üzleti Információgazdálkodási és Módszertani Intézet
xi di=xi- yi = xi+50 di=yi-
100 -100 10 000 150 -100
150 -50 2 500 200 -50
210 +10 100 260 +10
240 +40 1 600 290 +40
300 +100 10 000 350 +100
Σ 1 000 0 24 200 1 250 0
200 250
σ2=4 840 σ2=4 840
σ=69.6 σ=69.6
x
x y2
id
y
Properties of Standard Deviation
• If you add a constant ‘a’ to every xi, the standard deviation will be the same.
Miskolci Egyetem Gazdaságtudományi Kar
Üzleti Információgazdálkodási és Módszertani Intézet
xi di=xi- yi = xi·1.1 di=yi-
100 -100 10 000 110 -110 12 100
150 -50 2 500 165 -55 3 025
210 +10 100 231 +11 121
240 +40 1 600 264 +44 1 936
300 +100 10 000 330 +110 12 100
Σ 1000 0 24 200 1 100 29 282
= 200 = 220
σ2=4 840 σ2=5 856.4
σ=69.6 σ=76.52
x
x y2
id
y
2
id
Properties of Standard Deviation
• If you multiply every xi by a constant ‘b’, the standard deviation will be b*σ
Miskolci Egyetem Gazdaságtudományi Kar
Üzleti Információgazdálkodási és Módszertani Intézet
III.4. Variance
• Variance of a set of observations: the average squared
deviation of the data points from their mean.
• Population variance:
• Sample variance:
2 2
2 1 1
1
( ) ( )n n
i i i
i i
n
i
i
X X f X X
nf
2 2
2 1 1
1
( ) ( )
11
n n
i i i
i i
n
i
i
X X f X X
Sn
f
III.5. Coefficient of Variation
• The measure of dispersion around the mean in %.
VX
sV
X
Miskolci Egyetem Gazdaságtudományi Kar
Üzleti Információgazdálkodási és Módszertani Intézet
IV. Measures of Shape
• Skewness is a measure of the degree of asymmetry
of a frequency distribution.
• Kurtosis is a measure of the flatness (versus
peakedness) of a frequency distribution.
Miskolci Egyetem Gazdaságtudományi Kar
Üzleti Információgazdálkodási és Módszertani Intézet
IV.1.Kurtosis
Positive – cluster
more and have
longer tails
Negative – cluster
less and have
shorter tails
The measure of the extent to which observations cluster around
the central point.
For a normal
distribution, the
value of the
kurtosis statistic
is zero.
Miskolci Egyetem Gazdaságtudományi Kar
Üzleti Információgazdálkodási és Módszertani Intézet
Symmetry
Me Mo X Mo Me X
Skewed to the left(long right tail)
Skewed to the right
X Me Mo
IV.2. Skewness
A>0 A<0
X MoA
3 1
3 1
( ) ( )
( ) ( )
Q Me Me QF
Q Me Me Q
Miskolci Egyetem Gazdaságtudományi Kar
Üzleti Információgazdálkodási és Módszertani Intézet
Box Plot
• The box plot is a set of five summary
measures of the distributions of the data:
- the median of the data
- the lower quartile
- the upper quartile
- the smallest observation
- the largest observation
+ asymetry
Miskolci Egyetem Gazdaságtudományi Kar
Üzleti Információgazdálkodási és Módszertani Intézet
Box&Whiskers
Source: Aczel [1996]
Miskolci Egyetem Gazdaságtudományi Kar
Üzleti Információgazdálkodási és Módszertani Intézet
Elements of Box Plot
Source: Aczel [1996]
Miskolci Egyetem Gazdaságtudományi Kar
Üzleti Információgazdálkodási és Módszertani Intézet
Source: Aczel [1996]
Miskolci Egyetem Gazdaságtudományi Kar
Üzleti Információgazdálkodási és Módszertani Intézet
Box Plot
The least
standard
deviation
The highest
salary
MeQ1
Q3
Miskolci Egyetem Gazdaságtudományi Kar
Üzleti Információgazdálkodási és Módszertani Intézet
Thanks for your attention!
top related