the analysis of the egyptian economic census survey 2012/2013 - mohamed ismaeil and ali rashed
TRANSCRIPT
اليوم العالمي لالحصاء
20-10-2015 International Statistics Day
ورشة عمل
تحليل استكشافي لبيانات التعداد االقتصادي لجمهورية مصر العربية
2013/2012لسنة
An Exploratory Analysis of the Egyptian Economic Census Data 2012/2013.
قسم االحصاء بكلية االقتصاد والعلوم السياسية، ومستشار رئيس الجهازاستاذ و رئيس : محمد اسماعيل. د
باحث أول ومحلل بيانات، مجلس السكان الدولي: علي راشد. ا
المقصود بالتحليل االستكشافي للبيانات
أهداف التحليل االستكشافي
أساليب التحليل االستكشافي
األساليب البيانية للتحليل االستكشافي
المدرج التكراري
رسم النقاط
Run Plot
Normal Probability Plot
Quintile Plot (QQ Plot)
Autocorrelation plot
رسم الصندوق
االنتشارشكل
االطار العام
األساليب الكمية للتحليل االستكشافي
الموضع/مقاييس المركز: اوالا
مقاييس التشتت: ثانياا
االلتواء: ثالثاا
التفرطح: رابعاا
اختبارات العشوائية: خامساا
اختبارات التوزيعات: سادساا
االطار العام: تابع
اكتشاف القيم الشاذة
البيانات ( معايرة)تطبيع(Z-Scores)
النوع، المحافظة، : مثل)مقارنة خصائص عدة مجموعات من البيانات
.كميابيانياا و .....( القطاع،
االرتباط بين المتغيرات الكمية
معامل بيرسون لالرتباط
معامل سبيرمان الرتباط الرتب
االطار العام: تابع
يقصد بالتحليل االستكشافي بأنه اسلوب لتحليل البيانات الذي يعتمد على أكثرلتحديد المتغيرات المهمة، والكتشاف القيم الشاذة، ( بيانيا وكمياا )من طريقة
.والختبار بعض الفروض
إظهار أنه يهدف الى في لبيانات الكميةتمثل أهمية التحليل االستكشافي لالمالمح والخصائص األساسية الكامنة فى البيانات والتى تساهم فى بلورة المعلومات والفروض العلمية التى يمكن دراستها واختبارها فى المراحل
.البحثالمتقدمة من
أهدافهاإلحصائية وتعدد بوفرة أدواته االستكشافى للبيانات تميز التحليل ي .
بالتطور السريع فى مجال التحليل االستكشافى للبياناتة أهميوازدادتالكومبيوتر وتوافر البرامج التى تمكن من استخدام هذه األدوات بسهولة
والتحكم فى مخرجاتها بالشكل الذى يساعد على إظهار مالمح البيانات .األساسية
المقصود بالتحليل االستكشافي للبيانات
الهدف الرئيسي للتحليل االستكشافي للبيانات هو اسباغ نظرة متعمقة
للبيانات والتعرف على هيكلها واعطاء الباحث كل العناصر التي يحتاجها
.بهدف استخراج النتائج
تتمثل األهداف في االتي:
التوفيق الجيد للنماذج المختلفة(Good fitting models)
الحصول على قائمة بالقيم الشاذة
التوصل الستنتاجات قوية(a sense of robustness of conclusions)
تقدير معلمات النماذج المختلفة
تحليل أسباب عدم التأكد لتقدير هذه المعلمات
المهمة في هذه البيانات( المتغيرات)ترتيب قائمة العوامل
االستكشافي للبياناتالتحليل أهداف
أساليب التحليل االستكشافي
حيث أن هذه هي األدوات األكثر استعماال : البيانية األساليب : أوالا •المرحلة تقوم على مبدأ أن التحليل البصري ُيمكننا من رؤية العالقات
من األشكال البيانية التي تستعمل في هذه المرحلة هناك . بشكل أسرع Scatter)مخطط التشتت ، (Box plot)الرسوم الصندوقية
plot) ، والمدرجات التكرارية(Histograms.)
: الكميةاألساليب : ثانيا
تستعمل هذه األساليب لحساب بعض القياسات و التأكد من أن البيانات •–Kolmogorov تتبع توزعا من التوزيعات باستعمال مثال اختبار
Smirnov. يمكن أيضا القيام بعملية تحليل االنحدار(Regression Analysis) لتأكد من وجود عالقة خطية أو غير خطية بين عينتبن.
جنيهالمدرج التكراري لالرباح االجمالية بااللف 0
.00
5.0
1.0
15
.02
.02
5
De
nsity
0 50 100 150 200profit in thousands
جنيهاالجمالية بااللف لالرباح المدرج التكراري االقتصاديالنشاط حسب
0.0
1.0
2.0
3.0
40
.01
.02
.03
.04
0 50 100 150 200
0 50 100 150 200
Food products Industry Garment Industry
Food & Beverages Services ActivitiesDe
nsity
profit in thousandsGraphs by sectors according to ISIC classification: 2 digits
جنيه بالمحافظةالتكراري لالرباح االجمالية بااللف المدرج
لنشاط الصناعات الغذائية0
.01
.02
.03
.04
0.0
1.0
2.0
3.0
40
.01
.02
.03
.04
0.0
1.0
2.0
3.0
40
.01
.02
.03
.04
0 50 100 150 200 0 50 100 150 200 0 50 100 150 200
0 50 100 150 200 0 50 100 150 200 0 50 100 150 200
cairo alex port said suez damietta dakahlia
sharkia kalioubia kafr el sheikh gharbia menoufia behera
ismailia giza beni suef fayoum menia assiout
suhag quena aswan luxor red sea new valley
matrouh north sinai south sinai
De
nsity
profit in thousandsGraphs by governorate
0.0
5.1
0.0
5.1
0.0
5.1
0.0
5.1
0.0
5.1
0 50 100 150 200 0 50 100 150 200 0 50 100 150 200
0 50 100 150 200 0 50 100 150 200 0 50 100 150 200
cairo alex port said suez damietta dakahlia
sharkia kalioubia kafr el sheikh gharbia menoufia behera
ismailia giza beni suef fayoum menia assiout
suhag quena aswan luxor red sea new valley
matrouh north sinai south sinai
De
nsity
profit in thousandsGraphs by governorate
جنيه بالمحافظةالتكراري لالرباح االجمالية بااللف المدرج
لنشاط المالبس الجاهزة
بااللف جنيه بالمحافظةالتكراري لالرباح االجمالية المدرج
لنشاط األغذية والمشروبات
0.0
2.0
4.0
60
.02
.04
.06
0.0
2.0
4.0
60
.02
.04
.06
0.0
2.0
4.0
6
0 50 100 150 200 0 50 100 150 200 0 50 100 150 200
0 50 100 150 200 0 50 100 150 200 0 50 100 150 200
cairo alex port said suez damietta dakahlia
sharkia kalioubia kafr el sheikh gharbia menoufia behera
ismailia giza beni suef fayoum menia assiout
suhag quena aswan luxor red sea new valley
matrouh north sinai south sinai
De
nsity
profit in thousandsGraphs by governorate
جنيهالتكراري لالرباح االجمالية بااللف المدرج
بمحافظة القاهرة0
.00
5.0
1.0
15
.02
0.0
05
.01
.01
5.0
2
0 50 100 150 200
0 50 100 150 200
Food products Industry Garment Industry
Food & Beverages Services ActivitiesDe
nsity
profit in thousandsGraphs by sectors according to ISIC classification: 2 digits
0.1
.2.3
.40
.1.2
.3.4
-5 0 5 10 15
-5 0 5 10 15
Food products Industry Garment Industry
Food & Beverages Services ActivitiesDen
sity
LnProfitGraphs by sectors according to ISIC classification: 2 digits
جنيهاالجمالية بااللف لوغاريتم االرباح المدرج التكراري االقتصاديالنشاط حسب
0.2
.4.6
.80
.2.4
.6.8
0.2
.4.6
.80
.2.4
.6.8
0.2
.4.6
.8
-5 0 5 10 15 -5 0 5 10 15 -5 0 5 10 15
-5 0 5 10 15 -5 0 5 10 15 -5 0 5 10 15
cairo alex port said suez damietta dakahlia
sharkia kalioubia kafr el sheikh gharbia menoufia behera
ismailia giza beni suef fayoum menia assiout
suhag quena aswan luxor red sea new valley
matrouh north sinai south sinai
De
nsi
ty
LnProfitGraphs by governorate
جنيه االجمالية بااللف لوغاريتم االرباح التكراري المدرج
حسب المحافظة
0.2
.4.6
.80
.2.4
.6.8
0.2
.4.6
.80
.2.4
.6.8
0.2
.4.6
.8
-5 0 5 10 15 -5 0 5 10 15 -5 0 5 10 15
-5 0 5 10 15 -5 0 5 10 15 -5 0 5 10 15
cairo alex port said suez damietta dakahlia
sharkia kalioubia kafr el sheikh gharbia menoufia behera
ismailia giza beni suef fayoum menia assiout
suhag quena aswan luxor red sea new valley
matrouh north sinai south sinai
De
nsi
ty
LnProfitGraphs by governorate
جنيه بالمحافظةاالجمالية بااللف االرباح التكراري لوغاريتم المدرج لنشاط الصناعات الغذائية
0.5
10
.51
0.5
10
.51
0.5
1
-5 0 5 10 15 -5 0 5 10 15 -5 0 5 10 15
-5 0 5 10 15 -5 0 5 10 15 -5 0 5 10 15
cairo alex port said suez damietta dakahlia
sharkia kalioubia kafr el sheikh gharbia menoufia behera
ismailia giza beni suef fayoum menia assiout
suhag quena aswan luxor red sea new valley
matrouh north sinai south sinai
De
nsity
LnProfitGraphs by governorate
جنيه بالمحافظةاالجمالية بااللف لوغاريتم االرباح التكراري المدرج لنشاط المالبس الجاهزة
0.2
.4.6
.80
.2.4
.6.8
0.2
.4.6
.80
.2.4
.6.8
0.2
.4.6
.8
-5 0 5 10 15 -5 0 5 10 15 -5 0 5 10 15
-5 0 5 10 15 -5 0 5 10 15 -5 0 5 10 15
cairo alex port said suez damietta dakahlia
sharkia kalioubia kafr el sheikh gharbia menoufia behera
ismailia giza beni suef fayoum menia assiout
suhag quena aswan luxor red sea new valley
matrouh north sinai south sinai
De
nsi
ty
LnProfitGraphs by governorate
جنيه بالمحافظةاالجمالية بااللف لوغاريتم االرباح التكراري المدرج لنشاط االغذية والمشروبات
0.2
.4.6
0.2
.4.6
-5 0 5
-5 0 5
Food products Industry Garment Industry
Food & Beverages Services ActivitiesDe
nsity
LnProfitGraphs by sectors according to ISIC classification: 2 digits
جنيهاالجمالية بااللف للوغاريتم االرباح المدرج التكراري
القاهرة حسب النشاط االقتصادي لمحافظة
0.2
.4.6
0.2
.4.6
-2 0 2 4 6
-2 0 2 4 6
Food products Industry Garment Industry
Food & Beverages Services ActivitiesDe
nsity
LnProfitGraphs by sectors according to ISIC classification: 2 digits
جنيهاالجمالية بااللف للوغاريتم االرباح المدرج التكراري
النشاط االقتصادي لمحافظة الجيزة حسب
0 20 40 60 80 100mean of profit1
south sinainorth sinai
matrouhnew valley
red sealuxor
aswanquenasuhag
assioutmenia
fayoumbeni suef
gizaismailiabehera
menoufiagharbia
kafr el sheikhkalioubia
sharkiadakahliadamietta
suezport said
alexcairo
جنيهاالجمالية بااللف رسم النقاط لمتوسط االرباح
0 20 40 60mean of profit1
private sector
public sector
جنيهرسم النقاط لمتوسط االرباح االجمالية بااللف القطاع االقتصاديحسب
0 20 40 60mean of profit1
Food & Beverages Services Activities
Garment Industry
Food products Industry
بااللف جنيهرسم النقاط لمتوسط االرباح االجمالية النشاط االقتصاديحسب
0 20 40 60 80mean of profit1
south sinainorth sinai
matrouhnew valley
red sealuxor
aswanquenasuhag
assioutmenia
fayoumbeni suef
gizaismailiabehera
menoufiagharbia
kafr el sheikhkalioubia
sharkiadakahliadamietta
suezport said
alexcairo
جنيهرسم النقاط لمتوسط االرباح االجمالية بااللف الصناعات الغذائية: النشاط االقتصادي: المحافظةحسب
0 10 20 30 40 50mean of profit1
south sinainorth sinai
matrouhnew valley
red sealuxor
aswanquenasuhag
assioutmenia
fayoumbeni suef
gizaismailiabehera
menoufiagharbia
kafr el sheikhkalioubia
sharkiadakahliadamietta
suezport said
alexcairo
جنيهرسم النقاط لمتوسط االرباح االجمالية بااللف صناعة المالبس الجاهزة: النشاط االقتصادي: المحافظةحسب
رسم النقاط لمتوسط االرباح االجمالية بااللف جنيه صناعة األغذية والمشروبات: النشاط االقتصادي: المحافظةحسب
0 20 40 60 80 100mean of profit1
south sinainorth sinai
matrouhnew valley
red sealuxor
aswanquenasuhag
assioutmenia
fayoumbeni suef
gizaismailiabehera
menoufiagharbia
kafr el sheikhkalioubia
sharkiadakahliadamietta
suezport said
alexcairo
Normal Probability Plot for total profit 0
.00
0.2
50
.50
0.7
51
.00
No
rma
l F[(
pro
fit1
-m)/
s]
0.00 0.25 0.50 0.75 1.00Empirical P[i] = i/(N+1)
Q-Q Plot for total profit 0
10
00
00
02
00
00
00
30
00
00
0
pro
fit in
tho
usa
nd
s
0 2000 4000 6000total number of workers: one stage of strata
Quantile-Quantile Plot
Q-Q plot for profit If Profit less than 200(000)
-20
00
20
04
00
pro
fit in
tho
usa
nds
0 100 200 300 400total number of workers: one stage of strata
Quantile-Quantile Plot
0 50 100 150 200profit in thousands
Food & Beverages Services Activities
Garment Industry
Food products Industry
االرباح االجمالية بااللف جنيه: رسم الصندوق حسب النشاط االقتصادي
جنيهبااللف االرباح االجمالية : رسم الصندوق والنشاط االقتصادي( خاص/عام)سب القطاع ح
0 50 100 150 200profit in thousands
private sector
public sector
Food & Beverages Services Activities
Garment Industry
Food products Industry
Food & Beverages Services Activities
Garment Industry
Food products Industry
االرباح االجمالية باالف جنيه: رسم الصندوق حسب المحافظة
0 50 100 150 200profit in thousands
south sinainorth sinai
matrouhnew valley
red sealuxor
aswanquenasuhag
assioutmenia
fayoumbeni suef
gizaismailiabehera
menoufiagharbia
kafr el sheikhkalioubia
sharkiadakahliadamietta
suezport said
alexcairo
االرباح االجمالية بااللف جنيه: رسم الصندوق حسب المحافظة، لنشاط الصناعات الغذائية
0 50 100 150 200profit in thousands
south sinainorth sinai
matrouhnew valley
red sealuxor
aswanquenasuhag
assioutmenia
fayoumbeni suef
gizaismailiabehera
menoufiagharbia
kafr el sheikhkalioubia
sharkiadakahliadamietta
suezport said
alexcairo
االرباح االجمالية بااللف جنيه: رسم الصندوق صناعة المالبس الجاهزةحسب المحافظة، لنشاط
0 50 100 150 200profit in thousands
south sinainorth sinai
matrouhnew valley
red sealuxor
aswanquenasuhag
assioutmenia
fayoumbeni suef
gizaismailiabehera
menoufiagharbia
kafr el sheikhkalioubia
sharkiadakahliadamietta
suezport said
alexcairo
االرباح االجمالية بااللف جنيه: رسم الصندوق صناعة األغذية والمشروباتحسب المحافظة، لنشاط
0 50 100 150 200profit in thousands
south sinainorth sinai
matrouhnew valley
red sealuxor
aswanquenasuhag
assioutmenia
fayoumbeni suef
gizaismailiabehera
menoufiagharbia
kafr el sheikhkalioubia
sharkiadakahliadamietta
suezport said
alexcairo
االرباح االجمالية بااللف جنيه: رسم الصندوق حسب النشاط االقتصادي
0 50 100 150 200profit in thousands
Food & Beverages Services Activities
Garment Industry
Food products Industry
0 50 100 150 200profit in thousands
Food & Beverages Services Activities
Garment Industry
Food products Industry
محافظة القاهرة
محافظة الجيزة
االرباح االجمالية بااللف جنيه: رسم الصندوق حسب النشاط االقتصادي
محافظة
االسكندرية
محافظة الغربية
0 50 100 150 200profit in thousands
Food & Beverages Services Activities
Garment Industry
Food products Industry
0 50 100 150 200profit in thousands
Food & Beverages Services Activities
Garment Industry
Food products Industry
االرباح االجمالية بااللف جنيه: رسم الصندوق حسب النشاط االقتصادي
0 50 100 150 200profit in thousands
Food & Beverages Services Activities
Garment Industry
Food products Industry
0 50 100 150 200profit in thousands
Food & Beverages Services Activities
Garment Industry
Food products Industry
محافظة السويس
محافظة دمياط
شكل االنتشار بين عدد العمال واالرباح االجمالية0
5010
015
020
0
prof
it in
thou
sand
s
0 10 20 30 40 50total number of workers: one stage of strata
01
00
00
20
00
03
00
00
tota
l sa
les
in th
ou
san
ds
0 20 40 60 80 100total number of workers: one stage of strata
شكل االنتشار بين عدد العمال والمبيعات االجمالية
01
00
0020
00
030
00
00
10
00
020
00
030
00
00
10
00
020
00
030
00
00
10
00
020
00
030
00
00
10
00
020
00
030
00
0
0 50 0 50 0 50
0 50 0 50 0 50
cairo alex port said suez damietta dakahlia
sharkia kalioubia kafr el sheikh gharbia menoufia behera
ismailia giza beni suef fayoum menia assiout
suhag quena aswan luxor red sea new valley
matrouh north sinai south sinai
tota
l sa
les in th
ou
san
ds
total number of workers: one stage of strataGraphs by governorate
شكل االنتشار بين عدد العمال والمبيعات االجمالية حسب المحافظة
01
00
00
20
00
03
00
00
01
00
00
20
00
03
00
00
0 50
0 50
Food products Industry Garment Industry
Food & Beverages Services Activities
tota
l sa
les in th
ou
san
ds
total number of workers: one stage of strataGraphs by sectors according to ISIC classification: 2 digits
شكل االنتشار بين عدد العمال والمبيعات االجمالية حسب النشاط االقتصادي
02
00
04
00
06
00
08
00
00
20
00
40
006
00
08
00
0
0 50
0 50
Food products Industry Garment Industry
Food & Beverages Services Activities
tota
l sa
les in th
ou
san
ds
total number of workers: one stage of strataGraphs by sectors according to ISIC classification: 2 digits
شكل االنتشار بين عدد العمال والمبيعات االجمالية حسب النشاط االقتصادي
محافظة القاهرة
05
00
01
00
00
05
00
01
00
00
0 10 20 30 40
0 10 20 30 40
Food products Industry Garment Industry
Food & Beverages Services Activities
tota
l sa
les in th
ou
san
ds
total number of workers: one stage of strataGraphs by sectors according to ISIC classification: 2 digits
محافظة الجيزة
شكل االنتشار بين عدد العمال والمبيعات االجمالية حسب النشاط االقتصادي
محافظة االسكندرية
محافظة دمياط
01
00
02
00
03
00
00
10
00
20
00
30
00
0 50
0 50
Food products Industry Garment Industry
Food & Beverages Services Activities
tota
l sa
les in th
ou
san
ds
total number of workers: one stage of strataGraphs by sectors according to ISIC classification: 2 digits
05
00
10
00
15
00
20
00
05
00
10
00
15
00
20
00
0 10 20 30
0 10 20 30
Food products Industry Garment Industry
Food & Beverages Services Activities
tota
l sa
les in th
ou
san
ds
total number of workers: one stage of strataGraphs by sectors according to ISIC classification: 2 digits
شكل االنتشار بين عدد العمال والمبيعات االجمالية حسب النشاط االقتصادي
محافظة أسيوط
محافظة الغربية
01
00
020
003
00
040
00
01
00
020
003
00
040
00
0 5 10 15 20
0 5 10 15 20
Food products Industry Garment Industry
Food & Beverages Services Activities
tota
l sa
les in th
ou
san
ds
total number of workers: one stage of strataGraphs by sectors according to ISIC classification: 2 digits
01
00
02
00
03
00
00
10
00
20
00
30
00
0 50
0 50
Food products Industry Garment Industry
Food & Beverages Services Activities
tota
l sa
les in th
ou
san
ds
total number of workers: one stage of strataGraphs by sectors according to ISIC classification: 2 digits
باآلتىيتحدد ( أو البيانات)موضع التوزيع:
.1وصف مركز التوزيع أى القيمة التى تميل البيانات أن تتركز حولها .
ويطلق على المؤشرات العددية لقياس مركز البيانات بمقاييس النزعة .Averagesالمركزية أو مقاييس المركز أو المتوسطات
.2 وصف بعض مواضع التوزيع البعيدة عن المركز والتى لها طبيعة
خاصة ويطلق على المؤشرات العددية لقياس هذه المشاهدات بالكسيرات Fractiles .
والكسيرات معاا ( المتوسطات ) ويطلق على مقاييس النزعة المركزية .Measures of Locationبمقاييس الموضع
األساليب االحصائية للتحليل االستكشافي: ثانياا
مقاييس الموضع: اوالا
.مركز البيانات والمشاهدات البعيدة عن المركز بشكل عددىصف ت1.
المقارنة بين البيانات وأى مجموعة أخرى من البيانات بشكل أكثر دقة 2.
وموضوعية بدالا من االعتماد على التوزيعات التكرارية والتى يعتمد . إنشاءها جزئياا على رأى الباحث الشخصى
.البياناتتساعد هذه المقاييس فى قياس التشتت فى 3.
.االلتواءتساعد هذه المقاييس فى تحديد اتجاه ودرجة 4.
أحد وسائل التحليل -تساعد هذه المقاييس فى رسم الصندوق والشعيرات 5. .الشاذةواكتشاف القيم -االستكشافى للبيانات
يمكن حسابها دائماا ألى عدد من المشاهدات بعكس التوزيع التكرارى الذى 6. .يفترض وجود عدد كبير من المشاهدات
.أكثر فائدة من التوزيع التكرارى فى مرحلة التحليل اإلحصائى7.
أهمية مقاييس الموضع
التى عرفها اإلنسان ( المتوسطات)من أقدم مقاييس النزعة المركزية
ويمكن االستدالل تاريخياا على أن استخدامه يعود على األقل فهماا، وأسهلها
.للقرن الخامس قبل الميالد
( تكراراا )يعرف المنوال للمتغير النوعى بأنه الوجه األكثر شيوعاا : تعريف
.فى البيانات
ويمكن التعرف على منوال المتغير النوعى فى مجموعة من البيانات وذلك
بتنظيم البيانات فى جدول تكرارى ثم تحديد الوجه الذى يناظر أكبر تكرار
.المنوالفيكون هو
ويتميز المنوال باآلتى:
.ابسط مقاييس النزعة المركزية فهماا وال يحتاج إلى حسابات1.
.الوحيد الذى يمكن التعرف عليه للبيانات االسميةالمتوسط 2.
.ال يتأثر بالقيم الشاذة3.
كثر من منوال قد يساعد على اكتشاف عدم تجانس البيانات وبالتالى إمكانية أوجود 4.
Modeالمنوال
أساسيين لتعريف الوسيط همامفهومين هناك:
50من القيم وتزيد عن %50البحث عن القيمة التى تقل عن%
وبالرغم من إمكانية إيجاد هذه القيمة للعديد من . من هذه القيم
البيانات إال أنه ال يمكن إيجادها للعديد من البيانات األخرى خاصة
إذا كان عدد البيانات فردى مثل مجموعة البيانات
1, 3, 4, 8, 9 .
البحث عن القيمة التى تقسم البيانات إلى قسمين بحيث أن عدد
القيم التى تقل عن هذه القيمة يساوى عدد القيم التى تزيد عن
كوسيط 4وبالتالى يمكن اعتبار القيمة الوسطى . هذه القيمة
.للبيانات السابق ذكرها
Medianالوسيط
عند التعامل مع بيانات المتغير المتصل من المتوقع الحصول على
قيم مختلفة خاصة إذا أستخدم مستوى مناسب من الدقة فى
.وبالتالى يسهل إعطاء تعريف للوسيط فى هذه الحالة. القياس
يعرف وسيط المتغير المتصل بأنه القيمة التى تقسم : تعريف
البيانات إلى قسمين بحيث أن عدد القيم التى تقل عن الوسيط
.يساوى عدد القيم التى تزيد عن الوسيط
ويكون ( أو تنازلياا ) وإليجاد قيمة الوسيط ترتب القيم تصاعدياا
الوسيط هو القيمة الوسطى إذا كان عدد البيانات فردى ، والوسط
.الحسابى للقيمتين الوسطيتين إذا كان عدد البيانات زوجى
وسيط المتغير المتصل
الوسيط باآلتى يتميز:
سهولة الفهم ويمكن التعرف عليه للبيانات الترتيبية .
دائماا موجود ألى بيانات كمية .
يمكن التعرف عليه بسهولة إذا كان عدد المشاهدات صغيراا.
ال يتأثر كثيراا بالقيم الشاذة أو المتطرفة .
يمكن إيجاده بدون معرفة بعض القيم الحقيقية إذا كان ترتيب هذه القيم . معروفاا
يمكن إيجاده من الجداول التكرارية المفتوحة دون الحاجة إلى قفل . الفئات
مزايا وعيوب الوسيط
ويعاب على الوسيط ما يلى:
ليس وحيداا بمعنى أنه قد يكون هناك أكثر من وسيط لنفس البيانات.
يحتاج دائماا إلى ترتيب البيانات ، وقد تحتاج هذه العملية وقتاا طويالا خاصة .إذا كانت البيانات غير مبوبة فى جدول تكرارى وعددها كبير
يتأثر بموقع القيم فى الترتيب وليس بحجمها باستثناء قيمة واحدة أو أثنين .على األكثر وهذا يقلل من كفاءته كمقياس للنزعة المركزية
قليل االستخدام فى التحليل اإلحصائى نظراا لقلة كفاءته .
كفاءته أقل كمقياس للمركز عند التعامل مع البيانات المتقطعة.
قيمته ال تعتمد على نمط توزيع البيانات التى تقل أو تزيد عنه ، وبالتالى فإن
مجرد معرفة الوسيط قد ال يمدنا بمعلومات كافية إال إذا كان شكل المنحنى .التكرارى معروفاا
مزايا وعيوب الوسيط
ويعتبر الوسط الحسابى أكثر مقاييس المركز شيوعاً واستخداماً خاصة فى الدراسات
التحليلية ألنه أكثر كفاءة من الوسيط والمنوال حيث يعتمد حسابه على الحجم الفعلى لجميع
.البيانات المتاحة
الحسابىالصيغة الحسابية اآلتية للوسط:
يعرف انحراف القيمة عن الوسط الحسابى بأنه الفرق بين هذه القيمة والوسط : تعريف
الحسابى
يعرف الوسط الحسابى للقيم : تعريفx1 , x2 , ... , xn القيم أى لهذه بأنه نقطة االتزان
.القيمة التى تجعل مجموع انحرافات القيم عنها يساوى الصفر
الوسط الحسابى
ينفرد الوسط الحسابى من بين مقاييس النزعة المركزية بإمكانية حساب
الوسط الحسابى العام لمجموعة كبيرة من البيانات باستخدام األوساط
.الحسابى للمجموعات الجزئية التى تتكون منها هذه المجموعة الكبيرة
لثالث مجموعات من البيانات العامحساب الوسط الحسابى:
الوسط الحسابى العام لألوساط الحسابية
تعتمد فكرة الكسيرات األساسية على تقسيم البيانات المرتبة
فإذا كان عدد هذه . إلى عدة أقسام متساوية من حيث العدد
األقسام أربعة سميت الكسيرات بالربيعات ، وإذا كان عدد
األقسام خمسة سميت بالخميسات ، وإذا كان عددها عشرة
سميت بالعشيرات ، بينما إذا كان عددها مائه سميت
.بالمئينات
Fractilesالكسيرات
التطبيقيةتعتبر الربيعات أهم الكسيرات على اإلطالق نظراً لعظم أهميتها .
يعرف الربيع األول : تعريفFirst Quartile المتصلة )للمتغيرات الكمية
بأنه القيمة التى تقسم البيانات إلى قسمين بحيث أن ( والمتقطعة
25نسبة القيم التى تقل عن هذه القيمة تساوى أو تقل عن%
75نسبة القيم التى تزيد عن هذه القيمة تساوى أو تقل عن% .
ويطلق على الوسيط عادًة الربيع الثانىSecond Quartile ويصف الربيع األول
مركز النصف األصغر من البيانات ، ويصف الربيع الثالث مركز النصف األكبر من
.ككلالبيانات ، بينما يصف الربيع الثانى أو الوسيط مركز البيانات
Quartilesالربيعات
البيانات المرتبة إلى خمس أقسام متساوية من حيث العدد عن طريق تقسيمأو إلى عشرة أقسام متساوية عن طريق العشيرات Quintilesالخميسات
Deciles أو إلى مائة قسم عن طريق المئيناتPercentiles .
من البيانات ، ويعرف %20الخميس األول بأنه القيمة التى يقل عنها تعريف
وهكذا حتى نصل ... من البيانات %40الخميس الثانى بأنه القيمة التى يقل عنها
.من البيانات %80إلى الخميس الرابع والذى يعرف بأنه القيمة التى يقل عنها
البياناتمن %10يمكن تعريف العشير األول بأنه القيمة التى يقل عنها بالمثل ،
وهكذا ... من البيانات %20ويعرف العشير الثانى بأنه القيمة التى يقل عنها
من %90حتى تصل إلى العشير التاسع والذى يعرف بأنه القيمة التى يقل عنها
. البيانات
من البيانات ، ويعرف %1األول فيعرف بأنه القيمة التى يقل عنها أما المئين
وهكذا حتى نصل ... من البيانات %2المئين الثانى بأنه القيمة التى يقل عنها
من %99إلى المئين التاسع والتسعين والذى يعرف بأنه القيمة التى يقل عنها
.البيانات
الخميسات والعشيرات والمئينات
بعض المقاييس االحصائية الكمية لألرباح (الف جنيه)
mean p25 p50 p75 sd min max skewness kurtosis
Food products 1525.8 20.6 49.8 142.1 18682.2 -193294 703751 21.3 638
Garment Industry 1809.1 9.9 18.3 39.6 58062.7 -18642 3219453 54.3 3003
Food & Beverages 294 14.5 28.4 56.7 5251.6 -1349 353419 40.2 2106.9
Total 894.7 14.6 30.5 73.7 24566.8 -193294 3219453 105 13390.7
لعدد العمال بالمنشاتبعض المقاييس االحصائية الكمية
(عاملالف )
Food products
Garment Industry
Food & Beverages Total
mean 30.8 33.1 5.6 17.4 p25 4 1 2 2 p50 7 2 3 4 p75 11 5 5 8 sd 166.5 202.6 29.9 123.1 min 1 1 1 1 max 5432 5460 2255 5460 skewness 15.1 13.1 46.8 20.6 kurtosis 324.1 242.4 2955.1 606.4
تلعب مقاييس التشتت دور هام كما يلي:
تلخيص المالمح الرئيسية للبيانات فى عدد محدود من المقاييس 1. .العددية
مقارنة المالمح الرئيسية لعدة مجموعات مختلفة بشكل أكثر دقة 2. .وموضوعية
يمكن حسابها إذا كان عدد المشاهدات صغيراا على عكس التوزيع 3. .التكرارى الذى يتطلب إنشائه عدداا كبيراا من المشاهدات
يمكن حساب هذه المؤشرات عادة بشكل أسرع وأسهل من إنشاء 4. .التوزيع التكرارى
.الدور الهام الذى تلعبه هذه المقاييس فى مرحلة التحليل اإلحصائى5.
مقاييس التشتت: ثانياا
يعتبر المدى من أبسط مقاييس التشتت ويستخدم رغم ذلك فى العديد من
التطبيقات العملية مثل مراقبة جودة اإلنتاج ودراسة استقرار سوق المال
:يلىوالتطبيقات الصحية ويعرف كما
يعرف مدى مجموعة من القيم بأنه الفرق بين أكبر قيمة : تعريف
وأصغر قيمة ، وفى حالة البيانات المبوبة يعرف بأنه الفرق بين مركز
.آخر فئة ومركز أول فئة
عيوب المدي:
. يعتمد فى حسابه على قيمتين فقط ويهمل باقى القيم1.
.يعتمد على القيم الشاذة أو المتطرفة2.
ال يعطى فكرة دقيقة عن اختالف القيم عن بعضها البعض وال يعطى أى فكرة 3. .عن توزيع القيم حول مركزها
.ال يمكن حسابه من الجدوال التكرارية المفتوحة من أحد الطرفين أو كالهما4.
المدى : مقاييس التشتت
المدى الربيعى ـ كمقياس للتشتت ـ العيب األساسى للمدى وهو اعتماده على يعالج
القيم الشاذة والمتطرفة وذلك عن طريق ترتيب المشاهدات ثم حذف ربع .المشاهدات من الطرفين وحساب المدى للقيم الباقية
المدى الربيعى : تعريفQR هو الفرق بين الربيع الثالثQ3 والربيع األولQ1
أنأى
Q1 - Q3 = QR
ويتميز المدى الربيعى بما يلى:
سهل الحساب والتفسير .
يمكن حسابه من الجدوال التكرارية المفتوحة من أحد الطرفين أو كالهما
Quartile Rangeالمدى الربيعى
تقوم فكرة حساب االنحراف المتوسط على إيجاد القيم المطلقة النحرافات القيم عنمركزها أى إهمال إشاراتها ، ثم حساب الوسط الحسابى للقيم المطلقة لالنحرافات
.كمقياس للتشتت
لحساب االنحراف المتوسط نتبع الخطوات اآلتية:
(.أو وسيط البيانات ) نوجد الوسط الحسابى 1.
(.أو عن الوسيط ) نوجد انحرافات القيم عن وسطها الحسابى 2.
وذلك بإهمال 2نوجد القيم المطلقة لالنحرافات المحسوبة فى 3. .اإلشارة
فنحصل على 3حساب الوسط الحسابى لالنحرافات المطلقة فى 4. .االنحراف المتوسط
Mean Deviation (.M.D)المتوسط االنحراف
بأنه الوسط الحسابى للقيم المطلقة يعرف االنحراف المتوسط للبيانات الخامتعريف :
ويتم حسابه بالصيغة اآلتية: النحرافات البيانات عن الوسط الحسابى
M Dx x
n
i
i
n
.
1
التباين هو الوسط الحسابى لمربعات انحرافات القيم عن وسطها : تعريف
: صيغة حسابهالحسابى ،
يعرف االنحراف المعيارى بأنه الجذر التربيعى للوسط الحسابى : تعريف
. الحسابىلمربعات انحرافات القيم عن وسطها
Standard Deviation (s)االنحراف المعيارى
:ولحساب االنحراف المعيارى نتبع الخطوات اآلتية نوجد الوسط الحسابى للبيانات ، ثم نوجد انحرافات القيم عن هذا الوسط. نوجد مربعات انحرافات القيم عن وسطها الحسابى. نوجد الوسط الحسابى لمربعات انحرافات القيم عن وسطها الحسابى فنحصل على
.التبايناالنحراف المعيارى هو الجذر التربيعى للتباين.
بأنه النسبة بين المدى الربيعى يعرف معامل االختالف الربيعى: تعريف :ومجموع الربيعين األول والثالث وتأخذ صيغة حسابه الشكل التالى
النسبة بين المدى الكسيرى ومجموع وهمعامل االختالف الكسيرى
الكسيرين المستخدمين فى حساب المدى الكسيرى وتأخذ صيغة حسابه
:الشكل التالى
حيثr رتبة الكسير األول
معامالت االختالف
Q Q
Q Q
3 1
3 1
الربيعىمعامل االختالف 100
P P
P P
r r
r r
100
100
معامل االختالف الكسيرى 100
يعرف معامل االختالف النسبى: تعريف Relative Variation Coefficient
وتأخذ صيغة حسابه X والوسط الحسابى sبأنه النسبة بين االنحراف المعيارى
:التالىالشكل
معامالت االختالف: ت
معامل االختالف النسبى s
x100
خصائص معامل االلتواء الجيد:
ال تتغير قيمته بإضافة أو طرح قيمة ثابتة من المتغير.
(1-) تتغير إشارة المعامل وال تتغير قيمته الحسابية عند ضرب المتغير فى.
يجب أن تكون قيمته صفرا إذا كان التوزيع متماثال.
تتناسب قيمة معامل االلتواء طرديا مع درجة االلتواء أو شدته
تعريف االلتواء
التوزيع التكراري المتماثل ما كانت تكراراته موزعة توزيعاا متماثالا حول وسطه
الحسابي بما يعني قيم المتغير المتساوية البعد عن الوسط الحسابي لها نفس التكرار
موجب )فالتواء توزيع يعني مدى بعده عن التماثل وقد يكون االلتواء جهة اليمين
.( سالب االلتواء)أو االلتواء جهة اليسار ( االلتواء
متماثل، وبافتراض أن هذه األشكال تمثل درجات 3التواء جهة اليسار ، الشكل 2التواء جهة اليمين ، الشكل 1الشكل
يعني عدد كبير من الطالب حصلوا على درجات أقل من المتوسط بمعنى أن مستوى 1طالب في امتحان ما، ففي الشكل
حيث يبن أن عدد كبير من 2الطالب أقل من مستوى االمتحان أو أن االمتحان صعب في حين العكس تماماا في الشكل
الطالب حصلوا على درجات أكبر من المتوسط أي أن مستوى الطالب أعلى من مستوى االمتحان أو أن االمتحان سهل
.الطالب مناسب لمستوى االمتحانيعنى مستوى 3في حين الشكل
:يقاس االلتواء بأحد المقياسين اآلتيين
أشكال االلتواء
وهي مقاييس نسبية يمكن استخدامها للمقارنة بين التواء التوزيعات كما أن قيمة مقياس االلتواء محصورة
السالبة تعني االلتواء جهة اليسار والقيمة الموجبة تعني االلتواء جهة اليمين والقيمة فالقيمة i+3 ، – 3بين
(.التوزيع متماثل)صفر تعني عدم وجود التواء أو التماثل
معامل االلتواء
(عدد سالب)=
التوزيع ملتوي التواء سالب اتجاه اليسار
(صفر= )
التوزيع متماثل
(عدد موجب)=
التوزيع ملتوي التواء موجب اتجاه اليمين
:يلىبعد حساب معامل االلتواء يمكن معرفة تماثل أو التواء التوزيع كما ، ويدل ذلك على أن منحنى التوزيع التكراري (ks=0)االلتواء عاملمقيمة تكان( المنوال=الوسيط = الوسط الحسابي )إذا كان -
.متماثل، ويدل ذلك على أن منحنى التوزيع التكراري (+=ks)االلتواء عاملمقيمة تكان( المنوال<الوسيط < الوسط الحسابي )إذا كان -
.ملتوي جهة اليمين ، ويدل ذلك على أن منحنى التوزيع التكراري (-=ks) االلتواء عاملمقيمة تكان( المنوال >الوسيط > الوسط الحسابي )إذا كان -
.ملتوي جهة اليسار
ملخص معامل االلتواء
Kurtosis التفرطح
في قمة المنحنى مقارنة بقمة ( االنخفاض أو االرتفاع ) مقدار التدبب يقصد بالتفرطح
:منحنى التوزيع الطبيعي
.في حالة التوزيع الطبيعي المعتدل 3وتكون قيمة معامل التفرطح تساوى
(:مقارنة بالمنحنيات المعتدلة)ثالثة أنواع للمنحنيات التكرارية التفرطح Mesokurtic ( Norma( ) معتدل)متوسط التفرطح ( 1 معظم القيم بالقرب من الوسط الحسابي والذيلين (Leptokurticمدبب (2
القيم بعيدة عن الوسط والذيلينمعظم ( Platykurticمفرطح ( 3
:يحسب من الصيغة الرياضية
التفرطح
شكل يوضح
أشكال
المختلفة
للمنحنيات
معامل التفرطح
3أقل من
منحنى التوزيع مفرطح
3يساوى
منحنى التوزيع معتدل
3من أكبر
منحنى التوزيع مدبب
منحنى مدبب
منحنى مفرطح
تستند فكرة المعايرةStandardization فى اإلحصاء على
توحيد المقارنة بين القيم وذلك بعزل أو تنحية أثر اختالفات
المركز والتشتت بين القيم موضع المقارنة ، بحيث يسهل
ويتم عادة عزل . Pure Valuesالمقارنة بين القيم الصافية
فى اإلحصاء بطرح قيمه المركز levelالمركز أو مستوى القيم
عادة Variationالمناسب من البيانات ، كما يتم عزل التشتت
.بقسمة البيانات على مقياس التشتت المناسب
Standardized Valuesالقيم المعيارية
التوزيعات المتماثلة: الحالة األولى
يمكن تعريف القيمة المعيارية ، وتسمى فى هذه الحالة : تعريفZ - Score لمشاهدة معينة بأنها عدد االنحرافات المعيارية التى تبعد بها ،
, x1 , x2فإذا كان لدينا المشاهدات . هذه المشاهدة عن الوسط الحسابى.....,xn ورمزنا للوسط الحسابى واالنحراف المعيارى بالرمزينX-bar
xiعلى الترتيب فان القيمة المعيارية أو الوحدة المعيارية للمشاهدة Sو
: هى
القيم المعيارية: تابع
الملتويةالتوزيعات : الحالة الثانية
فى حالة -يمكن تعريف القيمة المعيارية لمشاهدة معينة : تعريف
بأنها عدد وحدات المدى الربيعى التى تبعد بها هذه -البيانات الملتوية ، x1 , x2 , ...... , xnفإذا كان لدينا المشاهدات . المشاهدة عن الوسيط
على الترتيب IQR , mورمزنا للوسيط والمدى الربيعى بالرمزين
:هى xiفإن القيمة المعيارية للمشاهدة
القيم المعيارية: تابع
يمكن تعريف القيم الشاذة بأنها القيم التى تختلف اختالفا : تعريف
.ملحوظا عن معظم القيم األخرى
وتحدث القيم الشاذة عادة نتيجة ألحد األسباب اآلتية:
أخطاء فى تسجيلRecording البيانات.
أخطاء تحدث عند إدخال البياناتData Entry إلى الكمبيوتر.
اختالف الظروف التى تم فيها الحصول على هذه البيانات عن الظروف .التى تم فيها الحصول على باقى البيانات
Detecting Outliers اكتشاف القيم الشاذة
يمكن االعتماد على شكل النقاطDot Plot أو األغصان واألوراق
Stem and Leaf الكتشاف مثل هذه القيم بشكل تقريبى ، إال أنه
يفضل استخدام المؤشرات التى تستخدم مقاييس المركز والتشتت
.الكتشاف مثل هذه القيم
ويفضل بصفة عامة الستخدام المؤشرات التى تعتمد على الوسط
الحسابى واالنحراف المعيارى الكتشاف القيم الشاذة إذا كان توزيع
البيانات متماثال أو قريبا من التماثل ، بينما يفضل استخدام المؤشرات
التى تعتمد على الربيعات والمئينات أو الكسيرات بصفة عامة إذا كان .توزيع البيانات ملتويا
طرق اكتشاف القيم الشاذة
المتماثلةالتوزيعات : األولى الحالة
ولكن ليس -إذا كان توزيع البيانات متماثال أو قريبا من التماثل
فإنه من الممكن -له خصائص التوزيع الطبيعى األخرى
استخدام متبانية تشيبتشف التى سبق أن أشرنا إليها فى الفصل
تقع داخل المدى ، %94السابق والتى تنص على أن أكثر من
وبالتالى يمكن اعتبار أى مشاهدة تقع خارج هذا المدى بأنها
مشاهدة غير عادية أو شاذة ، كما يمكن اعتبار أى مشاهدة تقع Very Unusualخارج المدى بأنها مشاهدة غير عادية جدا
.Extremeأو متطرفة
طرق اكتشاف القيم الشاذة
الملتويةالتوزيعات : الحالة الثانية
طريقة توكىTukey
وتعتمد هذه الطريقة أساسا على الربيع األولQ1 والربيع الثالثQ3
الصورة األولى . ويأخذ عادة صورتين مختلفتين IQRوالمدى الربيعى
ويمكن تعريف حديه األدنى Inner Fenceوتسمى بالسياج الداخلى
:واألعلى كما يلى
LIF = Q1 - 1.5 IQR
UIF = Q3 + 1.5 IQR
حيث ترمزLIF إلى الحد األدنى للسياج الداخلىLower Inner Fence
Upper Innerإلى الحد األعلى للسياج الداخلى UIF، بينما ترمز Fence . وبالتالى تعتبر القيمة الشاذة إذا وقعت خارج حدود السياج
.( LIF , UIF )الداخلى
طرق اكتشاف القيم الشاذة
أما الصورة الثانية وتسمى بالسياج الخارجىOuter Fence فتأخذ نفس صورة السياج الداخلى مع
، (IQR 1.5)بدال من استخدام ( IQR 3)استخدام
وبالتالى تعتبر القيمة متطرفة إذا وقعت خارج حدود .(LOF , UOF )السياج الخارجى
طرق اكتشاف القيم الشاذة
الصندوق والشعيراتBox - and-Wisker Plot
اعتمدت بعض الوسائل الحديثة فى عرض البيانات بغرض Exploratory Dataالتحليل االستكشافى للبيانات
Analysis ( EDA) على مقياس توكى ، ومن أهم هذه
وهو شكل Box - Plotالوسائل الصندوق والشعيرات
بيانى يوضح المدى الذى تنتشر عليه البيانات ونمط
االختالف ودرجة التماثل أو االلتواء فى توزيع البيانات
.وكذلك فى توزيع النصف األوسط للبيانات
طرق اكتشاف القيم الشاذة
يعرف االرتباط بين متغيرين بأنه درجة العالقة بين المتغيرين: تعريف.
عن قوة العالقة -بصرف النظر عن اإلشارة -االرتباط معامل تعبر قيمة
بين المتغيرين ورغم أنه ال توجد عالقة محددة لوصف درجة العالقة بين
المتغيرين بناء على قيمة معامل االرتباط إال أنه يمكن استخدام بعض
فإذا كانت قيمة معامل . المؤشرات التقريبية للحكم على درجة هذه العالقةدل ذلك على ضعف العالقة بينما إذا كانت قيمته (0,0.5)االرتباط تقع بين
وتنعدم العالقة بين المتغيرين . دل ذلك على قوة هذه العالقة (0.5,1)تقع بين
إذا كان معامل االرتباط صفرا ، بينما تدل القيمة واحد لمعامل االرتباط على
وتدل إشارة معامل االرتباط عادة على . وجود عالقة تامة بين المتغيرين
اتجاه العالقة بين المتغيرين ، فإذا كانت اإلشارة موجبة دل ذلك على وجود عالقة طردية بين المتغيرين
Correlation االرتباطمعامل
االنتشارشكل Scatter Plot
ويتم رسم شكل . يعتبر شكل االنتشار من أهم وسائل فحص العالقة بين متغيرينوالمتغير الثانى على Xاالنتشار بالتعبير عن أحد المتغيرين على المحور األفقى
بنقطة على الخريطة ) ( حيث يعبر عن كل زوج من أزواج القيم Yالمحور الرأسى
(.الفراغ الثنائى)البيانية
ويعطى شكل االنتشار صورة تقريبية عن قوة واتجاه العالقة بين المتغيرين ، ذلك أنهفكلما تجمعت X ،Yلو تصورنا أن هناك خط مستقيم يمثل العالقة بين المتغيرين
واقتربت البيانات من هذا الخط أو بمعنى آخر كلما اقتربت نقط الشكل من الخط
المستقيم كلما زادت قوة االرتباط الخطى حتى إذا وقعت كلها على الخط المستقيم كان ، Xالممثل للعالقة بين المتغيرين ) ويحدد ميل الخط المستقيم . هناك ارتباط خطى تام
Y ) اتجاه العالقة بين المتغيرين ، فإذا كان ميل الخط موجب كانت العالقة بين
.المتغيرين طردية والعكس صحيح
االرتباط بين المتغيرات الكمية
بين المتغيرين يعرف التغاير: تعريفX, Y بأنه الوسط الحسابى لحاصل ضرب
عن وسطها الحسابى Y عن وسطها الحسابى فى انحرافات قيم Xانحرافات قيم
:أنأى
ويدل التغاير بين المتغيرينX , Y على اتجاه العالقة بينهما ، فإذا كان موجباً تكون
العالقة طردية ، وإذا كان سالباً تكون العالقة عكسية أما إذا كان التغاير صفرا .فليس هناك عالقة خطية بين المتغيرين
Covarianceالتغاير
يعرف معامل ارتباط بيرسون : تعريفr لالرتباط الخطى بين المتغيرين
X , Y يلىكما :
على فإن معامل ارتباط بيرسون لالرتباط الخطى يمكن كتابته وبالتالى
: الصورة
Pearson'sبيرسون لالرتباط معامل Correlation Coefficient
ويتميز معامل بيرسون لالرتباط الخطى بالخصائص اآلتية:
.(1,1-)يتراوح بين 1.
.ال يعتمد على وحدات قياس المتغيرين2.
ال يتأثر إذا أضيف أو طرح رقم ثابت للمتغيرين بمعنى أن معامل 3. X+k هو نفسه معامل االرتباط بين X , Yاالرتباط بين المتغيرين
,Y+c حيث ،k , c ثوابت.
ال تتأثر قيمة معامل االرتباط عند ضرب أحد المتغيرين أو كالهما فى 4.هو نفسه X , Yرقم ثابت بمعنى أن معامل االرتباط بين المتغيرين
.ثوابت k , cحيث kX , cYمعامل االرتباط بين المتغيرين
معامل بيرسون لالرتباط الخطى خصائص
Correlation coefficients empl profit1 netind~x netva totva outputfc totwage totsales totprod
empl 1
profit1 0.2 1 netindtax 0.0 0.0 1
netva 0.3 1.0 0.0 1
totva 0.3 1.0 0.0 1.0 1 outputfc 0.6 0.7 0.1 0.7 0.8 1 totwage 0.8 0.2 0.1 0.3 0.4 0.7 1 totsales 0.6 0.5 0.1 0.6 0.6 1.0 0.7 1 totprod 0.6 0.7 0.1 0.7 0.8 1.0 0.7 1.0 1