the analysis of the egyptian economic census survey 2012/2013 - mohamed ismaeil and ali rashed

92
حصاءلعالمي ل اليوم ا20 - 10 - 2015 International Statistics Day ورشة عمل لجمهورية مصر العربيةقتصادي التعداد ا لبياناتستكشافييل ا تحل لسنة2013/2012 An Exploratory Analysis of the Egyptian Economic Census Data 2012/2013. د. سماعيل محمد ا: تاذ و رئيس اسلجهازر رئيس السياسية، ومستشاعلوم اد والقتصاء بكلية احصا قسم ا ا. علي راشد: ن الدوليلسكات، مجلس ال بيانا ومحل باحث أول

Upload: economic-research-forum

Post on 15-Apr-2017

379 views

Category:

Government & Nonprofit


0 download

TRANSCRIPT

اليوم العالمي لالحصاء

20-10-2015 International Statistics Day

ورشة عمل

تحليل استكشافي لبيانات التعداد االقتصادي لجمهورية مصر العربية

2013/2012لسنة

An Exploratory Analysis of the Egyptian Economic Census Data 2012/2013.

قسم االحصاء بكلية االقتصاد والعلوم السياسية، ومستشار رئيس الجهازاستاذ و رئيس : محمد اسماعيل. د

باحث أول ومحلل بيانات، مجلس السكان الدولي: علي راشد. ا

المقصود بالتحليل االستكشافي للبيانات

أهداف التحليل االستكشافي

أساليب التحليل االستكشافي

األساليب البيانية للتحليل االستكشافي

المدرج التكراري

رسم النقاط

Run Plot

Normal Probability Plot

Quintile Plot (QQ Plot)

Autocorrelation plot

رسم الصندوق

االنتشارشكل

االطار العام

األساليب الكمية للتحليل االستكشافي

الموضع/مقاييس المركز: اوالا

مقاييس التشتت: ثانياا

االلتواء: ثالثاا

التفرطح: رابعاا

اختبارات العشوائية: خامساا

اختبارات التوزيعات: سادساا

االطار العام: تابع

اكتشاف القيم الشاذة

البيانات ( معايرة)تطبيع(Z-Scores)

النوع، المحافظة، : مثل)مقارنة خصائص عدة مجموعات من البيانات

.كميابيانياا و .....( القطاع،

االرتباط بين المتغيرات الكمية

معامل بيرسون لالرتباط

معامل سبيرمان الرتباط الرتب

االطار العام: تابع

يقصد بالتحليل االستكشافي بأنه اسلوب لتحليل البيانات الذي يعتمد على أكثرلتحديد المتغيرات المهمة، والكتشاف القيم الشاذة، ( بيانيا وكمياا )من طريقة

.والختبار بعض الفروض

إظهار أنه يهدف الى في لبيانات الكميةتمثل أهمية التحليل االستكشافي لالمالمح والخصائص األساسية الكامنة فى البيانات والتى تساهم فى بلورة المعلومات والفروض العلمية التى يمكن دراستها واختبارها فى المراحل

.البحثالمتقدمة من

أهدافهاإلحصائية وتعدد بوفرة أدواته االستكشافى للبيانات تميز التحليل ي .

بالتطور السريع فى مجال التحليل االستكشافى للبياناتة أهميوازدادتالكومبيوتر وتوافر البرامج التى تمكن من استخدام هذه األدوات بسهولة

والتحكم فى مخرجاتها بالشكل الذى يساعد على إظهار مالمح البيانات .األساسية

المقصود بالتحليل االستكشافي للبيانات

الهدف الرئيسي للتحليل االستكشافي للبيانات هو اسباغ نظرة متعمقة

للبيانات والتعرف على هيكلها واعطاء الباحث كل العناصر التي يحتاجها

.بهدف استخراج النتائج

تتمثل األهداف في االتي:

التوفيق الجيد للنماذج المختلفة(Good fitting models)

الحصول على قائمة بالقيم الشاذة

التوصل الستنتاجات قوية(a sense of robustness of conclusions)

تقدير معلمات النماذج المختلفة

تحليل أسباب عدم التأكد لتقدير هذه المعلمات

المهمة في هذه البيانات( المتغيرات)ترتيب قائمة العوامل

االستكشافي للبياناتالتحليل أهداف

أساليب التحليل االستكشافي

حيث أن هذه هي األدوات األكثر استعماال : البيانية األساليب : أوالا •المرحلة تقوم على مبدأ أن التحليل البصري ُيمكننا من رؤية العالقات

من األشكال البيانية التي تستعمل في هذه المرحلة هناك . بشكل أسرع Scatter)مخطط التشتت ، (Box plot)الرسوم الصندوقية

plot) ، والمدرجات التكرارية(Histograms.)

: الكميةاألساليب : ثانيا

تستعمل هذه األساليب لحساب بعض القياسات و التأكد من أن البيانات •–Kolmogorov تتبع توزعا من التوزيعات باستعمال مثال اختبار

Smirnov. يمكن أيضا القيام بعملية تحليل االنحدار(Regression Analysis) لتأكد من وجود عالقة خطية أو غير خطية بين عينتبن.

جنيهالمدرج التكراري لالرباح االجمالية بااللف 0

.00

5.0

1.0

15

.02

.02

5

De

nsity

0 50 100 150 200profit in thousands

جنيهاالجمالية بااللف لالرباح المدرج التكراري االقتصاديالنشاط حسب

0.0

1.0

2.0

3.0

40

.01

.02

.03

.04

0 50 100 150 200

0 50 100 150 200

Food products Industry Garment Industry

Food & Beverages Services ActivitiesDe

nsity

profit in thousandsGraphs by sectors according to ISIC classification: 2 digits

جنيه بالمحافظةالتكراري لالرباح االجمالية بااللف المدرج

لنشاط الصناعات الغذائية0

.01

.02

.03

.04

0.0

1.0

2.0

3.0

40

.01

.02

.03

.04

0.0

1.0

2.0

3.0

40

.01

.02

.03

.04

0 50 100 150 200 0 50 100 150 200 0 50 100 150 200

0 50 100 150 200 0 50 100 150 200 0 50 100 150 200

cairo alex port said suez damietta dakahlia

sharkia kalioubia kafr el sheikh gharbia menoufia behera

ismailia giza beni suef fayoum menia assiout

suhag quena aswan luxor red sea new valley

matrouh north sinai south sinai

De

nsity

profit in thousandsGraphs by governorate

0.0

5.1

0.0

5.1

0.0

5.1

0.0

5.1

0.0

5.1

0 50 100 150 200 0 50 100 150 200 0 50 100 150 200

0 50 100 150 200 0 50 100 150 200 0 50 100 150 200

cairo alex port said suez damietta dakahlia

sharkia kalioubia kafr el sheikh gharbia menoufia behera

ismailia giza beni suef fayoum menia assiout

suhag quena aswan luxor red sea new valley

matrouh north sinai south sinai

De

nsity

profit in thousandsGraphs by governorate

جنيه بالمحافظةالتكراري لالرباح االجمالية بااللف المدرج

لنشاط المالبس الجاهزة

بااللف جنيه بالمحافظةالتكراري لالرباح االجمالية المدرج

لنشاط األغذية والمشروبات

0.0

2.0

4.0

60

.02

.04

.06

0.0

2.0

4.0

60

.02

.04

.06

0.0

2.0

4.0

6

0 50 100 150 200 0 50 100 150 200 0 50 100 150 200

0 50 100 150 200 0 50 100 150 200 0 50 100 150 200

cairo alex port said suez damietta dakahlia

sharkia kalioubia kafr el sheikh gharbia menoufia behera

ismailia giza beni suef fayoum menia assiout

suhag quena aswan luxor red sea new valley

matrouh north sinai south sinai

De

nsity

profit in thousandsGraphs by governorate

جنيهالتكراري لالرباح االجمالية بااللف المدرج

بمحافظة القاهرة0

.00

5.0

1.0

15

.02

0.0

05

.01

.01

5.0

2

0 50 100 150 200

0 50 100 150 200

Food products Industry Garment Industry

Food & Beverages Services ActivitiesDe

nsity

profit in thousandsGraphs by sectors according to ISIC classification: 2 digits

0.1

.2.3

.4

De

nsi

ty

-5 0 5 10 15LnProfit

جنيهاالجمالية بااللف لوغاريتم االرباح المدرج التكراري

0.1

.2.3

.40

.1.2

.3.4

-5 0 5 10 15

-5 0 5 10 15

Food products Industry Garment Industry

Food & Beverages Services ActivitiesDen

sity

LnProfitGraphs by sectors according to ISIC classification: 2 digits

جنيهاالجمالية بااللف لوغاريتم االرباح المدرج التكراري االقتصاديالنشاط حسب

0.2

.4.6

.80

.2.4

.6.8

0.2

.4.6

.80

.2.4

.6.8

0.2

.4.6

.8

-5 0 5 10 15 -5 0 5 10 15 -5 0 5 10 15

-5 0 5 10 15 -5 0 5 10 15 -5 0 5 10 15

cairo alex port said suez damietta dakahlia

sharkia kalioubia kafr el sheikh gharbia menoufia behera

ismailia giza beni suef fayoum menia assiout

suhag quena aswan luxor red sea new valley

matrouh north sinai south sinai

De

nsi

ty

LnProfitGraphs by governorate

جنيه االجمالية بااللف لوغاريتم االرباح التكراري المدرج

حسب المحافظة

0.2

.4.6

.80

.2.4

.6.8

0.2

.4.6

.80

.2.4

.6.8

0.2

.4.6

.8

-5 0 5 10 15 -5 0 5 10 15 -5 0 5 10 15

-5 0 5 10 15 -5 0 5 10 15 -5 0 5 10 15

cairo alex port said suez damietta dakahlia

sharkia kalioubia kafr el sheikh gharbia menoufia behera

ismailia giza beni suef fayoum menia assiout

suhag quena aswan luxor red sea new valley

matrouh north sinai south sinai

De

nsi

ty

LnProfitGraphs by governorate

جنيه بالمحافظةاالجمالية بااللف االرباح التكراري لوغاريتم المدرج لنشاط الصناعات الغذائية

0.5

10

.51

0.5

10

.51

0.5

1

-5 0 5 10 15 -5 0 5 10 15 -5 0 5 10 15

-5 0 5 10 15 -5 0 5 10 15 -5 0 5 10 15

cairo alex port said suez damietta dakahlia

sharkia kalioubia kafr el sheikh gharbia menoufia behera

ismailia giza beni suef fayoum menia assiout

suhag quena aswan luxor red sea new valley

matrouh north sinai south sinai

De

nsity

LnProfitGraphs by governorate

جنيه بالمحافظةاالجمالية بااللف لوغاريتم االرباح التكراري المدرج لنشاط المالبس الجاهزة

0.2

.4.6

.80

.2.4

.6.8

0.2

.4.6

.80

.2.4

.6.8

0.2

.4.6

.8

-5 0 5 10 15 -5 0 5 10 15 -5 0 5 10 15

-5 0 5 10 15 -5 0 5 10 15 -5 0 5 10 15

cairo alex port said suez damietta dakahlia

sharkia kalioubia kafr el sheikh gharbia menoufia behera

ismailia giza beni suef fayoum menia assiout

suhag quena aswan luxor red sea new valley

matrouh north sinai south sinai

De

nsi

ty

LnProfitGraphs by governorate

جنيه بالمحافظةاالجمالية بااللف لوغاريتم االرباح التكراري المدرج لنشاط االغذية والمشروبات

0.2

.4.6

0.2

.4.6

-5 0 5

-5 0 5

Food products Industry Garment Industry

Food & Beverages Services ActivitiesDe

nsity

LnProfitGraphs by sectors according to ISIC classification: 2 digits

جنيهاالجمالية بااللف للوغاريتم االرباح المدرج التكراري

القاهرة حسب النشاط االقتصادي لمحافظة

0.2

.4.6

0.2

.4.6

-2 0 2 4 6

-2 0 2 4 6

Food products Industry Garment Industry

Food & Beverages Services ActivitiesDe

nsity

LnProfitGraphs by sectors according to ISIC classification: 2 digits

جنيهاالجمالية بااللف للوغاريتم االرباح المدرج التكراري

النشاط االقتصادي لمحافظة الجيزة حسب

0 20 40 60 80 100mean of profit1

south sinainorth sinai

matrouhnew valley

red sealuxor

aswanquenasuhag

assioutmenia

fayoumbeni suef

gizaismailiabehera

menoufiagharbia

kafr el sheikhkalioubia

sharkiadakahliadamietta

suezport said

alexcairo

جنيهاالجمالية بااللف رسم النقاط لمتوسط االرباح

0 20 40 60mean of profit1

private sector

public sector

جنيهرسم النقاط لمتوسط االرباح االجمالية بااللف القطاع االقتصاديحسب

0 20 40 60mean of profit1

Food & Beverages Services Activities

Garment Industry

Food products Industry

بااللف جنيهرسم النقاط لمتوسط االرباح االجمالية النشاط االقتصاديحسب

0 20 40 60 80mean of profit1

south sinainorth sinai

matrouhnew valley

red sealuxor

aswanquenasuhag

assioutmenia

fayoumbeni suef

gizaismailiabehera

menoufiagharbia

kafr el sheikhkalioubia

sharkiadakahliadamietta

suezport said

alexcairo

جنيهرسم النقاط لمتوسط االرباح االجمالية بااللف الصناعات الغذائية: النشاط االقتصادي: المحافظةحسب

0 10 20 30 40 50mean of profit1

south sinainorth sinai

matrouhnew valley

red sealuxor

aswanquenasuhag

assioutmenia

fayoumbeni suef

gizaismailiabehera

menoufiagharbia

kafr el sheikhkalioubia

sharkiadakahliadamietta

suezport said

alexcairo

جنيهرسم النقاط لمتوسط االرباح االجمالية بااللف صناعة المالبس الجاهزة: النشاط االقتصادي: المحافظةحسب

رسم النقاط لمتوسط االرباح االجمالية بااللف جنيه صناعة األغذية والمشروبات: النشاط االقتصادي: المحافظةحسب

0 20 40 60 80 100mean of profit1

south sinainorth sinai

matrouhnew valley

red sealuxor

aswanquenasuhag

assioutmenia

fayoumbeni suef

gizaismailiabehera

menoufiagharbia

kafr el sheikhkalioubia

sharkiadakahliadamietta

suezport said

alexcairo

Normal Probability Plot for total profit 0

.00

0.2

50

.50

0.7

51

.00

No

rma

l F[(

pro

fit1

-m)/

s]

0.00 0.25 0.50 0.75 1.00Empirical P[i] = i/(N+1)

Q-Q Plot for total profit 0

10

00

00

02

00

00

00

30

00

00

0

pro

fit in

tho

usa

nd

s

0 2000 4000 6000total number of workers: one stage of strata

Quantile-Quantile Plot

Q-Q plot for profit If Profit less than 200(000)

-20

00

20

04

00

pro

fit in

tho

usa

nds

0 100 200 300 400total number of workers: one stage of strata

Quantile-Quantile Plot

جنيهبااللف االرباح االجمالية : رسم الصندوق

0 50 100 150 200profit in thousands

0 50 100 150 200profit in thousands

Food & Beverages Services Activities

Garment Industry

Food products Industry

االرباح االجمالية بااللف جنيه: رسم الصندوق حسب النشاط االقتصادي

جنيهبااللف االرباح االجمالية : رسم الصندوق والنشاط االقتصادي( خاص/عام)سب القطاع ح

0 50 100 150 200profit in thousands

private sector

public sector

Food & Beverages Services Activities

Garment Industry

Food products Industry

Food & Beverages Services Activities

Garment Industry

Food products Industry

االرباح االجمالية باالف جنيه: رسم الصندوق حسب المحافظة

0 50 100 150 200profit in thousands

south sinainorth sinai

matrouhnew valley

red sealuxor

aswanquenasuhag

assioutmenia

fayoumbeni suef

gizaismailiabehera

menoufiagharbia

kafr el sheikhkalioubia

sharkiadakahliadamietta

suezport said

alexcairo

االرباح االجمالية بااللف جنيه: رسم الصندوق حسب المحافظة، لنشاط الصناعات الغذائية

0 50 100 150 200profit in thousands

south sinainorth sinai

matrouhnew valley

red sealuxor

aswanquenasuhag

assioutmenia

fayoumbeni suef

gizaismailiabehera

menoufiagharbia

kafr el sheikhkalioubia

sharkiadakahliadamietta

suezport said

alexcairo

االرباح االجمالية بااللف جنيه: رسم الصندوق صناعة المالبس الجاهزةحسب المحافظة، لنشاط

0 50 100 150 200profit in thousands

south sinainorth sinai

matrouhnew valley

red sealuxor

aswanquenasuhag

assioutmenia

fayoumbeni suef

gizaismailiabehera

menoufiagharbia

kafr el sheikhkalioubia

sharkiadakahliadamietta

suezport said

alexcairo

االرباح االجمالية بااللف جنيه: رسم الصندوق صناعة األغذية والمشروباتحسب المحافظة، لنشاط

0 50 100 150 200profit in thousands

south sinainorth sinai

matrouhnew valley

red sealuxor

aswanquenasuhag

assioutmenia

fayoumbeni suef

gizaismailiabehera

menoufiagharbia

kafr el sheikhkalioubia

sharkiadakahliadamietta

suezport said

alexcairo

االرباح االجمالية بااللف جنيه: رسم الصندوق حسب النشاط االقتصادي

0 50 100 150 200profit in thousands

Food & Beverages Services Activities

Garment Industry

Food products Industry

0 50 100 150 200profit in thousands

Food & Beverages Services Activities

Garment Industry

Food products Industry

محافظة القاهرة

محافظة الجيزة

االرباح االجمالية بااللف جنيه: رسم الصندوق حسب النشاط االقتصادي

محافظة

االسكندرية

محافظة الغربية

0 50 100 150 200profit in thousands

Food & Beverages Services Activities

Garment Industry

Food products Industry

0 50 100 150 200profit in thousands

Food & Beverages Services Activities

Garment Industry

Food products Industry

االرباح االجمالية بااللف جنيه: رسم الصندوق حسب النشاط االقتصادي

0 50 100 150 200profit in thousands

Food & Beverages Services Activities

Garment Industry

Food products Industry

0 50 100 150 200profit in thousands

Food & Beverages Services Activities

Garment Industry

Food products Industry

محافظة السويس

محافظة دمياط

شكل االنتشار بين عدد العمال واالرباح االجمالية0

5010

015

020

0

prof

it in

thou

sand

s

0 10 20 30 40 50total number of workers: one stage of strata

01

00

00

20

00

03

00

00

tota

l sa

les

in th

ou

san

ds

0 20 40 60 80 100total number of workers: one stage of strata

شكل االنتشار بين عدد العمال والمبيعات االجمالية

01

00

0020

00

030

00

00

10

00

020

00

030

00

00

10

00

020

00

030

00

00

10

00

020

00

030

00

00

10

00

020

00

030

00

0

0 50 0 50 0 50

0 50 0 50 0 50

cairo alex port said suez damietta dakahlia

sharkia kalioubia kafr el sheikh gharbia menoufia behera

ismailia giza beni suef fayoum menia assiout

suhag quena aswan luxor red sea new valley

matrouh north sinai south sinai

tota

l sa

les in th

ou

san

ds

total number of workers: one stage of strataGraphs by governorate

شكل االنتشار بين عدد العمال والمبيعات االجمالية حسب المحافظة

01

00

00

20

00

03

00

00

01

00

00

20

00

03

00

00

0 50

0 50

Food products Industry Garment Industry

Food & Beverages Services Activities

tota

l sa

les in th

ou

san

ds

total number of workers: one stage of strataGraphs by sectors according to ISIC classification: 2 digits

شكل االنتشار بين عدد العمال والمبيعات االجمالية حسب النشاط االقتصادي

02

00

04

00

06

00

08

00

00

20

00

40

006

00

08

00

0

0 50

0 50

Food products Industry Garment Industry

Food & Beverages Services Activities

tota

l sa

les in th

ou

san

ds

total number of workers: one stage of strataGraphs by sectors according to ISIC classification: 2 digits

شكل االنتشار بين عدد العمال والمبيعات االجمالية حسب النشاط االقتصادي

محافظة القاهرة

05

00

01

00

00

05

00

01

00

00

0 10 20 30 40

0 10 20 30 40

Food products Industry Garment Industry

Food & Beverages Services Activities

tota

l sa

les in th

ou

san

ds

total number of workers: one stage of strataGraphs by sectors according to ISIC classification: 2 digits

محافظة الجيزة

شكل االنتشار بين عدد العمال والمبيعات االجمالية حسب النشاط االقتصادي

محافظة االسكندرية

محافظة دمياط

01

00

02

00

03

00

00

10

00

20

00

30

00

0 50

0 50

Food products Industry Garment Industry

Food & Beverages Services Activities

tota

l sa

les in th

ou

san

ds

total number of workers: one stage of strataGraphs by sectors according to ISIC classification: 2 digits

05

00

10

00

15

00

20

00

05

00

10

00

15

00

20

00

0 10 20 30

0 10 20 30

Food products Industry Garment Industry

Food & Beverages Services Activities

tota

l sa

les in th

ou

san

ds

total number of workers: one stage of strataGraphs by sectors according to ISIC classification: 2 digits

شكل االنتشار بين عدد العمال والمبيعات االجمالية حسب النشاط االقتصادي

محافظة أسيوط

محافظة الغربية

01

00

020

003

00

040

00

01

00

020

003

00

040

00

0 5 10 15 20

0 5 10 15 20

Food products Industry Garment Industry

Food & Beverages Services Activities

tota

l sa

les in th

ou

san

ds

total number of workers: one stage of strataGraphs by sectors according to ISIC classification: 2 digits

01

00

02

00

03

00

00

10

00

20

00

30

00

0 50

0 50

Food products Industry Garment Industry

Food & Beverages Services Activities

tota

l sa

les in th

ou

san

ds

total number of workers: one stage of strataGraphs by sectors according to ISIC classification: 2 digits

باآلتىيتحدد ( أو البيانات)موضع التوزيع:

.1وصف مركز التوزيع أى القيمة التى تميل البيانات أن تتركز حولها .

ويطلق على المؤشرات العددية لقياس مركز البيانات بمقاييس النزعة .Averagesالمركزية أو مقاييس المركز أو المتوسطات

.2 وصف بعض مواضع التوزيع البعيدة عن المركز والتى لها طبيعة

خاصة ويطلق على المؤشرات العددية لقياس هذه المشاهدات بالكسيرات Fractiles .

والكسيرات معاا ( المتوسطات ) ويطلق على مقاييس النزعة المركزية .Measures of Locationبمقاييس الموضع

األساليب االحصائية للتحليل االستكشافي: ثانياا

مقاييس الموضع: اوالا

.مركز البيانات والمشاهدات البعيدة عن المركز بشكل عددىصف ت1.

المقارنة بين البيانات وأى مجموعة أخرى من البيانات بشكل أكثر دقة 2.

وموضوعية بدالا من االعتماد على التوزيعات التكرارية والتى يعتمد . إنشاءها جزئياا على رأى الباحث الشخصى

.البياناتتساعد هذه المقاييس فى قياس التشتت فى 3.

.االلتواءتساعد هذه المقاييس فى تحديد اتجاه ودرجة 4.

أحد وسائل التحليل -تساعد هذه المقاييس فى رسم الصندوق والشعيرات 5. .الشاذةواكتشاف القيم -االستكشافى للبيانات

يمكن حسابها دائماا ألى عدد من المشاهدات بعكس التوزيع التكرارى الذى 6. .يفترض وجود عدد كبير من المشاهدات

.أكثر فائدة من التوزيع التكرارى فى مرحلة التحليل اإلحصائى7.

أهمية مقاييس الموضع

التى عرفها اإلنسان ( المتوسطات)من أقدم مقاييس النزعة المركزية

ويمكن االستدالل تاريخياا على أن استخدامه يعود على األقل فهماا، وأسهلها

.للقرن الخامس قبل الميالد

( تكراراا )يعرف المنوال للمتغير النوعى بأنه الوجه األكثر شيوعاا : تعريف

.فى البيانات

ويمكن التعرف على منوال المتغير النوعى فى مجموعة من البيانات وذلك

بتنظيم البيانات فى جدول تكرارى ثم تحديد الوجه الذى يناظر أكبر تكرار

.المنوالفيكون هو

ويتميز المنوال باآلتى:

.ابسط مقاييس النزعة المركزية فهماا وال يحتاج إلى حسابات1.

.الوحيد الذى يمكن التعرف عليه للبيانات االسميةالمتوسط 2.

.ال يتأثر بالقيم الشاذة3.

كثر من منوال قد يساعد على اكتشاف عدم تجانس البيانات وبالتالى إمكانية أوجود 4.

Modeالمنوال

أساسيين لتعريف الوسيط همامفهومين هناك:

50من القيم وتزيد عن %50البحث عن القيمة التى تقل عن%

وبالرغم من إمكانية إيجاد هذه القيمة للعديد من . من هذه القيم

البيانات إال أنه ال يمكن إيجادها للعديد من البيانات األخرى خاصة

إذا كان عدد البيانات فردى مثل مجموعة البيانات

1, 3, 4, 8, 9 .

البحث عن القيمة التى تقسم البيانات إلى قسمين بحيث أن عدد

القيم التى تقل عن هذه القيمة يساوى عدد القيم التى تزيد عن

كوسيط 4وبالتالى يمكن اعتبار القيمة الوسطى . هذه القيمة

.للبيانات السابق ذكرها

Medianالوسيط

عند التعامل مع بيانات المتغير المتصل من المتوقع الحصول على

قيم مختلفة خاصة إذا أستخدم مستوى مناسب من الدقة فى

.وبالتالى يسهل إعطاء تعريف للوسيط فى هذه الحالة. القياس

يعرف وسيط المتغير المتصل بأنه القيمة التى تقسم : تعريف

البيانات إلى قسمين بحيث أن عدد القيم التى تقل عن الوسيط

.يساوى عدد القيم التى تزيد عن الوسيط

ويكون ( أو تنازلياا ) وإليجاد قيمة الوسيط ترتب القيم تصاعدياا

الوسيط هو القيمة الوسطى إذا كان عدد البيانات فردى ، والوسط

.الحسابى للقيمتين الوسطيتين إذا كان عدد البيانات زوجى

وسيط المتغير المتصل

الوسيط باآلتى يتميز:

سهولة الفهم ويمكن التعرف عليه للبيانات الترتيبية .

دائماا موجود ألى بيانات كمية .

يمكن التعرف عليه بسهولة إذا كان عدد المشاهدات صغيراا.

ال يتأثر كثيراا بالقيم الشاذة أو المتطرفة .

يمكن إيجاده بدون معرفة بعض القيم الحقيقية إذا كان ترتيب هذه القيم . معروفاا

يمكن إيجاده من الجداول التكرارية المفتوحة دون الحاجة إلى قفل . الفئات

مزايا وعيوب الوسيط

ويعاب على الوسيط ما يلى:

ليس وحيداا بمعنى أنه قد يكون هناك أكثر من وسيط لنفس البيانات.

يحتاج دائماا إلى ترتيب البيانات ، وقد تحتاج هذه العملية وقتاا طويالا خاصة .إذا كانت البيانات غير مبوبة فى جدول تكرارى وعددها كبير

يتأثر بموقع القيم فى الترتيب وليس بحجمها باستثناء قيمة واحدة أو أثنين .على األكثر وهذا يقلل من كفاءته كمقياس للنزعة المركزية

قليل االستخدام فى التحليل اإلحصائى نظراا لقلة كفاءته .

كفاءته أقل كمقياس للمركز عند التعامل مع البيانات المتقطعة.

قيمته ال تعتمد على نمط توزيع البيانات التى تقل أو تزيد عنه ، وبالتالى فإن

مجرد معرفة الوسيط قد ال يمدنا بمعلومات كافية إال إذا كان شكل المنحنى .التكرارى معروفاا

مزايا وعيوب الوسيط

ويعتبر الوسط الحسابى أكثر مقاييس المركز شيوعاً واستخداماً خاصة فى الدراسات

التحليلية ألنه أكثر كفاءة من الوسيط والمنوال حيث يعتمد حسابه على الحجم الفعلى لجميع

.البيانات المتاحة

الحسابىالصيغة الحسابية اآلتية للوسط:

يعرف انحراف القيمة عن الوسط الحسابى بأنه الفرق بين هذه القيمة والوسط : تعريف

الحسابى

يعرف الوسط الحسابى للقيم : تعريفx1 , x2 , ... , xn القيم أى لهذه بأنه نقطة االتزان

.القيمة التى تجعل مجموع انحرافات القيم عنها يساوى الصفر

الوسط الحسابى

ينفرد الوسط الحسابى من بين مقاييس النزعة المركزية بإمكانية حساب

الوسط الحسابى العام لمجموعة كبيرة من البيانات باستخدام األوساط

.الحسابى للمجموعات الجزئية التى تتكون منها هذه المجموعة الكبيرة

لثالث مجموعات من البيانات العامحساب الوسط الحسابى:

الوسط الحسابى العام لألوساط الحسابية

تعتمد فكرة الكسيرات األساسية على تقسيم البيانات المرتبة

فإذا كان عدد هذه . إلى عدة أقسام متساوية من حيث العدد

األقسام أربعة سميت الكسيرات بالربيعات ، وإذا كان عدد

األقسام خمسة سميت بالخميسات ، وإذا كان عددها عشرة

سميت بالعشيرات ، بينما إذا كان عددها مائه سميت

.بالمئينات

Fractilesالكسيرات

التطبيقيةتعتبر الربيعات أهم الكسيرات على اإلطالق نظراً لعظم أهميتها .

يعرف الربيع األول : تعريفFirst Quartile المتصلة )للمتغيرات الكمية

بأنه القيمة التى تقسم البيانات إلى قسمين بحيث أن ( والمتقطعة

25نسبة القيم التى تقل عن هذه القيمة تساوى أو تقل عن%

75نسبة القيم التى تزيد عن هذه القيمة تساوى أو تقل عن% .

ويطلق على الوسيط عادًة الربيع الثانىSecond Quartile ويصف الربيع األول

مركز النصف األصغر من البيانات ، ويصف الربيع الثالث مركز النصف األكبر من

.ككلالبيانات ، بينما يصف الربيع الثانى أو الوسيط مركز البيانات

Quartilesالربيعات

البيانات المرتبة إلى خمس أقسام متساوية من حيث العدد عن طريق تقسيمأو إلى عشرة أقسام متساوية عن طريق العشيرات Quintilesالخميسات

Deciles أو إلى مائة قسم عن طريق المئيناتPercentiles .

من البيانات ، ويعرف %20الخميس األول بأنه القيمة التى يقل عنها تعريف

وهكذا حتى نصل ... من البيانات %40الخميس الثانى بأنه القيمة التى يقل عنها

.من البيانات %80إلى الخميس الرابع والذى يعرف بأنه القيمة التى يقل عنها

البياناتمن %10يمكن تعريف العشير األول بأنه القيمة التى يقل عنها بالمثل ،

وهكذا ... من البيانات %20ويعرف العشير الثانى بأنه القيمة التى يقل عنها

من %90حتى تصل إلى العشير التاسع والذى يعرف بأنه القيمة التى يقل عنها

. البيانات

من البيانات ، ويعرف %1األول فيعرف بأنه القيمة التى يقل عنها أما المئين

وهكذا حتى نصل ... من البيانات %2المئين الثانى بأنه القيمة التى يقل عنها

من %99إلى المئين التاسع والتسعين والذى يعرف بأنه القيمة التى يقل عنها

.البيانات

الخميسات والعشيرات والمئينات

بعض المقاييس االحصائية الكمية لألرباح (الف جنيه)

mean p25 p50 p75 sd min max skewness kurtosis

Food products 1525.8 20.6 49.8 142.1 18682.2 -193294 703751 21.3 638

Garment Industry 1809.1 9.9 18.3 39.6 58062.7 -18642 3219453 54.3 3003

Food & Beverages 294 14.5 28.4 56.7 5251.6 -1349 353419 40.2 2106.9

Total 894.7 14.6 30.5 73.7 24566.8 -193294 3219453 105 13390.7

لعدد العمال بالمنشاتبعض المقاييس االحصائية الكمية

(عاملالف )

Food products

Garment Industry

Food & Beverages Total

mean 30.8 33.1 5.6 17.4 p25 4 1 2 2 p50 7 2 3 4 p75 11 5 5 8 sd 166.5 202.6 29.9 123.1 min 1 1 1 1 max 5432 5460 2255 5460 skewness 15.1 13.1 46.8 20.6 kurtosis 324.1 242.4 2955.1 606.4

تلعب مقاييس التشتت دور هام كما يلي:

تلخيص المالمح الرئيسية للبيانات فى عدد محدود من المقاييس 1. .العددية

مقارنة المالمح الرئيسية لعدة مجموعات مختلفة بشكل أكثر دقة 2. .وموضوعية

يمكن حسابها إذا كان عدد المشاهدات صغيراا على عكس التوزيع 3. .التكرارى الذى يتطلب إنشائه عدداا كبيراا من المشاهدات

يمكن حساب هذه المؤشرات عادة بشكل أسرع وأسهل من إنشاء 4. .التوزيع التكرارى

.الدور الهام الذى تلعبه هذه المقاييس فى مرحلة التحليل اإلحصائى5.

مقاييس التشتت: ثانياا

يعتبر المدى من أبسط مقاييس التشتت ويستخدم رغم ذلك فى العديد من

التطبيقات العملية مثل مراقبة جودة اإلنتاج ودراسة استقرار سوق المال

:يلىوالتطبيقات الصحية ويعرف كما

يعرف مدى مجموعة من القيم بأنه الفرق بين أكبر قيمة : تعريف

وأصغر قيمة ، وفى حالة البيانات المبوبة يعرف بأنه الفرق بين مركز

.آخر فئة ومركز أول فئة

عيوب المدي:

. يعتمد فى حسابه على قيمتين فقط ويهمل باقى القيم1.

.يعتمد على القيم الشاذة أو المتطرفة2.

ال يعطى فكرة دقيقة عن اختالف القيم عن بعضها البعض وال يعطى أى فكرة 3. .عن توزيع القيم حول مركزها

.ال يمكن حسابه من الجدوال التكرارية المفتوحة من أحد الطرفين أو كالهما4.

المدى : مقاييس التشتت

المدى الربيعى ـ كمقياس للتشتت ـ العيب األساسى للمدى وهو اعتماده على يعالج

القيم الشاذة والمتطرفة وذلك عن طريق ترتيب المشاهدات ثم حذف ربع .المشاهدات من الطرفين وحساب المدى للقيم الباقية

المدى الربيعى : تعريفQR هو الفرق بين الربيع الثالثQ3 والربيع األولQ1

أنأى

Q1 - Q3 = QR

ويتميز المدى الربيعى بما يلى:

سهل الحساب والتفسير .

يمكن حسابه من الجدوال التكرارية المفتوحة من أحد الطرفين أو كالهما

Quartile Rangeالمدى الربيعى

تقوم فكرة حساب االنحراف المتوسط على إيجاد القيم المطلقة النحرافات القيم عنمركزها أى إهمال إشاراتها ، ثم حساب الوسط الحسابى للقيم المطلقة لالنحرافات

.كمقياس للتشتت

لحساب االنحراف المتوسط نتبع الخطوات اآلتية:

(.أو وسيط البيانات ) نوجد الوسط الحسابى 1.

(.أو عن الوسيط ) نوجد انحرافات القيم عن وسطها الحسابى 2.

وذلك بإهمال 2نوجد القيم المطلقة لالنحرافات المحسوبة فى 3. .اإلشارة

فنحصل على 3حساب الوسط الحسابى لالنحرافات المطلقة فى 4. .االنحراف المتوسط

Mean Deviation (.M.D)المتوسط االنحراف

بأنه الوسط الحسابى للقيم المطلقة يعرف االنحراف المتوسط للبيانات الخامتعريف :

ويتم حسابه بالصيغة اآلتية: النحرافات البيانات عن الوسط الحسابى

M Dx x

n

i

i

n

.

1

التباين هو الوسط الحسابى لمربعات انحرافات القيم عن وسطها : تعريف

: صيغة حسابهالحسابى ،

يعرف االنحراف المعيارى بأنه الجذر التربيعى للوسط الحسابى : تعريف

. الحسابىلمربعات انحرافات القيم عن وسطها

Standard Deviation (s)االنحراف المعيارى

:ولحساب االنحراف المعيارى نتبع الخطوات اآلتية نوجد الوسط الحسابى للبيانات ، ثم نوجد انحرافات القيم عن هذا الوسط. نوجد مربعات انحرافات القيم عن وسطها الحسابى. نوجد الوسط الحسابى لمربعات انحرافات القيم عن وسطها الحسابى فنحصل على

.التبايناالنحراف المعيارى هو الجذر التربيعى للتباين.

بأنه النسبة بين المدى الربيعى يعرف معامل االختالف الربيعى: تعريف :ومجموع الربيعين األول والثالث وتأخذ صيغة حسابه الشكل التالى

النسبة بين المدى الكسيرى ومجموع وهمعامل االختالف الكسيرى

الكسيرين المستخدمين فى حساب المدى الكسيرى وتأخذ صيغة حسابه

:الشكل التالى

حيثr رتبة الكسير األول

معامالت االختالف

Q Q

Q Q

3 1

3 1

الربيعىمعامل االختالف 100

P P

P P

r r

r r

100

100

معامل االختالف الكسيرى 100

يعرف معامل االختالف النسبى: تعريف Relative Variation Coefficient

وتأخذ صيغة حسابه X والوسط الحسابى sبأنه النسبة بين االنحراف المعيارى

:التالىالشكل

معامالت االختالف: ت

معامل االختالف النسبى s

x100

خصائص معامل االلتواء الجيد:

ال تتغير قيمته بإضافة أو طرح قيمة ثابتة من المتغير.

(1-) تتغير إشارة المعامل وال تتغير قيمته الحسابية عند ضرب المتغير فى.

يجب أن تكون قيمته صفرا إذا كان التوزيع متماثال.

تتناسب قيمة معامل االلتواء طرديا مع درجة االلتواء أو شدته

تعريف االلتواء

التوزيع التكراري المتماثل ما كانت تكراراته موزعة توزيعاا متماثالا حول وسطه

الحسابي بما يعني قيم المتغير المتساوية البعد عن الوسط الحسابي لها نفس التكرار

موجب )فالتواء توزيع يعني مدى بعده عن التماثل وقد يكون االلتواء جهة اليمين

.( سالب االلتواء)أو االلتواء جهة اليسار ( االلتواء

متماثل، وبافتراض أن هذه األشكال تمثل درجات 3التواء جهة اليسار ، الشكل 2التواء جهة اليمين ، الشكل 1الشكل

يعني عدد كبير من الطالب حصلوا على درجات أقل من المتوسط بمعنى أن مستوى 1طالب في امتحان ما، ففي الشكل

حيث يبن أن عدد كبير من 2الطالب أقل من مستوى االمتحان أو أن االمتحان صعب في حين العكس تماماا في الشكل

الطالب حصلوا على درجات أكبر من المتوسط أي أن مستوى الطالب أعلى من مستوى االمتحان أو أن االمتحان سهل

.الطالب مناسب لمستوى االمتحانيعنى مستوى 3في حين الشكل

:يقاس االلتواء بأحد المقياسين اآلتيين

أشكال االلتواء

وهي مقاييس نسبية يمكن استخدامها للمقارنة بين التواء التوزيعات كما أن قيمة مقياس االلتواء محصورة

السالبة تعني االلتواء جهة اليسار والقيمة الموجبة تعني االلتواء جهة اليمين والقيمة فالقيمة i+3 ، – 3بين

(.التوزيع متماثل)صفر تعني عدم وجود التواء أو التماثل

معامل االلتواء

(عدد سالب)=

التوزيع ملتوي التواء سالب اتجاه اليسار

(صفر= )

التوزيع متماثل

(عدد موجب)=

التوزيع ملتوي التواء موجب اتجاه اليمين

:يلىبعد حساب معامل االلتواء يمكن معرفة تماثل أو التواء التوزيع كما ، ويدل ذلك على أن منحنى التوزيع التكراري (ks=0)االلتواء عاملمقيمة تكان( المنوال=الوسيط = الوسط الحسابي )إذا كان -

.متماثل، ويدل ذلك على أن منحنى التوزيع التكراري (+=ks)االلتواء عاملمقيمة تكان( المنوال<الوسيط < الوسط الحسابي )إذا كان -

.ملتوي جهة اليمين ، ويدل ذلك على أن منحنى التوزيع التكراري (-=ks) االلتواء عاملمقيمة تكان( المنوال >الوسيط > الوسط الحسابي )إذا كان -

.ملتوي جهة اليسار

ملخص معامل االلتواء

Kurtosis التفرطح

في قمة المنحنى مقارنة بقمة ( االنخفاض أو االرتفاع ) مقدار التدبب يقصد بالتفرطح

:منحنى التوزيع الطبيعي

.في حالة التوزيع الطبيعي المعتدل 3وتكون قيمة معامل التفرطح تساوى

(:مقارنة بالمنحنيات المعتدلة)ثالثة أنواع للمنحنيات التكرارية التفرطح Mesokurtic ( Norma( ) معتدل)متوسط التفرطح ( 1 معظم القيم بالقرب من الوسط الحسابي والذيلين (Leptokurticمدبب (2

القيم بعيدة عن الوسط والذيلينمعظم ( Platykurticمفرطح ( 3

:يحسب من الصيغة الرياضية

التفرطح

شكل يوضح

أشكال

المختلفة

للمنحنيات

معامل التفرطح

3أقل من

منحنى التوزيع مفرطح

3يساوى

منحنى التوزيع معتدل

3من أكبر

منحنى التوزيع مدبب

منحنى مدبب

منحنى مفرطح

تستند فكرة المعايرةStandardization فى اإلحصاء على

توحيد المقارنة بين القيم وذلك بعزل أو تنحية أثر اختالفات

المركز والتشتت بين القيم موضع المقارنة ، بحيث يسهل

ويتم عادة عزل . Pure Valuesالمقارنة بين القيم الصافية

فى اإلحصاء بطرح قيمه المركز levelالمركز أو مستوى القيم

عادة Variationالمناسب من البيانات ، كما يتم عزل التشتت

.بقسمة البيانات على مقياس التشتت المناسب

Standardized Valuesالقيم المعيارية

التوزيعات المتماثلة: الحالة األولى

يمكن تعريف القيمة المعيارية ، وتسمى فى هذه الحالة : تعريفZ - Score لمشاهدة معينة بأنها عدد االنحرافات المعيارية التى تبعد بها ،

, x1 , x2فإذا كان لدينا المشاهدات . هذه المشاهدة عن الوسط الحسابى.....,xn ورمزنا للوسط الحسابى واالنحراف المعيارى بالرمزينX-bar

xiعلى الترتيب فان القيمة المعيارية أو الوحدة المعيارية للمشاهدة Sو

: هى

القيم المعيارية: تابع

الملتويةالتوزيعات : الحالة الثانية

فى حالة -يمكن تعريف القيمة المعيارية لمشاهدة معينة : تعريف

بأنها عدد وحدات المدى الربيعى التى تبعد بها هذه -البيانات الملتوية ، x1 , x2 , ...... , xnفإذا كان لدينا المشاهدات . المشاهدة عن الوسيط

على الترتيب IQR , mورمزنا للوسيط والمدى الربيعى بالرمزين

:هى xiفإن القيمة المعيارية للمشاهدة

القيم المعيارية: تابع

يمكن تعريف القيم الشاذة بأنها القيم التى تختلف اختالفا : تعريف

.ملحوظا عن معظم القيم األخرى

وتحدث القيم الشاذة عادة نتيجة ألحد األسباب اآلتية:

أخطاء فى تسجيلRecording البيانات.

أخطاء تحدث عند إدخال البياناتData Entry إلى الكمبيوتر.

اختالف الظروف التى تم فيها الحصول على هذه البيانات عن الظروف .التى تم فيها الحصول على باقى البيانات

Detecting Outliers اكتشاف القيم الشاذة

يمكن االعتماد على شكل النقاطDot Plot أو األغصان واألوراق

Stem and Leaf الكتشاف مثل هذه القيم بشكل تقريبى ، إال أنه

يفضل استخدام المؤشرات التى تستخدم مقاييس المركز والتشتت

.الكتشاف مثل هذه القيم

ويفضل بصفة عامة الستخدام المؤشرات التى تعتمد على الوسط

الحسابى واالنحراف المعيارى الكتشاف القيم الشاذة إذا كان توزيع

البيانات متماثال أو قريبا من التماثل ، بينما يفضل استخدام المؤشرات

التى تعتمد على الربيعات والمئينات أو الكسيرات بصفة عامة إذا كان .توزيع البيانات ملتويا

طرق اكتشاف القيم الشاذة

المتماثلةالتوزيعات : األولى الحالة

ولكن ليس -إذا كان توزيع البيانات متماثال أو قريبا من التماثل

فإنه من الممكن -له خصائص التوزيع الطبيعى األخرى

استخدام متبانية تشيبتشف التى سبق أن أشرنا إليها فى الفصل

تقع داخل المدى ، %94السابق والتى تنص على أن أكثر من

وبالتالى يمكن اعتبار أى مشاهدة تقع خارج هذا المدى بأنها

مشاهدة غير عادية أو شاذة ، كما يمكن اعتبار أى مشاهدة تقع Very Unusualخارج المدى بأنها مشاهدة غير عادية جدا

.Extremeأو متطرفة

طرق اكتشاف القيم الشاذة

الملتويةالتوزيعات : الحالة الثانية

طريقة توكىTukey

وتعتمد هذه الطريقة أساسا على الربيع األولQ1 والربيع الثالثQ3

الصورة األولى . ويأخذ عادة صورتين مختلفتين IQRوالمدى الربيعى

ويمكن تعريف حديه األدنى Inner Fenceوتسمى بالسياج الداخلى

:واألعلى كما يلى

LIF = Q1 - 1.5 IQR

UIF = Q3 + 1.5 IQR

حيث ترمزLIF إلى الحد األدنى للسياج الداخلىLower Inner Fence

Upper Innerإلى الحد األعلى للسياج الداخلى UIF، بينما ترمز Fence . وبالتالى تعتبر القيمة الشاذة إذا وقعت خارج حدود السياج

.( LIF , UIF )الداخلى

طرق اكتشاف القيم الشاذة

أما الصورة الثانية وتسمى بالسياج الخارجىOuter Fence فتأخذ نفس صورة السياج الداخلى مع

، (IQR 1.5)بدال من استخدام ( IQR 3)استخدام

وبالتالى تعتبر القيمة متطرفة إذا وقعت خارج حدود .(LOF , UOF )السياج الخارجى

طرق اكتشاف القيم الشاذة

الصندوق والشعيراتBox - and-Wisker Plot

اعتمدت بعض الوسائل الحديثة فى عرض البيانات بغرض Exploratory Dataالتحليل االستكشافى للبيانات

Analysis ( EDA) على مقياس توكى ، ومن أهم هذه

وهو شكل Box - Plotالوسائل الصندوق والشعيرات

بيانى يوضح المدى الذى تنتشر عليه البيانات ونمط

االختالف ودرجة التماثل أو االلتواء فى توزيع البيانات

.وكذلك فى توزيع النصف األوسط للبيانات

طرق اكتشاف القيم الشاذة

يعرف االرتباط بين متغيرين بأنه درجة العالقة بين المتغيرين: تعريف.

عن قوة العالقة -بصرف النظر عن اإلشارة -االرتباط معامل تعبر قيمة

بين المتغيرين ورغم أنه ال توجد عالقة محددة لوصف درجة العالقة بين

المتغيرين بناء على قيمة معامل االرتباط إال أنه يمكن استخدام بعض

فإذا كانت قيمة معامل . المؤشرات التقريبية للحكم على درجة هذه العالقةدل ذلك على ضعف العالقة بينما إذا كانت قيمته (0,0.5)االرتباط تقع بين

وتنعدم العالقة بين المتغيرين . دل ذلك على قوة هذه العالقة (0.5,1)تقع بين

إذا كان معامل االرتباط صفرا ، بينما تدل القيمة واحد لمعامل االرتباط على

وتدل إشارة معامل االرتباط عادة على . وجود عالقة تامة بين المتغيرين

اتجاه العالقة بين المتغيرين ، فإذا كانت اإلشارة موجبة دل ذلك على وجود عالقة طردية بين المتغيرين

Correlation االرتباطمعامل

االنتشارشكل Scatter Plot

ويتم رسم شكل . يعتبر شكل االنتشار من أهم وسائل فحص العالقة بين متغيرينوالمتغير الثانى على Xاالنتشار بالتعبير عن أحد المتغيرين على المحور األفقى

بنقطة على الخريطة ) ( حيث يعبر عن كل زوج من أزواج القيم Yالمحور الرأسى

(.الفراغ الثنائى)البيانية

ويعطى شكل االنتشار صورة تقريبية عن قوة واتجاه العالقة بين المتغيرين ، ذلك أنهفكلما تجمعت X ،Yلو تصورنا أن هناك خط مستقيم يمثل العالقة بين المتغيرين

واقتربت البيانات من هذا الخط أو بمعنى آخر كلما اقتربت نقط الشكل من الخط

المستقيم كلما زادت قوة االرتباط الخطى حتى إذا وقعت كلها على الخط المستقيم كان ، Xالممثل للعالقة بين المتغيرين ) ويحدد ميل الخط المستقيم . هناك ارتباط خطى تام

Y ) اتجاه العالقة بين المتغيرين ، فإذا كان ميل الخط موجب كانت العالقة بين

.المتغيرين طردية والعكس صحيح

االرتباط بين المتغيرات الكمية

:اشكال االنتشار

بين المتغيرين يعرف التغاير: تعريفX, Y بأنه الوسط الحسابى لحاصل ضرب

عن وسطها الحسابى Y عن وسطها الحسابى فى انحرافات قيم Xانحرافات قيم

:أنأى

ويدل التغاير بين المتغيرينX , Y على اتجاه العالقة بينهما ، فإذا كان موجباً تكون

العالقة طردية ، وإذا كان سالباً تكون العالقة عكسية أما إذا كان التغاير صفرا .فليس هناك عالقة خطية بين المتغيرين

Covarianceالتغاير

يعرف معامل ارتباط بيرسون : تعريفr لالرتباط الخطى بين المتغيرين

X , Y يلىكما :

على فإن معامل ارتباط بيرسون لالرتباط الخطى يمكن كتابته وبالتالى

: الصورة

Pearson'sبيرسون لالرتباط معامل Correlation Coefficient

ويتميز معامل بيرسون لالرتباط الخطى بالخصائص اآلتية:

.(1,1-)يتراوح بين 1.

.ال يعتمد على وحدات قياس المتغيرين2.

ال يتأثر إذا أضيف أو طرح رقم ثابت للمتغيرين بمعنى أن معامل 3. X+k هو نفسه معامل االرتباط بين X , Yاالرتباط بين المتغيرين

,Y+c حيث ،k , c ثوابت.

ال تتأثر قيمة معامل االرتباط عند ضرب أحد المتغيرين أو كالهما فى 4.هو نفسه X , Yرقم ثابت بمعنى أن معامل االرتباط بين المتغيرين

.ثوابت k , cحيث kX , cYمعامل االرتباط بين المتغيرين

معامل بيرسون لالرتباط الخطى خصائص

Correlation coefficients empl profit1 netind~x netva totva outputfc totwage totsales totprod

empl 1

profit1 0.2 1 netindtax 0.0 0.0 1

netva 0.3 1.0 0.0 1

totva 0.3 1.0 0.0 1.0 1 outputfc 0.6 0.7 0.1 0.7 0.8 1 totwage 0.8 0.2 0.1 0.3 0.4 0.7 1 totsales 0.6 0.5 0.1 0.6 0.6 1.0 0.7 1 totprod 0.6 0.7 0.1 0.7 0.8 1.0 0.7 1.0 1

شكرا لحسن استماعكم