บทที่ 3 การวิเคราะห ์ความ ...46 10 15 20 25 30 35 40 30 20...
TRANSCRIPT
บทท 3 การวเคราะหความเหมาะสมของตวแบบ
การวเคราะหการถดถอยเชงเสนอยางงายมประโยชนและมการใชกนอยางแพรหลาย
ในงานวจยแตการทจะใชตวแบบการถดถอยใหมความถกตองและมอานาจการทดสอบทสงนน ตวแบบจาเปนตองเปนไปตามขอตกลง (assumption) ขอตกลงทกาหนดไวม 5 ขอ (Montgomery & Peck, 1992, p. 7) ดงนคอ
1. ความสมพนธระหวางตวแปร X และ Y เปนเสนตรงหรอมแนวโนมเปนเสนตรง 2. ความคลาดเคลอน () มคาเฉลยเทากบ 0 3. ความคลาดเคลอน () มความแปรปรวนคงทเทากบ 2 4. ความคลาดเคลอนแตละคาเปนอสระตอกน 5. ความคลาดเคลอนมการแจกแจงแบบปกต ขอตกลงดงกลาวมความจาเปนอยางยงโดยเฉพาะในการทดสอบสมมตฐานและ
การประมาณคาพารามเตอรตางๆ หากตวแบบไมเปนไปตามขอตกลงแลวอาจทาใหการตดสนใจผดพลาดได เนองจากคาประมาณของความคลาดเคลอนคอสวนเหลอ (residual หรอ e) ซงสวนเหลอสามารถคานวณไดดงน
iii YYe ˆ (3.1) หากตวแบบการถดถอยทไดไมเปนไปตามขอตกลงแลวจะพบวาสวนเหลอจะเบยงเบนไป
จากขอตกลง ดงนนการวเคราะหสวนเหลอจงเปนการวเคราะหตวแบบทงายและมประโยชนมาก
3.1 คณสมบตของสวนเหลอ เนองจากขอตกลงของการใชสมการถดถอยกลาววาความคลาดเคลอนมการแจกแจงแบบปกตทมคาเฉลยเทากบ 0 และความแปรปรวนคงทและความคลาดเคลอนแตละคาเปนอสระตอกนดงนนสวนเหลอมคาเฉลยเทากบ 0 หรอ
01
n
e
e
n
ii
(3.2)
44
และความแปรปรวนของสวนเหลอคอ
MSEn
SSE
n
e
n
een
ii
n
ii
222
)(1
2
1
2
(3.3)
เนองจากองศาเสรเทากบ n – 2 แสดงวาสวนเหลอไมเปนอสระตอกนท งนเนองจาก สวนเหลอมาจากคาพยากรณ ( Y ) และคาพยากรณมการประมาณคา 2 คาคอ b0 และ b1 ดงน น สวนเหลอจงสญเสยความเปนอสระไป 2 คาเชนเดยวกบคาพยากรณ Montgomery และ Peck (1992) หนา 68 กลาววาหากขอมลมขนาดใหญพอแลวตวแบบจะไดรบผลกระทบเพยงเลกนอยจากการทสวนเหลอไมเปนอสระตอกน และหากจานวนขอมลมขนาดใหญมากเมอเทยบกบจานวนตวแปรอสระแลวตวแบบจะไดรบผลกระทบเพยงเลกนอยเชนกน เมอคาความแปรปรวนของสวนเหลอเพมมากขนความถกตองในการพยากรณจะลดลง (Freund, Wilson, & Sa, 2006, p. 43) ในบางกรณสวนเหลอมาตรฐาน (standardized residual) จะมประโยชนอยางมากใน การวเคราะหและการตความหมายโดยเฉพาะอยางยงในการวเคราะหการถดถอยพห สวนเหลอมาตรฐานไดจากการหารสวนเหลอดวยคาสวนเบยงเบนมาตรฐานทาใหสวนเหลอเปนคาทไมมหนวยโดยมคาเฉลยเทากบ 0 และสวนเบยงเบนมาตรฐานเทากบ 1
MSE
ee i
i * (3.4)
สวนเหลอปรบแลว (studentized residual) เปนอกรปแบบของสวนเหลอทมความสาคญและใชกนมากในการวเคราะหตวแบบ สวนเหลอปรบแลวจะหารดวยความแปรปรวนของ สวนเหลอแตละคาในขณะทสวนเหลอมาตรฐานจะหารดวยความแปรปรวนรวม
xx
i
ii
S
xX
nMSE
ee
2)(11
(3.5)
การใชขอมลจานวนนอยนนจะทาใหสวนเหลอแตละคามความแปรปรวนทตางกนมาก การหารดวยความแปรปรวนรวมจงอาจไมเหมาะสมดงนนการใชสวนเหลอปรบแลวจะเหมาสมกวาการใช สวนเหลอมาตรฐาน แตเมอขนาดตวอยางใหญขนความแปรปรวนของสวนเหลอแตละคาจะ
45
ไมแตกตางกนมากดงนนการใชสวนเหลอมาตรฐานหรอสวนเหลอปรบแลวจะใหผลทไมแตกตางกนมาก
3.2 การวเคราะหสวนเหลอ การวเคราะหสวนเหลอสามารถทาได 6 แบบหลกคอ
1. ฟงกชนการถดถอยไมเปนเสนตรง 2. สวนเหลอมความแปรปรวนทไมคงท 3. สวนเหลอไมเปนอสระตอกน 4. การมคาผดปกต (outlier) 5. สวนเหลอมการแจกแจงทไมเปนปกต 6. ตวแปรอสระทสาคญบางตวไมถกรวมเขาในการสรางตวแบบถดถอย การตรวจสอบขอตกลงของความคลาดเคลอนจงทาไดโดยการตรวจสอบจากสวนเหลอ
การตรวจสอบขอตกลงอยางงายคอการวาดแผนภาพกระจายของสวนเหลอและพจารณาวาเปนไปตามขอตกลงหรอไม แตบางครงแผนภาพกระจายทไดอาจไมชดเจนเพยงพอทจะใชในการพจารณาได การวาดแผนภาพกระจายเพอตรวจสอบ 6 รปแบบดงกลาวสามารถวาดไว 7 ลกษณะดงน
1. แผนภาพกระจายระหวางสวนเหลอกบตวแปรอสระ (ภาพท 3.1) 2. แผนภาพกระจายระหวางคาสมบรณของสวนเหลอหรอคาสวนเหลอกาลงสองกบ
ตวแปรอสระ (ภาพท 3.2) 3. แผนภาพกระจายระหวางสวนเหลอกบคาพยากรณ (ภาพท 3.3) 4. แผนภาพกระจายระหวางสวนเหลอกบเวลา (ภาพท 3.4) 5. แผนภาพกระจายระหวางสวนเหลอกบตวแปรอสระทไมไดรวมอยในตวแบบ 6. แผนภาพกลอง (box plot) ของสวนเหลอ (ภาพท 3.5) 7. แผนภาพกระจายแบบปกต (normality probability plot) ของสวนเหลอ (ภาพท 3.6)
ภาพท 3.1 – 3.6 ไดจากขอมลในตวอยางท 1.1 ทวาดโดยใชโปรแกรม MINITAB
46
353025201510
40
30
20
10
0
-10
-20
-30
-40
x
Res
idu
al
ภาพท 3.1 แผนภาพกระจายระหวางสวนเหลอกบตวแปรอสระ
3 53 02 52 01 51 0
4 0
3 0
2 0
1 0
0
x
ab_r
es
ภาพท 3.2 แผนภาพกระจายระหวางคาสมบรณของสวนเหลอกบตวแปรอสระ
300200100
40
30
20
10
0
-10
-20
-30
-40
Fitted Value
Res
idu
al
ภาพท 3.3 แผนภาพกระจายระหวางสวนเหลอกบคาพยากรณ
47
12108642
40
30
20
10
0
-10
-20
-30
-40
Observation Order
Res
idu
al
ภาพท 3.4 แผนภาพกระจายระหวางสวนเหลอกบเวลา
40
30
20
10
0
-10
-20
-30
-40
RE
SI1
ภาพท 3.5 แผนภาพกลองของสวนเหลอ
403020100-10-20-30-40
2
1
0
-1
-2
Nor
mal
Sco
re
Residual ภาพท 3.6 แผนภาพกระจายแบบปกตของสวนเหลอ
48
3.2.1 ฟงกชนการถดถอยไมเปนเสนตรง ในการทดสอบความเปนฟงกชนเชงเสนตรงสามารถทาไดโดยการวาดแผนภาพกระจายระหวางตวแปรอสระและตวแปรตามแตวธนอาจยากตอการสงเกต แผนภาพกระจายระหวางสวนเหลอกบตวแปรอสระหรอระหวางสวนเหลอกบคาพยากรณจะงายแกการวเคราะหมากกวา หากฟงกชนการถดถอยเปนเสนตรงแลวสวนเหลอจะกระจายรอบคาศนยในแนวนอนหรอกระจายอยางไมเปนระบบหรอไมสามารถหารปแบบได ในกรณของสมการถดถอยเชงเสนอยางงายแลวแผนภาพกระจายของตวแปรอสระกบสวนเหลอจะใหผลเหมอนกบแผนภาพกระจายของ คาพยากรณกบสวนเหลอ
เมอพจารณาแผนภาพกระจายระหวางตวแปร X และ Y ทมความสมพนธเชงเสนโคงกน ดงภาพ 3.7 ก พบวาจดตางๆ มแนวโนมเปนเสนโคงและการกระจายระหวางตวแปร X กบ สวนเหลอในภาพ 3.7 ข จะมลกษณะโคงโดยสวนเหลอจะมคาบวกเมอ X มคานอยและเมอ X มคามากแตจะมคาลบเมอ X มคากลาง ดงนนการใชสมการถดถอยเชงเสนอยางงายจงไมเหมาะกบขอมลชนดน
50403020100
70
60
50
40
30
20
10
0
x
y
50403020100
20
10
0
-10
x
Res
idu
al
ภาพท 3.7 ก การกระจายของ X กบ Y ภาพท 3.7 ข การกระจายของ X กบสวนเหลอ ภาพท 3.8 ก – ง แสดงใหเหนถงความสมพนธของตวแปรอสระกบสวนเหลอในรปแบบตางๆ กน โดยภาพท 3.8 ก เปนรปของความสมพนธเชงเสนตรงของตวแปรอสระและตวแปรตามโดยสวนเหลอมการกระจายตวทสมาเสมอรอบคา 0 สาหรบภาพท 3.8 ข ค และ ง แสดงใหเหนถงความสมพนธระหวางตวแปรทงสองทไมเปนเสนตรง โดยภาพท 3.8 ข แผนภาพกระจายมลกษณะเปนเสนโคงพาราโบลา ภาพท 3.8 ค แผนภาพกระจายมลกษณะเปนรปปากแตรกลาวคอ เมอ X มคาตาแลวความแปรปรวนของสวนเหลอจะนอยและความแปรปรวนของสวนเหลอเพมขนเมอ X มคาเพมขน
xy 04.17.53ˆ
49
ภาพท 3.8 ง แผนภาพกระจายมแนวโนมเพมมากขน เมอ X มคาตาแลวสวนเหลอจะมคาเปนลบและสวนเหลอจะมคาเปนบวกเพมมากขนเมอ X มคาเพมขน
5040302010
10
0
-10
x
Res
idua
l
50403020100
10
0
-10
xR
esi
dua
l
ก ข
5040302010
10
0
-10
x
Res
idua
l
5040302010
10
0
-10
x
Res
idua
l
ค ง
ภาพท 3.8 การกระจายของตวแปรอสระกบสวนเหลอในรปแบบตางๆ 3.2.2 สวนเหลอมความแปรปรวนทไมคงท
การวเคราะหวาสวนเหลอมความแปรปรวนคงทหรอไมสามารถพจารณาจากแผนภาพตางๆ ดงน แผนภาพกระจายระหวางตวแปรอสระกบสวนเหลอ แผนภาพกระจายระหวางคาพยากรณกบสวนเหลอ แผนภาพกระจายระหวางตวแปรอสระกบคาสมบรณของสวนเหลอหรอกบสวนเหลอกาลงสอง แผนภาพกระจายระหวางคาพยากรณกบคาสมบรณของสวนเหลอกบ สวนเหลอกาลงสอง ในภาพท 3.8 ก สวนเหลอมการกระจายตวทสมาเสมอแสดงวาสวนเหลอ มความแปรปรวนทคงท เมอสวนเหลอมความแปรปรวนไมคงทสามารถตรวจสอบไดจากแผนภาพกระจายระหวางตวแปรอสระกบสวนเหลอดงในภาพท 3.8 ค ลกษณะของความแปรปรวนของ สวนเหลอทเพมมากขนเมอตวแปรอสระมคามากขนจะพบไดบอย ลกษณะเชนนเรยก megaphone
50
ตวอยางเชน เมอเดกหญงทมอายเพมมากขน ความดนเลอดจะมความแปรปรวนเพมขน เปนตน (Neter et al., 1996, p. 102) แผนภาพกระจายระหวางตวแปรอสระหรอคาพยากรณกบคาสมบรณของสวนเหลอหรอกบสวนเหลอกาลงสองน นจะมประโยชนมากโดยเฉพาะอยางยงในกรณทขอมลมจานวน ไมมากเนองจากคาสมบรณหรอคากาลงสองนจะทาใหเหนความไมคงทของความแปรปรวน อยางชดเจน
3.2.3 สวนเหลอไมเปนอสระตอกน หากขอมลทนามาวเคราะหมความเกยวของกบเวลา เชน การวดอณหภมของน าใน
ทะเลสาบทกชวโมง เปนตน ขอมลชนดนจะไมเปนอสระตอกน วธการตรวจสอบอยางงายคอ การวาดแผนภาพกระจายระหวางสวนเหลอกบเวลา หากพบวาสวนเหลอมการกระจายทมแบบแผน เชน มแนวโนมทสงขนหรอลดลงดงภาพท 3.9 ก หรอเปนวฏจกรดงภาพท 3.9 ข เปนตน แสดงวาขอมลชดนไมเปนอสระตอกน หากขอมลเปนอสระตอกนแลวแผนภาพทไดน นสวนเหลอควรมการกระจาย ทสมาเสมอรอบคาศนย
151050
5
0
-5
-10
Time order
Res
idua
l
151050
10
0
-10
Timeorder
Res
idua
l
ก ข
ภาพท 3.9 การกระจายของเวลากบสวนเหลอในรปแบบตางๆ
3.2.4 การมคาผดปกต หากขอมลมคาผดปกต (outlier) แลวจะทาใหสวนเหลอมคามากกวาหรอนอยกวา
คาสวนเหลออนๆ ตามไปดวยแตหากคาผดปกตมมากกวา 1 คาและมคาใกลเคยงกนแลวบางครงจะยากแกการตรวจสอบ การตรวจสอบคาผดปกตอยางงายคอ การวาดแผนภาพกระจายระหวาง ตวแปรอสระกบสวนเหลอหรอคาพยากรณกบสวนเหลอ นอกจากนยงสามารถวาดแผนภาพกลอง
51
(box plot) แผนภาพกานและใบ (stem-and-leaf plot) และแผนภาพความนาจะเปนของการแจกแจงแบบปกต (normal probability plot) ของสวนเหลอเพอตรวจสอบคาผดปกตกได วธตรวจสอบทมประสทธภาพวธหนงคอการวาดแผนภาพกระจายของตวแปรอสระกบสวนเหลอมาตรฐาน หากขอมลใดมคาสมบรณของสวนเหลอมาตรฐานทมากกวาหรอเทากบ 4 แลวขอมลน นเปน คาผดปกต เพราะโอกาสทขอมลจะมคาสมบรณมากกวา 3 (หรอมากกวา + 3 ของสวนเบยงเบนมาตรฐาน ) น น มนอยมาก (Neter et al., 1996, p. 103 และ Montgomery & Peck, 1992, p. 80) คาผดปกตจะมผลตอความถกตองของสมการถดถอยและคาพยากรณอยางมากเนองจากสมการถดถอยทไดจากวธกาลงสองนอยทสดนนจะไวตอคาผดปกตดงนนจงจาเปนอยางยงทจะตรวจสอบคาผดปกตโดยเฉพาะอยางยงเมอขอมลมจานวนไมมาก ภาพท 3.10 แสดงใหเหนมขอมลทม คามากกวา 4 อย 1 คาดงนนขอมลนอาจเปนคาผดปกต
3020100
10
9
8
7
6
5
4
3
2
1
0
x
|Sta
ndar
dize
d re
sidu
al|
ภาพท 3.10 แผนภาพกระจายระหวางตวแปรอสระกบคาสมบรณของ สวนเหลอมาตรฐาน คาผดปกตบางครงอาจทาใหสวนเหลอไมเปนไปตามขอตกลงทกาหนดไวหากตด
คาผดปกตนออกไปอาจทาใหสวนเหลอเปนไปตามขอตกลงกได นอกจากนคาผดปกตยงทาให คาสมประสทธการตดสนใจมคาสงขนและคาเฉลยกาลงสองของความคลาดเคลอนมคาลดลงดวย
3.2.5 สวนเหลอมการแจกแจงทไมเปนปกต หากสวนเหลอมการแจกแจงทไมเปนปกตเพยงเลกนอยจะไมมผลกระทบตอ
การวเคราะหโดยใชวธการกาลงสองนอยทสด แตหากสวนเหลอมการแจกแจงทเบยงเบนจาก การแจกแจงปกตมากแลวอาจทาใหผลการวเคราะหผดพลาดได การพจารณาวาสวนเหลอมการแจกแจง
52
ปกตหรอไมอยางงายคอ การใชแผนภมและแผนภาพทมดวยกนหลายประเภท เชน แผนภมฮสโตแกรม แผนภาพกลอง แผนภาพแบบจด (dot plot) และแผนภาพความนาจะเปนของการแจกแจงแบบปกต เปนตน ในการใชแผนภาพความนาจะเปนของการแจกแจงแบบปกตเพอพจารณานนหากจดตางๆเรยงตวกนในเชงเสนตรง 45 องศาแลวสวนเหลอนนมการแจกแจงแบบปกต ภาพท 3.11 แสดง การกระจายตวในแบบตางๆ โดยการใชแผนภาพความนาจะเปนของการแจกแจงแบบปกตทใชโปรแกรม MINITAB วาด โดยรป ก แสดงใหเหนถงการแจกแจงของสวนเหลอทเปนปกตโดย คาสวนใหญอยในแนวเสนตรง 45 องศานอกจากนคา p-value ทไดยงมคามากกวา 0.05 โดยใชวธทดสอบการแจกแจงแบบปกตของ Anderson – Darling แสดงวาสวนเหลอชดนมการแจกแจงแบบปกต สาหรบภาพท 3.11 ข นนสวนเหลอมการแจกแจงแบบเบซายโดยจะเหนวาจดตางๆ มลกษณะโคงทสวนเหลอทมคานอยมความนาจะเปนตากวาทควรจะเปนเชนเดยวกบสวนเหลอทมคามาก แตในขณะทสวนเหลอทมคากลางจะมความนาจะเปนทสงเกนกวาทควรจะเปนซงสอดคลองกบ คา p-value ทต า
P-Value: 0.326A-Squared: 0.412
Anderson-Darling Normality Test
N: 45StDev: 0.846491Average: 0.0511647
210-1
.999
.99
.95
.80
.50
.20
.05
.01
.001
Pro
babi
lity
Residual
Normal Probability Plot
ก
53
P-Value: 0.000A-Squared: 3.581
Anderson-Darling Normality Test
N: 60StDev: 2.64526Average: 2.68691
20-2
.999
.99
.95
.80
.50
.20
.05
.01
.001
Pro
babi
lity
Residual
Normal Probability Plot
ข
ภาพท 3.11 แผนภาพการทดสอบความนาจะเปนของการแจกแจงแบบปกต การตรวจสอบการแจกแจงแบบปกตควรทาการตรวจสอบหลงจากการตรวจสอบและแกไขตามขอ 1 - 4 เสยกอนเนองจากวาบางครงการทแผนภาพแสดงใหเหนวาสวนเหลอไมมการแจกแจงแบบปกตนนอาจมาจากการทสวนเหลอมความแปรปรวนทไมคงทแตเมอมการแกไขแลวสวนเหลออาจมการแจกแจงทปกตกได หากตวอยางมขนาดใหญแลวการทสวนเหลอไมมการแจกแจงแบบปกตจะมผลกระทบตอคาพยากรณของสมประสทธเพยงเลกนอย (Mooi & Sarstedt, 2011, p. 174-175)
3.2.6 ตวแปรอสระทสาคญบางตวไมถกรวมเขาในการสรางตวแบบถดถอย การทตวแปรอสระทสาคญบางตวถกละเลยหรอไมไดนามารวมในการสราง ตวแบบจะทาใหผลการวเคราะหทไดมความผดพลาดและอาจทาใหผลรวมกาลงสองความคลาดเคลอน (SSE) มคาสงเกนกวาทควรจะเปนและสงผลใหไมปฏเสธสมมตฐานในการวเคราะหความแปรปรวนได การทจะทราบวาตวแปรอสระตวใดถกละเลยนนตองมาจากการศกษาจากทฤษฎหรอจากงานวจยทเกยวของมาชวยในการวนจฉย การวเคราะหวาตวแปรอสระตวใดถกละเลยจากตวแบบโดยวธใชแผนภาพน นทาไดโดยการวาดแผนภาพกระจายระหวางตวแปรอสระนนกบ สวนเหลอวามรปแบบทเปลยนไปหรอไม เชน ในการศกษาความเรวในการประกอบชนสวนกบอายงานของพนกงานแหงหนงมแผนภาพกระจายของอายงานกบสวนเหลอดงภาพท 3.12 ก จากนนหากพจารณาแผนภาพแยกตามเพศจะพบวาเพศชายสวนใหญจะมคาสวนเหลอทตากวาคาศนยหรอเพศชายใชเวลาในการประกอบจรงตากวาทตวแบบพยากรณไดดงภาพท 3.12 ข ในขณะทเพศหญง
54
สวนใหญจะมคาสวนเหลอทสงกวาคาศนยหรอเพศหญงใชเวลาในการประกอบจรงสงกวา ทตวแบบพยากรณไดดงภาพท 3.12 ค แสดงวาเพศทงสองมความแตกตางในการทางานดงน น การสรางตวแบบโดยไมคานงถงเพศจะทาใหการพยากรณเวลาทใชผดไปจากความเปนจรงจงควรเพมตวแปรเพศเขาในการสรางตวแบบเพมความถกตองของตวแบบ
121086420
10
0
-10
x
Re
sidu
al
ก แผนภาพทใชขอมลทงสองเพศ
121086420
10
0
-10
x
Re
sidu
al
ข แผนภาพทใชขอมลเฉพาะเพศชาย
55
121086420
10
0
-10
x
Re
sidu
al
ค แผนภาพทใชขอมลเฉพาะเพศหญง
ภาพท 3.12 แผนภาพกระจายระหวางอายงานกบเวลาทใช
3.2.7 การวเคราะหสวนเหลอโดยใชการทดสอบทางสถต
ถงแมวาการใชกราฟหรอแผนภาพในการวเคราะหสวนเหลอนนงายแกการพจารณาแตบางครงอาจยากแกการตดสนใจโดยเฉพาะอยางยงเมอกราฟหรอแผนภาพน นแสดงภาพท ไมชดเจน ดงนนการใชวธทดสอบทางสถตจงจาเปนในกรณท ไมสามารถตดสนใจได การทดสอบทางสถตใหคาทเชอถอไดมากกวา ขอเสยของการทดสอบทางสถตคอ การทดสอบสวนมาก มขอตกลงวาขอมลหรอสวนเหลอตองไมมความสมพนธกนหรอเปนอสระตอกนแตหากขอมล มขนาดใหญเพยงพอแลวสามารถยอมใหขอมลมความสมพนธกนได (Neter et al., 1996, p. 110) การทดสอบทางสถตของสวนเหลอทจะกลาวถงคอ การทดสอบความเปนอสระ การทดสอบความคงทของความแปรปรวน การทดสอบคาผดปกตและการทดสอบการกระจายตวแบบปกต 3.2.7.1 การทดสอบความเปนอสระของสวนเหลอ การทดสอบความเปนอสระของ สวนเหลอทนยมใชคอวธ Durbin-Watson test การทดสอบนจะทดสอบวาสวนเหลอในชวงเวลาปจจบนมความสมพนธกบสวนเหลอในชวงเวลา 1 ชวงกอนหนานหรอไม สวนใหญแลวหาก สวนเหลอมความสมพนธกนมกจะเปนทางบวกขนตอนการทดสอบมดงน
(1) การตงสมมตฐาน H0 : < 0 หรอ สวนเหลอไมมความสมพนธกนทางบวก H1 : > 0 หรอ สวนเหลอมความสมพนธกนทางบวก
(2) กาหนดระดบนยสาคญ
56
(3) กาหนดเขตวกฤต สถตทใชในการทดสอบน คอ D และเนองจากคาวกฤตของการทดสอบนยาก
แกการคานวณดงนน Durbin และ Watson จงใชเขตวกฤตทมการใชคาตาสด (dL) และคาสงสด (dU) เขตวกฤตนขนกบจานวนตวแปรอสระทใช
(4) คานวณคาสถต
n
ii
n
iii
e
ee
D
1
2
1
21)(
(3.6)
คาสถตนไดจากการเปรยบเทยบคาสวนเหลอในปจจบนกบคาในอดต 1 ชวงเวลากอนหนา
(5) สรปผล การสรปผลวาสวนเหลอมความสมพนธกนหรอไมนนพจารณาดงน
หาก D > dU แลวสรปวาสวนเหลอไมมความสมพนธกนทางบวก หาก D < dL แลวสรปวาสวนเหลอมความสมพนธกนทางบวก หาก dL < D < dU แลวไมสามารถสรปไดวามความสมพนธกนทางบวกหรอไม หมายเหต
1. หากตองการทดสอบความสมพนธเชงลบหรอ H1 : < 0 แลวสถต D จะเปน 4 – D หาก 4 – D มคานอยกวา dL แลวสรปวาสวนเหลอมความสมพนธกนทางลบ
2. หากตองการทดสอบทงสองดานในเวลาเดยวกนหรอ H1 : ≠ 0 แลวใหใชระดบนยสาคญเปน 2 เมอ คอระดบนยสาคญสาหรบการทดสอบดานเดยว
3. หากคาสถต D ตกอยในเขตทไมสามารถตดสนใจไดแลวควรทาการเกบขอมลเพม
4. การทดสอบนใชในการทดสอบสวนเหลอทมความสมพนธกบชวงเวลากอนหนาเทานนไมสามารถใชกบความสมพนธแบบอนได
57
ตวอยางท 3.1 ขอมลของปรมาณปยทใชกบความสงของตนไมจงทดสอบความสมพนธทางบวกของสวนเหลอโดยใชวธ Durbin-Watson test ทระดบนยสาคญ 0.05
จากการสรางสมการถดถอยโดยใชวธกาลงสองนอยทสดไดคาสวนเหลอดงตารางขางบน
เนองจากระดบนยสาคญเทากบ 0.05 และจานวนตวแปรอสระเทากบ 1 ดงนนเขตวกฤตทไดจากตารางท 3 ในภาคผนวก คอ dL เทากบ1.08 และ dU เทากบ 1.36 คาสถตสามารถคานวณไดดงน
n
ii
n
iii
e
ee
D
1
2
1
21 )(
7536.453
055.1037D = 2.285
พบวาคาสถต D (2.285) > dU (1.36) ดงนนสวนเหลอไมมความสมพนธทางบวกกน
ปรมาณ (Xi) ความสง (Yi) ei ei – ei-1 ( ei – ei-1)2 (ei)2 5.6 66 -5.235 - - 27.40523 3.0 71 2.322 7.557 57.1082 5.391684 4.5 78 7.687 5.365 28.7832 59.08997 2.5 67 -1.705 -9.392 88.2097 2.907025 5.2 61 -10.123 -8.418 70.8627 102.4751 5.8 75 4.292 14.415 207.7922 18.42126 4.0 65 -4.747 -9.039 81.7035 22.53401 3.8 79 9.680 14.427 208.1383 93.7024 6.1 76 4.326 -5.354 28.6653 18.71428 4.7 67 -3.357 -7.683 59.0285 11.26945 5.4 69 -2.341 1.016 1.0323 5.480281 4.1 66 -3.404 -1.063 1.1300 11.58722 6.3 72 0.317 3.721 13.8458 0.100489 4.4 77 7.146 6.829 46.6352 51.06532 3.2 64 -4.859 -12.005 144.1200 23.60988
รวม 0.376 1037.055 453.7536
58
3.2.7.2 การทดสอบความคงทของความแปรปรวน การทดสอบความคงทของ ความแปรปรวนทจะกลาวถงคอวธ Modified Levene test การทดสอบนเปนการทดสอบวา ความแปรปรวนของสวนเหลอเพมขนตามคาของตวแปรอสระทเพมขนหรอลดลงตามคาของ ตวแปรอสระทเพมขนหรอไมดงภาพท 3.8 ค สวนเหลอไมจาเปนตองมการแจกแจงแบบปกตแตวธนขนาดตวอยางตองมขนาดใหญพอเพอทจะตดผลกระทบจากการทสวนเหลอไมเปนอสระตอกน เมอสวนเหลอมความแปรปรวนสงขนจะพบวาสวนเหลอจะมความแปรผนมากขนดวย ดงน น การตรวจสอบของวธนจะแบงสวนเหลอออกเปนสองสวนตามคาของตวแปรอสระจากน นเปรยบเทยบคาเฉลยของความแตกตางสมบรณของสวนเหลอกบคามธยฐานของแตละกลมทงสองกลมวาตางกนหรอไมโดยใชสถต t ขนตอนการทดสอบมดงน
(1) การตงสมมตฐาน H0 : ความแปรปรวนของสวนเหลอคงท H1 : ความแปรปรวนของสวนเหลอไมคงท
(2) กาหนดระดบนยสาคญ (3) กาหนดเขตวกฤต เขตวกฤตสามารถหาไดจากการอานคา t ทองศาเสร n – 2 และ /2 (4) คานวณคาสถต
21
21*
11
nns
ddtL
(3.7)
โดย n = n1 + n2
111~eed ii
222~eed ii
1~e = มธยฐานของสวนเหลอในกลมท 1
2~e = มธยฐานของสวนเหลอในกลมท 2
2
~~2
122
2
111
21
n
dddds
n
ii
n
ii
(5) สรปผล หากคา 2/,2
* nL tt แลวสรปวาความแปรปรวนของสวนเหลอคงท
หากคา 2/,2*
nL tt แลวสรปวาความแปรปรวนของสวนเหลอไมคงท
59
หมายเหต หากระดบคาของตวแปรอสระมหลายกลมแลวใหทดสอบโดยใชการทดสอบ t ของสองกลมประชากรทาการทดสอบของ 2 กลมใหญโดยรวมกลมตางๆ เขากบกลมทมคาของตวแปรอสระสงสด ตวอยางท 3.2 จากขอมลในตวอยาง 3.1 จงใชวธ Modified Levene test ในการทดสอบความคงทของความแปรปรวนของสวนเหลอทระดบนยสาคญ 0.05 วธทา
เขตวกฤตสามารถหาไดจากตารางท 1 ในภาคผนวกโดยมคา t ทองศาเสรเทากบ 15 – 2 = 13 และ = 0.05 มคาเทากบ 2.160 เนองจากคาของตวแปรอสระมการกระจายทสมาเสมอตงแต 2.5 จนถง 6.3 ดงนนจะแบงสวนเหลอเปน 2 กลมดงน กลมแรกมจานวน 8 ตวตงแตคา 2.5 จนถง 4.5 และกลมทสองมจานวน 7 ตวตงแตคา 4.7 จนถง 6.3 จะได
1~e = 0.3085 และ 2
~e = -2.34 จากนนคานวณคา di1 และ di2 ดงน
0135.23085.0705.1~11111 eed
016.1)2341.0(357.3~21212 eed
. .
658.2)2341.0(317.0~27272 eed
จากนนคานวณคาเฉลยของทงสองกลม
193.58
55.411 d และ 950.3
7
65.272 d
จากนนคานวณคากาลงสองของความแตกตางระหวางคา d กบคาเฉลยกาลงสองของแตละกลม 1140.101936.50135.2 22
111 dd 6084.8950.3016.1 22
212 dd . . 6693.1950.3658.2 22
272 dd
และ 215
26006.5637053.47
s = 2.8234
ดงนนคาสถตคอ
60
7
1
8
18234.2
950.31936.5*
Lt = 0.851
เนองจาก *Lt (0.851) < tตาราง (2.160) ดงนนสรปวาความแปรปรวนของสวนเหลอมคาคงท
3.3 การทดสอบความเหมาะสมของสมการถดถอย เนองจากสมการถดถอยเชงเสนอยางงายนใชกบขอมลทมความสมพนธเชงเสนตรงกน การทดสอบความเหมาะสมของสมการถดถอย (lack of fit test) คอการทดสอบวาสมการถดถอยทไดมความเหมาะสมกบขอมลนนหรอไม หากตวแปรท งสองไมมความสมพนธเชงเสนตรงกนสมการถดถอยทไดไมเหมาะทจะใชกบขอมลชดนน การทดสอบความเหมาะสมมขอตกลงของ ตวแปรตามดงนคอ (1) มความเปนอสระตอกน (2) มการแจกแจงแบบปกตและ (3) มความแปรปรวนทเทากน นอกจากนการทดสอบนทระดบของ X หนงๆ ตองมคามากกวา 1 คานนคอ มการวดหรอจดเกบคาซ านนเอง เชน การศกษาความสมพนธระหวางเชาวนปญญากบผลสมฤทธของการเรยนนนควรใหมนกเรยนทมเชาวนปญญาเทากนอยในขอมลชดน เปนตน แตหากเปน การทดลองทควบคมระดบของตวแปรอสระไดนนทาการทดลองซ าทระดบ X หนงๆ แตไมใชเปนการวดซ าหรออานคาซ า การทตองเกบขอมล ณ ตาแหนงเดมหลายคาเพอใชในการประมาณคาความแปรปรวนของความคลาดเคลอน (2) แตไมจาเปนวาททกระดบของ X จะตองมคา Y หลายคา บางระดบสามารถมคา Y เพยงคาเดยวได ในการทดสอบนมสมมตฐานคอ H0: 1 = 0 และ H1: 1 ≠ 0 สมมตใหทระดบของ Xi (i = 1,…,m) มคา Yij (j = 1,…,ni) อย ni ตวโดย Yij คอคา Y ตวท j
ของ X ในระดบท i ดงนนจานวนขอมลทงหมดเทากบ n โดย n =
m
iin
1
การทดสอบนแบงผลรวม
กาลงสองความคลาดเคลอน (SSE) ออกเปนสองสวนคอ ผลรวมกาลงสองความคลาดเคลอนแทจรง (pure error sum of squares หรอ SSPE) และผลรวมกาลงสองความคลาดเคลอนทไมเหมาะสม (lack of fit sum of squares หรอ SSLOF) ดงน SSE = SSPE + SSLOF (3.8) โดยท SSPE เปนผลรวมกาลงสองของการวดความแปรผนของคา Y ทตาแหนง X หนงเมอเทยบกบคาเฉลยของ Y ณ ตาแหนง X นนดงน
SSPE =
m
i
n
jiij
i
YY1 1
2)( (3.9)
โดยองศาเสรของ SSPE เทากบ
m
ii mnn
1
)1(
61
สาหรบ SSLOF เปนผลรวมกาลงสองของการวดความแปรผนของคาเฉลยของ Y ในแตละระดบของ X เมอเทยบกบคาพยากรณดงน
SSLOF =
m
iiii YYn
1
2)ˆ( (3.10)
โดยองศาเสรของ SSLOF เทากบ n - 2 หากตวแปรทงสองมความสมพนธเชงเสนตรงกนแลวคาเฉลยของแตละกลมควรมคาไมแตกตางจากคาพยากรณมากแตหากตวแปรทงสองไมมความสมพนธเชงเสนตรงกนแลวคาเฉลยของแตละกลมจะแตกตางจากคาพยากรณมาก สาหรบสถตทใชในการทดสอบคอ F โดยมสตรการคานวณดงน
MSPE
MSLOF
mnSSPE
mSSLOFF
)/(
)2/( (3.11)
หาก F > F, m - 2, n - m แลวสรปวาตวแบบเชงเสนตรงทไดไมเหมาะสมกบขอมล
ตารางขางลางแสดงการวเคราะหความแปรปรวนโดยแยกออกเปนความคลาดเคลอนแทจรงและความคลาดเคลอนทไมเหมาะสม Source of variation SS df MS F Regression SSR 1 MSR Residual SSE n – 2 MSE Lack of fit SSLOF c – 2 MSLOF F Pure Error SSPE n – c MSPE Total SST n – 1
62
ตวอยางท 3.3 ฝายบคคลตองการศกษาความสมพนธระหวางอายงานกบความเรวทใชใน การประกอบชนสวนรถยนตของพนกงานโดยมขอมลดงตารางขางลาง จงทดสอบความเหมาะสมของสมการถดถอยทระดบนยสาคญ 0.05
อายงาน (ป) เวลาทใช (นาท) 0.5 58 0.5 45 0.5 52 1.0 43 1.0 40 1.0 44 1.5 36 1.5 33 1.5 37 2.0 30 2.0 28 2.0 25 2.5 23 2.5 24 2.5 21 3.0 24 3.0 23 3.0 26
วธทา หากพจารณาความสมพนธระหวางขอมลจากกราฟทไดจาก MINITAB พบวาขอมลมความสมพนธทไมเปนเสนตรงดงภาพขางลาง
63
จากขอมลขางตนจะไดสมการถดถอยคอ ii XY 6.113.54ˆ และมคา SSE = 288.10 คาเฉลยของ Y ในแตละระดบของ X มดงน 1y = 51.67, 2y = 42.33, 3y = 35.33, 4y = 27.67, 5y = 22.67 และ
6y = 24.33 ดงนนสามารถคานวณคา SSPE ไดดงน SSPE = (58 - 51.67)2 + (45 - 51.67)2 + …+ (23 - 24.33)2 + (26 – 24.33)2 = 124.00 ดงนน SSLOF = 288.10 – 124.00 = 164.10 องศาเสรของ SSPE = 18 – 6 = 12 องศาเสรของ SSLOF = 6 – 2 = 4 และคาสถต F คอ
)/(
)2/(
mnSSPE
mSSLOFF
12/00.124
4/10.164 = 3.97
หากเปรยบเทยบคาสถตทไดกบคาวกฤตจากตาราง F3.26 พบวา F = 3.97 > F3.26
ดงนนสรปวาสมการถดถอยทไดนไมเหมาะสมกบขอมลชดนเนองจากขอมลไมเปนเสนตรง หมายเหต
1. หากการทดสอบความสมพนธเชงเสนตรงของสมการถดถอยแสดงใหเหนวาไมมความสมพนธเชงเสนตรงระหวางตวแปรทงสองหรอตวแปรอสระไมสามารถพยากรณ
64
ตวแปรตามได บางครงหากทาการทดสอบความเหมาะสมของสมการถดถอยแลวจะพบวาสมการถดถอยเชงเสนอยางงายไมเหมาะสมกบขอมลชดนซงทจรงแลวขอมลชดน มความสมพนธกนแตไมเปนเสนตรงกได ดงนนการตรวจสอบความเหมาะสมของสมการถดถอยจงเปนสงสาคญทควรตรวจสอบ
2. นกวจยควรระวงในการเกบขอมลซ าตองพยายามใหขอมลทเกบในระดบเดยวกนมความเปนอสระตอกน
3. หากไมสามารถเกบขอมลใหมคา x ทระดบเดยวกนไดกสามารถทดสอบความเหมาะสมไดโดยนาขอมลทมคา x ใกลกนมาจดเปนกลมเดยวกน
4. ผอานสามารถใช MINITAB ชวยในการทดสอบความเหมาะสมไดโดยการเขาไปท “Option” ของการวเคราะหสมการถดถอยแลวเลอก “Pure error” ภายใต “Lack of Fit Tests” ดงภาพท 3.13
ภาพท 3.13 หนาจอการทดสอบความเหมาะสม
ผลลพธทไดจากการใช MINITAB แสดงดงภาพท 3.14 ในรปของตาราง ANOVA โดยในสวนของการว เคราะหความเหมาะสมจะดจากคา F และ p-value ของ Lack of Fit จะพบวาสอดคลองกบผลลพธในตวอยางท 3.3
65
ภาพท 3.14 หนาจอผลลพธการทดสอบความเหมาะสม
3.4 การแกไขขอมลทไมเปนไปตามขอตกลง การวเคราะหขอมลทไมเปนไปตามขอตกลงสามารถทาไดสองวธคอ (1) หารปแบบการถดถอยทเหมาะสมในการวเคราะห ขอดของวธนคอนกวเคราะหสามารถ
เขาใจและตความสงทไดไมยากเนองจากขอมลยงคงเดมแตขอเสยคอวธนอาจยงยากและตองใชความรทางสถตทคอนขางสงและบางครงอาจตองการขอมลจานวนมากในการวเคราะห
(2) แปลงขอมล (transform) ใหเปนไปตามขอตกลงแลวทาการวเคราะหโดยใชตวแบบเดม วธนงายกวาวธแรกเนองจากในปจจบนโปรแกรมสาเรจรปทางสถตมคาสงทชวยในการแปลงขอมลและสามารถใชกบขอมลทมขนาดนอยได แตขอเสยคอ ยากแกการตความพารามเตอรทไดจากการแปลงขอมล การแกไขขอมลทไมเปนไปตามขอตกตงสามารถทาไดหลายวธดงน
3.4.1 การแกไขความสมพนธทไมเปนเสนตรง บอยครงอาจพบวาหากขอมลไมมความสมพนธเชงเสนตรงแลวขอมลอาจม
ความสมพนธแบบโพลโนเมยลหรอเอกซโปเนนเชยล เชน 22110)( XXyE หรอ
XyE 10)( เปนตน
66
3.4.2 การแกไขความแปรปรวนทไมคงทของความคลาดเคลอน หากความแปรปรวนของความคลาดเคลอนไมคงทแบบเปนระบบสามารถแกไขโดยการใชว ธกาลงสองนอยทสดแบบถวงน าหนก (weighted least square method) ในการประมาณคาพารามเตอร
3.4.3 การแกไขความไมเปนอสระของความคลาดเคลอน หากความคลาดเคลอนมความสมพนธตอกนสามารถแกไขโดยการใชตวแบบทยอมใหความคลาดเคลอนมความสมพนธกน
3.4.4 การแกไขความคลาดเคลอนทไมมการแจกแจงแบบปกต สวนมากแลวการทความคลาดเคลอนไมมการแจกแจงแบบปกตและมความแปรปรวนไมคงทมก เกด ขนพรอมๆ กน การแปลงขอมลนอกจากจะชวยใหความคลาดเค ลอนม ความแปรปรวนคงทแลวยงชวยใหความคลาดเคลอนมการแจกแจงปกตอกดวย ดงนนจงควรแปลงขอมลใหมความแปรปรวนทคงทกอนแลวตรวจสอบวาความคลาดเคลอนมการแจกแจงปกตหรอไมหลงจากการแปลงขอมลแลว
3.4.5 การแกไขขอมลในกรณทไมไดรวมตวแปรทสาคญเขาในตวแบบ หากการวเคราะหความคลาดเคลอนชใหเหนวามการละตวแปรทสาคญไปควรจะเพม ตวแปรเหลานนเขาไปในตวแบบ
3.5 การแปลงขอมล การแปลงขอมลสามารถทาไดทงการแปลงตวแปรอสระและตวแปรตามอยางใดอยางหนงหรอแปลงทงตวแปรอสระและตวแปรตามพรอมกนกได ในทนจะกลาวถงการแปลงขอมลใหมความสมพนธเปนเสนตรงและการแปลงขอมลเพอใหความแปรปรวนมคาคงท
3.5.1 การแปลงขอมลทไมมความสมพนธเปนเสนตรง เนองจากขอตกลงหนงของการใชสมการถดถอยเชงเสนอยางงายคอ ตวแปรอสระและตวแปรตามมความสมพนธเชงเสนกน การวเคราะหวาตวแปรมความสมพนธเชงเสนหรอไมสามารถทดสอบโดยการใชการทดสอบความเหมาะสมของสมการถดถอยดงทไดกลาวไวแลวหรอการพจารณาจากแผนภาพกระจายระหวางตวแปรทงสอง หากความคลาดเคลอนไมมการแจกแจงแบบปกตแตใกลเคยงการแจกแจงแบบปกตและมความแปรปรวนของความคลาดเคลอนมคาคงทแลวควรทาการแปลงตวแปรอสระท งนเนองจากการแปลงตวแปรตามอาจทาใหความคลาดเคลอนมการแจกแจงทไมหางไกลจากการแจกแจงปกตมากขนหรอความแปรปรวนของความคลาดเคลอนทแตกตางกนมากขนกได
67
Montgomery และ Peck (1992, p. 89-90) ไดเสนอรปแบบในการแปลงตวแปรอสระและ/หรอตวแปรตามโดยดจากแผนภาพกระจายระหวางตวแปรอสระและตวแปรตาม หากพจารณาฟงกชนเอกซโปเนนเชยล XeY 1
0 จะพบวาสามารถแปลงฟงกชนนใหเปนเสนตรงไดโดยการเปลยนใหอยในรปของลอการทมดงน lnlnln 10 XY หรอ XY 10 โดยทตองตรวจสอบวา ln นนมการแจกแจงแบบปกตหรอไมหลงจากการสรางสมการถดถอยของขอมลทไดจากการแปลงแลว รปแบบการแปลงทเหมาะสมแบบตางๆ ตามฟงกชนของขอมลแสดงดงภาพท 3.15 และตารางท 3.1
Positive curvature Negative curvature
y
y
y
y y
y
y
x
x
x
x x
x
x
68
(a) (b)
(c) (d)
(e) (f)
(g) (h)y
0
0
0
00
0
0
0
x
11
0e
0
0
( , , x all > 0)10 ( , x > 0 , < 0)10
> 11
( < 0)1 ( > 0)1
( < 0)1 ( > 0)1
( < 0)1 ( > 0)1
= 11
1
0 < < 1 1
< -11
= -11
-1< < 0 1
0 e/
11/
01/
01/
1 0/ 1 0/
11/
69
ตารางท 3.1 ฟงกชนการแปลงขอมลแบบตางๆ รป ฟงกชนของขอมล รปแบบการแปลง ฟงกชนหลงการแปลง
a และ b 10
XY YY log , XX log XY 10log c และ d XeY 1
0 YY ln XY 10ln
e และ f XY log10 XX log XY 10 g และ h
10
X
XY
YY
1 ,
XX
1 XY 10
ตวอยางท 3.4 จากขอมลขางลาง X 5.5 5.5 2.9 4.5 5.0 5.5 6.1 7.0 7.0 2.2 Y 62.7 56.2 16.8 40.5 50.0 50.0 74.4 100.0 97.0 9.7
X 7.0 6.5 2.6 5.5 4.5 4.5 5.4 2.5 6.1 3.5 Y 98.0 84.5 13.5 60.5 42.3 44.2 58.3 12.5 74.4 29.0
จงทดสอบความเหมาะสมของตวแบบทระดบนยสาคญ 0.05 และหากพบวาตวแบบ เชงเสนไมเหมาะสมจงแปลงขอมล วธทา
จากแผนภาพกระจายระหวางตวแปรทงสองพบวาขอมลไมมความสมพนธเชงเสนตรงกนดงภาพขางลาง
765432
100
90
80
70
60
50
40
30
20
10
0
x
y
70
จากขอ มลขางตน จะไดสมการถดถอยคอ ii XY 4.183.37ˆ และ เม อทดสอบ ความเหมาะสมของตวแบบพบวาตวแบบเชงเสนไมเหมาะสมเนองจาก p-value เทากบ 0.003 ถงแมวาตวแบบเชงเสนจะไมเหมาะสมแตพบวาคา R-Sq(adj) อยในระดบทสงคอ 97.4% Regression Analysis: y versus x The regression equation is y = - 37.3 + 18.4 x Predictor Coef SE Coef T P Constant -37.292 3.578 -10.42 0.000 x 18.4245 0.6932 26.58 0.000 S = 4.638 R-Sq = 97.5% R-Sq(adj) = 97.4% Analysis of Variance Source DF SS MS F P Regression 1 15197 15197 706.44 0.000 Residual Error 18 387 22 Lack of Fit 10 354 35 8.48 0.003 Pure Error 8 33 4 Total 19 15584 7 rows with no replicates Lack of fit test Possible curvature in variable x (P-Value = 0.000) Possible lack of fit at outer X-values (P-Value = 0.016) Overall lack of fit test is significant at P = 0.000
นอกจากนหากพจารณาแผนภาพกระจายระหวางคาพยากรณกบสวนเหลอพบวาไมมความสมพนธเชงเสนกนเชนเดยวกบแผนภาพกระจายระหวางตวแปรอสระกบสวนเหลอ ดงภาพขางลาง
71
1009080706050403020100
10
0
-10
e
y
765432
10
0
-10
x
e
เมอพจารณาแผนภาพกระจายระหวางตวแปรอสระกบตวแปรตามพบวาตวแปรทงสองม
ความสมพนธแบบเอกซโปเนนเชยลซงตรงกบรปแบบในภาพท 3.15 a จงควรแปลงขอมลของ ตวแปรทงสองเปน log X และ log Y ดงน loglogloglog 10 XY หรอ XY 10 ดงนนขอมลของตวแปรทงสองหลงจากการแปลงดวยลอการทมมดงนคอ X' 0.7404 0.7404 0.4624 0.6532 0.6990 0.6990 0.7853 0.8451 0.8451 0.3424 Y' 1.7973 1.7497 1.2253 1.6075 1.6990 1.6990 1.8716 2.0000 1.9868 0.9868
X' 0.8451 0.8129 0.4150 0.7404 0.6532 0.6532 0.7324 0.3979 0.7853 0.5441 Y' 1.9912 1.9269 1.1303 1.7818 1.6263 1.6454 1.7657 1.0969 1.8716 1.4624
72
เมอนาขอมลทแปลงมาสรางแผนภาพกระจายระหวางตวแปรทงสองพบวามความสมพนธ เชงเสนดงภาพขางลาง
0.850.750.650.550.450.35
2.0
1.5
1.0
x'
y'
เมอนาขอมลทแปลงแลวมาสรางสมการถดถอยได ii XY 98.1322.0ˆ และพบวา
R-Sq(adj) มคาสงขนเปน 99.6% นอกจากนเมอทดสอบความเหมาะสมของตวแบบพบวาตวแบบ มความเหมาะสมดวย p-value เทากบ 0.130
The regression equation is Y’ = 0.322 + 1.98 x’
Predictor Coef SE Coef T P Constant 0.32213 0.02068 15.58 0.000 X’ 1.97725 0.03011 65.67 0.000
S = 0.02054 R-Sq = 99.6% R-Sq(adj) = 99.6%
Analysis of Variance
Source DF SS MS F P Regression 1 1.8202 1.8202 4312.82 0.000 Residual Error 18 0.0076 0.0004
Lack of Fit 10 0.0056 0.0006 2.26 0.130 Pure Error 8 0.0020 0.0002
Total 19 1.8278
7 rows with no replicates
Unusual Observations Obs x’ y’ Fit SE Fit Residual St Resid 20 0.544 1.46240 1.39788 0.00595 0.06451 3.28R
R denotes an observation with a large standardized residual
No evidence of lack of fit (P > 0.1)
73
ผลลพธทไดสอดคลองกบแผนภาพกระจายระหวางคาพยากรณกบสวนเหลอทไมแสดงรปแบบใดและมการกระจายตวอยางสมดงภาพขางลาง ดงนนแสดงใหเหนวาการแปลงขอมลนน ทาใหขอมลมความเหมาะสมกบตวแบบสมการเชงเสนอยางงาย
2.01.51.0
0.05
0.00
-0.05
FITS1
RE
SI1
3.5.2 การแปลงขอมลทไมมการแจกแจงแบบปกตและมความแปรปรวนไมคงท โดยทวไปหากพบวาขอมลไมมการแจกแจงแบบปกตแลวมกจะพบวาขอมลม ความแปรปรวนทไมคงท ในการสรางสมการถดถอยนนตวแปรตามควรมการแจกแจงแบบปกตดงนนการแปลงคาตวแปรตามจงมความจาเปนและในขณะเดยวกนการแปลงขอมลของตวแปรตาม น นย งอาจชวยใหความสมพนธของตวแปรท งสองเปนเสนตรงอกดวย สาเหตหลกของ ความแปรปรวนทไมคงทน นสวนใหญมาจากการทความแปรปรวน (2) ของตวแปรตามมความสมพนธกบคาเฉลย (E(Y)) เชน หาก Y มการแจงแจงแบบปวซองแลวความแปรปรวนของ Y จะมคาเทากบคาเฉลย ดงนนการแกไขความแปรปรวนทไมคงทนนสามารถทาไดโดยการถอดรากของ Y หรอ YY หรอหาก Y เปนขอมลสดสวนซงมคาอยในชวง 0 กบ 1 แลวแผนภาพระหวาง คาพยากรณกบสวนเหลอจะมลกษณะดงภาพท 3.16 ในกรณเชนนควรแปลง Y ดวย arcsin หรอ
)(sin 1 YY เปนตน
74
1.00.90.80.70.60.50.40.30.20.10.0
4
3
2
1
0
-1
-2
-3
-4
-5
e
y ภาพท 3.16 ความสมพนธระหวางคาพยากรณและสวนเหลอ Montgomery & Peck (1992, p. 98) เสนอรปแบบการแปลงตวแปรตามไวดงตารางท 3.2 ตารางท 3.2 รปแบบการแปลงโดยพจารณาฟงกชนของความแปรปรวน
ความสมพนธระหวาง 2 กบ E(Y) รปแบบการแปลง
2 คาคงท YY (ไมตองแปลงขอมล)
2 E(Y) YY (กรณ y แจกแจงแบบปวซอง)
2 E(Y)[1 - E( Y)] )(sin 1 YY (กรณ 0 < Y < 1)
2 [E(Y)]2 )ln(YY 2 [E(Y)]3 2
1
YY 2 [E(Y)]4 1 YY
จากรปแบบการแปลงตวแปรขางตนพบวาการแปลงโดยใชลอการทมนนเหมาะกบคา Y ทมคาความแปรปรวนเพมขนหรอลดลงแบบเอกซโปเนนเชยลและเมอคาเฉลยของ Y มกาลงเพมมากขนการแปลงจะใชฟงกชนทตาลงเพอลดความแปรปรวนของ Y ทเพมขนอยางรวดเรว เชน การใชสวนกลบของ Y เปนตน
การทคาของตวแปรตามไมคงทจะสงผลใหความแปรปรวนของสวนเหลอไมคงทดวย การตรวจสอบวาคาของตวแปรตามมความแปรปรวนคงทหรอไมอยางงายคอการวาดแผนภาพกระจายระหวางของสวนเหลอกบคาพยากรณหรอกบคาของตวแปรตาม โดยแผนภาพจะชวยใหการเลอกรปแบบการแปลงขอมลทาไดงายขน การตรวจสอบและปรบแกความแปรปรวนใหคงท
75
นนจาเปนตองทาหากใชวธกาลงสองนอยทสดในการสรางสมการถดถอยเนองจากคาประมาณของพารามเตอรทไดจะไมเปนตวประมาณคาทมความแปรปรวนนอยทสดแตยงคงเปนตวประมาณคาทไมเอนเอยง การทตวประมาณคาไมมความแปรปรวนทนอยทสดนน ทาใหคาสมประสทธของสมการถดถอยมคาสวนเบยงเบนมาตรฐานทใหญขนสงผลใหความถกตองของการประมาณคาและการพยากรณลดลง ซงอาจสงผลใหการทดสอบสมมตฐานของคาสมประสทธไมถกตองไปดวย
หลงจากการแปลงขอมลแลวหากทาการพยากรณคา Y ตองมการแปลงคาพยากรณกลบมา สรปแบบเดมหรอหนวยเดม เชน หากแปลงคา Y โดยการถอดรากตองยกกาลงสองของคาพยากรณ ( 2Y ) เพอใหคาพยากรณอยในหนวยเดยวกนกบขอมลเดม เปนตน
ตวอยาง 3.5 โรงงานผลตแกวตองการศกษาจานวนแกวทมตาหนตอเดอน (หนวยเปนพนชน) เปนจานวน 10 เดอนโดยมขอมลดงน X (เดอนท) 0 1 2 3 4 5 6 7 8 9 Y (จานวน) 97 138 161 178 220 234 283 299 374 396 วธทา จากขอมลดงกลาวเมอนามาวาดแผนภาพกระจายระหวางตวแปรท งสองไมพบ ความผดปกตแตอยางใดดงภาพและเมอสรางสมการถดถอยระหวางตวแปรทงสองจะไดสมการถดถอยคอ ii XY 5.328.91ˆ
9876543210
400
300
200
100
month
defe
ct
จากตารางการวเคราะหความแปรปรวนทไดจาก MINITAB พบวาคา R2 อยในระดบทสงมากคอ 97.9%
76
The regression equation is defect = 91.8 + 32.5 month Predictor Coef SE Coef T P Constant 91.764 8.893 10.32 0.000 month 32.497 1.666 19.51 0.000 S = 15.13 R-Sq = 97.9% R-Sq(adj) = 97.7% Analysis of Variance Source DF SS MS F P Regression 1 87124 87124 380.53 0.000 Residual Error 8 1832 229 Total 9 88956
แตเมอพจารณาจากแผนภาพกระจายระหวางคาพยากรณกบสวนเหลอพบวาทคาพยากรณตาๆ นนสวนเหลอจะมคาเปนบวกในทานองเดยวกนกบคาพยากรณสงๆ แตเมอคาพยากรณมคากลางๆ นนสวนเหลอจะมคาเปนลบ
400300200100
20
10
0
-10
-20
Fitted Value
Res
idua
l
Residuals Versus the Fitted Values(response is defect)
แสดงใหเหนวาความแปรปรวนของคาคลาดเคลอนนนไมคงท ในกรณนจงควรแปลงคา Y
โดยการถอดรากหรอ YY หลงจากการแปลงขอมลแลวพบวาไดสมการถดถอยคอ
ii XY 08.13.10ˆ
จากตารางการวเคราะหความแปรปรวนทไดจาก MINITAB พบวาคา R2 มคาเพมมากขนเลกนอยเปน 98.9%
77
The regression equation is defect’ = 10.3 + 1.08 month
Predictor Coef SE Coef T P Constant 10.2694 0.2190 46.89 0.000 month 1.07590 0.04102 26.23 0.000
S = 0.3726 R-Sq = 98.9% R-Sq(adj) = 98.7%
Analysis of Variance
Source DF SS MS F P Regression 1 95.498 95.498 687.89 0.000 Residual Error 8 1.111 0.139 Total 9 96.609
เมอพจารณาแผนภาพกระจายระหวางคาพยากรณกบสวนเหลอไมพบรปแบบทผดปกต
แตอยางใดดงภาพขางลางแสดงวาตวแบบทไดจากขอมลทแปลงแลวมความเหมาะสม
2019181716151413121110
0.5
0.0
-0.5
Fitted Value
Res
idua
l
Residuals Versus the Fitted Values(response is defect')
3.5.3 การแปลงขอมลโดยวธ Box-Cox transformation เมอพบวาตวแปรตามมการแจกแจงทไมปกตหรอมความแปรปรวนทไมคงทดงใน
ตวอยางทผานมา การเลอกรปแบบการแปลงโดยการพจารณาจากแผนภาพอาจมความยงยาก Box และ Cox (1964) ไดคดคนสตรการแปลงขอมลโดยจดใหอยในรปของการยกกาลงของ Y หรอ Y
โดยท เปนพารามเตอรทใชในการกาหนดรปแบบการแปลง ดงน
= -1.0 คอ Y
Y1
= -0.5 คอ Y
Y1
= 0.0 คอ )ln(YY
78
= 0.5 คอ YY = 1.0 คอ YY (ไมมการแปลงขอมล) = 2.0 คอ 2YY
แนวคดของวธการนคอการสรางสมการถดถอยโดยวธความนาจะเปนสงสด (maximum likelihood method) ในการประมาณคา และทาการคดเลอกซ าโดยพจารณาจาก ทใหผลรวมกาลงสองของความคลาดเคลอน (SSE) ทได หาก ใดใหคา SSE ทต าสดนนเปน ทเหมาะสมทสด เนองจากการใชคา ทแตกตางกนจะใหคา Y มหนวยทแตกตางกนทาให SSE ทไดจากการสมการถดถอยน นๆ ไมสามารถนามาเปรยบเทยบกนไดดงน นจงตองแปลงคา Y ในอยในรปเดยวกน (Y( )) ดงน
1
1
Y
Y
, ≠ 0
)(Y )ln(YY , = 0
โดย
n
YY
)ln(ln 1
จากน นนาคา Y( ) ทไดมาสรางสมการถดถอยกบตวแปรอสระเพอหาคา SSE แลวเปรยบเทยบเพอหาคา ทให SSE ทต าทสด การคานวณดวยมอน นจะยงยากและเสยเวลามาก ในปจจบนนมโปรแกรมสาเรจรปทชวยในการหาคา ทเหมาะสมพรอมทงแปลงขอมลโดยการใชคา นนเชน โปรแกรม MINITAB เปนตน การใชโปรแกรม MINITAB มขนตอนดงน
1. เลอก “Stat” 2. เลอก “Control Charts” 3. เลอก “Box-Cox Transformation..” 4. ระบคาตวแปร Y ทตองการแปลงคาลง “Single column:” 5. ระบขนาดของกลมยอย (subgroup) ลงในชอง “Subgroup size” หากไมมกลมยอยให
ใส 1 6. หากตองการเกบคาทแปลงแลวใหระบชอคอลมนใน “Store transform data in single
column:”
79
7. นกวจยสามารถเลอกทจะระบคา หรอใหโปรแกรมหาคา ทเหมาะสมใหโดยคลกท “Options…” จากนนระบคา ลงในชอง “Use lambda:” แตหากไมระบคาโปรแกรมจะหาคา ทเหมาะสมใหเอง
8. จากนนคลก “OK” ดงภาพท 3.17
ภาพท 3.17 หนาจอการหาคา ทเหมาะสม
ตวอยางท 3.6 จากขอมลในตวอยางท 3.5 หากใชโปรแกรม MINITAB ในการหาคา ทเหมาะสมพรอมทงคานวณคา Y ทแปลงแลว วธทา
ขอมลชดนไมมกลมยอยดงนน subgroup จงเทากบ 1 จากนนใหโปรแกรมหาคา ทเหมาะสมให หลงจากการคานวณโปรแกรมจะแสดงกราฟดงภาพ
80
543210-1-2-3-4-5
250
200
150
100
50
0
95% Confidence Interval
StD
ev
Lambda
Last Iteration Info
29.210
29.201
29.206
0.730
0.674
0.617
StDevLambda
Up
Est
Low
Box-Cox Plot for defect
จากภาพพบวาคา ทเหมาะสมคอ 0.674 และชวงความเชอมนท 95% ของคา คอ (0.617, 0.73) ซงคา มคาใกลเคยงกบ 0.5 (ท = 0.5 นนการแปลงทเหมาะสมคอ การถอดรากหรอ YY ) ดงในตวอยางท 3.5 ทแปลงขอมลโดยใชการถอดราก
หมายเหต 1. หลงจากการแปลงขอมลแลวคาประมาณของสมประสทธ (b0 และ b1) ทไดน นจะมคณสมบตของสมการถดถอยตามขอมลทแปลงแลวมใชขอมลเดม 2. เนองจากคา เปนคาทไดจากขอมล หากมคาทใกลเคยงกบคา ทสามารถจดรปแบบการแปลงไดควรจะเลอกใชรปแบบการแปลงทใกลเคยงเพองายแกการแปลงขอมลดงเชน ในตวอยางท 3.7 คา เทากบ 0.674 ซงใกลเคยงกบ 0.5 จงควรแปลงโดยการถอดรากแตหากใชโปรแกรม MINITAB แลวโปรแกรมจะแปลงใหโดยอตโนมต 3. หากคา มคาใกลเคยง 1 ไมจาเปนทจะตองแปลงขอมล สรป การวเคราะหความเหมาะสมของตวแบบเปนสงทจาเปนในการวเคราะหการถดถอยเพอใหการวเคราะหขอมลไดถกตองและพยากรณไดอยางเทยงตรง ในการวเคราะหความเหมาะสมสามารถทาไดหลายวธ เชน การใชแผนภาพกระจายระหวางตวแปรหรอสวนเหลอหรอคาพยากรณ รวมไปถงการวเคราะหโดยใชว ธทางสถตท มความถกตองมากขน หากขอมลมรปแบบท ไมเหมาะสมแลวจาเปนตองมการแปลงเพอใหตวแบบมความถกตองมากขน
81
คาถามทายบท 3.1 ขอมลราคาขายบาน (แสนบาท) กบยอดขายบานแบบตางๆ (หลง) ของบรษทหนงมดงน ราคา 134 67 44 39 29 20 17 19 7 10 5 ยอดขาย 42 100 61 60 79 99 91 127 115 250 260 (1) สรางแผนภาพกระจายระหวางตวแปรทงสองพรอมทงอธบายความสมพนธ (2) สรางสมการถดถอยเชงเสนอยางงาย (3) คานวณคาพยากรณทราคาขายแตละคา (4) สรางแผนภาพกระจายระหวางสวนเหลอกบคาพยากรณพรอมทงอธบายแผนภาพทได (5) สรางแผนภาพกระจายแบบโคงปกตพรอมทงอธบายแผนภาพทได (6) คานวณสวนเหลอมาตรฐานของขอมลชดน 3.2 จากขอมลในขอ 2.13 จงสรางแผนภาพดงตอไปน (1) แผนภาพกระจายระหวางสวนเหลอกบคาพยากรณพรอมทงอธบายแผนภาพทได (2) แผนภาพกระจายแบบโคงปกตพรอมทงอธบายแผนภาพทได 3.3 จากขอมลขางลางจงตอบคาถามตอไปน X 50 62 34 63 81 97 36 25 40 70 74 Y 1.5 1.8 1.1 1.9 2.2 2.4 1.2 0.4 2.1 1.8 2.1 (1) สรางสมการถดถอยเชงเสนอยางงาย (2) สรางแผนภาพกระจายแบบโคงปกตพรอมทงอธบายแผนภาพทได (3) คานวณสวนเหลอปรบแลวของขอมลชดน (4) สรางแผนภาพกระจายระหวางสวนเหลอกบคาพยากรณพรอมทงอธบายแผนภาพทได (5) หากทานตองการปรบปรงตวแบบทานควรแปลงขอมลอยางไร 3.4 จากขอมลในขอ 3.3 จงทดสอบความเปนอสระของสวนเหลอทไดโดยวธ Durbin-Watson ท
ระดบนยสาคญ 0.05 3 .5 จากขอ ม ลในขอ 3 .3 จงใชว ธ Modified Levene test ในการทดสอบความคงท ของ
ความแปรปรวนของสวนเหลอทระดบนยสาคญ 0.05 3.6 ในการศกษาความสมพนธระหวางปรมาณเชอแบคทเรยทเหลอ (โคโลน) กบเวลาทใชในการ
ฆาเชอ (นาท) มขอมลดงน เวลา 178 110 94 83 70 50 50 30 29 18 15 จานวน 1 2 3 4 5 6 7 8 9 10 11
82
(1) สรางแผนภาพกระจายระหวางตวแปรทงสองพรอมทงอธบายความสมพนธ (2) สรางสมการถดถอยเชงเสนอยางงาย (3) สรางแผนภาพกระจายของสวนเหลอกบเวลาพรอมทงอธบายแผนภาพทได (4) สรางแผนภาพกระจายแบบโคงปกตพรอมทงอธบายแผนภาพทได (5) หากทานตองการปรบปรงตวแบบทานควรแปลงขอมลอยางไร 3.7 จากขอมลขางลางจงตอบคาถามตอไปน X 1 0 0 2 1 3 0 1 2 0 2 1 3 Y 15 12 10 18 14 22 9 16 19 11 17 13 21 (1) สรางแผนภาพกระจายระหวางตวแปรทงสองพรอมทงอธบายความสมพนธ (2) สรางสมการถดถอยเชงเสนอยางงาย (3) สรางแผนภาพกระจายของสวนเหลอกบ X พรอมทงอธบายแผนภาพทได (4) สรางแผนภาพกระจายของสวนเหลอกบคาพยากรณ ผลลพธทไดสอดคลองกบขอ (3) หรอไม (5) สรางแผนภาพกระจายแบบโคงปกตพรอมทงอธบายแผนภาพทได (6) ทดสอบความคงทของความแปรปรวนของสวนเหลอโดยใชวธ Modified Levene test ท
ระดบนยสาคญ 0.05 แลวเปรยบเทยบผลทไดกบแผนภาพในขอ (3) (7) ทดสอบความเหมาะสมของสมการถดถอยทระดบนยสาคญ 0.10 (8) หากทานตองการปรบปรงตวแบบทานควรแปลงขอมลอยางไร 3.8 ขอมลขางลางคอคา X และสวนเหลอทไดจากสมการถดถอยอยางงาย จงสรางแผนภาพกระจาย
ระหวางคาทงสองพรอมทงอธบายแผนภาพทได หากตองการแปลงขอมลควรแปลงอยางไร X 5 6 7 8 9 10 11 12 13 14 สวนเหลอ 3.2 2.9 -1.7 -2.0 -2.3 -1.2 -0.9 0.8 0.7 0.5 3.9 จากขอมลขางลางจงสรางแผนภาพกระจายระหวางตวแปรทงสองและทดสอบความเหมาะสม
ของสมการถดถอยทระดบนยสาคญ 0.05 X 6 6 6 8 8 10 10 14 14 22 22 Y 100 95 100 104 117 121 115 124 120 133 130 X 26 26 30 30 32 32 Y 180 135 149 146 150 153 3.10 หากทานตองการปรบปรงสมการถดถอยของขอ 3.9 ทานจะทาอยางไร