factor analysis workshop #1-principal component …it.nation.ac.th/faculty/danai/download/statistics...
TRANSCRIPT
1
Factor Analysis Workshop #1-Principal Component Analysis
ขอมล : ไดมาจากการศกษาสภาวะจตใจและการปรบตวของกลมตวอยางจานวน 439 ตวอยาง ซงประกอบดวยคาคณศพท
ทบงบอกความรสกในทางบวก 10 คา และคาคณศพททบงบอกความรสกในทางลบ 10 คา โดยใชมาตราลเกรท 5 อนดบ
เปนการบงบอกระดบความรสกนน(1= ไมรสกเชนนนเลยแมแตนอย 2= รสกบางเลกนอย 3= รสกปานกลาง 4= รสกมาก
5 = รสกมากทสด)
Scale# ตวแปรทใช ใชบงบอก Scale# ตวแปรทใช ใชบงบอก
1 p1 เกดความสนใจ-interested 11 P11 โกรธงาย-irritable
2 P2 ผดหวง-upset 12 P12 คลจดดลใจ-inspired
3 P3 หวาดกลว-scared 13 P13 ใสใจ-attentive
4 P4 ภาคภมใจ-proud 14 P14 เกรงกลว-afraid
5 P5 อบอาย-ashamed 15 P15 ตนเตน-excited
6 P6 มงมน-determined 16 P16 รสกผด-guilty
7 P7 กระฉบกระเฉง-active 17 P17 กระตอลอลน-enthusiastic
8 P8 หดห-distressed 18 P18 ตนตว-alert
9 P9 แขงแกรง-strong 19 P19 กระสบกระสาย-nervous
10 P10 เปนอร-hostile 20 P20 ประหมา-jittery
จากไฟลขอมลคลก Analyze>Data Reduction>Factor
•เลอกตวแปร p1-p20 ซงตองการลดรป และยายตวแปรเหลานเขาไปอยในกลอง variables
เอกสารวชาการดานศาสตรการวจยและสถตประยกต
13
2
•คลกทป ม Deescriptives ในสวนของ Statistics ใหคลก Initial solution ในสวน Correlation Matrix ใหคลก
Coefficients และ KMO and Bartlett’s test of sphericity
3
•คลกทป ม Extraction ในสวน Method ใหเลอก Principal components ในสวน Analyze ใหเลอก Correlation
matrix ในสวน Display ใหเลอก Unrotated factor solution และ Scree plot ในสวน Extract ใหเลอก ระบ
Eigenvalues over 1
•คลก continue
•คลกทป ม Options ในสวนของ Missing values ใหเลอก Exclude cases pairwise ในสวน Coefficient Display
format ใหเลอก Sorted by size และ Suppress absolute values less than ….ใหใส 0.3 เขาไปเพอใหแสดง factor
loadings ทเกน 0.3 ขนไป
•คลก Continue และ OK
4
ภาพถดไปแสดง Correlation Matrix สวนแรก ทเปนสวนของ computer output
5
Computer output ทแสดง correlation matrix สวนทสอง พงสงเกตวา ตวแปรทง 20 ตวมความสมพนธระหวางกน และ
ระดบความสมพนธไมมคาเขาใกลศนย นเปนขอมลเบองตนทชใหเหนวา factor analysis สามารถนามาใชในการลดรปตว
แปร20 ตว ใหอยในรป 2-4 องคประกอบ อนง เมอสารวจเรวๆจะพบวา correlation matrix ไมนาจะเปน Identity matrix
ทมคา Correlation coefficient ในตาแหนงทไมอยบนเสนทะแยงมมมคาตางจากศนย (0)
Computer output ในสวนตอไป ตอกยาความเหมาะสมในการใช factor analysis ลดรปขอมล
6
KMO ทใชวดความพอเพยงของขอมลแสดงคา 0.873 ซงสงกวาตวเลขขนตาทยอมรบกนในทางปฏบต (0.6) ดงนนจานวน
ขอมลไมเปนปญหาในการทา Factor Analysis
Bartlett’s test of sphericity ซงใชทดสอบวา Correlation matrix มความแตกตางจาก Identity matrix หรอไมมคา
sig.=.000 ซงหมายความวา correlation matrix ในกรณนไมไดมลกษณะเหมอน Identity matrix
Computer output ตอไปแสดงคาของ Variance ทอธบายดวยปจจยทเปนผลมาจากการทา factor analysis
จากตารางจะเหนไดวา จากผลของการลดรปขอมล บงเกดเปนองคประกอบ 1-20 ทใชอธบาย variance ของตวแปรทง 20
ตว โดยมองคประกอบทใชอธบายคาของ variance ทม eigenvalue สงกวา 1 เพยง 4 ตว
จากองคประกอบทงหมด 20 ตว variance ท standardized( ทอนใหเทากบ 1) รวมกนจะเทากบ 20(1+1+..+1) โดย
องคประกอบแรกสามารถอธบายคาของ variance รวมของตวแปรทงหมดได 31.183 เปอรเซนต ( 6.237X100/20.00) องค
ประกอสองสามารถอธบายคาของvariance รวมของตวแปรทงหมดได 17.008 เปอรเซนต ( 3.402X100/20.00)
7
Computer output สวนตอไปแสดง Communualities
ความหมายของ communalities ( ใชสญลกษณ h2 ) บงบอกสดสวนของ varianceของแตละตวแปรทอธบายไดดวย
องคประกอบทง 4 ตวอยางเชน องคประกอบทง 4 สามารถอธบาย variance ในตวแปร pn1 ไดถงรอยละ 51.6
8
Computer output สวนตอไป แสดง factor loadings ของแตละตวแปร พงสงเกตวา ตวแปรทงหมดจะม factor loadings
อยทองคประกอบ 1 และ 2 เปนหลก
ขนตอนตอไป เราจะทาการคดเลอกจานวนองคประกอบทเราจะใช ซงการทจะกาหนดจานวนองคประกอบทเหมาะสมจะตอง
อาศยขอมลจาก scree plot และผลการ simulate จากขนาดของตวแปรและขนาดของกลมตวอยาง
9
จาก scree plot จะเหนไดวามการหกมมในคาของ Eigenvalue อยทองคประกอบทสาม หลงจากนนการหกมมท
องคประกอบอนๆ ไมสามารถเหนไดเดนชดนก
เพอใหแนใจ เราไดลองทา parallel analysis เพอพจารณาวา จากการsimulate จะมโอกาสทเราจะได คาของ
Eigenvalue สกเทาใด เมอกาหนดขนาดของกลมตวอยางและจานวนตวแปร
ภาพดานลางแสดงการsimulate เพอหาคาeigenvalue โดยวธ Principal Component analysis
10
ตารางตอไปแสดงการเปรยบเทยบeigenvalue ทไดจรง กบทไดจาก Monte Carlo simulation
องคประกอบท Eigenvalue ทไดจรง Eigenvalueทไดจากการsimulate การตดสนใจเกยวกบองคประกอบ
1 6.237 1.3955 เลอก
2 3.402 1.3236 เลอก
3 1.224 1.2574 ไมเลอก
4 1.159 1.2202 ไมเลอก
5 ตากวา 1 1.1772 ไมเลอก
จากขอมลทงหมดขางตน เราจงตดสนใจทจะใชเพยง 2 องคประกอบในการอธบาย variance ของตวแปรทเราศกษาอย
ขนตอนตอไป เราจะทาการ rotate factor โดยวธการ Varimax เพอหา factor loadings ทตงฉาก(orthogonal) กบ
Factor loadings ทหาได
•คลก Analyze>Data Reduction>Factor
•คลกใหตวแปรทงหมด(pn1-pn20) ไปอยในกลอง Variable box
•คลกทป ม Descriptives และคลกเอาเครองหมายทเราตกไวในกลอง Initial Solution กลองCoefficients และกลอง
KMO and Bartlett’s test ออก เพอเราจะไดไมตองวนกลบไปทาอก เปนการซาซอน คลกcontinue
•คลกทป ม Extraction แตเรายงคงเลอกตกPrincipal Components ในสวนของ Method Correlation matrix ในสวน
ชอง Analyze Scree plot และ Unrotated factor solution ในสวนของ Display
•ในสวนของ Extract เราจะเลอก Number of Factors และใหพมพจานวนองคประกอบทเราจะเกบไวจานวน 2
องคประกอบ
•คลกทป ม Options ในสวนของMissing Valuesใหเลอก Exclude cases pairwise ในสวนของ Coefficient Display
Format ใหเลอก Sorted by size และ Suppress absolute values less than 0.3
11
•คลกทป ม Rotation ในสวนของMethod เลอก Varimax
12
•คลก Continue และ OK
Computer output ทเกดจากการ rotate แสดงไดดงน
ตารางดานบนแสดงผลทเกดจากการ rotate โดยกาหนดขนาดององคประกอบเทากบสอง
ตารางถดไปแสดง factor loadings ของตวแปรในแตละองคประกอบ
13
โปรดสงเกตวา ตวแปรทม loadings ในองคประกอบทหนง เปนความรสกทดทมตอบคคล สงของ สถาการณทงหมด
แยกออกจากตวแปรทม loadings ในองคประกอบทสอง ซงเปนความรสกในทางลบตอบคคล สงของ ถานการณทงหมดโดย
เดดขาด กลาวอกนยหนงกคอ ไมผดเพยนจากความจรงมากนกถาจะกลาววา องคประกอบทหนงคอความรสกในดานด สวน
องคประกอบทสองเปนความรสกในทางลบ อยางรกตาม เราอาจสงวนทาทไวตอนนและอยาเพงดวนสรปผลทไดจนกวาเรา
จะทาการ rotate ในรปแบบอน เพอเพมความมนใจของเรา
•คลก Analyze>Data Reduction>Factor
•คลกใหตวแปรทงหมด(pn1-pn20) ไปอยในกลอง Variable box
•ในสวนของ Extract เราจะเลอก Number of Factors และใหพมพจานวนองคประกอบทเราจะเกบไวจานวน 2
องคประกอบ
•คลกทป ม Options ในสวนของMissing Valuesใหเลอก Exclude cases pairwise ในสวนของ Coefficient Display
Format ใหเลอก Sorted by size และ Suppress absolute values less than 0.3
•คลกทป ม Rotation ในสวนของMethod เลอก Direct Oblimin
14
Computer output จากการ rotate ดวยวธ Oblimin ปรากฏผลดงน
จาก Pattern Matrix จะเหนไดวา solution ทไดคลายคลงกบทไดโดยวธ Varimax สวนตารางถดไปเปน Structure
Matrix ซงใหขอมลเกยวกบความสมพนธระหวางตวแปรและองคประกอบ
15
ตารางสดทายทไดจากการ rotate แบบ Oblimin แสดงใหเหนวา ความสมพนธระหวางองคประกอบทงสองอยในอตราตา (
correlation coefficient = -.277 เปนการสนบสนนการ rotate แบบ Varimax ทตงอยบนสมมตฐานทวา องคประกอบ
ตองมความสมพนธตาหรอไมมเลย เปนสมมตฐานทสมเหตสมผลจากขอมลทได
Contribution this issue: ดร. ดนย ปตตพงศ