การวิเคราะห์ข้อมูลk4ds.psu.ac.th/shf/hna/files/hnadataanalysis.pdf ·...
TRANSCRIPT
การวเคราะหขอมล
ดร.นพ.วรสทธ ศรศรวชย
มลนธสขภาพภาคใต
โครงการพฒนาศกยภาพบคลากรดานการประเมนความจ าเปนดานสขภาพ เพอรองรบการบรหารจดการเขตสขภาพท 12
2
Reference: รศ.ดร.บณฑต ถนค ำรพ Workbook of Statistics
การวเคราะหขอมลทางสถต
1. สถตเชงพรรณนา Descriptive statistics
2. สถตเชงเปรยบเทยบ Comparative statistics
3. สถตเชงความสมพนธ Associative statistics
สถตเชงพรรณนาDescriptive Statistics
5
คากลาง
• สถตทนยมใชอธบายคากลาง เชน– คาเฉลย (Mean)
– คามธยฐาน (Median)
– คาฐานนยม (Mode)
6
คาเฉลย (Mean)
• คาเฉลย (Mean) ใชกบขอมลตอเนอง (Continuous variable) ทมการกระจายแบบปกต (Normal distribution) โดยการน าเอาคาของขอมลแตละตวมารวมกนแลวหารดวยจ านวนขอมลทงหมด
7
คามธยฐาน (Median)
• คามธยฐาน (Median) ใชกบขอมลทมการกระจายแบบไมปกต (Not normal distribution) เปนคาของขอมลทอยกงกลางของขอมลทงหมดหลงจากเรยงล าดบขอมลจากนอยไปมากหรอจากมากไปนอย
ตวอยาง จงหาคามธยฐานของขอมล 3, 7, 19, 25, 12, 18, 10
วธท า เรยงขอมลจากนอยไปมากได 3, 7, 10, 12, 18, 19, 25
ขอมลมทงหมด 7 ตว เมอเรยงล าดบขอมลแลวตวเลขทอยต าแหนงตรงกลาง คอ ตวเลขต าแหนงท 4 = (จ านวนขอมลทงหมด + 1)/2) ดงนนมธยฐานจงมคาเทากบ 12
8
คาฐานนยม (Mode)
• คาฐานนยม (Mode) เปนคาของขอมลทมความถสงสดในชดขอมลนน คาฐานนยมใชเปนคากลางไดกบขอมลทกประเภท
ตวอยาง จงหาฐานนยมของขอมลชดน 3, 2, 5, 3, 3,
3, 3, 3, 3, 5
วธท า ขอมลม 2 จ านวน 1 คา ม 3 จ านวน 7 คา ม 5 จ านวน 2 คา ดงนน ฐานนยมของขอมล คอ 3
9
การกระจาย
• สถตทนยมใชอธบายการกระจายของขอมล เชน– คาเบยงเบนมาตรฐาน (Standard deviation, SD)
– พสย (range)
– คาพสยระหวางควอไทล (interquartile range, IQR)
10
คาเบยงเบนมาตรฐาน
• คาเบยงเบนมาตรฐาน (Standard deviation, SD) เปนการอธบายดการกระจายของขอมลตอเนอง
SD S
X X
N
ii
N
2
1
11
พสย (range)
• พสย (range) เปนการอธบายการกระจายทงายทสด ใชแสดงลกษณะการกระจายของขอมลอยางหยาบๆ โดยหาความแตกตางของขอมลสงสดและต าสดของกลม
ตวอยาง ขอมลคอ 10, 12, 15, 18 และ 20
วธท า พสย = 20 - 10 = 10
12
พสย (range)
• ขอมลทมพสยกวาง แสดงวามการกระจายของขอมลมาก แตคาพสยทค านวณจากขอมลทมคาสงหรอต าผดปกตอยในชดขอมลจะท าใหพสยไมสามารถสะทอนการกระจายทแทจรง
• พสยใชไดกบทงขอมลล าดบและขอมลตอเนอง และเหมาะสมส าหรบการวดการกระจายของขอมลจ านวนนอยๆ เพราะงายตอการค านวณ
13
เปอรเซนไทล (percentile)
• เปอรเซนไทล (percentile) เปนการแบงขอมลออกเปน 100 สวนเทาๆ กน โดยต าแหนงทแบงม 99 คา คอ P1 P2 P3 ... P99โดยมธยฐาน = P50
Pi =i = ต าแหนงของเปอรเซนไทล
n = จ านวนขอมลทงหมด
14
ควอไทล (Quartile)
• ควอไทล (Quartile) เปนการแบงขอมลออกเปน 4 สวนเทาๆ กน โดยต าแหนงทแบงม 3 คาคอ Q1 Q2 Q3– ควอไทลท 1 (Q1) คอ จ านวนทแบงขอมลออกเปน 25% ทมคานอยกวา
และ 75% ทมคามากกวา (P25)– ควอไทลท 2 (Q2) คอ คามธยฐาน– ควอไทลท 3 (Q3) คอ จ านวนทแบงขอมลเปน 75% ทมคานอยกวา และ
25% ทมคามากกวา (P75)
i = ต าแหนงของควอไทลn = จ านวนขอมลทงหมด
15
คาพสยระหวางควอไทล
• คาพสยระหวางควอไทล (interquartile range, IQR) เปนวดการกระจายของขอมลดวยผลตางระหวางควอไทลท 3 และควอไทลท 1
ตวอยาง ขอมลอาย 10 คน = 6 17 25 31 41 48 48 70 88 92
วธท า คาพสยระหวางควอไทล (IQR) = Q3-Q1 = 70-25 = 45 (25, 70)
คาพสยระหวางควอไทลใชอธบายขอมลล าดบและขอมลตอเนอง ซงจะแสดงใหเหนวา รอยละ 50 ของขอมลทอยตรงกลางมชวงหางเทาใด
สถตเชงเปรยบเทยบ Comparative Statistics
17
การเปรยบเทยบขอมล
• การเปรยบเทยบขอมลแบงเปน 2 ประเภท– การเปรยบเทยบขอมลชนดตวแปรตอเนอง
– การเปรยบเทยบขอมลชนดตวแปรกลม
18
19
20
การเลอกใชสถต (ตอ)
• ตวอยาง 1: การเปรยบเทยบ ความเรว ในการขบรถของคนขบรถเพศชาย และ เพศหญง
• ใชสถต 2 sample t-test เพอทดสอบวาความแตกตางของ ความเรว เกดขนเพราะโอกาส (chance) จากการสมหรอไม
21
• หญง VS ชาย ใครขบ เรว กวากน?
N = 10,000 nช1 = 100 100
nญ1 = 100
100
การเลอกใชสถต (ตอ)
Mean ญ1 = 40
Mean ช1 = 100nญ2 = 100
100
Mean ญ2 = 130
22
• ตวอยาง 2: การประเมนผลโครงการรณรงคสงเสรมการไมขบรถเรวเกนก าหนด ประกอบดวยตวแปร
A. กลมการรณรงค (Group) คอ – การรณรงคดวยสอมวลชน (Group = 1)
– การรณรงคดวยมาตรการองคกร (Group = 2)
B. ความเรว ทวดในชวง:1. กอนด าเนนการรณรงค 1 เดอน (PreSpeed)
2. หลงด าเนนการรณรงค 1 เดอน (PostSpeed)
การเลอกใชสถต (ตอ)
23
การเลอกใชสถต (ตอ)
• ค าถามยอย 1: หลงจากรณรงคไปแลว 1 เดอน ความเรว ของกลมตวอยางทไดรบการรณรงคดวยสอมวลชน จะแตกตางไปจากกลมทไดรบการรณรงคดวยมาตรการองคกร หรอไม?
• ใชสถต 2 sample t-test for independent samples เพอทดสอบวาความแตกตางของ ความเรว ใน 2 กลมทการรณรงคตางกนเกดขนเพราะโอกาส (chance) จากการสมหรอไม
24
การเลอกใชสถต (ตอ)
• ค าถามยอย 2: ความเรวของกลมตวอยางหลงจากผานการรณรงคไปแลว 1 เดอน จะแตกตางไปจาก ความเรวกอนการรณรงค หรอไม?
• ใชสถต paired t-test for dependent samples เพอทดสอบวาความแตกตางของ ความเรว ในกลมเดยวกนกอนและหลงการรณรงค เกดขนเพราะโอกาส (chance) จากการสมหรอไม
25
การเลอกใชสถต (ตอ)
• ตวอยาง 3 การศกษาผลของ ลกษณะงาน (Group) ของพนกงานโรงงาน 3 กลมทมสภาพการท างานแตกตางกน วาจะม ความรในการขบรถ (Knowledge) แตกตางกนหรอไม
• ใชสถต ANOVA เพอทดสอบวา ความรในการขบรถ ในพนกงานทม สภาพการท างานแตกตางกน 3 กลม เกดขนเพราะโอกาส (chance) จากการสมหรอไม
26
การเลอกใชสถต (ตอ)
• ตวอยาง 4 การประเมนประสทธผลในการรณรงคการไมขบรถเรวเกนก าหนด โดยดจาก ความเรวทวดในชวงหลงด าเนนการรณรงค 1 เดอน (PostSpeed) กบ คะแนนความรในการขบรถ(Knowledge) วาตวแปรทงสองนมความสมพนธกนหรอไม อยางไร
• ใชสถต Pearson Correlation เพอทดสอบและหาระดบความสมพนธของ ความเรว (PostSpeed) กบ ความร (Knowledge)
สถตเชงความสมพนธAssociative Statistics
28
สถตเชงความสมพนธ
• ใชในการหาความสมพนธระหวางตวแปร 2 ตวหรอมากกวา ชวยใหสามารถท านายคาของตวแปรหนงจากอกตวแปรหนงได เชน ความสมพนธระหวาง การบงคบใชกฎหมายการสวมหมวกนรภย กบ การบาดเจบทศรษะ โดยความสมพนธระหวางตวแปรทควรพจารณา คอ
1. การทดสอบความสมพนธระหวางตวแปร
2. การหาขนาดความสมพนธระหวางตวแปร
29
การทดสอบความสมพนธระหวางตวแปร
• วเคราะหโดยใชตารางไขว (Cross tabulation) ในการสรปความสมพนธระหวาง 2 ตวแปรทเปนตวแปรกลม
• ตารางแสดงความสมพนธระหวางตวแปรอาจมขนาดตางๆ ขนอยกบจ านวนกลมของตวแปรแตละตว
• ในดานวทยาศาสตรสขภาพสวนใหญเปนความสมพนธระหวาง การเกดโรคกบปจจยการเกดโรค– ตวแปรผล/ตวแปรตาม มกแบงเปน 2 กลม คอ เปนโรค หรอ ไมเปนโรค – ตวแปรปจจย/ตวแปรตน มกแบงเปน 2 กลม คอ มปจจยเสยง หรอ ไมมปจจยเสยง
• ผลการศกษาจงแสดงอยในรปตาราง 2 x 2 แลวทดสอบความสมพนธดวยสถตChi square (X2) หรอ Fisher’s exact test
30
การหาขนาดความสมพนธระหวางตวแปร
• Risk ratio (RR)– เปนสถตทใชบอกขนาดความแตกตางของอตราการเกดโรคใน กลมทไดรบ
ปจจยเสยง วามจ านวนเปนกเทาของ กลมทไมไดรบปจจยเสยง
• Odds ratio (OR) – เปนการเปรยบเทยบอตราสวนของการเปนโรคและไมเปนโรคใน กลมท
ไดรบปจจยเสยง และ ไมไดรบปจจยเสยง
31
Risk Ratio (RR)
• เปนสถตทใชบอกขนาดความแตกตางของอตราการเกดโรคใน กลมทไดรบปจจยเสยง วาเปนกเทาของ กลมทไมไดรบปจจยเสยง
• RR = อตราการเกดโรคในกลมทไดรบปจจยเสยงอตราการเกดโรคในกลมทไมไดรบปจจยเสยง
• การแปลผล คอ RR > 1 กลมไดรบปจจยเสยงเสยงกวาRR < 1 กลมไมไดรบปจจยเสยงเสยงกวาRR = 1 ทงกลมไดหรอไมไดรบปจจยเสยงเสยงเทากน
32
Risk Ratio (RR) (ตอ)
• การค านวณคา RR จากสดสวนของการเกดโรคจะตองทราบจ านวนคนทไดรบหรอไมไดรบปจจยเสยง แลวตดตามคน 2 กลมดงกลาวเพอค านวณอตราการเกดโรคทแทจรง ท าให RR ใชไดกบขอมลจากการศกษาแบบมกลมตดตามผล (cohort study) หรอการทดลองเทานน สวนขอมลทไมสามารถหาอตราการเกดโรคทแทจรงได จะหาขนาดความสมพนธดวย Odds ratio
33
Risk Ratio (RR) (ตอ)
• ตวอยาง หาคา RR จากตารางดานลาง เพอดขนาดของความสมพนธ
จากผลการค านวณไดคา RR = [10/(10+40)] / [2/(2+48)] = 5
แสดงวา คนทท างานซอมเครองยนต จะมโอกาสเกดอบตเหตทางถนนเปน 5 เทา ของ คนทท างานส านกงาน
ลกษณะงาน
อบตเหตทางถนน
เกด ไมเกด รวม
ท างานซอมเครองยนต 10 40 50
ท างานส านกงาน 2 48 50
รวม 12 88 100
34
Odds Ratio (OR)
• เปนการเปรยบเทยบอตราสวนของการเปนโรคและไมเปนโรคในกลมทไดรบปจจยเสยง และ ไมไดรบปจจยเสยง
• OR = อตราสวนการเปนโรคและไมเปนโรคในกลมทไดรบปจจยเสยงอตราสวนการเปนโรคและไมเปนโรคในกลมทไมไดรบปจจยเสยง
• การแปลผล OR > 1 โอกาสเปนโรคในกลมทไดรบปจจยเสยงสงกวาOR < 1 โอกาสเปนโรคในกลมทไมไดรบปจจยเสยงสงกวาOR = 1 ไดหรอไมไดรบปจจยเสยงโอกาสเปนโรคเทากน
35
Odds Ratio (OR) (ตอ)
• ตวอยางเมอ 2 กลมเปนอสระตอกน
การศกษาการวจยเชงวเคราะหแบบภาคตดขวาง (cross-sectionalanalytical study) เพอดวาการเกด อบตเหตทางถนน ของผชายวยท างานมความสมพนธกบ อาย หรอไม
กลมอาย (ป)
อบตเหตทางถนน
เกด ไมเกด รวม
20-40 15 65 80
41-60 5 115 120
รวม 20 180 200
36
Odds Ratio (OR) (ตอ)
ค านวณคา OR ในกรณทประชากรทง 2 กลมเปนอสระตอกน
OR = (15/65)/(5/115) = 5.3
จากคา OR ไดแสดงวาคาโอกาสของการเกด อบตเหตทางถนน ของผชาย กลมอาย 20-40 ป สงเปน 5.3 เทาของ กลมอาย 41–60 ป
กลมอาย (ป)
อบตเหตทางถนน
เกด ไมเกด รวม
20-40 15 65 80
41-60 5 115 120
รวม 20 180 200
37
Odds Ratio (OR) (ตอ)
• ตวอยางเมอ 2 กลมไมเปนอสระตอกน
การศกษาวาผชายท ดมเหลา มโอกาสเกด อบตเหตทางถนนมากกวาผชายท ไมดมเหลา หรอไม ออกแบบงานวจยเปนแบบกลมผปวย–ไมปวยทถกจบคดวยอายและเพศ (Matched case-control study) มผลการศกษาดงน
กลมเกดอบตเหตทางถนน
ดม ไมดม รวม
กลมไมเกดอบตเหตทางถนน(กลมควบคม/Control)
ดม 2 3 5
ไมดม 10 25 35
รวม 12 28 40
38
Odds Ratio (OR) (ตอ)
ค านวณคา OR ในกรณทประชากรทง 2 กลมไมเปนอสระตอกน
OR = 10/3 = 3.3
กลมเกดอบตเหตทางถนน
ดม ไมดม รวม
กลมไมเกดอบตเหตทางถนน(กลมควบคม/Control)
ดม 2 3 5
ไมดม 10 25 35
รวม 12 28 40
39
ความสมพนธระหวาง RR กบ OR
• ในกรณทมอตราการเกดโรคต าๆ เชน < รอยละ 5 คา a จะเลกมากเมอเทยบกบคา b และคา c จะเลกมากเมอเทยบกบคา d จงท าใหสดสวนการเปนโรค (RR) มคาใกลเคยงกบคาอตราสวนของการเปนโรค (OR) ดงนนจงสามารถแปรผล OR ไดเหมอนกน RR
• RR = (2/100) / (8/900) = 2.25 VS OR = (2/98) / (8/892) = 2.28
ปจจย
อบตเหตทางถนน
เกด ไมเกด รวม
ม 2 (a) 98 (b) 100 (a+b)
ไมม 8 (c) 892 (d) 900 (c+d)
รวม 10 (a+c) 990 (b+d) 1,000 (a+b+c+d)
40