sinh thỐng kÊ cĂn bẢn

24
GS TS LÊ HOÀNG NINH

Upload: aquarius

Post on 05-Jan-2016

68 views

Category:

Documents


2 download

DESCRIPTION

GS TS LÊ HOÀNG NINH. SINH THỐNG KÊ CĂN BẢN. Mục tiêu. Tổng quan về các khái niệm và các từ dùng trong sinh thống kê Áp dụng các test thống kê. Tại sao dùng thống kê ?. Thống kê mô tả Nhận diện kiểu hình Đặt một giả thuyết Thống kê suy lý Phân biệt , làm rõ các sự khác biệt thật - PowerPoint PPT Presentation

TRANSCRIPT

Page 1: SINH THỐNG KÊ  CĂN BẢN

GS TS LÊ HOÀNG NINH

Page 2: SINH THỐNG KÊ  CĂN BẢN

Mục tiêu

Tổng quan về các khái niệm và các từ dùng trong sinh thống kê

Áp dụng các test thống kê

Page 3: SINH THỐNG KÊ  CĂN BẢN

Tại sao dùng thố�ng kê?

Thống kê mô tả• Nhận diện kiểu hình • Đặt một giả thuyết

Thống kê suy lý• Phân biệt , làm rõ các sự khác biệt thật

• Cho phép kiểm định một giả thuyết

Page 4: SINH THỐNG KÊ  CĂN BẢN

Tại sao dùng thố�ng kê?

Cardiovascular Mortality in Males

0

0.2

0.4

0.6

0.8

1

1.2

'35-'44 '45-'54 '55-'64 '65-'74 '75-'84

SMR BangorRoseto

AJPH 1992

Page 5: SINH THỐNG KÊ  CĂN BẢN

Các loại dữ liệu

Số Liên tục Rời

Loại tên Thứ tự

Page 6: SINH THỐNG KÊ  CĂN BẢN

Thố�ng kê mố ta�

Nhận ra kiểu hình dữ liệu Nhận ra những ngoại lệ, bên ngoài Hướng chọn test thống kê

Page 7: SINH THỐNG KÊ  CĂN BẢN

Tỷ lệ mẫu dương tính với bệnh X năm 1998-99

05

101520253035

South

Northeast

West

Midwest

Thố�ng kê mố ta�

Page 8: SINH THỐNG KÊ  CĂN BẢN

Mố ta� dữ liệu bằng con số�

Số đo khuynh hướng trung tâm• Số trung bình --MEAN • Số trung vị -- trị số ở giữa• MODE – các trị số có tần số xuất hiện

cao nhất

Page 9: SINH THỐNG KÊ  CĂN BẢN

Phân bố� thứ hạng sinh viên trong khóa học 2013

0

2

4

6

8

10

12

14

Number of Students

A A- B+ B B- C+ C C- D+ D D- F

Grade

Page 10: SINH THỐNG KÊ  CĂN BẢN

Mố ta� dữ liệu bằng con số�

Các số đo độ phân tán • Biên độ • Độ lệch chuẩn STANDARD DEVIATION• Độ nghiên SKEWNESS

Page 11: SINH THỐNG KÊ  CĂN BẢN

Số� đo độ phân tán

• Biên độ Trị số cao và thấp nhất

• Độ lệch chuẩn SD Đo độ gần của dữ liệu so với trị số

trung bình• Độ nghiên

Xem tính đối xứng của đường cong

Page 12: SINH THỐNG KÊ  CĂN BẢN

Số� đo độ phân tán

• RANGE highest to lowest values

• Độ lệch chuẩn how closely do values cluster around

the mean value• Độ nghiên

refers to symmetry of curve

Page 13: SINH THỐNG KÊ  CĂN BẢN

Độ lệch chuâ�n Standard Deviation

B

A

Curve B

Curve A

Page 14: SINH THỐNG KÊ  CĂN BẢN

Số� đo độ phân tán

• RANGE highest to lowest values

• STANDARD DEVIATION how closely do values cluster around

the mean value• Độ nghiên SKEWNESS

refers to symmetry of curve

Page 15: SINH THỐNG KÊ  CĂN BẢN

Skewness

Curve A

Curve B

negative skew

Mo

de

Me

dia

n

Me

an

Page 16: SINH THỐNG KÊ  CĂN BẢN

Phân phố�i bình thường

TB = TV = Mode Độ nghiên = 0 68% trị số trong

khoảng 1 SD 95% trị số trong

khoảng 2 SDs

.

Me

an

, Med

ian

, Mo

de

1

2

Page 17: SINH THỐNG KÊ  CĂN BẢN

Thố�ng kê suy lý

Dùng để xác định khả năng một kết luận dựa trên bô dữ liệu trên một mẫu là đúng trên quần thể.

Page 18: SINH THỐNG KÊ  CĂN BẢN

Các từ

Giá trị p : khả năng, xác suất sự khác biệt quan sát được có thể xảy ra là do cơ hội. (chance)

Page 19: SINH THỐNG KÊ  CĂN BẢN

Thư� nghiệm cao huyê�t áp

DRUG Baseline mean SBP F/u mean SBP

A 150 130

B 150 125

Page 20: SINH THỐNG KÊ  CĂN BẢN

Từ

Khoảng tin cậy:Là biên độ các trị số mà chắc chắn là

có chứa trị số thật trên quần thể

Page 21: SINH THỐNG KÊ  CĂN BẢN

30 Day % Mortality

Study IC STK Control p N

Khaja 5.0 10.0 0.55 40

Anderson 4.2 15.4 0.19 50

Kennedy 3.7 11.2 0.02 250

Page 22: SINH THỐNG KÊ  CĂN BẢN

95% Confidence Intervals

-.40 -.35 -.30 -.25 -.20 -.15 -.10 -.05 .00 .05 .10 .15 .20

Khaja(n=40)

Anderson(n=50)

Kennedy(n=250)

Page 23: SINH THỐNG KÊ  CĂN BẢN

Các kiê�u sai lâ>m

Nodifference

Difference

Nodifference

TYPE IIERROR ()

Difference TYPE IERROR ()

Sự thật

Kết luận

Power = 1-

Page 24: SINH THỐNG KÊ  CĂN BẢN

Test nào được sư� dụng?

1. What type of data?

2. How many samples?

3. Are the data normally distributed?

4. What is the sample size?