sinh thỐng kÊ cĂn bẢn
DESCRIPTION
GS TS LÊ HOÀNG NINH. SINH THỐNG KÊ CĂN BẢN. Mục tiêu. Tổng quan về các khái niệm và các từ dùng trong sinh thống kê Áp dụng các test thống kê. Tại sao dùng thống kê ?. Thống kê mô tả Nhận diện kiểu hình Đặt một giả thuyết Thống kê suy lý Phân biệt , làm rõ các sự khác biệt thật - PowerPoint PPT PresentationTRANSCRIPT
GS TS LÊ HOÀNG NINH
Mục tiêu
Tổng quan về các khái niệm và các từ dùng trong sinh thống kê
Áp dụng các test thống kê
Tại sao dùng thố�ng kê?
Thống kê mô tả• Nhận diện kiểu hình • Đặt một giả thuyết
Thống kê suy lý• Phân biệt , làm rõ các sự khác biệt thật
• Cho phép kiểm định một giả thuyết
Tại sao dùng thố�ng kê?
Cardiovascular Mortality in Males
0
0.2
0.4
0.6
0.8
1
1.2
'35-'44 '45-'54 '55-'64 '65-'74 '75-'84
SMR BangorRoseto
AJPH 1992
Các loại dữ liệu
Số Liên tục Rời
Loại tên Thứ tự
Thố�ng kê mố ta�
Nhận ra kiểu hình dữ liệu Nhận ra những ngoại lệ, bên ngoài Hướng chọn test thống kê
Tỷ lệ mẫu dương tính với bệnh X năm 1998-99
05
101520253035
South
Northeast
West
Midwest
Thố�ng kê mố ta�
Mố ta� dữ liệu bằng con số�
Số đo khuynh hướng trung tâm• Số trung bình --MEAN • Số trung vị -- trị số ở giữa• MODE – các trị số có tần số xuất hiện
cao nhất
Phân bố� thứ hạng sinh viên trong khóa học 2013
0
2
4
6
8
10
12
14
Number of Students
A A- B+ B B- C+ C C- D+ D D- F
Grade
Mố ta� dữ liệu bằng con số�
Các số đo độ phân tán • Biên độ • Độ lệch chuẩn STANDARD DEVIATION• Độ nghiên SKEWNESS
Số� đo độ phân tán
• Biên độ Trị số cao và thấp nhất
• Độ lệch chuẩn SD Đo độ gần của dữ liệu so với trị số
trung bình• Độ nghiên
Xem tính đối xứng của đường cong
Số� đo độ phân tán
• RANGE highest to lowest values
• Độ lệch chuẩn how closely do values cluster around
the mean value• Độ nghiên
refers to symmetry of curve
Độ lệch chuâ�n Standard Deviation
B
A
Curve B
Curve A
Số� đo độ phân tán
• RANGE highest to lowest values
• STANDARD DEVIATION how closely do values cluster around
the mean value• Độ nghiên SKEWNESS
refers to symmetry of curve
Skewness
Curve A
Curve B
negative skew
Mo
de
Me
dia
n
Me
an
Phân phố�i bình thường
TB = TV = Mode Độ nghiên = 0 68% trị số trong
khoảng 1 SD 95% trị số trong
khoảng 2 SDs
.
Me
an
, Med
ian
, Mo
de
1
2
Thố�ng kê suy lý
Dùng để xác định khả năng một kết luận dựa trên bô dữ liệu trên một mẫu là đúng trên quần thể.
Các từ
Giá trị p : khả năng, xác suất sự khác biệt quan sát được có thể xảy ra là do cơ hội. (chance)
Thư� nghiệm cao huyê�t áp
DRUG Baseline mean SBP F/u mean SBP
A 150 130
B 150 125
Từ
Khoảng tin cậy:Là biên độ các trị số mà chắc chắn là
có chứa trị số thật trên quần thể
30 Day % Mortality
Study IC STK Control p N
Khaja 5.0 10.0 0.55 40
Anderson 4.2 15.4 0.19 50
Kennedy 3.7 11.2 0.02 250
95% Confidence Intervals
-.40 -.35 -.30 -.25 -.20 -.15 -.10 -.05 .00 .05 .10 .15 .20
Khaja(n=40)
Anderson(n=50)
Kennedy(n=250)
Các kiê�u sai lâ>m
Nodifference
Difference
Nodifference
TYPE IIERROR ()
Difference TYPE IERROR ()
Sự thật
Kết luận
Power = 1-
Test nào được sư� dụng?
1. What type of data?
2. How many samples?
3. Are the data normally distributed?
4. What is the sample size?