curso de bioestadística parte 17 métodos no paramétricos dr. en c. nicolás padilla raygoza...
TRANSCRIPT
Curso de BioestadísticaParte 17
Métodos no paramétricos
Dr. en C. Nicolás Padilla RaygozaDepartamento de Enfermería y ObstetriciaDivisión Ciencias de la Salud e Ingenierías
Campus Celaya-SalvatierraUniversidad de Guanajuato México
Presentación
Médico Cirujano por la Universidad Autónoma de Guadalajara. Pediatra por el Consejo Mexicano de Certificación en Pediatría. Diplomado en Epidemiología, Escuela de Higiene y Medicina
Tropical de Londres, Universidad de Londres. Master en Ciencias con enfoque en Epidemiología, Atlantic
International University. Doctorado en Ciencias con enfoque en Epidemiología, Atlantic
International University. Profesor Asociado C, Departamento de Enfermería y
Obstetricia, División Ciencias de la Salud e Ingenierías, Campus Celaya Salvatierra, Universidad de Guanajuato.
Competencias
Aplicará pruebas no paramétricas para análisis de datos
Obtendrá intervalo de confianza para análisis no paramétrico
Aplicará prueba de rangos señalados de Wilcoxon
Aplicará prueba de suma de rangos de Wilcoxon
Alicará r de Spearman.
Introducción
Métodos paramétricos Se basan en medias, desviaciones estándar o
probabilidades. La distribución Normal no es siempre
apropiada Para estudiar variables con pocas
observaciones, Distribuciones asimétricas, o Variables que pueden tomar más de dos
valores
Introducción (contd…)
Cuando sucede lo anterior, usamos otros métodos de análisis
Métodos no paramétricos No se basan en las mismas suposiciones que
los medios paramétricos, pero también tienen algunas suposiciones.
Categorías (ranking), medias, mediana
Algunos métodos no paramétricos usan los rankings en lugar de los valores reales.
Las categorías se usan para comparar los datos, más por el ranking que por su tamaño.
Paciente Glucosa en sangre (mg/dl)
1 135
2 225
3 70
4 100
5 110
6 150
7 90
8 100
9 170
10 60
11 80
Categorías (ranking), medias, mediana
Rankeamos en orden ascendente
Paciente Glucosa en sangre (mg/dl)
Ranking
10 60 1
3 70 2
11 80 3
7 90 4
4 100 5
8 100 6
5 110 7
1 135 8
6 150 9
9 170 10
2 225 11
¿Son la media y la mediana, iguales?
Para usar la media y que el intervalo de confianza sea adecuado, la distribución de los valores debe ser simétrica.
En cambio, para que la mediana y su intervalo de confianza sean adecuados, no se requiere suposiciones.
¿Son la media y la mediana, iguales?
Usando el orden (ranking) en lugar de los valores originales, disminuye la necesidad de suposiciones acerca de la distribución, se hacen los cálculos más simples y rápidos.
La desventaja es que los valores originales se pierden.
Por esto, los métodos no paramétricos se usan sólo para probar hipótesis, no para estimación de efectos.
Métodos no paramétricos
Situación Método no paramétrico
Método paramérico
Muestra única Prueba de rangos señalados de Wilcoxon
Prueba de Z (prueba de t)
Dos muestras independientes
Suma de rangos señalados de Wilcoxon
Prueba de Z para dos muestras independientes (Prueba t)
Dos muestras pareadas
Prueba de rangos señalados de Wilxocon
Prueba de Z pareada (Prueba t pareada)
Muestra única, dos variables
Coeficiente de correlación de Spearman
Coeficiente de correlación de Pearson
Datos de una muestra
Se muestran los datos de los 11 pacientes con niveles de glucosa.
Queremos saber si el promedio es de 100 mg/dl.Paciente Glucosa en sangre
(mg/dl)Ranking
10 60 1
3 70 2
11 80 3
7 90 4
4 100 5
8 100 6
5 110 7
1 135 8
6 150 9
9 170 10
2 225 11
Datos de una muestra
La prueba no paramétrica alternativa es la prueba de rangos señalados de Wilcoxon.
Puede ser usada para evaluar si los valores de la muestra están centrados en 100 mg/dl.
Esta prueba no requiere Normalidad de la distribución de los datos, pero requiere que la distribución sea simétrica, aunque no es necesario que tome la forma de “campana” como la Normal.
Datos de una muestra
La prueba de rangos señalados de Wilcoxon es calculada por los siguientes seis pasos:
1. Calcule la diferencia entre cada observación y el valor de interés, 100 mg/dl.
2. Excluya cualquier diferencia = 0.3. Clasifique y ordene (ranking) las diferencias por
magnitud, ignorando el signo.4. Sume las categorías con diferencias positivas.5. Sume las categorías de las diferencias negativas.6. Seleccione el más pequeño de las dos sumas y
llámelo T.
Datos de una muestra
Paciente Glucosa en sangre (mg/dl)
Diferencias con 100 mg/dl
Rnking
10 60 -40 6
3 70 -30 4
11 80 -20 3
7 90 -10 2
4 100 0
8 100 0
5 110 10 1
1 135 35 5
6 150 50 7
9 170 70 8
2 225 125 9
Dos grupos independientes
30 adolescentes con apendicitis aguda, fueron distribuidos 15 para ser sometidos a apendicetomía tradicional y 15 para apendicetomía por laparoscopía.
En ambos casos se valoró el dolor postoperatorio.
Dolor postoperatorio Tradicional Laparoscopía
Ninguno 1 3
Leve 5 7
Moderado 5 4
Severo 4 1
Total 15 15
Dos grupos independientes
Para comparar el dolor postoperatorio en los dos grupos, podemos usar la prueba de suma de rangos de Wilcoxon.
Definimos la hipótesis nula Ho: las dos distribuciones se sobreponen.
Definimos la hipótesis alternativa Hi: las dos distribuciones no se sobreponen.
Dos grupos independientes
La prueba de suma de rangos de Wilcoxon consta de tres pasos: Ordenar los valores de ambos grupos en
orden ascendente. Calcular T como la suma de los rankings de la
muestra más pequeña o de uno de los grupos, si son iguales.
Compara el valor de T en la tabla de valores críticos de la suma de rangos de Wilcoxon.
Dos grupos independientes
Dolor postoperatorio Tradicional Laparoscopía
Rankings
Ninguno 1 1+
Ninguno 3 4
Leve 5 9+
Leve 7 16
Moderado 5 21+
Moderado 4 25
Severo 4 29+
Severo 1 30
Total 15 15
Dos grupos pareados La tabla muestra las horas de mejoría que proporcionan dos
analgésicos en 12 pacientes con artritis reumatoide. Para probar que la mejoría es la misma con los dos analgésicos
podemos usar la t pareada o la prueba de rangos señalados de Wilcoxon.
En ambos se calcula la diferencia en horas de mejoría para cada paciente. Paciente Analgésico A Analgésico B
1 3.5 3.5
2 3.6 5.7
3 2.6 2.9
4 2.6 2.4
5 7.3 9.9
6 3.4 3.3
7 14.9 16.7
8 6.6 6.0
9 2.3 3.8
10 2.0 4.0
11 6.8 9.1
12 8.5 26.9
Dos grupos pareados
Con la prueba de rangos señalados de Wilcoxon, no se requiere Normalidad, sino que estén los datos simétricos a ambos lados de la mediana.
Ho: diferencia de medianas = 0 Hi= diferencia de medianas ≠ 0Paciente Analgésico A Analgésico B Diferencia Rankings
1 3.5 3.5 0
2 3.6 5.7 -2.1 8
3 2.6 2.9 -0.3 3
4 2.6 2.4 0.2 2
5 7.3 9.9 -2.6 10
6 3.4 3.3 0.1 1
7 14.9 16.7 -1.8 6
8 6.6 6.0 0.6 5
9 2.3 3.8 -1.5 4
10 2.0 4.0 -2.0 5
11 6.8 9.1 -2.3 7
12 8.5 26.9 -18.4 11
Dos grupos pareados
Calculamos la prueba de rangos señalados de Wilcoxon para las diferencias haciendo lo siguiente:
1.- Cuente cuantas diferencias no 0 hay.2.- Ordene las diferencias por su magnitud, ignorando el signo.3.- Sume los rankings de todas las diferencias positivas.4.- Sume los rankings de todas las diferencias negativas.5.- Seleccione la más pequeña de las dos sumas y llámela T.
(Suma de diferencias – 59, suma de diferencias + 8, T = 8)6.- Compare el valor de T con las tablas de valores críticos para la
prueba de rangos señalados de Wilcoxon. T = 8, 0.01<p<0.02.
Correlación de rangos de Spearman
La tabla y gráfica muestran la incidencia de cáncer de colon y el promedio de consumo de carne per cápita en 13 países.
País Incidencia Ca Colon Promedio de consumo de carne
1 10 1
2 8 9
3 11 5
4 12 5
5 22 33
6 67 37
7 73 32
8 48 8
9 37 41
10 31 12
11 21 29
12 17 3
13 3 1
0
10
20
30
40
50
60
70
80
0 10 20 30 40 50
Consumo de carne
Inci
denc
ia d
e C
a de
Col
on x
10
0,00
0
Correlación de rangos de Spearman
Es apropiada para relaciones monotónicas, no lineales.
Se usa la misma forma de cálculo que la r de Pearson, sólo usando los rankings.
Se calcula en tres pasos: Los valores de la primera variable son ordenados, Los valores de la segunda variable son ordenados, Se aplica la fórmula de r de Pearson, usando los
rankings en lugar de los valores originales.
Correlación de rangos de Spearman
País Incidencia Ca Colon
Promedio de consumo de carne
Ranking de Cáncer
Ranking de consumo de carne
1 10 1 3 1
2 8 9 2 7
3 11 5 4 5
4 12 5 5 4
5 22 33 8 11
6 67 37 12 12
7 73 32 13 10
8 48 8 11 6
9 37 41 10 13
10 31 12 9 8
11 21 29 7 9
12 17 3 6 3
13 3 1 1 2
Comparación de métodos
Ejemplo Método paramétrico Método no paramétrico
Glucosa en sangre
Prueba de t para una muestra p>0.1
Prueba de rangos señalados de Wilcoxon, p>0.05
Intensidad del dolor postquirúrgico
t para una muestra pareada p<0.05
Prueba de suma de rangos de Wilxocon, p>0.05
Mejoría del dolor Prueba t pareada p>0.05
Prueba de rangos señalados de Wilcoxon, p<0.05
Correlación entre cáncer de colon y consumo de carne
R de Pearson, r= 0.65 R de Spearman, r=0.74
Bibliografía
1.- Last JM. A dictionary of epidemiology. New York, 4ª ed. Oxford University Press, 2001:173.
2.- Kirkwood BR. Essentials of medical ststistics. Oxford, Blackwell Science, 1988: 1-4.
3.- Altman DG. Practical statistics for medical research. Boca Ratón, Chapman & Hall/ CRC; 1991: 1-9.