bioestadistica faseii
DESCRIPTION
trabajo de estadisticaTRANSCRIPT
Población
μ: media
σ2: Varianza
π ó P: Proporción
MuestraX: media
S2: VarianzaP:proporción
MUESTREO
INFERENCIAPARÁMETROS
ESTADÍSTICOS
Inferencia Estadística
Inferencia Paramétrica• Variables cuantitativas cuyo número es mayor de
30 datos o provienen de una curva normal.• Pueden ser menos de 30 datos si es que se tiene la
seguridad que provienen de una curva normal
Inferencia No Paramétrica• Variables cualitativas y variables cuantitativas sin
curva normal
Tipos de Muestras
• Una sola muestra• Dos o más muestras: -Muestras Relacionadas o pareadas -Muestras Independientes
Estimación de ParámetrosEstimación de Parámetros
Es un proceso para obtener valores aproximados de una población (parámetros) a partir de los valores calculados de una muestra (estadísticos)
• INTERVALOS DE CONFIANZA:
a) Puntual
b) Por Intervalos
• PRUEBA DE HIPÓTESIS
INTERVALOS DE CONFIANZA
El valor de la respuesta se ofrece a través de un intervalo con una probabilidad de ocurrencia, mide el grado de confianza en la respuesta llamado nivel de confianza: 1-α
Ejemplo:
Una muestra de n=100 individuos de una población tiene un peso medio de 60 kg y desviación de 5kgEstimaciones puntuales
• 60 kg estima a μ• 5 kg estima a σ• 5/raiz(n)= 0,5 estima el error estándar (típico) EE
Estimación por Intervalos de Confianza• Hay una confianza del 68% de que μ esté en 60±0,5• Hay una confianza del 95% de que μ esté en 60±1
60
Nivel de confianza = 1-
Probabilidad de error o nivel de significancia: = 0.10, 0.05, 0.01
Prueba de HipótesisPrueba de Hipótesis
Consideraciones preliminares
• Muestras independientes o pareadas
• Varianzas iguales o diferentes
• Prueba de la normalidad
• Datos fuera de rango
• Pruebas paramétricas o no paramétricas
• El valor de “p”
Ejemplos de Hipótesis:
1. La talla de los peruanos es diferente de 1.65
2. El estado nutricional de las gestantes depende del nivel de hemoglobina
3. La talla promedio de niños con lactancia materna es mayor de los niños que no recibieron
4. La proporción de fumadores del género femenino es menor al género masculino
5. Existe relación entre los conocimientos y las prácticas que tiene la madre del niño menor de 5 años sobre la medidas preventivas de las IRA.
6. El peso final es diferente al peso inicial después de la aplicación de una dieta
Región crítica y nivel de significancia
No rechazo H0
Reg. CríticaReg. Crítica
/2a =2.5%
Nivel de significancia + Nivel de confianza = 100
/2a =2.5%
1-a=95%
a=5%
Rechazo H0
Rechazo H0
NIVEL DE SIGNIFICANCIA
0.025
0.95
0
Z= 1.96Z= - 1.96
0.025
97.5%
DISTRIBUCIÓN NORMAL ESTANDARIZADA ACUMULADA
Muestras Independientes o Pareadas
Muestras Independientes Se dice que dos o más muestras son independientes
cuando sus datos provienen de grupos diferentes, que no guardan ninguna relación entre sí.
Ejm. - Proporción de muertes neonatales de los
hospitales de Essalud y Minsa.- Estado nutricional de niños de Lima Cercado y
Chosica.- Edad gestacional de Adolescentes y Añosas.
…muestras Independientes o Pareadas
Muestras Pareadas o RepetidasSe dice que las muestras son pareadas cuando
1. Dos o más grupos de datos provienen de una misma muestra, también se denomina muestra repetida.
Ejm. Cuando se quieren determinar diferencias entre los niveles de Hb en una intervención quirúrgica en tres momentos :Hb basal, a los 10 minutos y a los 20 minutos.
2. Cuando se forman dos muestras en donde las personas son pareadas o emparejadas con otras personas que tienen las mismas características que se desean controlar.
Ejm. Se quiere determinar si el hecho de comer
pescado es un factor para contraer el cólera. Para lo cual se identifica a un grupo de personas que tuvieron la enfermedad y se emparejan cada una de ellas con otra persona que no tiene la enfermedad. Se empareja tomando en cuenta ciertos tipos de variables, edad, sexo, barrio, etc.
…muestras Independientes o Pareadas
EL VALOR DE “p”
…sea cual sea el valor de “p” y demasiadas veces de “ No hay diferencias significativas” deducimos que “no hay diferencias”.
Austin Bradford Hill
…el valor de “p”
El valor de “p” nos permitirá interpretar los resultados de un análisis de datos realizado por un software, toda vez que en este caso ya no existe la necesidad de usar tablas para comparar un valor calculado con el tabulado.
…el valor de “p”
Interpretación:
1. Si el valor de “p” es mayor que el valor de significación (α) entonces no existen diferencias estadísticamente significativas.
2. Si el valor de “p” es menor que el valor de significación (α) entonces existen diferencias estadísticamente significativas.
Prueba de la Normalidad
Es importante realizar esta prueba cuando no se tiene la certeza de que los datos provienen o no de una curva normal.
Conocer si los datos provienen de una curva normal
permitirá decidir que pruebas se han de utilizar. Se utilizarán pruebas Paramétricas si los datos
provienen de una curva normal. Se utilizarán pruebas No paramétricas si los datos
no provienen de una curva normal.
…prueba de la Normalidad
La condición para decidir si un determinado grupo de datos tiende a una curva normal es que al menos existan más de 30 datos de la variable en estudio (tamaño de muestra mínimo) en cada grupo de estudio.
De particular interés están los coeficientes de asimetría y curtosis estandarizados que pueden utilizarse para determinar si la muestra procede de una distribución normal.
Los valores de estos estadísticos fuera del rango de -2 a +2 indican alejamiento significante de normalidad que tendería a invalidar cualquier test estadístico con respecto a la desviación normal.
…prueba de la Normalidad
• También se puede utilizar el valor de Asimetría para la prueba de la normalidad.
• Si el valor de Asimetría es mayor que 1(uno) en valor absoluto entonces se dice que no pertenece a una distribución normal.
…prueba de la Normalidad
En algunos casos a pesar de que existe una gran cantidad de datos (más de 30), sin embargo los valores de curtosis o asimetría indican que los datos no provienen de una curva normal.
Esto se puede deber a la presencia de datos FUERA DE RANGO O INTERVALO.
Datos Fuera de Rango o Intervalo
• El dato se observa, registra e introduce en la computadora incorrectamente.
• El dato proviene de una población distinta.
• El dato es correcto pero representa un suceso poco común (fortuito).
Datos Fuera de Rango o Intervalo
Los datos fuera de intervalo aparecen generalmente por las siguientes razones:
Como detectar un dato fuera de rango
1. Calculando el Valor Z
Si el valor de Z es mayor de 3 quiere decir que ese dato está fuera de intervalo, ya que se asume que el 100% de una población está comprendida dentro del rango de -3z y +3z (-3s y +3s).
syy
Z
2. Con el gráfico de Caja y Bigotes (Box and Plot).
– Al elaborar este gráfico haciendo uso de los rangos intercuartílicos y la mediana, así como los valores de -3s y +3s. Se puede determinar fácilmente los datos que se encuentran fuera de rango.
Transformación a curva normal
Los datos que no cumplen el criterio de ser una curva normal de acuerdo con los anteriores estadísticos, se pueden convertir a una curva normal utilizando la raíz cuadrada o el logaritmo natural de los datos.
Pruebas Paramétricas o No Paramétricas
Pruebas ParamétricasSe dice que una prueba es paramétrica cuando:• Se trata de variables cuantitativas cuyo número es
mayor de 30 datos o provienen de una curva normal.
• Pueden ser menos de 30 datos si es que se tiene la seguridad que provienen de una curva normal
• Si son seis o menos datos, usar pruebas no paramétricas. Algunos indican 11 o menor de 20.
…Pruebas Paramétricas o No Paramétricas
Pruebas no Paramétricas
Son pruebas no paramétricas cuando:• Se trata de variables cualitativas.• Se trata de variables cuantitativas, con
menos de 30 datos y no provienen de una curva normal.
• Cuando son seis o menos datos. Algunos indican 11 o 20 datos.
SPSS
PRUEBAS ESTADÍSTICAS
Pruebas para
Comparar grupos
Variables
cualitativas
Variables
cuantitativas
2 grupos 3 grupos2 grupos Tres o más grupos
Pruebas para comparar grupos
VARIABLES CUALITATIVAS
COMPARACIÓN DE DOS GRUPOSVariables Categóricas o Cualitativas
Menú principal
2 grupos
Muestras independientes
Chi CuadradoCorrección de Yates
Frecuencias pequeñas:
Prueba exacta de Fisher
Muestras pareadas
McNemar
Comparación de dos proporciones Independientes
Prueba de Chi Cuadrado
Ejemplo 6
Se desea analizar el tratamiento de la infección urinaria con dos antibióticos A y B. Dividiéndose 34 pacientes en dos grupos de 17, evaluándose después de un tiempo de observación si la infección desapareció o no.
Solución
1. Codificar la variable 1 como:– Etiqueta: Tratamiento de Antibiótico– 1= A– 2= B
2. Codificar la variable 2 como– Etiqueta: Desaparición de la Infección– 1= Si– 2= No
Interpretación
Como el valor de p = 0,001 es menor que 0,05 entonces hay diferencias significativas entre los grupos, por lo tanto podemos concluir que el tratamiento con el antibiótico A es más eficaz que el antibiótico B.
volver
Comparación de dos proporciones pareadasPrueba de Chi Cuadrado de McNemar
Ejemplo 7
Se desea saber si el efecto de dos fármacos es el mismo para desaparecer los síntomas de una úlcera. Para lo cual se seleccionan 50 pacientes a los que se les administra el fármaco A. Luego se busca a otro paciente de características similares (Par o “gemelo”) al que se les suministra el fármaco B. Después de un periodo de observación se comprueba en cada caso si los síntomas han desaparecido.
Solución
1. Codificar la variable 1 como:– Etiqueta: Fármaco A– 1= Úlcera ha cicatrizado– 2= Úlcera no ha cicatrizado
2. Codificar la variable 2 como– Etiqueta: Fármaco B– 1= Úlcera ha cicatrizado– 2= Úlcera no ha cicatrizado
Interpretación
Como el valor de p = 0,607 es mayor que 0,05 entonces no hay diferencias significativas entre los grupos, por lo tanto podemos concluir que el Fármaco A y el Fármaco B tienen la misma eficacia para la cicatrización de úlceras.
Volver
Comparación de 3 o más gruposVariables Cualitativas
Menú Principal
Muestras
independientes Muestras pareadas
3 o más grupos
χ2 Q de Cochran
Comparación de 3 o más proporciones Independientes
Prueba de Chi Cuadrado Ejemplo 8 Se desea analizar si el efecto de tres tratamientos
dermatológicos para el acné A,B y C, depende del tipo de presentación, crema, comprimido, polvo y líquido. Para lo cual se distribuyen 300 pacientes en 12 grupos de 25 cada uno. Luego de un periodo de observación se analiza la proporción de pacientes sin acné en cada grupo.
Se desea determinar si la eficacia del tratamiento está relacionado con el tipo de presentación.
Solución1. Codificar la variable 1 como:
– Etiqueta: Tratamiento dermatológico– 1= A– 2= B– 3= C
2. Codificar la variable 2 como– Etiqueta: Presentación del tratamiento– 1= Crema– 2= Comprimido– 3= Polvo– 4= Líquido
Interpretación
Como el valor de p = 0,00 asociado al estadístico Chi cuadrado es menor que 0,05 entonces hay diferencias significativas entre los grupos, por lo tanto podemos concluir que el uso del tratamiento dependerá del tipo de presentación.
Volver
Comparación de 3 o más proporciones pareadas
Prueba Q de Cochran Ejemplo 9 Se desea analizar el efecto de dos fármacos sobre los
síntomas de la úlcera, para lo cual se distribuyen 150 pacientes en tres grupos de 50 cada uno. Aleatoriamente se suministra a 50 pacientes un placebo, luego se busca dos pares o “gemelos” a quienes se les suministra los fármacos A y B respectivamente. Después de un periodo se observa si los síntomas han desaparecido o no.
Se desea determinar si la eficacia de los fármacos con respecto al placebo es la misma .
Solución1. Codificar la variable 1 como:
– Etiqueta: Placebo– 1= Úlcera ha cicatrizado– 2= Úlcera no ha cicatrizado
2. Codificar la variable 2 como– Etiqueta: Fármaco A– 1= Úlcera ha cicatrizado– 2= Úlcera no ha cicatrizado
3. Codificar la variable 3 como:– Etiqueta: Fármaco B– 1= Úlcera ha cicatrizado– 2= Úlcera no ha cicatrizado
Interpretación
Como el valor de p = 0,09 asociado al estadístico Q de Cochran es menor que 0,05 entonces hay diferencias significativas entre los grupos, por lo tanto podemos concluir que los fármacos tienen menor efectividad que el placebo.
Volver
Pruebas para comparar grupos
VARIABLES CUANTITATIVAS
COMPARACIÓN DE DOS GRUPOS Variables Cuantitativas
Menú principal
2 Grupos
Muestrasindependientes
¿Distribución normal?
("paramétrica")
Si
¿Varianzas Iguales?
Si
t de student para v.iguales
No
T de student para var.
diferentes
No
U Mann-Whitney
Muestraspareadas
¿Distribución normal?
("paramétrica")
Si
t de Studentpareada
No
Prueba Wilcoxon
Comparación de dos grupos independientes con distribución normal
Prueba de t de Student
Ejemplo 10
Se desea conocer si la disminución de hemoglobina es independiente de la presencia o no de úlcera en los pacientes cuando se aplica un nuevo tratamiento. Para lo cual se mide la disminución de hemoglobina en 70 pacientes, de los cuales 28 tenían úlcera y 42 no.
Solución
1. Codificar la variable 1 como:– Etiqueta: Disminución de Hemoglobina
2. Codificar la variable 2 como– Etiqueta: Con úlcera– 1= Si– 2= No
El valor de p= 0,138 nos indica que no hay diferencias significativas entre las varianzas por lo que se asume la igualdad de varianzas.
InterpretaciónComo el valor de p= 0,00 asociado al estadístico “t”, cuando se asumen varianzas iguales es menor que 0,05 entonces existen diferencias significativas entre los promedios. Por lo tanto se puede concluir que la disminución de hemoglobina es diferente entre los pacientes con úlcera y sin úlcera. Para el ejemplo existe mayor disminución de hemoglobina en los pacientes con úlcera.
Volver
Comparación de dos grupos independientes sin distribución normal (no paramétrica)
Prueba de U de Mann- Witney
Ejemplo 12 Se desea conocer si al aplicar un nuevo Fármaco
más el tratamiento habitual permite incrementar la FEVI (fracción de eyección del ventrílocuo izquierdo) deprimida en grado severo. Se seleccionan 12 pacientes a los que se les aplica el tratamiento habitual y 11 pacientes a quienes se les aplica el tratamiento habitual más el nuevo Fármaco. Luego de seis meses se mide la FEVI en ambos grupos.
Solución
1. Codificar la variable 1 como:– Etiqueta: FEVI
2. Codificar la variable 2 como– Etiqueta: Tratamiento– 1= Habitual– 2= Habitual más fármaco.
Interpretación
Como el valor de p= 0,740 asociado al estadístico “U” de Mann-Whitney, es mayor que 0,05 entonces no existen diferencias significativas entre las muestras. Por lo tanto se puede concluir que el uso del Farmaco A más el tratamiento habitual no aumenta significativamente el FEVI.
Volver
Comparación de dos grupos pareados con distribución normal
Prueba de t de Student para muestras pareadas
Ejemplo 11
Se desea conocer si un tratamiento contra la artrosis puede causar disminución de hemoglobina. Para lo cual se mide la hemoglobina en 70 pacientes antes y después del tratamiento.
Solución
1. Codificar la variable 1 como:– Etiqueta: Hemoglobina inicial
2. Codificar la variable 2 como– Etiqueta: Hemoglobina final
Interpretación
Como el valor de p= 0,00 asociado al estadístico “t”, es menor que 0,05 entonces existen diferencias significativas entre los promedios inicial y final. Por lo tanto se puede concluir que el tratamiento contra la artrosis produce disminución de hemoglobina.
Volver
Comparación de dos grupos pareados sin distribución normal
Prueba de Wilcoxon
Ejemplo 13
Se desea conocer si el nivel de colesterol se incrementa debido a un producto (A) presente en la dieta de los pacientes de un hospital. Para lo cual se cambia el Producto A por un producto B menos rico en colesterol y se hace la medición del colesterol a 42 pacientes antes y después de la sustitución del producto.
Solución
1. Codificar la variable 1 como:– Etiqueta: Colesterol inicial
2. Codificar la variable 2 como– Etiqueta: Colesterol final
Interpretación
Como el valor de p= 0,230 asociado al estadístico Wilcoxon, es mayor que 0,05 entonces existen diferencias significativas entre los rangos positivos y negativos. Por lo tanto se puede concluir que el colesterol en los pacientes no se ve incrementado por el consumo del producto A.
volver
Comparación de 3 o más gruposVariables Cuantitativas
Menú Principal
3 o más grupos
Muestras independientes
¿Distribución normal?
("paramétrica")
Si
ANOVA
No
Kruskal-Wallis
Muestrasapareadas
¿Distribución normal?
("paramétrica")
Si
ANOVA paramedidas repetidas
No
Friedman
Comparación de 3 o más grupos independientes con distribución normal
ANÁLISIS DE LA VARIANZA (ANOVA)
Ejemplo 14
Se desea saber si el tiempo de reaparición de los síntomas en pacientes con úlcera péptica es independiente del tiempo de respuesta a un tratamiento aplicado. Para lo cual se determina el tiempo de reaparición de los síntomas y se agrupa de acuerdo al tiempo de respuesta en cuatro grupos (2, 4, 6 y 8 semanas).
Solución
1. Codificar la variable 1 como:– Etiqueta: Tiempo de respuesta al tratamiento– 1 = 2 semanas– 2 = 4 semanas– 3 = 6 semanas– 4 = 8 semanas
2. Codificar la variable 2 como– Etiqueta: Tiempo de reaparición de los síntomas
• Como el valor de p = 0,00 asociado al estadístico de Levene es menor que 0,05 entonces las varianzas son diferentes, por lo que se tendrá que homogenizar las varianzas con la función potencia, raíz cuadrada y logaritmo natural.
Interpretación
Como el valor de p = 0,00 asociado al estadístico de F de Snedecor es menor que 0,05 entonces existen diferencias significativas entre los promedios. Por lo tanto se tiene que realizar la prueba de comparaciones múltiples para determinar entre que grupos existen las diferencias.
Tukey (grupos del mismo tamaño)
Scheffé (grupos de diferente tamaño)
Conclusión
• El análisis de comparaciones múltiples nos indica que todos los grupos son diferentes, por lo tanto se debe considerar que el tiempo de reaparición de los síntomas va a ser diferente para cada tiempo de respuesta al tratamiento.
volver
Comparación de 3 o más grupos independientes sin distribución normal
ANÁLISIS DE LA VARIANZA DE KRUSKAL-WALLIS
Ejemplo 15
Se desea saber si un Fármaco aumenta el índice cardiaco en pacientes con Shock, pero se sospecha que el aumento puede ser diferente según el tipo de shock. Para lo cual se suministra el fármaco a 99 pacientes y después de un determinado tiempo se mide el índice cardiaco y se divide en cuatro grupos de acuerdo con el tipo de shock (Hipovolémico, Cardiogénico, Distributivo y Obstructivo).
Interpretación
Como el valor de p = 0,001 es menor que 0,05 entonces los promedios de rangos en los cuatro tratamientos son diferentes. Por lo tanto se puede concluir indicando que el fármaco incrementa el índice cardiaco independientemente del tipo de shock. Siendo mayor el efecto en el grupo cardiogénico.
Volver
Comparación de 3 o más grupos pareados con distribución normal
ANOVA PARA MEDIDAS REPETIDAS
Ejemplo 16
Se desea conocer el efecto de tres fármacos para reducir la presión arterial sistólica. Para lo cual se buscó a 160 pacientes, a los que se les administró el fármaco A, luego se buscó a dos “pares” o “gemelos” de la misma edad, al primero se le administró el Fármaco B y al segundo el Fármaco C.
Solución
1. Codificar la variable 1 como:– Etiqueta: Fármaco A
2. Codificar la variable 2 como– Etiqueta: Fármaco B
3. Codificar la variable 3 como– Etiqueta: Fármaco C
Interpretación
Como el valor de p = 0,523 asociado al estadístico de contraste es mayor que 0,05 entonces no existen diferencias significativas entre los grupos. Por lo tanto se puede concluir que el efecto de los fármacos sobre la presión arterial sistólica es el mismo.
Volver
Comparación de 3 o más grupos pareados sin distribución normal
PRUEBA DE FRIEDMAN
Ejemplo 17
Se desea conocer si el consumo de un fármaco (A) antihipertensivo es igual que el de otros dos fármacos (B y C) de la competencia. Para lo cual se seleccionan aleatoriamente 34 farmacias y se obtiene el número de fármacos (A, B y C) vendidos en el mes en cada farmacia.
Solución
1. Codificar la variable 1 como:– Etiqueta: Cantidad de Fármaco A
2. Codificar la variable 2 como:– Etiqueta: Cantidad de Fármaco B
3. Codificar la variable 3 como:– Etiqueta: Cantidad de Fármaco C
Interpretación
Como el valor de p = 0,865 asociado al estadístico de Friedman es mayor que 0,05 entonces no existen diferencias significativas entre los grupos. Por lo tanto se puede concluir que la venta de los tres fármacos es la misma.
volver
Asociación entre dos variables cuantitativas
Correlación de Pearson
Ejemplo 21
Se realiza un estudio para establecer una ecuación mediante la cual se pueda utilizar la concentración de estrona en saliva(X) para predecir la concentración del esteroide en plasma libre (Y). Para lo cual se midieron la concentración de ambos indicadores en 14 varones sanos.
Solución
1. Codificar la variable 1 como:– Etiqueta: Estrona en Saliva
2. Codificar la variable 2 como:– Esteroide en plasma libre
Interpretación
Como el valor de p = 0,00 asociado al estadístico t es menor que 0,05 entonces podemos concluir que conociendo el nivel de estrona en la saliva se puede predecir concentración de esteroide en el plasma libre.
VOLVER
edad de los encuestados
20
40
60
80
191
412
Figura 4. Ejemplo de gráfico de Caja y Bigotes. Edad de encuestados.
Volver