tema 4: variables aleatorias iii · 2019. 10. 15. · tema 4: variables aleatorias iii...
Post on 21-Nov-2020
11 Views
Preview:
TRANSCRIPT
Tema 4: Variables aleatorias III
Estadística- Biología sanitaria
Marcos Marvá Ruiz
Estadística- Biología sanitaria Tema 4: Variables aleatorias III Marcos Marvá Ruiz 1 / 14
Media y varianza de una v.a. continua
Para un variable aleatoria discreta con valores x1, . . . , xk y probabilidades p1, . . . , pk :
µ = E(X) =k∑
i=1
xi · pi
σ2 = Var(X) =k∑
i=1
(xi − µ)2 · pi
Para una variable aleatoria continua con densidad f (x) se tiene:
µ = E(X) =∫ ∞−∞
x · f (x) dx
σ2 = Var(X) =∫ ∞−∞
(x − µ)2 · f (x) dx
Para pasar de discreto a continuo cambia sumatorio por integral y la probabilidad pipor el diferencial de probabilidad dp = f (x) dx (sección 5.4.2 del libro)
No hay sorpresa: la media de la curva normal es µ y su varianza es σ2.Calcula la media y la varianza de la función del ejemplo anteriorEstadística- Biología sanitaria Tema 4: Variables aleatorias III Marcos Marvá Ruiz 2 / 14
Ejemplo: media y varianza de una v.a. continua
1 Comprobar que la función f (x) = 38 x2 si 0 ≤ x ≤ 2, f (x) = 0 si x /∈ [0, 2] es una
función de probabilidad.2 Calcular P(0.5 < X ≤ 1.5)3 Calcular la media y la varianza
Escribir el cálculo y resolver con WolframAlpha
Estadística- Biología sanitaria Tema 4: Variables aleatorias III Marcos Marvá Ruiz 3 / 14
Función de distribución: F (k) = P(X ≤ k).Esto se traduce de forma diferente para v.a. discreta (izquierda) y continua (derecha) :
F (xk) =k∑
i=1
P(X = xi ) F (k) =∫ k
−∞f (x) dx
La gráfica de F también es diferente en el caso discreto (izq) y continuo (dcha)
−1 1 3 5
0.0
0.8
−4 0 2 4
0.0
0.8
Para un intervalo [a, b] se cumple esta propiedad que hace que F sea más útil que f :
P(a < X < b) = F (b)− F (a)
Problema inverso: percentiles dado p ∈ (0, 1), encontrar x∗ tal que
P(X < x∗) = p
Estadística- Biología sanitaria Tema 4: Variables aleatorias III Marcos Marvá Ruiz 4 / 14
Ejemplo:sea X ∼ N(10, 3) esLa probabilidad de que X esté entre 9 y 12
pnorm(q = 12, mean = 10, sd = 3) - pnorm(q = 9, mean = 10, sd = 3)
## [1] 0.3780661
El percentil 70 de una v.a.
qnorm(p = 0.7, mean = 10, sd = 3)
## [1] 11.5732
Estadística- Biología sanitaria Tema 4: Variables aleatorias III Marcos Marvá Ruiz 5 / 14
QQPLOTs: ¿son normales estos datos?Idea: comparar (estandarizados o no)
Percentiles muestrales: los de de los datosPercentiles teóricos: los que tendrían si la población subyacente fuera normal
−2 0 2
−2
02
4
Presión diastólica Framingham
Theoretical Quantiles
Sam
ple
Qua
ntile
s
−3 −2 −1 0 1 2 3
−2
−1
01
2
Longitud caparazón "crabs"
Theoretical Quantiles
Sam
ple
Qua
ntile
s
Estadística- Biología sanitaria Tema 4: Variables aleatorias III Marcos Marvá Ruiz 6 / 14
Detectar la normalidad gráficamente, muestras grandespar(mfrow = c(2,3))muestra = rnorm(200); hist(muestra, main = "Muestra normal", cex.main = .8)boxplot(muestra, main = "Muestra normal", cex.main = .8)qqnorm(muestra, main = "Muestra normal", cex.main = .8)qqline(muestra, lwd = 3, col = "purple")muestra2 = rexp(200, rate = .4)hist(muestra2, main = "Muestra NO normal", cex.main = .8)boxplot(muestra2, main = "Muestra NO normal", cex.main = .8)qqnorm(muestra2, main = "Muestra NO normal", cex.main = .8)qqline(muestra2, lwd = 3, col = "purple")
Muestra normal
muestra
Fre
quen
cy
−3 −2 −1 0 1 2
010
2030
40
−3
−2
−1
01
2
Muestra normal
−3 −2 −1 0 1 2 3
−3
−2
−1
01
2
Muestra normal
Theoretical Quantiles
Sam
ple
Qua
ntile
s
Muestra NO normal
muestra2
Fre
quen
cy
0 2 4 6 8 10 12
020
4060
02
46
810
Muestra NO normal
−3 −2 −1 0 1 2 3
02
46
810
Muestra NO normal
Theoretical Quantiles
Sam
ple
Qua
ntile
s
Estadística- Biología sanitaria Tema 4: Variables aleatorias III Marcos Marvá Ruiz 7 / 14
Detectar la normalidad gráficamente, muestras pequeñaspar(mfrow = c(2,3))muestra = rnorm(15)hist(muestra, main = "Muestra normal", cex.main = .8)boxplot(muestra, main = "Muestra normal", cex.main = .8)qqnorm(muestra, main = "Muestra normal", cex.main = .8)qqline(muestra)muestra2 = rnorm(20)hist(muestra2, main = "Muestra normal", cex.main = .8)boxplot(muestra2, main = "Muestra normal", cex.main = .8)qqnorm(muestra2, main = "Muestra normal", cex.main = .8)qqline(muestra2)
Muestra normal
muestra
Fre
quen
cy
−2 −1 0 1 2
01
23
45
−1.
5−
0.5
0.5
1.5
Muestra normal
−1 0 1
−1.
5−
0.5
0.5
1.5
Muestra normal
Theoretical Quantiles
Sam
ple
Qua
ntile
s
Muestra normal
muestra2
Fre
quen
cy
−2 −1 0 1 2
01
23
45
−2
−1
01
Muestra normal
−2 −1 0 1 2
−2
−1
01
Muestra normal
Theoretical Quantiles
Sam
ple
Qua
ntile
s
Estadística- Biología sanitaria Tema 4: Variables aleatorias III Marcos Marvá Ruiz 8 / 14
Propiedades de X ∼ N(µ, σ)
Regla 68 - 95 - 99. Si X ∼ N(µ, σ) entonces se cumplen estas aproximaciones:P(µ− σ < X < µ+ σ) ≈ 0.683,
P(µ− 2σ < X < µ+ 2σ) ≈ 0.955
P(µ− 3σ < X < µ+ 3σ) ≈ 0.997
Estadística- Biología sanitaria Tema 4: Variables aleatorias III Marcos Marvá Ruiz 9 / 14
Propiedades de X ∼ N(µ, σ)Problema: Imposible calcular la primitiva de fµ,σ.
Solución: Aproximar numéricamente.
Si X ∼ N(µ, σ), la variable que se obtiene mediante la transformación de tipificación:
Z = X − µσ
es una variable normal N(0, 1), la normal estándar, a la que llamaremos Z . Además
P(a < X < b) = P(a − µ
σ< Z <
b − µσ
)Ejemplo: considera X ∼ N(5, 0.5), entonces P(5 < X < 6) = P(0 < Z < 2)
Estadística- Biología sanitaria Tema 4: Variables aleatorias III Marcos Marvá Ruiz 10 / 14
Propiedades de X ∼ N(µ, σ): la tabla (para conectar, si la conocías)
Ejemplo: Si X ∼ N(5, 0.5), calcular P(5< X < 6)
Ejemplo: Si X ∼ N(0, 1), calcular a tal que P(X < a) = 0.7Estadística- Biología sanitaria Tema 4: Variables aleatorias III Marcos Marvá Ruiz 11 / 14
Propiedades de la media y la varianza
Sean X1,X2 son dos variables aleatorias, a, b ∈ R se tiene:1 E(X1 + X2) = E(X1) + E(X2)2 Si X1 y X2 son independientes, Var(X1 + X2) = Var(X1) + Var(X2)3 E(a · X + b) = a · E(X) + b4 Var(a · X + b) = a2 · Var(X)
Propiedades válidas para variables aleatorias continuas (más adelante)
Ejemplos:
Para 1 y 2: media y varianza binomial a partir de Bernoulli.Para 3: cambio de unidades afín (Fahrenheit = 32 + 9
5 Celsius).
Estadística- Biología sanitaria Tema 4: Variables aleatorias III Marcos Marvá Ruiz 12 / 14
Propiedades de la normal X ∼ N(µ, σ)
Si X1 ∼ N(µ1, σ1) y X2 ∼ N(µ2, σ2) son independientes, entonces:
X = aX1 + bX2 ∼ N(µX = aµ1 + nµ2, σX =√
a2σ21 + b2σ2
2)
Esto se extiende a la combinación lineal de cualquier número de normales
Ejemplo: Dispones de dos medios de cultivo celular, A y B. Los fabricantes aseguran quela concentración de nutrientes es:
En el medio A, en promedio, de 10gr/dm3, con una desviación típica de 0.5gr/dm3
En el medio B, en promedio, de 12gr/dm3, con una desviación típica de 0.6gr/dm3
Si mezclas 4dm3 de A con 6dm3 de B:
1 Determina la concentración esperada y su desviación típica.2 Si las concentraciones XA y XB siguen distribuciones normales, ¿qué distribución sigue
la concentración del nuev medio de cultivo (la mezcla)?
Estadística- Biología sanitaria Tema 4: Variables aleatorias III Marcos Marvá Ruiz 13 / 14
La distribución uniforme
La distribución uniforme en el intervalo [a, b]Esta distribución representa la idea intuitiva de que todos los puntos del intervalo sonigual de probables. (¡Pero, cuidado, esa idea es inútil! ¿Ves por qué?)Es más acertado pensar que ninguna parte del intervalo es más probable que otraLa función de densidad apropiada es constante en [a, b] y vale 0 fuera:
f (x) =
1
b − a si a ≤ x ≤ b
0 en otro caso
Estadística- Biología sanitaria Tema 4: Variables aleatorias III Marcos Marvá Ruiz 14 / 14
top related