tema 4: variables aleatorias ii - uahestadística- biología sanitaria tema 4: variables aleatorias...
TRANSCRIPT
Tema 4: Variables aleatorias II
Estadística- Biología sanitaria
Marcos Marvá Ruiz
Estadística- Biología sanitaria Tema 4: Variables aleatorias II Marcos Marvá Ruiz 1 / 12
Objetivos
Relacionar las variables aleatorias binomial y normal.Presentar la función de densidad de probabilidad de una v.a. continua.Cálculo de probabilidades con una v.a. normal.
Estadística- Biología sanitaria Tema 4: Variables aleatorias II Marcos Marvá Ruiz 2 / 12
¿Qué sucede con la binomial cuando n se hace grande y p es moderado?
GeoGebra
Estadística- Biología sanitaria Tema 4: Variables aleatorias II Marcos Marvá Ruiz 3 / 12
La curva normalde Moivre se preguntó en el s. XVII por la distribución binomial X ∼ B(n, p) cuando:
n grande0 << p << 1
Descubrió que:
P(X = x) ∼ 0 conforme n crece, pero∑n
x=0 P(X = x) = 1.Por eso tiene más sentido preguntarse por P(a ≤ X ≤ b).Hay una función que aproxima muy bien los valores de P(X = x):
P(X = x) ≈ fµ,σ(x) = 1σ√2π
e−12 ( x−µ
σ )2
donde µ = np y σ =√
np(1− p) son el valor esperado y la desviación típica de lavariable binomial X .
Es la distribución normal y su gráfica se llama campana de GaussEstadística- Biología sanitaria Tema 4: Variables aleatorias II Marcos Marvá Ruiz 4 / 12
Función de probabilidad: la normal
La función normal con media µ y desviación típica σ se define:
fµ,σ(x) = 1σ√2π
e−12 ( x−µ
σ )2⇔ X ∼ N(µ, σ)
La gráfica de fµ,σ se llama campana de Gauss
Es simétrica respecto de µCuanto menor es σ el área bajo la curva está menos dispersa.Estadística- Biología sanitaria Tema 4: Variables aleatorias II Marcos Marvá Ruiz 5 / 12
Función de probabilidad: ¿dónde aparece curva la normal?Presión diastólica Framingham
60 80 100 120 140
0.00
0.05
60 80 100 120 140
0.00
0.05
Longitud caparazón "crabs"
10 20 30 40 50
0.00
0.05
10 20 30 40 50
0.00
0.05
Aparentemente, ambas distribuciones son “normales”. . . volveremos sobre esto
Estadística- Biología sanitaria Tema 4: Variables aleatorias II Marcos Marvá Ruiz 6 / 12
La curva normalA la vez, Newton trataba de calcular el área que hay bajo la curva y = f (x)
Demostró que eso es posible y que se puede hacer como límite de la suma de rectánguloscada vez más pequeños que aproximan dicho área. GeoGebra
IDEA: aproximar la prob. binomial (suma) por el área bajo la curva normal (integral)
Estadística- Biología sanitaria Tema 4: Variables aleatorias II Marcos Marvá Ruiz 7 / 12
Si X ∼ B(100, 1/2) y f50, 5(x) es la normal con µ = 50 y σ = 5.
P(39 ≤ X ≤ 46) = P(X = 39) + · · ·+ P(X = 46) ≈∫ 46
39f50, 5(x)dx
sum(dbinom(39:46, size = 100, prob = 0.5))
## [1] 0.2315698
pnorm(46, mean = 50, sd = 5) - pnorm(39, mean = 50, sd = 5)
## [1] 0.197952
Discreto vs continuo: la corrección de Yates
pnorm(46.5, mean = 50, sd = 5) - pnorm(38.5, mean = 50, sd = 5)
## [1] 0.2312395
Estadística- Biología sanitaria Tema 4: Variables aleatorias II Marcos Marvá Ruiz 8 / 12
El Teorema Central del Límite (1ª versión).Explica como aproximar una binomial X ∼ B(n, p) por normal Y ∼ N(µ, σ), donde
µ = n · p, σ = √n · p · q
Entonces, siempre que se cumpla
n · p > 5, n · q > 5
1 La probabilidad puntual
P(X = k) ≈ P(k − 0.5 ≤ Y ≤ k + 0.5)
2 La probabilidad de un intervalo
P(k1 ≤ X ≤ k2) ≈ P(k1 − 0.5 ≤ Y ≤ k2 + 0.5)
3 Del mismo modo
P(X ≤ k) ≈ P(Y ≤ k + 0.5) P(X ≥ k) ≈ P(Y ≤ k − 0.5)
Estadística- Biología sanitaria Tema 4: Variables aleatorias II Marcos Marvá Ruiz 9 / 12
Función de probabilidad y v.a. continua
Una función continua f (x) sirve para calcular probabilidades si estas condiciones:Es no negativa: f (x) ≥ 0 para todo x
El área total bajo la gráfica de f (x) es 1:∫ +∞
−∞f (x)dx = 1
y en ese caso se llama función de densidad de probabilidad.
Si f (x) que cumple las propiedades enteriores se dice que f define una variablealeatoria continua X con función de densidad f .En tal caso la probabilidad de que X pertenezca a un intervalo (a, b) se define así
P(a ≤ X ≤ b) = área bajo la gráfica de f =∫ b
af (x) dx .
Estadística- Biología sanitaria Tema 4: Variables aleatorias II Marcos Marvá Ruiz 10 / 12
Función de probabilidad
Ejemplo: La función f (x) =√2
9π
(6
((x − 3)4 + 1) + 3((x + 5)4 + 1)
)es una función de
densidad continua. Comprueba que su integral de −∞ a ∞ es 1 con Wolfram Alpha:
integrate f(x) = (sqrt(2) / (9 pi)) * (6 / ((x - 3)^4 + 1) + 3 / ((x + 5)^4 + 1)) from -oo to oo
La gráfica de esta función es:
Usemos Wolfram Alpha para calcular tres probabilidades:
P(−6 < x < 4) ≈ 0.26034. Usa este enlaceP(1 < x < 5) ≈ 0.642484. Usa este enlaceP(−2 < x < 0) ≈ 0.0043287. Usa este enlaceEstadística- Biología sanitaria Tema 4: Variables aleatorias II Marcos Marvá Ruiz 11 / 12
Ejemplo: cálculo de probabilidades con la curva normalEn crabs, la media es 32.1 y la desviación típica 7.1.
Si X=“longitud del caparazón de un cangrejo elegido al azar” ∼ N(µ = 32.1, σ = 7.1)
Cálculo con GeoGebra
Cálculo con R
pnorm(32, mean = 32.1, sd = 7.12) - pnorm(20, mean = 32.1, sd = 7.12)
## [1] 0.4497787
Estadística- Biología sanitaria Tema 4: Variables aleatorias II Marcos Marvá Ruiz 12 / 12