estadÍstica 1o cc. ambientales [3 mm] tema 3:...
TRANSCRIPT
![Page 1: ESTADÍSTICA 1o CC. Ambientales [3 mm] Tema 3: …verso.mat.uam.es/~amparo.baillo/AmbEst/Tema3.pdf · Teorema central del l mite (TCL): ... v.a. X con media y varianza poblacional](https://reader031.vdocuments.site/reader031/viewer/2022022512/5aea01fb7f8b9ae5318bd76d/html5/thumbnails/1.jpg)
ESTADISTICA1o CC. Ambientales
Tema 3: Estimacion puntualy por intervalos
I Muestra aleatoria. Inferencia estadıstica parametrica
I Estimacion puntual
I Intervalos de confianza
I Distribuciones asociadas a la normal
I Intervalos de confianza en poblaciones normales
I Intervalos de confianza para otras distribuciones
Estadıstica (Ambientales). Profesora: Amparo Baıllo Tema 3: Estimacion puntual y por intervalos 1
![Page 2: ESTADÍSTICA 1o CC. Ambientales [3 mm] Tema 3: …verso.mat.uam.es/~amparo.baillo/AmbEst/Tema3.pdf · Teorema central del l mite (TCL): ... v.a. X con media y varianza poblacional](https://reader031.vdocuments.site/reader031/viewer/2022022512/5aea01fb7f8b9ae5318bd76d/html5/thumbnails/2.jpg)
Muestra aleatoriaInferencia estadıstica parametrica
Inconveniente: La distribucion de probabilidad de la v.a. X deinteres suele ser desconocida.
Objetivo: Estudiar una v.a. numerica X en una poblacion a partirde la informacion contenida en una muestra aleatoria de individuosde esa poblacion.
Una muestra aleatoria (simple) de tamano n de X es una coleccionX1, . . . ,Xn tal que
• cada Xi tiene la misma distribucion de probabilidad que X ;
• las v.a. X1, . . . ,Xn son independientes entre sı.
Extraeremos informacion acerca de la distribucion de probabilidadde X , que es desconocida, a partir de la muestra X1, . . . ,Xn de X .
Estadıstica (Ambientales). Profesora: Amparo Baıllo Tema 3: Estimacion puntual y por intervalos 2
![Page 3: ESTADÍSTICA 1o CC. Ambientales [3 mm] Tema 3: …verso.mat.uam.es/~amparo.baillo/AmbEst/Tema3.pdf · Teorema central del l mite (TCL): ... v.a. X con media y varianza poblacional](https://reader031.vdocuments.site/reader031/viewer/2022022512/5aea01fb7f8b9ae5318bd76d/html5/thumbnails/3.jpg)
Simplificacion del problema → Estadıstica parametrica:
Supondremos que la distribucion de probabilidad de X pertenece auna familia parametrica de distribuciones concreta (Poisson,normal, . . . ). En este caso, para determinar totalmente ladistribucion de X solo queda especificar el valor de uno o variosparametros (λ para la Poisson, µ y σ para la normal).
Los parametros que nos van a interesar en este curso son:
• Media y Varianza poblacional (µ y σ2) cuando X ∼ N(µ, σ).
• Proporcion p de individuos de una poblacion que presentancierta caracterıstica.
• Media poblacional (λ) cuando X ∼ Poisson(λ).
Estadıstica (Ambientales). Profesora: Amparo Baıllo Tema 3: Estimacion puntual y por intervalos 3
![Page 4: ESTADÍSTICA 1o CC. Ambientales [3 mm] Tema 3: …verso.mat.uam.es/~amparo.baillo/AmbEst/Tema3.pdf · Teorema central del l mite (TCL): ... v.a. X con media y varianza poblacional](https://reader031.vdocuments.site/reader031/viewer/2022022512/5aea01fb7f8b9ae5318bd76d/html5/thumbnails/4.jpg)
Notacion en inferencia parametrica:
Parametro: θEspacio parametrico: Θ, conjunto de posibles valores del parametroSi X es discreta: funcion de masa Pθ.Si X es continua: funcion de densidad fθ.
Partes de la inferencia parametrica:
• Estimacion puntual: Estimar los parametros desconocidosa partir de la informacion de la muestra aleatoria X1, . . . ,Xn.
• Estimacion por intervalos de confianza
• Contrastes de hipotesis parametricas
Estadıstica (Ambientales). Profesora: Amparo Baıllo Tema 3: Estimacion puntual y por intervalos 4
![Page 5: ESTADÍSTICA 1o CC. Ambientales [3 mm] Tema 3: …verso.mat.uam.es/~amparo.baillo/AmbEst/Tema3.pdf · Teorema central del l mite (TCL): ... v.a. X con media y varianza poblacional](https://reader031.vdocuments.site/reader031/viewer/2022022512/5aea01fb7f8b9ae5318bd76d/html5/thumbnails/5.jpg)
Estimacion puntual
Un estimador puntual, θ, de un parametro θ es una funcion real dela muestra, X1, . . . ,Xn, que aproxima el valor de θ. Es aleatorio.
Una estimacion (puntual) es el valor numerico concreto que tomaun estimador al ser aplicado a una realizacion muestral x1, . . . , xnconcreta observada.
Tanto el estimador como la estimacion se denotan utilizando elsımbolo: (p.e. µ, σ, p, λ) .
Estimadores naturales de la media y varianza poblacional (µ y σ2):
• Media muestral: µ = X =X1 + · · ·+ Xn
n=
1
n
n∑i=1
Xi
• Varianza muestral: σ2 = S2 =1
n − 1
n∑i=1
(Xi − X )2
Estadıstica (Ambientales). Profesora: Amparo Baıllo Tema 3: Estimacion puntual y por intervalos 5
![Page 6: ESTADÍSTICA 1o CC. Ambientales [3 mm] Tema 3: …verso.mat.uam.es/~amparo.baillo/AmbEst/Tema3.pdf · Teorema central del l mite (TCL): ... v.a. X con media y varianza poblacional](https://reader031.vdocuments.site/reader031/viewer/2022022512/5aea01fb7f8b9ae5318bd76d/html5/thumbnails/6.jpg)
Determina en estos ejemplos el parametro poblacional de interes,su correspondiente estimador y la estimacion a partir de los datos.
Ejemplo 3.1: Se esta estudiando la presencia de ciertomicroorganismo letal en el aire. En uno de los experimentos seanalizaron 35 muestras aleatorias y se observo que 6 de ellascontenıan el germen.
Ejemplo 3.2: Un laboratorio examina el contenido de azufre enun yacimiento de carbon en Texas. Debido a imprecisiones en losaparatos, las medidas tienen distribucion normal. Se toman 10muestras aleatorias del yacimiento y se analizan. La mediaobservada es 0.88.
Estadıstica (Ambientales). Profesora: Amparo Baıllo Tema 3: Estimacion puntual y por intervalos 6
![Page 7: ESTADÍSTICA 1o CC. Ambientales [3 mm] Tema 3: …verso.mat.uam.es/~amparo.baillo/AmbEst/Tema3.pdf · Teorema central del l mite (TCL): ... v.a. X con media y varianza poblacional](https://reader031.vdocuments.site/reader031/viewer/2022022512/5aea01fb7f8b9ae5318bd76d/html5/thumbnails/7.jpg)
Un mismo estimador puede tomar diferentes valores numericos(diferentes estimaciones), ya que su valor depende totalmente dela muestra concreta observada.
Ejemplo 3.2 (cont.): Los valores observados de azufre fueron:
0.73 0.80 0.90 1.24 0.82 0.72 0.57 1.18 0.54 1.30
x = s2 =
Se vuelve al mismo yacimiento y se recogen otras muestrasdiferentes, obteniendose los siguientes contenidos en azufre:
1.56 1.22 1.32 1.39 1.33 1.54 1.04 2.25 1.49 1.28
x = s2 =
Estadıstica (Ambientales). Profesora: Amparo Baıllo Tema 3: Estimacion puntual y por intervalos 7
![Page 8: ESTADÍSTICA 1o CC. Ambientales [3 mm] Tema 3: …verso.mat.uam.es/~amparo.baillo/AmbEst/Tema3.pdf · Teorema central del l mite (TCL): ... v.a. X con media y varianza poblacional](https://reader031.vdocuments.site/reader031/viewer/2022022512/5aea01fb7f8b9ae5318bd76d/html5/thumbnails/8.jpg)
Antes de la observacion:
X1, . . . ,Xn −→
XS2
T = T (X1, . . . ,Xn)son v.a.’s
Si tomo observaciones concretas de la poblacion:
x1, . . . , xn −→
xs2
t = T (x1, . . . , xn)son numeros.
Si tomo nuevas observaciones de la poblacion:
x1, . . . , xn −→
¯xs2
t = T (x1, . . . , xn)son otros numeros.
Estadıstica (Ambientales). Profesora: Amparo Baıllo Tema 3: Estimacion puntual y por intervalos 8
![Page 9: ESTADÍSTICA 1o CC. Ambientales [3 mm] Tema 3: …verso.mat.uam.es/~amparo.baillo/AmbEst/Tema3.pdf · Teorema central del l mite (TCL): ... v.a. X con media y varianza poblacional](https://reader031.vdocuments.site/reader031/viewer/2022022512/5aea01fb7f8b9ae5318bd76d/html5/thumbnails/9.jpg)
Sea X1, . . . ,Xn una muestra aleatoria de una poblacion X cuyadistribucion de probabilidad es conocida pero depende de unparametro desconocido θ = (θ1, . . . , θk).
Objetivos de la estimacion puntual:
• Aproximar/estimar el valor de θ mediante estimadores θ.
• Estudiar metodos para hallar estimadores.
• Decidir que estimadores son razonables.
Si X es una v.a. discreta, la funcion de masa de la muestra es:
P(x1, . . . , xn) = P{X1 = x1, . . . ,Xn = xn} = P(x1) · · ·P(xn)
Si X es continua con densidad f , la funcion de densidad de lamuestra es:
f (x1, . . . , xn) = f (x1) · · · f (xn)
Estadıstica (Ambientales). Profesora: Amparo Baıllo Tema 3: Estimacion puntual y por intervalos 9
![Page 10: ESTADÍSTICA 1o CC. Ambientales [3 mm] Tema 3: …verso.mat.uam.es/~amparo.baillo/AmbEst/Tema3.pdf · Teorema central del l mite (TCL): ... v.a. X con media y varianza poblacional](https://reader031.vdocuments.site/reader031/viewer/2022022512/5aea01fb7f8b9ae5318bd76d/html5/thumbnails/10.jpg)
Construccion de estimadores puntuales
1. Metodo de los momentos
El estimador por el metodo de los momentos, θ = (θ1, . . . , θk), seobtiene al resolver el sistema
Eθ[X ] = 1n
∑ni=1 Xi ,
Eθ[X 2] = 1n
∑ni=1 X
2i ,
· · ·
Eθ[X k ] = 1n
∑ni=1 X
ki
Observacion: Presenta el inconveniente de que la solucion puedeno pertenecer al espacio parametrico.
Estadıstica (Ambientales). Profesora: Amparo Baıllo Tema 3: Estimacion puntual y por intervalos 10
![Page 11: ESTADÍSTICA 1o CC. Ambientales [3 mm] Tema 3: …verso.mat.uam.es/~amparo.baillo/AmbEst/Tema3.pdf · Teorema central del l mite (TCL): ... v.a. X con media y varianza poblacional](https://reader031.vdocuments.site/reader031/viewer/2022022512/5aea01fb7f8b9ae5318bd76d/html5/thumbnails/11.jpg)
2. Metodo de maxima verosimilitud (MV)
Dada la muestra x1, . . . , xn, la funcion de verosimilitud es
L(θ) = L(θ; x1, . . . , xn) =
{Pθ(x1) · · ·Pθ(xn) si X es discretafθ(x1) · · · fθ(xn) si X es continua
Mide lo verosımil que es el valor de un parametro θ = (θ1, . . . , θk)teniendo en cuenta la muestra observada.
El estimador de maxima verosimilitud (emv), θ = (θ1, . . . , θk), esel punto de maximo de la verosimilitud L(θ), que coincide con elpunto de maximo de log(L(θ)).
En la practica, para hallar el emv, resolvemos el sistema deecuaciones
∂ ln(L(θ))
∂θ1= 0 , . . . ,
∂ ln(L(θ))
∂θk= 0.
Estadıstica (Ambientales). Profesora: Amparo Baıllo Tema 3: Estimacion puntual y por intervalos 11
![Page 12: ESTADÍSTICA 1o CC. Ambientales [3 mm] Tema 3: …verso.mat.uam.es/~amparo.baillo/AmbEst/Tema3.pdf · Teorema central del l mite (TCL): ... v.a. X con media y varianza poblacional](https://reader031.vdocuments.site/reader031/viewer/2022022512/5aea01fb7f8b9ae5318bd76d/html5/thumbnails/12.jpg)
Ejemplo 3.3: Un metodo para estudiar las sustancias que causanmutaciones consiste en matar a ratones hembra 17 dıas despues deaparearse y examinar sus uteros en busca de embriones muertos.La tabla que sigue proporciona datos de 309 hembras.
No embriones Recuentomuertos de hembras
0 1251 1132 523 134 45 16 1
7 o mas 0Total 309
No embriones Frecuencia Probabilidadmuertos relativa Poisson
0 0.405 eλ
1 0.366 eλλ
2 0.168 eλλ2/2
3 0.042 eλλ3/3!
4 0.013 eλλ4/4!
5 0.003 eλλ5/5!
6 0.003 eλλ6/6!
7 o mas 0 eλλ7/7!
0 1 2 3 4 5 6 7 8 9
0.0
0.1
0.2
0.3
0.4
Frecuencia relativa
Distribución de Poisson
Estadıstica (Ambientales). Profesora: Amparo Baıllo Tema 3: Estimacion puntual y por intervalos 12
![Page 13: ESTADÍSTICA 1o CC. Ambientales [3 mm] Tema 3: …verso.mat.uam.es/~amparo.baillo/AmbEst/Tema3.pdf · Teorema central del l mite (TCL): ... v.a. X con media y varianza poblacional](https://reader031.vdocuments.site/reader031/viewer/2022022512/5aea01fb7f8b9ae5318bd76d/html5/thumbnails/13.jpg)
Ejemplos importantes:
Distribucion de X emv
Bernoulli(p) p = x
Poisson(λ) λ = x
N(µ,σ) µ = x
σ2 =n − 1
ns2
Ejemplo 3.3 (cont.): λ = x = 0.91586
No embriones Frecuencia Probabilidadmuertos relativa Poisson
0 0.405 0.4001 0.366 0.3672 0.168 0.1693 0.042 0.0514 0.013 0.0125 0.003 0.0026 0.003 0.000
7 o mas 0 0.000
Estadıstica (Ambientales). Profesora: Amparo Baıllo Tema 3: Estimacion puntual y por intervalos 13
![Page 14: ESTADÍSTICA 1o CC. Ambientales [3 mm] Tema 3: …verso.mat.uam.es/~amparo.baillo/AmbEst/Tema3.pdf · Teorema central del l mite (TCL): ... v.a. X con media y varianza poblacional](https://reader031.vdocuments.site/reader031/viewer/2022022512/5aea01fb7f8b9ae5318bd76d/html5/thumbnails/14.jpg)
Sesgo y Error Cuadratico Medio
Una medida del comportamiento del estimador θ es su errorcuadratico medio (ECM)
E[(θ − θ)2
]= Vθ(θ) + (Sesgo(θ))2,
siendo Sesgo(θ) = E (θ)− θ.
Si E (θ) = θ se dice que el estimador θ es insesgado.
Sesgo
Sesgo(θ) = E(θ)− θ.Un buen estimador debe ser insesgado o tener un sesgo pequeno.
Estimador insesgado:
13.2. Insesgadez
Insesgadez
θ
5
θ
θ
Sesgo positivo:
13.2. Insesgadez
Insesgadez
θ
5
θ
θ
Sesgo negativo:
13.2. Insesgadez
Insesgadez
θ
5
θ
θ
Estadıstica (Ambientales). Profesora: Amparo Baıllo Tema 3: Estimacion puntual y por intervalos 14
![Page 15: ESTADÍSTICA 1o CC. Ambientales [3 mm] Tema 3: …verso.mat.uam.es/~amparo.baillo/AmbEst/Tema3.pdf · Teorema central del l mite (TCL): ... v.a. X con media y varianza poblacional](https://reader031.vdocuments.site/reader031/viewer/2022022512/5aea01fb7f8b9ae5318bd76d/html5/thumbnails/15.jpg)
Propiedades de la media muestral X :
Sea X1, . . . ,Xn una muestra aleatoria de una v.a. X con E (X ) = µy varianza V (X ) = σ2.
• Si X tiene distribucion normal, entonces la distribucion de losvalores que toma X es tambien normal.
Si X ∼ N(µ, σ) =⇒ X ∼ N
(µ,
σ√n
).
• Teorema central del lımite (TCL): Si n es grande, ladistribucion de X es aproximadamente normal aunque X nosea normal.
Si n es grande =⇒ Xaprox∼ N
(µ,
σ√n
).
Estadıstica (Ambientales). Profesora: Amparo Baıllo Tema 3: Estimacion puntual y por intervalos 15
![Page 16: ESTADÍSTICA 1o CC. Ambientales [3 mm] Tema 3: …verso.mat.uam.es/~amparo.baillo/AmbEst/Tema3.pdf · Teorema central del l mite (TCL): ... v.a. X con media y varianza poblacional](https://reader031.vdocuments.site/reader031/viewer/2022022512/5aea01fb7f8b9ae5318bd76d/html5/thumbnails/16.jpg)
Distribucion de la media muestral
Estadıstica (Ambientales). Profesora: Amparo Baıllo Tema 3: Estimacion puntual y por intervalos 16
![Page 17: ESTADÍSTICA 1o CC. Ambientales [3 mm] Tema 3: …verso.mat.uam.es/~amparo.baillo/AmbEst/Tema3.pdf · Teorema central del l mite (TCL): ... v.a. X con media y varianza poblacional](https://reader031.vdocuments.site/reader031/viewer/2022022512/5aea01fb7f8b9ae5318bd76d/html5/thumbnails/17.jpg)
Ejemplo 3.4: De acuerdo con la Organizacion Mundial de laSalud un individuo tiene sobrepeso si su ındice de masa corporal(IMC) es superior a 25. Se sabe que el IMC de una poblacion esuna variable con distribucion normal de media µ = 26 y desviaciontıpica σ = 6. Si se seleccionan aleatoriamente 100 individuos y secalcula la media de sus IMC, ¿cual es la probabilidad de que estamedia sea superior a 25.5?
Otras propiedades: Sea X1, · · · ,Xn una muestra aleatoria de unav.a. X con media y varianza poblacional µ y σ2 respectivamente
• La media muestral X es un estimador insesgado de la mediade la poblacion: E (X ) = µ.
• La varianza muestral S2X es un estimador insesgado de la
varianza de la poblacion: E (S2X ) = σ2.
Estadıstica (Ambientales). Profesora: Amparo Baıllo Tema 3: Estimacion puntual y por intervalos 17
![Page 18: ESTADÍSTICA 1o CC. Ambientales [3 mm] Tema 3: …verso.mat.uam.es/~amparo.baillo/AmbEst/Tema3.pdf · Teorema central del l mite (TCL): ... v.a. X con media y varianza poblacional](https://reader031.vdocuments.site/reader031/viewer/2022022512/5aea01fb7f8b9ae5318bd76d/html5/thumbnails/18.jpg)
Error tıpico o relativo
El error tıpico de un estimador es su desviacion tıpica (o unaestimacion de la misma).
El error tıpico de la media X es su desviacion tıpica,
se(X ) =σ√n
pero en la practica σ es un parametro poblacional desconocido.
Resulta natural estimar σ2 con la varianza muestral s2. Losprogramas informaticos proporcionan el siguiente error tıpico de lamedia muestral
se(X ) =s√n.
Estadıstica (Ambientales). Profesora: Amparo Baıllo Tema 3: Estimacion puntual y por intervalos 18
![Page 19: ESTADÍSTICA 1o CC. Ambientales [3 mm] Tema 3: …verso.mat.uam.es/~amparo.baillo/AmbEst/Tema3.pdf · Teorema central del l mite (TCL): ... v.a. X con media y varianza poblacional](https://reader031.vdocuments.site/reader031/viewer/2022022512/5aea01fb7f8b9ae5318bd76d/html5/thumbnails/19.jpg)
Ejemplo 1.2 (cont.): Contaminacion por Hg en el pescado
Estadísticos descriptivos
N Mínimo Máximo MediaDesviación
estándar
Estadístico Estadístico Estadístico EstadísticoError
estándar Estadístico
LONG
N válido (por lista)
171 25,2 65,0 39,971 ,6513 8,5172
171
Página 1
Estadıstica (Ambientales). Profesora: Amparo Baıllo Tema 3: Estimacion puntual y por intervalos 19
![Page 20: ESTADÍSTICA 1o CC. Ambientales [3 mm] Tema 3: …verso.mat.uam.es/~amparo.baillo/AmbEst/Tema3.pdf · Teorema central del l mite (TCL): ... v.a. X con media y varianza poblacional](https://reader031.vdocuments.site/reader031/viewer/2022022512/5aea01fb7f8b9ae5318bd76d/html5/thumbnails/20.jpg)
Ejemplo 3.5: En SPSS se pueden generar observaciones aleatorias dealgunas distribuciones, por ejemplo, generamos una muestra de tamano20 de una N(2,1). Pinchamos en Transformar -> Calcular variable
Estadísticos descriptivos
N MediaDesviación
estándar
Estadístico EstadísticoError
estándar Estadístico
X
N válido (por lista)
20 1,6618 ,22998 1,02850
20
Página 1
Estadıstica (Ambientales). Profesora: Amparo Baıllo Tema 3: Estimacion puntual y por intervalos 20
![Page 21: ESTADÍSTICA 1o CC. Ambientales [3 mm] Tema 3: …verso.mat.uam.es/~amparo.baillo/AmbEst/Tema3.pdf · Teorema central del l mite (TCL): ... v.a. X con media y varianza poblacional](https://reader031.vdocuments.site/reader031/viewer/2022022512/5aea01fb7f8b9ae5318bd76d/html5/thumbnails/21.jpg)
Intervalos de confianza
Sea X1, . . . ,Xn una muestra aleatoria de una poblacion X confuncion de distribucion Fθ, siendo θ un parametro desconocido.
Fijamos 0 < α < 1. Sea (T1,T2) un intervalo tal queTi = Ti (X1, . . . ,Xn) para i = 1, 2 y
1− α = Pθ{T1(X1, . . . ,Xn) < θ < T2(X1, . . . ,Xn)}= Pθ{θ ∈ (T1,T2)}.
Entonces, para cada observacion (x1, . . . , xn) de la muestra, elintervalo IC0.95(θ) = (T1(x1, . . . , xn),T2(x1, . . . , xn)) es unintervalo de confianza para θ al nivel de confianza 1− α.
El nivel de significancia α es la probabilidad de equivocarnos alafirmar que el parametro se encuentra en el IC obtenido:
α = Pθ{θ /∈ (T1,T2)}.
Estadıstica (Ambientales). Profesora: Amparo Baıllo Tema 3: Estimacion puntual y por intervalos 21
![Page 22: ESTADÍSTICA 1o CC. Ambientales [3 mm] Tema 3: …verso.mat.uam.es/~amparo.baillo/AmbEst/Tema3.pdf · Teorema central del l mite (TCL): ... v.a. X con media y varianza poblacional](https://reader031.vdocuments.site/reader031/viewer/2022022512/5aea01fb7f8b9ae5318bd76d/html5/thumbnails/22.jpg)
Construccion de un intervalo de confianza:
• Buscamos una cantidad pivotal para θ, que es una funcionC (X1, . . . ,Xn; θ) cuya distribucion no depende de θ.
Ejemplo 3.6: Sea (X1, . . . ,X10) una muestra aleatoria deX ∼ N(µ, 1). Entonces una cantidad pivotal para µ es
• A continuacion buscamos dos valores c1 y c2 tales que
Pθ{c1 < C (X1, . . . ,Xn; θ) < c2} = 1− α.
Estadıstica (Ambientales). Profesora: Amparo Baıllo Tema 3: Estimacion puntual y por intervalos 22
![Page 23: ESTADÍSTICA 1o CC. Ambientales [3 mm] Tema 3: …verso.mat.uam.es/~amparo.baillo/AmbEst/Tema3.pdf · Teorema central del l mite (TCL): ... v.a. X con media y varianza poblacional](https://reader031.vdocuments.site/reader031/viewer/2022022512/5aea01fb7f8b9ae5318bd76d/html5/thumbnails/23.jpg)
Ejemplo 3.6 (cont.):
• Finalmente se despeja θ de la desigualdad c1<C (X1, . . . ,Xn; θ)<c2.
Ejemplo 3.6 (cont.):
Para la muestra 1.7 2.1 2.3 2.4 1.9 1.6 2.0 2.1 2.1 1.8tenemos x = e IC0.95(µ) =
Estadıstica (Ambientales). Profesora: Amparo Baıllo Tema 3: Estimacion puntual y por intervalos 23
![Page 24: ESTADÍSTICA 1o CC. Ambientales [3 mm] Tema 3: …verso.mat.uam.es/~amparo.baillo/AmbEst/Tema3.pdf · Teorema central del l mite (TCL): ... v.a. X con media y varianza poblacional](https://reader031.vdocuments.site/reader031/viewer/2022022512/5aea01fb7f8b9ae5318bd76d/html5/thumbnails/24.jpg)
Habitualmente se trabaja con niveles de confianza del 90 %(α = 0.1), del 95 % (α = 0.05) y del 99 % (α = 0.01).
Si se observan 100 muestras de tamano n de X ∼ Fθ y seconstruyen los correspondientes 100 intervalos de confianza para θ,IC1−α(θ), aproximadamente en (1− α)100 de ellos esta elparametro desconocido θ:
x(1)1 , . . . , x
(1)n → IC
(1)1−α(θ)
x(2)1 , . . . , x
(2)n → IC
(2)1−α(θ)
...
x(100)1 , . . . , x
(100)n → IC
(100)1−α (θ)
Ver fichero Excel 100Ics.xlxs.
Estadıstica (Ambientales). Profesora: Amparo Baıllo Tema 3: Estimacion puntual y por intervalos 24
![Page 25: ESTADÍSTICA 1o CC. Ambientales [3 mm] Tema 3: …verso.mat.uam.es/~amparo.baillo/AmbEst/Tema3.pdf · Teorema central del l mite (TCL): ... v.a. X con media y varianza poblacional](https://reader031.vdocuments.site/reader031/viewer/2022022512/5aea01fb7f8b9ae5318bd76d/html5/thumbnails/25.jpg)
Distribuciones asociadas a la normal
Son distribuciones de probabilidad de ciertos estadısticosconstruidos a partir de muestras de distribuciones normales.
La distribucion χ2 de Pearson
Sean X1, . . . ,Xn v.a. independientes identicamente distribuidas(i.i.d.) con distribucion N(0, 1). La variable aleatoria
∑ni=1 X
2i
sigue una distribucion χ2 de Pearson con n grados de libertad:n∑
i=1
X 2i ∼ χ2
n
0 2 4 6 80
0.2
0.4
0.6
0.8
1
Densidad de la χ2n
χ21
χ22
χ23
χ24
χ25
Estadıstica (Ambientales). Profesora: Amparo Baıllo Tema 3: Estimacion puntual y por intervalos 25
![Page 26: ESTADÍSTICA 1o CC. Ambientales [3 mm] Tema 3: …verso.mat.uam.es/~amparo.baillo/AmbEst/Tema3.pdf · Teorema central del l mite (TCL): ... v.a. X con media y varianza poblacional](https://reader031.vdocuments.site/reader031/viewer/2022022512/5aea01fb7f8b9ae5318bd76d/html5/thumbnails/26.jpg)
La distribucion t de Student
Sean Y ,X1, . . . ,Xn v.a.i.i.d. con distribucion N(0, 1). La variable
aleatoriaY√
1n
∑ni=1 X
2i
sigue una distribucion t de Student con n
grados de libertad, tn.
−5 0 50
0.1
0.2
0.3
0.4
Densidad de la t
N(0,1)t5
t2
Estadıstica (Ambientales). Profesora: Amparo Baıllo Tema 3: Estimacion puntual y por intervalos 26
![Page 27: ESTADÍSTICA 1o CC. Ambientales [3 mm] Tema 3: …verso.mat.uam.es/~amparo.baillo/AmbEst/Tema3.pdf · Teorema central del l mite (TCL): ... v.a. X con media y varianza poblacional](https://reader031.vdocuments.site/reader031/viewer/2022022512/5aea01fb7f8b9ae5318bd76d/html5/thumbnails/27.jpg)
La distribucion F de Fisher
Sean X1, . . . ,Xm,Y1, . . . ,Yn v.a.i.i.d. con distribucion N(0, 1). Lav.a.
1m
∑mi=1 X
2i
1n
∑nj=1 Y
2j
sigue una distribucion F de Fisher con m y n grados de libertad,Fm,n.
0 1 2 3 4 5 60
0.1
0.2
0.3
0.4
0.5
0.6
0.7Densidad de la F
F5,3
F4,6
Estadıstica (Ambientales). Profesora: Amparo Baıllo Tema 3: Estimacion puntual y por intervalos 27
![Page 28: ESTADÍSTICA 1o CC. Ambientales [3 mm] Tema 3: …verso.mat.uam.es/~amparo.baillo/AmbEst/Tema3.pdf · Teorema central del l mite (TCL): ... v.a. X con media y varianza poblacional](https://reader031.vdocuments.site/reader031/viewer/2022022512/5aea01fb7f8b9ae5318bd76d/html5/thumbnails/28.jpg)
Intervalos de confianza en poblaciones normales
Propiedad: Sea X1, . . . ,Xn una muestra aleatoria de X ∼ N(µ, σ).Entonces X y S2 son v.a. independientes,
X ∼ N
(µ,
σ√n
),
n − 1
σ2S2 ∼ χ2
n−1 yX − µ
S√n
∼ tn−1
• Sea x1, . . . , xn una muestra de X ∼ N(µ, σ). Si σ es conocido unintervalo de confianza para µ al nivel de confianza 1− α es
IC1−α(µ) =
(x − zα/2
σ√n, x + zα/2
σ√n
)=
(x ∓ zα/2
σ√n
).
• Si σ es desconocido, IC1−α(µ) =
(x ∓ tn−1;α/2
s√n
)y
IC1−α(σ2) =
((n − 1)s2
χ2n−1;α/2
,(n − 1)s2
χ2n−1;1−α/2
,
).
Estadıstica (Ambientales). Profesora: Amparo Baıllo Tema 3: Estimacion puntual y por intervalos 28
![Page 29: ESTADÍSTICA 1o CC. Ambientales [3 mm] Tema 3: …verso.mat.uam.es/~amparo.baillo/AmbEst/Tema3.pdf · Teorema central del l mite (TCL): ... v.a. X con media y varianza poblacional](https://reader031.vdocuments.site/reader031/viewer/2022022512/5aea01fb7f8b9ae5318bd76d/html5/thumbnails/29.jpg)
Ejemplo 3.7: El envenenamiento por DDT causa temblores yconvulsiones. En un estudio se ha administrado una dosis de DDTa 4 ratones y se ha medido posteriormente en cada uno el periodoabsolutamente refractario, es decir, el tiempo que tardan susnervios en recuperarse tras un estımulo:
1.7 1.6 1.8 1.9 (en milisegundos)
Asumiendo normalidad en los datos:
(a) Estima el periodo absolutamente refractario medio µ paratoda la poblacion de ratones de la misma cepa sujeta almismo tratamiento con DDT.
La estimacion de µ es la media muestral: µ ≈ µ = x
x =1.7 + 1.6 + 1.8 + 1.9
4= 1.75.
Estadıstica (Ambientales). Profesora: Amparo Baıllo Tema 3: Estimacion puntual y por intervalos 29
![Page 30: ESTADÍSTICA 1o CC. Ambientales [3 mm] Tema 3: …verso.mat.uam.es/~amparo.baillo/AmbEst/Tema3.pdf · Teorema central del l mite (TCL): ... v.a. X con media y varianza poblacional](https://reader031.vdocuments.site/reader031/viewer/2022022512/5aea01fb7f8b9ae5318bd76d/html5/thumbnails/30.jpg)
Ejemplo 3.7 (cont.)
(b) Halla el error tıpico de la estimacion anterior.
s2 =(1.7− 1.75)2 + (1.6− 1.75)2 + (1.8− 1.75)2 + (1.9− 1.75)2
3= 0.017
Por tanto s =√
0.017 ≈ 0.13 y se(x)=sx√n
=0.13
2= 0.065.
(c) Calcula un intervalo de confianza para µ al 90 %.
IC90 %(µ) = [1.75∓t3;0.05·0.065] = [1.75∓2.353·0.065] = [1.597 , 1.903]
es decir, 1.597 ≤ µ ≤ 1.903 con un nivel de confianza del 90 %.
(d) Calcula otro intervalo, pero ahora con un nivel del 95 %.
IC95 %(µ) = [1.75∓t3;0.025·0.065] = [1.75∓3.182·0.065] = [1.543 , 1.957]
es decir, 1.543 ≤ µ ≤ 1.957 con un nivel de confianza del 95 %.
Estadıstica (Ambientales). Profesora: Amparo Baıllo Tema 3: Estimacion puntual y por intervalos 30
![Page 31: ESTADÍSTICA 1o CC. Ambientales [3 mm] Tema 3: …verso.mat.uam.es/~amparo.baillo/AmbEst/Tema3.pdf · Teorema central del l mite (TCL): ... v.a. X con media y varianza poblacional](https://reader031.vdocuments.site/reader031/viewer/2022022512/5aea01fb7f8b9ae5318bd76d/html5/thumbnails/31.jpg)
Ejemplo 3.8: Un aumento de la concentracion de colesterol en lasangre contribuye a dificultar su circulacion y, a la larga, producirenfermedades cardıacas y circulatorias graves. Se ha recogido unamuestra aleatoria de siete personas con niveles de Colesterol LDL
1.5 2.1 1.9 2.3 2.5 3.2 3.0 (dg/dl)
Utilizando estos datos, construye un intervalo de confianza al 90 %para la desviacion tıpica.Nota: suponer normalidad en los datos.
Estadıstica (Ambientales). Profesora: Amparo Baıllo Tema 3: Estimacion puntual y por intervalos 31
![Page 32: ESTADÍSTICA 1o CC. Ambientales [3 mm] Tema 3: …verso.mat.uam.es/~amparo.baillo/AmbEst/Tema3.pdf · Teorema central del l mite (TCL): ... v.a. X con media y varianza poblacional](https://reader031.vdocuments.site/reader031/viewer/2022022512/5aea01fb7f8b9ae5318bd76d/html5/thumbnails/32.jpg)
Ejemplo 3.5 (cont.): Con SPSS calculamos un IC de la mediapara los datos generados de una normal
Descriptivos
Estadístico Error estándar
X Media
95% de intervalo de confianza para la media
Límite inferior
Límite superior
Media recortada al 5%
Mediana
Varianza
Desviación estándar
Mínimo
Máximo
Rango
Rango intercuartil
Asimetría
Curtosis
1,6618 ,22998
1,1805
2,1432
1,6366
1,6712
1,058
1,02850
,14
3,63
3,49
1,53
,305 ,512
-,523 ,992
Página 1
Estadıstica (Ambientales). Profesora: Amparo Baıllo Tema 3: Estimacion puntual y por intervalos 32
![Page 33: ESTADÍSTICA 1o CC. Ambientales [3 mm] Tema 3: …verso.mat.uam.es/~amparo.baillo/AmbEst/Tema3.pdf · Teorema central del l mite (TCL): ... v.a. X con media y varianza poblacional](https://reader031.vdocuments.site/reader031/viewer/2022022512/5aea01fb7f8b9ae5318bd76d/html5/thumbnails/33.jpg)
• Sean x1, . . . , xm e y1, . . . , yn muestras independientes deX ∼ N(µ1, σ) e Y ∼ N(µ2, σ) respectivamente (σ desconocido).Entonces
IC1−α(µ1 − µ2) =
(x − y ∓ tm+n−2;α/2 sp
√1
m+
1
n
),
donde la varianza combinada
s2p =
(m − 1)s21 + (n − 1)s2
2
m + n − 2
es una media ponderada de las cuasivarianzas muestrales
s21 =
1
m − 1
m∑i=1
(xi − x)2 y s22 =
1
n − 1
n∑i=1
(yi − y)2.
Estadıstica (Ambientales). Profesora: Amparo Baıllo Tema 3: Estimacion puntual y por intervalos 33
![Page 34: ESTADÍSTICA 1o CC. Ambientales [3 mm] Tema 3: …verso.mat.uam.es/~amparo.baillo/AmbEst/Tema3.pdf · Teorema central del l mite (TCL): ... v.a. X con media y varianza poblacional](https://reader031.vdocuments.site/reader031/viewer/2022022512/5aea01fb7f8b9ae5318bd76d/html5/thumbnails/34.jpg)
Ejemplo 3.9: Se quiere comparar la grasa corporal (en kg) entrenadadoras y corredoras olımpicas. Se observan los siguientes datos:
Corredoras Nadadoras11.2 7.6 8.2 9.2 14.1 12.7 9.2 10.710.1 7.3 3.7 5.5 15.1 13.7 8.7 14.3
9.4 6.9 8.3 5.0 11.4 11.9
Suponiendo que estas variables siguen distribuciones normaleshomocedasticas, calcular un intervalo de confianza para ladiferencia media de grasa entre ambos tipos de deportistas.
Estadıstica (Ambientales). Profesora: Amparo Baıllo Tema 3: Estimacion puntual y por intervalos 34
![Page 35: ESTADÍSTICA 1o CC. Ambientales [3 mm] Tema 3: …verso.mat.uam.es/~amparo.baillo/AmbEst/Tema3.pdf · Teorema central del l mite (TCL): ... v.a. X con media y varianza poblacional](https://reader031.vdocuments.site/reader031/viewer/2022022512/5aea01fb7f8b9ae5318bd76d/html5/thumbnails/35.jpg)
• Sean x1, . . . , xm e y1, . . . , yn muestras aleatorias independientesde X ∼ N(µ1, σ1) e Y ∼ N(µ2, σ2) respectivamente (σ1 y σ2
desconocidas). Entonces
IC1−α
(σ2
1
σ22
)=
(s2
1/s22
Fm−1;n−1;α/2,
s21/s
22
Fm−1;n−1;1−α/2
).
Observacion: Fm;n;1−α =1
Fn;m;α
Ejemplo 3.9 (cont.): Suponiendo que la distribucion de la grasacorporal en nadadoras y corredoras es normal con distintas mediasy distintas varianzas, calcular un intervalo de confianza al 90 %para el cociente de las varianzas.
Estadıstica (Ambientales). Profesora: Amparo Baıllo Tema 3: Estimacion puntual y por intervalos 35
![Page 36: ESTADÍSTICA 1o CC. Ambientales [3 mm] Tema 3: …verso.mat.uam.es/~amparo.baillo/AmbEst/Tema3.pdf · Teorema central del l mite (TCL): ... v.a. X con media y varianza poblacional](https://reader031.vdocuments.site/reader031/viewer/2022022512/5aea01fb7f8b9ae5318bd76d/html5/thumbnails/36.jpg)
• Datos emparejados: Sea (X1,Y1), . . . , (Xn,Yn) una muestraaleatoria de (X ,Y ) donde X e Y no son independientes, pero lospares (Xi ,Yi ) son independientes entre sı.
Denotemos E (X ) = µ1 y E (Y ) = µ2 y supongamos queD = X − Y ∼ N(µ = µ1 − µ2, σ). EntoncesD1 = X1 − Y1, . . . ,Dn = Xn − Yn es una muestra aleatoria de D.
Podemos construir intervalos de confianza para µ = µ1 − µ2 y paraσ como se indico en la pagina 28.
Estadıstica (Ambientales). Profesora: Amparo Baıllo Tema 3: Estimacion puntual y por intervalos 36
![Page 37: ESTADÍSTICA 1o CC. Ambientales [3 mm] Tema 3: …verso.mat.uam.es/~amparo.baillo/AmbEst/Tema3.pdf · Teorema central del l mite (TCL): ... v.a. X con media y varianza poblacional](https://reader031.vdocuments.site/reader031/viewer/2022022512/5aea01fb7f8b9ae5318bd76d/html5/thumbnails/37.jpg)
Ejemplo 3.10: Ensayo clınico cruzado. Se quiere comparar elefecto X de un nuevo medicamento con el efecto Y de otro yacomercializado. Se administran ambos a 14 personas coninsuficiencia respiratoria, asignando aleatoriamente a cada pacienteun tratamiento, y manteniendolo durante un mes. Luego se le da eltratamiento alternativo durante otro mes. En la cuarta semana decada tratamiento se observa FEV1 (forced expiratory volume), elvolumen de aire que un paciente expulsa en un segundo, tras unainhalacion profunda.
Paciente X Y D Paciente X Y D1 2.9 3.9 -1.0 8 3.9 2.4 1.52 4.0 3.9 0.1 9 2.5 3.6 -1.13 3.4 3.3 0.1 10 6.5 2.1 4.44 3.2 4.3 -1.1 11 5.5 4.0 1.55 3.8 3.2 0.6 12 4.0 3.9 0.16 5.2 3.5 1.7 13 5.3 4.0 1.37 3.9 2.7 1.2 14 4.3 2.3 2.0
Calcular un intervalo de confianza al 90 % para la diferencia mediade FEV1 con ambos medicamentos.Estadıstica (Ambientales). Profesora: Amparo Baıllo Tema 3: Estimacion puntual y por intervalos 37
![Page 38: ESTADÍSTICA 1o CC. Ambientales [3 mm] Tema 3: …verso.mat.uam.es/~amparo.baillo/AmbEst/Tema3.pdf · Teorema central del l mite (TCL): ... v.a. X con media y varianza poblacional](https://reader031.vdocuments.site/reader031/viewer/2022022512/5aea01fb7f8b9ae5318bd76d/html5/thumbnails/38.jpg)
Intervalos de confianza para otras distribuciones
Intervalo de confianza para el parametro p de una Bernoulli
Sea x1, . . . , xn una muestra de X∼Bernoulli(p). Entonces
IC1−α(p) =
(x ∓ zα/2
√x(1− x)
n
)(para n grande)
Intervalo para diferencia de proporciones de Bernoullis
Sean x1, . . . , xm e y1, . . . , yn muestras de X ∼ Bernoulli(p1) eY ∼ Bernoulli(p2) respectivamente, tal que p1 = x y p2 = y .Entonces, para m y n grandes,
IC1−α(p1 − p2) =
(x − y ∓ zα/2
√x(1− x)
m+
y(1− y)
n
)
Estadıstica (Ambientales). Profesora: Amparo Baıllo Tema 3: Estimacion puntual y por intervalos 38
![Page 39: ESTADÍSTICA 1o CC. Ambientales [3 mm] Tema 3: …verso.mat.uam.es/~amparo.baillo/AmbEst/Tema3.pdf · Teorema central del l mite (TCL): ... v.a. X con media y varianza poblacional](https://reader031.vdocuments.site/reader031/viewer/2022022512/5aea01fb7f8b9ae5318bd76d/html5/thumbnails/39.jpg)
Ejemplo 3.11: Koshy et al. (2010)1 estudian el efecto deltabaquismo de los padres sobre el ındice de masculinidad, tambienllamado razon de sexo, la razon de hombres por mujeres en undeterminado territorio, expresada en tanto por ciento. Para ellotoman una muestra de 363 nacimientos de padres fumadorescronicos (ambos) en la que 158 bebes fueron varones y el restoninas. Calcular un intervalo de confianza para la proporcion devarones nacidos de ambos padres fumadores cronicos.
1Koshy et al. (2010). Parental smoking and increased likelihood of femalebirths. Annals of Human Biology.Estadıstica (Ambientales). Profesora: Amparo Baıllo Tema 3: Estimacion puntual y por intervalos 39
![Page 40: ESTADÍSTICA 1o CC. Ambientales [3 mm] Tema 3: …verso.mat.uam.es/~amparo.baillo/AmbEst/Tema3.pdf · Teorema central del l mite (TCL): ... v.a. X con media y varianza poblacional](https://reader031.vdocuments.site/reader031/viewer/2022022512/5aea01fb7f8b9ae5318bd76d/html5/thumbnails/40.jpg)
Ejemplo 3.12: Un laboratorio farmaceutico desarrolla un nuevomedicamento para prevenir los resfriados. La companıa afirma queel producto es igual de efectivo en hombres que en mujeres. Paracomprobarlo observan una muestra de 100 mujeres y 200 hombressobre los que prueban el medicamento. Al final del estudio un 38 %y un 51 % respectivamente de las mujeres y hombres de la muestrase habıan resfriado.Calcular un intervalo de confianza al 95 % para la diferencia entrela proporcion de mujeres y la de hombres que se resfrıan aunhabiendo tomado el medicamento.
Estadıstica (Ambientales). Profesora: Amparo Baıllo Tema 3: Estimacion puntual y por intervalos 40
![Page 41: ESTADÍSTICA 1o CC. Ambientales [3 mm] Tema 3: …verso.mat.uam.es/~amparo.baillo/AmbEst/Tema3.pdf · Teorema central del l mite (TCL): ... v.a. X con media y varianza poblacional](https://reader031.vdocuments.site/reader031/viewer/2022022512/5aea01fb7f8b9ae5318bd76d/html5/thumbnails/41.jpg)
Intervalo de confianza para el parametro λ de una Poisson
Sea x1, . . . , xn una muestra de X ∼ Pois(λ). Recordemos queE (X ) = V (X ) = λ y λ = x . Entonces, para n grande,
IC1−α(λ) =
(x ∓ zα/2
√x
n
).
Ejemplo 3.3 (cont.): Calcular un intervalo de confianza al 95 %para el parametro λ.
Estadıstica (Ambientales). Profesora: Amparo Baıllo Tema 3: Estimacion puntual y por intervalos 41
![Page 42: ESTADÍSTICA 1o CC. Ambientales [3 mm] Tema 3: …verso.mat.uam.es/~amparo.baillo/AmbEst/Tema3.pdf · Teorema central del l mite (TCL): ... v.a. X con media y varianza poblacional](https://reader031.vdocuments.site/reader031/viewer/2022022512/5aea01fb7f8b9ae5318bd76d/html5/thumbnails/42.jpg)
Mınimo tamano muestral
El error cometido al estimar un parametro θ mediante un intervalode confianza IC1−α(θ) es la semi-amplitud del intervalo.
Observacion: Esta definicion tiene sentido principalmente enintervalos del tipo IC1−α(θ) = (θ ∓ semilongitud).
Objetivo: Determinar el mınimo tamano muestral n necesario paraque el error cometido al estimar θ mediante un intervalo deconfianza sea menor que una cierta cantidad.
Motivacion: Queremos que la estimacion por intervalo deconfianza tenga una determinada precision.
El valor de n obtenido debe tomarse como orientativo,especialmente cuando la semilongitud del intervalo dependa de lamuestra observada.
Estadıstica (Ambientales). Profesora: Amparo Baıllo Tema 3: Estimacion puntual y por intervalos 42
![Page 43: ESTADÍSTICA 1o CC. Ambientales [3 mm] Tema 3: …verso.mat.uam.es/~amparo.baillo/AmbEst/Tema3.pdf · Teorema central del l mite (TCL): ... v.a. X con media y varianza poblacional](https://reader031.vdocuments.site/reader031/viewer/2022022512/5aea01fb7f8b9ae5318bd76d/html5/thumbnails/43.jpg)
Ejemplo 3.13: Se quiere estimar la proporcion de manatıes en elCaribe que han sido heridos por helices de barcos. ¿A cuantosmanatıes tendremos que examinar para asegurar que la estimaciontiene un error maximo del 10 % con un nivel de confianza del95 %?
Estadıstica (Ambientales). Profesora: Amparo Baıllo Tema 3: Estimacion puntual y por intervalos 43