unidad n° vii · es decir, la media de su distribución muestral es el parámetro. ejemplo: la...
TRANSCRIPT
Módulo Teórico Estadística Básica Prof. Dr. Juan Ignacio Pastore
Unidad N° VII
Distribuciones de muestreo: Distribución de la media muestral con varianza conocida y
desconocida. Distribución T. Manejo de Tablas. Distribución de la proporción muestral y
del estadístico ji-cuadrado.
Módulo Teórico Estadística Básica Prof. Dr. Juan Ignacio Pastore
1. INTRODUCCIÓN A LA INFERENCIA ESTADÍSTICA
La inferencia estadística está formada por un conjunto de métodos utilizados para tomar
decisiones u obtener conclusiones sobre una población a partir de la información
contenida en una muestra obtenida en forma aleatoria de la misma.
Normalmente, por distintas razones, es imposible estudiar la totalidad de la población para
tomar decisiones u obtener conclusiones. Por tal razón, para obtener conclusiones de la
población se recurre a una muestra de la misma.
Cualquier inferencia o conclusión obtenida de la población, necesariamente, estará
basada en un estadístico muestral, es decir, en la información proporcionada por la
muestra. Formalmente definimos un estadístico como una función de las observaciones
muestrales. La elección del estadístico apropiado dependerá de cuál sea el parámetro
poblacional que nos interese. El valor verdadero del parámetro será desconocido y un
objetivo será estimar su valor, por lo que tal estadístico se denomina estimador.
El estudio de poblaciones estadísticas supone en general el conocimiento de la función de
probabilidad que gobierna el comportamiento aleatorio de la variable de interés. En
muchos casos sabemos o presumimos conocer cómo se distribuye una población.
Sabemos por ejemplo que la población es aproximadamente normal; pero desconocemos
la media y la varianza poblacionales. Sabemos que la variable de interés es binomial pero
desconocemos la probabilidad de éxito poblacional o el número de pruebas de Bernoulli.
Sabemos que se trata de un proceso de Poisson pero desconocemos la frecuencia media
de ocurrencia por unidad. Presumimos que la variable es exponencial pero
desconocemos el parámetro que precisa la distribución exponencial poblacional.
Lógicamente en todas estas situaciones la función de probabilidad de la variable en
estudio se concreta determinando los parámetros poblacionales correspondientes y para
lograrlo se utilizan los denominados métodos de estimación de parámetros.
La estimación de uno o varios parámetros poblacionales desconocidos es posible
construyendo funciones de probabilidad de variables aleatorias muestrales, más
conocidos como estimadores muestrales.
Dichos estimadores garantizaran un cálculo o una aproximación satisfactoria del
parámetro poblacional desconocido siempre que cumplan propiedades de: insesgamiento
o máxima simetría, varianza mínima o máxima concentración de los datos alrededor del
parámetro estimado y máxima probabilidad.
Módulo Teórico Estadística Básica Prof. Dr. Juan Ignacio Pastore
Población y Muestra
Población o universo Es el conjunto de individuos o elementos con características
comunes que se desean investigar. Normalmente es demasiado grande para poder
abarcarla. El estudio de toda la población se denomina censo.
Muestra es un subconjunto de la población al que tenemos acceso y sobre el que
realmente hacemos las observaciones (mediciones). El objetivo principal de la toma de
una muestra aleatoria es obtener información sobre los parámetros no conocidos de la
población.
La inferencia estadística consiste en generalizar las conclusiones extraídas de una
muestra sobre la población.
Muestreo Aleatorio Simple (M.A.S.)
Muestreo. Es el proceso para extraer una muestra de una población. Es necesario utilizar
muestras representativas del total de la población, es decir, muestras en las que exista
alguna garantía de que cualquier elemento de la población ha podido estar representado
en ellas. El muestreo puede ser de dos tipos:
- Muestreo probabilístico. En este muestreo se conoce (o puede calcularse) la
probabilidad asociada a cada una de las muestras que es posible extraer de una
determinada población.
- Muestreo no probabilístico. En él se desconoce o no se tiene en cuenta la
probabilidad asociada a cada una de las muestras posibles; el investigador selecciona
aquella muestra que, en su opinión, es más representativa.
Solo el muestreo probabilístico permite obtener una idea sobre el grado de
representatividad de una muestra.
En el Muestreo Aleatorio Simple, cada elemento de la población tiene la misma
probabilidad de ser elegido para formar parte de la muestra. Cada muestra del mismo
tamaño tiene la misma probabilidad de ser seleccionada.
➢ El muestreo aleatorio simple en poblaciones finitas se realiza “con sustitución”.
➢ Este procedimiento garantiza la independencia de las observaciones.
➢ La selección aleatoria de los elementos se realiza con una tabla de números
aleatorios, o con algún procedimiento informático.
Formalmente:
Módulo Teórico Estadística Básica Prof. Dr. Juan Ignacio Pastore
Muestra aleatoria simple: Si X es una variable aleatoria con distribución de
probabilidades o fdp ( )f x , el conjunto de n observaciones tomadas de la variable X ,
1 2, , , nX X X , con resultados numéricos 1 2, , , nx x x , es una muestra aleatoria de tamaño
n si:
a) Las iX son variables aleatorias independientes.
b) Cada observación iX tiene la misma distribución de probabilidades.
El objetivo de tomar una muestra es obtener información sobre los parámetros no
conocidos de la población.
Parámetros y Estimadores
Parámetro: Es una característica numérica que describe una variable observada en la
población. Se calcula sobre la población.
Estadístico o estimador: Es cualquier operación que se hace con la muestra. Por eso es
una función de las observaciones contenidas en una muestra.
Si X es una variable aleatoria con distribución de probabilidades o fdp ( )f x ,
caracterizada por el parámetro desconocido y si 1 2, , , nX X X es una muestra aleatoria
de tamaño n , entonces ( )1 2, , , nh X X X = es un estimador del parámetro .
Ejemplos: la media muestral, la proporción muestral y la varianza muestral.
Cómo los valores de un estadístico, varían de una muestra aleatoria a otra, se lo puede
considerar como una variable aleatoria con su correspondiente distribución de
probabilidades. La distribución de probabilidades de un estadístico se conoce como
distribuciones de muestreo.
Estimación puntual: Es el valor numérico que toma un estimador. Se calcula con los
datos de la muestra, del cual se espera que estime un parámetro poblacional.
Módulo Teórico Estadística Básica Prof. Dr. Juan Ignacio Pastore
Ejemplos:
Parámetro Poblacional Estimador Estimación
Media 1ˆ
n
i
i
X
Xn
== =
1
n
i
i
x
xn
==
Varianza 2
2 2 2
1
1ˆ ( )
1
n
i
i
S X Xn
=
= = −− ( )
22
1
1
1
n
i
i
s x xn =
= −−
Proporción p ˆX númeroéxitos
pn númeropruebas
= = ˆx
pn
=
Parámetros poblacionales, estimadores y estimaciones
Puede haber varios estimadores puntuales diferentes para un mismo parámetro. Por
ejemplo, si deseamos estimar la media poblacional, podríamos considerar la media
muestral, la mediana de la muestra, o quizás el promedio de las observaciones extremas
como estimadores puntuales.
Teniendo en cuenta esto:
➢ ¿Qué características queremos que posea un buen estimador?
➢ ¿Cómo decimos que un estimador es mejor que otro?
Propiedades de los estimadores
Nuestro objetivo ahora será dar algunas propiedades deseables de los estimadores
puntuales, con el fin de poder conocer la bondad de los mismos, pues cuantas más
propiedades verifiquen los estimadores puntuales mejores serán.
Módulo Teórico Estadística Básica Prof. Dr. Juan Ignacio Pastore
Propiedad de insesgadura:
Si tenemos un gran número de muestras de tamaño n y obtenemos el valor del estimador
en cada una de ellas, sería deseable que la media de todas estas estimaciones
coincidiera con el valor medio de la población . Se dice que un estimador es insesgado
si su esperanza matemática coincide con el valor del parámetro a estimar.
Formablemente: Un estimador es un estimador insesgado del parámetro
desconocido si ( )E = . Es decir, la media de su distribución muestral es el
parámetro.
Ejemplo:
La media muestral X y la varianza muestral 2S son estimadores insesgados de la media
poblacional y la varianza poblacional 2 , respectivamente.
Dem/
Si 1 2 3, , , , nX X X X son v. a. independientes idénticamente distribuidas (iid) con
esperanza y varianza finita, ( )iE X = y ( ) 2
iV X = para todo 1,2, ,i n= .
Veamos en primer lugar que 1
ni
i
XX
n=
= es un estimador insesgado de , es decir la
media poblacional.
( ) ( )1 1
1 1n ni
i
i i
XE X E E X
n n n= =
= = =
n =
Veamos ahora que ( )
2
2
1 1
ni
i
X XS
n=
−=
− es un estimador insesgado de 2 , es decir de la
varianza poblacional.
Módulo Teórico Estadística Básica Prof. Dr. Juan Ignacio Pastore
( )( )
( ) ( )2
2 22 2
1 1 1
2 22 2
1 1 1 1 1
22 2
1 1
1 12
1 1 1
1 12 2
1 1
1 12
1 1
n n ni
i i i
i i i
n n n n n
i i i i
i i i i i
n X
n
i i
i i
X XE S E E X X E X X X X
n n n
E X X X X E X X X nXn n
E X nX X nX E Xn n
= = =
= = = = =
= =
− = = − = − + = − − −
= + − + = − + = − −
= − + =
− −
( ) ( ) ( ) ( ) ( )
2 2 22
1
22 22 2 2 2 2
1 1 1
2
12
1
1 1 1
1 1 1
1
1
n n
i
i
n n n
i i
i i i
nX nX E X nXn
E X E nX E X nE X nn n n n
nn
=
= = =
− + = − =
−
= − = − = + − + = − − −
=−
2 2n n + − n−2
n
( )2 21 1
1 1n
n n
= − = − −
( )2 1n − 2=
Cálculos auxiliares:
( ) ( ) ( ) ( ) ( )
2
22 2 2 2 2 2
i i i i iE X E X V X E X E X
− = = = + = +
( ) ( ) ( ) ( )2 222 2
2E X E X V X E Xn n
− = = = +
Observación: si hubiésemos dividido por n en lugar de ( )1n − al definir 2S la propiedad
anterior no era válida.
Propiedad de eficiencia:
Se dice que los estimadores son eficientes cuando generan una distribución muestral con
el mínimo error estándar, es decir, entre dos estimadores insesgados de un parámetro
dado es más eficiente el de menor varianza.
Formalmente: Un estimador insesgado 1 es más eficiente que otro 2 Si son
insesgados de y la varianza de 1 es menor que la varianza de
2 .
Módulo Teórico Estadística Básica Prof. Dr. Juan Ignacio Pastore
Estimador consistente:
Un estimador se dice consistente cuando su valor tiende hacia el verdadero valor del
parámetro a medida que aumenta el tamaño de la muestra. Es decir, la probabilidad de
que la estimación sea el verdadero valor del parámetro tiende a 1.
Propiedad de suficiencia:
Se dice de un estimador que es suficiente cuando es capaz de extraer de los datos toda
la información importante sobre el parámetro.
Un estimador es suficiente si utiliza toda la información de la muestra.
La media muestral es un estimador suficiente de .
El modo no es un estimador suficiente de .
Error de Muestreo
Es el error que se comete debido al hecho de dar conclusiones sobre cierta realidad, a
partir de la observación de sólo una parte de ella, es decir, es la diferencia entre el
parámetro de la población y el estadístico de la muestra utilizado para estimar el
parámetro.
Distribuciones de Muestreo.
Las muestras aleatorias obtenidas de una población son, por naturaleza propia,
impredecibles. No se esperaría que dos muestras aleatorias del mismo tamaño y tomadas
de la misma población tengan, por ejemplo, la misma media muestral o que sean
completamente parecidas. Por lo tanto es de esperar que cualquier estadístico cambie su
valor de una muestra a otra, por ello, se quiere estudiar la distribución de todos los valores
posibles de un estadístico.
Tales distribuciones serán muy importantes en el estudio de la estadística inferencial,
porque las inferencias sobre las poblaciones se harán usando estadísticos muestrales.
Cómo los valores de un estadístico, varían de una muestra aleatoria a otra, se lo puede
considerar como una variable aleatoria con su correspondiente distribución de
probabilidades. La distribución de probabilidades de un estadístico se denomina
distribución muestral.
Distribución muestral. El concepto de distribución muestral se refiere al comportamiento
de un estadístico. Los estadísticos son variables aleatorias. Como tales, tienen su propia
función de probabilidad. Podemos hacer explícita su forma o su valor esperado y su
varianza.
Módulo Teórico Estadística Básica Prof. Dr. Juan Ignacio Pastore
Resumiendo:
Dada una población y el experimento aleatorio que consistente en seleccionar una
muestra de tamaño n de dicha población. Sea la variable aleatoria ( )1 2, , , nx x x
(estadístico muestral) como una aplicación que asigna a cada muestra, 1 2,X , , nX X , un
resumen estadístico determinado, ( )1 2, , , nh X X X . Esta nueva variable aleatoria tiene
una distribución de probabilidad denominada distribución muestral de .
• Su comportamiento dependerá del que tenga la muestra de la v.a. X en la población y
del tamaño de las muestras.
•A veces nos resultará útil conocer su esperanza matemática, su varianza y forma.
Empíricamente: Para hallar empíricamente la distribución muestral de un estadístico es
necesario seleccionar todas las muestras de dicha población y a partir de dicha
información construir la distribución de frecuencia relativa de los valores del estadístico, la
cual es considerada como su distribución muestral.
Distribución de muestreo de la media x
Si 1 2 3, , , , nX X X X son v.a. independientes idénticamente distribuidas (iid) con
esperanza y varianza finita, ( )iE X = y ( ) 2
iV X = para todo 1,2, ,i n= .
Sea 1
ni
i
xX
n=
= , entonces ( )E X = , ( )2
V Xn
= y
Xn
= .
( ) ( )1 1
1 1n ni
i
i i
XE X E E X
n n n= =
= = =
n =
( ) ( )2 21 1
1 1n ni
i
i i
XV X V V X
n n n= =
= = =
n
22
n
=
Módulo Teórico Estadística Básica Prof. Dr. Juan Ignacio Pastore
Ejemplo: Se toman muestras de tamaño 2 de una población consistente de cinco valores,
2, 4, 6, 8 y 10 para simular una población "grande" de manera que el muestreo pueda
realizarse un gran número de veces, supondremos que éste se hace con sustitución, es
decir, el número elegido se reemplaza antes de seleccionar el siguiente, además, se
seleccionan muestras ordenadas. En una muestra ordenada, el orden en que se
seleccionan las observaciones es importante, por tanto, la muestra ordenada (2,4) es
distinta de la muestra ordenada (4,2).
En la muestra (4,2), se seleccionó primero 4 y después 2.
La media poblacional es igual a 6 y la varianza poblacional es igual a 8.
La siguiente tabla contiene una lista de todas las muestras ordenadas de tamaño 2 que es posible seleccionar con sustitución y también contiene las medias muestrales y los correspondientes errores muestrales.
Se puede observar que la suma de los errores muestrales es cero
X toma los valores 2;3;4;5;6;7;8;9;10X
R = y la distribución de probabilidades está
dada por:
Módulo Teórico Estadística Básica Prof. Dr. Juan Ignacio Pastore
Para esta distribución podemos calcular su esperanza y varianza
( )1 2 3 1
2 3 4 10 625 25 25 25
E X = + + + =
( )22 2 2 21 2 3 1
2 3 4 10 4025 25 25 25
E X = + + + + =
( ) ( ) ( )22 2
40 36 4V X E X E X = − = − =
Por lo tanto se verifica que:
( )E X =
( )2
V Xn
=
Distribuciones muestrales de poblaciones con distribución conocida.
Se ha visto que para hallar la distribución muestral de un estadístico es necesario
seleccionar todas las muestras de dicha población y a partir de dicha información construir
la distribución de frecuencia relativa de los valores del estadístico. Otra manera de hallar
la distribución muestral de un estadístico es basándose en el hecho de que como un
estadístico es función de variables aleatorias cuya distribución es conocida, excepto
quizás por sus parámetros, entonces podemos hallar su distribución de probabilidad.
Distribución muestral de la media x
En esta sección vamos a determinar la distribución muestral de la media solo en el caso
en que la población sea normal, tomando en consideración los casos en que la varianza
es conocida y la varianza es desconocida.
Módulo Teórico Estadística Básica Prof. Dr. Juan Ignacio Pastore
Distribución muestral de la media para una población normal con varianza 2 conocida.
Resultado: Al estudiar la distribución normal se consideraron algunas propiedades que posee dicha distribución, una de ellas era referente a la distribución de una combinación
lineal de variables aleatorias normales. Así pues, sabemos que si 1 2 3, , , , nX X X X son
v.a. independientes distribuidas normalmente ( )2,i i iX N 1,...,i n = y si ,...,i na a
son números reales, entonces la variable aleatoria:
1
n
i i
i
X a X=
=
Tiene una distribución normal 2 2
1 1
,n n
i i i i i
i i
X N a a = =
Este resultado nos será de utilidad para obtener la distribución de la media muestral,
Teorema: Si 1 2 3, , , , nX X X X es una muestra aleatoria extraída de una población que se
distribuye normalmente ( )2,X N entonces la media muestral se distribuye
normalmente con ( )E X = y ( )2
V Xn
= , es decir
2
,X Nn
.
Sea 1
ni
i
XX
n=
= ,
( ) ( )1 1
1 1n ni
i
i i
XE X E E X
n n n= =
= = =
n =
( ) ( )2 21 1
1 1n ni
i
i i
XV X V V X
n n n= =
= = =
n
22
n
=
Cómo la población se distribuye normalmente con varianza 2 conocida entonces por el
resultado anterior para cualquier tamaño de la muestra 2
,X Nn
.
Módulo Teórico Estadística Básica Prof. Dr. Juan Ignacio Pastore
Distribución muestral de la media para una población normal con varianza 2
desconocida.
Hasta ahora estábamos admitiendo que se conoce la varianza de la población de la que
se extrae la muestra, pero esta no sería la situación general, sino que la mayoría de las
veces no conocemos la varianza de la población, entonces cómo se dispone de una
muestra aleatoria de tamaño n , podemos, calcular la varianza muestral 2S para estimar la
varianza poblacional 2 desconocida.
Cuando la varianza poblacional 2 es desconocida la distribución del estadístico X
Sn
−
depende del tamaño de la muestra:
a) El tamaño de la muestra es grande 30n .
Cuando el tamaño de la muestra es grande, es decir 30n , la distribución del estadístico
X
Sn
− sigue siendo aproximadamente ( )0,1N
b) El tamaño de la muestra es pequeño 30n .
Antes de analizar este caso estudiemos la distribución de la varianza muestral:
Distribución de la varianza muestral
Ya vimos que el estadístico 2S es un estimador insesgado de la varianza 2 de una
población normal cuando se desconoce 2 .
Si 2S es la varianza de una muestra aleatoria de tamaño n tomada de una población
normal que tiene una varianza 2 , una función ( ) 2
2
1n S
− de dicho estadístico, el cual
sigue siendo un estadístico, sigue una distribución tiene una distribución ji-cuadrado con
1n− grados de libertad.
( ) 2
2 2
12
1n
n S
−
−=
Módulo Teórico Estadística Básica Prof. Dr. Juan Ignacio Pastore
Distribución Ji-Cuadrado
Sean 1 2, , , nX X X variables aleatorias distribuidas normalmente e independientemente
con media 0 = y varianza 2 1 = . Entonces la variable aleatoria 2 2 2 2
1 2 nX X X = + + + ,
tiene una distribución Ji-Cuadrado con n grados de libertad, cuya fdp está definida por:
( )
12 2
2
10
22
0 0
n x
nx e x
nf x
x
− −
=
Donde es la función Gamma.
En matemáticas, la función gamma denotada por ( )z , extiende el concepto de factorial
a los números complejos. Se define como:
( ) 1
0
z xz x e dx
− − =
Puede demostrarse que:
1) La integral de ( )z es finita.
2) ( ) ( ) ( )1 1z z z = − −
3) En particular, si z es un entero positivo, ( ) !z z =
4) ( )1 1 = y 1
2
=
La siguiente figura muestra la gráfica de la función 2 para distintos grados de libertad
notados por k .
Módulo Teórico Estadística Básica Prof. Dr. Juan Ignacio Pastore
Grados de libertad: es el nombre dado al número de observaciones linealmente
independientes que ocurren en una suma de cuadrados.
Observación:
✓ Si los grados de libertad n→ la forma límite de 2 es la distribución normal.
✓ La media y la varianza de la distribución ji-cuadrado son n = y 2 2n = .
✓ Los puntos porcentuales de la distribución se dan en la tabla correspondiente
( )( ) ( )( )
2
2,
2 2
,n
n
n nP f x dx
= =
Por ejemplo
( )( ) ( )2 2 2
10 100,05;1018,31 0,05P P = =
Esto significa que el punto del 5% de la distribución con 10 grados de libertad es 18,31.
( )
( )2
2
2
1
1
n
n S
−
−= =
( )
( )
2
1
1
n
i
i
X X
n
=
−
−
( ) ( )22
2 21 1
n ni i
i i
X X X X
= =
− − = =
Módulo Teórico Estadística Básica Prof. Dr. Juan Ignacio Pastore
b) El tamaño de la muestra es pequeño 30n .
Si el tamaño de la muestra es pequeño, 30n , los valores de la varianza muestral 2S
varían considerablemente de muestra en muestra, pues 2S disminuye a medida que n
aumenta, y la distribución del estadístico ya no sería una distribución normal. Por lo tanto,
cuando la varianza poblacional 2 es desconocida la distribución del estadístico X
Sn
−
se ajusta a una distribución t de Student, con 1n− grados de libertad.
1n
XT t
Sn
−
−=
Distribución T de Student
Si Z es una variable aleatoria con distribución normal ( )0,1N , V una variable aleatoria
con distribución Ji-Cuadrado con n grados de libertad y además Z y V son
independientes, entonces la variable aleatoria:
n
ZT t
V
n
=
Tiene la siguiente fdp:
( )
( )
( )12 2
1
2 1
12
n
n
f x xn
n x
n
+
+ = −
+
La distribución de T se llama ahora la distribución t de Student. El parámetro v
representa el número de grados de libertad. La distribución depende de v , pero no de
o , lo cual es muy importante en la práctica.
Los puntos porcentuales de la distribución t están dados por la tabla correspondiente
( ) ( ),
,
v
v
t
P T t f x dx
= =
La siguiente figura muestra la gráfica de la función t de Student para distintos grados de
libertad notados por k
Módulo Teórico Estadística Básica Prof. Dr. Juan Ignacio Pastore
.
Por ejemplo
( )( ) ( )0.05,101,812 0,05P T t P T = =
0.95,10 0.05,10 1.813t t= − = −
Recordemos que si Z es una variable aleatoria con distribución normal ( )0,1N , V una
variable aleatoria con distribución Ji-Cuadrado con n grados de libertad y además Z y V
son independientes, entonces la variable aleatoria:
n
ZT t
V
n
=
De acuerdo a esta definición:
( )
( )
2
2
1
1
XX
n
n S
n
−−
= −
−
1n n −
1n − S
1n
Xt
Sn
−
−=
Módulo Teórico Estadística Básica Prof. Dr. Juan Ignacio Pastore
DISTRIBUCION DE LA PROPORCIÓN MUESTRAL p
Consideremos una v.a ( ),X B n p donde p es la proporción de “éxito” en la población.
Para tamaños grandes de n, n>30, la distribución Binomial se aproxima a una distribución
normal.
( ), (1 )X N np np p −
Definamos el estadístico X
pn
= , es el estimador puntual de la proporción poblacional.
La distribución de muestreo de p es aproximadamente normal con esperanza p y
varianza ( )1p p
n
− con p no cerca de 0 y 1.
Este resultado se obtiene de la aplicación directa del TLC y el Teorema de Bernouli
Generalizado.
La distribución F de Fisher
Si 2
1 y 2
2 son v.a. independientes que tienen distribución ji-cuadrado, con 1n y 2n
grados de libertad, respectivamente, la variable aleatoria definida por:
2
1
1
2
2
2
nF
n
=
Tiene una distribución F con 1n y 2n grados de libertad.