unidad n° vii · es decir, la media de su distribución muestral es el parámetro. ejemplo: la...

Módulo Teórico Estadística Básica Prof. Dr. Juan Ignacio Pastore

Unidad N° VII

Distribuciones de muestreo: Distribución de la media muestral con varianza conocida y

desconocida. Distribución T. Manejo de Tablas. Distribución de la proporción muestral y

del estadístico ji-cuadrado.


1. INTRODUCCIÓN A LA INFERENCIA ESTADÍSTICA

La inferencia estadística está formada por un conjunto de métodos utilizados para tomar

decisiones u obtener conclusiones sobre una población a partir de la información

contenida en una muestra obtenida en forma aleatoria de la misma.

Normalmente, por distintas razones, es imposible estudiar la totalidad de la población para

tomar decisiones u obtener conclusiones. Por tal razón, para obtener conclusiones de la

población se recurre a una muestra de la misma.

Cualquier inferencia o conclusión obtenida de la población, necesariamente, estará

basada en un estadístico muestral, es decir, en la información proporcionada por la

muestra. Formalmente definimos un estadístico como una función de las observaciones

muestrales. La elección del estadístico apropiado dependerá de cuál sea el parámetro

poblacional que nos interese. El valor verdadero del parámetro será desconocido y un

objetivo será estimar su valor, por lo que tal estadístico se denomina estimador.

El estudio de poblaciones estadísticas supone en general el conocimiento de la función de

probabilidad que gobierna el comportamiento aleatorio de la variable de interés. En

muchos casos sabemos o presumimos conocer cómo se distribuye una población.

Sabemos por ejemplo que la población es aproximadamente normal; pero desconocemos

la media y la varianza poblacionales. Sabemos que la variable de interés es binomial pero

desconocemos la probabilidad de éxito poblacional o el número de pruebas de Bernoulli.

Sabemos que se trata de un proceso de Poisson pero desconocemos la frecuencia media

de ocurrencia por unidad. Presumimos que la variable es exponencial pero

desconocemos el parámetro que precisa la distribución exponencial poblacional.

Lógicamente en todas estas situaciones la función de probabilidad de la variable en

estudio se concreta determinando los parámetros poblacionales correspondientes y para

lograrlo se utilizan los denominados métodos de estimación de parámetros.

La estimación de uno o varios parámetros poblacionales desconocidos es posible

construyendo funciones de probabilidad de variables aleatorias muestrales, más

conocidos como estimadores muestrales.

Dichos estimadores garantizaran un cálculo o una aproximación satisfactoria del

parámetro poblacional desconocido siempre que cumplan propiedades de: insesgamiento

o máxima simetría, varianza mínima o máxima concentración de los datos alrededor del

parámetro estimado y máxima probabilidad.


Población y Muestra

Población o universo Es el conjunto de individuos o elementos con características

comunes que se desean investigar. Normalmente es demasiado grande para poder

abarcarla. El estudio de toda la población se denomina censo.

Muestra es un subconjunto de la población al que tenemos acceso y sobre el que

realmente hacemos las observaciones (mediciones). El objetivo principal de la toma de

una muestra aleatoria es obtener información sobre los parámetros no conocidos de la

población.

La inferencia estadística consiste en generalizar las conclusiones extraídas de una

muestra sobre la población.

Muestreo Aleatorio Simple (M.A.S.)

Muestreo. Es el proceso para extraer una muestra de una población. Es necesario utilizar

muestras representativas del total de la población, es decir, muestras en las que exista

alguna garantía de que cualquier elemento de la población ha podido estar representado

en ellas. El muestreo puede ser de dos tipos:

- Muestreo probabilístico. En este muestreo se conoce (o puede calcularse) la

probabilidad asociada a cada una de las muestras que es posible extraer de una

determinada población.

- Muestreo no probabilístico. En él se desconoce o no se tiene en cuenta la

probabilidad asociada a cada una de las muestras posibles; el investigador selecciona

aquella muestra que, en su opinión, es más representativa.

Solo el muestreo probabilístico permite obtener una idea sobre el grado de

representatividad de una muestra.

En el Muestreo Aleatorio Simple, cada elemento de la población tiene la misma

probabilidad de ser elegido para formar parte de la muestra. Cada muestra del mismo

tamaño tiene la misma probabilidad de ser seleccionada.

➢ El muestreo aleatorio simple en poblaciones finitas se realiza “con sustitución”.

➢ Este procedimiento garantiza la independencia de las observaciones.

➢ La selección aleatoria de los elementos se realiza con una tabla de números

aleatorios, o con algún procedimiento informático.

Formalmente:


Muestra aleatoria simple: Si X es una variable aleatoria con distribución de

probabilidades o fdp ( )f x , el conjunto de n observaciones tomadas de la variable X ,

1 2, , , nX X X , con resultados numéricos 1 2, , , nx x x , es una muestra aleatoria de tamaño

n si:

a) Las iX son variables aleatorias independientes.

b) Cada observación iX tiene la misma distribución de probabilidades.

El objetivo de tomar una muestra es obtener información sobre los parámetros no

conocidos de la población.

Parámetros y Estimadores

Parámetro: Es una característica numérica que describe una variable observada en la

población. Se calcula sobre la población.

Estadístico o estimador: Es cualquier operación que se hace con la muestra. Por eso es

una función de las observaciones contenidas en una muestra.

Si X es una variable aleatoria con distribución de probabilidades o fdp ( )f x ,

caracterizada por el parámetro desconocido y si 1 2, , , nX X X es una muestra aleatoria

de tamaño n , entonces ( )1 2, , , nh X X X = es un estimador del parámetro .

Ejemplos: la media muestral, la proporción muestral y la varianza muestral.

Cómo los valores de un estadístico, varían de una muestra aleatoria a otra, se lo puede

considerar como una variable aleatoria con su correspondiente distribución de

probabilidades. La distribución de probabilidades de un estadístico se conoce como

distribuciones de muestreo.

Estimación puntual: Es el valor numérico que toma un estimador. Se calcula con los

datos de la muestra, del cual se espera que estime un parámetro poblacional.


Ejemplos:

Parámetro Poblacional Estimador Estimación

Media 1ˆ

n

i

i

X

Xn

== =

1

n

i

i

x

xn

==

Varianza 2

2 2 2

1

1ˆ ( )

1

n

i

i

S X Xn

=

= = −− ( )

22

1

1

1

n

i

i

s x xn =

= −−

Proporción p ˆX númeroéxitos

pn númeropruebas

= = ˆx

pn

=

Parámetros poblacionales, estimadores y estimaciones

Puede haber varios estimadores puntuales diferentes para un mismo parámetro. Por

ejemplo, si deseamos estimar la media poblacional, podríamos considerar la media

muestral, la mediana de la muestra, o quizás el promedio de las observaciones extremas

como estimadores puntuales.

Teniendo en cuenta esto:

➢ ¿Qué características queremos que posea un buen estimador?

➢ ¿Cómo decimos que un estimador es mejor que otro?

Propiedades de los estimadores

Nuestro objetivo ahora será dar algunas propiedades deseables de los estimadores

puntuales, con el fin de poder conocer la bondad de los mismos, pues cuantas más

propiedades verifiquen los estimadores puntuales mejores serán.


Propiedad de insesgadura:

Si tenemos un gran número de muestras de tamaño n y obtenemos el valor del estimador

en cada una de ellas, sería deseable que la media de todas estas estimaciones

coincidiera con el valor medio de la población . Se dice que un estimador es insesgado

si su esperanza matemática coincide con el valor del parámetro a estimar.

Formablemente: Un estimador es un estimador insesgado del parámetro

desconocido si ( )E = . Es decir, la media de su distribución muestral es el

parámetro.

Ejemplo:

La media muestral X y la varianza muestral 2S son estimadores insesgados de la media

poblacional y la varianza poblacional 2 , respectivamente.

Dem/

Si 1 2 3, , , , nX X X X son v. a. independientes idénticamente distribuidas (iid) con

esperanza y varianza finita, ( )iE X = y ( ) 2

iV X = para todo 1,2, ,i n= .

Veamos en primer lugar que 1

ni

i

XX

n=

= es un estimador insesgado de , es decir la

media poblacional.

( ) ( )1 1

1 1n ni

i

i i

XE X E E X

n n n= =

= = =

n =

Veamos ahora que ( )

2

2

1 1

ni

i

X XS

n=

−=

− es un estimador insesgado de 2 , es decir de la

varianza poblacional.


( )( )

( ) ( )2

2 22 2

1 1 1

2 22 2

1 1 1 1 1

22 2

1 1

1 12

1 1 1

1 12 2

1 1

1 12

1 1

n n ni

i i i

i i i

n n n n n

i i i i

i i i i i

n X

n

i i

i i

X XE S E E X X E X X X X

n n n

E X X X X E X X X nXn n

E X nX X nX E Xn n

= = =

= = = = =

= =

− = = − = − + = − − −

= + − + = − + = − −

= − + =

− −

( ) ( ) ( ) ( ) ( )

2 2 22

1

22 22 2 2 2 2

1 1 1

2

12

1

1 1 1

1 1 1

1

1

n n

i

i

n n n

i i

i i i

nX nX E X nXn

E X E nX E X nE X nn n n n

nn

=

= = =

− + = − =

−

= − = − = + − + = − − −

=−

2 2n n + − n−2

n

( )2 21 1

1 1n

n n

= − = − −

( )2 1n − 2=

Cálculos auxiliares:

( ) ( ) ( ) ( ) ( )

2

22 2 2 2 2 2

i i i i iE X E X V X E X E X

− = = = + = +

( ) ( ) ( ) ( )2 222 2

2E X E X V X E Xn n

− = = = +

Observación: si hubiésemos dividido por n en lugar de ( )1n − al definir 2S la propiedad

anterior no era válida.

Propiedad de eficiencia:

Se dice que los estimadores son eficientes cuando generan una distribución muestral con

el mínimo error estándar, es decir, entre dos estimadores insesgados de un parámetro

dado es más eficiente el de menor varianza.

Formalmente: Un estimador insesgado 1 es más eficiente que otro 2 Si son

insesgados de y la varianza de 1 es menor que la varianza de

2 .


Estimador consistente:

Un estimador se dice consistente cuando su valor tiende hacia el verdadero valor del

parámetro a medida que aumenta el tamaño de la muestra. Es decir, la probabilidad de

que la estimación sea el verdadero valor del parámetro tiende a 1.

Propiedad de suficiencia:

Se dice de un estimador que es suficiente cuando es capaz de extraer de los datos toda

la información importante sobre el parámetro.

Un estimador es suficiente si utiliza toda la información de la muestra.

La media muestral es un estimador suficiente de .

El modo no es un estimador suficiente de .

Error de Muestreo

Es el error que se comete debido al hecho de dar conclusiones sobre cierta realidad, a

partir de la observación de sólo una parte de ella, es decir, es la diferencia entre el

parámetro de la población y el estadístico de la muestra utilizado para estimar el

parámetro.

Distribuciones de Muestreo.

Las muestras aleatorias obtenidas de una población son, por naturaleza propia,

impredecibles. No se esperaría que dos muestras aleatorias del mismo tamaño y tomadas

de la misma población tengan, por ejemplo, la misma media muestral o que sean

completamente parecidas. Por lo tanto es de esperar que cualquier estadístico cambie su

valor de una muestra a otra, por ello, se quiere estudiar la distribución de todos los valores

posibles de un estadístico.

Tales distribuciones serán muy importantes en el estudio de la estadística inferencial,

porque las inferencias sobre las poblaciones se harán usando estadísticos muestrales.

Cómo los valores de un estadístico, varían de una muestra aleatoria a otra, se lo puede

considerar como una variable aleatoria con su correspondiente distribución de

probabilidades. La distribución de probabilidades de un estadístico se denomina

distribución muestral.

Distribución muestral. El concepto de distribución muestral se refiere al comportamiento

de un estadístico. Los estadísticos son variables aleatorias. Como tales, tienen su propia

función de probabilidad. Podemos hacer explícita su forma o su valor esperado y su

varianza.


Resumiendo:

Dada una población y el experimento aleatorio que consistente en seleccionar una

muestra de tamaño n de dicha población. Sea la variable aleatoria ( )1 2, , , nx x x

(estadístico muestral) como una aplicación que asigna a cada muestra, 1 2,X , , nX X , un

resumen estadístico determinado, ( )1 2, , , nh X X X . Esta nueva variable aleatoria tiene

una distribución de probabilidad denominada distribución muestral de .

• Su comportamiento dependerá del que tenga la muestra de la v.a. X en la población y

del tamaño de las muestras.

•A veces nos resultará útil conocer su esperanza matemática, su varianza y forma.

Empíricamente: Para hallar empíricamente la distribución muestral de un estadístico es

necesario seleccionar todas las muestras de dicha población y a partir de dicha

información construir la distribución de frecuencia relativa de los valores del estadístico, la

cual es considerada como su distribución muestral.

Distribución de muestreo de la media x

Si 1 2 3, , , , nX X X X son v.a. independientes idénticamente distribuidas (iid) con

esperanza y varianza finita, ( )iE X = y ( ) 2

iV X = para todo 1,2, ,i n= .

Sea 1

ni

i

xX

n=

= , entonces ( )E X = , ( )2

V Xn

= y

Xn

= .

( ) ( )1 1

1 1n ni

i

i i

XE X E E X

n n n= =

= = =

n =

( ) ( )2 21 1

1 1n ni

i

i i

XV X V V X

n n n= =

= = =

n

22

n

=


Ejemplo: Se toman muestras de tamaño 2 de una población consistente de cinco valores,

2, 4, 6, 8 y 10 para simular una población "grande" de manera que el muestreo pueda

realizarse un gran número de veces, supondremos que éste se hace con sustitución, es

decir, el número elegido se reemplaza antes de seleccionar el siguiente, además, se

seleccionan muestras ordenadas. En una muestra ordenada, el orden en que se

seleccionan las observaciones es importante, por tanto, la muestra ordenada (2,4) es

distinta de la muestra ordenada (4,2).

En la muestra (4,2), se seleccionó primero 4 y después 2.

La media poblacional es igual a 6 y la varianza poblacional es igual a 8.

La siguiente tabla contiene una lista de todas las muestras ordenadas de tamaño 2 que es posible seleccionar con sustitución y también contiene las medias muestrales y los correspondientes errores muestrales.

Se puede observar que la suma de los errores muestrales es cero

X toma los valores 2;3;4;5;6;7;8;9;10X

R = y la distribución de probabilidades está

dada por:


Para esta distribución podemos calcular su esperanza y varianza

( )1 2 3 1

2 3 4 10 625 25 25 25

E X = + + + =

( )22 2 2 21 2 3 1

2 3 4 10 4025 25 25 25

E X = + + + + =

( ) ( ) ( )22 2

40 36 4V X E X E X = − = − =

Por lo tanto se verifica que:

( )E X =

( )2

V Xn

=

Distribuciones muestrales de poblaciones con distribución conocida.

Se ha visto que para hallar la distribución muestral de un estadístico es necesario

seleccionar todas las muestras de dicha población y a partir de dicha información construir

la distribución de frecuencia relativa de los valores del estadístico. Otra manera de hallar

la distribución muestral de un estadístico es basándose en el hecho de que como un

estadístico es función de variables aleatorias cuya distribución es conocida, excepto

quizás por sus parámetros, entonces podemos hallar su distribución de probabilidad.

Distribución muestral de la media x

En esta sección vamos a determinar la distribución muestral de la media solo en el caso

en que la población sea normal, tomando en consideración los casos en que la varianza

es conocida y la varianza es desconocida.


Distribución muestral de la media para una población normal con varianza 2 conocida.

Resultado: Al estudiar la distribución normal se consideraron algunas propiedades que posee dicha distribución, una de ellas era referente a la distribución de una combinación

lineal de variables aleatorias normales. Así pues, sabemos que si 1 2 3, , , , nX X X X son

v.a. independientes distribuidas normalmente ( )2,i i iX N 1,...,i n = y si ,...,i na a

son números reales, entonces la variable aleatoria:

1

n

i i

i

X a X=

=

Tiene una distribución normal 2 2

1 1

,n n

i i i i i

i i

X N a a = =

Este resultado nos será de utilidad para obtener la distribución de la media muestral,

Teorema: Si 1 2 3, , , , nX X X X es una muestra aleatoria extraída de una población que se

distribuye normalmente ( )2,X N entonces la media muestral se distribuye

normalmente con ( )E X = y ( )2

V Xn

= , es decir

2

,X Nn

.

Sea 1

ni

i

XX

n=

= ,

( ) ( )1 1

1 1n ni

i

i i

XE X E E X

n n n= =

= = =

n =

( ) ( )2 21 1

1 1n ni

i

i i

XV X V V X

n n n= =

= = =

n

22

n

=

Cómo la población se distribuye normalmente con varianza 2 conocida entonces por el

resultado anterior para cualquier tamaño de la muestra 2

,X Nn

.


Distribución muestral de la media para una población normal con varianza 2

desconocida.

Hasta ahora estábamos admitiendo que se conoce la varianza de la población de la que

se extrae la muestra, pero esta no sería la situación general, sino que la mayoría de las

veces no conocemos la varianza de la población, entonces cómo se dispone de una

muestra aleatoria de tamaño n , podemos, calcular la varianza muestral 2S para estimar la

varianza poblacional 2 desconocida.

Cuando la varianza poblacional 2 es desconocida la distribución del estadístico X

Sn

−

depende del tamaño de la muestra:

a) El tamaño de la muestra es grande 30n .

Cuando el tamaño de la muestra es grande, es decir 30n , la distribución del estadístico

X

Sn

− sigue siendo aproximadamente ( )0,1N

b) El tamaño de la muestra es pequeño 30n .

Antes de analizar este caso estudiemos la distribución de la varianza muestral:

Distribución de la varianza muestral

Ya vimos que el estadístico 2S es un estimador insesgado de la varianza 2 de una

población normal cuando se desconoce 2 .

Si 2S es la varianza de una muestra aleatoria de tamaño n tomada de una población

normal que tiene una varianza 2 , una función ( ) 2

2

1n S

− de dicho estadístico, el cual

sigue siendo un estadístico, sigue una distribución tiene una distribución ji-cuadrado con

1n− grados de libertad.

( ) 2

2 2

12

1n

n S

−

−=


Distribución Ji-Cuadrado

Sean 1 2, , , nX X X variables aleatorias distribuidas normalmente e independientemente

con media 0 = y varianza 2 1 = . Entonces la variable aleatoria 2 2 2 2

1 2 nX X X = + + + ,

tiene una distribución Ji-Cuadrado con n grados de libertad, cuya fdp está definida por:

( )

12 2

2

10

22

0 0

n x

nx e x

nf x

x

− −

=

Donde es la función Gamma.

En matemáticas, la función gamma denotada por ( )z , extiende el concepto de factorial

a los números complejos. Se define como:

( ) 1

0

z xz x e dx

− − =

Puede demostrarse que:

1) La integral de ( )z es finita.

2) ( ) ( ) ( )1 1z z z = − −

3) En particular, si z es un entero positivo, ( ) !z z =

4) ( )1 1 = y 1

2

=

La siguiente figura muestra la gráfica de la función 2 para distintos grados de libertad

notados por k .


Grados de libertad: es el nombre dado al número de observaciones linealmente

independientes que ocurren en una suma de cuadrados.

Observación:

✓ Si los grados de libertad n→ la forma límite de 2 es la distribución normal.

✓ La media y la varianza de la distribución ji-cuadrado son n = y 2 2n = .

✓ Los puntos porcentuales de la distribución se dan en la tabla correspondiente

( )( ) ( )( )

2

2,

2 2

,n

n

n nP f x dx

= =

Por ejemplo

( )( ) ( )2 2 2

10 100,05;1018,31 0,05P P = =

Esto significa que el punto del 5% de la distribución con 10 grados de libertad es 18,31.

( )

( )2

2

2

1

1

n

n S

−

−= =

( )

( )

2

1

1

n

i

i

X X

n

=

−

−

( ) ( )22

2 21 1

n ni i

i i

X X X X

= =

− − = =


b) El tamaño de la muestra es pequeño 30n .

Si el tamaño de la muestra es pequeño, 30n , los valores de la varianza muestral 2S

varían considerablemente de muestra en muestra, pues 2S disminuye a medida que n

aumenta, y la distribución del estadístico ya no sería una distribución normal. Por lo tanto,

cuando la varianza poblacional 2 es desconocida la distribución del estadístico X

Sn

−

se ajusta a una distribución t de Student, con 1n− grados de libertad.

1n

XT t

Sn

−

−=

Distribución T de Student

Si Z es una variable aleatoria con distribución normal ( )0,1N , V una variable aleatoria

con distribución Ji-Cuadrado con n grados de libertad y además Z y V son

independientes, entonces la variable aleatoria:

n

ZT t

V

n

=

Tiene la siguiente fdp:

( )

( )

( )12 2

1

2 1

12

n

n

f x xn

n x

n

+

+ = −

+

La distribución de T se llama ahora la distribución t de Student. El parámetro v

representa el número de grados de libertad. La distribución depende de v , pero no de

o , lo cual es muy importante en la práctica.

Los puntos porcentuales de la distribución t están dados por la tabla correspondiente

( ) ( ),

,

v

v

t

P T t f x dx

= =

La siguiente figura muestra la gráfica de la función t de Student para distintos grados de

libertad notados por k


.

Por ejemplo

( )( ) ( )0.05,101,812 0,05P T t P T = =

0.95,10 0.05,10 1.813t t= − = −

Recordemos que si Z es una variable aleatoria con distribución normal ( )0,1N , V una

variable aleatoria con distribución Ji-Cuadrado con n grados de libertad y además Z y V

son independientes, entonces la variable aleatoria:

n

ZT t

V

n

=

De acuerdo a esta definición:

( )

( )

2

2

1

1

XX

n

n S

n

−−

= −

−

1n n −

1n − S

1n

Xt

Sn

−

−=


DISTRIBUCION DE LA PROPORCIÓN MUESTRAL p

Consideremos una v.a ( ),X B n p donde p es la proporción de “éxito” en la población.

Para tamaños grandes de n, n>30, la distribución Binomial se aproxima a una distribución

normal.

( ), (1 )X N np np p −

Definamos el estadístico X

pn

= , es el estimador puntual de la proporción poblacional.

La distribución de muestreo de p es aproximadamente normal con esperanza p y

varianza ( )1p p

n

− con p no cerca de 0 y 1.

Este resultado se obtiene de la aplicación directa del TLC y el Teorema de Bernouli

Generalizado.

La distribución F de Fisher

Si 2

1 y 2

2 son v.a. independientes que tienen distribución ji-cuadrado, con 1n y 2n

grados de libertad, respectivamente, la variable aleatoria definida por:

2

1

1

2

2

2

nF

n

=

Tiene una distribución F con 1n y 2n grados de libertad.

unidad n° vii · es decir, la media de su distribución muestral es el parámetro. ejemplo: la...

Documents