fundamentos para la inferencia...4 distribución muestral de la varianza muestral • si la...

24
Estadísca 2017 - Prof. Tamara Burdisso Fundamentos para la inferencia Unidad 3 – Parte II 1

Upload: others

Post on 13-Jan-2020

33 views

Category:

Documents


6 download

TRANSCRIPT

Page 1: Fundamentos para la inferencia...4 Distribución muestral de la varianza muestral • Si la distribución poblacional subyacente es normal puede probarse que la variable aleatoria

Estadísca 2017 - Prof. Tamara Burdisso

Fundamentos para la inferencia

Unidad 3 – Parte II 1

Page 2: Fundamentos para la inferencia...4 Distribución muestral de la varianza muestral • Si la distribución poblacional subyacente es normal puede probarse que la variable aleatoria

2

Distribución muestral de la varianza muestral

• Hasta aquí nos ocupamos de hacer inferencia sobre la media y/o la proporción de una población. Ahora nos enfocamos en la varianza poblacional.

• Supongamos que extraemos una muestra de tamaño n de una población con media y varianza . Sean la muestra. La varianza poblacional es la esperanza de

• Claramente es desconocida, pero ya sabemos como estimarla. Y además sabemos como obtener una estimación de

• se denomina varianza muestral y el desvío típico ó desviación estándar muestral Unidad 3 – Parte II

X2

X nXXX ,....,, 21

22

XX XE

X

2

X

n

i

iX XXn

s1

22

1

1

2

XsXs

Unidad 3 – Parte IIEstadísca 2017 - Prof. Tamara Burdisso

2

Page 3: Fundamentos para la inferencia...4 Distribución muestral de la varianza muestral • Si la distribución poblacional subyacente es normal puede probarse que la variable aleatoria

Distribución muestral de la varianza muestral

• Por qué en lugar de ?

• Podemos probar que la esperanza de la varianza muestral, i.e. la media de la distribución muestral de la varianza muestral, converge a la varianza poblacional. Matemáticamente

• Notar que sólo se afirma que la media de la varianza muestral converge a la varianza poblacional. Pero nada se dijo sobre la forma de la distribución muestral de la varianza muestral.

• Para poder caracterizar la distribución muestral de la varianza muestral se debe saber más acerca de la distribución poblacional .

Unidad 3 – Parte II

1n n

nXXX ,....,, 21

22

XXsE

Unidad 3 – Parte IIEstadísca 2017 - Prof. Tamara Burdisso

3

Page 4: Fundamentos para la inferencia...4 Distribución muestral de la varianza muestral • Si la distribución poblacional subyacente es normal puede probarse que la variable aleatoria

4

Distribución muestral de la varianza muestral

• Si la distribución poblacional subyacente es normal puede probarse que la variable aleatoria

• sigue una distribución (ji o chi cuadrado) con grados de libertad.

• Notar que la distribución sólo está definida para valores positivos, lo cual resulta adecuado para la varianza muestral, ya que no puede ser negativa.

Unidad 3 – Parte II

2

2

12

1

2

2

2)1(

n

i X

i

X

n

i

i

X

X XXXX

sn

2

1n

Unidad 3 – Parte IIEstadísca 2017 - Prof. Tamara Burdisso

4

Page 5: Fundamentos para la inferencia...4 Distribución muestral de la varianza muestral • Si la distribución poblacional subyacente es normal puede probarse que la variable aleatoria

5

Distribución muestral de la varianza muestral

• La familia de está caracterizada por un único parámetro: los grados de libertad a los que llamaremos y se lo anota como

• La media y la varianza de la son

• En nuestro caso la variable aleatoria sigue una distribución

• Esto quiere decir que

Unidad 3 – Parte II

2

kVarkE kk 2y 22

k2

k

2

k

2

2)1(

X

Xsn

2

1n

11

1)1( 2

22

2

nsE

nn

snE X

XX

X

22

XXsE

Unidad 3 – Parte IIEstadísca 2017 - Prof. Tamara Burdisso

5

Page 6: Fundamentos para la inferencia...4 Distribución muestral de la varianza muestral • Si la distribución poblacional subyacente es normal puede probarse que la variable aleatoria

6

Distribución muestral de la varianza muestral

• Para hallar la varianza de usamos el hecho de que

• Ejemplos de

Unidad 3 – Parte II

2

Xs

12

112

)1( 2

4

2

2

2

nsVar

nn

snVar X

XX

X

12 4

2

nsVar X

X

2

k

Unidad 3 – Parte IIEstadísca 2017 - Prof. Tamara Burdisso

6

Page 7: Fundamentos para la inferencia...4 Distribución muestral de la varianza muestral • Si la distribución poblacional subyacente es normal puede probarse que la variable aleatoria

7

Funciones de densidad de la distribución chi cuadrado

Unidad 3 – Parte IIUnidad 3 – Parte IIEstadísca 2017 - Prof. Tamara Burdisso

7

Page 8: Fundamentos para la inferencia...4 Distribución muestral de la varianza muestral • Si la distribución poblacional subyacente es normal puede probarse que la variable aleatoria

8

Condiciones para el buen funcionamiento del TCL

Unidad 3 – Parte IUnidad 3 – Parte IIEstadísca 2017 - Prof. Tamara Burdisso

8

Page 9: Fundamentos para la inferencia...4 Distribución muestral de la varianza muestral • Si la distribución poblacional subyacente es normal puede probarse que la variable aleatoria

Por lo tanto, la distribución muestral de la varianza muestral

• Sea la varianza muestral de una muestra aleatoria de n observaciones i.i.d. extraídas de una población con media y varianza . Entonces se tiene que:

i. La distribución muestral de tiene media , i.e

ii. La varianza de la distribución muestral de depende de la distribución de la población. Si la distribución poblacional es normalentonces

iii. Si las v.as. de la distribución subyacentes son normales i.i.d., entonces

Unidad 3 – Parte II

2

Xs

X2

X

2

12

2

unasegún distribuye se)1(

n

X

Xsn

22

XXsE 2

X2

Xs

2

Xs

12 4

2

nsVar X

X

Unidad 3 – Parte IIEstadísca 2017 - Prof. Tamara Burdisso

9

Page 10: Fundamentos para la inferencia...4 Distribución muestral de la varianza muestral • Si la distribución poblacional subyacente es normal puede probarse que la variable aleatoria

10

Aplicación para la varianza muestral

• Se quiere someter a todos los empleados de cierta institución a una evaluación de 100 preguntas de elección múltiple. Inicialmente en un estudio piloto se someten a este test a 20 empleados elegidos al azar. Supongamos que, para la población completa de todos los empleados, la distribución del número de respuestas correctas sigue una distribución normal con varianza 250.

1. ¿Cuál es la probabilidad de que la varianza muestral sea menor que 100?

2. ¿Cuál es la probabilidad de que el desvío típico muestral sea mayor a que 21?

Unidad 3 – Parte IIUnidad 3 – Parte IIEstadísca 2017 - Prof. Tamara Burdisso

10

Page 11: Fundamentos para la inferencia...4 Distribución muestral de la varianza muestral • Si la distribución poblacional subyacente es normal puede probarse que la variable aleatoria

Estadísca 2017 - Prof. Tamara BurdissoUnidad 3 – Parte II 11

Propiedades de los estimadores puntuales

• Parámetro: es una medida numérica descriptiva de una población. Su valor es casi siempre desconocido

• Estadístico/estimador: un estadístico es cualquier función de una muestra de datos aleatoria proveniente de una población.

• Estimación: una estimación es el valor numérico del estimador cuando el mismo es evaluado utilizando los datos de una muestra específica.

• Un estimador es una variable aleatoria, ya que hereda la aleatoriedad de la muestra aleatoria, mientras que una estimación es un número no aleatorio.

Page 12: Fundamentos para la inferencia...4 Distribución muestral de la varianza muestral • Si la distribución poblacional subyacente es normal puede probarse que la variable aleatoria

Estadísca 2017 - Prof. Tamara BurdissoUnidad 3 – Parte II 12

Propiedades de los estimadores puntuales

• Un estimador puntual de un parámetro poblacional es una función de la muestra que genera un único valor llamado estimación puntual.

• Por ejemplo, la media muestral es un estimador puntual de la media poblacional , y el valor que toma para un conjunto específico de datos se llama estimación puntual

• ¿Cómo hacemos para saber cual es el mejor estimador puntual de un parámetro poblacional?

• Existe un conjunto de criterios con los que se puede evaluar a un estimador.

• Tres son las propiedades deseables que debería poseer un estimador: consistencia, ausencia de sesgo e eficiencia.

X

X

x

Page 13: Fundamentos para la inferencia...4 Distribución muestral de la varianza muestral • Si la distribución poblacional subyacente es normal puede probarse que la variable aleatoria

Estadísca 2017 - Prof. Tamara BurdissoUnidad 3 – Parte II 13

Insesgamiento

• Estimador insesgado: Un estimador puntual es un estimador insesgado de un parámetro poblacional si el valor esperado del estimador es igual al parámetro que se desea estimar

• Notar que lo que se está afirmando es que en promedio el estimador estima correctamente al parámetro poblacional, y no que un determinado valor de tenga que ser exactamente el valor correcto de

• El valor esperado de debería ser la media de los valores de para todas las muestras posibles que se puedan obtener.

ˆE

Page 14: Fundamentos para la inferencia...4 Distribución muestral de la varianza muestral • Si la distribución poblacional subyacente es normal puede probarse que la variable aleatoria

Estadísca 2017 - Prof. Tamara BurdissoUnidad 3 – Parte II 14

Insesgamiento

• La media muestral es un estimador insesgado de la media poblacional:

• La proporción muestral es un estimador insesgado de la proporción poblacional:

• La varianza muestral es un estimador insesgado de la varianza poblacional:

• Un estimador que no es insesgado es sesgado.

• Sesgo: Sea un estimador de . El sesgo de es la diferencia entre su valor esperado y ; i.e.

• Por lo tango el sesgo de un estimador insesgado es cero.

XE

ppE ˆ

22 SE

ˆˆ Esesgo

Page 15: Fundamentos para la inferencia...4 Distribución muestral de la varianza muestral • Si la distribución poblacional subyacente es normal puede probarse que la variable aleatoria

Estadísca 2015 - Prof. Tamara BurdissoUnidad 3 – Parte II 15

Insesgamiento

Unidad 3 – Parte IIEstadísca 2017 - Prof. Tamara Burdisso

15

Page 16: Fundamentos para la inferencia...4 Distribución muestral de la varianza muestral • Si la distribución poblacional subyacente es normal puede probarse que la variable aleatoria

Estadísca 2017 - Prof. Tamara BurdissoUnidad 3 – Parte II 16

Eficiencia

• Es deseable que un estimador sea insesgado, pero puede ocurrir que se disponga de más de un estimador insesgado para un mismo parámetro (p.ej. la media y la mediana bajo distribución normal, ambos son estimadores inesgados de ).

• ¿Cómo elijo en este tipo de situaciones? Lo lógico sería quedarse con aquel estimador que este más concentrado alrededor del parámetro poblacional que se desea estimar.

• Surge entonces la eficiencia de un estimador de la mano de la varianza como medida de concentración

Page 17: Fundamentos para la inferencia...4 Distribución muestral de la varianza muestral • Si la distribución poblacional subyacente es normal puede probarse que la variable aleatoria

Estadísca 2017 - Prof. Tamara BurdissoUnidad 3 – Parte II 17

Eficiencia

• Si existen varios estimadores insesgados de un mismo parámetro, el estimador insesgado que tiene la mínima varianza, es el estimador más eficiente, o el estimador insesgado de mínima varianza.

• Sean dos estimadores insesgados de , basados en el mismo tamaño de muestra. Se dice entonces que

1. es más eficiente que si

2. La eficiencia relativa de con respecto a es el cociente entre sus varianzas; i.e.

2

1

21ˆyˆ

21ˆvarˆvar

1 2

2

1

ˆvar

ˆvar

relativaeficiencia

Page 18: Fundamentos para la inferencia...4 Distribución muestral de la varianza muestral • Si la distribución poblacional subyacente es normal puede probarse que la variable aleatoria

Estadísca 2017 - Prof. Tamara BurdissoUnidad 3 – Parte II 18

Ejemplo: estimadores insesgados rivales

• Sea una muestra aleatoria estraída de una población normal con media y varianza ¿Se debe utilizar la media muestral o la mediana muestral para estimar la media poblacional?

• Asumimos que la población sigue distribución normal y es de gran tamaño en comparación con el tamaño de la muestra, n.

• La media muestral es un estimador insesgado de , y la mediana muestral también es insesgada. Sus varianzas son:

nxxx ,...,, 21

n

X2

var

2

X

57,1var

var

X

medianarelativaeficiencia

nn

mediana22

57,12

var

Page 19: Fundamentos para la inferencia...4 Distribución muestral de la varianza muestral • Si la distribución poblacional subyacente es normal puede probarse que la variable aleatoria

Estadísca 2015 - Prof. Tamara BurdissoUnidad 3 – Parte II 19

Sesgo e eficiencia

Unidad 3 – Parte IIEstadísca 2017 - Prof. Tamara Burdisso

19

Page 20: Fundamentos para la inferencia...4 Distribución muestral de la varianza muestral • Si la distribución poblacional subyacente es normal puede probarse que la variable aleatoria

Estadísca 2017 - Prof. Tamara BurdissoUnidad 3 – Parte II 20

Propiedades de algunos estimadores

Parámetro

poblacional

Estimador

puntualPropiedades

Media µInsesgado, de máxima eficiencia

(suponiendo la existencia de

normalidad)

Media µ MedianaInsesgado (suponiendo la

existencia de normalidad) pero no

de máxima eficiencia

Proporción P Insesgado de máxima eficiencia

Varianza σ2Insesgado, de máxima eficiencia

(suponiendo la existencia de

normalidad)

p

X

2S

Page 21: Fundamentos para la inferencia...4 Distribución muestral de la varianza muestral • Si la distribución poblacional subyacente es normal puede probarse que la variable aleatoria

Estadísca 2015 - Prof. Tamara BurdissoUnidad 3 – Parte II 21

Diario Perfil – 18/10/2015

Unidad 3 – Parte IIEstadísca 2017 - Prof. Tamara Burdisso

21

Page 22: Fundamentos para la inferencia...4 Distribución muestral de la varianza muestral • Si la distribución poblacional subyacente es normal puede probarse que la variable aleatoria

Estadísca 2015 - Prof. Tamara BurdissoUnidad 3 – Parte II 22

Diario Perfil – 18/10/2015

• “…Esto es lo que refleja la muestra nacional de Ipsos-Mora y Araujo para PERFIL, que se realizó del jueves 8 al jueves 15 de octubre con encuestas presenciales de más de 1.200 casos en todo el país. Se insiste siempre con lo mismo para no dar lugar a equívocos: un estudio sociológico serio no adivina el futuro sino que plantea escenarios probables.”

• http://www.perfil.com/politica/Scioli-ganaria-en-primera-vuelta-vence-a-Macri-en-ballottage-pero-no-a-Massa-20151017-0163.html

Unidad 3 – Parte IIEstadísca 2017 - Prof. Tamara Burdisso

22

Page 23: Fundamentos para la inferencia...4 Distribución muestral de la varianza muestral • Si la distribución poblacional subyacente es normal puede probarse que la variable aleatoria

Estadísca 2015 - Prof. Tamara BurdissoUnidad 3 – Parte II 23

Elecciones Generales - 25 de Octubre 2015

Unidad 3 – Parte IIEstadísca 2017 - Prof. Tamara Burdisso

23

Page 24: Fundamentos para la inferencia...4 Distribución muestral de la varianza muestral • Si la distribución poblacional subyacente es normal puede probarse que la variable aleatoria

Estadísca 2015 - Prof. Tamara BurdissoUnidad 3 – Parte II 24

Ficha técnica de la encuesta – 18/10/2015

• Tipo de investigación: cuantitativa. Método de recolección de datos: encuestas presenciales con tablets en hogares. Tipo de encuesta: cuestionario estructurado compuesto por preguntas cerradas y semiabiertas, con una duración de 15 minutos aprox. Target: hombres y mujeres de 16 a 75 años de todos los niveles socioeconómicos residentes de todo el país. Fecha de campo: del 8 al 15 de octubre. Tamaño de la muestra: 1.209 casos. Método de muestreo: probabilístico hasta la selección del individuo, mediante un muestreo estratificado, multietápico por conglomerado en hogares, según cuotas de edad, sexo y NSE. Ponderación: se ponderó teniendo en cuenta género, peso poblacional por estrato, región y voto anterior. Error muestral: +- 2,81%. Nivel de confianza: 95%. Perfil de la muestra: 53% mujeres, 47% hombres; 8,6% NSE alto, 47,6% NSE medio y 43,8% NSE bajo; 23% de 16 a 25 años, 23% de 26 a 35, 19% de 36 a 45, 15% de 46 a 55 y 21% de 56 a 75 años.

Unidad 3 – Parte IIEstadísca 2017 - Prof. Tamara Burdisso

24