Muestreo y
Distribuciones Muestrales
Dr. Víctor Aguirre Torres, ITAM. Guión 8.
2
Muestreo
POBLACIONmuestra
Muestreo
InferenciaEstadística
Conteos rápidos, preferencias electorales, etc.
Dr. Víctor Aguirre Torres, ITAM. Guión 8.
3
Tipos de Muestreo
Muestreo No ProbabilísticoNo aplican las fórmulas estadísticas del cursoMuestreo Probabilístico.Aplican las fórmulas estadísticas del curso
Dr. Víctor Aguirre Torres, ITAM. Guión 8.
4
Muestreo No Probabilístico
No se conocen de antemano las probabilidades de que aparezcan cada uno de los elementos de la población en la muestra.Ejemplos: Muestreo por Conveniencia, Muestreo en Centros Comerciales, Muestreo por Cuotas, Encuestas Telefónicas no Solicitadas, etc.Adolece de sesgos en la selección de la muestra.
Dr. Víctor Aguirre Torres, ITAM. Guión 8.
5
Muestreo Probabilístico
Las unidades se seleccionan por un procedimiento probabilístico controlado.Las probabilidades de que aparezcan cada uno de los elementos de la población en la muestra se conocen de antemano.Evita sesgos en la selección de los elementos de la muestra.
Dr. Víctor Aguirre Torres, ITAM. Guión 8.
6
Tipos de Muestreo Probabilístico
Muestreo Aleatorio Simple (MAS)Muestreo Sistemático (MS) con Arranque AleatorioMuestreo Aleatorio Estratificado (MAE)Muestreo Polietápico o por Conglomerados.
Dr. Víctor Aguirre Torres, ITAM. Guión 8.
7
Muestreo Aleatorio Simple (MAS)
Existe un marco de muestreo: listado, mapa, tarjetero, etc.Todas la unidades tiene IGUAL.probabilidad de aparecer en la muestra.N = Tamaño de la población.n = Tamaño de la muestra.Total de muestras disrtintas: N
nC
Dr. Víctor Aguirre Torres, ITAM. Guión 8.
8
Muestreo Aleatorio Simple (MAS).
=ALEATORIO.ENTRE(1,$E$3)
Muestreo Aleatorio Simple.
Tamaño de la población N 400
Tamaño de la muestra n 15
Variable ordenElemento a encuestar
265 1 167
71 2 397
24 3 21310 4 85361 5 9365 6 112324 7 100375 8 31382 9 13469 10 8660 11 14957 12 38169 13 369399 14 28614 15 274
Los elementos se fijan copiando los valores de lacolumna variable.
Dr. Víctor Aguirre Torres, ITAM. Guión 8.
9
Muestreo Sistemático con Arranque Aleatorio (MS)
Existe un marco de muestreo: listado, mapa, tarjetero, etc.Todas la unidades tiene IGUAL probabilidad de aparecer en la muestra.Procedimiento:Calcular k=N/n.Elegir un arranque aleatorio entre 1 y k, digamos a.Elegir las unidades a, a+k, a+2k, ... Etc.
Dr. Víctor Aguirre Torres, ITAM. Guión 8.
10
Muestreo Sistemático (MS) con Arranque Aleatorio.
Muestreo Sistemático con Arranque Aleatorio
Tamaño de la población N 1000
Tamaño de la muestra n 40
Muestrear uno cada k 25Variable
Arranque aleatorio 23 19
ordenElemento a encuestar
1 192 443 694 945 1196 144
38 94439 96940 994
...
Dr. Víctor Aguirre Torres, ITAM. Guión 8.
11
¿Qué se observa o mide?
Variable cuantitativaX1 = edad de un árbolX2 = ingreso del hogarX3 = gasto del hogarVariable cualitativaX5 = partido políticoX6 = género
Dr. Víctor Aguirre Torres, ITAM. Guión 8.
12
Estimación Puntual. Variable cuantitativa X
Estimadores puntuales (muestra)
∑=
=n
1iix
n1 x
∑=
−=n
1j
2j
2X )xx(
1-n1s
∑=
=N
1jjX x
N1µ
∑=
−=N
1j
2Xj
2X )x(
N1 µσ
POBLACIONmuestra
Muestreo
InferenciaEstadística
Población, fijo Muestra, variable aleatoria
Dr. Víctor Aguirre Torres, ITAM. Guión 8.
13
Ejemplo.
Se obtuvo una muestra sistemática de 22 carrocerías de una línea de pintado.Se midieron espesores de las carrocerías en 3 planos y 7 posiciones.
3
2
1
Dr. Víctor Aguirre Torres, ITAM. Guión 8.
14
Datos Muestrales.obs ESP3.1 ESP3.2 ESP3.4 ESP1.2 ESP1.3 ESP2.2 ESP2.3
1 1 0.98 1 0.93 0.77 1.19 1.022 0.98 0.96 0.89 0.92 0.83 1.09 0.973 1.01 0.94 0.92 0.94 0.75 1.12 0.984 0.92 0.85 0.87 0.93 0.8 1.09 0.885 1.02 0.97 1.05 1.09 0.93 1.09 0.976 0.93 0.96 0.85 0.91 0.83 1.01 0.897 1.1 1.01 1.02 0.85 0.96 1.1 1.068 1.23 1.1 1.21 0.98 0.92 1.3 1.39 1.18 1.18 1.13 1.01 1 1.18 1.2110 1.18 1.1 1.12 0.93 1 1.13 0.9411 0.89 0.84 0.8 0.88 0.72 0.96 0.7512 1.06 0.93 0.81 0.91 0.81 0.94 0.8713 1.04 0.98 0.94 1.01 0.92 1.06 114 1.09 1.01 1.02 1.08 0.72 1.04 0.8915 1.08 1.05 1.14 0.91 0.89 1.06 116 1.02 1.09 1 0.89 0.87 1.05 0.8817 1 1.02 0.91 0.93 0.81 1.08 0.8518 0.93 0.98 0.84 0.83 0.7 0.98 0.8419 1.02 1.01 0.94 0.97 0.79 1.1 120 0.89 0.84 0.83 0.98 0.89 0.94 0.8321 1.09 1.05 0.96 1.1 0.96 1.26 122 0.87 0.96 0.81 0.91 0.81 1.02 0.84
Promedio 1.0241 0.9914 0.9573 0.9495 0.8491 1.0814 0.9532Var
muestral 0.0096 0.0073 0.0143 0.0053 0.0083 0.0087 0.0157Desviación Estándar 0.0980 0.0855 0.1195 0.0725 0.0909 0.0935 0.1255
Dr. Víctor Aguirre Torres, ITAM. Guión 8.
15
Variable cualitativa X
X solo toma valores 0 o 1.Parámetro poblacional de interés:
población la en unos de Proporción
xN1p
N
1jjX
=
= ∑=
Dr. Víctor Aguirre Torres, ITAM. Guión 8.
16
Estimación Puntual
Parámetro Estimador
∑=
=n
1iiX x
n1 p∑
=
=N
1jjX x
N1p
Población, fijo Muestra, variable aleatoria
POBLACIONmuestra
Muestreo
InferenciaEstadística
Dr. Víctor Aguirre Torres, ITAM. Guión 8.
17
Ejemplo.
Se obtuvo una muestra sistemática de 1114 electores que fueron a votar en una elección. Datos Muestrales:
Votos a favor p barraPartido 1 473 0.4246Partido 2 418 0.3752Partido 3 167 0.1499Partido 4 56 0.0503
Total 1114
Dr. Víctor Aguirre Torres, ITAM. Guión 8.
18
Variación Muestral
Tanto como son variables aleatorias.Ambas pueden tomar una cantidad prácticamente infinita de valores distintos.Se puede modelar su variación por medio de la distribución de probabilidades Normal.
x p
Dr. Víctor Aguirre Torres, ITAM. Guión 8.
19
Demo de la Universidad de Rice
http://www.ruf.rice.edu/~lane/stat_sim/sampling_dist/Muestra el histograma del promedio muestral, en el caso hipotético que se pudiesen obtener una gran cantidad de muestras de la misma población.Si n=25 (tamaño de la muestra) el histograma es aproximadamente normal.
Dr. Víctor Aguirre Torres, ITAM. Guión 8.
20
Distribución Muestral de bajo MAS y MS.
Se puede mostrar que
Teorema del Límite Central. Para n>30, tiene un distribución de probabilidades aproximadamente normal con media y desviación estándar
x
2XX
XX ))x(E σσσµ ==== 2
XE(s ; n
)xVar( ;
nXσ
x
Xµ
Dr. Víctor Aguirre Torres, ITAM. Guión 8.
21
0.82 0.84 0.86 0.88 0.90 0.92 0.94 0.96 0.98f(x)
0
5
10
15
20
25
Distribución Muestral de bajo MAS y MS. Posición 1.2.
x
0192.009.009.
9.0)x(E9.
22n
)2.1(X
)2.1(X
2.1
)2.1(X
==
==
==
22
(supuesto)
(supuesto) 0
σ
σ
µ
Intervalo de Variación Muestral Máxima: 0.842-0.957
9972.0)3z3(P
)0192.0
9.0957.0z0192.0
9.0842.0(P)957.0x842.0(P 2.1
≈<<−=
−<<
−=<<
Valor observado
Dr. Víctor Aguirre Torres, ITAM. Guión 8.
22
Distribución Muestral de bajo MAS y MS.
Se puede mostrar que
Si np>5 y n(1-p)>5 entonces la distribución muestral de se pues aproximar con una distribución normal con parámetros
p
n
)p1(p)pVar( ; p)p(E 2pσ=−
==
n)p1(pp)p(E p
−=== σµ y
p
Dr. Víctor Aguirre Torres, ITAM. Guión 8.
23
0.29 0.31 0.32 0.34 0.35 0.36 0.38 0.39 0.41f(x)
0
5
10
15
20
25
30
Distribución Muestral de bajo MAS y MS.Partido 2.
p
0.014291
0.000204 ; 389.9
(supuesto) 0.35
σ)pVar(
1.724)p1(nnpp)p(E
1114n
2p
2
22
22
=
==−=
===
Intervalo de Variación Muestral Máxima: 0.3071-0.3928
Valor observado
9972.0)3z3(P
)01429.0
35.03928.0z01429.0
35.03071.0(P)3928.0p3071.0(P 2
≈<<−=
−<<
−=<<
Dr. Víctor Aguirre Torres, ITAM. Guión 8.
24
Problemas Recomendados Capítulo 7.
Promedio muestral: 26, 30.Proporción muestral: 37, 39.