teoría de la decisión estadística - aula virtual · pdf filegb alfredo a....

21
1 Teoría de la Decisión GB Alfredo A. Carneiro Campos UNEFA ZULIA Teoría de la decisión Estadística Conceptos básicos Unidad 7. Estimación de parámetros . Criterios para la estimación . Mínimos cuadrados. Regresión lineal simple . Ley de correlación . Intervalos de confianza . Distribuciones: t-student y chi cuadrado Unidad 8. Pruebas de hipótesis . Formulación general . Distribución de varianza conocida . Prueba para la bondad del ajuste . Validación de modelos

Upload: doanthuan

Post on 09-Feb-2018

218 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: Teoría de la decisión Estadística - Aula Virtual · PDF fileGB Alfredo A. Carneiro Campos Teoría de la Decisión UNEFA ZULIA 1 Teoría de la decisión Estadística Conceptos básicos

1 Teoría de la Decisión GB Alfredo A. Carneiro Campos UNEFA ZULIA

Teoría de la decisión

Estadística Conceptos básicos

Unidad 7. Estimación de parámetros

. Criterios para la estimación

. Mínimos cuadrados. Regresión lineal simple

. Ley de correlación

. Intervalos de confianza

. Distribuciones: t-student y chi cuadrado

Unidad 8. Pruebas de hipótesis

. Formulación general

. Distribución de varianza conocida

. Prueba para la bondad del ajuste

. Validación de modelos

Page 2: Teoría de la decisión Estadística - Aula Virtual · PDF fileGB Alfredo A. Carneiro Campos Teoría de la Decisión UNEFA ZULIA 1 Teoría de la decisión Estadística Conceptos básicos

2 Teoría de la Decisión GB Alfredo A. Carneiro Campos UNEFA ZULIA

Teoría de la decisión

Estadística Estimación de parámetros

Objeto: inferir los valores de estadísticos descriptivos de una población a partir de

una muestra.

Parámetro: atributo descriptivo de una población. Comúnmente; la media, la varianza y la

desviación típica.

Estadístico: atributo medido sobre la distribución muestral

Puntuales: medidas discretas de los estadísticos

por Intervalos: medidas continuas, se define un intervalo en el cual se estima

con cierta probabilidad que el parámetro en estudio se encuentra.

Comúnmente: intervalos de confianza

1)( ULP1-α = coeficiente de confianza y expresa la probabilidad que el valor del parámetro para la población esté dentro del intervalo especificado (L, U)

Page 3: Teoría de la decisión Estadística - Aula Virtual · PDF fileGB Alfredo A. Carneiro Campos Teoría de la Decisión UNEFA ZULIA 1 Teoría de la decisión Estadística Conceptos básicos

3 Teoría de la Decisión GB Alfredo A. Carneiro Campos UNEFA ZULIA

Teoría de la decisión

Estadística Estimación de parámetros

Ciertos criterios deben ser aplicados para considerar adecuado un estimador:

Ausencia de sesgo: el estimador será insesgado si su esperanza matemática

es igual al valor del parámetro.

Consistencia: será consistente si la esperanza del estimador tiende al valor del

parámetro y su varianza tiende a cero cuando el tamaño de la muestra tiende a

infinito

Eficiencia: un estimador de un parámetro será más eficiente que otro si se

cumple que su varianza con respecto al parámetro sea menor que la del

segundo

Suficiencia: un estimador será suficiente si resume toda la información

relevante de la muestra para estimarlo y no hay otro estimador que ofrezca

mejor o más información

Page 4: Teoría de la decisión Estadística - Aula Virtual · PDF fileGB Alfredo A. Carneiro Campos Teoría de la Decisión UNEFA ZULIA 1 Teoría de la decisión Estadística Conceptos básicos

4 Teoría de la Decisión GB Alfredo A. Carneiro Campos UNEFA ZULIA

Teoría de la decisión

Estadística Estimación de la media

Intervalo de confianza

Caso I: conocida la desviación estándar poblacional

1. Distribución normal en la muestra.

2. Escala z ¿cuál es la puntuación

correspondiente al nivel de confianza?

3. Trasladar a la escala x

3 2 3 2 Escala z

2,5% 2,5%

95% NzX

975,0

NzX

025,0

NzX

NzXP

975,0025,0 reposiciónmuestreopara

N

NN

NzX

reposiciónconmuestreoparaN

zX

p

p

c

c

sin1

XN

zxiii

N

Xxzii

Ni

ii

ii

X

)(

)(

)(

Si N => 30 y no se conoce µ, trabajar con la desviación muestral S, en reemplazo de σ

Page 5: Teoría de la decisión Estadística - Aula Virtual · PDF fileGB Alfredo A. Carneiro Campos Teoría de la Decisión UNEFA ZULIA 1 Teoría de la decisión Estadística Conceptos básicos

5 Teoría de la Decisión GB Alfredo A. Carneiro Campos UNEFA ZULIA

Teoría de la decisión

Estadística Estimación de la media

Intervalo de confianza

Tabla de valores zc para varios niveles de confianza

Nivel de confianza

99,73% 99,00% 98,00% 96,00% 95,45% 95,00% 90,00% 80,00% 68,27% 50,00%

Zc 3,00 2,58 2,33 2,05 2,00 1,96 1,65 1,28 1,00 0,57

Page 6: Teoría de la decisión Estadística - Aula Virtual · PDF fileGB Alfredo A. Carneiro Campos Teoría de la Decisión UNEFA ZULIA 1 Teoría de la decisión Estadística Conceptos básicos

6 Teoría de la Decisión GB Alfredo A. Carneiro Campos UNEFA ZULIA

Teoría de la decisión

Estadística Estimación de la media

Intervalo de confianza

Caso II: desconocida la desviación estándar poblacional

1. Técnica de estimación para muestras pequeñas (N < 30)

2. Usar la varianza muestral y la aproximación será con la distribución t de student

con 1 grado de libertad:

3. Análogamente al anterior a partir de

obtenemos

donde 1-α es el nivel de confianza

2S

N

S

X

N

StX n 1

111

N

StX

N

StXP nn

Page 7: Teoría de la decisión Estadística - Aula Virtual · PDF fileGB Alfredo A. Carneiro Campos Teoría de la Decisión UNEFA ZULIA 1 Teoría de la decisión Estadística Conceptos básicos

7 Teoría de la Decisión GB Alfredo A. Carneiro Campos UNEFA ZULIA

Teoría de la decisión

Estadística Estimación de parámetros

Valores críticos de t

Page 8: Teoría de la decisión Estadística - Aula Virtual · PDF fileGB Alfredo A. Carneiro Campos Teoría de la Decisión UNEFA ZULIA 1 Teoría de la decisión Estadística Conceptos básicos

8 Teoría de la Decisión GB Alfredo A. Carneiro Campos UNEFA ZULIA

Teoría de la decisión

Estadística Estimación de la media

Intervalo de confianza

Ejercicio 1.- De un total de 200 calificaciones de matemáticas se tomó una muestra aleatoria (sin

reemplazo) de tamaño 50. En esta muestra se observó una media de 75 y una desviación típica de 10.

(a)¿cuáles son los límites de confianza de 95% para la estimación de la media de las 200 calificaciones?

(b)¿con qué grado de confianza se puede decir que la media de las 200 calificaciones es de 75 ± 1?

1.- Se observa que el tamaño de la población no es muy grande con respecto a la muestra, y además el

muestreo es sin reposición, por tanto es necesario introducir la corrección poblacional

2.- El tamaño de la muestra es mayor a 30; por tanto podemos usar la desviación típica muestral (S) como

un buen estimador de la desviación típica poblacional (σ)

3.- Establecido el contexto, podemos trabajar bajo el esquema del caso I:

y del nivel de confianza del 95% se infiere zc = 1,96.

así;

:intervalo de confianza para µ (a)

868,01200

50200

1

p

p

N

NN

1

p

p

XXcN

NN

N

SdondezX

4,275868,050

1096,17596,1

XX

Page 9: Teoría de la decisión Estadística - Aula Virtual · PDF fileGB Alfredo A. Carneiro Campos Teoría de la Decisión UNEFA ZULIA 1 Teoría de la decisión Estadística Conceptos básicos

9 Teoría de la Decisión GB Alfredo A. Carneiro Campos UNEFA ZULIA

Teoría de la decisión

Estadística Estimación de la media

Intervalo de confianza

En la segunda cuestión se requiere establecer el grado de confianza dado unos límites; así:

Buscamos en la tabla de la distribución normal cual es el área que corresponde a zc = 0,81 y se obtiene

0,2910; el doble de esta área: 2*0,2910 será el nivel de confianza asociado a los límites 75±1, por tanto

58,2 %

Una conclusión interesante y estadísticamente significativa, es la observación que mientras menor la

desviación aspirada del parámetro con respecto a la estimación, menor será el intervalo de confianza;

asunto que ya trabajamos en clase, o, dicho de otra manera; menor la probabilidad que la estimación

represente al parámetro en un conjunto de muestras.

81,0123,123,175868,0 ccccXc zzzN

SzXzX

Page 10: Teoría de la decisión Estadística - Aula Virtual · PDF fileGB Alfredo A. Carneiro Campos Teoría de la Decisión UNEFA ZULIA 1 Teoría de la decisión Estadística Conceptos básicos

10 Teoría de la Decisión GB Alfredo A. Carneiro Campos UNEFA ZULIA

Teoría de la decisión

Estadística Estimación de la media

Intervalo de confianza

Ejercicio 2.- El administrador de un cadena de tiendas desea determinar la cantidad promedio que gastan

Las personas usando la tarjeta de crédito de la tienda. El registro de clientes tarjetahabientes muestra un

Total de 10.000 clientes; de ellos selecciona una muestra aleatoria de 25 clientes; resultando en un promedio

De gasto de Bs. 75,0 con una desviación típica de Bs. 20.

¿cuál será una estimación razonable para la media y la desviación típica de la población?

1.- Fijamos como aceptable un grado de confianza del 95%. Esto quiere decir que las colas de nuestra

distribución serán de tamaño 0,025; es decir (5/2) %. Eso es porque la distribución t es simétrica.

2.- El valor crítico de t (el equivalente a z en la dist. normal) lo hallamos en la tabla de la distribución t;

Intersectando en la columna de los α/2 correspondiente a 0,025 con la fila correspondiente a 24 24 grados

de libertad (N-1); y el resultado es tN-1 = 2,064.

3.- Así:

Estadísticamente significa que si se seleccionaran todas las posibles muestras de tamaño 25; el 95% de

Los intervalos desarrollados incluirían a la media poblacional en algún lugar dentro del intervalo.

95,026,83.74,66.

256,87525

20.064,2751

BsBsP

N

StX n

Page 11: Teoría de la decisión Estadística - Aula Virtual · PDF fileGB Alfredo A. Carneiro Campos Teoría de la Decisión UNEFA ZULIA 1 Teoría de la decisión Estadística Conceptos básicos

11 Teoría de la Decisión GB Alfredo A. Carneiro Campos UNEFA ZULIA

Teoría de la decisión

Estadística Estimación de la media

Intervalo de confianza

Ejercicio 4.- Una empresa tiene 5.000 árboles navideños maduros y listos para cortar. En forma aleatoria

se seleccionan 100 de estos árboles y se miden sus alturas; los resultados se expresan en la tabla. Si

cada árbol se vende a razón de Bs. 15 por cada 5 cmts. de altura; calcular el valor del inventario de

árboles con un margen de confianza,

(i) de 95%; (ii) de 99% y (iii) de 90%.

Tabla de alturas en la muestra

142,24 154,94 160,02 86,36 119,38 88,90 111,76 127,00 160,02 149,86

177,80 154,94 134,62 165,10 182,88 139,70 180,34 144,78 190,50 190,50

134,62 121,92 139,70 170,18 152,40 152,40 185,42 187,96 109,22 121,92

180,34 134,62 198,12 149,86 142,24 160,02 121,92 165,10 129,54 144,78

185,42 157,48 203,20 134,62 162,56 111,76 170,18 114,30 121,92 124,46

127,00 144,78 182,88 139,70 142,24 157,48 182,88 144,78 149,86 157,48

116,84 154,94 132,08 116,84 182,88 142,24 116,84 121,92 144,78 132,08

137,16 185,42 180,34 177,80 167,64 170,18 147,32 180,34 190,50 127,00

111,76 149,86 142,24 137,16 160,02 109,22 172,72 176,23 139,70 160,02

121,92 124,46 177,80 152,40 170,18 119,38 124,46 175,26 167,64 185,42

Page 12: Teoría de la decisión Estadística - Aula Virtual · PDF fileGB Alfredo A. Carneiro Campos Teoría de la Decisión UNEFA ZULIA 1 Teoría de la decisión Estadística Conceptos básicos

12 Teoría de la Decisión GB Alfredo A. Carneiro Campos UNEFA ZULIA

Teoría de la decisión

Estadística Estimación de la media

Intervalo de confianza

(1) Contexto del problema:

. ¿cómo será la distribución?. Siendo un fenómeno natural (al igual que las de las

personas) podemos suponer que las alturas de los árboles se distribuyen normalmente, y en

consecuencia la distribución de la muestra también lo será.

. Por otra parte el tamaño de la muestra la ubica dentro de la clasificación de

muestra grande, en consecuencia;

(a) no hará falta la corrección poblacional;

(b) podemos calcular la distribución utilizando las puntuaciones z (a pesar de la relación entre

el tamaño de la muestra y el de la población); y

(c) La media muestral ( ) y la desviación típica muestral (S) pueden ser utilizadas para el

cálculo de la estimación sin que ello signifique un error apreciable en la estimación del valor

del parámetro.

Page 13: Teoría de la decisión Estadística - Aula Virtual · PDF fileGB Alfredo A. Carneiro Campos Teoría de la Decisión UNEFA ZULIA 1 Teoría de la decisión Estadística Conceptos básicos

13 Teoría de la Decisión GB Alfredo A. Carneiro Campos UNEFA ZULIA

(i) Como el nivel de confianza es del 95% se define zc = 1,96 y el valor se calcula como:

(ii) para el nivel de confianza del 99% se define zc = 2,58 y el valor se calcula como:

(iii) para el nivel de confianza del 99% se define zc = 1,645 y el valor se calcula como:

Teoría de la decisión

Estadística Estimación de la media

Intervalo de confianza

Media muestral: 149,82

Desviación típica (S): 25,60

00,600.322.2.00,000.5*00,3.

.*.84,154)2(

00,000.172.2.00,000.5*00,3.

*.80,144)1(

84,15480,144%9502,582,149100

6,2596,182,14996,1

Bscmts

Bscmts

Bscmts

Bscmts

confianzadeN

SX

00,450.346.2.00,000.5*00,3.

.*.43,156)2(

00,150.148.2.00,000.5*00,3.

*.21,143)1(

43,15621,143%9961,682,149100

6,2558,282,14958,2

Bscmts

Bscmts

Bscmts

Bscmts

confianzadeN

SX

00,500.314.2.00,000.5*00,3.

.*.03,154)2(

00,150.184.2.00,000.5*00,3.

*.61,145)1(

03,15461,145%9021,482,149100

6,25645,182,149645,1

Bscmts

Bscmts

Bscmts

Bscmts

confianzadeN

SX

Page 14: Teoría de la decisión Estadística - Aula Virtual · PDF fileGB Alfredo A. Carneiro Campos Teoría de la Decisión UNEFA ZULIA 1 Teoría de la decisión Estadística Conceptos básicos

14 Teoría de la Decisión GB Alfredo A. Carneiro Campos UNEFA ZULIA

Teoría de la decisión

Estadística Estimación de la media

Intervalo de confianza

Ejercicio 5.- Para el ejercicio 4 ¿cuál sería el margen de confianza para un estimado

de la media poblacional de µ ± 2,5?

En la tabla se obtiene el valor del área correspondiente: 0,3023

Como la distribución es simétrica P=2*0,3023 = 60,26

Así el margen de confianza es del 60,26 %

85,05,295,25,25,282,14982,149 cccc zzN

Sz

N

Sz

Page 15: Teoría de la decisión Estadística - Aula Virtual · PDF fileGB Alfredo A. Carneiro Campos Teoría de la Decisión UNEFA ZULIA 1 Teoría de la decisión Estadística Conceptos básicos

15 Teoría de la Decisión GB Alfredo A. Carneiro Campos UNEFA ZULIA

Teoría de la decisión

Estadística Estimación de la media

Intervalo de confianza

Ejercicio 6.- Para el ejercicio 4 suponga una muestra de tamaño 25, según la tabla.

Calcule los mismos intervalos de confianza, 95, 99 y 90.

Contexto:

(1) Cae dentro de supuesto de muestras muy pequeñas

En relación a la población.

(2) Se utilizará la distribución t de student para calcular

El intervalo de confianza, utilizando distribución y media

muestral.

Tabla de alturas en la muestra

185,42 170,18 124,46 170,18 198,12

177,80 144,78 167,64 127,00 121,92

144,78 177,80 139,70 138,70 185,42

187,96 86,36 160,02 154,94 134,62

116,84 185,42 137,16 190,50 160,02

Media muestral: 155,09

Desviación típica (S): 27,48

Page 16: Teoría de la decisión Estadística - Aula Virtual · PDF fileGB Alfredo A. Carneiro Campos Teoría de la Decisión UNEFA ZULIA 1 Teoría de la decisión Estadística Conceptos básicos

16 Teoría de la Decisión GB Alfredo A. Carneiro Campos UNEFA ZULIA

Teoría de la decisión

Estadística Estimación de la media

Intervalo de confianza

(1) Con 95% => área de la cola: 0,025

95,000,150.496.2.00,550.156.2.

95,0000.15.

.*.41,166000.15

.

.*.77,143

32,1109,1555

48,2706,209,155

2506,2 11

BsBsP

cmts

Bscmts

cmts

BscmtsP

StXt nn

(2) Con 99% => área de la cola: 0,005

99,000,200.557.2.00,500.095.2.

99,0000.15.

.*.48,170000.15

.

.*.70,139

39,1509,1555

48,2780,209,155

2580,2 11

BsBsP

cmts

Bscmts

cmts

BscmtsP

StXt nn

(3) Con 90% => área de la cola: 0,05

9,000,350.467.2.00,350.185.2.

9,0000.15.

.*.49,164000.15

.

.*.69,145

40,909,1555

48,2771,109,155

2571,1 11

BsBsP

cmts

Bscmts

cmts

BscmtsP

StXt nn

Page 17: Teoría de la decisión Estadística - Aula Virtual · PDF fileGB Alfredo A. Carneiro Campos Teoría de la Decisión UNEFA ZULIA 1 Teoría de la decisión Estadística Conceptos básicos

17 Teoría de la Decisión GB Alfredo A. Carneiro Campos UNEFA ZULIA

Teoría de la decisión

Estadística Estimación de la desv. típ.

Intervalo de confianza

2

1

2

22

)(

N

i

i XXNs

a b

IC

valores críticos

papb

pbpa

NsNsNs

2

2

22

Chi cuadrado para varios grados de libertad

Grados de libertad (v) se define como el tamaño (N) de la

muestra menos la cantidad (k) de parámetros a estimar.

En el caso de este estadístico, como se debe estimar σ;

k = 1

Obsérvese que para v ≥ 30 la distribución adquiere

una conformación normal con la aproximación

22 122

1 pp z

Si consideramos:

Page 18: Teoría de la decisión Estadística - Aula Virtual · PDF fileGB Alfredo A. Carneiro Campos Teoría de la Decisión UNEFA ZULIA 1 Teoría de la decisión Estadística Conceptos básicos

18 Teoría de la Decisión GB Alfredo A. Carneiro Campos UNEFA ZULIA

Teoría de la decisión

Estadística Estimación de la desv. típ.

Intervalo de confianza

V = 5 V = 5

a

α = 0,05

1,112

95,0

8,122

975,0 61,12

1,0

α = 0,05, asumimos igual tamaño

a b

α2 = 0,025

α1 = 0,025

a

α = 0,1

61,12

1,0

a b

α1 = 0,1

α2 = 0,05

8,122

975,0 831,02

025,0

Page 19: Teoría de la decisión Estadística - Aula Virtual · PDF fileGB Alfredo A. Carneiro Campos Teoría de la Decisión UNEFA ZULIA 1 Teoría de la decisión Estadística Conceptos básicos

19 Teoría de la Decisión GB Alfredo A. Carneiro Campos UNEFA ZULIA

Teoría de la decisión

Estadística Estimación de la desv. típ.

Intervalo de confianza

Ejercicio nº 1.- De una población de 1.000 alumnos se ha tomado aleatoriamente una muestra

de diez y seis, en la cual se ha observado que la desviación típica de las alturas es de 6 cmts.

Encontrar el intervalo de confianza del 95% para σ.

1. Grados de libertad = N-k = 16-1 = 15

2. Se determinan los valores críticos: α = 0,5 a partir de aquí se determinan:

en la tabla se obtiene: 6,26

en la tabla se obtiene: 27,5

3. Se aplica la función:

RESULTADO:

2

025,0

2

975,0

592,9577,426,6

166

5,27

166

025,0975,0

cmtscmtsNsNs

95,0)6,96,4( P

Page 20: Teoría de la decisión Estadística - Aula Virtual · PDF fileGB Alfredo A. Carneiro Campos Teoría de la Decisión UNEFA ZULIA 1 Teoría de la decisión Estadística Conceptos básicos

20 Teoría de la Decisión GB Alfredo A. Carneiro Campos UNEFA ZULIA

Teoría de la decisión

Estadística Estimación de la desv. típ.

Intervalo de confianza

Ejercicio nº 2.- La desviación típica de una muestra de 200 bombillos es de 100 horas.

Encontrar el intervalo de confianza del 95% para σ de la producción total..

se observa que v es mayor que 30 grados de libertad, por tanto se puede aprovechar

La aproximación a la distribución normal

1. Se determinan los valores críticos: α = 0,5 a partir de aquí se determinan:

Z0,95 en la tabla de distribución normal se obtiene: +1,96 y -1,96

2. Se aplica la función:

95,0)3,1114,91( hshsP

5,239)925,1996,1(5,0)1)199(2(2

1 22

975,0

2

975,0 z 37,161)925,1996,1(5,0)1)199(2(2

1 22

025,0

2

025,0 z

hshshshsNsNs

33,1114,9137,161

200100

5,239

200100

025,0975,0

RESULTADO

Page 21: Teoría de la decisión Estadística - Aula Virtual · PDF fileGB Alfredo A. Carneiro Campos Teoría de la Decisión UNEFA ZULIA 1 Teoría de la decisión Estadística Conceptos básicos

21 Teoría de la Decisión GB Alfredo A. Carneiro Campos UNEFA ZULIA

Teoría de la decisión

Estadística Estimación del tamaño de

la muestra para la media

Problema: ¿Cuánto margen de error es razonable aceptar al estimar? ¿cuál su relación con el intervalo de confianza en la estimación de la media?

Si conocemos σ o tenemos una buena estimación de ella;

Si conocemos σ o tenemos una buena estimación de ella;