li broest adi stica

Upload: junior-aragon

Post on 02-Mar-2018

216 views

Category:

Documents


0 download

TRANSCRIPT

  • 7/26/2019 Li Broest Adi Stica

    1/20

    Captulo 8

    ESTIMACION PUNTUAL Y POR

    INTERVALO

    8.1. INTRODUCCION

    El corazon de la estadstica inferencial esta constituida por la estimacion de parametros y la prueba de hipotesis.

    Entenderemos, como inferencia estadstica a un conjunto de metodos matematicos que permiten al investigador sacar

    conclusiones de una poblacion a partir de las observaciones obtenidas de una muestra extrada de ella. Pero estas

    conclusiones o inferencias, a diferencias de las deducciones logicas de las matematicas que son absolutas, estas son

    apenas probables. Sin embargo, por la forma como se adquirir estas conclusiones o inferencias es posible que se puede

    llegar a un conocimiento erroneo de la poblacion.

    Es claro, que a las poblaciones se les describe mediante medidas descriptivas num ericas llamadaspar ametro. Por

    lo tanto, en la mayoras de las veces el proposito de muchas investigaciones estadsticas es estimar el valor de uno

    o mas parametros de una poblacion. Por consiguiente, en este captulo trataremos el concepto de la estimacion de

    un parametro, concepto fundamental de la estadstica inferencial. Estudiaremos dos tipos de problemas; el problema

    de estimacion puntual, el cual consiste en dar un solo valor aproximado de un parametro de una poblacion a partir

    de los datos obtenidos de una muestra, y el problema de estimacion por intervalo, que consiste en la obtencion de

    un intervalo dentro del cual se encuentra el verdadero valor del parametro estimado con una cierta probabilidad o

    nivel de confianza. Los parametros que mas se investigan son: la media, la proporcion, la varianza y otras que son

    combinaciones de las anteriores.

    A continuacion en las siguientes tablas se daran los estimadores puntuales y por intervalos de algunos parametros

    y los supuestos poblacionales asociados a las estimaciones.

    167

  • 7/26/2019 Li Broest Adi Stica

    2/20

    8.1. INTRODUCCION Universidad Popular del Cesar

    Resumen de construccion de intervalos de confianza

    para un promedio y diferencias de promedios

    Parametros Supuestos Estimador Varianza Intervalo de

    poblacionales puntual del estimador confianza

    Varianza Media

    = media conocida muestral V(X) = 2

    n xz/2ee(X)

    XN(,2) xTamano de Media

    = media muestra muestral V(X) = s2

    n xz/2ee(X)

    n 30 xVarianza descono- Media

    = media cida yn < 30 muestral V(X) = s2

    n

    x

    t/2ee(X)

    XN(,2) xy n < 30Diferencias Varianzas Diferencia

    de conocidas de medias

    medias Muestras muestrales V(D) = 2X1

    n1+

    2X2n2

    Dz/2ee(D)X1 X2 independientes D= x1 x2

    Xi N(i,2i ),i=1, 2Diferencias Muestras Diferencia

    de independientes de medias

    medias Tamanos muestrales V(D) = s2

    X1n1

    + s2

    X2n2

    Dz/2ee(D)X1 X2 de muestras D= x1 x2

    n1 30 yn2 30Diferencias Varianzas desco- Diferencia

    de nocidas e iguales de medias

    medias Muestras muestrales V(D) = s2p

    1

    n1+ 1

    n2

    D t/2ee(D)

    X1 X2 independientes D= x1 x2Xi N(i,2),i=1, 2

    Donde

    nes el tamano de la muestra

    xes la media muestral

    s2 es la varianza muestral

    z/2 es el valor correspondiente al area bajo la curva normal P(z/2

  • 7/26/2019 Li Broest Adi Stica

    3/20

    8.1. INTRODUCCION Universidad Popular del Cesar

    t(/2,n1) es el valor correspondiente al area bajo la curva tde students con n 1 grados de libertad para unamuestra, P(t/2,n1 < T

  • 7/26/2019 Li Broest Adi Stica

    4/20

    8.1. INTRODUCCION Universidad Popular del Cesar

    Estimacion del tamano de muestra

    1. Para estimar un promedio X: El tamano necesario para estimar unpromediopoblacional con una con-

    fianza100(1

    )y unerrorde estimacion alrededor de la media poblacional y con unamuestra aleatoria

    simple con reemplazoes:

    n=z/2

    2Donde

    a) Nivel de confianza. Los niveles de confianza es: z/2 es el valor cuantil correspondiente al area bajo la

    curva normal P(z/2 < Z< z/2) = 1 y los mas utilizados y sus correspondientes valores z semuestran en la tabla siguiente:

    Confianza mas usadas

    100(1/2) % 80 % 90 % 95 % 98 %Z 1.28 1.64 1.96 2.58

    b) Estimacion de la varianza. Algunas de las maneras de estimar las varianzas de la poblacion para calcular

    el tamano de la muestra:

    a. Por los resultados de una encuesta piloto.

    b. Utilizando estudios anteriores altamente correlacionado con el estudio que estamos haciendo.

    c. Conjeturar sobre la estructura de la poblacion y ayudarse con algunos resultados matematicos. Por

    ejemplo, si usted cree que la poblacion se distribuye en forma normal entonces rango/4.

    c) Estimacion del margen error o precision. La precision deseada se puede establecer, al definir la cantidad

    de margen de error tolerable en las estimaciones muestrales. Esta cantidad se determina mejor a la luz de

    los usos a los cuales se van utilizar los resultados de la muestra.

    2. Para estimar una proporcionP: Para estimar el tamano de muestra para una proporcion poblacion, con

    un muestreo aleatorio simple con reemplazo, se utiliza la siguiente expresion:

    n= z/2p(1p)

    2

    Donde

    a) Nivel de confianza. El nivel de confianza es: z/2 es el valor cuantil correspondiente al area bajo la curva

    normalP(z/2

  • 7/26/2019 Li Broest Adi Stica

    5/20

    8.1. INTRODUCCION Universidad Popular del Cesar

    c) Estimacion del margen error o precision. El error de estimacion siempre se da en las mismas unida-

    des del parametro que se quiere estimar, de manera tal que, con una probabilidad 100(1/2) %, laproporcion muestral p se encuentre en un intervalo aalrededor de la proporcion poblacional.

    Resumen de construccion de intervalos de confianza

    para la varianza y el cociente de dos varianzas

    Parametros Supuestos Estimador Intervalo de

    poblacionales puntual confianza

    Varianza Varianza

    2 XN(,2) muestral

    (n1)s2(1/2,n1)

    , (n1)s2(/2,n1)

    s2

    Cociente XyY Cociente

    de dos desconocidas de varianzas

    varianzas Muestras muestrales

    as2X1s2X2

    ,bs2X1s2X2

    2X1/

    2X2

    independientes s2X1/s2

    X2

    nes el tamano de la muestra

    s2 es la varianza muestral

    21/2,n1 es el valor correspondiente al area bajo la curva

    2 con n1 grados de libertad con una muestra de

    tamanon,P(2 < 21/2,n1) = 1/2.

    2/2,n1 es el valor correspondiente al area bajo la curva

    2 con n1 grados de libertad con una muestra de

    tamanon,P(2 < 2/2,n1) = /2.

    a= 1f1/2,n21,n11

    es el cuantil inferior de una distribucionF.

    b= f1/2,n1

    1,n2

    1es el cuantil superior de una distribucionF.

    171 Humberto Barrios. mail: [email protected]

  • 7/26/2019 Li Broest Adi Stica

    6/20

    8.1. INTRODUCCION Universidad Popular del Cesar

    EJERCICIOS RESUELTOS

    Ejemplo 8.1. Los datos que a continuacion se dan son los vol umenes en cent metros cubicos del contenido de 25

    bolsas de leche que se seleccionaron de un proceso de llenado con el proposito de verificar el volumen promedio: 898,

    905, 900, 900, 900, 895, 908, 901, 904, 897, 902, 898, 898, 903, 894, 899, 897, 904, 901, 910, 907, 905, 903, 899,

    911. Si el volumen de cada bolsa es una variable aleatoria aproximadamente normal con una varianza de2 =36.

    Obtener:

    a. Un estimacion puntual para el promedio poblacional

    b. Los intervalos de confianza estimados del 90 %, 95 % y 99 %.

    c. De una conclusion con respecto a los niveles de confianza dados en el punto anterior.

    d. Cual debe ser el tamano de muestra necesario para estimar el volumen promedio de las bolsas de leche con una

    confianza del 95%, un error de estimacion 2 cc y una varianza2 =36?

    Solucion 33.

    1. Con base en los datos muestrales, el valor de la media muestral es: x= 901.56. Por lo tanto, una estimacion

    puntual para el volumen promedio de las bolsas de leche es de 901.56 cc.

    2. Un intervalo de confianza para un promedio poblacional para una poblacion que se distribuye aproximadamente

    normal con una varianza conocida y un nivel de confianza 100(1) % es

    xz/2

    n

    ,x +z/2

    n

    As, un intervalo de confianza del 90% para la media del proceso de llenado es

    901.561.64

    6

    5

    = (901.561.97) = (899.59,903.53)

    Por lo tanto, podemos concluir con una confianza del 90% que en el procedo de llenado de las bolsas de leche

    salen con promedio entre 899.59 y 903.53 cc.

    Los otros intervalos de confianza se obtienen llevando a cabo el mismo procedimiento. Los resultados se resu-

    men en el siguiente cuadro, ver 8.1

    Cuadro 8.1: Intervalos de confianza

    Confianza z/2 Limite inferior Limite superior

    90 % 1.64 899.59 903.53

    95 % 1.96 899.21 903.91

    99 % 2.58 898.46 904.66

    172 Humberto Barrios. mail: [email protected]

  • 7/26/2019 Li Broest Adi Stica

    7/20

    8.1. INTRODUCCION Universidad Popular del Cesar

    3. Observando el cuadro 8.1 se ve que para una desviacion y un tamano de muestra dados, para confianzas mas

    grandes se obtienen intervalos de confianza mas anchos.

    4. Para un muestreo aleatorio simple con reemplazo la formula para hallar tamano de muestra con una confianza

    del 100(1/2) %, con un errory una varianza conocidaes

    n=

    z/2

    2De acuerdo a lo anterior, con una confianza 95%, un error= 2 cc y una varianza2 =36. Reemplazando en

    la formula obtenemos

    n=

    1.96(6)

    2

    2=36.

    Por lo tanto, para estimar el contenido promedio de las bolsas de leche, en el proceso de llenado, es necesario

    tomar una muestra de tamanon=36, y esto lo hacemos con una confianza del 95 %.

    Ejemplo 8.2. Se encontr o en una muestra aleatoria sistematicaque la concentracion promedio de zinc en las aguas

    del r o Guatapur en 36 sitios diferentes fue de 2.6 gramos por mililitro y una desviaci on estandar de 0.3 gramos.

    Encuentre un intervalo de confianza del 95 % para la concentracion promedio de zinc en las aguas del Ro Guatapur .

    Solucion 34.

    Se tiene una situacion donde no se supone que tipo de distribucion tiene las mediciones de las concentraciones de

    zinc en las aguas del ro Guatapur, pero se tiene un tamano de muestra superior a 30. Por lo tanto, un intervalo de

    confianza para esta situacion esta dado por

    xz/2

    sn

    ,x +z/2s

    n

    Donde

    x=2.6gres la media muestral, la cual es una estimacion puntual de la media poblacional

    s=0.3gres la desviacion estandar obtenida de la muestra

    n=36 tamano de muestra superior a 30

    z/2= 1.96 es el valor cuantil correspondiente al area bajo la curva normal P(z/2

  • 7/26/2019 Li Broest Adi Stica

    8/20

    8.1. INTRODUCCION Universidad Popular del Cesar

    Ejemplo 8.3. Un fabricante de vehculos sabe que el consumo de gasolina de sus vehculos se distribuye normal-

    mente. Se selecciona una muestra aleatoria simple de coches y se observa el consumo en litros cada cien kil ometros

    obteniendo las siguientes observaciones: 6.4, 5.9, 6.4, 6.4, 6.1, 5.9, 5.6, 6.2, 6.8, 6.9, 6.1, 6.5. Obtenga el intervalo de

    confianza para el consumo medio de gasolina de todos los vehculos de este fabricante, al nivel de confianza del 99%.

    Solucion 35.

    De la muestra se tiene el tamano de la muestra n= 12, la media de la muestra x= 6.27 litros por cada cien

    kilometros y la desviacion estandar de la muestra s = 0.38. Es claro, que una estimacion puntual del consumo promedio

    de gasolina por cada cien kilometros es x= 6.27 litros. Por otra parte, tenemos que un intervalo de confianza para el

    promedio de una poblacion que se distribuye normalmente, con una varianza desconocida 2 y un tamano de muestra

    nmenor que 30 es

    x t/2,n1 s

    n,x + t/2,n1 s

    n

    Donde

    x= 6.27 litros por cien kilometros es la media muestral, la cual es una estimacion puntual de la media pobla-

    cional

    s=0.38 es la desviacion estandar obtenida de la muestra

    n=12 tamano de muestra superior a 30

    t/2,11= 3.11 es el valor cuantil correspondiente al area bajo la curva t-student P(t/2,11 < T < t/2,11) =0.99.

    Por consiguiente, reemplazando estos valores en el anterior intervalo obtenemos

    6.273.11

    0.38

    12

    ,6.27 + 3.11

    0.38

    12

    = (5.93,6.61)

    Podemos concluir, con una confianza del 99%, que el consumo promedio de gasolina para este tipo de veh culo

    esta entre 5.93 y 6.61 litros por cada cien kilometros.

    Ejemplo 8.4. Una muestra aleatoria de tamano n1= 25 que se tomo de una poblacion distribuida normalmente con

    una varianza de 21 =25 tiene una media x1= 80. Una segunda muestra aleatoria de tamano n2= 36, que se tomo

    de una poblacion distribuida normalmente con una varianza de22 =9, tiene una media de x2= 75. Encuentre un

    intervalo de confianza del 95% para12.

    Solucion 36.

    174 Humberto Barrios. mail: [email protected]

  • 7/26/2019 Li Broest Adi Stica

    9/20

    8.1. INTRODUCCION Universidad Popular del Cesar

    Cuadro 8.2:

    Poblacion n x s2

    I 25 80 25

    II 36 75 9

    Los datos de las muestras se pueden resumir en el siguiente cuadro 8.2

    Es claro que una estimacion puntual para la diferencia de los promedios poblacionales es: x1 x2= 80 75=5. Por otra parte, puesto que las poblaciones estan distribuidas normalmente con varianzas conocidas, entonces un

    intervalo de confianza para la diferencias de medias esta dado por la siguiente expresion:

    x1 x2

    z/2

    1

    n1

    +2

    n2

    , x1

    2+z/2

    1

    n1

    +2

    n2

    Para una confianza del 95% se tiene quez/2= 1.96. As, reemplazando los valores del cuadro 8.2 en el intervalo

    anterior, se tiene:

    80751.96

    25

    25+

    9

    36, 8075 + 1.96

    25

    25+

    9

    36

    Por lo tanto (2.81, 7.19). As, podemos afirmar con una confianza del 95% que la verdadera diferencia de los

    promedios de las dos poblaciones esta entre 2.81 y 7.19.

    Ejemplo 8.5. Se comparan las resistencias de dos clases de hilo. Cincuenta piezas de cada clase de hilo se prueban

    bajo condiciones similares. La marca A tiene una resistencia a la tracci on promedio de 78.3 kilogramos con una

    desviacion est andar de 5.6 kg., mientras que la marca B tiene una resistencia a la traccion promedio de 87.2 kg.

    con una desviacion est andar de 6.3 kg. construya un intervalo de confianza de 95% para la diferencia de las medias

    poblacionales.

    Solucion 37.

    Los datos de las muestras se pueden resumir en el siguiente cuadro 8.3

    Cuadro 8.3:

    Clases de hilo n x s

    A 50 78.3 5.6

    B 50 87.2 6.3

    Una estimacion puntual para la diferencia de las resistencias de las dos clases de hilo es: x1 x2=87.378.3=9,a favor del hilo de tipo B. Por otra parte, puesto que los tamanos de muestras son superiores a 30, entonces un intervalo

    de confianza para la diferencias de medias esta dado por la siguiente expresion:

    175 Humberto Barrios. mail: [email protected]

  • 7/26/2019 Li Broest Adi Stica

    10/20

    8.1. INTRODUCCION Universidad Popular del Cesar

    x1 x2z/2

    s21n1

    +s22n2

    , x1 2+z/2

    s21n1

    +s22n2

    Para un nivel de confianza del 95% se tiene que z/2= 1.96. As, reemplazando los valores del cuadro 8.3 en el

    intervalo anterior, se tiene:

    87.278.31.96

    39.69

    50 +

    31.36

    50 , 8075 + 1.96

    39.69

    50 +

    31.36

    50

    Por lo tanto (6.56, 11.24). As, podemos afirmar con una confianza del 95% que la verdadera diferencia de los

    promedios de las resistencias de las dos clases de hilo esta entre 6.56 y 11.24.

    Ejemplo 8.6. En un proceso qumico por lotes, se comparan los efectos de dos catalizadores sobre la potencia de la

    reaccion del proceso. Se prepar o una muestra de 12 lotes con el uso del catalizador 1 y se obtuvo una muestra de 10

    lotes con el catalizador 2. Los 12 lotes para los que se utilizo el catalizador 1 dan un rendimiento promedio de 85 con

    una desviaci on estandar muestral de 4, y para la segunda muestra el promedio es 81 con una desviacion estandar de

    5. Encuentre un intervalo de confianza de 90 % para la diferencia entre las dos medias poblacionales:Suponga que

    las poblaciones se distribuyen normalmente con varianzas iguales.

    Solucion 38.

    Los datos de las muestras obtenidos de los efectos de dos catalizadores se pueden resumir en el siguiente cuadro

    8.4

    Cuadro 8.4:

    Catalizadores n x s

    1 12 85 4

    2 10 81 5

    Una estimacion puntual para la diferencia de los efectos de los dos catalizadores: x1 x2=8581=4, a favor delcatalizador 1. Por otra parte, puesto que los tamanos de muestras son superiores menores a 30, las poblaciones estan

    distribuidas aproximadamente normal y con varianzas iguales pero desconocidas, entonces un intervalo de confianza

    para la diferencias de medias esta dado por la siguiente expresion:

    x1 x2 t(/2,n1+n22)sp

    n1

    + 1

    n2, x1 x2+ t(/2,n1+n22)sp

    1

    n1+

    1

    n2

    Dondes2pes la varianza muestral combinada es

    s2p=(n11)s21+ (n21)s22

    n1+ n22

    176 Humberto Barrios. mail: [email protected]

  • 7/26/2019 Li Broest Adi Stica

    11/20

    8.1. INTRODUCCION Universidad Popular del Cesar

    As,

    s2p=(121)42 + (101)52

    12 + 102 =20.05 sp= 4.48

    Para un nivel de confianza del 95% se tiene que t0.95,20= 1.72. As, reemplazando los valores del cuadro 8.4 en el

    intervalo anterior, se tiene:

    85811.72(4.48)

    1

    12+

    1

    10, 85811.72(4.48)

    1

    12+

    1

    10

    Por lo tanto (0.70, 7.30). As, podemos afirmar con una confianza del 90% que la verdadera diferencia de los

    promedios de los efectos de los dos catalizadores esta entre 0.70 y 7.30.

    Ejemplo 8.7. Una encuesta realizada por Gallup revelo que si las elecciones fueran el pr oximo domingo, 17 de

    noviembre 2013. La intencion de voto de los 1.200 encuestados, el 27% lo hara por el presidente Juan Manuel

    Santos, el 14.9% elegir a a Oscar Ivan Zuluaga, en el tercer puesto se mantiene Antonio Navarro Wolff con 12%, en

    el cuarto lugar figura Clara L opez con 7.2% y por ultimo Marta Luca Ramrez, con 5 % de electores. Por otra parte,

    la encuesta revelo que el 30.9% votar a en blanco y un 3.2% no sabr a o no respondieron. Responda las siguientes

    preguntas, bajo el supuesto que la encuesta se realizo con un muestreo aleatorio simple con reemplazo.

    1. Construir un intervalo de confianza del 95% de la verdadera proporci on de intencion de voto de los colombiano,

    para cada uno de los candidatos que aspiran a la presidencia de la republica, para el pr oximo periodo.

    2. Construir un intervalo de confianza para la diferencia entre las proporciones del voto en blanco y la intenci on

    de voto para el presidente Juan Manuel Santos. De una conclusion.

    3. Con una confianza del 95% y un error del 3% cual debe ser el tamano de muestra para estimar la verdadera

    proporcion de la intencion de voto que favorece al presidente Santos?

    Solucion 39.

    En el siguiente cuadro se muestran los estimadores puntuales de las proporciones de la intencion de vota corres-

    pondiente a cada candidato incluyendo al del voto en blanco, ver 8.5.

    a. Un intervalo de confianza aproximado de 100(1) % para la verdadera proporcion poblacional es

    pz/2

    p(1p)

    n, p +z/2

    p(1p)

    n

    Dondez/2es el valor cuantil correspondiente al area bajo la curva normal P(z/2

  • 7/26/2019 Li Broest Adi Stica

    12/20

    8.1. INTRODUCCION Universidad Popular del Cesar

    Cuadro 8.5:

    Intencion

    Pre-candidatos de voto

    Juan M. Santos 27.0 %

    Oscar I. Zuluaga 14.9%

    Antonio Navarro 12.0%

    Clara Lopez 7.2 %

    Marta L. Ramrez 5.0%

    Voto en blanco 30.6%

    Otros 3.2 %

    > #INTERVALO DE CONFIANZA PARA UNA PROPORCION CON R

    > n=1200 #tama~no de muestra

    > p=0.27 #proporcion en la muestra

    > con=0.95 #confianza

    > #INTERVALO DE CONFIANZA

    > round(p+c(-1,1)*qnorm(con+(1-con)/2)*sqrt(p*(1-p)/n),3)

    [1] 0.245 0.295

    0.271.960.27(0.73)1200 , 0.27 + 1.96

    0.27(0.73)

    1200

    = (0.245, 0.295)

    Por lo tanto, estimamos con una confianza del 95% que la proporcion de votantes que apoyaran a Santos bajo el

    supuesto que el proximo domingo fueran las elecciones estara entre 24.5% y 29.5%.

    Los demas intervalos de confianzas, para los otros candidatos, se obtienen de manera similar.

    b. Un intervalo de confianza del 100(1) % para la diferencia de dos proporciones, con tamanos de muestrasgrandes, poblaciones independientes y utilizando el Teorema del Limite Central es

    |p1p2|z/2p1(1p1)n1 +p

    2(1

    p2

    )

    n2,|p1p2|+z/2p1(1p1)n1 +

    p2

    (1

    p2

    )

    n2

    Realizando los calculos en R, con p1=0.306,p2=0.27,n1=n2=1200 y con una confianza del 95%, obtenemos

    #INTERVALO DE CONFIANZA PARA LA DIFERENCIA DE DOS PROPORCIONES CON R

    > n1=1200 #tama~no de muestra para la poblacion 1

    > n2=1200 #tama~no de muestra para la poblacion 2

    > p1=0.306 #proporcion en la muestra 1

    178 Humberto Barrios. mail: [email protected]

  • 7/26/2019 Li Broest Adi Stica

    13/20

    8.1. INTRODUCCION Universidad Popular del Cesar

    > p2=0.27 #proporcion en la muestra 2

    > con=0.95 #confianza

    > #INTERVALO DE CONFIANZA

    > round(abs(p1-p2)+c(-1,1)*qnorm(con+(1-con)/2)*sqrt(p1*(1-p1)/n1+p2*(1-p2)/n2),3)

    [1] 0.000 0.072

    Por lo tanto, podemos afirmar con una confianza del 95% que no hay evidencias para afirmar que existe diferencias

    significativa entre el voto en blanco y el de Santos, es decir, hay un empate tecnico.

    c. Para estimar el tamano de muestra para una proporcion poblacion, con un muestreo aleatorio simple con reemplazo,

    se utiliza la siguiente expresion:

    n= z/2p(1p)

    2

    Donde el error de estimacion sera la diferencia absoluta entre p de una muestra y la verdadera proporci on que

    podemos aceptar y y p se puede tomar de estudios anterior o simplemente p= 0.5 el cual es un maximo para el

    tamano de la muestra, como se puede ver a continuacion: sea p =0.20, 0.30, 0.40, 0.50, 0.40, 0.30, 0.20. Haciendo

    los calculos en R, obtenemos

    > p=c(0.20, 0.30, 0.40, 0.50, 0.40, 0.30, 0.20)# proporciones

    > con=0.95 #nivel de confianza

    > ee=0.03 #error de estimacion

    > n=round(qnorm(con+(1-con)/2)^2*p*(1-p)/(ee^2),0)

    > #TAMA~NOS DE MUESTRAS

    p;n

    [1] 0.2 0.3 0.4 0.5 0.4 0.3 0.2

    [1] 683 896 1024 1067 1024 896 683

    Observemos que para diferentes valores de p con una confianza y un error fijo obtenemos diferentes tamanos de

    muestras, pero para p=0.50 se obtiene el maximo. Esto solo ocurre en el caso de una proporcion.

    Ejemplo 8.8. Se espera tener una cierta variacion aleatoria nominal en el espesor de las laminas de plastico que

    una maquina produce. Para determinar cuando la variacion en el espesor se encuentra dentro de ciertos limites, cada

    d a se selecciona en forma aleatoria 12 laminas de plastico y se mide en mil metros su espesor. Los datos que se

    obtuvieron son los siguientes: 10.7, 10.5, 11.4, 11.7, 16.1, 12.5, 11.0, 12.3, 12.2, 14.2, 13.1, 12.4. Si se supone que el

    espesor es una variable aleatoria distribuida normal. Obtener los intervalos de confianza del 90 %, 95 % y 99 % para

    la varianza desconocida del espesor.

    Solucion 40.

    179 Humberto Barrios. mail: [email protected]

  • 7/26/2019 Li Broest Adi Stica

    14/20

    8.1. INTRODUCCION Universidad Popular del Cesar

    Para hallar un intervalo de confianza del 90% para la varianza del espesor, se aplica la siguiente formula:

    (n1)s2(1/2,n1)

    , (n1)s2(/2,n1)

    nes el tamano de la muestra

    s2 es la varianza muestral

    21/2,n1 es el valor correspondiente al area bajo la curva 2 con n1 grados de libertad con una muestra de

    tamanon,P(2 < 21/2,n1) = 1/2.

    2/2,n1 es el valor correspondiente al area bajo la curva

    2 con n1 grados de libertad con una muestra de

    tamanon,P(2 < 2/2,n1) = /2.

    Realizando los calculo en R

    > #INTERVALO DE CONFIANZA DE LA VARIANZA CON R

    > x=c(10.7, 10.5, 11.4, 11.7, 16.1, 12.5, 11.0, 12.3, 12.2, 14.2, 13.1, 12.4)#datos

    > n=length(x)#numero de datos

    > lg=n-1#grados de libertad

    > ss=var(x)#varianza de la muestra

    > con=0.90#confianza

    > chi1=qchisq(con+(1-con)/2,11)#cuantil superior

    > chi2=qchisq((1-con)/2,11)#cuantil inferior> #INTERVALO DE CONFIANZA

    > round(c((n-1)*ss/chi1,(n-1)*ss/chi2),2)

    [1] 1.39 5.99

    Por lo tanto, un intervalo de confianza del 99% para la varianza poblacional, 2, esta entre 1.39 y 5.99.

    Ejemplo 8.9. Una empresa fabrica propulsores. A los ingenieros les gustar a saber cual de dos procesos tiene la

    menor rugosidad en las superficies. Para ello se toman muestras aleatorias de cada proceso. Datos.

    Proceso 1 n1= 16, s1= 4.7

    Proceso 2 n2= 12, s2= 5.1

    Solucion 41.

    Supongase que se tienen dos poblaciones normales e independientes con varianzas desconocidas 21 y 22 , res-

    pectivamente. De este par de poblaciones, se tienen disponibles dos muestras aleatorias de tamanosn1 y n2, respec-

    tivamente, seans21 y s22 las dos varianzas muestrales. Si se desea, por ejemplo, conocer un intervalo de confianza del

    1000(1) % por ciento para el cociente de las dos varianzas 2122

    se tiene

    180 Humberto Barrios. mail: [email protected]

  • 7/26/2019 Li Broest Adi Stica

    15/20

    8.2. EJERCICIOS Universidad Popular del Cesar

    as2X1

    s2X2

    ,bs2X1

    s2X2

    n1 es el tamano de la muestra de la poblacion 1

    n2 es el tamano de la muestra de la poblacion 2

    s21 es la varianza muestral de la poblacion 1

    s22 es la varianza muestral de la poblacion 2

    a= 1f1/2,n21,n11

    es el cuantil inferior de una distribucionF.

    b= f1/2,n11,n21es el cuantil superior de una distribucionF.

    Los resultados se derivan de R, se muestran a continuacion:

    > #INTERVALO DE CONFIANZA PARA EL COCIENTE DE DOS VARIANZAS

    > con=0.90

    > n1=16#tama~no de muestra de la primera poblacion 1

    > n2=12#tama~no de muestra de la primera poblacion 2

    > s1=4.7#desviacion e la primera poblacion 1

    > s2=5.1#desviacion e la primera poblacion 1

    > a=1/qf(con+(1-con)/2,n1-1,n2-1)#cuantil inferior de F

    > b=qf(con+(1-con)/2,n2-1,n1-1)#cuantil superior de F

    > #INTERVALO DE CONFIANZA

    > round(c(a*s1 2/(s2^2),b*s1 2/(s2^2)),2)

    [1] 0.31 2.13

    Como el intervalo de confianza(0.31, 2.13)incluye al uno, no se puede concluir que exista alguna diferencia entre

    la variabilidad de los dos procesos. Es decir, el intervalo de confianza incluye la posibilidad de que las dos desviaciones

    estandar sean iguales, puesto que el cociente puede ser igual a uno.

    8.2. EJERCICIOS1. Se sabe que el peso de los ladrillos producidos por una determinada fabrica sigue una distribucion normal con

    una desviacion tpica de 0.12 kilos. En el da de hoy se extrae una muestra aleatoria de 60 ladrillos cuyo peso

    medio es de 4.07 kilos.

    a. Calcular un intervalo de confianza del 99 % para el peso medio de los ladrillos producidos hoy.

    b. Sin realizar los calculos, determinar si un intervalo de confianza del 95 % para la media poblacional tendra

    mayor, menor o la misma longitud que el calculado en el apartado a.

    181 Humberto Barrios. mail: [email protected]

  • 7/26/2019 Li Broest Adi Stica

    16/20

    8.2. EJERCICIOS Universidad Popular del Cesar

    c. Se decide que manana se tomara una muestra de 20 ladrillos. Sin realizar los calculos, determinar si un

    intervalo de confianza del 99% para el peso medio de los ladrillos producidos manana tendra mayor, menor

    o la misma longitud que el calculado en el apartado a.

    d. Se sabe que la desviacion tpica poblacional para la produccion de hoy es de 0.15 kilos. Sin realizar los

    calculos, determinar si un intervalo de confianza del 99% para el peso medio de los ladrillos producidos hoy

    tendra mayor, menor o la misma longitud que el calculado en el apartado a.

    e. Hallar el tamano muestral necesario para calcular un intervalo de confianza del 90% para el peso medio

    poblacional de los ladrillos, cuya amplitud a cada lado de la media muestral sea igual a 0.01 kilos.

    2. Un supervisor de control de calidad en una enlatadora sabe que la cantidad exacta en cada lata vara, pues

    hay ciertos factores imposibles de controlar que afectan a la cantidad de llenado. El llenado medio por lata es

    importante, pero igualmente importante es la variacion s2 de la cantidad de llenado. Si s2 es grande, algunas

    latas contendran muy poco, y otras, demasiado. A fin de estimar la variacion del llenado en la enlatadora, el

    supervisor escoge al azar 10 latas y pesa el contenido de cada una, obteniendo el siguiente pesaje (en onzas):

    7.96,7.90,7.98,8.01,7.97,8.03,8.02,8.04,8.02 Establezca un intervalo de confianza de 90% para la verdadera

    variacion del llenado de latas en la enlatadora.

    3. Es comun utilizar el acero inoxidable en las plantas qumicas para manejar fluidos corrosivos. Sin embargo, este

    acero tienen especial susceptibilidad al agrietamiento por corrosion causada por esfuerzos en ciertos entornos.

    En una muestra de 295 fallas de aleaciones de acero que ocurrieron en refineras de petroleo y plantas petro-

    qumicas en Venezuela durante los ultimos 10 anos, 118 se debieron a agrietamiento por corrosion causada por

    esfuerzos y a fatiga de corrosion. Establezca un intervalo de confianza de 95% para la verdadera proporcion de

    fallas de aleaciones causadas por agrietamiento por corrosion debido a esfuerzos.

    4. Supongamos que el tiempo en horas dedicado por los estudiantes de una determinada asignatura a preparar el

    examen final tiene una distribucion normal. Se toma una muestra aleatoria de 6 estudiantes cuyos resultados son

    los siguientes: 12.2,18.4,23.1,11.7,8.2,24

    a. Calcular un intervalo de confianza del 99% para la media poblacional.

    b. Calcular un intervalo de confianza del 99 % para la varianza poblacional.

    c. Sin realizar los calculos, determinar si un intervalo de confianza del 90% tendra una amplitud mayor o

    menor que el hallado en el apartado b.

    5. Para comparar la estatura media de los habitantes de dos regiones de Colombia se toman dos muestras aleatorias

    de tamanos 150 y 250. Los resultados obtenidos fueron:

    Supuesta la distribucion de la altura como una normal, se pide calcular al nivel de confianza del 98%:

    a. Intervalo de confianza de la media poblacional de la region 1.

    182 Humberto Barrios. mail: [email protected]

  • 7/26/2019 Li Broest Adi Stica

    17/20

    8.2. EJERCICIOS Universidad Popular del Cesar

    Region x s n

    Andina 1.73 0.10 150

    Costa 1.70 0.12 250

    b. Intervalo de confianza de la media poblacional de la region 2.

    c. Intervalo de confianza de la diferencia de medias poblacionales.

    6. Un gabinete de investigacion quiere estimar la proporcion de consumidores que adquiriran antes un producto

    de fabricacion nacional que uno elaborado por un competidor extranjero. Su intencion es construir un intervalo

    de confianza para la proporcion poblacional con una amplitud maxima a cada lado de la proporcion muestral de

    0.04. Cuantas observaciones se necesitan, incluir en la muestra, para alcanzar este objetivo?

    7. Se encuentra que la concentracion promedio de zinc que se saca del agua a partir de una muestra de mediciones

    de zinc en 36 sitios diferentes del rio Guatapur es de 2.6 gramos por mililitros. Encuentre un intervalo de

    confianza de 95% y 99% para la concentracion media de zinc en el ro. Suponga que la desviacion estandar de

    la poblacion es 0.3.

    8. Una empresa electrica fabrica bombillas y su tiempo de duracion se distribuyen aproximadamente normal, con

    una varianza de 1296. Se ensaya una muestra de 35 bombillas y arroja una duracion promedia de 800 horas.

    a. Hallar una estimacion puntual para la media poblacional. De una interprete.

    b. Con un nivel de confianza del 95% estime la media poblacion de todos las bombillas que produce la empresa.

    Interprete los resultados.

    c. Cuantas bombillas se deben probar para un nivel de confianza 95%, si se desea que nuestra estimaci on

    puntualeste dentro de las 10 horas de la media real? Interprete el resultado obtenido.

    d. Con relacion al punto anterior. Que le ocurre al tamano de la muestra s: S aumente el nivel de confianza?

    Si se disminuye la varianza? Si se disminuye el error de estimacion?. Haga una conclusion de lo observado.

    9. Las estaturas de una muestra aleatoria de 50 estudiantes de la Universidad Popular del Cesar (UPC) da una

    media de 175 centmetros y una desviacion estandar de 7 centmetros.

    a. Hallar una estimacion puntual para la media poblacional. Interprete los resultados.

    b. Hallar una estimacion para la varianza del promedio muestral? Interprete los resultados.

    c. Hallar un error de estimacion para la media muestral? Interprete los resultados.

    d. Estime el promedio poblacional de las estaturas de los estudiantes de la UPC, con una confianza del 95%.

    Interprete los resultados.

    10. Una maquina produce piezas metalicas de forma cilndrica. Se toma una muestra de nueve piezas y las medidas

    de los diametros son: 1.01, 0.97, 1.03, 1.04, 0.99, 0.98, 0.99, 1.01 y 1.03 centmetros. Se conoce que el diametro

    de las piezas producidas por la maquina se distribuyen aproximadamente normal.

    183 Humberto Barrios. mail: [email protected]

  • 7/26/2019 Li Broest Adi Stica

    18/20

    8.2. EJERCICIOS Universidad Popular del Cesar

    a. Hallar una estimacion puntual para la media poblacional. Interprete los resultados.

    b. Hallar una estimacion para la varianza del promedio muestral? Interprete los resultados.

    c. Hallar un error de estimacion para la media muestral? Interprete los resultados.

    d. Estime un intervalo de confianza para el promedio poblacional del diametro de los cilindros producidos por

    la maquina, con una confianza del 99%. Interprete los resultados.

    e. Realice una nueva estimacion con un nivel de confianza menor, compare con los resultados anteriores y

    concluya con su juicio crtico.

    11. Se sabe que el peso de los ladrillos producidos por una determinada fabrica sigue una distribucion normal con

    una desviacion tpica de 0.12 kilos. En el da de hoy se extrae una muestra aleatoria de 60 ladrillos cuyo peso

    medio es de 4.07 kilos.

    a. Calcular un intervalo de confianza del 99 % para el peso medio de los ladrillos producidos hoy.

    b. Sin realizar los calculos, determinar si un intervalo de confianza del 95 % para la media poblacional tendra

    mayor, menor o la misma longitud que el calculado en el apartado a.

    c. Se decide que manana se tomara una muestra de 20 ladrillos. Sin realizar los calculos, determinar si un

    intervalo de confianza del 99% para el peso medio de los ladrillos producidos manana tendra mayor, menor

    o la misma longitud que el calculado en el apartado a.

    d. Se sabe que la desviacion tpica poblacional para la produccion de hoy es de 0.15 kilos. Sin realizar los

    calculos, determinar si un intervalo de confianza del 99% para el peso medio de los ladrillos producidos hoy

    tendra mayor, menor o la misma longitud que el calculado en el apartado a.

    e. Hallar el tamano muestral necesario para calcular un intervalo de confianza del 90% para el peso medio

    poblacional de los ladrillos, cuya amplitud a cada lado de la media muestral sea igual a 0.01 kilos.

    12. Un supervisor de control de calidad en una enlatadora sabe que la cantidad exacta en cada lata vara, pues

    hay ciertos factores imposibles de controlar que afectan a la cantidad de llenado. El llenado medio por lata es

    importante, pero igualmente importante es la variacion s2 de la cantidad de llenado. Si s2 es grande, algunas

    latas contendran muy poco, y otras, demasiado. A fin de estimar la variacion del llenado en la enlatadora, el

    supervisor escoge al azar 10 latas y pesa el contenido de cada una, obteniendo el siguiente pesaje (en onzas):

    7.96, 7.90, 7.98, 8.01, 7.97, 8.03, 8.02, 8.04, 8.02. Establezca un intervalo de confianza de 90% para la verdadera

    variacion del llenado de latas en la enlatadora.

    13. Es comun utilizar el acero inoxidable en las plantas qumicas para manejar fluidos corrosivos. Sin embargo, este

    acero tienen especial susceptibilidad al agrietamiento por corrosion causada por esfuerzos en ciertos entornos.

    En una muestra de 295 fallas de aleaciones de acero que ocurrieron en refiner as de petroleo y plantas petro-

    qumicas en Venezuela durante los ultimos 10 anos, 118 se debieron a agrietamiento por corrosion causada por

    esfuerzos y a fatiga de corrosion. Establezca un intervalo de confianza de 95% para la verdadera proporcion de

    fallas de aleaciones causadas por agrietamiento por corrosion debido a esfuerzos.

    184 Humberto Barrios. mail: [email protected]

  • 7/26/2019 Li Broest Adi Stica

    19/20

    8.2. EJERCICIOS Universidad Popular del Cesar

    14. Supongamos que el tiempo en horas dedicado por los estudiantes de una determinada asignatura a preparar el

    examen final tiene una distribucion normal. Se toma una muestra aleatoria de 6 estudiantes cuyos resultados son

    los siguientes: 12.2, 18.4, 23.1, 11.7, 8.2, 24.

    a. Calcular un intervalo de confianza del 99% para la media poblacional.

    b. Calcular un intervalo de confianza del 99 % para la varianza poblacional.

    c. Sin realizar los calculos, determinar si un intervalo de confianza del 90% tendra una amplitud mayor o

    menor que el hallado en el apartado b.

    15. Para comparar la estatura media de los habitantes de dos regiones de Colombia se toman al azar dos muestras

    aleatorias de tamanos 150 y 250. Los resultados obtenidos fueron:

    Region x s n

    Andina 1.73 0.10 150

    Costa 1.70 0.12 250

    Supuesta la distribucion de la altura como una normal, se pide calcular al nivel de confianza del 98%:

    a. Intervalo de confianza de la media poblacional de la region 1.

    b. Intervalo de confianza de la media poblacional de la region 2.

    c. Intervalo de confianza de la diferencia de medias poblacionales.

    16. Un gabinete de investigacion quiere estimar la proporcion de consumidores que adquiriran antes un producto

    de fabricacion nacional que uno elaborado por un competidor extranjero. Su intencion es construir un intervalo

    de confianza para la proporcion poblacional con una amplitud maxima a cada lado de la proporcion muestral de

    0.04. Cuantas observaciones se necesitan, incluir en la muestra, para alcanzar este objetivo?

    17. Se encuentra que la concentracion promedio de zinc que se saca del agua a partir de una muestra de mediciones

    de zinc en 36 sitios diferentes del rio Guatapur es de 2.6 gramos por mililitros. Encuentre un intervalo de

    confianza de 95% y 99% para la concentracion media de zinc en el ro. Suponga que la desviacion estandar de

    la poblacion es 0.3.

    18. De 1000 casos de cancer pulmonar seleccionados aleatoriamente, 823 son de pacientes que fallecieron.

    a. Construya un intervalo de confianza del 95 % para la tasa de cancer pulmonar.

    b. Que grande debe ser el tamano de la muestra para tener una confianza del 95% de que el error al estimar la

    tasa de mortalidad del cancer pulmonar no sea superior a 0.03%?

    19. Se tomo una muestra aleatoria de 50 cascos utilizados por los corredores de motocicletas y los conductores de

    automoviles de carrera, y se someten a una prueba de impacto. En 18 de los cascos se observa cierto da no.

    185 Humberto Barrios. mail: [email protected]

  • 7/26/2019 Li Broest Adi Stica

    20/20

    8.2. EJERCICIOS Universidad Popular del Cesar

    a. Encuentre un intervalo de confianza del 95 % para la verdadera proporcion de cascos de este tipo que mos-

    traran dano como resultado de la prueba?

    b. Al utilizar la estimacion puntual de p obtenida a partir de la muestra preliminar de 50 cascos. Cuantos

    cascos debe probarse para tener una confianza del 95% de que el error al estimar el verdadero valor de psea

    menor que 0.02?

    c. De que tamano debe ser la muestra si se desea tener una confianza del 95% de que el error al estimar psea

    menor que 0.02, sin importar el valor verdadero de p?

    20. Un fabricante de calculadoras electronicas esta interesado en estimar la fraccion de unidades defectuosas pro-

    ducidas.Toma una muestra aleatoria de 50 calculadoras y resultaron 5 defectuosas. Calcule un intervalo de

    confianza del 99% para la fraccion de calculadoras defectuosas?

    21. Se lleva a cabo un estudio para determinar la efectividad de una nueva vacuna contra la gripe. Se administra lavacuna a una muestra aleatoria de 3000 sujetos, y de este grupo 13 contraen gripe. Como grupo de control se

    seleccionaron de manera aleatoria 2500 sujetos, a los cuales no se les administro la vacuna, y de este grupo 170

    contraen gripe. construya un intervalo de confianza del 95% para la diferencia entre las dos proporciones.

    22. Se analiza la fraccion de productos defectuosos por dos lneas de produccion. Una muestra de 100 unidades

    provenientes de la lnea 1 contiene 10 que son defectuosas, mientras una muestra aleatoria de 120 unidades de

    la lnea 2 tiene 25 que son defectuosas. Encuentre un intervalo de confianza del 99% para la diferencia en

    fracciones de productos defectuosos producidos por las dos l neas?