estadistica (ii bimestre abril agosto 2011)
DESCRIPTION
Universidad Técnica Particular de Loja Ciclo Académico Abril Agosto 2011 Carrera: Ciencias de la Computación Docente: Ing. Ana Gabriela Correa Ciclo: Tercero Bimestre: SegundoTRANSCRIPT
![Page 1: ESTADISTICA (II Bimestre Abril agosto 2011)](https://reader034.vdocuments.site/reader034/viewer/2022052200/55964a7d1a28ab781d8b466c/html5/thumbnails/1.jpg)
ESTADÍSTICA
ESCUELA:
NOMBRES:
Informática
Ing. Gabriela Correa Mena
BIMESTRE: Segundo
Abril Agosto 2011
![Page 2: ESTADISTICA (II Bimestre Abril agosto 2011)](https://reader034.vdocuments.site/reader034/viewer/2022052200/55964a7d1a28ab781d8b466c/html5/thumbnails/2.jpg)
CONTENIDO
• UNIDAD 5: Muestreo
• UNIDAD 6: Prueba de hipótesis para dos muestras
• UNIDAD 7: Análisis de varianza
• UNIDAD 8: Métodos no paramétricos ji cuadrada
• UNIDAD 9: Correlación y regresión lineal
![Page 3: ESTADISTICA (II Bimestre Abril agosto 2011)](https://reader034.vdocuments.site/reader034/viewer/2022052200/55964a7d1a28ab781d8b466c/html5/thumbnails/3.jpg)
UNIDAD 5
MUESTREO
![Page 4: ESTADISTICA (II Bimestre Abril agosto 2011)](https://reader034.vdocuments.site/reader034/viewer/2022052200/55964a7d1a28ab781d8b466c/html5/thumbnails/4.jpg)
Herramienta para inferir algo sobre una población
Muestreo
- Entrar en contacto con todos los miembros de la población consumedemasiado tiempo
- El costo de estudiar a todos los elementos de la población es muy alto
- Resulta imposible verificar y localizar a todos los miembros de la población
- Algunas pruebas resultan negativas
Razones para muestrear:
![Page 5: ESTADISTICA (II Bimestre Abril agosto 2011)](https://reader034.vdocuments.site/reader034/viewer/2022052200/55964a7d1a28ab781d8b466c/html5/thumbnails/5.jpg)
• Media poblacional• Valores de la población (X)• Número de elementos de la población (N)
• Total de muestras• Fórmula de Combinación (C)
Aspectos a considerar
Distribución muestral de la Media
Organiza las medias de todas las muestras en una distribución de probabilidad
Media de la población = Media de la distribución muestral de la media
![Page 6: ESTADISTICA (II Bimestre Abril agosto 2011)](https://reader034.vdocuments.site/reader034/viewer/2022052200/55964a7d1a28ab781d8b466c/html5/thumbnails/6.jpg)
Ejemplo: Cierta empresa cuenta con 4 empleados deproducción (a quienes se les considera la población). En latabla siguiente se incluyen los ingresos por hora de cadaempleado.
Empleado Ingreso por hora
José 3
Arturo 1
María 4
Rosa 8
a. Media de la población
![Page 7: ESTADISTICA (II Bimestre Abril agosto 2011)](https://reader034.vdocuments.site/reader034/viewer/2022052200/55964a7d1a28ab781d8b466c/html5/thumbnails/7.jpg)
b. Distribución muestral de la media paramuestras de tamaño 2
Total de muestras:
N= 4n = 2
![Page 8: ESTADISTICA (II Bimestre Abril agosto 2011)](https://reader034.vdocuments.site/reader034/viewer/2022052200/55964a7d1a28ab781d8b466c/html5/thumbnails/8.jpg)
Empleado Ingreso por hora
José 3
Arturo 1
María 4
Rosa 8
![Page 9: ESTADISTICA (II Bimestre Abril agosto 2011)](https://reader034.vdocuments.site/reader034/viewer/2022052200/55964a7d1a28ab781d8b466c/html5/thumbnails/9.jpg)
Media muestral – Distribución de probabilidad
![Page 10: ESTADISTICA (II Bimestre Abril agosto 2011)](https://reader034.vdocuments.site/reader034/viewer/2022052200/55964a7d1a28ab781d8b466c/html5/thumbnails/10.jpg)
c. Media de la distribución muestral de la media
![Page 11: ESTADISTICA (II Bimestre Abril agosto 2011)](https://reader034.vdocuments.site/reader034/viewer/2022052200/55964a7d1a28ab781d8b466c/html5/thumbnails/11.jpg)
Comparar
La dispersión de la distribución muestral de las medias esmenor que la dispersión de los valores de la población
![Page 12: ESTADISTICA (II Bimestre Abril agosto 2011)](https://reader034.vdocuments.site/reader034/viewer/2022052200/55964a7d1a28ab781d8b466c/html5/thumbnails/12.jpg)
Comparar
La dispersión de la distribución muestral de las medias esmenor que la dispersión de los valores de la población
![Page 13: ESTADISTICA (II Bimestre Abril agosto 2011)](https://reader034.vdocuments.site/reader034/viewer/2022052200/55964a7d1a28ab781d8b466c/html5/thumbnails/13.jpg)
Preguntas Objetivas
( ) La media de las medias de lasmuestras es exactamente igual a lamedia de la población
( ) La dispersión de la distribuciónmuestral de la media es más estrechaque la distribución poblacional
![Page 14: ESTADISTICA (II Bimestre Abril agosto 2011)](https://reader034.vdocuments.site/reader034/viewer/2022052200/55964a7d1a28ab781d8b466c/html5/thumbnails/14.jpg)
UNIDAD 6
PRUEBA DE HIPOTESIS PARA DOS MUESTRAS
![Page 15: ESTADISTICA (II Bimestre Abril agosto 2011)](https://reader034.vdocuments.site/reader034/viewer/2022052200/55964a7d1a28ab781d8b466c/html5/thumbnails/15.jpg)
Afirmación relativa a un parámetro de lapoblación sujeta a verificación
Hipótesis
Se establecen las hipótesis nula (H0) y alternativa (H1)
Se selecciona un nivel de
significancia (α)
Se identifica el estadístico de
prueba
Se formula una
regla para tomar
decisiones
Se toma una muestra, se llega
a una decisión
No se rechaza H0Se rechaza H0
Se acepta H1
Procedimiento para probar una hipótesis
![Page 16: ESTADISTICA (II Bimestre Abril agosto 2011)](https://reader034.vdocuments.site/reader034/viewer/2022052200/55964a7d1a28ab781d8b466c/html5/thumbnails/16.jpg)
Formule hipótesis nula (H0) y alternativa (H1)
Ejemplo (pag 371): Los clientes de un supermercado tienen laopción de pagar en una caja registradora normal operada por uncajero o emplear un nuevo procedimiento llamado U-Scan. Lagerente necesita saber si el tiempo medio de pago con el método
tradicional es mayor que con U-scan.
Tipo Cliente Media Muestral
Desviación estándar de la
población
Tamaño de la muestra
Tradicional 5.50 min 0.40 min 50
U-Scan 5.30 min 0.30 min 100
![Page 17: ESTADISTICA (II Bimestre Abril agosto 2011)](https://reader034.vdocuments.site/reader034/viewer/2022052200/55964a7d1a28ab781d8b466c/html5/thumbnails/17.jpg)
Determine el estadístico de prueba
Seleccione el nivel de significancia (α)
Debido a que se conoce las desviaciones estándar se emplea el estadístico Z
Formule una regla de decisión
![Page 18: ESTADISTICA (II Bimestre Abril agosto 2011)](https://reader034.vdocuments.site/reader034/viewer/2022052200/55964a7d1a28ab781d8b466c/html5/thumbnails/18.jpg)
Tome la decisión respecto de H0 e interprete el resultado
13.3064.0
2.0
100
30.0
50
40.0
3.55.5
22
22
u
u
s
s
us
nn
XXz
Se rechaza H0, el método U-scan es mas rápido
![Page 19: ESTADISTICA (II Bimestre Abril agosto 2011)](https://reader034.vdocuments.site/reader034/viewer/2022052200/55964a7d1a28ab781d8b466c/html5/thumbnails/19.jpg)
UNIDAD 7
ANÁLISIS DE VARIANZA
![Page 20: ESTADISTICA (II Bimestre Abril agosto 2011)](https://reader034.vdocuments.site/reader034/viewer/2022052200/55964a7d1a28ab781d8b466c/html5/thumbnails/20.jpg)
Distribución F
Continua
No puede ser
negativos
Tiene sesgo
positivo
Esasintótica
Comparar si dos muestras que provienen de diferentes poblaciones tienen varianzas iguales
Comparar varias medias poblaciones en forma simultanea (ANOVA)
![Page 21: ESTADISTICA (II Bimestre Abril agosto 2011)](https://reader034.vdocuments.site/reader034/viewer/2022052200/55964a7d1a28ab781d8b466c/html5/thumbnails/21.jpg)
Tabla ANOVAFuente devariación
Suma de cuadrados
Grados de libertad
Media cuadrática F
Tratamiento
Aleatorio -Error
Total
Análisis de la varianza (ANOVA)
Poblaciones
Independientes
Igual desviación estándar σ
![Page 22: ESTADISTICA (II Bimestre Abril agosto 2011)](https://reader034.vdocuments.site/reader034/viewer/2022052200/55964a7d1a28ab781d8b466c/html5/thumbnails/22.jpg)
Ejemplo: Citrus Clean es un nuevo limpiador multiusos a
prueba en el mercado, y se han colocado exhibidores en treslugares distintos dentro de varios supermercados. A continuaciónse reporta la cantidad de botellas de 12onzas vendidas en cadalugar del supermercado
Cerca del pan 18 14 19 17
Cerca de las cervezas 12 18 10 16
Cerca de otros limpiadores 26 28 30 32
Con un nivel de significancia de 0.05. ¿Hay alguna diferencia en elnúmero medio de botellas vendidas en los tres lugares?
![Page 23: ESTADISTICA (II Bimestre Abril agosto 2011)](https://reader034.vdocuments.site/reader034/viewer/2022052200/55964a7d1a28ab781d8b466c/html5/thumbnails/23.jpg)
a. Formule la hipótesis nula y alternativaEl número medio de botellas vendido en los tres lugares es el
mismoH0 : µ1 = µ2 = µ3H1 : Número medio de botellas vendido no es el mismo
b. Regla de decisión
Grados de libertad en el numerador : k - 1 = 3 - 1 = 2
Grados de libertad en el denominador: n - k = 12 - 3 = 9Apéndice B.4 pag. 7884.26Rechaza H0 si F > 4.26
![Page 24: ESTADISTICA (II Bimestre Abril agosto 2011)](https://reader034.vdocuments.site/reader034/viewer/2022052200/55964a7d1a28ab781d8b466c/html5/thumbnails/24.jpg)
c. Calcule los valores de SS total
• X cada observación de la muestra
• media global total
d. Calcule los valores de SSE
• X cada observación de la muestra
• media muestral para el tratamiento c
![Page 25: ESTADISTICA (II Bimestre Abril agosto 2011)](https://reader034.vdocuments.site/reader034/viewer/2022052200/55964a7d1a28ab781d8b466c/html5/thumbnails/25.jpg)
d. Calcule los valores de SSECerca del pan Cerca de las cervezas Cerca de otros limpiadores
18 12 26
14 18 28
19 10 30
17 16 32
17 14 29
![Page 26: ESTADISTICA (II Bimestre Abril agosto 2011)](https://reader034.vdocuments.site/reader034/viewer/2022052200/55964a7d1a28ab781d8b466c/html5/thumbnails/26.jpg)
d. Calcule los valores de SST
e. Elabore una tabla ANOVA
Fuente devariación
Suma de cuadrados
Grados de libertad
Media cuadrática F
Tratamiento SST= 504 k – 1 = 2 SST/( k - 1)= 25230.65Aleatorio -Error SSE=74 n – k = 9 SSE/(n - k) = 8.22
Total SST=578 11
Conclusión:H0 se rechazo debido a que F > 4.26Hay una diferencia en el número medio de botellas vendidas en lasdistintas ubicaciones
![Page 27: ESTADISTICA (II Bimestre Abril agosto 2011)](https://reader034.vdocuments.site/reader034/viewer/2022052200/55964a7d1a28ab781d8b466c/html5/thumbnails/27.jpg)
UNIDAD VIII
MÉTODOS NO PARAMÉTRICOSJI CUADRADO
![Page 28: ESTADISTICA (II Bimestre Abril agosto 2011)](https://reader034.vdocuments.site/reader034/viewer/2022052200/55964a7d1a28ab781d8b466c/html5/thumbnails/28.jpg)
Nunca negativo
Tiene sesgo positivo
Existe una familia de
distribuciones de ji cuadradas
(k – 1 )
La distribución se aproxima a distribución
normal
Características distribución ji cuadrada
![Page 29: ESTADISTICA (II Bimestre Abril agosto 2011)](https://reader034.vdocuments.site/reader034/viewer/2022052200/55964a7d1a28ab781d8b466c/html5/thumbnails/29.jpg)
Estadístico de prueba ji cuadrado
• fo frecuencia observada en una categoría en particular
• fe frecuencia esperada en una categoría en particular
Prueba de bondad de ajuste
Comparar una distribución observada con una distribuciónesperada
![Page 30: ESTADISTICA (II Bimestre Abril agosto 2011)](https://reader034.vdocuments.site/reader034/viewer/2022052200/55964a7d1a28ab781d8b466c/html5/thumbnails/30.jpg)
Prueba de bondad de ajuste: fe iguales
Ejemplo: La directora de recursos humanos de una empresa,
está preocupada por el ausentismo entre los trabajadores por hora,por lo que decide tomar una muestra de los registros de lacompañía y determinar si el ausentismo está distribuido de manerauniforme en toda la semana de seis días. Las hipótesis son:
H0: El ausentismo está distribuido de manera uniforme en todala semana de trabajo
H1: Es ausentismo no está distribuido de manera uniforme entoda la semana de trabajo
![Page 31: ESTADISTICA (II Bimestre Abril agosto 2011)](https://reader034.vdocuments.site/reader034/viewer/2022052200/55964a7d1a28ab781d8b466c/html5/thumbnails/31.jpg)
Los resultados de la muestra son
Día Número de ausencias
Lunes 12
Martes 9
Miércoles 11
Jueves 10
Viernes 9
Sábado 9
a. ¿Cómo se denominan los números 12,9,11,10,9,9 ycuántas celdas o categorías hay?
Frecuencias observadas y hay seis celdas (días de la semana)
![Page 32: ESTADISTICA (II Bimestre Abril agosto 2011)](https://reader034.vdocuments.site/reader034/viewer/2022052200/55964a7d1a28ab781d8b466c/html5/thumbnails/32.jpg)
Día Número de ausencias
Lunes 12
Martes 9
Miércoles 11
Jueves 10
Viernes 9
Sábado 9
fe 60/6=10
b. ¿Cuál es la frecuencia esperada para cada día?
c. ¿Cuántos grados de libertad hay?gl = k -1 = 6 – 1 = 5
![Page 33: ESTADISTICA (II Bimestre Abril agosto 2011)](https://reader034.vdocuments.site/reader034/viewer/2022052200/55964a7d1a28ab781d8b466c/html5/thumbnails/33.jpg)
d. ¿Cuál es el valor crítico de ji cuadrado con un nivelde significancia de 1%?Apéndice B.3 pag. 787
Grados de libertad Área de Cola Derecha
![Page 34: ESTADISTICA (II Bimestre Abril agosto 2011)](https://reader034.vdocuments.site/reader034/viewer/2022052200/55964a7d1a28ab781d8b466c/html5/thumbnails/34.jpg)
e. Calcule el estadístico de prueba
Día Número de ausencias
Lunes 12
Martes 9
Miércoles 11
Jueves 10
Viernes 9
Sábado 9
fe 60/6=10
Conclusión:No se rechaza H0El ausentismo se distribuye de manera uniforme durante la semana
![Page 35: ESTADISTICA (II Bimestre Abril agosto 2011)](https://reader034.vdocuments.site/reader034/viewer/2022052200/55964a7d1a28ab781d8b466c/html5/thumbnails/35.jpg)
UNIDAD IX
CORRELACIÓN Y REGRESIÓN LINEAL
![Page 36: ESTADISTICA (II Bimestre Abril agosto 2011)](https://reader034.vdocuments.site/reader034/viewer/2022052200/55964a7d1a28ab781d8b466c/html5/thumbnails/36.jpg)
Análisis de Correlación
Grupo de técnicas para medir la asociación entre dos variables
Variable Independiente: Se representa en el eje X y es la variableempleada como estimador
Variable Dependiente: Se representa en el eje Y y es la variable porestimar o predecir
![Page 37: ESTADISTICA (II Bimestre Abril agosto 2011)](https://reader034.vdocuments.site/reader034/viewer/2022052200/55964a7d1a28ab781d8b466c/html5/thumbnails/37.jpg)
Análisis de Correlación
Grupo de técnicas para medir la asociación entre dos variables
Variable Independiente: Se representa en el eje X y es la variableempleada como estimador
Variable Dependiente: Se representa en el eje Y y es la variable porestimar o predecir
![Page 38: ESTADISTICA (II Bimestre Abril agosto 2011)](https://reader034.vdocuments.site/reader034/viewer/2022052200/55964a7d1a28ab781d8b466c/html5/thumbnails/38.jpg)
Coeficiente de Correlación
Medida de la fuerza de la
relación lineal entre dos variables
r = 0, no hay
asociación entre ellas
r = 1 indica una asociación directa entre las variables
R = -1 indica una
asociación inversa
entre las variables
Varia de -1 a +1
![Page 39: ESTADISTICA (II Bimestre Abril agosto 2011)](https://reader034.vdocuments.site/reader034/viewer/2022052200/55964a7d1a28ab781d8b466c/html5/thumbnails/39.jpg)
Ejemplo: Una empresa americana vende copiadoras de todo tamaño. La nuevagerente nacional de ventas desea saber la relación entre el número de llamadas deventas y el número de copiadoras vendidas. Selecciona una muestra aleatoria de 10representantes, como se se observa en la tabla. ¿Qué observaciones cabe hacerrespecto de la relación entre el número de llamadas de venta y el número decopiadoras vendidas?
![Page 40: ESTADISTICA (II Bimestre Abril agosto 2011)](https://reader034.vdocuments.site/reader034/viewer/2022052200/55964a7d1a28ab781d8b466c/html5/thumbnails/40.jpg)
G R A C I A S
![Page 41: ESTADISTICA (II Bimestre Abril agosto 2011)](https://reader034.vdocuments.site/reader034/viewer/2022052200/55964a7d1a28ab781d8b466c/html5/thumbnails/41.jpg)