proyecto estadística espol 2 parcial
DESCRIPTION
ESPOL, Algunas Características de los Estudiantes de Estadística para Ingenierías: Un Análisis EstadísticoTRANSCRIPT
qwertyuiopasdfghjklzxcvbnmqwerty
uiopasdfghjklzxcvbnmqwertyuiopasd
fghjklzxcvbnmqwertyuiopasdfghjklzx
cvbnmqwertyuiopasdfghjklzxcvbnmq
wertyuiopasdfghjklzxcvbnmqwertyui
opasdfghjklzxcvbnmqwertyuiopasdfg
hjklzxcvbnmqwertyuiopasdfghjklzxc
vbnmqwertyuiopasdfghjklzxcvbnmq
wertyuiopasdfghjklzxcvbnmqwertyui
opasdfghjklzxcvbnmqwertyuiopasdfg
hjklzxcvbnmqwertyuiopasdfghjklzxc
vbnmqwertyuiopasdfghjklzxcvbnmq
wertyuiopasdfghjklzxcvbnmqwertyui
opasdfghjklzxcvbnmqwertyuiopasdfg
hjklzxcvbnmrtyuiopasdfghjklzxcvbn
mqwertyuiopasdfghjklzxcvbnmqwert
yuiopasdfghjklzxcvbnmqwertyuiopas
dfghjklzxcvbnmqwertyuiopasdfghjklz
ESCUELA SUPERIOR POLITÉCNICA DEL LITORAL
INSTITUTO DE CIENCIAS MATEMÁTICAS
“ESPOL, Algunas Características de los Estudiantes de Estadística para
Ingenierías: Un Análisis Estadístico”
2
CONTENIDO
Contenido CONTENIDO ............................................................................................................................................. 2
1. INTRODUCCIÓN ........................................................................................................................... 3
1.1. DE QUÉ SE TRATA EL PROYECTO .................................................................................................... 3
1.2. OBJETIVO ........................................................................................................................................ 3
1.3. MARCO TEÓRICO ............................................................................................................................ 3
2. ANÁLISIS ESTADÍSTICO ......................................................................................................... 6
2.1 TABLA DE FRECUENCIAS .......................................................................................................................... 7
2.2 GRÁFICOS DE LAS VARIABLES ................................................................................................................ 11
2.3 MEDIDAS DE TENDENCIA CENTRAL, DISPERSIÓN, POSICIÓN Y SESGO ..................................................... 23
3. MATRIZ DE COVARIANZAS Y CORRELACIÓN .................................................................. 59
3.1 DETERMINACIÓN DE LA MATRIZ DE VARIANZAS Y COVARIANZAS MUESTRAL S .................................. 59
3.2 DETERMINACIÓN DE LA MATRIZ DE CORRELACIÓN MUESTRAL R. ........................................................ 60
4. ESTADÍSTICA INFERENCIAL ................................................................................................. 61
4.1 INTERVALOS DE CONFIANZA .................................................................................................................. 61
4.2 PRUEBAS DE HIPÓTESIS PARA MEDIAS. ................................................................................................... 70
4.3 INTERVALOS DE CONFIANZA VARIANZAS ............................................................................................... 75
4.4 PRUEBAS DE HIPÓTESIS PARA VARIANZAS ............................................................................................. 81
4.5 BONDAD DE AJUSTE ............................................................................................................................... 87
4.6 TABLAS DE CONTINGENCIA .................................................................................................................... 94
5. CONCLUSIONES........................................................................................................................ 101
6. RECOMENDACIONES ............................................................................................................... 102
7. BIBLIOGRAFÍA .......................................................................................................................... 103
3
1. Introducción
1.1. De qué se trata el proyecto
Al comienzo del semestre a todos los alumnos que cursábamos estadística nos hicieron llenar un
formulario en el que nos preguntaba cosas de cada uno como nuestros gustos o información
personal; con todos los formularios se obtuvo una población de 305 (estudiantes) de las cuales
tomamos una muestra de 100 y de esta muestra hicimos el respectivo análisis de algunas de
estas preguntas (variables).
1.2. Objetivo
Poder diferenciar entre Población y Muestra además de, Parámetro Poblacional y Estimadores
Muéstrales.
Utilizar los conocimientos adquiridos en clase para realizar los diferentes literales que se piden
en el proyecto.
Desarrollar habilidades de análisis crítico y matemático en la materia de ESTADÍSTICA.
Realizar proyectos estadísticos de carácter serio y beneficioso para la sociedad.
1.3. Marco teórico
En el proyecto que se presenta a continuación se va a constar de diferentes términos estadísticos
los cuales, debemos tener muy claro su definición.
Entre estos tenemos:
Población
El concepto de población en estadística va más allá de lo que comúnmente se conoce como tal.
Una población se precisa como un conjunto finito o infinito de personas u objetos que presentan
características comunes.
En este caso la población consistirá en 270 elementos que crearemos a partir de la formula
proporcionada por el ejercicio.
El tamaño que tiene una población es un factor de suma importancia en el proceso de
investigación estadístico, y este tamaño vienen dado por el número de elementos que constituye
una población puede ser finita o infinita. Cuando el número de elementos que integra una
población es muy grande, se puede considerar a esta como una población infinita, por ejemplo;
el conjunto de todos los números positivos. Una población finita es aquella que está formada
por un limitado número de elementos.
Es a menudo imposible o poco práctico observar la totalidad de los individuos, sobre todos si
estos son muchos. En lugar de examinar el grupo entero llamado población o universo, se
examina una pequeña parte del grupo llamada muestra.
4
Muestra
Se llama muestra a una parte de la población a estudiar qué sirve para representarla.
El estudio de muestras es más sencillo que el estudio de la población completa; cuesta menos y
lleva menos tiempo. Por último se aprobado que el examen de una población entera todavía
permite la aceptación de elementos defectuosos, por tanto, en algunos casos, el muestreo puede
elevar el nivel de calidad.
En nuestro caso, tomaremos una muestra de 100 elementos escogidos al azar para realizar el
estudio además de establecer una relación entre la muestra y la población a fin de comparar
datos y encontrar alguna tendencia si es que esta existe.
Una muestra representativa contiene las características relevantes de la población en las mismas
proporciones que están incluidas en tal población.
Los expertos en estadística recogen datos de una muestra. Utilizan esta información para hacer
referencia sobre la población que está representada por la muestra.
En consecuencia muestra y población son conceptos relativos. Una población es un todo y una
muestra es una fracción o segmento de ese todo.
Variable Aleatoria
Este es un elemento muy importante en nuestro proyecto ya que nos permitirá realizar estudios
tanto a la población como a la muestra. En nuestro proyecto procederemos a trabajar con tres
diferentes variables aleatorias.
Una variable aleatoria es aquella que asume diferentes valores a consecuencia de los resultados
de un experimento aleatorio.
Estas variables pueden ser discretas o continuas. Si se permite que una variable aleatoria adopte
solo un número limitado de valores, se le llama variable aleatoria discreta. por el contrario, si se
le permite asumir cualquier valor dentro de determinados límites, recibe el nombre de variable
aleatoria continua.
Función de probabilidad
Una distribución la podemos concebir con una distribución teórica de frecuencia, es decir, es
una distribución que describe como se espera que varíen los resultados. Dado que esta clase de
distribuciones se ocupan de las expectativas son modelos de gran utilidad para hacer inferencias
y tomar decisiones en condiciones de incertidumbre.
Media
En estadística, la media es una medida de centralización. Se llama media de una distribución de
estadística a la media aritmética de los valores de los distintos individuos que la componen.
Varianza
Esta medida se basa en la cuantificación de las distintas de los datos con respecto al valor de la
media.
5
Moda
Es el valor que ocurre con mayor frecuencia en una muestra puede ser que no exista la moda y
también es posible que exista más de una moda.
Mediana
Una mediana es el valor de la variable que deja el mismo número de datos antes y después que
él una vez ordenados estos.
Matriz correlación
Es una representación ordenada de los coeficientes de correlación de cada variable con la otra
variable y consigo misma.
Histograma
Es la manera más común de representar gráficamente la distribución de frecuencias de los datos.
Se lo construye dibujando rectángulos cuya base corresponda a cada intervalo de clase y su
altura, según el valor de la frecuencia.
Diagrama de Caja
Es un diagrama grafico que se usa para expresar en forma resumida, algunas medidas
estadísticas de posición.
El diagrama de caja describe gráficamente el rango de los datos, el rango intercuartílico, los
valores extremos y la ubicación de los cuartiles. Es una representación útil para comparar
grupos de datos.
Intervalos de Confianza
Un intervalo de confianza es un rango de valores (calculado en una muestra) en el cual se
encuentra el verdadero valor del parámetro, con una probabilidad determinada. La probabilidad
de que el verdadero valor del parámetro se encuentre en el intervalo construido se denomina
nivel de confianza.
Nivel de significancia
La probabilidad de equivocarnos se llama nivel de significancia.
Variables cualitativas
Son las variables que expresan distintas cualidades, características o modalidad. Cada
modalidad que se presenta se denomina atributo o categoría y la medición consiste en una
clasificación de dichos atributos. Las variables cualitativas pueden ser ordinales y nominales.
Las variables cualitativas pueden ser dicotómicas cuando sólo pueden tomar dos valores
posibles como sí y no, hombre y mujer o son politómicas cuando pueden adquirir tres o más
valores. Dentro de ellas podemos distinguir:
6
Variable cualitativa ordinal: También llamada variable cuasi cuantitativa. La variable
puede tomar distintos valores ordenados siguiendo una escala establecida, aunque no es
necesario que el intervalo entre mediciones sea uniforme, por ejemplo: leve, moderado,
grave.
Variable cualitativa nominal: En esta variable los valores no pueden ser sometidos a un
criterio de orden como por ejemplo los colores o el lugar de residencia.
Variables cuantitativas
Son las variables que se expresan mediante cantidades numéricas. Las variables cuantitativas
además pueden ser:
Variable discreta: Es la variable que presenta separaciones o interrupciones en la escala
de valores que puede tomar. Estas separaciones o interrupciones indican la ausencia de
valores entre los distintos valores específicos que la variable pueda asumir. Ejemplo: El
número de hijos (1, 2, 3, 4, 5).
Variable continua: Es la variable que puede adquirir cualquier valor dentro de un
intervalo especificado de valores. Por ejemplo la masa (2,3 kg, 2,4 kg, 2,5 kg,) o la altura
(1,64 m, 1,65 m, 1,66 m, ), que solamente está limitado por la precisión del aparato
medidor, en teoría permiten que siempre exista un valor entre dos cualesquiera.
2. Análisis Estadístico
NOMBRES Y CARACTERISTICAS DE LAS VARIABLES DE INTERES
Para nuestro análisis hemos escogido variables del tipo cualitativo y cuantitativo.
Nombres de las variables:
Sexo
Edad
Peso
Estatura
Materias tomadas
Materias aprobadas
Redes sociales
Horas semanales que utiliza la computadora
Minutos en llegar a la ESPOL
Horas semanales de ver televisión
Horas semanales que utiliza el internet
Internet en casa
7
2.1 Tabla de Frecuencias
Tabla de Frecuencia de la edad. (k=6)
0
Clases
Marca de
Clase
Frecuencia
Absoluta(f
)
Frecuencia
Relativa(f/n)
F. Absoluta
Acumulada(F)
F. Relativa
Acumulada(F/n)
1 [ 19 21 ) 20 52 0.52 52 0.52
2 [ 21 23 ) 22 32 0.32 84 0.84
3 [ 23 25 ) 24 12 0.12 96 0.96
4 [ 25 27 ) 26 2 0.02 98 0.98
5 [ 27 29 ) 28 1 0.01 99 0.99
6 [ 29 31 ) 30 1 0.01 100 1
Tabla de Frecuencia de la estatura (k=6)
Clases
Marca
de
Clase
Frecuencia
Absoluta(f
)
Frecuencia
Relativa(f/n)
F. Absoluta
Acumulada(F)
F. Relativa
Acumulada(F/n)
1 [ 152 158.5 ) 155.25 5 0.05 5 0.5
2 [158.5 165 ) 161.7 12 0.12 17 0.17
3 [165 171.5 ) 168.25 37 0.37 54 0.54
4 [171.5 178 ) 174.75 28 0.28 82 0.82
5 [178 184.5 ) 181.25 15 0.15 97 0.97
6 [184.5 191 ) 187.75 3 0.03 100 1
Tabla de Frecuencia de peso. (k=6)
8
Clases
Marca
de
Clase
Frecuencia
Absoluta(f
)
Frecuencia
Relativa(f/n)
F. Absoluta
Acumulada(F)
F. Relativa
Acumulada(F/n)
1 [ 48.63 59.63 ) 54.13 21 0.21 21 0.21
2 [59.63 70.63) 65.13 38 0.38 59 0.59
3 [70.63 81.63) 76.13 23 0.23 82 0.82
4 [81.63 92.63 ) 87.13 14 0.14 96 0.96
5 [92.63 103.63 ) 98.13 1 0.01 97 0.97
6 [103.63 114.63) 109.13 3 0.03 100 1
Tabla de Frecuencia de las materias aprobadas (k=6)
Clases
Marca de
Clase
Frecuencia
Absoluta(f
)
Frecuencia
Relativa(f/n)
F. Absoluta
Acumulada(F)
F. Relativa
Acumulada(F/n)
1 [ 12 20 ) 16 25 0.25 25 0.25
2 [ 20 28 ) 24 50 0.50 75 0.75
3 [ 28 36 ) 32 13 0.13 88 0.88
4 [ 36 44 ) 40 4 0.04 92 0.92
5 [ 44 52 ) 48 4 0.04 96 0.96
6 [ 52 60 ) 56 4 0.04 100 1
Tabla de Frecuencia de horas computador. (k=6)
Clases
Marca de
Clase
Frecuencia
Absoluta(f
)
Frecuencia
Relativa(f/n)
F. Absoluta
Acumulada(F)
F. Relativa
Acumulada(F/n)
1 [ 0.5 3.5 ) 2 59 0.59 59 0.59
2 [ 3.5 6.5) 5 33 0.33 92 0.92
3 [ 6.5 9.5 ) 8 5 0.05 97 0.97
4 [ 9.5 12.5 ) 11 2 0.02 99 0.99
5 [ 12.5 15.5 ) 14 0 0 99 0.99
6 [ 15.5 18.5 ) 17 1 0.01 100 1
9
Tabla de Frecuencia de minutos a llegar (k=6)
Clases
Marca de
Clase
Frecuencia
Absoluta(f
)
Frecuencia
Relativa(f/n)
F. Absoluta
Acumulada(F)
F. Relativa
Acumulada(F/n)
1 [ 15 38) 26.5 31 0.31 31 0.31
2 [ 38 61) 49.5 52 0.52 83 0.83
3 [ 61 84 ) 72.5 7 0.07 90 0.90
4 [84 107) 95.5 6 0.06 96 0.96
5 [ 107 130 ) 118.5 3 0.03 99 0.99
6 [ 130 153 ) 141.5 1 0.01 100 1
Tabla de Frecuencia de horas internet. (k=6)
Clases
Marca de
Clase
Frecuencia
Absoluta(f
)
Frecuencia
Relativa(f/n)
F. Absoluta
Acumulada(F)
F. Relativa
Acumulada(F/n)
1 [ 1 11) 5.5 43 0.43 43 0.43
2 [ 11 22) 16.5 33 0.33 76 0.76
3 [ 22 33) 27.5 13 0.13 89 0.89
4 [ 33 44 ) 38.5 7 0.07 96 0.96
5 [ 44 55 ) 49.5 2 0.02 98 0.98
6 [ 55 66 ) 60.5 2 0.02 100 1
Tabla de Frecuencia de materias en semestre. (k=6)
10
Clases
Marca de
Clase
Frecuencia
Absoluta(f
)
Frecuencia
Relativa(f/n)
F. Absoluta
Acumulada(F)
F. Relativa
Acumulada(F/n)
1 [ 2 3) 2.5 2 0.02 2 0.02
2 [ 3 4) 3.5 12 0.12 14 0.14
3 [ 4 5) 4.5 18 0.18 32 0.32
4 [ 5 6 ) 5.5 23 0.23 55 0.55
5 [ 6 7 ) 6.5 33 0.33 88 0.88
6 [ 7 8 ) 7.5 12 0.12 100 1
Tabla de Frecuencia de horas televisión. (k=6)
Clases
Marca de
Clase
Frecuencia
Absoluta(f
)
Frecuencia
Relativa(f/n)
F. Absoluta
Acumulada(F)
F. Relativa
Acumulada(F/n)
1 [ 0 7) 3.5 37 0.37 37 0.37
2 [ 7 14) 10.5 26 0.26 63 0.63
3 [ 14 21) 17.5 18 0.18 81 0.81
4 [ 21 28) 24.5 7 0.07 88 0.88
5 [ 28 35 ) 31.5 10 0.10 98 0.98
6 [ 35 42 ) 38.5 2 0.02 100 1
11
2.2 Gráficos de las variables
VARIABLE GÉNERO
La variable es cualitativa de carácter nominal, identificada por el sexo de los individuos
entrevistados. En nuestra muestra se presenta una ligera mayoría de hombres.
VARIABLE INTERNET EN CASA
Esta variable es cualitativa, podemos observar la grafica, en donde notamos claramente que la
mayoría de personas de esta muestra si tiene internet en su casa con un porcentaje del 73% y un
27% que no tiene.
87%
13%
Genero
masculino Femenino
SI73%
NO27%
Internet en casa
12
VARIABLE REDES SOCIALES
Esta variable es cualitativa, donde podemos observar que la grafica que la muestra tomada la
mayoría de personas tiene cuenta de facebook y que solo un 5% no tienen ninguna cuenta en
ninguna red social.
45%
11%
30%
9%
5%
REDES SOCIALES
FACEBOOK TWITTER Hi5 OTRAS NINGUNA
SI 87%
NO13%
SI 58%
NO42%
HI5
13
SI 22%
NO78%
SI 18%
NO82%
OTRAS
SI 9%
NO91%
NINGUNA
14
GRAFICAS DE LA VARIABLE EDAD
302826242220
40
30
20
10
0
Edad
Fre
cu
en
cia
Histograma de Edad
302826242220
Edad
Gráfica de caja de Edad
30282624222018
100
80
60
40
20
0
2Edad
Po
rce
nta
je a
cu
mu
lad
o
Media 20,94
Desv.Est. 1,895
N 100
Normal
Histograma de Edad
15
GRAFICAS DE LA VARIABLE PESO
1101009080706050
18
16
14
12
10
8
6
4
2
0
Peso
Fre
cu
en
cia
Histograma de Peso
120110100908070605040
Peso
Gráfica de caja de Peso
110100908070605040
100
80
60
40
20
0
5Peso
Po
rce
nta
je a
cu
mu
lad
o
Media 70,09
Desv.Est. 13,16
N 98
Normal
Histograma de Peso
16
GRAFICAS DE LA VARIABLE ESTATURA
190185180175170165160155
20
15
10
5
0
Estatura
Fre
cu
en
cia
Histograma de Estatura
190180170160150
Estatura
Gráfica de caja de Estatura
190185180175170165160155
100
80
60
40
20
0
4Estatura
Po
rce
nta
je a
cu
mu
lad
o
Media 170,7
Desv.Est. 7,395
N 100
Normal
Histograma de Estatura
17
GRAFICAS DE LA VARIABLE MATERIAS APROBADAS
564840322416
25
20
15
10
5
0
Materias_Aprobadas
Fre
cu
en
cia
Histograma de Materias_Aprobadas
605040302010
Materias_Aprobadas
Gráfica de caja de Materias_Aprobadas
5648403224168
100
80
60
40
20
0
8Materias_Aprobadas
Po
rce
nta
je a
cu
mu
lad
o
Media 25,05
Desv.Est. 10,11
N 99
Histograma de 8Materias_AprobadasNormal
18
GRAFICAS DE LA VARIABLE MATERIAS SEMESTRE
765432
35
30
25
20
15
10
5
0
Materias_Semestre
Fre
cu
en
cia
Histograma de Materias_Semestre
765432
Materias_Semestre
Gráfica de caja de Materias_Semestre
8765432
100
80
60
40
20
0
9Materias_Semestre
Po
rce
nta
je a
cu
mu
lad
o
Media 5,081
Desv.Est. 1,291
N 99
Histograma de 9Materias_SemestreNormal
19
GRAFICAS DE LA VARIABLE MINUTOS LLEGAR A LA ESPOL
14012010080604020
25
20
15
10
5
0
Minutos_llegar
Fre
cu
en
cia
Histograma de Minutos_llegar
160140120100806040200
Minutos_llegar
Gráfica de caja de Minutos_llegar
1501209060300
100
80
60
40
20
0
8Minutos_llegar
Po
rce
nta
je a
cu
mu
lad
o
Media 49,57
Desv.Est. 24,67
N 99
Histograma de 8Minutos_llegarNormal
20
GRAFICAS DE LA VARIABLE HORAS COMPUTADOR
1815129630
40
30
20
10
0
Horas_Computador
Fre
cu
en
cia
Histograma de Horas_Computador
20151050
Horas_Computador
Gráfica de caja de Horas_Computador
1815129630
100
80
60
40
20
0
11Horas_Computador
Po
rce
nta
je a
cu
mu
lad
o
Media 3,451
Desv.Est. 2,477
N 99
Histograma de 11Horas_ComputadorNormal
21
GRAFICAS DE LA VARIABLE HORAS INTERNET
6050403020100
25
20
15
10
5
0
Horas_Internet
Fre
cu
en
cia
Histograma de Horas_Internet
6050403020100
Horas_Internet
Gráfica de caja de Horas_Internet
6050403020100-10
100
80
60
40
20
0
12Horas_Internet
Po
rce
nta
je a
cu
mu
lad
o
Media 16,57
Desv.Est. 13,29
N 98
Histograma de 12Horas_InternetNormal
22
GRAFICAS DE LA VARIABLE HORAS TELEVISION
37.530.022.515.07.50.0
18
16
14
12
10
8
6
4
2
0
Horas_Television
Fre
cu
en
cia
Histograma de Horas_Television
403020100
Horas_Television
Gráfica de caja de Horas_Television
37,530,022,515,07,50,0-7,5
100
80
60
40
20
0
13Horas_Television
Po
rce
nta
je a
cu
mu
lad
o
Media 11,96
Desv.Est. 9,598
N 100
Histograma de 13Horas_TelevisionNormal
23
2.3 Medidas de Tendencia central, dispersión, posición y sesgo
MEDIDAS DE TENDENCIA CENTRAL DE X
X=>Edades de Alumnos
302826242220
Mediana
Media
21,521,020,520,0
1er cuartil 20,000
Mediana 20,000
3er cuartil 22,000
Máximo 30,000
20,564 21,316
20,000 21,000
1,664 2,202
A -cuadrado 5,55
V alor P < 0,005
Media 20,940
Desv .Est. 1,895
V arianza 3,592
Sesgo 2,08611
Kurtosis 6,25379
N 100
Mínimo 19,000
Prueba de normalidad de A nderson-Darling
Interv alo de confianza de 95% para la media
Interv alo de confianza de 95% para la mediana
Interv alo de confianza de 95% para la desv iación estándarIntervalos de confianza de 95%
Resumen para 2Edad
Media
Mediana
0
Moda
Podemos decir que la media (aritmética) es
la cantidad total de la variable distribuida a
partes iguales entre cada observación.
24
DISPERSION DE LA VARIABLE X
Varianza
Desviación estándar
1,89477903
Coeficiente de Variación
0,090227
25
POSICION DE LA VARIABLE X
Percentil 95
=95.95
Percentil 35
=35.35
Decil 9
=90.9
Decil 2
=20.2
Decil 7
=70.7
Cuartil 1
=25.25
Cuartil 2
=50.50
Cuartil 3
=75.75
26
OTROS CALCULOS DE LA VARIABLE X
Coefciente de asimetría
Coeficiente de Kurtosis
6,25
Rango Intercuartil
Rango
Un resultado positivo
significa que la
distribución se sesga a la
izquierda.
El resultado muestra que se trata de
una distribución platicúrtica, es decir,
con una reducida concentración
alrededor de los valores centrales de la
distribución.
27
MEDIDAS DE TENDENCIA CENTRAL DE Y
Y=>Estatura de Alumnos
187,5180,0172,5165,0157,5
Mediana
Media
172171170169
1er cuartil 166,00
Mediana 170,00
3er cuartil 175,00
Máximo 190,00
169,22 172,16
169,00 172,00
6,49 8,59
A -cuadrado 0,52
V alor P 0,187
Media 170,69
Desv .Est. 7,39
V arianza 54,68
Sesgo -0,110671
Kurtosis 0,467159
N 100
Mínimo 152,00
Prueba de normalidad de A nderson-Darling
Interv alo de confianza de 95% para la media
Interv alo de confianza de 95% para la mediana
Interv alo de confianza de 95% para la desv iación estándarIntervalos de confianza de 95%
Resumen para 4Estatura
Media
Mediana
Moda
Podemos decir que la media (aritmética) es
la cantidad total de la variable distribuida a
partes iguales entre cada observación.
28
DISPERSION DE LA VARIABLE Y
Varianza
Desviación estándar
7,39
Coeficiente de Variación
4,33
29
POSICION DE LA VARIABLE Y
Percentil 95
=95.95
Percentil 35
=35.35
69
Decil 9
=90.9
Decil 2
=20.2
Decil 7
=70.7
Cuartil 1
=25.25
Cuartil 2
=50.50
70
Cuartil 3
=75.75
30
OTROS CALCULOS DE LA VARIABLE Y
Coefciente de asimetría
Coeficiente de Kurtosis
0,47
Rango Intercuartil
Rango
Un resultado negativo
significa que la
distribución se sesga a la
derecha.
El resultado muestra que se trata de
una distribución platicúrtica, es decir,
con una reducida concentración
alrededor de los valores centrales de la
distribución.
31
MEDIDAS DE TENDENCIA CENTRAL DE Z
Z=>Materias aprobadas
564840322416
Mediana
Media
27,025,524,022,521,0
1er cuartil 19,000
Mediana 23,000
3er cuartil 28,000
Máximo 57,000
23,035 27,067
21,000 24,000
8,869 11,752
A -cuadrado 4,95
V alor P < 0,005
Media 25,051
Desv .Est. 10,108
V arianza 102,171
Sesgo 1,53183
Kurtosis 2,11226
N 99
Mínimo 12,000
Prueba de normalidad de A nderson-Darling
Interv alo de confianza de 95% para la media
Interv alo de confianza de 95% para la mediana
Interv alo de confianza de 95% para la desv iación estándarIntervalos de confianza de 95%
Resumen para 8Materias_Aprobadas
Media
Mediana
Moda
Podemos decir que la media (aritmética) es
la cantidad total de la variable distribuida a
partes iguales entre cada observación.
32
DISPERSION DE LA VARIABLE Z
Varianza
Desviación estándar
10,11
Coeficiente de Variación
40,35
33
POSICION DE LA VARIABLE Z
Percentil 95
=95.95
Percentil 35
=35.35
1.35
Decil 9
=90.9
Decil 2
=20.2
7
Decil 7
=70.7
Cuartil 1
=25.25
Cuartil 2
=50.50
3
Cuartil 3
=75.75
34
OTROS CALCULOS DE LA VARIABLE Z
Coefciente de asimetría
Coeficiente de Kurtosis
2,11
Rango Intercuartil
Rango
Un resultado positivo
significa que la
distribución se sesga a la
izquierda.
El resultado muestra que se trata de
una distribución platicúrtica, es decir,
con una reducida concentración
alrededor de los valores centrales de la
distribución.
35
MEDIDAS DE TENDENCIA CENTRAL DE W
W=>Peso de alumnos
1101009080706050
Mediana
Media
72,070,569,067,566,0
1er cuartil 60,000
Mediana 69,000
3er cuartil 78,000
Máximo 113,000
67,455 72,733
66,130 72,000
11,543 15,317
A -cuadrado 0,74
V alor P 0,051
Media 70,094
Desv .Est. 13,163
V arianza 173,269
Sesgo 0,793666
Kurtosis 0,961248
N 98
Mínimo 48,630
Prueba de normalidad de A nderson-Darling
Interv alo de confianza de 95% para la media
Interv alo de confianza de 95% para la mediana
Interv alo de confianza de 95% para la desv iación estándarIntervalos de confianza de 95%
Resumen para 5Peso
Media
Mediana
Moda
Podemos decir que la media (aritmética) es
la cantidad total de la variable distribuida a
partes iguales entre cada observación.
36
DISPERSION DE LA VARIABLE W
Varianza
Desviación estándar
13,16
Coeficiente de Variación
18,78
37
POSICION DE LA VARIABLE W
Percentil 95
=95.95
Percentil 35
=35.35
1.35
Decil 9
=90.9
Decil 2
=20.2
Decil 7
=70.7
Cuartil 1
=25.25
Cuartil 2
=50.50
.5
Cuartil 3
=75.75
38
OTROS CALCULOS DE LA VARIABLE Z
Coefciente de asimetría
Coeficiente de Kurtosis
0,96
Rango Intercuartil
Rango
Un resultado positivo
significa que la
distribución se sesga a la
izquierda.
El resultado muestra que se trata de
una distribución platicúrtica, es decir,
con una reducida concentración
alrededor de los valores centrales de la
distribución.
39
MEDIDAS DE TENDENCIA CENTRAL DE V
V=>Horas de Computador
1815129630
Mediana
Media
4,03,53,02,52,0
1er cuartil 2,0000
Mediana 3,0000
3er cuartil 4,0000
Máximo 18,0000
2,9572 3,9452
2,0000 4,0000
2,1735 2,8798
A -cuadrado 4,22
V alor P < 0,005
Media 3,4512
Desv .Est. 2,4770
V arianza 6,1354
Sesgo 2,5721
Kurtosis 11,5608
N 99
Mínimo 0,5000
Prueba de normalidad de A nderson-Darling
Interv alo de confianza de 95% para la media
Interv alo de confianza de 95% para la mediana
Interv alo de confianza de 95% para la desv iación estándarIntervalos de confianza de 95%
Resumen para 11Horas_Computador
Media
Mediana
Moda
Podemos decir que la media (aritmética) es
la cantidad total de la variable distribuida a
partes iguales entre cada observación.
40
DISPERSION DE LA VARIABLE V
Varianza
Desviación estándar
2,477
Coeficiente de Variación
71,77
41
POSICION DE LA VARIABLE V
Percentil 95
=95.95
Percentil 35
=35.35
Decil 9
=90.9
Decil 2
=20.2
Decil 7
=70.7
Cuartil 1
=25.25
Cuartil 2
=50.50
3
Cuartil 3
=75.75
42
OTROS CALCULOS DE LA VARIABLE V
Coefciente de asimetría
Coeficiente de Kurtosis
11,56
Rango Intercuartil
Rango
Un resultado positivo
significa que la
distribución se sesga a la
izquierda.
El resultado muestra que se trata de
una distribución platicúrtica, es decir,
con una reducida concentración
alrededor de los valores centrales de la
distribución.
43
MEDIDAS DE TENDENCIA CENTRAL DE U
U=>Horas de Television
37,530,022,515,07,50,0
Mediana
Media
1412108
1er cuartil 5,000
Mediana 10,000
3er cuartil 19,750
Máximo 40,000
10,056 13,864
8,000 10,000
8,427 11,150
A -cuadrado 3,30
V alor P < 0,005
Media 11,960
Desv .Est. 9,598
V arianza 92,120
Sesgo 0,959289
Kurtosis 0,140496
N 100
Mínimo 0,000
Prueba de normalidad de A nderson-Darling
Interv alo de confianza de 95% para la media
Interv alo de confianza de 95% para la mediana
Interv alo de confianza de 95% para la desv iación estándarIntervalos de confianza de 95%
Resumen para 13Horas_Television
Media
Mediana
Moda
Podemos decir que la media (aritmética) es
la cantidad total de la variable distribuida a
partes iguales entre cada observación.
44
DISPERSION DE LA VARIABLE U
Varianza
Desviación estándar
9,598
Coeficiente de Variación
80,25
45
POSICION DE LA VARIABLE U
Percentil 95
=95.95
Percentil 35
=35.35
Decil 9
=90.9
Decil 2
=20.2
Decil 7
=70.7
Cuartil 1
=25.25
Cuartil 2
=50.50
3
Cuartil 3
=75.75
46
OTROS CALCULOS DE LA VARIABLE U
Coefciente de asimetría
Coeficiente de Kurtosis
0,14
Rango Intercuartil
Rango
Un resultado positivo
significa que la
distribución se sesga a la
izquierda.
El resultado muestra que se trata de
una distribución platicúrtica, es decir,
con una reducida concentración
alrededor de los valores centrales de la
distribución.
47
MEDIDAS DE TENDENCIA CENTRAL DE T
T=>Materias este Semestre
765432
Mediana
Media
6,005,755,505,255,00
1er cuartil 4,0000
Mediana 5,0000
3er cuartil 6,0000
Máximo 7,0000
4,8233 5,3383
5,0000 6,0000
1,1329 1,5010
A -cuadrado 3,36
V alor P < 0,005
Media 5,0808
Desv .Est. 1,2911
V arianza 1,6669
Sesgo -0,385466
Kurtosis -0,691492
N 99
Mínimo 2,0000
Prueba de normalidad de A nderson-Darling
Interv alo de confianza de 95% para la media
Interv alo de confianza de 95% para la mediana
Interv alo de confianza de 95% para la desv iación estándarIntervalos de confianza de 95%
Resumen para 9Materias_Semestre
Media
Mediana
Moda
Podemos decir que la media (aritmética) es
la cantidad total de la variable distribuida a
partes iguales entre cada observación.
48
DISPERSION DE LA VARIABLE T
Varianza
Desviación estándar
1,291
Coeficiente de Variación
25,41
49
POSICION DE LA VARIABLE T
Percentil 95
=95.95
Percentil 35
=35.35
Decil 9
=90.9
Decil 2
=20.2
Decil 7
=70.7
Cuartil 1
=25.25
Cuartil 2
=50.50
5
Cuartil 3
=75.75
50
OTROS CALCULOS DE LA VARIABLE T
Coefciente de asimetría
Coeficiente de Kurtosis
-0,69
Rango Intercuartil
Rango
Un resultado negativo
significa que la
distribución se sesga a la
derecha.
El resultado muestra que se trata de
una distribución platicúrtica, es decir,
con una reducida concentración
alrededor de los valores centrales de la
distribución.
51
MEDIDAS DE TENDENCIA CENTRAL DE S
S=>Horas Internet
6050403020100
Mediana
Media
1816141210
1er cuartil 6,000
Mediana 14,000
3er cuartil 21,750
Máximo 60,000
13,901 19,232
10,000 16,000
11,658 15,469
A -cuadrado 3,11
V alor P < 0,005
Media 16,566
Desv .Est. 13,294
V arianza 176,735
Sesgo 1,20845
Kurtosis 1,14876
N 98
Mínimo 1,000
Prueba de normalidad de A nderson-Darling
Interv alo de confianza de 95% para la media
Interv alo de confianza de 95% para la mediana
Interv alo de confianza de 95% para la desv iación estándarIntervalos de confianza de 95%
Resumen para 12Horas_Internet
Media
Mediana
Moda
Podemos decir que la media (aritmética) es
la cantidad total de la variable distribuida a
partes iguales entre cada observación.
52
DISPERSION DE LA VARIABLE S
Varianza
Desviación estándar
13,29
Coeficiente de Variación
80,25
53
POSICION DE LA VARIABLE S
Percentil 95
=95.95
Percentil 35
=35.35
Decil 9
=90.9
Decil 2
=20.2
Decil 7
=70.7
Cuartil 1
=25.25
Cuartil 2
=50.50
14.5
Cuartil 3
=75.75
54
OTROS CALCULOS DE LA VARIABLE S
Coefciente de asimetría
Coeficiente de Kurtosis
1,15
Rango Intercuartil
Rango
Un resultado positivo
significa que la
distribución se sesga a la
izquierda.
El resultado muestra que se trata de
una distribución platicúrtica, es decir,
con una reducida concentración
alrededor de los valores centrales de la
distribución.
55
MEDIDAS DE TENDENCIA CENTRAL DE R
R=>Minutos llegar a la ESPOL
14012010080604020
Mediana
Media
5652484440
1er cuartil 30,000
Mediana 45,000
3er cuartil 60,000
Máximo 150,000
44,646 54,485
40,000 45,000
21,643 28,676
A -cuadrado 3,54
V alor P < 0,005
Media 49,566
Desv .Est. 24,665
V arianza 608,371
Sesgo 1,52971
Kurtosis 3,06687
N 99
Mínimo 15,000
Prueba de normalidad de A nderson-Darling
Interv alo de confianza de 95% para la media
Interv alo de confianza de 95% para la mediana
Interv alo de confianza de 95% para la desv iación estándarIntervalos de confianza de 95%
Resumen para 8Minutos_llegar
Media
Mediana
Moda
Podemos decir que la media (aritmética) es
la cantidad total de la variable distribuida a
partes iguales entre cada observación.
56
DISPERSION DE LA VARIABLE R
Varianza
Desviación estándar
24,67
Coeficiente de Variación
49,76
57
POSICION DE LA VARIABLE R
Percentil 95
=95.95
Percentil 35
=35.35
Decil 9
=90.9
Decil 2
=20.2
Decil 7
=70.7
Cuartil 1
=25.25
Cuartil 2
=50.50
45
Cuartil 3
=75.75
58
OTROS CALCULOS DE LA VARIABLE R
Coefciente de asimetría
Coeficiente de Kurtosis
3,07
Rango Intercuartil
Rango
Un resultado positivo
significa que la
distribución se sesga a la
izquierda.
El resultado muestra que se trata de
una distribución platicúrtica, es decir,
con una reducida concentración
alrededor de los valores centrales de la
distribución.
59
3. Matriz de covarianzas y correlación
3.1 Determinación de la Matriz de Varianzas y Covarianzas Muestral S
Es una representación ordenada de las varianzas y las covarianzas entre las variables analizadas:
Matriz de Varianzas y Covarianzas Muestral S
Esta
tura Peso
Materias_
Aprobadas
Minutos
_llegar
Horas_I
nternet
Horas_Co
mputador
Horas_T
elevision
Materias_
Semestre
Eda
d
Estatura
54,6
807
61,5
789 -2,18666 2,68604 0,81364 1,32553 -6,04283 0,47702
0,05
192
Peso
61,5
789
173,
269 -9,97895
18,1331
7
14,7561
6 1,68612 4,56612 -0,03801
3,10
756
Materias_
Aprobadas
-
2,18
666
-
9,97
895
102,17089 4,99569 -
9,94346 1,77232 2,43166 0,56512
7,45
156
Minutos_ll
egar
2,68
604
18,1
3317 4,99569
608,370
65
-
57,6927
6
-8,39157 7,20851 3,94046
-
1,52
216
Horas_Inte
rnet
0,81
364
14,7
5616 -9,94346
-
57,6927
6
176,735
25 15,56333 46,36761 -1,13128
1,11
819
Horas_Co
mputador
1,32
553
1,68
612 1,77232
-
8,39157
15,5633
3 6,13544 1,8856 -0,93443
1,19
476
Horas_Tel
evision
-
6,04
283
4,56
612 2,43166 7,20851
46,3676
1 1,8856 92,1196 0,17512
-
1,78
02
Materias_S
emestre
0,47
702
-
0,03
801
0,56512 3,94046 -
1,13128 -0,93443 0,17512 1,66687
-
0,55
628
Edad
0,05
192
3,10
756 7,45156
-
1,52216 1,11819 1,19476 -1,7802 -0,55628
3,59
232
60
3.2 Determinación de la Matriz de Correlación Muestral R.
Es una representación ordenada de los coeficientes de correlación de cada variable con la otra
variable y consigo misma.
Correlación Muestral R.
Esta
tura
Pes
o
Materias_A
probadas
Minutos
_llegar
Horas_I
nternet
Horas_Co
mputador
Horas_Te
levision
Materias_
Semestre
Ed
ad
Estatura 1
0,6
27 -0,03 0,015 0,008 0,072 -0,085 0,05
0,0
04
Peso 0,62
7 1 -0,075 0,055 0,083 0,051 0,036 -0,002
0,1
23
Materias_A
probadas -
0,03
-
0,0
75 1 0,02 -0,074 0,07 0,025 0,043
0,3
87
Minutos_ll
egar 0,01
5
0,0
55 0,02 1 -0,175 -0,136 0,03 0,128
-
0,0
32
Horas_Inte
rnet
0,00
8
0,0
83 -0,074 -0,175 1 0,583 0,377 -0,067
0,0
44
Horas_Co
mputador
0,07
2
0,0
51 0,07 -0,136 0,583 1 0,079 -0,291
0,2
54
Horas_Tele
vision
-
0,08
5
0,0
36 0,025 0,03 0,377 0,079 1 0,014
-
0,0
98
Materias_S
emestre 0,05
-
0,0
02 0,043 0,128 -0,067 -0,291 0,014 1
-
0,2
26
Edad 0,00
4
0,1
23 0,387 -0,032 0,044 0,254 -0,098 -0,226 1
61
4. Estadística Inferencial
4.1 Intervalos de confianza
EDADES DE ALUMNOS
Calcular un intervalo de confianza para la media poblacional (95% de confianza)
= 1.96
Como el n= 100 ; n 30
1,895
20,94 – 1.96 20,94 + 1.96
20,564 21,316
21,421,321,221,121,020,920,820,720,620,5
Edad
Gráfica de intervalos de Edad95% IC para la media
62
ESTATURA
Calcular un intervalo de confianza para la media poblacional (95% de confianza)
= 1.96
Como el n= 100 ; n 30
7,39
– 1.96 + 1.96
169,22 172,16
172,5172,0171,5171,0170,5170,0169,5169,0
Estatura
Gráfica de intervalos de Estatura95% IC para la media
63
MATERIAS APROBADAS
Calcular un intervalo de confianza para la media poblacional (95% de confianza)
= 1.96
Como el n= 100; n 30
10,108
– 1.96 + 1.96 169,22
23,035 27,067
2726252423
Materias_Aprobadas
Gráfica de intervalos de Materias_Aprobadas95% IC para la media
64
PESO
Calcular un intervalo de confianza para la media poblacional (95% de confianza)
= 1.96
Como el n= 100; n 30
10,108
– 1.96 + 1.96 169,22
67,455 72,733
73727170696867
Peso
Gráfica de intervalos de Peso95% IC para la media
65
HORAS COMPUTADOR
Calcular un intervalo de confianza para la media poblacional (95% de confianza)
= 1.96
Como el n= 100; n 30
3,4512
– 1.96 + 1.96
2,9572 3,9452
4,03,83,63,43,23,0
Horas_Computador
Gráfica de intervalos de Horas_Computador95% IC para la media
66
HORAS TELEVISION
Calcular un intervalo de confianza para la media poblacional (95% de confianza)
= 1.96
Como el n= 100; n 30
9,598
– 1.96 + 1.96
10,056 13,864
1413121110
Horas_Television
Gráfica de intervalos de Horas_Television95% IC para la media
67
MATERIAS SEMESTRE
Calcular un intervalo de confianza para la media poblacional (95% de confianza)
= 1.96
Como el n= 100; n 30
1,2911
– 1.96 + 1.96
4,8233 5,3383
5,45,35,25,15,04,94,8
Materias_Semestre
Gráfica de intervalos de Materias_Semestre95% IC para la media
68
HORAS INTERNET
Calcular un intervalo de confianza para la media poblacional (95% de confianza)
= 1.96
Como el n= 100; n 30
13,294
– 1.96 + 1.96
13,901 19,232
191817161514
Horas_Internet
Gráfica de intervalos de Horas_Internet95% IC para la media
69
MINUTOS DE LLEGAR A LA ESPOL
Calcular un intervalo de confianza para la media poblacional (95% de confianza)
= 1.96
Como el n= 100; n 30
24,665
– 1.96 + 1.96
44,646 ,485
55,052,550,047,545,0
Minutos_llegar
Gráfica de intervalos de Minutos_llegar95% IC para la media
70
Criterio para análisis del valor p
El mínimo valor de α para rechazar Ho
Valor P < 0.05 (5%) (5%) 0.05<p<0.1 (10%) Valor P >0.1 (10%)
SE RECHAZA Ho INCERTIDUMBRE SE ACEPTA Ho
En el caso que no se conozca el nivel de significancia (α), se puede aceptar o rechazar un hipótesis
planteada (Hipótesis Nula) con la ayuda del criterio del valor p.
4.2 Pruebas de hipótesis para medias.
Edades
Realizar una prueba de hipótesis para la media poblacional.(Indique el nivel de significancia o
valor p de la prueba)
Para realizar la prueba de hipótesis asumiremos que 22
: 22
: 22
Valor estadística de prueba
Z =
Z =
Z =
Z = -5,5936
Existe evidencia estadística para rechazar Ho (Hipótesis Nula), ya que el valor p es menor 0.05
(5%).
71
Estatura de Alumnos
Realizar una prueba de hipótesis para la media poblacional.(Indique el nivel de significancia o
valor p de la prueba)
Para realizar la prueba de hipótesis asumiremos que 170
: 170
: 170
Valor estadística de prueba
Z =
Z =
Z =
Z = 0,9337
=0,823815
No existe evidencia estadística para rechazar Ho (Hipótesis Nula), ya que el valor p es mayor 0.
1(10%).
Materias Aprobadas
Realizar una prueba de hipótesis para la media poblacional.(Indique el nivel de significancia o
valor p de la prueba)
Para realizar la prueba de hipótesis asumiremos que 25
: 25
: 25
Valor estadística de prueba
Z =
Z =
Z =
Z = 0,049
72
No existe evidencia estadística para rechazar Ho (Hipótesis Nula), ya que el valor p es mayor 0.
1(10%).
Peso de Alumnos
Realizar una prueba de hipótesis para la media poblacional.(Indique el nivel de significancia o
valor p de la prueba)
Para realizar la prueba de hipótesis asumiremos que 68
: 68
: 68
Valor estadística de prueba
Z =
Z =
Z =
Z = 1,5881
No existe evidencia estadística para rechazar Ho (Hipótesis Nula), ya que el valor p es mayor 0.
1(10%).
Horas de Computador
Realizar una prueba de hipótesis para la media poblacional.(Indique el nivel de significancia o
valor p de la prueba)
Para realizar la prueba de hipótesis asumiremos que 5
: 5
: 5
Valor estadística de prueba
Z =
Z =
Z =
Z = -6,27
73
Existe evidencia estadística para rechazar Ho (Hipótesis Nula), ya que el valor p es menor 0.
05(5%).
Horas de Televisión
Realizar una prueba de hipótesis para la media poblacional.(Indique el nivel de significancia o
valor p de la prueba)
Para realizar la prueba de hipótesis asumiremos que 11
: 11
: 11
Valor estadística de prueba
Z =
Z =
Z =
Z = 1,00
No existe evidencia estadística para rechazar Ho (Hipótesis Nula), ya que el valor p es mayor 0.
1(10%).
Materias Semestre
Realizar una prueba de hipótesis para la media poblacional. (Indique el nivel de significancia o
valor p de la prueba)
Para realizar la prueba de hipótesis asumiremos que 4
: 4
: 4
Valor estadística de prueba
Z =
Z =
Z =
74
Z = 8,36
No existe evidencia estadística para rechazar Ho (Hipótesis Nula), ya que el valor p es mayor 0.
1(10%).
Horas Internet
Realizar una prueba de hipótesis para la media poblacional.(Indique el nivel de significancia o
valor p de la prueba)
Para realizar la prueba de hipótesis asumiremos que 16
: 16
: 16
Valor estadística de prueba
Z =
Z =
Z =
Z = 0,7221
No existe evidencia estadística para rechazar Ho (Hipótesis Nula), ya que el valor p es mayor 0.
1(10%).
Minutos llegar a la ESPOL
Realizar una prueba de hipótesis para la media poblacional. (Indique el nivel de significancia o
valor p de la prueba)
Para realizar la prueba de hipótesis asumiremos que 46
: 46
: 46
Valor estadística de prueba
Z =
Z =
75
Z =
Z = 1,5846
No existe evidencia estadística para rechazar Ho (Hipótesis Nula), ya que el valor p es mayor 0.
1(10%).
4.3 Intervalos de confianza Varianzas
EDADES DE ALUMNOS
Calcular un intervalo de confianza para la media poblacional (95% de confianza)
Suponiendo que:
=129,56
=74,22
Intervalo de Confianza:
.837
76
ESTATURA
Calcular un intervalo de confianza para la media poblacional (95% de confianza)
Suponiendo que:
=129,56
=74,22
Intervalo de Confianza:
MATERIAS APROBADAS
Calcular un intervalo de confianza para la media poblacional (95% de confianza)
Suponiendo que:
=129,56
=74,22
77
Intervalo de Confianza:
PESO
Calcular un intervalo de confianza para la media poblacional (95% de confianza)
Suponiendo que:
=129,56
=74,22
Intervalo de Confianza:
HORAS COMPUTADOR
Calcular un intervalo de confianza para la media poblacional (95% de confianza)
78
Suponiendo que:
=129,56
=74,22
Intervalo de Confianza:
HORAS TELEVISION
Calcular un intervalo de confianza para la media poblacional (95% de confianza)
Suponiendo que:
=129,56
=74,22
Intervalo de Confianza:
79
MATERIAS SEMESTRE
Calcular un intervalo de confianza para la media poblacional (95% de confianza)
Suponiendo que:
=129,56
=74,22
Intervalo de Confianza:
HORAS INTERNET
Calcular un intervalo de confianza para la media poblacional (95% de confianza)
Suponiendo que:
=129,56
=74,22
80
Intervalo de Confianza:
MINUTOS DE LLEGAR A LA ESPOL
Calcular un intervalo de confianza para la media poblacional (95% de confianza)
Suponiendo que:
=129,56
=74,22
Intervalo de Confianza:
81
Criterio para análisis del valor p
El mínimo valor de α para rechazar Ho
Valor P < 0.05 (5%) (5%) 0.05<p<0.1 (10%) Valor P >0.1 (10%)
SE RECHAZA Ho INCERTIDUMBRE SE ACEPTA Ho
En el caso que no se conozca el nivel de significancia (α), se puede aceptar o rechazar un hipótesis
planteada (Hipótesis Nula) con la ayuda del criterio del valor p.
4.4 Pruebas de hipótesis para Varianzas
Edades
Realizar una prueba de hipótesis para la varianza poblacional. (Indique el nivel de significancia o
valor p de la prueba)
Para realizar la prueba de hipótesis asumiremos que
: 4
: 4
Estadístico de Prueba:
n=100
Región de Rechazo:
Aproximando
No existe evidencia estadística para rechazar Ho (Hipótesis Nula), ya que el valor p está entre
valores mayores 0.1 (10%).
82
Estatura de Alumnos
Realizar una prueba de hipótesis para la varianza poblacional. (Indique el nivel de significancia o
valor p de la prueba)
Para realizar la prueba de hipótesis asumiremos que
: 60
: 60
Estadístico de Prueba:
n=100
Región de Rechazo:
Aproximando
No existe evidencia estadística para rechazar Ho (Hipótesis Nula), ya que el valor p está entre
valores mayores 0.1 (10%).
Materias Aprobadas
Realizar una prueba de hipótesis para la varianza poblacional. (Indique el nivel de significancia o
valor p de la prueba)
Para realizar la prueba de hipótesis asumiremos que
: 150
: 150
Estadístico de Prueba:
n=100
Región de Rechazo:
83
Aproximando
No existe evidencia estadística para rechazar Ho (Hipótesis Nula), ya que el valor p está entre
valores mayores 0.1 (10%).
Peso de Alumnos
Realizar una prueba de hipótesis para la varianza poblacional. (Indique el nivel de significancia o
valor p de la prueba)
Para realizar la prueba de hipótesis asumiremos que
: 50
: 50
Estadístico de Prueba:
n=100
Región de Rechazo:
Aproximando
Existe evidencia estadística para rechazar Ho (Hipótesis Nula), ya que el valor p es menor a 0,05
(5%).
84
Horas de Computador
Realizar una prueba de hipótesis para la varianza poblacional. (Indique el nivel de significancia o
valor p de la prueba)
Para realizar la prueba de hipótesis asumiremos que
: 10
: 10
Estadístico de Prueba:
n=100
Región de Rechazo:
Aproximando
No existe evidencia estadística para rechazar Ho (Hipótesis Nula), ya que el valor p es mayor 0.1
(10%).
Horas de Televisión
Realizar una prueba de hipótesis para la varianza poblacional. (Indique el nivel de significancia o
valor p de la prueba)
Para realizar la prueba de hipótesis asumiremos que
: 100
: 100
Estadístico de Prueba:
n=100
Región de Rechazo:
85
Aproximando
No existe evidencia estadística para rechazar Ho (Hipótesis Nula), ya que el valor p está entre
valores mayores 0.1 (10%).
Materias Semestre
Realizar una prueba de hipótesis para la varianza poblacional. (Indique el nivel de significancia o
valor p de la prueba)
Para realizar la prueba de hipótesis asumiremos que
: 20
: 20
Estadístico de Prueba:
n=100
Región de Rechazo:
Aproximando
No existe evidencia estadística para rechazar Ho (Hipótesis Nula), ya que el valor p está entre
valores mayores 0.1 (10%).
86
Horas Internet
Realizar una prueba de hipótesis para la varianza poblacional. (Indique el nivel de significancia o
valor p de la prueba)
Para realizar la prueba de hipótesis asumiremos que
: 90
: 90
Estadístico de Prueba:
n=100
Región de Rechazo:
Aproximando
Existe evidencia estadística para rechazar Ho (Hipótesis Nula), ya que el valor p es menor a 0,05
(5%).
Minutos llegar a la ESPOL
Realizar una prueba de hipótesis para la varianza poblacional. (Indique el nivel de significancia o
valor p de la prueba)
Para realizar la prueba de hipótesis asumiremos que
: 700
: 700
Estadístico de Prueba:
n=100
Región de Rechazo:
87
Aproximando
No existe evidencia estadística para rechazar Ho (Hipótesis Nula), ya que el valor p está entre
valores mayores 0.1 (10%).
4.5 Bondad de Ajuste
Criterio para análisis del valor p
El mínimo valor de α para rechazar Ho
Valor P < 0.05 (5%) (5%) 0.05<p<0.1 (10%) Valor P >0.1 (10%)
SE RECHAZA Ho INCERTIDUMBRE SE ACEPTA Ho
En el caso que no se conozca el nivel de significancia (α), se puede aceptar o rechazar un
hipótesis planteada (Hipótesis Nula) con la ayuda del criterio del valor p.
Tabla de Frecuencia de la edad. (k=3)
Clases
1 [ 19 21 ) 52 P(x<21) = 0.51 51
2 [ 21 23 ) 32 P(21<x<23 )= 0.35 35
3 [ 23 31) 16 P(x>31)= 0.14 14
:
:
P(x<21)
Z =
Z =
Z = 0.03
88
P(z<0.03) =0.51
P (21<x<23)
Z =
Z =
Z = 1.09
P(0.03 < z <1.09) =0.49 – 0.14 = 0.35
P(x>31)
P (z >1.09) = 0.14
= 0.56
Como no tenemos α, buscamos el valor p:
El 0.5<p<0.9 por lo tanto por el criterio del valor p dice que no se rechaza Ho (Hipótesis Nula)
Tabla de Frecuencia de la estatura (k=5)
Clases
1 [ 152 158.5 ) 5 P(x<158.5)= 0.05 5
2 [158.5 165 ) 12 P(158.5<x<165)= 0.17 17
3 [165 171.5 ) 37 P(165<x<171.5) = 0.32 32
4 [171.5 178 ) 28 P(171.5<x<178) = 0.30 30
5 [178 191 ) 18 P(x>178)= 0.16 16
:
:
P(x<158.5)
Z =
Z =
Z = - 1.65
P(z<- 1.65) = 0.05
89
P(158.5<x<165)
Z =
Z = =
Z = - 0.77
P(- 1.65 < z < - 0.77) = 0.17
P(165<x<171.5)
Z =
Z = =
Z = 0.11
P (- 0.77< z < 0.11) = 0.32
P (171.5<x<178)
Z =
Z = =
Z = 0.99
P(0.11< z <0.99) = 0.30
P(x>178)
P(z >0.99) = 0.16
=2.63
Como no tenemos α, buscamos el valor p:
El 0.5<p<0.9 por lo tanto por el criterio del valor p dice que no se rechaza Ho (Hipótesis Nula)
90
Tabla de Frecuencia de peso. (k=4)
Clases
1 [ 48.63 59.63 ) 21 P(x<59.63)= 0.21 21
2 [59.63 70.63) 38 P(59.63<x<70.63)= 0.31 31
3 [70.63 81.63) 23 P(70.63<x<81.63)= 0.29 29
4 [81.63 114.63) 18 P(x>81.63)= 0.19 19
:
:
P(x<59.63)
Z =
Z =
Z = - 0.79
P (z< - 0.79) = 0.21
P (59.63<x<70.63)
Z =
Z =
Z =0.04
P(- 0.79< z <0.04) = 0.31
P(70.63<x<81.63)
Z =
Z =
Z =0.88
P(0.04< z <0.88) = 0.29
P(x>81.63)
P(z > 0.88) = 0.19
=2.87
Como no tenemos α, buscamos el valor p:
El 0.5<p<0.1 por lo tanto por el criterio del valor p dice que no se rechaza Ho (Hipótesis Nula)
91
Tabla de Frecuencia de las materias aprobadas (k=4)
Clases
1 [ 12 20 ) 25 P(x<25)= 0.5 50
2 [ 20 28 ) 50 P(20<x<28)= 0.11 11
3 [ 28 36 ) 13 P(28<x<36)= 0.25 25
4 [ 36 60 ) 12 P(x>36)= 0.14 14
:
:
P(x<25)
Z =
Z =
Z = 0
P (z< 0) = 0.5
P(20<x<28)
Z =
Z =
Z = 0.29
P (0 < z <0.29) = 0.11
P(28<x<36)
Z =
Z =
Z = 1.08
P (0.29 < z < 1.08) = 0.25
P(x>36)
P(z > 1.08) = 0.14
=156.82
Como no tenemos α, buscamos el valor p:
El p<0.05 por lo tanto por el criterio del valor p dice que se rechaza Ho (Hipótesis Nul
92
Tabla de Frecuencia de horas computador. (k=3)
Clases
Frecuencia
Absoluta(f
)
1 [ 0.5 3.5 ) 59 P(x<3.5)= 0.51 51
2 [ 3.5 6.5) 33 P(3.5 <x<6.5)= 0.38 38
3 [ 6.5 18.5) 8 P(x>6.5)= 0.11 11
:
:
P(x<3.5)
Z =
Z =
Z = 0.02
P (z< 0.02) = 0.51
P (3.5 <x<6.5)
Z =
Z =
Z = 1.23
P (0.02< z < 1.23) = 0.38
P(x>6.5)
P(z > 1.23) = 0.11
=2.73
Como no tenemos α, buscamos el valor p:
El 0.5<p<0.1 por lo tanto por el criterio del valor p dice que no se rechaza Ho (Hipótesis Nula)
93
Tabla de Frecuencia de horas internet. (k=4)
Clases
Frecuencia
Absoluta(f
)
1 [ 1 11) 43 P(x<11)=0.34 34
2 [ 11 22) 33 P(11<x<22)=0,32 32
3 [ 22 33) 13 P(22<x<33)=0.23 23
4 [ 33 66 ) 11 P(x>33)=0.11 11
:
:
P(x<11)
Z =
Z =
Z = - 0.42
P (z< - 0.42) = 0.34
P (11<x<22)
Z =
Z =
Z =0.41
P (- 0.42< z < 0.41) = 0.5
P (22<x<33)
Z =
Z =
Z =1.24
P (0.41 < z < 1.24) = 0.05
P (x>33)
P(z > 1.24) = 0.11
=6.76
Como no tenemos α, buscamos el valor p:
94
El 0.1<p<0.05 por lo tanto por el criterio del valor p dice que no existe evidencia estadística para
rechazar Ho (Hipótesis Nula)
4.6 Tablas de contingencia
Esta prueba se puede usar para determinar la independencia entre dos métodos o factores
involucrados en la obtención de datos.
Se procedió a formar grupos con 7 variables, y analizar la independencia entre dos variables.
Terminología:
n: Cantidad de observaciones.
r: Cantidad de Filas.
c: Cantidad de Columnas
ri: Total de resultados en la fila i.
cj: Total de resultados en la columna j.
ni,j: Total de resultados observados en la fila i, columna j. (Datos Muéstrales ).
ei,j: Total de resultados observados en la fila i, columna j. (Frecuencia Esperada)
Obtención de la frecuencia esperada:
Estatura vs Peso
Estatura
Máximo: 187
Mínimo: 150
Intervalos
Bajo X<=165
Alto X>165
Peso
Máximo: 113
Mínimo: 48,63
Intervalos
Delgado X<=75
Pesado X>75
95
Tabla de contingencia:
Estatura
Bajo Alto Totales
Delgado 22 49 71
Peso Pesado 6 23 29
Totales 28 72 100
Frecuencia esperada :
1 2
1 19,88 51,12
2 8,12 20,88
Prueba de hipótesis.
Ho: La Estatura es independiente del Peso.
Ha: No son independientes (Negando Ho).
Estadístico de Prueba:
Región de Rechazo:
Apoyados en MINITAB:
1,083
Como no tenemos α, buscamos el valor p:
No existe evidencia estadística para rechazar Ho (Hipótesis Nula), ya que el valor p es mayor 0.1
(10%).
96
Edad vs Materias Aprobadas
Edad
Máximo: 30
Mínimo: 19
Intervalos
Normal X<=20
Mucha X>20
Materias Aprobadas
Máximo: 57
Mínimo: 12
Intervalos
Pocas X<=20
Muchas 21<=X<=35
Bastantes X>=36
Tabla de contingencia:
Materias Aprobadas
Pocas Muchas Bastantes Totales
Joven 17 22 8 47
Edad Adulto 18 31 4 53
Totales 35 53 12 100
Frecuencia esperada :
1 2 3
1 16,45 24,91 5,64
2 18,55 28,09 6,36
Prueba de hipótesis.
Ho: Las Materias Aprobadas es independiente de la Edad.
Ha: No son independientes (Negando Ho).
97
Estadístico de Prueba:
Región de Rechazo:
Apoyados en MINITAB:
Como no tenemos α, buscamos el valor p:
No existe evidencia estadística para rechazar Ho (Hipótesis Nula), ya que el valor p es mayor 0.1
(10%).
Edad vs Estatura
Edad
Máximo: 30
Mínimo: 19
Intervalos
Joven X<=20
Adulto X>20
Estatura
Máximo: 187
Mínimo: 150
Intervalos
Bajo X<=160
Media 161<=X<=170
Alto X>=171
98
Tabla de contingencia:
Estatura
Bajo Media Alta Totales
Joven 8 17 22 47
Edad Adulto 7 27 19 53
Totales 15 44 41 100
Frecuencia esperada :
1 2 3
1 7,05 20,68 19,27
2 7,95 23,32 21,73
Prueba de hipótesis.
Ho: La Estatura es independiente de la Edad.
Ha: No son independientes (Negando Ho).
Estadístico de Prueba:
Región de Rechazo:
Apoyados en MINITAB:
Como no tenemos α, buscamos el valor p:
No existe evidencia estadística para rechazar Ho (Hipótesis Nula), ya que el valor p es mayor 0.1
(10%).
99
Año de Ingreso vs Materias Aprobadas
Año de Ingreso
Máximo: 1999
Mínimo: 2008
Intervalos
1Gerneración X<=2007
2Generación X>=2008
Materias Aprobadas
Máximo: 57
Mínimo: 12
Intervalos
Pocas X<=28
Bastantes X>28
Tabla de contingencia:
Ingreso Espol
1Generación 2Generación Totales
Materias Pocas 43 36 79
Aprobadas Bastantes 16 5 21
Totales 59 41 100
Frecuencia esperada :
1 2
1 46,61 32,39
2 12,39 8,61
Prueba de hipótesis.
Ho: El Ingreso a la Espol es independiente de las Materias Aprobadas.
Ha: No son independientes (Negando Ho).
Estadístico de Prueba:
100
Región de Rechazo:
Apoyados en MINITAB:
Como no tenemos α, buscamos el valor p:
Existe evidencia estadística para rechazar Ho (Hipótesis Nula), ya que el valor p es menor a 0.05
(5%).
Regresión
Análisis de regresión: Peso vs. Estatura
La ecuación de regresión es
C1 = 163 + 0,0899 C2
Predictor Coef Coef. de EE T P
Constante 163,289 4,091 39,91 0,000
C2 0,08990 0,05740 1,57 0,121
S = 7,44116 R-cuad. = 2,4% R-cuad.(ajustado) = 1,4%
Análisis de varianza
Fuente GL SC MC F P
Regresión 1 135,84 135,84 2,45 0,121
Error residual 98 5426,35 55,37
Total 99 5562,19
101
5. Conclusiones Al finalizar este proyecto puedo recordar todo lo ocurrido durante la realización de este por lo que
he llegado a algunas conclusiones:
Al finalizar este proyecto puedo recordar todo lo ocurrido durante la realización de este por
lo que he llegado a algunas conclusiones:
Las variables de redes sociales, sexo, internet en casa son variables cualitativas mientras
las variables de edad, peso, estatura, materias aprobadas, materias tomadas, horas de
computador, minutos de legar a la espol, horas de televisión, horas de internet son variables
cuantitativas.
Para saber que si dos variables son independientes entre si utilizamos el método de ji
cuadrado y nos dio las siguientes conclusiones:
Que la variable peso y estatura son independientes entre si.
Que la variable edad y materias aprobadas son independientes entre si.
Que la variable edad y estatura son independientes entre si.
Que la variable año de ingreso y materias aprobadas son dependientes entre si.
Para saber de que si son de distribución normal se hizo el procedimiento de tablas de
contingencia y la siguiente conclusión que las variables peso, edad estatura, peso son de
distribución normal.
Los intervalos de confianza son un buen estimador para las medias de una de las siguientes
variables son:
Edades
20,564 21,316
Estatura
169,22 172,16
Materias aprobadas
169,22 172,16
Peso
67,455 72,733
102
6. Recomendaciones
Es necesario realizar un estudio metódico, con tiempo acerca de las muestras para poder
presentar datos fiables.
Es necesario estimar o suponer ciertos parámetros que ayuden a un análisis de éstas para
que posean cierta “correspondencia.”
103
7. Bibliografía PROBABILIDAD Y ESTADÍSTICA: Fundamentos y Aplicaciones. Autor: Gaudencio
Zurita Herrera. ISBN: 9789978310557. ICM – ESPOL. Guayaquil – Ecuador.
www.icm.espol.edu.ec
INTRODUCCION A LA PROBABILIDAD Y ESTADISTICA de BEAVER, ROBERT
J. y BEAVER, BARBARA M. y MENDENHALL, WILLIAM. ISBN: 9789706861955. Nº
Edición: 1ª ED. Año de edición: 2003. Plaza edición: MEXICO
Rodríguez Ojeada L. Probabilidad y Estadística Básica para Ingenieros. ICM – ESPOL.
Guayaquil – Ecuador. www.icm.espol.edu.ec
Meet Minitab 15 para Windows Enero 2007
104
Formulario a ser administrado a estudiantes
Con el fin de disponer de un conjunto de datos reales que puedan ser utilizados en diversos ejercicios, se responderá de forma anónima a las siguientes preguntas.
1. DATOS GENERALES DEL INFORMANTE
1. Género: Masculino Femenino
2. Edad (en años):
3. Mes de Nacimiento (1 a 12):
4. Estatura (en centímetros):
5. Peso (en Kg, un Kg = 2.2 libras):
6. Número de hermanos:
7. Año de ingreso a la ESPOL: (Sin incluir Pre Politécnico)
8. Número de materias aprobadas: (Sin incluir Pre Politécnico)
9. Número de materias que toma el presente
semestre:
2. PARTICULARIDADES
1. Escriba un dígito al azar de 0 a 9:
2. Lugar de residencia (de lunes a viernes) en el presente semestre:
Hogar familiar en Guayaquil Residencia estudiantil Otra solución Hogar familiar fuera de Guayaquil Apartamento con compañeros en Guayaquil
3. ¿Tiene computadora personal en casa? Sí No
4. ¿Tiene usted Internet en casa? Sí No
5. En cuales de las siguientes redes sociales posee usted una cuenta (puede marcar más de una opción): Facebook Twitter Hi5 Otras__________________ Ninguna
(Especifique)
6. A cuál de las redes sociales le dedica más tiempo y atención:
7. ¿Cómo llega usted habitualmente a la ESPOL? Vehículo propio A pie Transporte ESPOL En moto o bicicleta En el vehículo de un compañero Transporte Público
8. ¿Cuántos minutos ha empleado hoy en venir a la ESPOL?
9. ¿Cuál es su equipo de fútbol favorito? Ninguno
10. ¿Cuál fue el último libro no relacionado con sus estudios en la ESPOL, que leyó por iniciativa propia?
11. Número de horas diarias que usted pasa frente un computador:
12. Número de horas semanales que usted accede a Internet:
13. Número de horas semanales que usted emplea para ver televisión:
14. ¿Tiene usted instalado servicio de Internet en su teléfono?:
ESCUELA SUPERIOR POLITÉCNICA DEL LITORAL Centro de Estudios e Investigaciones Estadísticas ICM-ESPOL
FORMULARIO DE ESTADÍSTICA PARA INGENIERÍAS
105
3. OPINIÓN
1. ¿Cuál de los siguientes problemas considera es el más importante en el Ecuador actual? (Elija sólo una)
Déficit Fiscal Pérdida de valores morales
Desigualdad social Problemas Internacionales
Drogas Seguridad ciudadana Falta de empleo Otro____________________________
(Especifique)
106