MODELOS LINEALES: SIMPLE Y MÚLTIPLE
…
…
…
…
…
ESTADÍSTICA II
GRUPO AD
…
DEPARTAMENTO DE CIENCIAS BÁSICAS
BARRANQUILLA, 2010
1
TABLA DE CONTENIDO
Pág.
Introducción
Objetivos 4
General
Específicos
Metodología 5
Evidencias 18
Conclusión 20
2
INTRODUCCIÓN
En la practica de nuestros conocimientos vemos que la EstadísticaInferencial nos permite trabajar con una variable a nivel de intervalo o razón, así también se puede comprender la relación de dos o más variablesy nos permitirá relacionar mediante ecuaciones, una variable en relación de la otra variable llamándose Regresión Lineal y una variable en relación a otras variables llamándose Regresión múltiple.
Casi constantemente en la practica de la investigación estadística, se encuentran variables que de alguna manera están relacionados entre si, por lo que es posible que una de las variables puedan relacionarse matemáticamente en función de otra u otras variables.
En el presente trabajo mediante un experimento en el cual evidenciaremos una simulación de obreros trabajando en el embalaje de un producto al trasporte, describiremos técnicas estadísticas aplicadas a los modelos lineales.
3
OBJETIVOS
General
Adquirir la habilidad de construir un modelo de regresión simple y
múltiple utilizando los conocimientos adquiridos en algebra lineal.
Específicos
Aplicar modelos lineales a problemas de la vida diaria.
Establecer si al conjunto de datos se le puede aplicar bajo hipótesis.
Hallar valores dentro de la tabla de análisis de varianza “ANOVA”.
4
METODOLOGÍA
Realice un experimento en donde todas las personas del grupo carguen un objeto pesado (pesa) a una distancia. Tomando el tiempo de traslado del punto de partida hasta la distancia prefijada. Usted debe variar el peso de cada persona, replicando el experimento tres veces por persona (el mismo peso, la misma distancia). Pero a medida que avanza el experimento debe aumentar el peso del objeto de la carga (Simulación de obreros trabajando en el embalaje de un producto al trasporte).
PersonaReplicació
nEDAD en
mesesPeso de la
personaTiempo establecido hasta la distancia x
Peso del objeto de carga
1
1
2
3
2
1
2
3
3
1
2
3
4
1
2
3
5
1
2
3
1. Ajuste un modelo de regresión lineal simple tomando como variable dependiente el tiempo establecido por cada persona y su peso corporal. Construya la tabla de análisis de varianza y realice las conclusiones pertinentes.
2. Ajuste un modelo de regresión múltiple tomando como variable dependiente el tiempo establecido por cada persona y el resto de las variables del experimento como las variables independientes. Construya la tabla de análisis de varianza y realice las conclusiones pertinentes.
5
Utilice un alfa de 5%.Recopilación de datos
PersonaReplicació
nEDAD en
mesesPeso de la
personaTiempo establecido hasta la distancia x
Peso del objeto de carga
1
1 252 65.5 3.05 2.5
2 252 64 3.07 7.5
3 252 65 3.53 20
2
1 228 56 5.07 2.5
2 228 56 5.23 7.5
3 228 55 5.96 20
3
1 233 50 3.74 2.5
2 233 49 3.95 7.5
3 233 49 4.13 20
4
1 230 54 3.70 2.5
2 230 54.5 3.74 7.5
3 230 53 4.12 20
La información de la anterior tabla es la recopilación del peso de la persona, tiempo empleado y peso del objeto de carga.
La información de la persona 1, 2, 3 y 4, corresponde a José, Heidy, Jorge y Camila respectivamente.
Las cargas empleadas para tal uso fueron: 1º carga: 2.5 kg (incluida barra). 2º carga: 2.5 kg + 5 kg (7.5 kg, incluida barra). 3º carga: 2.5 kg + 5 kg + 12.5 kg (20 kg, incluida barra).
La distancia establecida desde el punto de partida hasta el punto de llegada fue de 4.0 metros.
6
Realización punto #1
Caso José.
Y XTiempo Peso corporal
3.05 65,53.07 643.53 65
Tiempo (y), variable dependiente.Peso corporal (x), variable independiente.
∑ x2=12611.25 ∑ x=194.5
∑ y2=31.1883 ∑ y=9.65
x=64.8333 y=3.2166
∑ xy=625.705 n=3
Por lo tanto,
SSxy=∑ xy−(∑ x ) .(∑ y )
n
SSxy=625.705−(194.5 ) . (9.65 )
3SSxy=0.0633
SSxx=∑ x2−(∑ x )2
n
SSxx=12611.25−(194.5 )2
3SSxx=1.6666
7
SSyy=∑ y2−(∑ y )2
n
SSyy=31.1883−(9.65 )2
3SSyy=0.1474SSxy=0.0633SSxx=1.6666SSyy=0.1474
β1=SSxySSxx
=0.06331.6666
=0.0542
βo= y−β1 x=3.2166−(0.0542)(64.8333)βo=−0.3028
El modelo es el siguiente,
y= β0+ β1 x+εy=−0.3028+0.0542 xEl coeficiente de correlación
r=∑ xy− (∑ x ) . (∑ y ) /n
√ [∑ x2−(∑ x )2/n ] .[∑ y2−(∑ y )2/n]r=
625.705−(194.5 ) . (9.65 )/3
√ [12611.25−(194.5 )2/3 ] . [31.1883−(9.65 )2/3 ]r= 0.0633
√ (1.1666 ) . (0.1474 )=0.06330.4146
r=0.1526 No existe una relación entre “x” y “y”R2= (0.1526 )2=0.0233 El modelo no es idóneo.
SStotal=∑ y2−(∑ y )2/n=0.1474
SSmodelo=∑ xy−(∑ x) .(∑ y )/n
[∑ x2−(∑ x)2/n ]=0.06331.1666
=0.0542
SSerror=0.1474−0.0542=0.0932
F de V SS CM Valor f
8
Modelo 2 0,05428571 0,02714286 0,87387572Error 3 0,09318095 0,03106032 Total 5 0,14746667
Fα [ p−1 ,n− p ]=F0.05 (2,3 )=9.5521f <Fα [ p−1 , n− p] 0.8738<9.5521No se rechaza Ho.
Caso Heidy.
Y XTiempo Peso corporal
5.07 565.23 565.96 55
Tiempo (y), variable dependiente.Peso corporal (x), variable independiente.
∑ x2=9297 ∑ x=167
∑ y2=88.5794 ∑ y=16.26
x=55.6666 y=5.42
∑ xy=904.6 n=3
Por lo tanto,
SSxy=∑ xy−(∑ x ) .(∑ y )
n
SSxy=904.6−(167 ) . (16.26 )
3SSxy=−0.54
SSxx=∑ x2−(∑ x )2
n
SSxx=9297−(167 )2
3SSxx=0.6666
9
SSyy=∑ y2−(∑ y )2
n
SSyy=88.5794−(16.26 )2
3SSyy=0.4502
SSxy=−0.54SSxx=0.6666SSyy=0.4502
β1=SSxySSxx
= −0.540.6666
=−0.81
βo= y−β1 x=5.42−(−0.81)(55.6666)βo=50.51
El modelo es el siguiente,
y= β0+ β1 x+εy=50.51−0.81 x
El coeficiente de correlación
r=∑ xy− (∑ x ) . (∑ y ) /n
√ [∑ x2−(∑ x )2/n ] .[∑ y2−(∑ y )2/n]
r=904.6−(167 ) . (16.26 ) /3
√ [9297−(167 )2/3 ] . [88.5794−(16.26 )2/3 ]
r= −0.54√ (0.6666 ) . (0.4502 )
=−0.540.5478
r=−0.9856 Existe una relación negativa entre “x” y “y”
R2= (−0.9856 )2=0.9715 El modelo es idóneo.
SStotal=∑ y2−(∑ y )2/n=0.4502
SSmodelo=∑ xy−(∑ x) .(∑ y )/n
[∑ x2−(∑ x)2/n ]= −0.540.6666
=−0.81
10
SSerror=0.4502−0.81=1.2602
F de V SS CM Valor fModelo 2 -0,81 -0,405 -0,96413268Error 3 1,2602 0,42006667 Total 5 0,4502
Fα [ p−1 ,n−p ]=F0.05 (2,3 )=9.5521f <Fα [ p−1 , n−p] −0.9641<9.5521No se rechaza Ho.
Caso Jorge.
Y XTiempo Peso corporal
3.74 503.95 494.13 49
Tiempo (y), variable dependiente.Peso corporal (x), variable independiente.
∑ x2=7302 ∑ x=148
∑ y2=46.647 ∑ y=11.82
x=49.3333 y=3.94
∑ xy=582.92 n=3
Por lo tanto,
SSxy=∑ xy−(∑ x ) .(∑ y )
n
SSxy=582.92−(148 ) . (11.82)
3SSxy=−0.2
SSxx=∑ x2−(∑ x )2
n
11
SSxx=7302−(148 )2
3SSxx=0.6666
SSyy=∑ y2−(∑ y )2
n
SSyy=46.647−(11.82)2
3SSyy=0.0762
SSxy=−0.2SSxx=0.6666SSyy=0.0762
β1=SSxySSxx
= −0.20.6666
=−0.3
βo= y−β1 x=3.94−(−0.3)(49.3333)βo=18.74
El modelo es el siguiente,
y= β0+ β1 x+εy=18.74−0.3x
El coeficiente de correlación
r=∑ xy− (∑ x ) . (∑ y ) /n
√ [∑ x2−(∑ x )2/n ] .[∑ y2−(∑ y )2/n]
r=582.92−(148 ) . (11.82)/3
√ [7302− (148 )2/3 ] . [46.647−(11.82 )2/3 ]
r= −0.2√ (0.6666 ) . (0.0762 )
= −0.20.2253
r=−0.8873 Existe una relación negativa entre “x” y “y”
R2= (−0.8873 )2=0.7874 El modelo esrelativamente idóneo.
12
SStotal=∑ y2−(∑ y )2/n=0.0762
SSmodelo=∑ xy−(∑ x) .(∑ y )/n
[∑ x2−(∑ x)2/n ]= −20.6666
=−0.3
SSerror=0.0762−(−0.3)=0.3762
F de V SS CM Valor fModelo 2 -0,3 -0,15 -1,19617225Error 3 0,3762 0,1254 Total 5 0,0762
Fα [ p−1 ,n−p ]=F0.05 (2,3 )=9.5521f <Fα [ p−1 , n−p] −1.1961<9.5521No se rechaza Ho.
Caso Camila.
Y XTiempo Peso corporal
3.7 543.74 54.54.12 53
Tiempo (y), variable dependiente.Peso corporal (x), variable independiente.
∑ x2=8695.25 ∑ x=161.5
∑ y2=44.652 ∑ y=11.56
x=53.8333 y=3.8533
∑ xy=621.99 n=3
Por lo tanto,
SSxy=∑ xy−(∑ x ) .(∑ y )
n
SSxy=621.99−(161.5 ) . (11.56 )
3SSxy=−0.3233
13
SSxx=∑ x2−(∑ x )2
n
SSxx=8695.25−(161.5 )2
3SSxx=1.1666
SSyy=∑ y2−(∑ y )2
n
SSyy=44.652−(11.56 )2
3SSyy=0.1074
SSxy=−0.3233SSxx=1.1666SSyy=0.1074
β1=SSxySSxx
=−0.32331.1666
=−0.2771
βo= y−β1 x=3.8533−(−0.2771)(53.8333)βo=18.7728
El modelo es el siguiente,
y= β0+ β1 x+εy=18.7728−0.2771 x
El coeficiente de correlación
r=∑ xy− (∑ x ) . (∑ y ) /n
√ [∑ x2−(∑ x )2/n ] .[∑ y2−(∑ y )2/n]
r=621.99−(161.5 ) . (11.56 )/3
√ [8695.25−(161.5 )2/3 ] . [44.652−(11.56 )2/3 ]
r= −0.3233√ (1.1666 ) . (0.1074 )
=−0.32330.3539
14
r=−0.9131 Existe una relación negativa entre “x” y “y”
R2= (−0.9131 )2=0.8338 El modelo esrelativamente idóneo.
SStotal=∑ y2−(∑ y )2/n=0.1074
SSmodelo=∑ xy−(∑ x) .(∑ y )/n
[∑ x2−(∑ x)2/n ]=−0.32331.1666
=−0.2771
SSerror=0.1074−(−0.2771)=0.3846
F de V SS CM Valor fModelo 2 -0,27714286 -0,13857143 -1,08087361Error 3 0,38460952 0,12820317 Total 5 0,10746667
Fα [ p−1 ,n− p ]=F0.05 (2,3 )=9.5521f <Fα [ p−1 , n− p] −1.0808<9.5521No se rechaza Ho.Realización punto #2
Tenemos la información obtenida experimentalmente:Tabla de datos
Y X1 X2 X3
Tiempo Edad Pesopersona
Pesocarga
3,05 252 65,5 2,5
3,07 252 64 7,5
3,53 252 65 20
5,07 228 56 2,5
5,23 228 56 7,5
5,96 228 55 20
3,74 233 50 2,5
3,95 233 49 7,5
4,13 233 49 20
3,7 230 54 2,5
3,74 230 54,5 7,5
4,12 230 53 20
Tiempo (y), variable dependiente.
15
Edad (X1), variable 1 independiente.Peso corporal (x2), variable 2 independiente.Peso carga del objeto (X3), variable 3 independiente.
A partir de la tabla, obtenemos la matriz x,Matriz x
1 252 65,5 2,51 252 64 7,51 252 65 201 228 56 2,51 228 56 7,51 228 55 201 233 50 2,51 233 49 7,51 233 49 201 230 54 2,51 230 54,5 7,51 230 53 20
De esta última se le aplica la matriz traspuesta x’,
Matriz x' 1 1 1 1 1 1 1 1 1 1 1 1
252 252 252 228 228 228 233 233 233 230 230 23065,5 64 65 56 56 55 50 49 49 54 54,5 532,5 7,5 20 2,5 7,5 20 2,5 7,5 20 2,5 7,5 20
Seguidamente obtenemos una matriz producto a partir de x’ (traspuesta) y x; con dimensiones 4x4.
Matriz x'x12 2829 671 120
2829 668031 158719 28290671 158719 37905,5 6680120 28290 6680 1850
Luego, a esta última se invierte, obteniendo la matriz (x’x)-1
Matriz (x'x)-1
77,5716783 -0,43753817 0,45789194 0,00574886
16
-0,43753817 0,00277216 -0,00383126 -0,000176830,45789194 -0,00383126 0,00789892 0,000364570,00574886 -0,00017683 0,00036457 0,00155529
Posteriormente se multiplica la matriz x’ por la matriz y, seleccionada de la tabla de datos
Por último
Se aplica la forma:β=( x ' x )−1 x ' y
Para obtener:
β= (x'x)-1x'y24,4789493 → β0-0,1125236 → β10,10353548 → β20,03666318 → β3
Donde,βo, es igual a 24.4789
β1, es igual a −0.1125β2, es igual a 0.1035
β3, es igual a 0.0366
Así,
y= β0+ β1 x1+ β2 x2+ β3 x3
17
Obteniendo
El modelo es: y=24.4789−0.1125 x1+0.1035 x2+0.0366 x3
CONCLUSIONES
1. En el caso de la Persona 1 (José), se pudo concluir que no existe relación entre las variables "x" y las variables "y", obteniendo r=0.1526. Además, se estableció que el modelo aplicado al conjunto de datos que arroja la experiencia con la Persona 1 (José) no es idóneo mientras que no se rechazó la hipótesis nula (Ho).
2. En el caso de la Persona 2 (Heidy), se pudo concluir que existe una altísima relación negativa entre las variables "x" y las variables "y", obteniendo r=-0.9856. Además, se estableció que el modelo aplicado al conjunto de datos que arroja la experiencia con la Persona 2 (Heidy) es idóneo mientras que no se rechazó la hipótesis nula (Ho).
3. En el caso de la Persona 3 (Jorge), se pudo concluir que existe una relación negativa y relativamente alta entre las variables "x" y las variables "y", obteniendo r=-0.8873. Además, se estableció que el modelo aplicado al conjunto de datos que arroja la experiencia con la Persona 3 (Jorge) es relativamente idóneo mientras que no se rechazó la hipótesis nula (Ho).
18
4. En el caso de la Persona 4 (Camila), se pudo concluir que existe una relación negativa y relativamente alta entre las variables "x" y las variables "y", obteniendo r=-0.9131. Además, se estableció que el modelo aplicado al conjunto de datos que arroja la experiencia con la Persona 4 (Camila) es relativamente idóneo mientras que no se rechazó la hipótesis nula (Ho).
5. Finalmente, a partir de los datos obtenidos experimentalmente se pudo notar el modelo de relación entre las variables, conociendo sus respectivos coeficientes.
El modelo es: y=24.4789−0.1125 x1+0.1035 x2+0.0366 x3
19