correlacion y regresion

22
CONTROL DE LECTURA N° 05 1.- Suponga que el gerente de comercialización de Bella Holandesa observa el precio y volumen de venta de galones de leche de 10 semanas en forma aleatoria. Los datos obtenidos se presentan en la tabla. Generar el diagrama de dispersión, verificar la tendencia con el coeficiente de correlación, los parámetros de la línea de regresión, el coeficiente de determinación, y la desviación estándar. Semana Venta Semanal de galones Precio de Venta por galón (en U$$) 1 10000 1.30 2 6000 2.00 3 5000 1.70 4 12000 1.50 5 10000 1.60 6 15000 1.20 7 5000 1.60 8 12000 1.40 9 17000 1.00 10 20000 1.10 SOLUCIÓN a) Diagrama de Dispersión: Y=f(x) X = Venta Semanal de galones Y = Precio de Venta por galón Universidad Nacional de Cajamarca

Upload: fredmanca512

Post on 29-Jan-2016

353 views

Category:

Documents


16 download

DESCRIPTION

ejercicios resueltos de correlación y regresión (matemática financiera)

TRANSCRIPT

Page 1: Correlacion y Regresion

CONTROL DE LECTURA N° 05

1.- Suponga que el gerente de comercialización de Bella Holandesa observa el precio y volumen de venta de galones de leche de 10 semanas en forma aleatoria. Los datos obtenidos se presentan en la tabla. Generar el diagrama de dispersión, verificar la tendencia con el coeficiente de correlación, los parámetros de la línea de regresión, el coeficiente de determinación, y la desviación estándar.

Semana Venta Semanal de galones

Precio de Venta por galón (en U$$)

1 10000 1.30

2 6000 2.00

3 5000 1.70

4 12000 1.50

5 10000 1.60

6 15000 1.20

7 5000 1.60

8 12000 1.40

9 17000 1.00

10 20000 1.10

SOLUCIÓN

a) Diagrama de Dispersión: Y=f(x)

X = Venta Semanal de galonesY = Precio de Venta por galón

b) Verificación de la tendencia con el coeficiente de correlación:

Semana Venta Semanal

de galones

Precio de Venta por

galón (en U$$)

XY X2 Y2 (Xi-Xprom)2

(yi-yprom)2

X Y1 10000 1.30 13000 100000000 1.69 1440000 0.01962 6000 2.00 12000 36000000 4 27040000 0.31363 5000 1.70 8500 25000000 2.89 38440000 0.06764 12000 1.50 18000 144000000 2.25 640000 0.0036

Universidad Nacional de Cajamarca

Page 2: Correlacion y Regresion

Ingeniería de proyectos

5 10000 1.60 16000 100000000 2.56 1440000 0.02566 15000 1.20 18000 225000000 1.44 14440000 0.05767 5000 1.60 8000 25000000 2.56 38440000 0.02568 12000 1.40 16800 144000000 1.96 640000 0.00169 17000 1.00 17000 289000000 1 33640000 0.1936

10 20000 1.10 22000 400000000 1.21 77440000 0.1156TOTAL 112000 14.40 14930

0148800000

021.5

623360000

00.824

Xpromedio Ypromedio

11200 1.44

Calculo de coeficiente de correlación:

= -0.863488967

Como: -1<R<1 (OK) Se ajusta

c) los parámetros de la línea de regresión:

Formulas paramétricas:

b =

b = -0.0000512842 = -0.00005

a = Yprom – b*Xprom

a= 2.01438356 = 2.00

El ajuste lineal será:

Y = 2.014 – 0.00005*X

Dónde: X = Venta Semanal de galones Y = Precio de Venta por galón

d) Coeficiente de determinación:

Coeficiente de determinación = R2

PROYECTOS I 2013

2

Σ XY−n∗Xprom∗YpromΣ x2−n∗Xprom2

R=n∑ XY−∑ X∑Y

√n∑ X2−¿¿¿¿

0 5000 10000 15000 20000 250000.00

0.50

1.00

1.50

2.00

2.50

Grafico de Dispersion

Venta Semanal de galones

Prec

io d

e Ve

nta

por

galó

n (e

n U

$$)

Page 3: Correlacion y Regresion

Ingeniería de proyectos

R2 = 0.745613197

e) Desviaciones Estándar:

Sx= √ Σ (Xi−Xprom )2n−1

= 5094.659513

Sy= √ Σ (Yi−Yprom )2n−1

= 0.302581486

2.- El gerente general de una planta de producción de materiales de construcción considera que la demanda de embarques de aglomerado puede estar relacionado con el número de permisos de construcción emitidos en el municipio durante el trimestre anterior. El gerente ha recolectado los siguientes datos:

a) Revísese el diagrama de dispersión para ver si los datos pueden ser descritos satisfactoriamente por una ecuación lineal. b) Calcúlese la razón de la variación de los embarques ante una variación de los permisos. c) Determínese una estimación de los embarques cuando el número de permisos de construcción es de 30. d) Calcular la desviación estándar.e) Calcular el coeficiente de correlación.

SOLUCION

a) Revísese el diagrama de dispersión para ver si los datos pueden ser descritos satisfactoriamente por una ecuación lineal:

Diagrama de Dispersión: Y=f(x)X = Permisos de ConstrucciónY = Embarque de Conglomerados

PROYECTOS I 2013

3

Page 4: Correlacion y Regresion

Ingeniería de proyectos

5 10 15 20 25 30 35 40 450.00

2.00

4.00

6.00

8.00

10.00

12.00

14.00

16.00

18.00

Grafico de Dispersion

Permisos de Construccion

Emba

rque

de

Cong

lom

erad

os

b) Calcúlese la razón de la variación de los embarques ante una variación de los permisos.

Numero Permisos de Construccion

Embarque de Conglomerados

XY X2 Y2 (Xi-Xprom)2

(yi-yprom)2

X Y1 15 6.00 90 225 36 64 162 9 4.00 36 81 16 196 363 40 16.00 640 1600 256 289 364 20 6.00 120 400 36 9 165 25 13.00 325 625 169 4 96 25 9.00 225 625 81 4 17 15 10.00 150 225 100 64 08 35 16.00 560 1225 256 144 36

TOTAL 184 80.00 2146 5006 950 774 150

XPROM YPROM23.00 10.00

Formulas paramétricas:

b =

b = 0.3953488372 = 0.395

a = Yprom – b*Xprom

a= 0.90698 = 0.915

PROYECTOS I 2013

4

Σ XY−n∗Xprom∗YpromΣ x2−n∗Xprom2

Page 5: Correlacion y Regresion

Ingeniería de proyectos

El ajuste lineal será:

Y = 0.915 + 0.395*X (SI SE AJUSTA)

Dónde: X = Permisos Y = Embarques

Y = 0.915 + 0.395*X

dYdX

= 0.395

c) Determínese una estimación de los embarques cuando el número de permisos de construcción es de 30.

Para x = 30

Y = 0.915 + 0.395*X

Y = 0.915 + 0.395*30

Y = 12.76 = 13 embaques

d) Calcular la desviación estándar.

Sx= √ Σ (Xi−Xprom )2n−1

= 9.84 = 10

Sy= √ Σ (Yi−Yprom )2n−1

=4.33 = 5

f) Calcular el coeficiente de correlación.

R = nΣXY−ΣXΣY

√(nΣx2−(Σx ) 2 )∗(nΣy2−(Σy ) 2) = 0.898

Como: -1<R<1 (OK) Se ajusta

PROYECTOS I 2013

5

Page 6: Correlacion y Regresion

Ingeniería de proyectos

3.- La población de cierta ciudad tiene el siguiente comportamiento histórico:

a) Realizar el diagrama de dispersión. b) Hallar los parámetros de la tendencia. c) Pronosticar la población en el año 15.

SOLUCION

a) Realizar el diagrama de dispersión.

Diagrama de Dispersión: Y=f(x)X = AñoY = Habitantes

PROYECTOS I 2013

6

Page 7: Correlacion y Regresion

Ingeniería de proyectos

0 1 2 3 4 5 6 7 8 9 100.00

200000.00

400000.00

600000.00

800000.00

1000000.00

1200000.00

1400000.00

1600000.00

Grafico de Dispersion

Año

Habi

tant

es

b) Hallar los parámetros de la tendencia.

AÑO HABITANTES

XY X2 Y2 (Xi-Xprom)2

(yi-yprom)2

X Y1 1000000.00 1000000 1 1000000000000 16 225000000002 1020000.00 2040000 4 1040400000000 9 169000000003 1050000.00 3150000 9 1102500000000 4 100000000004 1080000.00 4320000 16 1166400000000 1 49000000005 1120000.00 5600000 25 1254400000000 0 9000000006 1170000.00 7020000 36 1368900000000 1 4000000007 1230000.00 8610000 49 1512900000000 4 64000000008 1300000.00 1040000

064 1690000000000 9 22500000000

9 1380000.00 12420000

81 1904400000000 16 52900000000

45 10350000.00 54560000

285 12039900000000

60 137400000000

XPROM YPROM5.00 1150000.0

0

Formulas paramétricas:

PROYECTOS I 2013

7

Page 8: Correlacion y Regresion

Ingeniería de proyectos

b =

b = 46833.3333333333= 46833

a = Yprom – b*Xprom

a= 915833

El ajuste lineal será:

Y = 915833 + 46833*X (SI SE AJUSTA)

Dónde: X = Año Y = Habitantes

Calculo del coeficiente de correlación.

R = nΣXY−ΣXΣY

√(nΣx2−(Σx ) 2 )∗(nΣy2−(Σy ) 2) = 0.978672372

Como: -1<R<1 (OK) Se ajusta

Coeficiente de determinación:

Coeficiente de determinación = R2

R2 = 0.957799612

Calcular la desviación estándar.

Sx= √ Σ (Xi−Xprom )2n−1

= 2.738612788 = 3

Sy= √ Σ (Yi−Yprom )2n−1

= 131053.42 = 131053

c) Pronosticar la población en el año 15.

Para x = 15Y = 915833 + 46833*X Y = 915833 + 46833*15

PROYECTOS I 2013

8

R=n∑ XY−∑ X∑Y

√n∑ X2−¿¿¿¿

Σ XY−n∗Xprom∗YpromΣ x2−n∗Xprom2

Page 9: Correlacion y Regresion

Ingeniería de proyectos

Y = 1618328 habitantes

4. ¿CUÁL DE LAS SIGUIENTES SITUACIONES ES INCONSISTENTE?

a) Y = 499 + 0.21X y r = 0.75 b) Y = 100 + 0.9X y r = -0.7 c) Y = -20 + X y r = 0.4 d) Y = -7-4X y r = -0.9

Solución

CORRELACIÓN VALOR O RANGO

Perfecta |R| = 1

Excelente 0.9 <= |R| < 1

Buena 0.8 <= |R| < 0.9

Regular 0.5 <= |R| <0.8

Mala |R|< 0.5

Respuesta: Como se puede apreciar en las ecuaciones anteriores, la alternativa que es inconsistente es la “C” por presentar coeficiente de correlación menor de 0.5, lo cual indica que la correlación es mala.

5. Los ingresos de Telefónica se estiman mediante el Producto Nacional Bruto. La ecuación de regresión es Y = 0.078 + 0.06X en donde el PNB se mide en miles de millones de dólares.

Interprete la pendiente.

Interprete la intersección con Y.

SOLUCION

Asumiendo datos:

X Y

0 0.078

100 60.078

150 90.078

200 120.078

PROYECTOS I 2013

9

Page 10: Correlacion y Regresion

Ingeniería de proyectos

250 150.078

300 180.078

0 50 100 150 200 250 300 3500

20

40

60

80

100

120

140

160

180

200

a) Interprete la pendiente

Como la pendiente es positiva (ascendente m =0.06) los ingresos de telefónica van en aumento.

b) Interprete la intersección con Y.

Si comenzó con una inversión de telefónica de 0.078 miles de millones de dólares (inversión) (ano = 0).

6. Considere los datos de la tabla siguiente:

Ventas semanales (en US$) Gastos de publicidad (en US$)1,250.00 41,000.001,380.00 54,000.001,425.00 63,000.00

PROYECTOS I 2013

10

Page 11: Correlacion y Regresion

Ingeniería de proyectos

1,425.00 54,000.001,450.00 48,000.001,300.00 46,000.001,400.00 62,000.001,510.00 61,000.001,575.00 64,000.001,650.00 71,000.00

a) ¿Existe una relación significativa entre los gastos de publicidad y las ventas?b) Establezca la ecuación de predicción.c) Pronostique las ventas para un gasto de publicidad de US$50.00.d) ¿Qué porcentaje de los gastos en publicidad explican las variaciones en las ventas?

SOLUCIÓN

a) ¿Existe una relación significativa entre los gastos de publicidad y las ventas?

Diagrama de Dispersión: Y=f(x)X = Gastos en publicidadY = Ventas Mensuales

PROYECTOS I 2013

11

Page 12: Correlacion y Regresion

Ingeniería de proyectos

35000 40000 45000 50000 55000 60000 65000 70000 750000

200

400

600

800

1000

1200

1400

1600

1800

Grafico de Dispersion

Gastos de publicidad

Vent

as se

man

ales

Si existe una relación significativa debido a que el grafico de dispersión es muy homogéneo es decir no existe mucha diferencia entre gastos y ventas.

b) Establezca la ecuación de predicción.

NUMERO Gastos de publicidad

Ventas semanales

XY X2 Y2 (Xi-Xprom)2 (yi-yprom)2

PROYECTOS I 2013

12

Page 13: Correlacion y Regresion

Ingeniería de proyectos

(en US$) (en US$)  X Y1 41000 1250 51250000 1681000000 1562500 237160000 34782.252 54000 1380 74520000 2916000000 1904400 5760000 3192.253 63000 1425 89775000 3969000000 2030625 43560000 132.254 54000 1425 76950000 2916000000 2030625 5760000 132.255 48000 1450 69600000 2304000000 2102500 70560000 182.256 46000 1300 59800000 2116000000 1690000 108160000 18632.257 62000 1400 86800000 3844000000 1960000 31360000 1332.258 61000 1510 92110000 3721000000 2280100 21160000 5402.259 64000 1575 100800000 4096000000 2480625 57760000 19182.25

10 71000 1650 117150000 5041000000 2722500 213160000 45582.25TOTAL 564000 14365.00 818755000 32604000000 20763875 794400000 128552.5

XPROM YPROM

56400 1436.50

Formulas paramétricas:

b =

b = 0.0107867573 = 0.0108

a = Yprom – b*Xprom

a= 828.1268882 = 828.127

El ajuste lineal será:

Y = 828.127 + 0.0108*X (SI SE AJUSTA)

Dónde: X = Año Y = Habitantes

Calculo del coeficiente de correlación.

R = nΣXY−ΣXΣY

√(nΣx2−(Σx ) 2 )∗(nΣy2−(Σy ) 2) = 0.848

PROYECTOS I 2013

13

R=n∑ XY−∑ X∑Y

√n∑ X2−¿¿¿¿

Σ XY−n∗Xprom∗YpromΣ x2−n∗Xprom2

Page 14: Correlacion y Regresion

Ingeniería de proyectos

Como: -1<R<1 (OK) Se ajusta

Coeficiente de determinación:

Coeficiente de determinación = R2

R2 =0.719

Calcular la desviación estándar.

Sx= √ Σ (Xi−Xprom )2n−1

= 9395.034

Sy= √ Σ (Yi−Yprom )2n−1

= 119.5140624

c) Pronostique las ventas para un gasto de publicidad de US$50.00.

Para x =50Y = 828.127 + 0.0108*X Y = 828.127 + 0.0108*50 Y = 828.667 Las ventas para un gasto de publicidad de 50.00 dólares serán de 829

dólares.

d) ¿Qué porcentaje de los gastos en publicidad explican las variaciones en las ventas?

Coeficiente de variación

C.V(X) = Sx / Xprom = 0.16657862 = 16.65 %

C.V(Y) = Sx / Xprom = 0.083198094 = 8.31 %

CV (Y) < CV (X)

Esto significa que las ventas semanales son más homogéneas, es decir, tienen menos discrepancia que los gastos en publicidad.

7) En la siguiente tabla se presenta la información de una empresa de órdenes por correo para 12 ciudades:

PROYECTOS I 2013

14

Page 15: Correlacion y Regresion

Ingeniería de proyectos

Ciudades Número de Órdenes Recibidas por Correo

Número de Catálogos Distribuidos

A 24,000 6,000B 16,000 2,000C 23,000 5,000D 15,000 1,000E 32,000 10,000F 25,000 7,000G 18,000 15,000H 18,000 3,000I 35,000 11,000J 34,000 13,000K 15,000 2,000L 32,000 12,000

a) Determine si existe una relación lineal significativa entre estas dos variables.b) Determine la línea de regresión.c) Determine el error estándar de la estimación.d) ¿Qué porcentaje de la variación de los datos independientes explica la variación de

los datos dependientes?e) Pronostique las órdenes por correo recibidas cuando se distribuyeron 10,000

catálogos.f) Calcule la varianza explicada para la variable Y.

SOLUCION

a) Determine si existe una relación lineal significativa entre estas dos variables.

0 2,000 4,000 6,000 8,000 10,000 12,000 14,000 16,0000

5,000

10,000

15,000

20,000

25,000

30,000

35,000

40,000

Grafico de Dispersion

Numero de catalogos distribuidos

Num

ero

de o

rden

es re

civid

as p

o co

rreo

PROYECTOS I 2013

15

Page 16: Correlacion y Regresion

Ingeniería de proyectos

Para determinar si existe una relación lineal significativa procederemos a ajustar los datos a una tendencia lineal

b) Determine la línea de regresión.Ciudade

sNumer

oNúmero

de CatálogosDistribuido

s

Número de Ordenes

Recibidas por Correo

XY X2 Y2 (Xi-Xprom)2

(yi-yprom)2

  X Y

A 1 6,000 24,000 144000000 36000000 576000000 1562500 669421.488

B 2 2,000 16,000 32000000 4000000 256000000 27562500 51578512.4

C 3 5,000 23,000 115000000 25000000 529000000 5062500 33057.8512

D 4 1,000 15,000 15000000 1000000 225000000 39062500 66942148.8

E 5 10,000 32,000 320000000 100000000

1024000000

7562500 77760330.6

F 6 7,000 25,000 175000000 49000000 625000000 62500 3305785.12

G 7 15,000 18,000 270000000 225000000

324000000 60062500 26851239.7

H 8 3,000 18,000 54000000 9000000 324000000 18062500 26851239.7

I 9 11,000 35,000 385000000 121000000

1225000000

14062500 139669421

J 10 13,000 34,000 442000000 169000000

1156000000

33062500 117033058

K 11 2,000 15,000 30000000 4000000 225000000 27562500 66942148.8

PROYECTOS I 2013

16

Page 17: Correlacion y Regresion

Ingeniería de proyectos

L 12 12,000 32,000 384000000 144000000

1024000000

22562500 77760330.6

TOTAL 78 87,000 287000.00 2366000000

887000000

7513000000

256250000

655396694

Formulas paramétricas:

b =

b = 1.3626607539 = 1.363

a = Yprom – b*Xprom

a= 13302.5277 = 13302.528

El ajuste lineal será:

Y = 13302.528+ 1.363*X (SI SE AJUSTA)

Dónde: X = Catálogos Y = Ordenes

Calculo del coeficiente de correlación.

R = nΣXY−ΣXΣY

√(nΣx2−(Σx ) 2 )∗(nΣy2−(Σy ) 2) = 0.6995

Como: -1<R<1 (OK) Se ajusta

Coeficiente de determinación:

Coeficiente de determinación = R2

R2 =0.489326238

Calcular la desviación estándar.

PROYECTOS I 2013

R=n∑ XY−∑ X∑Y

√n∑ X2−¿¿¿¿

17

Σ XY−n∗Xprom∗YpromΣ x2−n∗Xprom2

XPROM YPROM

7,250 23181.82

Page 18: Correlacion y Regresion

Ingeniería de proyectos

Sx= √ Σ (Xi−Xprom )2n−1

= 4826.536496

Sy= √ Σ (Yi−Yprom )2n−1

= 7680.65259

c) Determine el error estándar de la estimación

S yx = 6863.812365

d) ¿Qué porcentaje de la variación de los datos independientes explica la variación de los datos dependientes?

Coeficiente de variación

C.V(X) = Sx / Xprom = 0.665729172 = 67%

C.V (Y) = Sx / Xprom = 0.332972438 = 33%

Coeficiente de variación

CV (X) < CV (Y)

Esto significa que el número de órdenes son más homogéneas, es decir, tienen menos discrepancia que el número de catálogos distribuidos.

e) Pronostique las órdenes por correo recibidas cuando se distribuyeron 10,000 catálogos.

Para x =10000Y = 13302.528+ 1.363*X Y = 13302.528+ 1.363*10000

Y = 26932.528

PROYECTOS I 2013

18

Page 19: Correlacion y Regresion

Ingeniería de proyectos

f) Calcule la varianza explicada para la variable Y.

La desviación estándar de la variable “Y” será el cuadrado de su desviación estándar:

Sy2= Σ (Yi−Yprom )2

n−1 = 59581517.66

PROYECTOS I 2013

19