regresión y correlaciónlineal

Upload: allisonmontenegrolozano

Post on 04-Mar-2016

27 views

Category:

Documents


0 download

DESCRIPTION

otros

TRANSCRIPT

Regresin y correlacin linealLa regresin como una tcnica estadstica, una de ellas la regresin lineal simple y la regresin multifactorial, analiza la relacin de dos o ms variables continuas, cuando analiza las dos variables a esta se le conoce como variable bivariantes que pueden corresponder a variables cualitativas, la regresin nos permite el cambio en una de las variables llamadas respuesta y que corresponde a otra conocida como variable explicativa, la regresin es una tcnica utilizada para inferir datos a partir de otros y hallar una respuesta de lo que puede suceder.Siendo as la regresin una tcnica estadstica, por lo tanto para interpretar situaciones reales, pero a veces se manipula de mala manera por lo que es necesario realizar una seleccin adecuada de las variables que van a construir las formulas matemtica, que representen a la regresin, por eso hay que tomar en cuenta variables que tiene relacin, de lo contraria se estara matematizando un galimatas. Se pueden encontrar varios tipos de regresin, por ejemplo:Regresin lineal simpleRegresin mltiple ( varias variables) 1.Simple 2.Mltiple, etc.Regresin logsticaLa regresin lineal tcnica que usa variables aleatorias, continuas se diferencia del otro mtodo analtica que es la correlacin, por que esta ltima no distingue entre las variables respuesta y la variable explicativa por que las trata en forma simtrica.La mate matizacin nos da ecuaciones para manipular los datos, como por ejemplo medir la circunferencia de los nios y nias y que parece incrementarse entre las edades de 2 meses y 18 aos, aqu podemos inferir o predecir que las circunferencias del crneo cambiara con la edad, en este ejercicio la circunferencia de la cabeza es la respuesta y la edad la variable explicativa.En la regresin tenemos ecuaciones que nos representan las diferentes clases de regresin: Regresin Lineal: y = A + BxRegresin Logartmica: y = A + BLn(x)Regresin Exponencial: y = Ac(bx)Regresin Cuadrtica: y = A + Bx +Cx2

+2 SD (98%)Media (50%)-2 SD (2%)Para obtener un modelo de regresin es suficiente establecer la regresin para eso se hace uso del coeficiente de correlacin: R.R = Coeficiente de correlacin, este mtodo mide el grado de relacin existente entre dos variables, el valor de R vara de -1 a 1, pero en la prctica se traba con un valor absoluto de R. El valor del coeficiente de relacin se interpreta de modo que a media que R se aproxima a 1, es ms grande la relacin entre los datos, por lo tanto R (coeficiente de correlacin) mide la aproximacin entre las variables.El coeficiente de correlacin se puede clasificar de la siguiente manera: CORRELACIN VALOR O RANGO1) Perfecta 1) R = 12) Excelente 2) R = 0.9 < = R < 13) Buena 3) R = 0.8 < = R < 0.94) Regular 4) R = 0.5 < = R < 0.85) Mala 5) R < 0.5GRAFICOS DE RECTA DE REGRESIN

Por ltimo se pueden graficar las lneas de tendencia, herramienta muy til para el mercadeo por que es utilizada para evaluar la resistencia que proyectan los precios. Cuando una lnea de tendencia central se rompe ya sea con tendencia al alza o en la baja es porque ocurre un cambio en los precios, por lo tanto las lneas de tendencia pueden ser alcista cuando se unen los puntos sucesivos y bajista cuando se unen los puntos mximos. Tambin existen grficos que representan la dispersin de datos dentro de las coordenadas cartesianas, sea las nubes de puntos y que pueden darse segn la relacin que representa, que puede ser lineal, exponencial y sin relacin, esta ltima cuando los puntos estn dispersos en todo el cuadro sin agruparse lo cual sugiere que no hay relacin.LOS GRFICOS SIGUIENTES NOS MUESTRAN ESTA RELACIN:Relacin lneas:

Relacin Exponencial:

Sin Relacin

Matemticamente las ecuaciones seran:Ajuste Lineal : Y = Bx + AAjuste Logartmico : Y =BLnX + AAjuste Exponencial : Y = AC BXEn el modelo de regresin lineal simple se utiliza la tcnica de estimacin de los mnimos cuadrados, este modelo tiene solo una variable de prediccin y se supone una ecuacin de regresin lineal.En el siguiente ejemplo la relacin entre la calificacin y salario la variable repuesta es el salario inicial y la variable predictiva o de prediccin es la calificacin promedia, si se desea determinar una ecuacin de regresin para el salario inicial promedio como una funcin de la calificacin promedio se podr graficar y procesar los datos en una computadora, estos datos son:CP = Calificacin PromedioSI = Salario InicialDe este grupo de datos se obtiene el siguiente grfico de dispersinRegresin simple y correlacinLa Regresin y la correlacin son dos tcnicas estadsticas que se pueden utilizar para solucionar problemas comunes en los negocios.Muchos estudios se basan en la creencia de que es posible identificar y cuantificar alguna Relacin Funcional entre dos o ms variables, donde una variable depende de la otra variable.Se puede decir que Y depende de X, en donde Y y X son dos variables cualquiera en un modelo de Regresin Simple."Y es una funcin de X" Y = f(X)Como Y depende de X,Y es la variable dependiente, yX es la variable independiente.En el Modelo de Regresin es muy importante identificar cul es la variable dependiente y cul es la variable independiente.En el Modelo de Regresin Simple se establece que Y es una funcin de slo una variable independiente, razn por la cual se le denomina tambin Regresin Divariada porque slo hay dos variables, una dependiente y otra independiente y se representa as:Y = f (X) "Y est regresando por X"La variable dependiente es la variable que se desea explicar, predecir. Tambin se le llama regresando variable de respuesta. La variable Independiente X se le denomina variable explicativa regresor y se le utiliza para explicar y.ANLISIS ESTADSTICO: REGRESIN LINEAL SIMPLEEn el estudio de la relacin funcional entre dos variables poblacionales, una variable X, llamada independiente, explicativa o de prediccin y una variable Y, llamada dependiente o variable respuesta, presenta la siguiente notacin: Y = a + b X + eDonde:a es el valor de la ordenada donde la lnea de regresin se intercepta con el eje Y.b es el coeficiente de regresin poblacional (pendiente de la lnea recta)e es el errorTIPOS DE CORRELACINCada conjunto de correlaciones se basa en unpo de correlacin, que no es ms que una lista de propiedades. stas pueden ser propiedades de datos, que se encuentran en el propio mensaje, o propiedades de contexto, que describen detalles del sistema o de mensajes no relacionados con los datos transmitidos en el mensaje.Puede usar un tipo de correlacin en ms de un conjunto de correlaciones. Si necesita establecer correlaciones entre distintos valores para las propiedades de un tipo de correlacin, deber crear un conjunto de correlaciones nuevo: cada uno de ellos se puede inicializar una sola vez.Puede promocionar las propiedades de un esquema de propiedades para declarar que algunas de las propiedades de un mensaje estn accesibles para la orquestacin. Para obtener ms informacin, veaomocionar propiedades.TIPOS DE CORRELACIN1rrelacin directaLa correlacin directa se da cuando al aumentar una de las variables la otra aumenta.La recta correspondiente a la nube de puntos de la distribucin es una recta creciente.

2rrelacin inversaLa correlacin inversa se da cuando al aumentar una de las variables la otra disminuye.La recta correspondiente a la nube de puntos de la distribucin es una recta decreciente.

3rrelacin nulaLa correlacin nula se da cuando no hay dependencia de ningn tipo entre las variables.En este caso se dice que las variables son incorreladas y la nube de puntos tiene una forma redondeada.

GRADO DE CORRELACINElado de correlacindica la proximidad que hay entre los puntos de la nube de puntos. Se pueden dar tres tipos:1.rrelacin fuerteLa correlacin ser fuerte cuanto ms cerca estn los puntos de la recta.

2.rrelacin dbilLa correlacin ser dbil cuanto ms separados estn los puntos de la recta.

3.rrelacin nulaEleficiente de correlacin lineal el cociente entre lavarianzael producto de lassviaciones tpicas ambas variables.Eleficiente de correlacin lineal expresa mediante la letra

Propiedades del coeficiente de correlacin1.eficiente de correlacin vara al hacerlo la escala de medicin.Es decir, si expresamos la altura en metros o en centmetros el coeficiente de correlacin no vara.2. signo deleficiente de correlacin el mismo que el de lavarianza.Si la covarianza es positiva, la correlacin es directa.Si la covarianza es negativa, la correlacin es inversa.Si la covarianza es nula, no existe correlacin. 3.Eleficiente de correlacin lineal un nmero real comprendido entre -1 y 1.-1 = r = 14. eleficiente de correlacin linealma valores cercanos a -1 la correlacin eserte e inversa, y ser tanto ms fuerte cuanto ms se aproxime r a -1.5. eleficiente de correlacin linealma valores cercanos a 1 la correlacin eserte y directa, y ser tanto ms fuerte cuanto ms se aproxime r a 1.6. eleficiente de correlacin linealma valores cercanos a 0, la correlacin eseacute;bil.7. r = 1 -1, los puntos de la nube estn sobre la recta creciente o decreciente. Entre ambas variables hay dependencia funcional.Ejemplos: Las notas de 12 alumnos de una clase en Matemticas y Fsica son las siguientes:Matemticas23445667781010

Fsica1324446467910

Hallar eleficiente de correlacin la distribucin e interpretarlo.xiyixiixi2yi2

21241

33999

428164

44161616

54202516

64243616

66363636

74284916

76424936

87566449

1099010081

1010100100100

7260431504380

1llamos lasdias aritmticas.

2lculamos lavarianza.

3lculamos lassviaciones tpicas.

4plicamos la frmula deleficiente de correlacin lineal.Recta de regresin de Y sobre XLa recta de regresin de Y sobre X se utiliza para estimar los valores de la Y a partir de los de la X.Landiente la recta es el cociente entre la covarianza y la varianza de la variable X.

Recta de regresin de X sobre YLacta de regresin X sobre Y se utiliza para estimar los valores de la X a partir de los de la Y.Landiente la recta es el cociente entre la covarianza y la varianza de la variable Y.

Si la correlacin es nula, r = 0, las rectas de regresin son perpendiculares entre s, y sus eucaciones son:y =mg src="image038.png" alt="Monografias.com" />x =mg src="image039.png" alt="Monografias.com" />Ejemplo:Las notas de 12 alumnos de una clase en Matemticas y Fsica son las siguientes:Matemticas23445667781010

Fsica1324446467910

Hallar lasctas de regresinrepresentarlas.xiyixiixi2yi2

21241

33999

428164

44161616

54202516

64243616

66363636

74284916

76424936

87566449

1099010081

1010100100100

7260431504380

1llamos lasdias arimticas.

2lculamos lavarianza.

3lculamos lasrianzas.

4Recta de regresin de Y sobre X.

4Recta de regresin de X sobre Y.

Una compaa de seguros considera que el nmero de vehculos (y) que circulan por una determinada autopista a ms de 120 km/h , puede ponerse en funcin del nmero de accidentes (x) que ocurren en ella. Durante 5 das obtuvo los siguientes resultados:Accidentes xi57219

Nmero de vehculos yi151810820

/font>Calcula el coeficiente de correlacin lineal.Si ayer se produjeron 6 accidentes, cuntos vehculos podemos suponer que circulaban por la autopista a ms de 120 km / h?Es buena la prediccin?Construimos una tabla, teniendo en cuenta que la frecuencia absoluta es uno. Debemos conocer la media aritmtica de las dos variables, las varianzas, las desviaciones tpicas y la covarianza.font>font>Media aritmticaVarianzaCovarianza

font>fixiyixi2yi2xi . yi

font>15152522575

font>171849324126

font>1210410020

font>1181648

font>192081400180

524711601113409

font>

EJERCICIOS REGRESION Y CORRELACION LINEAL Correlacin y regresin El nmero de espaoles (en millones) ocupados en la agricultura, para los aos que se indican, era:Ao19801982198419861988199019921994

Ocupados2,12,041,961,741,691,491,251,16

a) Podra explicarse su evolucin mediante una recta de regresin?b) Qu limitaciones tendran las estimaciones hechas por esa recta?[sol] a) Si; b) No vale para hacer estimaciones alejadas de los aos considerados. 2. Asocia las rectas de regresin y = x +16, y = 2x 12, y = 0,5x + 5 a las nubes de puntos siguientes:

3. Asigna los coeficientes de correlacin lineal r = 0,4, r = 0,85 y r = 0,7, a las nubes del problema anterior.[sol] a) Respectivamente: (c), (b), (a). b) Respectivamente: (a), (b), (c)Tipo II. Clculo de la correlacin y regresin4. [S] a) Calcula la recta de regresin de Y sobre X en la distribucin siguiente realizando todos los clculos intermedios.X107530

Y246810

b) Cul es el valor que correspondera segn dicha recta a X = 7? [sol] a) y = 0,8276x +10,138; b) 4,3448.5. [S] El nmero de bacterias por unidad de volumen, presentes en un cultivo despus de un cierto nmero de horas, viene expresado en la siguiente tabla:X: N de horas012345

Y: N de bacterias121923345662

Calcula: a)Las medias y desviaciones tpicas de las variables, nmero de horas y nmero de bacterias. b)La covarianza de la variable bidimensional. c)El coeficiente de correlacin e interpretacin. d)La recta de regresin de Y sobre X.

6. La tabla siguiente muestra las notas obtenidas por 8 alumnos en un examen, las horas de estudio dedicadas a su preparacin y las horas que vieron la televisin los das previos al examen.Nota56735849

Horas de estudio71094810514

Horas de TV762119395

a) Representa grficamente los diagramas correspondientes a nota-estudio y nota-TV. b) Se observa correlacin entre las variables estudiadas? De qu tipo? En qu caso estimas que es ms fuerte?[sol] b) S. Directa; inversa. 7. Con los datos del problema anterior, halla el coeficiente de correlacin de nota-estudio y nota-TV. Qu puede deducirse con ms precisin conociendo la nota que obtuvo una persona en el examen: el tiempo que dedic al estudio o el que dedic a ver la televisin?[sol] 0,943382 y (0,846283. El tiempo que dedic al estudio.8. Con los mismos datos, halla las rectas de regresin correspondientes y estima para un alumno que sac un 2 en el examen: a) Las horas que estudi. b) Las horas que vio la TV. [sol] a) Est = (0,246753 + 1,46753 ota; 2,7 h. b) TV = 14,1299 ( 1,2987 ota; 11,5 h.Tipo III. Estimacin a partir del a recta de regresin9. La altura, en cm, de 8 padres y del mayor de sus hijos varones, son:Padre170173178167171169184175

Hijo172177175170178169180187

a) Calcula la recta de regresin que permita estimar la altura de los hijos dependiendo de la del padre; y la del padre conociendo la del hijo.b) Qu altura cabra esperar para un hijo si su padre mide 174? Y para un padre, si su hijo mide 190 cm?[sol] a) H = 68,1853 + 0,621859 ; P = 77,4406 + 0,545082 . b) 176,4 cm; 181 cm.10. [S] Durante su primer ao de vida han pesado a Marta cada mes. En la tabla siguiente se dan sus pesos:x123456789101112

y3,23,74,25,35,76,56,87,27,97,788,5

En esta tabla, x representa la edad en meses e y el peso en kilogramos. a) Calcula la media y la desviacin tpica de los pesos. b) Determina la ecuacin de la recta de regresin de y sobre x, explicando detalladamente los clculos que haces y las frmulas que utilizas.[sol] a) 6,225; 1,7181 b) y = 0,48706x + 3,0590911. [S] Utilizando la recta de regresin de x sobre y correspondiente a la distribucin siguiente:x = altura sobre el nivel del mar0184231481911

y = temperatura media en C2018171210

Calcula la altitud de una ciudad en la que la temperatura media es de 15.[sol] 392,7 m.CONCLUSIONRegresin y correlacin lineal son dos herramientas para investigar la dependencia de una variable dependiente y en funcin de una variable independiente x. y = f(x)y = variable dependiente que se desea explicar o predecir, tambin se llama regresor o respuestax = variable independiente, tambin se llama variable explicativa, regresor o predictorRegresin lineal - la relacin entre x y y se representa por medio de una lnea rectaRegresin curvilinea - la relacin entre x y y se representa por medio de una curva.