presentación regreción lineal

26
2013

Upload: valgo16

Post on 30-Jun-2015

389 views

Category:

Education


0 download

DESCRIPTION

Regresión Lineal

TRANSCRIPT

Page 1: Presentación regreción lineal

2013

Page 2: Presentación regreción lineal

Introducción El análisis de regresión es una técnica estadística usada para estudiar la relación entre variables. En la investigación social se utiliza para predecir una amplia gama de fenómenos, desde medidas económicas hasta diferentes aspectos del comportamiento humano.Tanto en el caso de dos variables (regresión simple) como en el de más de dos variables (regresión múltiple), el análisis de regresión se usa

Page 3: Presentación regreción lineal

para explorar y cuantificar la relación entre una variable llamada dependiente o criterio (y) y una o más variable llamadas independiente o predictoras (X₁, X₂ …Xκ), así como para desarrollar una ecuación lineal con fines predictivos.Regresión lineal Simple Es un modelo matemático para predecir el efecto de una variable sobre otra, ambas cuantitativas.Una variable es la dependiente y la otra independiente. Se gráfica con el diagrama de dispersión .Dice como es la entre las dos variables.

Page 4: Presentación regreción lineal

El análisis consiste en encontrar la mejor línea recta de esos puntos.La variable X o independiente o predictora, la variable Y es la variable dependiente o predicha Los valores de X son fijos (previamente seleccionados por el investigador)Para cada X existe un conjunto de valores de Y, que deben seguir una distribución normal es decir las valores de Y deben ser normales , para aplicar con validez los procedimientos de inferencia y/o estimación Todas las varianzas de las subpoblaciones de Y

Page 5: Presentación regreción lineal

son iguales.

La relación se puede representar gráficamente mediante una línea rectaSe supone que el error sigue una distribución normal con media cero y sigma² El modelo de regresión completo es

Y es el valor de la variable dependiente A o alfa es el intercepto, donde cruza el eje YB o beta es la pendiente o inclinaciónDiagrama de Dispersión

exy

Page 6: Presentación regreción lineal
Page 7: Presentación regreción lineal
Page 8: Presentación regreción lineal

El análisis de regresión múltiple es el estudio de la

forma en que una variable dependiente, , se

relaciona con dos o más variables independientes.

En el caso general emplearemos k para representar

la cantidad de variables independientes.

Los conceptos de un modelo de regresión y una

ecuación de regresión que presentamos

Page 9: Presentación regreción lineal

presentamos en el tema anterior se pueden aplicar al caso de la regresión múltiple. La ecuación que describe la forma en que la variable dependiente, , se relaciona con las variables independientes 1, 2 ,...,k y un término de error se llama modelo de regresión. El modelo de regresión múltiple tiene la forma siguiente:

kk xbxbxbby ...ˆ 22110

Page 10: Presentación regreción lineal

VARIABLE DEPENDIENTE (Y) VARIABLES INDEPENDIENTES (X1,X2,......)

Volumen de ventas, en unidades Precio unitarioGasto de Propaganda

Peso de los estudiantes EstaturaEdad

Consumo de bienes industriales por año

Ingreso disponibleImportación de bienes de consumo

Unidades consumidas de un bien por familia

Precio unitario del bienIngresoNúmero de integrantes por familia

Precio de una vivienda Nº de habitacionesNº de pisosÁrea construidaÁrea techada , etc.

Page 11: Presentación regreción lineal

Análisis de regresión múltiple para 2 variables independientesPara dos variables independientes, la formula general de la ecuación de la regresión múltiple es:

X₁ y X₂ son las variables independienteA es la intecepción en Y

Y a b X b X' 1 1 2 2

b1 es el cambio neto en Y para cada cambio unitario en X1, manteniendo X2 constante

Page 12: Presentación regreción lineal

Se denomina coeficiente de regresión parcial, coeficiente de regresión neta o bien coeficiente de regresión.B₂ es el cambio neto en Y para cada cambio unitario en X₂, manteniendo X₁ constante. Se denomina coeficiente de regresión parcial o bien coeficiente de regresión. El cálculo de ésos valores es por demás laborioso a mano

Page 13: Presentación regreción lineal

Análisis de regresión múltiple con k variables independientes.La ecuación general de regresión múltiple con k variables independientes es: El criterio de mínimos cuadrados se usa para el desarrollo de esta ecuación.Como estimar b₁, b₂, etc., es muy tedioso, existen muchos programas de cómputo que pueden utilizarse para estimarlos

Y a b X b X b Xk k' ... 1 1 2 2

Page 14: Presentación regreción lineal

Error Estándar Múltiple de la Estimación de regresiónEl error estándar múltiple de la estimación es la medida de la eficiencia de la ecuación Está medida en las mismas unidades que la variable dependienteEs difícil determinar cuál es un valor grande y cuál es uno pequeño para el error estándarLa formula es:

Donde Y es la observaciónY es el valor estimado en la ecuación de regresión′

)1()1(

)'( 2

12

kn

SSEkn

YYS kY

Page 15: Presentación regreción lineal

n es el número de observaciones y k es el número de variables dependientes.Regresión y correlación múltiple (suposiciones)Las variables independientes y dependientes tienen una relación linealLa variable dependiente debe ser continua y al menos con escala de intervaloLa variación en (Y - Y ) o residuo debe ser la misma ′para todos los valores de YCuando éste es el caso, se dice que la diferencia presenta homoscedasticidad Los residuos deben tener distribución normal con media igual a 0

Page 16: Presentación regreción lineal

Las observaciones sucesivas de la variable dependiente deben estar correlacionadas.La matriz de correlación se usa para mostrar todos los posibles coeficientes de correlación simple entre todas las variables.La matriz también es útil para analizar y localizar la correlación de las variables independientes.En la matriz se muestra qué tan fuerte están correlacionadas las variables independientes, con la variable dependiente.También es útil para verificar si existe correlación entre las variables independientes Multicolinealidad lo cual distorsionaría el error estándar

Page 17: Presentación regreción lineal

Enfoque Matricial Donde:

Xy

1

3

2

1

.

.

.

xnny

y

y

y

y

pnnkiii

k

k

k

x

xxxx

xxxx

xxxx

xxxx

X

.......1

........................

........................

........................

.......1

.......1

.......1

321

3333231

2232221

1131211

1

2

1

0

.

.

.

xpkb

b

b

b

Page 18: Presentación regreción lineal

Enfoque Matricial para Encontrar los Parámetros de la Ecuación de Regresión. Al ajustar un modelo de regresión múltiple es mucho más conveniente expresar las operaciones matemáticas en forma matricial. Supongamos que existen k variables independientes y n observaciones (X₁ , X₂, X₃….X¡ĸ, Y¡), i= 1, 2, 3, 4, …., n, y que el modelo que relaciona las variables independientes y la variable dependiente es:

Este modelo es un sistema de n ecuaciones que pueden expresarse en notación matricial como:

ikkiii xbxbxbby ...ˆ 22110

Page 19: Presentación regreción lineal

Correlación simple es una extensión de la regresión simpleMide la calidad de ajuste de una línea.Dice cuanto se relacionan los datos variablesR es el coeficiente de correlación.R² es el coeficiente de determinación

prueba de HipótesisHo; r=0, mediante la estadística FSi r es igual cero se concluye que no existe correlación entre las variables, pero puede ser no

totaliación

licadainiaciónr

var

exp var2

Page 20: Presentación regreción lineal

Lineal (exponencial, curva, etc.) Coeficiente de Pearson. puede variar de -1 a + 1-1 correlación negativa perfecta-0,9 correlación negativa muy fuerte-0,75 correlación negativa considerable-0,5 correlación negativa media-0,1 correlación negativa débil0,0 no existe correlación entre las variablesLos programas reportan el valor de p del coeficiente de para evaluar la significancia de la correlación

Page 21: Presentación regreción lineal
Page 22: Presentación regreción lineal

Ejemplo de regresión lineal simple

Temperatura media anual y tasa de mortalidad por 100,000 habitantes

y = -0,0592x + 4,6146R2 = 0,8395

-0,5

0

0,5

1

1,5

2

2,5

0 20 40 60 80 100

Temperatura

Tasa d

e m

ort

alid

ad

po

r

100,0

00

Page 23: Presentación regreción lineal

Correlación de SpearmanSon medidas de correlación para dos variables, por lo menos una de ellas es ordinalLos individuos u objetos se ordenan por rangos (jerarquías)Objetivo. Conocer si el desarrollo mental de 8 niños está asociado a la educación formal de su madre.Hipótesis.Ho. No habrá correlación significativa en el desarrollo mental de 8 niños dependiendo de la educación formal de la madreH1. Habrá una correlación significativa en el desarrollo mental de 8 niños dependiendo de la edu-

Page 24: Presentación regreción lineal

cación formal de la madre

Ejemplo: Correlación de Spearman Escolaridad Desarrollo Rango educ. Rango desarr. Dif. Dif al cuadrado

1o. Sec 90 5 7 -2 4 1o. Prim 87 4 2 2 4Profesional 89 8 6 2 46o. Prim. 80 2 5 -3 93o. Sec. 85 6 4 2 4 3 Prim. 84 3 3 0 0 Analf. 75 1 1 0 0Preparatoria 91 7 8 -1 1

N = 8 26

rsc = 0.69, rst = 0.714, rsc < rst no se rechaza HoConclusión: No hay una correlación significativa en el desarrollo mental de 8

niños dependiendo de la educación formal de la madre.

Page 25: Presentación regreción lineal

Caso: correlación de Spearman Material y Método: se realizó un estudio transversal y comparativo aplicado a una población de 21 departamentos del Perú realizada en forma aleatoria (37 hospitales y 21 Centros de Salud Cabeceras de red). Se utilizaron dos instrumentos: Encuesta de satisfacción del establecimiento de salud a puérperas usuarias de los establecimientos y la Lista de chequeo para la medición de procesos de calidad de atención en servicios materno prenatales. Para el análisis de los datos se realizó un análisis bivariado y se utilizó el coeficiente de correlación de Spearman.Resultados: El coeficiente de correlación de Spearman entre el Grado de de satisfacción de la usuaria de los

Page 26: Presentación regreción lineal

servicios de atención de parto y el Porcentaje de <cumplimiento del Protocolo de Atención de Parto resultó de 0.027, lo que revela la no existencia de relación directa entre dichas variables.Conclusiones: se demuestra la falta de correlación entre el nivel de satisfacción de usuarias y el nivel de cumplimiento de índices estandarizados de atención del parto en los Centros Hospitalarios.