regresión correlacion 23-04

22
REGRESIÓN Y CORRELACIÓN

Upload: dyjohaner-trematerra

Post on 21-Jan-2018

884 views

Category:

Health & Medicine


2 download

TRANSCRIPT

Objetivo TerminalObjetivo Terminal

Al finalizar la unidad el estudiante será capaz de analizar el coeficiente de correlaciòn de Pearson y la ecuaciòn de regresión

Objetivo de la Unidad Definir medidas de correlación y su aplicación en el

estudio entre variables Calcular e interpretar las medidas de correlación en

ejemplos que se presenten Definir coeficiente de regresión interpretando el

significado de su valor en datos que se presenten Predecir un valor mediante la aplicación de la ecuación de

regresión en datos que se le presenten Valorar la importancia de los parametros biologicos

utilizando medidas de asociación y predicción.

Cuando se plantean estudios correlaciónales es indispensables contar con pruebas estadísticas apropiadas para conocer si existe relación o independencia entre dos variables que podrían estar asociadas.

Cuando se plantean estudios correlaciónales es indispensables contar con pruebas estadísticas apropiadas para conocer si existe relación o independencia entre dos variables que podrían estar asociadas.

Características

• Solo mide relaciones lineales. Si la relación entre las variables es lineal y al menos una de ella se distribuye normalmente

•Cuando se busca analizar la relación entre dos variables medidas en escala numérica.

•Es una prueba estadística para analizar la relación entre dos variables mutuamente dependientes.

•Su principal objetivo es determinar que intensa es la relación entre dos variables

•Se altera de manera importante ante la presencia de valores extremos

•No implica causalidad

COEFICIENTE DE CORRELACION DE PEARSON (ϒ)

COEFICIENTE DE CORRELACION DE PEARSON (ϒ)

Característ icas

• Sus valores oscilan entre – 1 y + 1 ambos extremos representan relaciones perfectas entre las variables.

• El cero (0) representa la ausencia de relación. • El signo posit ivo o negativo indican la dirección es

decir:• Un valor posit ivo (+) indica que las dos variables

aumentan o disminuyen al mismo tiempo. • Un valor negativo (-) indica que cuando una de las

variable aumenta la otra disminuye o viceversa.• El valor numérico indica la magnitud de la correlación

0

No hay correlación

-0,25 +0,25

Escasa

-0,5 +0,5

Cierta C.Cierta C.

+0,75-0,95-1 -0,75 +0,95 +1

Moderada. Moderada.Muy B. Muy B.Excel.. Excel..

PerfectaPerfecta

Escasa

VALOR TIPO DE RELACIÓN

< 0,50 ESCASA O NULA

ENTRE 0,51 y 0,80 MODERADA A BUENA

ENTRE 0,81 y 0,95 MUY BUENA

> 0,95 EXCELENTE

Formula:

∑∑∑

−−

−−=

22 )()(

))((

YYXX

YYXXγ

1. Elaborar el diagrama de dispersión

2.Obtener el promedio para cada una de las variables

3.Estimar en cuánto difiere cada observación

( x ó y) de su promedio

PASOS PARA CALCULAR EL COEFICIENTE DE CORRELACIÓN DE PEARSON

4. Elevar al cuadrado las diferencias o desviaciones y realizar la sumatoria.

5. Calcular el producto de las desviaciones obtenidas, respetando los signos y realizar la sumatoria de esos productos

6. Calcular el coeficiente de correlación (asociación entre variables)

PASOS PARA CALCULAR EL COEFICIENTE DE CORRELACIÓN DE PEARSON

Peso del niño al nacer (Kgs)

Y

Tensión Arterial de la madre (mmhg)

X

2,4002,5002,6002,7002,8002,9003,0003,1003,2003,300

180170160150140130120110100 90

Tensión arterial de la madre y el peso del niño al nacer en la Maternidad del Hospital AMP del Estado Lara.

Paso1: Representar los datos en un diagrama de dispersión

TA

20018016014012010080

PE

SO

3,4

3,2

3,0

2,8

2,6

2,4

2,2

Peso del niño al nacer según tensión arterial de la madrePeso del niño al nacer según tensión arterial de la madre

Y X (y- y) (x-x) (y-y)2 (x- x)2 ∑ (y-y)(x-x)

∑Media

2,4002,5002,6002,7002,8002,9003,0003,1003,2003,300

28.52,85

18017016015014013012011010090

1350135

-0.45-0.35-0.25-0.15-0.050.050.150.250.350.45

453525155-5

-15-25-35-45

. 202.122.062.022.002.002.022.062.122.202

.821

202512256252252525

225625

12252025

8250

-20,25-12,25-6,25-2,25-0.25-0.25-2.25-6.25

-12.25-20.25

-82.5

γ = - 1 ; Este resultado indica una relación negativa y excelente entre las variables

∑∑

∑∑∑

−=

−−

−−=

821.08250

00.82

)()(

))((22

γ

γYYXX

YYXX

A partir de los datos anteriores, se sustituyen en la fórmula y obtendremos los siguientes resultados:

Pasos: 6

Se simboliza: r2

Es el porcentaje de variación de una variable debido a la variación de otra donde “Y” es la variable dependiente y “X” la Independiente

EJ: El valor obtenido (- 1) se eleva al cuadrado y se multiplica por 100Es decir: (- 1)2 x 100 = 100

¿Qué significa? 100% de las variaciones del peso del niño al nacer son explicadas por la tensión arterial de la madre

Coeficiente de Regresión

1. Estima el efecto de una variable sobre otra. Una llamada variable dependiente (Y), y otra denominada independiente, explicativa o predictora (X).

2. Predice la relación entre variables.

3. Expresa que los valores de la variable dependiente cambian “b” unidades por cada unidad de cambio de la variable independiente.

1. El coeficiente de regresión puede tener cualquier valor.

2. Si es positivo indica que ambas variables aumentan a la vez.

3. Si es negativo indica que si una variable aumenta la otra disminuye o viceversa.

4. Si fuera cero (0) para cualquier valor de X habría siempre el mismo valor en la variable Y o para cada valor X se pudieran observar cualquier valor en la variable Y

CALCULO COEFICIENTE DE REGRESIÓN

Fórmula:

 

b= ∑(X-X)* (Y-Y) ; b= -82.50

(X-X)2 8250

b= - 0.01

Este coeficiente de regresión significa:

Por cada unidad (mmhg) que aumenta la tensión arterial de la madre, el peso del niño al nacer disminuye en 0.01 Kgs.

y

x

b

a

Permite predecir los valores de la variable dependiente conociendo los valores de la variable independiente:

Formula:Y = a + b x, donde a= (y – b.x)

X = variable independiente predictora o explicativa

Y = variable dependiente o respuesta.

a = punto donde la recta corta el eje de las ordenadas, es decir el valor que toma la variable Y cuando la variable X vale cero (0)

b = Pendiente de la recta: indica la cantidad en que varia la variable Y por cada unidad de variación de la variable X

Ecuación de Regresión Lineal Simple

Ejemplo, si quisiéramos predecir el peso de un niño al nacer hijo de madre con una de tensión arterial de 85 mmhg:

Al sustituir los valores en la fórmula obtendremos lo siguiente:

Y = [2.850 – (135 * -0.01)] + (-0,01) * 85

entonces:

 Y = 4,2 - (-0.01 x 85) ; 3,350 Kgs

Significa: El peso de un niño al nacer cuya madre presente una tensión arterial de 85 mmhg puede estimarse en 3,350 Kgs.

Los siguientes datos corresponden a mujeres embarazadas que asisten a la consulta prenatal del Ambulatorio La Carucieña, realiza los cálculos e interpreta los resultados de los siguientes estadísticos:

a) Coeficiente de Regresión

b) Coeficiente de Correlación

c) Coeficiente de Determinación

e)  Estima la presión sanguínea una embarazada de 38 años.

Presión Sistolica (Y)

Edad (X)

139171137111133128183130133144

41414647484949505151

Ejercicio de Aplicación: