correlacion y coorrelacion de pearson

12
1 TEMA 5. TÉCNICAS PARA EL ESTUDIO DE LA RELACIÓN ENTRE VARIABLES (I) CONCEPTO CORRELACIÓN Y CORRELACIÓN DE PEARSON Análisis de datos de la investigación educativa

Upload: elba-perez

Post on 28-Nov-2015

23 views

Category:

Documents


2 download

TRANSCRIPT

Page 1: Correlacion y Coorrelacion de Pearson

1

TEMA 5.

TÉCNICAS PARA EL ESTUDIO DE LA

RELACIÓN ENTRE VARIABLES (I)

CONCEPTO CORRELACIÓN Y

CORRELACIÓN DE PEARSON

Análisis de datos de la investigación educativa

Page 2: Correlacion y Coorrelacion de Pearson

2

ÍNDICE

1. Introducción…………………………………………….3

2. Objetivos………………………………………………..3

2.1 Generales…………………………………………...3

2.2 Específicos………………………………………….3

3. Desar rollo de los distintos apar tados………………….4

3.1 Definición…………………………………………..4

3.2 Condiciones de aplicación…………………………5

3.3 Propiedades………………………………………...5

3.4 Interpretación……………………………………...6

4. Actividades o problemas………………………………8

5. Soluciones a los problemas propuestos……………….8

6. Bibliografía……………………………………………12

Page 3: Correlacion y Coorrelacion de Pearson

3

1. Introducción

Hasta ahora hemos tratado la descripción de variables por separado,

examinado su distribución y frecuencias, caracterizando y determinando la

posición de individuos en el conjunto de la distribución. En este trabajo nos

ocuparemos del estudio conjunto de dos variables, podremos detectar relaciones

entre dos variables. La medida de las relaciones entre variables se encuentra en la

base de un conjunto de métodos de investigación a los que dan su nombre los

métodos correlaciónales. Por tanto este tema que seguidamente abordaremos se

centra en el concepto de correlación y el coeficiente de correlación de Pearson.

2. Objetivos.

2.1 Generales.

• Conseguir que los alumnos conozcan el concepto de correlación y sepan

calcular el concepto de correlación de Pearson.

2.2 Específicos.

• Los alumnos deben saber calcular la correlación de Pearson.

• Los alumnos deben conocer el concepto de correlación.

Page 4: Correlacion y Coorrelacion de Pearson

4

3. Desarrollo de los distintos apar tados

3.1 Definición

Hablamos de correlación cuando nos referimos a la relación existente entre

dos variables, su intensidad y su sentido (positivo o negativo).

La covarianza definida anteriormente como promedio de desviaciones

conjuntas de dos variables sobre sus respectivas medias, no resulta ser una

medida adecuada de la relación entre dos variables, pues el valor de Sxy esta

relacionado con el valor de la media de X y con el valor de la media de Y. por

este motivo, si cambiamos la unidad de medida, la covarianza se vera

modificada.

Podemos afirmar que el valor de la covarianza depende de la unidad de

medida. Para evitar el efecto de la unidad de medida sobre Sxy podemos dividir

las puntuaciones diferenciales por las respectivas desviaciones típicas Sx y Sy. El

nuevo índice de relación que obtengamos tendrá la ventaja de ser invariante ante

cualquier cambio en la unidad de medida. A este índice de correlación se le

denomina coeficiente de correlación de Pearson o también coeficiente de

correlación producto­momento.

La formula del coeficiente de correlación de Pearson también suele

expresarse de la siguiente forma, con objeto de eliminar errores que provengan de

la presencia de números decimales en el valor que adopta la media:

Page 5: Correlacion y Coorrelacion de Pearson

5

3.2 Condiciones de aplicación

Aplicar el coeficiente de correlación de Pearson exige que las variables

estén medidas al menos en una escala de intervalos y que se de una relación

lineal entre ellas. Es decir, que los puntos del diagrama de dispersión se

posicionen en la forma aproximada de una línea recta. Por tanto, usar el

coeficiente de correlación de Pearson presupone la sospecha de que entre los

grupos de puntuaciones se da una relación lineal.

3.3 Propiedades

a. El coeficiente de correlación de Pearson se encuentra comprendido

entre los valores ­1 y 1.

b. En el caso de que rxy valga 1, tendrá que cumplirse que para cada

pareja de valores, sus puntuaciones típicas son iguales: Zx = Zy. En el

polo opuesto, es decir, si rxy vale ­1, entonces se cumple que para todo

par de valores, las puntuaciones típicas son iguales pero de distinto

signo: Zx = ­Zy.

c. En el caso de que rxy es cero es que no hay relación lineal entre las variables medidas.

Page 6: Correlacion y Coorrelacion de Pearson

6

d. La transformación lineal de las variables no modifica el valor del

coeficiente de correlación, aunque sí podría cambiar su signo. Es decir,

si calculamos la correlación entre las variables x e y, el valor de esta

será, en valor absoluto, el mismo que obtengamos entre la variable

ax+b, donde a y b son constantes.

3.4 Interpretación

Al interpretar el coeficiente de correlación de Pearson nos situaremos en un

nivel meramente descriptivo.

Al igual que ocurría con la covarianza, la correlación entre dos variables es

positiva si ambas cavarían en el mismo sentido, es decir, cuando a puntuaciones

por encima de la media en X corresponde puntuaciones por encima de la media

en Y, y a puntuaciones por debajo de la media en X corresponden puntuaciones

por debajo de la media en Y. por el contrario, la correlación entre X e Y es

negativa, cuando cavarían en sentido opuesto, es decir, a puntuaciones por

encima de la media en X corresponde puntuaciones por debajo de la media en Y,

y viceversa.

Si tenemos en cuenta el valor de la correlación, podemos afirmar que, un

coeficiente de correlación de Pearson igual a 1 ó ­1, implica que en el diagrama

de dispersión correspondiente a las variables X e Y los puntos se disponen a lo

Page 7: Correlacion y Coorrelacion de Pearson

7

largo de una línea recta, y por tanto podemos decir que la covariación entre

ambas variables es total.

Un coeficiente de correlación igual o próximo a cero indica que no existes

relación lineal entre las dos variables, aunque podría existir otro tipo de

correlación no lineal.

Resulta difícil precisar a partir de que valor de rxy podemos considerar que existe una correlación lineal entre dos variables. Siempre debemos tener en

cuenta para la interpretación el tipo de variables a las que se aplica. Sin embargo,

para tener un referente, y siendo conscientes de que estos coeficientes no son

aplicables a todas las situaciones, tomamos los determinados por Bisquerra:

r = 1 correlación perfecta. 0´8 < r < 1 correlación muy alta 0´6< r < 0´8 correlación alta 0´4< r < 0´6 correlación moderada 0´2< r < 0´4 correlación baja 0< r < 0´2 correlación muy baja r = 0 correlación nula

Además debemos tener presente que la existencia de una correlación no

implica que necesariamente deba existir una relación causal directa. Por relación

causal directa se entiende que si X e Y están correlacionadas, entonces X es en

gran parte la causa de Y, o Y es en parte la causa de X.

No obstante, es habitual que tras encontrar una elevada correlación entre

variables se hipoteticen relaciones causa­efecto. Pero la existencia de una

relación de este tipo habrá de ser comprobada recurriendo a otras estrategias de

investigación y a otras técnicas estadísticas.

Page 8: Correlacion y Coorrelacion de Pearson

8

4. Actividades o problemas

1) El Equipo Directivo de un Centro de Educación Secundaria está

interesado en conocer la relación que existe entre el tiempo semanal

(horas) que dedican los alumnos al estudio y las calificaciones medias

de los mismos al final de trimestre. Eligiendo 11 alumnos al azar, han

encontrado los siguientes resultados. Calcular el coeficiente de

correlación de Pearson.

2) Para comprobar la fiabilidad de una prueba de razonamiento espacial,

un psicopedagogo se dispone a aplicarla en dos momentos distintos a un

grupo de 10 sujetos. Si la prueba es fiable se espera que las

puntuaciones logradas en ambos casos correlacionen entre sí. A partir

de los datos recogidos, que mostramos a continuación, ¿en qué medida

podemos afirmar que la prueba es fiable?

1ª aplicación: 18 14 11 16 15 12 19 10 19 14

2ª aplicación: 17 15 9 18 15 11 18 10 17 16

5. Soluciones a los problemas propuestos.

1)X Y X ∙ Y x y x ∙ y 5 2 4 7 10 4 8 1 3 6 10

7 4 5 8 9 6 9 4 5 7 8

35 8 2056902472 4 154280

­0.46 ­3.46 ­1.46 1.54 4.54 ­1.46 2.54 ­4.46 ­2.46 0.54 4.54

0.45 ­2.55 ­1.55 1.45 2.45 ­0.55 2.45 ­2.55 ­1.55 0.45 1.45

­0.21 8.82 2.26 2.23 11.12 0.80 6.22 11.37 3.81 0.24 6.58

60 72 446 53.24

Page 9: Correlacion y Coorrelacion de Pearson

9

Como se puede ver en la tabla anterior se muestran los resultados de x e y que son puntuaciones diferenciales que se han conseguido restándoles las medias a las puntuaciones directas. El valor de la media en cada una de las variables las mostraré a continuación junto con las operaciones para calcular la covarianza de cada variable.

Media

X = ∑ X = 60 = 5.46 Y = ∑ Y = 72 = 6.55 n 11 n 11

Covarianza

S xy =∑ Xi ∙ Yi ­ X ∙ Y = 446 ­ 5.45 ∙ 6.55 = 4.79 n 11

El resultado de la covarianza al ser positivo, nos indica cierta tendencia a

que a un tiempo semanal de estudio por encima de la media corresponden

calificaciones por encima de la media, y a un tiempo de estudio por debajo de la

media corresponden calificaciones por debajo de la media.

Para calcular el coeficiente de correlación de Pearson nos ayudarán los

resultados del ejercicio anterior. Pero además tendremos que calcular la

desviación típica de x e y. Y para la desviación típica necesitaremos los

resultados de la varianza de x e y respectivamente. Mostraré a continuación el

procedimiento y los resultados del proceso necesario para obtener lo solicitado

por el problema.

S² x = ∑x’² · fi ­ X² = 420 – 29.7 = 8.48 n 11

Page 10: Correlacion y Coorrelacion de Pearson

10

S² y = ∑ x’² ·fi ­ X² = 506 – 42.9 = 3.1 n 11

S x = √ 8.48 = 2.91

S y = √ 3.1 = 1.76

Coeficiente de correlación de Pearson → r xy = S xy Sx ∙ Sy

r xy = 4.79 = 0.94 2.91∙ 1.76

Viendo los resultados llegamos a la conclusión de que estamos ante una

correlación muy alta, lo que quiere decir a puntuaciones altas en cuanto a notas se

corresponden altas horas de trabajo y estudio semanal.

2)

X Y XY X 2 Y 2

18 17 306 324 289

14 15 210 196 225

11 9 99 121 81

16 18 288 256 324

15 15 225 225 225

12 11 132 144 121

19 18 342 361 324

10 10 100 100 100

19 17 323 361 289

14 16 224 196 256

148 146 2249 2284 2234

Page 11: Correlacion y Coorrelacion de Pearson

11

N = 10

rxy =_________n ∑xy – ∑x ∑y __________ = ____10 • 2249 – 148 • 146__ =

√n ∑xi 2 – (∑xi) 2 √n∑yi 2 – (∑yi) 2 √10 • 2284 – 148 2 √10 • 2234 ­ 146 2

= 882____ = _____882 ___= 0.90

30.59 • 32 978.88

Viendo los resultados, llegamos a la conclusión de que la prueba es fiable,

ya que existe una correlación muy alta. Como el resultado es positivo las dos

variables correlacionan en el mismo sentido. A puntuaciones X por encima de la

media en la primera aplicación, corresponden valores X por encima de la media

en la segunda aplicación.

Page 12: Correlacion y Coorrelacion de Pearson

12

6. Bibliografía

GIL, J.; DIEGO, J.L.; RODRÍGUEZ, G. y GARCÍA, E. (1996). Problemas de Estadística Básica Aplicada a las Ciencias de la Educación. Sevilla: Kronos.

GIL, J.; RODRÍGUEZ, G. y GARCÍA, E. (1995). Estadística Básica Aplicada a las Ciencias

de la Educación. Sevilla: Kronos