correlación de pearson y de sperman

13
COEFICIENTES DE CORRELACION DE PEARSON Y SPEARMAN Barcelona, Enero de 2016 Anderson Subero:25.786.992 Prof. Pedro Beltrán

Upload: anderson-subero

Post on 15-Apr-2017

303 views

Category:

Education


0 download

TRANSCRIPT

Page 1: Correlación de Pearson y de Sperman

COEFICIENTES DE CORRELACION DE PEARSON Y SPEARMAN

Barcelona, Enero de 2016

Anderson Subero:25.786.992Prof. Pedro Beltrán

Page 2: Correlación de Pearson y de Sperman

Coeficiente de Correlación de Pearson

El Coeficiente de Correlación de Pearson es una medida de la relación lineal entre dos variables aleatorias cuantitativas. A diferencia de la covarianza, la correlación de Pearson es independiente de la escala de medida de las variables.De manera menos formal, podemos definir el coeficiente de correlación de Pearson como un índice que puede utilizarse para medir el grado de relación de dos variables siempre y cuando ambas sean cuantitativas.En el caso de que se esté estudiando dos variables aleatorias x e y sobre una población; el coeficiente de correlación de Pearson se simboliza con la letra , siendo la expresión que nos permite calcularlo:

 

Page 3: Correlación de Pearson y de Sperman

Coeficiente de Correlación de Pearson

Donde;   es la covarianza de (X,Y)  es la desviación típica de la variable X  es la desviación típica de la variable YDe manera análoga podemos calcular este coeficiente sobre un estadístico muestral, denotado como   a:

Page 4: Correlación de Pearson y de Sperman

Ventajas y Desventajas del Coeficiente de PearsonVentajas

Requiere datos de cantidad solo del periodo base.

Es un índice de fácil ejecución e, igualmente, de fácil interpretación.

los resultados del coeficiente de correlación están acotados entre -1 y +1. Esta característica nos permite comparar diversas correlaciones de una manera más estandarizada.

Desventajas

No refleja cambios en los patrones de compra conforme pasa el tiempo y para las cantidades grandes de información , este método puede ser tedioso.

Se limita significativamente si no se afirma con una cierta probabilidad, que es diferente de cero.

Page 5: Correlación de Pearson y de Sperman

Usos del Coeficiente de Correlación de Pearson

Uno de los enfoques de pearson fue el test de hipótesis o prueba de significación, es un procedimiento para juzgar si una propiedad que se supone en una Población estadística es compatible con lo observado en una muestra de dicha población. Fue iniciada por Ronal Fisher y fundamentada posteriormente por Jerzy Neyman y Karl Pearson

Mediante esta teoría, se aborda el problema estadístico considerando una hipótesis determinada y una hipótesis alternativa , y se intenta dirimir cuál de las dos es la hipótesis verdadera, tras aplicar el problema estadístico a un cierto número de experimentos.Está fuertemente asociada a los considerados errores de tipo I y II en estadística, que definen respectivamente, la posibilidad de tomar un suceso falso como verdadero, o uno verdadero como falso.

Existen diversos métodos para desarrollar dicho test, minimizando los errores de tipo I y II, y hallando por tanto con una determinada potencia, la hipótesis con mayor probabilidad de ser correcta. Los tipos más importantes son los test centrados, de hipótesis y alternativa simple, aleatorizados, etc. Dentro de los tests no paramétricos, el más extendido es probablemente el test de la U de Mann-Whitney.

Page 6: Correlación de Pearson y de Sperman

Usos de Enfoques de Pearson a Problemas Estadísticos

En la perspectiva de Pearson, para establecer el nivel de significación estadística habría que atender al impacto de cada tipo de error en el objetivo del investigador, y a partir de ahí se decidiría cuál de ellos es preferible minimizar.

Pearson llamaron alfa al error tipo I y beta al error tipo II; a partir de este último tipo de error, introdujeron el concepto de “poder de una prueba estadística”, el cual se refiere a su capacidad para evitar el error tipo II, y está definido por 1-beta, y en estrecha relación con éste se ha desarrollado el concepto de “tamaño del efecto” que algunos han propuesto como sustituto de los valores p en los informes de investigación científica.

Las pruebas paramétricas más conocidas y usadas son la prueba T de Student, la prueba F, llamada así en honor a Fisher, y el coeficiente de correlación de Pearson, simbolizado por r.

Page 7: Correlación de Pearson y de Sperman

Coeficiente de Correlación de Spearman

El Coeficiente de Correlación de Spearman, ρ (rho) es una medida de la correlación (la asociación o interdependencia) entre dos variables aleatorias continuas. Para calcular ρ, los datos son ordenados y reemplazados por su respectivo orden.

El estadístico ρ viene dado por la expresión: El coeficiente de correlación de Spearman es menos sensible que el de Pearson para los valores muy lejos de lo esperado. En este ejemplo: Pearson = 0.30706 Spearman = 0.76270

Page 8: Correlación de Pearson y de Sperman

Coeficiente de Correlación de Spearman

Donde D es la diferencia entre los correspondientes estadísticos de orden de x - y. N es el número de parejas.

Se tiene que considerar la existencia de datos idénticos a la hora de ordenarlos, aunque si éstos son pocos, se puede ignorar tal circunstancia.

Para muestras mayores de 20 observaciones, podemos utilizar la siguiente aproximación a la distribución t de Student

Page 9: Correlación de Pearson y de Sperman

Coeficiente de Correlación de Spearman

La interpretación de coeficiente de Spearman es igual que la del coeficiente de correlación de Pearson. Oscila entre -1 y +1, indicándonos asociaciones negativas o positivas respectivamente, 0 cero, significa no correlación pero no independencia.

La correlación estimada entre X e Y se halla calculando el coeficiente de correlación de Pearson para el conjunto de rangos apareados.

La correlación de Spearman puede ser calculada con la fórmula de Pearson, si antes hemos transformado las puntuaciones en rangos.

Page 10: Correlación de Pearson y de Sperman

Usos del Coeficiente de correlación de Spearman

Para aplicar el coeficiente de correlación de Spearman se requiere que las variables estén medidas al menos en escala ordinal, es decir, de forma que las puntuaciones que las representan puedan ser colocadas en dos series ordenadas

A veces, este coeficiente es denominado por la letra griega ρs (rho), aunque cuando nos situamos en el contexto de la Estadística Descriptiva se emplea la notación rs

La fórmula de cálculo para rs puede derivarse de la utilizada en el caso de rxy; bastaría aplicar el coeficiente de correlación de Pearson a dos series de puntuaciones ordinales, compuestas cada una de ellas por los n primeros números naturales Donde d es la distancia existente entre los puestos que ocupan las puntuaciones correspondientes a un sujeto i cuando estas puntuaciones han sido ordenadas para X y para Y.

Page 11: Correlación de Pearson y de Sperman

Ventajas y Desventajas del Coeficiente de Spearman

Ventajas

Pueden ser aplicados a una amplia variedad porque ellos no tienen los requisitos rígidos de los métodos paramétricos correspondientes. 

No requieren poblaciones normalmente distribuidas.

Pueden frecuentemente ser aplicados a datos no numéricos, tal como el género de los que contestan una encuesta.

Al ser Spearman una técnica no paramétrica es libre de distribución probabilística.

DesventajasTienden a perder información porque datos numéricos exactos son frecuentemente reducidos a una forma cualitativa.

Las pruebas no paramétricas no son tan eficientes como las pruebas paramétricas, de manera que con una prueba no paramétrica generalmente se necesita evidencia más fuerte (así como una muestra más grande o mayores diferencias) antes de rechazar una hipótesis nula.

Page 12: Correlación de Pearson y de Sperman

Usos de Enfoques de Spearman a Problemas Estadísticos

Una generalización del coeficiente de Spearman es útil en la situación en la cual hay tres o más condiciones, varios individuos son observados en cada una de ellas, y predecimos que las observaciones tendrán un orden en particular. Por ejemplo, un conjunto de individuos pueden tener tres oportunidades para intentar cierta tarea, y predecimos que su habilidad mejorará de intento en intento.

El coeficiente de correlación de rangos de Spearman debe utilizarse para series de datos en los que existan valores extremos, pues si calculamos la correlación de Pearson, los resultados se verán afectados.

La interpretación del resultado del coeficiente de correlación de Spearman se encuentra entre los valores de -1 y 1. La significación estadística de un coeficiente debe tenerse en cuenta conjuntamente con la relevancia clínica del fenómeno que se estudia.

Page 13: Correlación de Pearson y de Sperman

Bibliografía

Internet

https://es.wikipedia.org/wiki/Coeficiente_de_correlaci%C3%B3n_de_Spearman#Ejemplo https://es.wikipedia.org/wiki/Coeficiente_de_correlaci%C3%B3n_de_Pearson

http://www.monografias.com/trabajos93/muestreo-correlaciones-contingencias-y-pearson/muestreo-correlaciones-contingencias-y-pearson2.shtml