coeficiente de correlacion y regresion lineal

Upload: heidyflores

Post on 07-Jul-2018

252 views

Category:

Documents


0 download

TRANSCRIPT

  • 8/18/2019 Coeficiente de Correlacion y Regresion Lineal

    1/26

  • 8/18/2019 Coeficiente de Correlacion y Regresion Lineal

    2/26

    Definición Un Diagrama de Dispersión es la forma mas sencilla de definir

    si existe o no una relación causa efecto entre dos variables yque tan firme es esta relación, como estatura y peso. Unaaumenta al mismo tiempo con la otra.

    El Diagrama de Dispersión es de gran utilidad para la soluciónde problemas de la calidad en un proceso y producto, ya que

    nos sirve para comprobar que causas (factores) estáninfluyendo o perturbando la dispersión de una característicade calidad o variable del proceso a controlar.

    Tres conceptos especialmente destacables son que eldescubrimiento de las verdaderas relaciones de causa-efecto

    es la clave de la resolución eficaz de un problema, que lasrelaciones de causa-efecto casi siempre muestranvariaciones, y que es más fácil ver la relación en un diagramade dispersión que en una simple tabla de números.

  • 8/18/2019 Coeficiente de Correlacion y Regresion Lineal

    3/26

    Características principales

    Impacto visualUn Diagrama de Dispersión muestra la posibilidadde la existencia de correlación entre dos variablesde un vistazo.

    ComunicaciónSimplifica el análisis de situaciones numéricascomplejas

    Guía en la investigación

    El análisis de datos mediante esta herramientaproporciona mayor información que el simpleanálisis matemático de correlación, sugiriendoposibilidades y alternativas de estudio, basadas enla necesidad de conjugar datos y procesos en suutilización.

  • 8/18/2019 Coeficiente de Correlacion y Regresion Lineal

    4/26

    PROCESOPasos previos a la construcción de un Diagrama de

    Dispersión

    Paso 1: Elaborar una teoría admisible y relevante sobre lasupuesta relación entre dos variables. Este paso previo esde gran importancia, puesto que el análisis de unDiagrama de Dispersión permite obtener conclusiones

    sobre la existencia de una relación entre dos variables,no sobre la naturaleza de dicha relación.

    Paso 2: Obtener los pares de datos correspondientes alas dos variables al igual que en cualquier otraherramienta de análisis de datos, éstos son la base de las

    conclusiones obtenidas, por tanto cumplirán lassiguientes condiciones:

    En cantidad suficiente: Se consideran necesarios al menos 40 paresde datos para construir un Diagrama de Dispersión.

  • 8/18/2019 Coeficiente de Correlacion y Regresion Lineal

    5/26

    Datos correctamente emparejados: Se estudiarála relación entre ambos.

    Datos exactos: Las inexactitudes afectan a susituación en el diagrama desvirtuando suapariencia visual.

    Datos representativos: Asegúrese de que cubrentodas las condiciones operativas del proceso Información completa: Anotar las condiciones en

    que han sido obtenidos los datos.

    Paso 3: Determinar los valores máximo y mínimopara cada una de las variables.

  • 8/18/2019 Coeficiente de Correlacion y Regresion Lineal

    6/26

    Ejemplo: Tabla de los datos recogidos

  • 8/18/2019 Coeficiente de Correlacion y Regresion Lineal

    7/26

    Paso 4: Decidir sobre qué eje representará a cada una de las

    variables

    Si se está estudiando una posible relación causa-efecto, el ejehorizontal representará la supuesta causa.

    Paso 5: Trazar y rotular los ejes horizontal y vertical. La construcción de

    los ejes afecta al aspecto y a la consiguiente interpretación deldiagrama.a) Los ejes han de ser aproximadamente de la misma longitud,determinando un área cuadrada.

    b) La numeración de los ejes ha de ir desde un valor ligeramente

    menor que el valor mínimo de cada variable hasta un valorligeramente superior al valor máximo de las mismas. Esto permite quelos puntos abarquen toda el área de registro de los datos.

    c) Numerar los ejes a intervalos iguales y con incrementos de lavariable constantes.

  • 8/18/2019 Coeficiente de Correlacion y Regresion Lineal

    8/26

    d) Los valores crecientes han de ir de abajo a arriba y deizquierda a derecha en los ejes vertical y horizontalrespectivamente.

    e) Rotular cada eje con la descripción de la variable

    correspondiente y con su unidad de medida.EjemploNúmero de errores

    Hora del día

  • 8/18/2019 Coeficiente de Correlacion y Regresion Lineal

    9/26

    Paso 6: Marcar sobre el diagrama los pares de datos Para cada par de datos localizar la intersección de las

    lecturas de los ejes correspondientes y señalarlo con un

    punto o símbolo.Si algún punto coincide con otro ya existente, se traza uncírculo concéntrico a este último.Ejemplo:

    numero de errores

    Hora del dia

  • 8/18/2019 Coeficiente de Correlacion y Regresion Lineal

    10/26

    Paso 7: Rotular el gráfico

    Se rotula el título del gráfico y toda aquella informaciónnecesaria para su correcta comprensión. En general, esconveniente incluir una descripción adicional del objetode las medidas y de las condiciones en que se han

    realizado, ya que esta información puede ayudar en lainterpretación del diagrama.

    Ejemplo: Número de errores de tecleo según la hora deldía

    Número de erroresHora del día

  • 8/18/2019 Coeficiente de Correlacion y Regresion Lineal

    11/26

    El Diagrama de Dispersión expresa el grado derelación entre dos variables, y dicha relación nonecesariamente significa que una de ellas es la

    causa de la otra. El análisis de un Diagrama de Dispersión es un

    proceso de cuatro pasos:

    Primero: Elaborar una teoría admisible y relevante sobre la

    supuesta relación entre dos variables.

    Segundo: Recoger datos y construir el Diagrama.

    Tercero: Identificar y clasificar la pauta de correlación.

    Cuarto: Discutir la teoría original y considerar otrasexplicaciones. La construcción y clasificación del Diagramade Dispersión es la parte central del proceso. No es ni elprincipio ni el final.

  • 8/18/2019 Coeficiente de Correlacion y Regresion Lineal

    12/26

    Correlación Fuerte

    Los puntos se agrupan claramente alrededor de una línea imaginaria quepasa por el centro de la masa de los mismos. Estos casos sugieren que elcontrol de una de las variables lleva al control de la otra. Los datos parecenconfirmar la teoría estudiada, pero hay que analizar la existencia de otrasposibles explicaciones admisibles y relevantes para dicha relación.

    Correlación Fuerte, Positiva:El valor de la variable "Y" (eje vertical) aumenta claramente con el valor de lavariable "X" (eje horizontal).

    Correlación Fuerte, Negativa:El valor de "Y" disminuye claramente cuando "X“ aumenta.

  • 8/18/2019 Coeficiente de Correlacion y Regresion Lineal

    13/26

    Correlación Débil

    Los puntos no están suficientemente agrupados, como para asegurarque existe la relación. El control de una de las variables nonecesariamente nos llevará al control de la otra.Si lo que se busca es determinar las causas de un problema, sedeben buscar otras variables con una relación mayor o másrelevante sobre el efecto.

    Correlación Débil, Positiva:El valor de la variable "Y" (eje vertical) tiende a aumentar cuandoaumenta el valor de la variable "X" (eje horizontal)

    Correlación Débil, Negativa:El valor de "Y" tiende a disminuir cuando aumenta el valor de "X".

  • 8/18/2019 Coeficiente de Correlacion y Regresion Lineal

    14/26

    Correlación complejaEl valor de la variable "Y" parece estar relacionado conel de la variable "X", pero esta relación no es simple olineal. En este caso se estudia la relación másprofundamente (¿Hay alguna ley no lineal que expliqueesta relación ?. ¿ Es esta relación el resultado decomponer varias relaciones ?).

    Sin correlación

    Para cualquier valor de la variable "X", "Y" puede tenercualquier valor. No aparece ninguna relación especialentre ambas variables. En este caso, nuestra teoría no escorrecta y se deben buscar otros tipos de relaciones.

  • 8/18/2019 Coeficiente de Correlacion y Regresion Lineal

    15/26

    UTILIZACIÓN El Diagrama de Dispersión es una herramienta útil para

    comprobar (aceptar o rechazar) teorías respecto a lasupuesta existencia de una relación entre dos variables.

    Utilización en las fases de un proceso de solución deproblemas. Hay tres puntos de dicho proceso en los que

    el Diagrama de Dispersión puede ser una herramientaútil:

    Durante la fase de diagnóstico, para ensayar teoríassobre las causas e identificar las causas raíz.

    Durante la fase de corrección, en el diseño desoluciones.

    Para el diseño de un sistema de control que mantengalos resultados de una acción de mejora de la calidad.

  • 8/18/2019 Coeficiente de Correlacion y Regresion Lineal

    16/26

    COEFICIENTE DE CORRELACIÓN DEPEARSON 

  • 8/18/2019 Coeficiente de Correlacion y Regresion Lineal

    17/26

  • 8/18/2019 Coeficiente de Correlacion y Regresion Lineal

    18/26

    0.3 0.8 1

    Débil positiva Fuerte positiva

    POSITIVA:

    -0.3 -0.8 -1

    Débil negativa Fuerte negativa

    NEGATIVA:

    0.3-0.3

    NO EXISTE CORRELACIÓN

  • 8/18/2019 Coeficiente de Correlacion y Regresion Lineal

    19/26

    El valor del índice de correlación varía en el intervalo [-1,1]: Si r = 1, existe una correlación positiva perfecta. El índice

    indica una dependencia total entre las dos variablesdenominada relación directa: cuando una de ellas aumenta, laotra también lo hace en proporción constante.

    Si 0 < r < 1, existe una correlación positiva. Si r = 0, no existe relación lineal. Pero esto no necesariamente

    implica que las variables son independientes: pueden existirtodavía relaciones no lineales entre las dos variables.

    Si -1 < r < 0, existe una correlación negativa.

    Si r = -1, existe una correlación negativa perfecta. El índiceindica una dependencia total entre las dos variables llamadarelación inversa: cuando una de ellas aumenta, la otradisminuye en proporción constante.

    http://es.wikipedia.org/wiki/Independencia_(probabilidad)http://es.wikipedia.org/wiki/Independencia_(probabilidad)http://es.wikipedia.org/wiki/Independencia_(probabilidad)

  • 8/18/2019 Coeficiente de Correlacion y Regresion Lineal

    20/26

     

    n

     yi xi xiyiSCxiyi

    )(

     

    n

     xi xiSCxi

    2

    2  )(

     

    n

     yi yiSCyi

    2

    2  )(

     xi   yi   2 xi  2 yi   xiyi

  • 8/18/2019 Coeficiente de Correlacion y Regresion Lineal

    21/26

    MÉTODO DE REGRESIÓN LINEAL

  • 8/18/2019 Coeficiente de Correlacion y Regresion Lineal

    22/26

    DEFINICIÓN

    La regresión lineal es un método de extraordinaria importancia

    para determinar magnitudes desconocidas experimentalmente.

    En síntesis cuando se varía una magnitud controladamente y se

    mide como varía la otra, se pueden representar ambas magnitudes

    en un sistema rectangular de ejes Y = F (x). De la observación

    puede inferirse que la dependencia sea lineal o se aproxime a una

    recta. 

    Empleando en método de la regresión lineal se pueden obtener los

    parámetros de la mejor recta que caracteriza al sistema de N

    puntos experimentales. La mayoría de las veces estos parámetrosestán relacionados con magnitudes de interés en el fenómeno

    estudiado. Este método optimiza y encuentra la recta que menos se

    desvía del conjunto de puntos. 

  • 8/18/2019 Coeficiente de Correlacion y Regresion Lineal

    23/26

  • 8/18/2019 Coeficiente de Correlacion y Regresion Lineal

    24/26

  • 8/18/2019 Coeficiente de Correlacion y Regresion Lineal

    25/26

    Cálculo de la ecuación de regresión lineal (de Y sobre X)

    Las fórmulas....  En puntuaciones directas

    2 2

     XY nXY  B

     X nX 

    Pendiente

    Ordenada origen  A Y BX 

  • 8/18/2019 Coeficiente de Correlacion y Regresion Lineal

    26/26

    Cálculo de la ecuación de regresión lineal (de Y sobre X)

    X Y XY X2

    suj1 120 10 1200 14400

    suj2 100 9 900 10000suj3 90 4 360 8100

    suj4 110 6 660 12100

    4 SUMA SUMA

    3120 44600

    PROMEDIO PROMEDIO

    105 7.25

    N

    4

    2

    3120 4 105 7 '250'1544600 4 105

     B 

    7 ' 25 0 '15 105 8 '5 A Y’=-8’5+0’15X 

    Luego

    http://www youtube com/watch?v=XyMcJ5M2qqQ