estadistica y ejersicios

Upload: ruben-dario-arrua

Post on 20-Feb-2018

217 views

Category:

Documents


0 download

TRANSCRIPT

  • 7/24/2019 Estadistica y ejersicios

    1/11

    PSICOESTADSTICA

    MODULO 5 ASOCIACIN VARIABLES CUALITATIVAS

    OBJETIVOS ESPECFICOS

    Comprender la importancia de relacionar dos variables cualitativas.

    Valorar la utilidad de la informacin que suministra la asociacin de variables cualitati-vas.

    Calcular e interpretar los coeficientes para variables nominales y ordinales.

    CONTENIDOS TEMTICOS

    55.. Coeficiente para variables cualitativas nominales.

    55..11Coeficiente de Q de Yule: Fundamento, Formula, Calculo, Propiedades.

    55..22Coeficiente X2: Fundamento, Formula, Calculo, Propiedades.

    55..33Coeficiente C de contingencia: Fundamento, Formula, Calculo, Propiedades

    55..44Coeficiente de asociacin para variables cualitativas ordinales: Coeficiente Ro

    de Sperman. Fundamento, Formula, Calculo, Propiedades

  • 7/24/2019 Estadistica y ejersicios

    2/11

    Antes de comenzar vamos a reflexionar sobrecundo podremos aplicar toda la informacin

    que aprenderemos en este mdulo.

    La palabra clave de este mdulo es: para Variables Cualitativas.Seguimos haciendo referencia a los conceptos de variables que vimos en el tema 1.

    Las variables cualitativas se clasifican en dicotmicas cuando puede asumir dos estadosposibles como ser:

    Sexo: Varn Mujer. Vidente No vidente.

    O Policotmica como ser: Estado Civil: soltero, casado, viudo, separado. Lengua Extrajera que conoce: ingles, francs, alemn, etc.

    Tambin debe recordar cuales son las escalas de clasificacin de las variables cualitativas: Nominal o de clasificacin y Ordinal o jerrquicas.

    Veamos algunos ejemplos: Para nominal: nacionalidad, deporte que practica, ocupacin, lugar de nacimiento. Para ordinal: puesto en el campeonato de ftbol, lugar en el cuadro de honor, cargo

    que ocupa en la escuela.

    Si ya tiene presente estos conceptos entonces

    Comencemos!

    5. COEFICIENTE PARA VARIABLES CUALITATIVAS

    Existe una serie de tcnicas estadsticas que nos permiten detectar:

    a) la existencia de correlacin yb) la intensidad de la correlacin.

    Por correlacin se entiende el grado de relacin o asociacin entre 2 o ms variables cuali-

    tativas y la intensidad de la relacin de las mismas. Por ejemplo: muchas veces abra escu-chado decir el nio estaba jugando muy bien hasta que lleg su mam y se puso molesto.

    Qu quiere decir esto?, que la presencia de la madre altera el comportamiento del niosobre todo cuando hay algn problema de relacin madre-hijo. Lo importante es poder en-contrar el grado de asociacin que hay entre estas dos variables, que no se pueden medircon nmeros.

    Desde el punto de vista estadstico estos coeficientes estudian el grado de dependenciaentre dos variables cualitativas.

    Para ello nos ayudaremos con los cuadros de doble entrada. Es decir para la presentacin

    de las observaciones correspondientes a dos variables se utiliza un cuadro que nos permitacolocar en la primera hilera las categoras de una de las variables y en la primera columna

  • 7/24/2019 Estadistica y ejersicios

    3/11

    las categoras de la segunda variable, ubicando en el cuerpo de la tabla, en cada una de lasceldas las observaciones correspondientes al resultado de la interseccin de ambas varia-bles y en la ltima columna y fila se colocan los subtotales de cada sub-categora y el totalgeneral, en el cruce de estas dos. Como lo vimos en la unidad 2.

    Lo vemos con un ejemplo:

    Tipo de ocupacin de los tutores de la EscuelaSexoSin trabajo Independiente En relacin de dependencia Total

    Varones 187 466 638 1291Mujeres 246 313 459 1018Total 433 779 1097 2309

    5.1 COEFICIENTE Q DE YULE:

    FUNDAMENTOSe trata de un coeficiente que mide la asociacin de dos variables cualitativas dicotmi-cas.Se debe tener la precaucin que este coeficiente se basa en la premisa de indepen-denciaentre las variables que estemos estudiando. Para ello se debe tener la precaucinde que la premisa de independencia ocupe la primera celda de la interseccin como muestrael esquema del dibujo.

    Variable YVariable XVariable Y1 Variable Y2 Total

    Variable X1 1 celda

    Variable X2Total

    Lo que se pretende decir es que:

    Si la variable X la establecemos como la consigan Fuma: X1 es Si y X2 es NO.Si la Variable Y es Padece de enfermedades pulmonares: Y1 Si y Y2 No.

    Nuestro objetivo de estudio, o hiptesis de estudio o premisa debe ser: las enfermedadespulmonares se manifiestan independientemente de que el individuo sea fumador o no.Recuerde que dijimos que Q trabajo bajo el supuesto de independencia.

    El acto de fumar es independiente al de enfermarse.

    FORMULA

    Para poder aplicar la frmula nombraremos a las celdas con las letras:

    A: X1, Y1B: X1, Y2C: X2, Y1D: X2, Y2

  • 7/24/2019 Estadistica y ejersicios

    4/11

    Variable YVariable XVariable Y1 Variable Y2 Total

    Variable X1 A B A+BVariable X2 C D C+D

    Total A+C B+D A+B+C+D

    De esta manera expresaremos que el coeficiente Q de Yule ser:

    Q = AD BCAD + BC

    Es decir: la resta de los productos de los extremos divido la suma de los productos de losextremos.

    CALCULO

    Padece enfermedades

    pulmonares

    Fuma

    Si NO TotalSi 120 67 187No 48 39 87Total 168 106 274

    Q = (120.39) (67. 48) = 4680 3216 = 1464 = 0,1854

    (120.39) + (67. 48) 4680 + 3216 7896

    Ahora bien qu nos quiere decir este resultado?

    INTERPRETACINEl coeficiente Q puede tomar valores entre -1 y 1

    Cuando Q toma valor:

    -1significa existe una perfecta relacin inversa, es decir que la presencia de una de lasvariables anula o inhibe por completo la presencia de la otra variable.Prximos a -0,75existe una fuerte relacin inversaPrximos a -0,50existe una moderada relacin inversaPrximos a -0,25existe una dbil relacin inversa

    0no existe relacin entre las variables. Esto quiere decir la presencia de una de las varia-bles no altera en absoluto el comportamiento de la otra variable.

    Prximos a 0,25existe una dbil relacin directaPrximos a 0,50existe una moderada relacin directaPrximos a 0,75existe una fuerte relacin directa

    1 significa existe una perfecta relacin directa, es decir que la presencia de la variableindependiente afecta directamente la presencia de la otra variable.

  • 7/24/2019 Estadistica y ejersicios

    5/11

    Aclaracin:

    Desde el punto de vista lgico la premisa debera ser: los fumadores son ms propensos aenfermedades pulmonares.

    Pero el coeficiente Q parte de premisas independientes, por lo que se debe suponer que elfumar no afecta a enfermedades pulmonares, al darme un valor 0 (cero) o muy cerca de 0(cero) quiere decir: no hay relacin entre lo que el investigador supone como independien-te por lo tanto se concluye que lo que el investigador dice en el supuesto no se cumple.

    La premisa de que:Las enfermedades pulmonares nada tienen que ver con el fumar es falso.No se cumple la premisa o hiptesis.

    Al ser falsa la premisa anterior su negacin se convierte en verdadero.

    No es cierto que las enfermedades pulmonares son independientes del individuofumadoro lo que es lo mismo las enfermedades pulmonares estn relacionada con el indi-viduo fumador.

    Retomando el resultado del ejercicios cuyo valor dio 0,1854 (que lo puede redondear a0,19), ubquelo en la grfica y

    Puede observar que cae en la franja de NO EXISTE RELACIN entre las variables estable-cidas como premisa.

    5.2COEFICIENTE X 2 (CHI)

    FUNDAMENTO

    Se trata de una prueba estadstica que nos permite comparar los resultados obtenidos enuna experiencia real con los resultados tericos de acuerdo a una distribucin de hiptesisterica. De este modo nos permite conocer con un nivel de probabilidad o significacin de-terminado si los resultados experimentales concuerdan o no con los esperados tericamen-te segn los valores asignados en la tabla de X 2. En este sentido y comparando con el va-lor de la tabla, lo nico que se hace es rechazar o no la hiptesis de nulidad.

    Particularmente en este curso veremos X 2 como prueba de independencia. Con esto que-remos decir que estudiaremos el nivel de independencia que existe entre ciertas variablescualitativas o si existe algn grado de relacin o asociacin entre ellas que hacen variar sus

    resultados.

    X2 COMO PRUEBA DE INDEPENDENCIA

    Trabaja con variables cualitativas con ms de dos clasificaciones, como deporte que practi-ca, por ejemplo.Esta prueba nos permite comprobar si existe entre las variables total independencia o si porel contrario es probable que estn asociadas y la presencia de una de ellas condiciona a laotra variable.

    FORMULA

    Para explicar mejor su clculo volveremos a nuestro ejemplo de ocupacin de los tutores.

  • 7/24/2019 Estadistica y ejersicios

    6/11

    Tipo de ocupacin de los tutores de la EscuelaSexo

    Sin trabajo Independiente En relacin de dependencia TotalVarones 187 466 638 1291

    Mujeres 246 313 459 1018Total 433 779 1097 2309

    El estudio consiste en indagar si la condicin de gnero es totalmente independiente a tenero no trabajo. Es decir nos interesa saber si el hecho de ser mujer no influye a la hora debuscar trabajo. (Esto podramos determinarlo como la hiptesis)

    La formula que utilizaremos es:

    X2 = (Fo - Ft )2

    Ft

    En donde:Fo= frecuencias de los hechos observados o hallados.Ft = frecuencia terica esperada para una determinada hiptesis o modelo de distribucin.

    Las frecuencias Fo son las que estn en la tabla (las podemos obtener de encuestas reali-zadas a los tutotes, por ejemplo). Las frecuencias que hay que calcular son las Ft.Y estas se calculan multiplicando ambas frecuencias marginales o (subtotales de cada cel-da) y se las divide por el total general

    CALCULO

    Ft= sub-tot marginal de columna * sub-tot marginal de fila =

    Total Gral

    Para la primera celda, varones sin trabajo, los subtotales son 1291 y 433 entonces:

    1291*433 = 242,10 Completamos (con verde) en la tabla2309

    Continuamos calculando para las otras celdas

    1291*779= 435,55 1291*1291= 613,352309 2309

    Tipo de ocupacin de los tutores de la EscuelaSexoSin trabajo Independiente En relacin de dependencia Total

    Varones 187 242,10 466 435,55 638 613,35 1291Mujeres 246 190,90 313 343,44 459 483,65 1018Total 433 779 1097 2309

    Para las mujeres ser

    433 * 1018 = 190,90 779 * 1018 = 343,44 1097 * 1018 = 483,65

    2309 2309 2309

  • 7/24/2019 Estadistica y ejersicios

    7/11

    Luego aplicando la frmula tendremos

    X2 = (Fo - Ft )2

    Ft

    X 2 = (187 242,10)2 + (466 435,55)2 + (638 613,35)2 +242,10 435,55 613,35

    (246 190,90)2+ (313 343,44)2 + (459 483,65)2 =190,90 343,44 483,65

    X2 = (-55,10)2 + (30,45)2 + (24,65)2+ (55,10)2 + (-30,44)2 + (-24,65)2 =

    242,10 435,55 613,35 190,90 343,44 483,65

    X

    2

    = 3036,01 + 927,20 + 607,62 + 3036,01 + 926,59 + 607,62 =242,10 435,55 613,35 190,90 343,44 483,65

    X2 = 12,54 + 2,12 + 0,99 + 15,90 + 2,69 + 1,25 = 35,49

    INTERPRETACIONES

    Para saber si este valor es representativo o no tenemos que ayudarnos con una tabla, la deChi, que en cualquier libro de estadstica la posee en la parte de apndice del mismo.

    A continuacin haremos la trascripcin de dicha tabla de sus primeras lneas.

    % 10 5 2 1 0.1Gr-lib

    1 2.706 2.841 5.412 6.635 10.8272 4.605 5.991 7.824 9.210 13.8153 6.251 7.815 9.837 11.341 16.2684 7.779 9.488 11.668 13.277 18.4655 9.236 11.070 13.388 15.086 20.517

    Esta tabla esta compuesta por:La primera fila: muestra el porcentaje del riesgo que se est dispuesto a correr si es que se

    comete error para la toma de decisin. Por ejemplo nosotros podemos elegir tomar unriesgo de un 5%.

    Luego hay que determinar los grados de libertad que tiene nuestra tabla.

    Los grados de libertad se calculan segn el tamao de la tabla, las tablas pueden ser de 2x2(dos filas y dos columnas) o 2 x 3 (2 filas y 3 columnas) que es nuestro caso u otro tamaocualquiera.

    Entonces se calcula multiplicando el nmero de columnas menos 1 por el nmero de filasmenos 1, es decir Gr-lib = (c-1) * (f-1)Para nuestro ejemplo sera:

  • 7/24/2019 Estadistica y ejersicios

    8/11

    Gr-lib = (3 1) * (2-1) = 2 * 1 = 2

    Ahora entrando por la fila y buscamos el grado de libertad 2 y por la columna del % queelegimos 5 en la interseccin de ambos valores se obtiene el nmero 5,991.

    Una vez hallado el valor en la tabla lo debemos comparar con el resultado obtenido en elclculo:

    5,991 < 35,49

    Como el valor hallado por nosotros es mucho mayor podemos rechazar la hiptesis pro-puesta. Por lo tanto en nulo lo que se dijo en la hiptesis: el hecho de ser mujer no influyea la hora de buscar trabajo.

    IMPORTANTE

    Esta forma de calcular X2

    es para averiguar la independencia entre las dos variables quese estn estudiando, por lo tanto en la hiptesis de estudio lo que debemos manifestar esque las variables son independientes. Luego si el valor obtenido en el clculo es muy prxi-mo al valor que nos muestra la tabla se puede decir que s son independientes. Pero si ocu-rre que el valor obtenido en el clculo es superior o inferior (considerablemente) podemosasegurar que no existe independencia entre las variables estudiadas.

    Ahora bien Qu queremos decir con independencia entre las variables?.Lo que se quiere decir es que la ocurrencia de un atributo cualitativo no se ve afectada nialtera su presencia con la ocurrencia de la otra variable de estudio.

    Por ejemplo quisiramos estudiar la independencia de que el alumno es bueno en matem-

    ticas no tiene nada que ver con que sea bueno en lengua son situaciones totalmente inde-pendiente.O bien podramos decir el que es bueno en matemticas seguro es bueno en lengua, (aquestamos manifestando que hay dependencia.)

    5.3 COEFICIENTE C DE CONTINGENCIA.

    FUNDAMENTO.

    El coeficiente de contingencia se utiliza para saber la asociacin de variables cualitativasnominales, que tienen dos o ms categoras.

    Este coeficiente requiere del clculo previo del estadstico Chi Cuadrado, dado que en sufrmula interviene este valor.

    FORMULA.

    La frmula de trabajo es:

    CALCULOPara ello primero se debe calcular Chi cuadrado, luego hacer el cociente y por

    ltimo aplicarle la raz cuadrara.

  • 7/24/2019 Estadistica y ejersicios

    9/11

    PROPIEDADES

    Los valores que puede asumir C van entre 0 C 1.

    Al igual que en los otros casos:

    Elcoeficiente de contingencia, toma valores comprendidos entre cero y uno.

    Cuando estprximo a cero, indicaasociacinnula o muydbil entre las variables involu-cradas.

    Cuando estprximo a uno, indica asociacin alta, fuerte,o casi perfecta, dependiendo dela cercana al nmero uno.

    5.4 COEFICIENTE DE RO()DE SPEARMAN.

    FUNDAMENTOEsta medida se la utiliza para estudiar la asociacin entre variables cualitativas de tipo ordi-nal. Es decir aquellas que establecen un orden. Si nos interesa estudiar el grado de asocia-cin que existe entre dos variables cualitativas ordinales el coeficiente Rode Sperman esuno de los ms apropiados.

    Es decir que ambas variables deber ser ordinales. Para ello se deben elegir una de las va-riables como la variable principal y en funcin de ellas ordenar.

    Si tomamos como ejemplo una relacin entre las asignaturas matemticas y lengua, y orde-namos (de mayor a menos) en primer lugar a los alumnos segn sus calificaciones obteni-das en matemticas, luego asignamos el orden segn las calificaciones obtenidas en len-gua. De esta manera obtendremos pares de nmeros, por ejemplo el alumno que obtuvo la1 nota en matemtica, y la 4 en lengua le corresponde el par (1,4).

    Nos quedara la siguiente tabla:

    Alumno Matemtica Orden Lengua Orden

    Ana 8 3 7 3

    Beatriz 10 1 6 4

    Carlos 9 2 5 5

    Denis 7 4 10 1

    Esteban 6 5 9 2

    FORMULA

    Algunos autores lo denominan coeficiente de Sperman (Cs) y otros le asignan la letragriega de nombre rho (), usted puede utilizar la que ms le agrade.

    = 1 6 d2 =

  • 7/24/2019 Estadistica y ejersicios

    10/11

    N (N2 1)

    Donde

    d2 = Diferencia entre el valor de la primera variable y la segunda elevados al cuadradoN = Cantidad de elementos involucrados en nuestros ejemplo es 5.6 es un valor constante propio de la formula.

    CALCULO

    Para realizar los clculos para este ejercicio nos ayudamos con la tabla anterior dondesolo tenemos los rdenes de las asignaturas

    = 1 6 d2 =

    N (N2 1)

    Alumno Orden

    Matemtica

    Orden

    Lengua

    Diferencia Diferencia al

    cuadrado d2

    A 3 3 (3 - 3) = 0 (0)2 = 0

    B 1 4 (1 4) = - 3 (-3)2 = 9

    C 2 5 (2 - 5) = -3 (-3)2 = 9

    D 4 1 (4 1) = 3 (3)2 = 9

    E 5 2 (5 2) = 3 (3)2 = 9

    d2 = 36

    Remplazando en la formula el valor calculado tendremos

    = 1 6 d2 = 1 - 6 x 36 = 1 - 216 = 1 216 =

    N (N2 1) 5 (52 1) 5 X 24 120

    = 1 1,8 = - 0,80

    = - 0,80

    INTERPRETACIONES puede tomar valores comprendidos entre -1y 1Cundo Cs = 0? Cuando todas las diferencia dan 0 es decir que el mismo orden queadquieren con la variable 1 (matemtica) lo obtienen en la variable 2 (lengua).

    Cundo = -1? Cuando el orden de la variables 1 es exactamente inverso en la varia-ble 2. Es decir aquella que tena el orden 1 en la variable 1, tiene el ltimo orden en lavariable 2 y la que tiene el 2 orden en variable 1, tiene el anteltimo orden en la variable2 y as sucesivamente.

    Cundo = 1? Cuando el orden crece o decrece de igual modo en ambas variablessin que estas tengan exactamente el mismo orden.Por lo tanto la interpretacin en estos casos sera guardaran este tipo de relacin entreambas variables.

  • 7/24/2019 Estadistica y ejersicios

    11/11

    En nuestro caso y observando el resultado obtenido podemos decir que = - 0,80 quie-re decir que aquellos alumnos que son buenos en matemtica no tienen igual rendimien-to en lengua en un alto porcentaje.

    IMPORTANTE

    Puede llegar a ocurrir que haya empate es decir que dos o ms alumnos reciben el mismopuntaje u orden al obtener la misma valoracin en esos casos se asigna el promedio de di-chos valores de empate.

    Ejemplo

    Alumno Matemtica Orden

    A 8 empate para el puesto 4 4,50

    B 10 puesto 1 1

    C 9 empate para el puesto 2 2,50

    D 9 empate para el puesto 2 2,50

    E 6 puesto 6 6

    F 8 empate para el puesto 4 4,50

    En el empate le correspondera a uno el lugar 2 y al otro el lugar 3Entonces se calcula el promedio de ambos lugares y se asigna el promedio a los dos alum-nosProm = 2 + 3 / 2 = 2,50Lo mismo ocurre con el puesto 4 y 5 por lo tanto el promedio es 4,50 que asignaremos a losindividuos A y FDe igual modo se procede si ocurren empates en la variable 2.Luego se procede exactamente de igual manera para calcular las diferencias con la asigna-tura lengua.