3) variables bi

Upload: rodrigocordova

Post on 07-Jul-2018

216 views

Category:

Documents


0 download

TRANSCRIPT

  • 8/18/2019 3) Variables Bi

    1/53

    ULARE :APUNTE IIIVariables Bidimensionales

     DISTRIBUCIONES BIDIMENSIONALES.

    INTRODUCCIÓN.

    En este capítulo nos dedicaremos a adquirir los conceptos de variable estadística bidimensional de tablas de !recuencias " de dia#ramas de dispersi$n% A continuaci$n nosdedicaremos al c&lculo de los par&metros m&s importantes que intervienen en unadistribuci$n bidimensional tales como las medias varian'as " desviaciones típicas de cadauna de las variables estadísticas unidimensionales que componen la variable estadística bidimensional% Acabando por anali'ar la correlaci$n e(istente entre ambas variables "aprendiendo a calcular la recta de re#resi$n cuando ten#a sentido%

    VARIABLES ESTADÍSTICAS BIDIMENSIONALES.

    Vamos a traba)ar sobre una serie de !en$menos en los que para cada observaci$n se

    obtiene un par de medidas%

    Por e)emplo:

    • E(tensi$n en*

    km  " n+mero de ,abitantes de los distintos países de Europa%• In#resos " #astos de cada una de las !amilias de los traba)adores de una empresa%• Puntuaciones obtenidas en un test de !luide' verbal por un #rupo de alumnos de -.

    de E%/%0% e in#resos anuales de sus padres%• Producci$n " ventas de una !&brica%•  N+mero de a1os a!iliados a un partido político " nivel de satis!acci$n con dic,o

     partido de un militante%• Edad " #rado de psicomotricidad de un #rupo !ormado por -2 minusv&lidos

    mentales%•  N+mero de ,oras que dedican los escolares a ver televisi$n " posici$n econ$mica de

    sus padres%• Renta nacional " n+mero de universitarios de los distintos países de 3!rica%• Edad " n+mero de días que !altan al traba)o los empleados de una !&brica%

    A estas variables estadísticas resultantes de la observaci$n de un !en$meno respectode dos modalidades se las llama variables estadísticas bidie!si"!ales%

    Las variables estadísticas bidie!si"!ales las representaremos por el par ( ) X Y 

    donde X  es una variable estadística unidimensional que toma los valores 4 * 5 %%%% k  x x x x  e Y 

    es otra variable estadística unidimensional que toma los valores 4 * 5 %%%% k  y y y y % Por tanto

    la variable estadística bidimensional ( ) X Y 

     toma estos valores:

    Pro!esor: Ricardo 6apata 7%  4

  • 8/18/2019 3) Variables Bi

    2/53

    ULARE :APUNTE IIIVariables Bidimensionales

    ( ) ( ) ( ) ( )4 4 * * 5 5 %%%%% k k  x y x y x y x y  o tambi8n ( ) 4i i x y i k ≤ ≤ %

    TABLAS BIDIMENSIONALES DE #RECUENCIAS.

    Las tablas de !recuencias bidimensionales pueden ser: simples o de doble entrada%

    Tablas si$les: Una tabla de !recuencias simple es la que reco#e en !ilas o

    columnas las !recuencias de los valores ( ) 4i i x y i k ≤ ≤ de la variable%

     X 4 x * x 5 x %%%% k  x

    Y 4

     y*

     y 5 y %%%% k  y

    ni 4n *n 5n %%%% k n

    Tablas de d"ble e!trada: Una tabla de doble entrada es la que reco#e las

    !recuencias de los ( ) 4 4i j x y i k j p≤ ≤ ≤ ≤ de las variables%

      Y 

     X 4

     y*

     y 5 y %%%%  p y

    4 x 44n 4*n 45n %%%% 4 pn

    * x

    *4n **n *5n %%%% * pn

    5 x

    54n

    5*n

    55n %%%% 5 pn

    %%%% %%%% %%%% %%%% %%%% %%%%k 

     x4k n *k n 5k n %%%% kpn

    #RECUENCIAS.

    #RECUENCIAS MAR%INALES.

    /i en una tabla de doble entrada sumamos las !recuencias absolutas por !ilas " por columnas obtenemos una nueva !ila " una nueva columna: son las &rec'e!ciasar(i!ales.

     

    Y

     X 

    4 y * y 5 y %%%%  p y

    4 x

    44n

    4*n

    45n %%%% 4 pn 49n

    * x

    *4n **n *5n %%%% * pn *9n

    Pro!esor: Ricardo 6apata 7%  *

  • 8/18/2019 3) Variables Bi

    3/53

    ULARE :APUNTE IIIVariables Bidimensionales

    5 x 54n 5*n 55n %%%% 5 pn 59n

    %%%% %%%% %%%% %%%% %%%% %%%% %%%%

    k  x 4k n *k n 5k n %%%% kpn 9k n

    94n 9*n 95n %%%% 9 pn

    4 4

     pk 

    iji j

    n N = = =∑∑Estas !recuencias obtenidas tienen en cuenta una sola variable " se puede construir 

    con ellas dos distribuciones unidimensionales " obtener los par&metros representativos%

    I/TRIBU7I;N

  • 8/18/2019 3) Variables Bi

    4/53

    ULARE :APUNTE IIIVariables Bidimensionales

    /i en una tabla de doble entrada nos centramos en los valores de una variable con lacondici$n de que el correspondiente valor de la otra sea !i)o tenemos una distribuci$nunidimensional llamada distribuci$n de la variable en cuesti$n condicionada al valor tomado como re!erencia en la otra variable%

    I/TRIBU7I;N E X  70NI7I0NAA A  jY y=

     X

    Y=y

     j

     j y

    4 x 4 jn

    * x * jn

    5 x 5 jn%%%% %%%%

    k  x kjn

    I/TRIBU7I;N E Y  70NI7I0NAA A i X x=

    Y

     X=xi 

    4 y

    * y 5 y %%%%  p y

    i x 4in *in 5in %%%% ipn

     Las frecuencias relati!as conicionaas nos "ermiten conocer el tanto "or ciento

    e los !alores e una !ariable conicionaa a caa !alor e la otra !ariable.

    DIA%RAMAS DE DIS)ERSIÓN.

    Los valores de una variable estadística bidimensional son pares de n+meros reales

    de la !orma ( ) 4 4i j x y i k j p≤ ≤ ≤ ≤   % /i representamos estos pares en un sistema dee)es cartesianos se obtiene un con)unto de puntos sobre el plano% A este con)unto de puntosse le denomina dia(raa de dis$ersi*! " !'be de $'!t"s%

    /i la relaci$n que e(iste entre las dos variables no si#ue nin#una le" ni !$rmula sedir& que e(iste una relaci*! estadística% /in embar#o al comparar dos variables para lascuales e(iste una !$rmula que las relacione diremos que e(iste una relaci*! &'!ci"!al%

    Pro!esor: Ricardo 6apata 7%  -

  • 8/18/2019 3) Variables Bi

    5/53

    ULARE :APUNTE IIIVariables Bidimensionales

     La nube e "untos es la re"resentaci#n gr$fica e las istribuciones

    biimensionales. Caa "unto tiene "or coorenaas el "ar e !alores %ue toman las

    !ariables.

    Las nube de puntos nos permite apreciar si ,a" una ma"or o menor relaci$n entre

    las variables%

    Tambi8n a partir de una nube de puntos se puede obtener la distribuci$n bidimensional correspondiente%

    >abr& nubes de puntos donde los puntos est8n mu" ale)ados unos de otros en estecaso se dice que la dis$ersi*! es (ra!de% Por el contrario en los casos en donde los puntosest8n mu" pr$(imos se dice que la nube de puntos est& mu" c"!ce!trada%MEDIAS+ VARIAN,AS - COVARIAN,A DE UNA VARIABLEESTADÍSTICA BIDIMENSIONAL.

    7onsideremos una variable estadística bidimensional ( ) X Y 

      cu"a distribuci$nviene dada por la tabla de !recuencias que aparece a continuaci$n:

      Y  X 

    4 y

    * y

    5 y %%%%  p y

    4 x 44n 4*n 45n %%%% 4 pn 49n

    * x *4n **n *5n %%%% * pn *9n

    5 x

    54n

    5*n

    55n %%%% 5 pn 59n

    %%%% %%%% %%%% %%%% %%%% %%%% %%%%

    k  x

    4k n *k n 5k n %%%% kpn 9k n

    94n

    9*n 95n %%%% 9 pn

    4 4

     pk 

    ij

    i j

    n N = =

    =∑∑

    Recordemos las de!iniciones de media " varian'a para las distribuciones de variableestadística unidimensional:

  • 8/18/2019 3) Variables Bi

    6/53

    ULARE :APUNTE IIIVariables Bidimensionales

    Varian'a de la variable ?:

    ( )*

    9* 4

    9k 

    i i

    i X 

     x x n

     s N 

    =

    −=

    Varian'a de la variable @:

    ( )*

    9

    4*

    9 p

     j j

     j

     y y n

     s N 

    =

    −=

    A la raí' cuadrada positiva de las varian'as se le llama desviaci$n típica " se

    representa por  X  s   " por Y  s %

    COVARIAN,A.

    DE#INICIÓN.

    /e llama c"varia!a o varia!a c"!/'!ta de una variable bidimensional ( ) X Y 

     ala media aritm8tica de los productos de las desviaciones de cada una de las variablesrespecto a sus medias respectivas%

    La covarian'a se representa por  XY  s  o  XY σ  %

    C0LCULO DE LA COVARIAN,A.

    /ea la variable estadística bidimensional representada por el par ( ) X Y 

     donde X  es

    una variable estadística unidimensional que toma los valores 4 * 5 %%%% k  x x x x   e Y   es otra

    variable estadística unidimensional que toma los valores 4 * 5 %%%%

     p y y y y

    % La variable

    estadística bidimensional ( ) X Y 

     toma los valores que aparecen en la si#uiente tabla:

     Y

     X 

    4 y * y 5 y %%%%  p y

    4 x 44n 4*n 45n %%%% 4 pn 49n

    * x *4n **n *5n %%%% * pn *9n

    5 x 54n 5*n 55n %%%% 5 pn 59n

    %%%% %%%% %%%% %%%% %%%% %%%% %%%%

    k  x 4k n *k n 5k n %%%% kpn 9k n

    Pro!esor: Ricardo 6apata 7% 

  • 8/18/2019 3) Variables Bi

    7/53

    ULARE :APUNTE IIIVariables Bidimensionales

    94n 9*n 95n %%%% 9 pn

    4 4

     pk 

    ij

    i j

    n N = =

    =∑∑

    /i los datos de las variables X  o Y  estuviesen a#rupados en intervalos los i x   "Co los

     j y   4 4i k j p≤ ≤ ≤ ≤ ,acen re!erencia a las marcas de clase%

    La covarian'a de la variable estadística bidimensional viene dada por lase(presiones Dequivalentes:

    ( ) ( )4 4

    9 9 pk 

    i j ij

    i j

     XY 

     x x y y n

     s N 

    = =

    − −=

    ∑∑  o

    4 4

    9 9

    9

     pk 

    i j ij

    i j

     XY 

     x y n

     s x y N 

    = == −∑∑

    CORRELACIÓN - RE%RESIÓN.

    CONCE)TO %ENERAL DE CORRELACIÓN.

    Representamos a continuaci$n varios dia#ramas de dispersi$n:

    Pro!esor: Ricardo 6apata 7%  F

  • 8/18/2019 3) Variables Bi

    8/53

  • 8/18/2019 3) Variables Bi

    9/53

    ULARE :APUNTE IIIVariables Bidimensionales

    a% Es una relaci$n lineal positiva !uncional% b% Es una relaci$n lineal positiva !uerte%c% Es una relaci$n lineal positiva d8bil%d% Es una relaci$n lineal ne#ativa !uncional%

    e% Es una relaci$n lineal ne#ativa !uerte%!% Es una relaci$n lineal ne#ativa d8bil%#% Relaci$n curvilínea positiva !uncional%,% Relaci$n curvilínea positiva !uerte%i% Relaci$n curvilínea positiva d8bil% )% Relaci$n curvilínea ne#ativa !uncional%J% Relaci$n curvilínea ne#ativa !uerte%l% Relaci$n curvilínea ne#ativa d8bil%m% No e(iste relaci$n%

    e una manera #eneral llamaremos c"rrelaci*! a la teoría que trata de estudiar larelaci$n o dependencia que e(iste entre las dos variables que intervienen en unadistribuci$n bidimensional%

    7on arre#lo a lo visto anteriormente se dice que:

    4% La c"rrelaci*! es li!eal " c'rvilí!ea  se#+n que el dia#rama de puntos secondense en torno a una línea recta o una curva respectivamente%

    *% La c"rrelaci*! es $"sitiva " directa cuando a medida que crece una variable laotra tambi8n crece%La c"rrelaci*! es !e(ativa " i!versa cuando a medida que crece una variable

    la otra decrece%La c"rrelaci*! es !'la  cuando no e(iste nin#una relaci$n entre ambasvariables% En este caso los puntos del dia#rama est&n esparcidos al a'ar sin!ormar nin#una línea " se dice que las variables est&n i!c"rreladas%

    5% La c"rrelaci*! es de ti$" &'!ci"!al  si e(iste una !unci$n tal que todos losvalores de la distribuci$n la satis!acen%En caso contrario ser& tanto m&s !uerte o m&s d8bil dependiendo de la ma"or omenor tendencia de los valores de la distribuci$n a satis!acer una determinada!unci$n%

    COE#ICIENTE DE CORRELACIÓN LINEAL.

    El procedimiento m&s !recuentemente utili'ado para asi#nar valores a las posiblescorrelaciones entre las variables es el c"e&icie!te de c"rrelaci*! li!eal de )ears"!.

    Pro!esor: Ricardo 6apata 7%  K

  • 8/18/2019 3) Variables Bi

    10/53

    ULARE :APUNTE IIIVariables Bidimensionales

    El coe!iciente de correlaci$n de Pearson se de!ine mediante la si#uiente e(presi$n:

      9 XY 

     X Y 

     sr 

     s s=

    0B/ERVA7I0NE/:

    4% El c&lculo pr&ctico del coe!iciente de correlaci$n lineal r M resulta mu" sencillo

    una ve' que se sabe calcular la covarian'a de la variable ( ) X Y 

    así como lasdesviaciones típicas de las variables X  e Y %

    *% El si#no del coe!iciente r M viene dado por el si#no de la covarian'a "a que lasdesviaciones típicas son siempre positivas% Así pues el si#no de la covarian'adecide el comportamiento de la correlaci$n:

    • /i la covarian'a es positiva la correlaci$n es directa%• /i la covarian'a es ne#ativa la correlaci$n es inversa%• /i la covarian'a es nula no e(iste correlaci$n%

    5% /e demuestra que el coe!iciente de correlaci$n lineal es un n+mero realcomprendido entre 4 " 4%

    -% /i 4r  = −  se puede demostrar que todos los valores de la variable bidimensional( ) X Y   se encuentran situados sobre una rectaO en consecuencia satis!acen laecuaci$n de una recta% Entonces se dice que entre las variables ? e @ e(iste unade$e!de!cia &'!ci"!al. 

    % /i 4 2r − < <   la correlaci$n es ne#ativa " ser& tanto m&s !uerte a medida que r se apro(ima m&s a 4 " tanto m&s d8bil a medida que se apro(ima a 2% En este

    caso se dice que las variables X  e Y  est&n en de$e!de!cia aleat"ria%% /i 2r  =   entonces no e(iste nin#+n tipo de relaci$n entre las dos variables% Eneste caso se dice que las variables X  e Y  son aleat"riae!te i!de$e!die!tes%

    F% /i 2 4r < <  la correlaci$n es positiva " ser& tanto m&s !uerte a medida que r seapro(ima a 4 " tanto m&s d8bil a medida que se apro(ima a 2% En este caso sedice que las variables X  e Y  est&n en de$e!de!cia aleat"ria%

    % /i 4r  =   se puede demostrar que todos los valores de la variable bidimensional( ) X Y   se encuentran situados sobre una rectaO en consecuencia satis!acen laecuaci$n de una recta% En este caso se dice que entre las variables ? e @ e(isteuna de$e!de!cia &'!ci"!al%

    VAL0RE/ E r  Intensidad de la correlaci$n4r  = 7orrelaci$n per!ecta

    Pro!esor: Ricardo 6apata 7%  42

  • 8/18/2019 3) Variables Bi

    11/53

    ULARE :APUNTE IIIVariables Bidimensionales

    2 4r < < 7orrelaci$n mu" alta

    2B 2r < < 7orrelaci$n alta

    2- 2Br < < 7orrelaci$n moderada

    2* 2-r < < 7orrelaci$n ba)a2 2*r < < 7orrelaci$n mu" ba)a

    2r  = 7orrelaci$n nula

    RE%RESIÓN.

    /upon#amos que tenemos un dia#rama de dispersi$n " tratamos de construir unalínea que se apro(ime lo me)or posible a la nube de puntos: a este recta le llamaremos lí!eade re(resi*!%

    A,ora bien el m8todo para conse#uir la línea que me)or se apro(ime a una nube de puntos no parece !&cil% 7$mo primera apro(imaci$n vamos a ver un m8todo mu" sencilloque se denomina m8todo #r&!ico%

    Este m8todo consiste en obtener a o)oM la línea que consideramos m&srepresentativa del aspecto que presenta la nube de puntos% Pero es obvio que este m8todo es poco ri#uroso " mu" sub)etivo dependiendo en #ran medida del acierto " la pericia delsu)eto que lo realice%

    CONCE)TO %ENERAL DE RE%RESIÓN.

    7onsideramos una variable estadística bidimensional ( ) X Y 

      para la que se ,acomprobado que e(iste una correlaci$n !uerte entre las variables  X   e Y % En ese caso elan&lisis de la re#resi$n permite obtener la ecuaci$n de la !unci$n matem&tica que me)or sea)usta al dia#rama de dispersi$n%

    Pero Gqu8 entendemos por la línea que me)or se a)usta al dia#rama dedispersi$nMH% Es !&cil comprender que se trata de aquella línea que ,a#a que lasdesviaciones de los puntos de la nube respecto de los correspondientes de la línea sea lomenor posible% En estas condiciones diremos que es la línea que menos se separa de la nubede puntos%

    A la ,ora de reali'ar el a)uste de una línea de re#resi$n a una nube de puntos e(istela posibilidad de apro(imar 8sta mediante una recta una par&bola una c+bica unae(ponencial una lo#arítmica etc% Nosotros nos limitaremos al estudio de la re#resi$nlineal Dmediante una recta%

    ESTUDIO ANALÍTICO DE LA RE%RESIÓN LINEAL.

    Pro!esor: Ricardo 6apata 7%  44

  • 8/18/2019 3) Variables Bi

    12/53

    ULARE :APUNTE IIIVariables Bidimensionales

    /upon#amos que una ve' estudiada la correlaci$n e(istente entre las dos variables  X 

    e Y  que componen una variable bidimensional ( ) X Y 

    se observa que dic,as variablesest&n !uertemente correladas " que el dia#rama de dispersi$n se puede a)ustar mediante una

    recta%

    /upon#amos que la variable ( ) X Y 

     toma los valores ( ) 4 4i j x y i k j p≤ ≤ ≤ ≤ como aparece en la tabla si#uiente:

     Y

     X 

    4 y

    * y

    5 y %%%%  p y

    4 x 44n 4*n 45n %%%% 4 pn 49n

    * x

    *4n **n *5n %%%% * pn *9n

    5 x 54n 5*n 55n %%%% 5 pn 59n

    %%%% %%%% %%%% %%%% %%%% %%%% %%%%

    k  x

    4k n *k n 5k n %%%% kpn 9k n

    94n

    9*n

    95n %%%% 9 pn

    4 4

     pk 

    ij

    i j

    n N = =

    =∑∑

    7onsideremos X  como variable independiente e Y  como variable dependiente de X %

    Entonces se trata de encontrar la ecuaci$n de una recta de la !orma 9 y a x b= +   que sea laque me)or se a)uste a la nube de puntos: la recta de re(resi*! de - s"bre 1 %

    Así pues el problema queda reducido al c&lculo de los par&metros aM " bM condos condiciones:

    • La recta de re#resi$n debe pasar por el punto( ) x y

    %

    • La suma( )( )

    *

    4 4

    9 9 pk 

    i i ij

    i j

     y a x b f N = =

    − + =∑∑ debe ser mínima%

    Para el c&lculo de estos par&metros que permiten obtener la recta que me)or se

    apro(ima a la nube de puntos usaremos el denominado m8todo de los mínimos cuadrados%

    /ea( )

    *

    4 4

    9 9 pk 

    ij i i

    i j

     D f y a x b= =

    = − + ∑∑% Buscamos para un aM dado el valor de bM que

    ,ace D mínimo%

    Pro!esor: Ricardo 6apata 7%  4*

  • 8/18/2019 3) Variables Bi

    13/53

    ULARE :APUNTE IIIVariables Bidimensionales

    La derivada de respecto a bM es:

    ( )   ( )4 4* 9 9 * 9 pk 

    ij i i

    i j

     D f y a x b y a x b

    b   = =

     ∂ = − − − = − − − ÷∂    ∑∑

      Por tanto el mínimo parcial alcan'ado ,aciendo variar bM para un aM dado es:

    9b y a x= −   Del mínimo se obtiene donde la derivada se anula%

    Esta relaci$n entre aM " bM e(presa #eom8tricamente que la recta buscada pasa por 

    el punto( ) x y

    %

    Llamamos a,ora

    ( )**

    4

    4 4 4 4

    9 9 9 9 9 p pk k 

    ij i i ij i i

    i j i j

     D f y a x y a x f y y a x x= = = =

    = − − + = − − −   ∑∑ ∑∑

    " consideramos:( ) ( )( )4

    4 4

    * 9 9 9 pk 

    ij i i i

    i j

     D f x x y y a x x

    b   = =

     ∂= − − − − − ÷∂    

    ∑∑

    el valor de aM que anula esta derivada es:

    ( ) ( )

    ( )

    4 4

    *

    4 4

    9 9

    9

     pk 

    ij i i

    i j

     pk 

    ij i

    i j

     f x x y y

    a

     f x x

    = =

    = =

    − −=

    ∑∑

    ∑∑ es decir:

    *

     XY 

     X 

     sa

     s=

     

    En de!initiva 

    ( )* * *9 9 9 9 XY XY XY 

     X X X 

     s s s y a x b x y x x x y

     s s s= + = + − = − +

    0 lo que es lo mismo conocida la pendiente " un punto por el que pasa la recta dea)uste es:

    ( )* 9 XY  X 

     s y y x x

     s− = −

    Pro!esor: Ricardo 6apata 7%  45

  • 8/18/2019 3) Variables Bi

    14/53

    ULARE :APUNTE IIIVariables Bidimensionales

    A esta recta de re#resi$n( )* 9 XY 

     X 

     s y y x x

     s− = −

    se le llama recta de re(resi*! de -s"bre 1.

    A partir de esta recta podemos calcular con cierta apro(imaci$n los valores de  yMconocidos los de  xM sin m&s que sustituir estos +ltimos en la ecuaci$n% A estos c&lculos seles llama estiaci"!es o $revisi"!es%

    An&lo#amente se puede obtener la recta de re#resi$n de ? sobre @ cu"a !ormasería:

    ( )* 9 XY Y 

     s x x y y

     s− = −

    A partir de esta recta podemos calcular con cierta apro(imaci$n los valores de  xMconocidos los de  yM sin m&s que sustituir estos +ltimos en la ecuaci$n%

     No obstante Gqu8 !iabilidad podemos conceder a estos c&lculos obtenidos a trav8sde las rectas de re#resi$nH%

    La !iabilidad ser& tanto ma"or cuanto ma"or sea el coe!iciente de correlaci$n linealen valor absoluto% Así pues si r M est& mu" pr$(imo a cero no tiene sentido reali'ar nin#+ntipo de estimaciones o previsiones% /i r M est& mu" pr$(imo a 4 o a 4 probablemente losvalores reales ser&n pr$(imos a nuestras estimaciones " si r 4 o r 4 las estimacionesreali'adas coincidir&n con los valores reales%

    Pero incluso para valores de r M pr$(imos a 4 o a 4 las estimaciones que

    obten#amos pueden resultar poco !iablesO por e)emplo cuando se pretende e(trapolar m&sall& del recorrido de los datos observados%

    Pro!esor: Ricardo 6apata 7%  4-

  • 8/18/2019 3) Variables Bi

    15/53

    ULARE :APUNTE IIIVariables Bidimensionales

    ANÁLISIS DE VARIANZA

    ANOVA

    Pro!esor: Ricardo 6apata 7%  4

  • 8/18/2019 3) Variables Bi

    16/53

    ULARE :APUNTE IIIVariables Bidimensionales

     

    CONTENIDO

    1. ANOVA

    2. Ejercicios

    Pro!esor: Ricardo 6apata 7%  4

  • 8/18/2019 3) Variables Bi

    17/53

    ULARE :APUNTE IIIVariables Bidimensionales

    3. Teoría de experimentos de un solo factorANALISIS DE VARIANZA DE

    UN FACTOR (ANOVA 1 VIA)

    El análisis de la variana de un factor !ANOVA" es una metodolo#ía para analiar la variaci$n entre

    muestras % la variaci$n al interior de las mismas mediante la determinaci$n de varianas. Es llamado

    de una vía por&ue analia un varia'le independiente o (actor ej) Velocidad. *omo tal+ es un m,todo

    estadístico -til para comparar dos o más medias po'lacionales. El ANOVA de un criterio nos permite

    poner a prue'a ip$tesis tales como)

    k  H    µ  µ  µ  µ    ===== %%%%5*42

    %:4   diferentes sonles poblacionamediasdosmenos Al  H 

    /os supuestos en &ue se 'asa la prue'a t de dos muestras &ue utilia muestras independientes

    son)

    1. Am'as po'laciones son normales.

    2. /as varianas po'lacionales son i#uales+ esto es+ %*

    *

    *

    4   σ σ    =

    El estadístico tiene una distri'uci$n muestral resultando)

    *

    *

    w

    b

     s

     s Fc =

    El valor crítico para la prue'a ( es)

    EE4D4D   −−   nk k  F α 

    0onde el n-mero de #rados de li'ertad para el numerador es 1 % para el denominador es !n1"+

    siendo α   el nivel de si#nificancia.

    n-mero de muestras.

    Pro!esor: Ricardo 6apata 7%  4F

  • 8/18/2019 3) Variables Bi

    18/53

    ULARE :APUNTE IIIVariables Bidimensionales

    4or ejemplo)

    Ejemplo: 5e tienen 16 empleados seleccionados al aar &ue se someten a3 diferentes cursos de entrenamiento) 4ro#rama 1+ 4ro#rama 2 % 4ro#rama 3.

    *omo los empleados se seleccionan aleatoriamente para cada pro#rama

    el dise7o se denomina 085E9O *O:4/ETA:ENTE A/EATO;8

  • 8/18/2019 3) Variables Bi

    19/53

    ULARE :APUNTE IIIVariables Bidimensionales

    5*T [email protected]

    V!"#!$#%& e&'"e lo *#+e"e&'e '"!'!m#e&'o o Variaci$n entre muestras o variaci$n entre

    pro#rama 1+ pro#rama 2 % pro#rama 3

    E(E*TO 0E /A :E08A 0E *A0A T;ATA:8ENTO ;E54E*TO A /A :E08A >ENE;A/

    *

    4

    ED   X  X r !"#   jr 

     j

     j   −= ∑=

    5*T; 6!BC.@ ?1.3333"2 @!?1 ?1.3333"2 @!?@ ?1.333"2

    5*T; [email protected]

    , V!"#!$#%& *e&'"o *e -& '"!'!m#e&'o o m-e'"!  o pro#rama dado &ue no todos los empleados

    dentro de un mismo pro#rama o'tuvieron los mismos puntajes. 5e denomina Variaci$n dentro de los

    tratamientos.

    VA;8A*8=N 0ENT;O 0E/ T;ATA:8ENTO O VA;8A*8=N 0E/ E;;O;

    *A0A VA/O; ;E54E*TO A /A :E08A 0E 5 T;ATA:8ENTO

    *

    44

    ED   jc

     j

    ij

    i

     X  X !$    −=   ∑∑==

    SCE . SCT / SCTR . 10

    2 3RADOS DE LI4ERTADPro!esor: Ricardo 6apata 7%  4K

  • 8/18/2019 3) Variables Bi

    20/53

    ULARE :APUNTE IIIVariables Bidimensionales

    >rados de li'ertad totales n 1 161 13

    >rados de li'ertad de los tratamientos c 1 3 1 2

    >rados de li'ertad del error #l. Totales #l. Tratamientos 13 2 11#l 5*T #l 5*T; #l 5*E

    #l 5*E #l 5*T #l 5*T; !n 1" !c 1" n c

    5 CUADRADOS MEDIOS (5uma *uadradosF >rados li'ertad"

    *:T *uadrado medio total 5*T F !n1" 1C.6

    *:T; *uadrado medio del tratamiento 5*T; F !c 1" 32.C

    *:E *uadrado medio del error 5*EF #le. 1D.C

    ESTAD6STICO DE PRUE4A F$ Y ESTAD6STICO F CR6TICO DE ALFA

    (c *:T; F *:E 1.946745562

    cncador deno %l numerador  %l alfa   F  F  −−= 4min%%   α 

    *álculo de ( con Excel

    085T;.(.8NV!A/(A+ >/. T;+ >/. E;;" 085T;.(.8NV!G.G@+ 2+ 11" 3.C?22CBC@B

      !"#$%&'&"

      '!& (#"#$%&'!

    (istr. )

    *omo (c es menor a (alfa no se recaa Ho % las medias son i#uales.

    Pro!esor: Ricardo 6apata 7%  *2

  • 8/18/2019 3) Variables Bi

    21/53

    ULARE :APUNTE IIIVariables Bidimensionales

    7 VALOR P DE F$

    4 distr.f!(c+ #l. 5*Tr+ #l. 5*E" distr.f!1.C6D+ 2+ 11" 0.18898099*omo 4 es ma%or a alfa no se recaa Ho

    CONCLUSION: NO HAI 5(8*8ENTE EV80EN*8A 4A;A ;E*HAA/E5

    Pro!esor: Ricardo 6apata 7%  *4

  • 8/18/2019 3) Variables Bi

    22/53

  • 8/18/2019 3) Variables Bi

    23/53

    ULARE :APUNTE IIIVariables Bidimensionales

    7

    USO DE MINITA4

      S'!' < ANOVA < O&e =!> (U&'!$?e*)

    en ;esponses in separate columns 8ndicar las columnas de datos

    En *onfidence /evel C@K

    5eleccionar *omparisons Tue% @K

    OL

    One-way ANOVA: Programa 1, Programa 2, Programa 3

    Source DF SS MS F P

    Factor 2 65.7 32.9 1.94 0.189Error 11 186.0 16.9

    Total 13 251.7

    S = 4.112 R-Sq = 26.11 R-Sq!a"#$ = 12.67

      %&"'('"ual 95 )%* For Mea& +a*e" o&

      Poole" StDe(

    ,e(el Mea& StDe( ------------------------------------

    Pro/raa 1 4 80.000 5.715 !------------------------$

    Pro/raa 2 5 81.000 2.236 !---------------------$

    Pro/raa 3 5 85.000 4.123 !---------------------$

      ------------------------------------

      77.0 80.5 84.0 87.5Poole" StDe( = 4.112

    NOTA: 5i los 8ntervalos de confiana se traslapan+ las medias son i#uales estadísticamente

    Tue 95 S'ulta&eou* )o&'"e&ce %&ter(al*

    ll Pa'r'*e )oar'*o&*

    %&"'('"ual co&'"e&ce le(el = 97.94

    Pro/raa 1 *utracte" ro

      ,oer )e&ter :er ------------------------------------

    Pro/raa 2 -6.451 1.000 8.451 !-----------------------$

    Pro/raa 3 -2.451 5.000 12.451 !-----------------------$

      ------------------------------------

      -6.0 0.0 6.0 12.0

    Pro/raa 2 *utracte" ro

    Pro!esor: Ricardo 6apata 7%  *5

  • 8/18/2019 3) Variables Bi

    24/53

    ULARE :APUNTE IIIVariables Bidimensionales

      ,oer )e&ter :er ------------------------------------

    Pro/raa 3 -3.025 4.000 11.025 !---------------------$

      ------------------------------------

      -6.0 0.0 6.0 12.0

    Pro!esor: Ricardo 6apata 7%  *-

  • 8/18/2019 3) Variables Bi

    25/53

    ULARE :APUNTE IIIVariables Bidimensionales

    NOTA: 5i el cero se encuentra en el intervalo de confiana de la diferencia entre medias+ este par de

    medias no son diferentes. E@ERCICIOS:

    1  *uatro cataliadores &ue pueden afectar la concentraci$n de un componente en una mecla

    lí&uida de tres componentes están siendo investi#ado.

    5e o'tienen las si#uientes concentraciones)

    C!'!l#;!*o"A 4 C D

    50 5, 51 5B57 525 52 2BB502 57 552 5550 55, 517

    52B

    4ara determinar si existe diferencia si#nificativa en el nivel de :atemáticas de 6 #rupos de

    estudiantes de 8n#eniería se reali$ un examen aleatorio a D individuos por #rupo. 0etermine

    cuales son los #rupos en los cuales existen diferencias a un C@K de nivel de confiana.

     

     & $ (

    75 78 55 4

    93 91 72

    78 97 49 871 82 4 77

    3 85 70 5

    7 77 8 95

    , /as calificaciones en el examen a 1? empleados de tres unidades de ne#ocio

    5e muestran a continuaci$n)

    4ro'ar si no a% diferencia entre las unidades a un @K de nivel de si#nificancia.

    A J *?@ B1 @CB@ B@ D6?2 B3 D2BD B6 DCB1 DC B@?@ ?2 DB

    Pro!esor: Ricardo 6apata 7%  *

  • 8/18/2019 3) Variables Bi

    26/53

    ULARE :APUNTE IIIVariables Bidimensionales

    2 4ro'ar si a% diferencia en los tiempos de servicio de 6 unidades de ne#ocio para el mismo

    servicio a un nivel de si#nificancia del @K.

    A J * [email protected] ?.B 11.1 C.CB.? B.6 1G.3 [email protected] C.6 C.B 12.1B.6 1G.1 1G.3 1G.??.6 C.2 C.2 11.3B.3 C.? ?.? 11.@

    Pro!esor: Ricardo 6apata 7%  *

  • 8/18/2019 3) Variables Bi

    27/53

    ULARE :APUNTE IIIVariables Bidimensionales

    , TEOR6A DE E8PERIMENTOS DE UN SOLO FACTOR

    n esta parte se analia el caso en &ue se desea conocer el efecto de un solo factor ovaria'le independiente so're la característica de calidad &ue s, esta analiando. Esto

    implica &ue a fin de poder detectar su efecto+ este factor se de'e de variar manteniendo el

    resto de los factores en un valor fijo.EEpe"#me&'o #& "e'"#$$#o&e e& l! !le!'o"#e*!*

    uando se desea analiar el efecto de un factor so're una varia'le dependiente o

    característica de calidad es necesario el variar el Mnivel valor de ese factor. A cada

    diferente nivel al cual se realia el experimento se le conoce como tratamiento. 4or

    ejemplo si el factor es el proveedor los diferentes niveles o serian proveedor A+ proveedor J+

    proveedor *+ etc. + si el factor es el tipo de proceso los tratamientos serian proceso 1+ proceso 2. 5i

    el factor es temperatura los diferentes niveles serian por ejemplo 1G+ 2G+ 3G % 6G *+etc.

    *4or otro lado en cada nivel del factor se efect-an una serie de prue'as+ a cada una de estas prue'as

    se les conoce como replicaciones E/ factor se considera fijo.

    Ejemplo 1: 5upon#a &ue se desea sa'er si los ejes &ue surten cuatro proveedores tienen diferente

    resistencia a la tracci$n. 4ara ello se decide llevar a ca'o un experimento de un solo factor donde la

    varia'le dependiente es la resistencia a la tracci$n del eje medida en L#sFcm 2 % el factor es el

    proveedor. El factor tiene cuatro niveles o tratamientos diferentes. no para cada proveedor

    !llámelos 8+ 88+ 888+ 8V" se decide pro'ar @ ejes de cada proveedor aciendo un total de 2G prue'as

    ejecutadas en la misma ma&uina de prue'a % con ,l mismo operario !recuerde &ue el resto de losfactores se de'en de mantener a un nivel fijo".

    4ara &ue el experimento sea aleatorio se numeran los ejes del 1 al 2G % se selecciona al aar un

    n-mero entre 1 % 2G. 5e#-n ,l numero seleccionado es el si#uiente eje &ue se prue'a. 0e esta

    Pro!esor: Ricardo 6apata 7%  *F

  • 8/18/2019 3) Variables Bi

    28/53

    ULARE :APUNTE IIIVariables Bidimensionales

    manera+ el si#uiente eje a pro'ar es seleccionado sin nin#una restricci$n. 5upon#a. &ue los

    resultados de experimento se muestran en la ta'la si#uiente)

    P"oee*o" I II III IV@D D6 6@ 62@@ D1 6D 3CD2 @G 6@ 6@@C @@ 3C 63DG @D 63 61

    El proveedor factor

    Tratamiento 8+ 88+ 888+ 8V

    *on cinco replicaciones en cada tratamiento.

    O'servando la ta'la se MveM &ue existen evidentemente diferencias entre la resistencia de los ejes de

    un proveedor a otro. 4ero tam'i,n existen entre los ejes de un mismo proveedor+ entonces+ Pla

    diferencia detectada entre+ los ejes de un proveedor % otro existe realmenteQ O Pla diferencia es

    de'ida al aarQ+ /a erramienta estadística conocida como análisis de variana !ANOVA" puede

    a%udar a despejar esta duda.

    4ara esto supon#a un caso #eneral como si#ue) 5i define Iij como el valor correspondiente de la

    varia'le dependiente o característica de calidad de la i,sima o'servaci$n o replicaci$n 'ajo el

    tratamiento j+ los resultados de un experimento de un solo factor con tratamientos % n replicas u

    o'servaciones por tratamiento seria)

    T"!'!m#e&'o

    (el)

    Oe"!$#o&e To'!le P"ome*#o

    1 I11 I12 ... I1n I1.   ..

    2 I21 I22 ... I2n I2.   .2

    3 I31 I32 ... I3n I3. .3

    ... ... ... ... ... ... ...

    Pro!esor: Ricardo 6apata 7%  *

  • 8/18/2019 3) Variables Bi

    29/53

    ULARE :APUNTE IIIVariables Bidimensionales

    L I1 I2 ... In I. .:

    Este caso se puede representar mediante el modelo estadístico lineal)

     ij jij ;

  • 8/18/2019 3) Variables Bi

    30/53

    ULARE :APUNTE IIIVariables Bidimensionales

    ..C,..

    ..

    ,1A2A...Ai co, .C,.

    .

    ,

    1i

    :

    1 j

    ij

    ii

    ,

    1i

    iji

    =

    =

    ==

    =

    ∑∑

    = =

    =

    N n es ,l numero total de o'servaciones

    /as ip$tesis en este caso son)

    Ho) τ j  GR para todo valor de j.H1) τ j ≠ GR para al menos un valor de j.

    %o si$ni&ica '#e el &actor (los niveles bajo est#dio) no tiene e&ecto sobre la variable de!endiente % 1

    '#e si lo tiene, esto es '#e e*iste di&erencia, estad+stica. ec#erde tambin '#e la i!/tesis n#la se

    as#me como cierta a menos '#e los datos indi'#en lo contrario.

    0escomposici$n de la suma total de cuadrados

    a denominaci$n de análisis de variana resulta de descomponer la varia'ilidad total de los

    datos en sus partes componentes. /a suma total de cuadrados corre#ida es)/( ) ( )

    #

    :

    1 j

    ,

    1i

    2:

    1 j

    2:

    1 j

    ,

    1i

    2

    ****tr **

    .iij..i.,..ij

    +=

       

       −+−=−   ∑∑∑∑∑

    = === =

    0onde)

    Pro!esor: Ricardo 6apata 7%  52

  • 8/18/2019 3) Variables Bi

    31/53

  • 8/18/2019 3) Variables Bi

    32/53

    ULARE :APUNTE IIIVariables Bidimensionales

    tratamientos de un solo factor el si#uiente paso es el analiar en detalle cual de los tratamientos

    es el mejor % cuales son i#uales.

    Aplicando el ANOVA a los datos del ejemplo 2.2 se tiene)

    ∑∑= =

    =+++=4

    1 j

    5

    1i

    2222 5194041...5556Yij

    Entonces+ calculando las sumas de cuadrados tenemos &ue)

    55T  @1+C6G S !1GGD2"F2G 133?.2

    55tr  2C22F@ 2?D2F@ 21?2F@ 21G2F@ S1GGD2F2G [email protected]

    55E  55T S 55tr 133?.2 S [email protected] 2G3.2

    :5tr  55trF!1" [email protected]!3 1" 3B?.2

    :5E  55EF!n" 2G3.2F!2G6" 12.BG

    Pro!esor: Ricardo 6apata 7%  5*

    Totales Promedios

    Yi

    I 56 55 62 59 60 292 58.4

    II 64 61 50 55 56 286 57.2

    III 45 46 45 39 43 218 43.6

    IV 42 39 45 43 41 210 42

    Y..= 1006 40.24

    ..

    .

  • 8/18/2019 3) Variables Bi

    33/53

    ULARE :APUNTE IIIVariables Bidimensionales

    Esto se resume en la si#uiente ta'la)

    F-e&'e

    De e""o" SS 3L MS F

    (actor o tratamientos 55tr113@ S 1 3 :5tr 3B?.3:5trF:5E

    2C.BCError 55E2G3.2 N S 1D :5E12.BTotal 55T133?.2 N S 1 1C

    0onde (G :5trF:5E  3B?.3F12.BG2C.BC con 3 #rados de li'ertad en el numerador % 1D #rados de

    li'ertad en el denominador.

    5i el nivel de aceptaci$n !error tipo 8" lo fijamos en @K+ esto es+ α  G.G@+ de la ta'la de la funci$n (

    se tiene &ue)

    (α+3+1D  3.26

    0ado &ue (G 2C.BC 3.26 ( G.G@+3+1D

    Se concl#e '#e %o se recaa el &actor !roveedor a&ecta la variable resistencia a la tracci/n.

    Epe"#me&'o $o& -& olo +!$'o" > *#+e"e&'e &me"o *e le$'-"! po" '"!'!m#e&'o (o $!o

    *e!l!&$e!*o)

    uando por al#una ra$n ,l numero de lecturas &ue se tienen 'ajo cada tratamiento es

    diferente+ di#amos E****

    liDertaddegrados1E:co,>**

    liDertaddegrados1Eco,>

    ..**

    #

    :

    1 j

    tr 

    :

    1 j

    ,

    1i

    2

    E2

    ij

    =

    −=

    =

    ∑∑

    =

    = =

     N 

    n

    i

    i** %%%

    Pro!esor: Ricardo 6apata 7%  55

  • 8/18/2019 3) Variables Bi

    34/53

    ULARE :APUNTE IIIVariables Bidimensionales

     

    Es+ sin em'ar#o+ desea'le &ue ,l numero de muestras sea i#ual 'ajo cada tratamiento+ puesto &ue

    el poder de la prue'a se maximia cuando ,l numero de muestras es i#ual.

    Ejemplo : El tiempo de respuesta en milise#undos fue determinado para tres tipos diferentes de

    circuitos % los resultados son)

    *on un nivel de si#nificaci$n de α  G.G@. PTiene los circuitos diferente tiempo de respuestaQ

    3R n1 DR n2 3R n3 6R N D 3 6 13

    12.29474.98E37.24E

    474.9813

    1754

    353

    73

    7

    C?..C,.B

    37.242355.72993

    13

    17518...129

    C?..Bij

    tr #

    2222

    :

    1 j

    2i

    2itr 

    22222

    :

    1 j

    ,

    1i

    22

    ===

    =−++

    =−=

    =−

    =−++++

    =−=

    ∑∑

    =

    = =

    /a ta'la ANOVA es)

    Pro!esor: Ricardo 6apata 7%  5-

    otales Promedios

    tr i

    I 9 12 10 8 15 13 7 11.17

    II 20 23 30 73 24.33

    III 5 8 1 35 8.75

    .. 175 14.75

    !Dseracio,es   .i

    ..=

  • 8/18/2019 3) Variables Bi

    35/53

    ULARE :APUNTE IIIVariables Bidimensionales

    F-e&'e

    De e""o"SS 3L MS

    F

    (actor o tratamientos 55tr6B6.C? S 1 2 :5tr 23B.6C:5trF:5E

    16.D6Error 55E1D2.2C N S 1G :5E1D.22Total 55TD3B.26 N S 1 12

    ado '#e .05,2,10 3 4.10, se concl#e '#e los circ#itos m#estran di&erentes tiem!os de res!#esta.

    Estimaci$n de parámetros del modelo

     

    continuaci$n+ se desarrollan estimadores para los parámetros del modelo de clasificaci$n en

    un sentido)Aijiij ;

  • 8/18/2019 3) Variables Bi

    36/53

    ULARE :APUNTE IIIVariables Bidimensionales

    n estimador puntual para µi podría ser .04.152537=F   ==

    24.404.1580.10...

  • 8/18/2019 3) Variables Bi

    37/53

    ULARE :APUNTE IIIVariables Bidimensionales

    ( )

    [ ]B%*B2%*4

    %

    2B%2B%*B2%*4% *C

    ±

    ±=

    ±   −

    bieno

    n

     & t Y 

      $ k  N i   α 

    por tanto+ el intervalo deseado es 1?.C@ ≤ µ ≤ 26.2@

    Estimaci$n de la varia'le de respuesta

    a descomposici$n de la varia'ilidad en las o'servaciones por medio del análisis de variancia+ esuna relaci$n puramente al#e'raica./

    ijiij ;

  • 8/18/2019 3) Variables Bi

    38/53

    ULARE :APUNTE IIIVariables Bidimensionales

    El examen de los residuos de'e ser automático en el análisis de variancia. Si el modelo es

    adec#ado, los resid#os no deben tener estr#ct#ra.

    *omparaci$n de medias de tratamientos individuales

    upon#amos &ue al efectuar un análisis de variancia para un modelo de efectos fijos la)

    ip$tesis nula es recaada. 5e conclu%e &ue existe diferencia entre las medias+ aun&ue no

    se especifi&ue exactamente c#al de ellas es di&erente. En esta situaci$n puede ser -til

    realiar comparaciones adicionales entre #rupos de medias de los tratamientos. /a media del i

    ,simo tratamiento se define mediante µi  µ  τi % su estimaci$n es .i . /as comparaciones entre

    medias de tratamientos se realian en t,rminos de los totales de tratamientos Ii. O de los promedios

    de tratamientos .i . /os procedimientos para efectuar estas comparaciones se conocen como

    mtodos de com!araci/n mlti!le

    5

    M'o*o *e l! MGm! D#+e"e&$#! S#H+#$!'#! (LSD *el #&Hl le!' #H+#$!&' *#++e"e&$e)

    upon#amos &ue despu,s de a'er recaado la ip$tesis nula+ con 'ase en una prue'a  

    de análisis de variancia+ se desea pro'ar Ho) µi µ j para toda i ≠  j. Esto puede acerse

    empleando la estadística t)

    5    

       +

    −=

     ji

    #

     jio

    ,

    1

    ,

    1M*

    ..t

    5uponiendo una ip$tesis alterna 'ilateral+ la pareja de medias µi+ µ j se consideran diferentes

     5í ji#:A2CG ji ,C1,C1BM*t..   +>−   −

     /a cantidad)

       

       +=   −

     ji

    #:GC2A

    ,

    1

    ,

    1Mt(

    Pro!esor: Ricardo 6apata 7%  5

  • 8/18/2019 3) Variables Bi

    39/53

    ULARE :APUNTE IIIVariables Bidimensionales

    5e denomina mínima diferencia si#nificativa. 5i el dise7o es 'alanceado+ entonces n1  n2  n  n.

    4ara usar el procedimiento de la /50+ simplemente se comparan las diferencias o'servadas entrecada par de promedios con el valor correspondiente de la /50. 5i+ se conclu%e &ue las medias

    po'lacionales µi  µ j son diferentes.

    Ejemplo 2: 4ara ilustrar este procedimiento+ si se usan los datos del Ejemplo 2.3 el valor de la /50

    con α  .G@ es)

    3.755

    2(8.06)2.086

    n

    1

    n

    1!t"!#

     ji$%&'(2)

    =

    =  

      

      +=   −

    4or tanto+ una pareja de medias difieren si#nificativamente si el valor a'soluto de la diferencia de

    promedios en los tratamientos correspondientes es ma%or &ue 3.B@. /os cinco promedios detratamiento son)

    10.8.Y 21.6.Y

     16.6.Y 15.4.Y 9.8.Y

    54

    321

    ==

    ===

     

    I las diferencias de los promedios son)

    Pro!esor: Ricardo 6apata 7%  5K

  • 8/18/2019 3) Variables Bi

    40/53

  • 8/18/2019 3) Variables Bi

    41/53

    ULARE :APUNTE IIIVariables Bidimensionales

    :i1

    :i

    ==I%

    ==I%o

    ≠=

    4ara i 1+ 2+...+ 1. El procedimiento de 0unnett es una modificaci$n de la prue'a t. 4ara cada

    ip$tesis se calculan las diferencias &ue se o'servan en las medias mu,strales)

    1E:1A2A...Aico,:.i.   =− 

    /a ip$tesis nula Ho) µi µ es recaada con un nivel de error tipo 8 se#-n alfa sí)

       

       +−>−

    :i

    #G

    ,

    1

    ,

    1M?1AB:d:.i.

    En donde la constante dα ! 1+ f" se encuentra en la Ta'la 8U del Ap,ndice del texto de 0ise7o %

    Análisis de Experimentos de 0ou#las *. :ont#omer% !son posi'les tanto prue'as unilaterales como

    'ilaterales". Ha% &ue notar &ue alfa constitu%e el nivel de si#nificaci$n conjunto asociado a las 1

    prue'as.

    Ejemplo 5: 4ara ilustrar la prue'a de 0unnett+ consid,rense los datos del Ejemplo 3+ % su p$n#ase

    &ue el tratamiento @ es el control. En este ejemplo+ @+ 1 6+ f 2G+ ni n @+ % con un nivel

    del @K se encuentra en la Ta'la 8U del Ap,ndice &ue d G.G@ !6+2G" 2.D@. 4or tanto+ la diferencia crítica

    es)

    4.75

    2B8.0?2.5

    ,

    2M#d.05B4A20?   ==

    Pro!esor: Ricardo 6apata 7%  -4

  • 8/18/2019 3) Variables Bi

    42/53

    ULARE :APUNTE IIIVariables Bidimensionales

    !Ha% &ue notar &ue esta es una simplificaci$n de la Ecuaci$n anterior % &ue resulta de un dise7o

    'alanceado." En consecuencia+ un tratamiento de'e considerarse si#nificativamente diferente del

    control si la diferencia es ma%or &ue 6.BD. /as diferencias o'servadas son)

    10.810.821...5>s4

    .810.817...5>s3

    4.10.815.4..5>s2

    1.010.89.8..5>s1

    54

    53

    52

    51

    =−=−

    =−=−

    =−=−

    −=−=−

    5$lo las diferencias ...>. 5453   −−  indican una diferencia si#nificativa al ser comparadas con

    el controlR por tanto+ se conclu%e &ue µ3  µ@ % µ6  µ@. Es conveniente usar más o'servaciones para

    el tratamiento de control !es decir+ n " &ue para los otros tratamientos !o sea+ n+  suponiendo el mismo

    n-mero de o'servaciones en los otros 1 tratamientos" cuando se comparan tratamientos con un

    control. 0e'e ele#irse la ra$n n F n aproximadamente i#ual a la raí cuadrada del n-mero total de

    tratamientos. En otras pala'ras+ se eli#e nFn :  S-po#$#o&e *el !&9l## *e !"#!&;! 

    Al aplicar un análisis de variana se acen las si#uientes suposiciones si#uientes)

    1. El proceso esta en control estadístico !esta'le". Esto es+ se pueden repetir % las causas de

    variaci$n se an eliminado.

    2. /a distri'uci$n de la po'laci$n &ue se muestra es normal.

    3. /a variana de los errores dentro de los niveles del factor es la misma) esto es+ la

    varia'ilidad natural dentro de cada tratamiento es la misma de un tratamiento a otro.

    3"!+#$! *e "e#*-o $o&'"! el !lo" !j-'!*o *e ijHR

    Pro!esor: Ricardo 6apata 7%  -*

  • 8/18/2019 3) Variables Bi

    43/53

    ULARE :APUNTE IIIVariables Bidimensionales

    i el modelo es correcto % las suposiciones se satisfacen+ los residuos no de'en tener al#-n

    patr$n+ ni de'en estar relacionados con al#una varia'le+ inclu%endo la respuesta I ij. na

    compro'aci$n sencilla consiste en #raficar los residuos contra los valores ajustados ijHR

    !de'e recordarse &ue para el modelo en un sentido i.Eij   HHR el promedio del tratamiento i,simo". En

    esta #rafica no de'e revelarse nin#-n patr$n o'vio en la si#uiente fi#ura se #rafican los residuos

    contra los valores ajustados de los datos de la resistencia a la tensi$n del ejemplo 2.3 Nin#-n patr$n

    inusual es evidente.5

    >rafica de residuos contra valores ajustados

    n efecto &ue en ocasiones revela la #rafica es el de una variana varia'le. Al#unas veces la

    variana de las o'servaciones lo ace. Esto resulta cuando el error es proporcional a la ma#nitud dela o'servaci$n !com-nmente esto sucede en instrumentos de medici$n S el error es proporcional a la

    escala de la lectura". 5i este es el caso+ los residuos aumenta a medida &ue Iij lo ace+ % la #rafica

    de los residuos contra ij  parecerá un em'udo &ue se ensanca o un altavo. /a variana varia'le

    tam'i,n ocurre en casos cu%os datos no tienen distri'uci$n normal % están ses#ados+ por&ue en las

    distri'uciones ses#adas la variana tiende a ser funci$n de la media.

    1 I&'"o*-$$#%& ! l! e'!*G'#$! *e !$$#*e&'e

    Cl!#+#$!$#%& *e lo !$$#*e&'e

    , S#'em! *e Cl!#+#$!$#%&

    2 6&*#$e E'!*G'#$o

    Pro!esor: Ricardo 6apata 7%  -5

  • 8/18/2019 3) Variables Bi

    44/53

    ULARE :APUNTE IIIVariables Bidimensionales

     1. Introdu!"n a #a e$tad%$t!a de a!dente$

    El tratamiento estadístico de los accidentes constitu%e una t,cnica #eneral analítica de #ran

    rendimiento en se#uridad al permitir el control so're el n-mero de accidentes+ sus causas+ #ravedad+localiaci$n de puestos de tra'ajo con ries#o+ onas del cuerpo más expuestas % cuantas

    circunstancias pueden incidir en los accidentes.

    A lo lar#o de distintos períodos de tiempo esto posi'ilita conocer la situaci$n so're el #rado de

    accidenta'ilidad de un sector o rama de actividad+ forma de producirse el accidente+ onas del

    cuerpo afectado+ etc,tera %a partir de los datos o'tenidos+ consecuencia de una clara % correcta

    clasificaci$n+ orientar la actuaci$n de las t,cnicas operativas de se#uridad.

    No o'stante el induda'le valor de esta t,cnica para conocer la evoluci$n de la accidenta'ilidad

    dentro de una misma empresa+ presenta el pro'lema de la disparidad de criterios existentes en su

    tratamiento+ tanto a nivel nacional como internacional+ por lo &ue los datos estadísticos+

    denominados índices Estadísticos+ s$lo podrán ser comparados cuando se conocan los verdaderos

    criterios &ue an intervenido en su determinaci$n.

    2. a$!'!a!"n de #o$ a!dente$

    4ara poder actuar so're los accidentes de tra'ajo+ es preciso sa'er cuándoW+ d$ndeW + c$moW %por &u,W se producen+ %a &ue s$lo a partir de este conocimiento+ fruto de una exaustiva

    clasificaci$n+ se podrán esta'lecer las t,cnicas adecuadas para su prevenci$n.

    (actores de clasificaci$n)

    /os factores más importantes de clasificaci$n utiliados en los distintos sistemas % recomendadospor la O8T son los si#uientes)

    (orma o t!)o de a!dente) refleja las circunstancias en &ue ocurri$ el accidente. /anaturalea del contacto o forma en &ue ,ste se a producido entre la persona afectada % el o'jeto osu'stancia &ue causa la lesi$n !atrapamiento+ caídas+ electrocuci$n+ etc."

    Pro!esor: Ricardo 6apata 7%  --

  • 8/18/2019 3) Variables Bi

    45/53

    ULARE :APUNTE IIIVariables Bidimensionales

    A)arato o agente mater!a# au$ante: o'jeto+ su'stancia o condici$n del tra'ajo &ueprodujo el accidente con o sin lesi$n !veículo+ erramienta+ ma&uinaria+ etc." 5e puede distin#uirentre) a#ente material ori#en del accidente % a#ente material ori#en de lesi$n.

    Natura#e*a de #a #e$!"n: tipo de lesi$n física sufrida por el tra'ajador !luxaci$n+ fractura+des#arramiento+ amputaci$n+ etc."

    +!a!"n de #a #e$!"n: parte del cuerpo donde se localia la lesi$n !mano+ ca'ea+ ojos+ etc.". /a American National 5tandards 8nstitute !AN58" introduce+ además+ otros factores complementarios. Parte de# agente mater!a#: parte del a#ente material &ue se relaciona más directamente conel accidente !elementos de una má&uinaerramienta+ muela a'rasiva+ etc." Al i#ual &ue en el a#entematerial se puede considerar una do'le faceta+ como ori#en de accidente o como ori#en de lesi$n.  

    &ond!!"n )e#!gro$a: causa t,cnica relacionada con el accidente.

    Ato !n$eguro) causa umana o imprudencia relacionada con el accidente.

    /os factores se7alados se pueden completar con otros+ de induda'le valor en se#uridad+ tales como)Actividad industrial % tama7o de la empresaR /u#ar del accidenteR 5exo % edad del accidentadoR4rofesi$n+ calificaci$n+ experiencia del accidentado+ tipo de contratoR :es del a7o+ día de la semana+ora del día+ etc.

    3. S!$tema$ de a$!'!a!"nJasado en los factores anteriores se an esta'lecido dos sistemas de clasificaci$n de accidentes)

    a$!'!a!"n $!m)#e: en#lo'a en una -nica ta'la factores diversos+ inclu%e al#unos de lossi#uientes factores)

    1. M/u!na$  1.1 Motore$  1.2 Tran$m!$!one$  1.3 A)arato$ de e#e0a!"n  1. M/u!na$ - erram!enta$ y otra$ m/u!na$

    2. Tran$)orte$  2.1 (erroarr!#e$

      2.2 aro$  2.3 Ve%u#o$3. E4)#o$!one$, !nend!o$. Su$tan!a$ t"4!a$, ard!ente$ o orro$!0a$5. E#etr!!dad6. &a%da de# traa7ador 8. P!$ada$ de o7eto$ y o/ue$ ontra o7eto$

    Pro!esor: Ricardo 6apata 7%  -

  • 8/18/2019 3) Variables Bi

    46/53

    ULARE :APUNTE IIIVariables Bidimensionales

    9. &a%da de o7eto$. ;errume$ 1. Man!)u#a!"n de o7eto$ $!n a)arato$ men!o$11.

  • 8/18/2019 3) Variables Bi

    47/53

    ULARE :APUNTE IIIVariables Bidimensionales

    Esto representa el n-mero de accidentes ocurridos en jornada de tra'ajo con 'aja  6or cada mill$nde oras tra'ajadas por el colectivo expuesto al ries#o. En su cálculo de'en tenerse en cuenta lassi#uientes consideraciones)

    5$lo de'erán incluirse los accidentes ocurridos dentro de las oras de tra'ajo.

    5$lo de'erán conta'iliarse las oras reales de exposici$n al ries#o+ descartando porconsi#uiente+ permisos+ vacaciones+ enfermedad+ etc.

    0e'erá tenerse en cuenta &ue no todo el personal de una empresa está expuesto al mismories#o+ por lo &ue de'erán calcularse índices distintos para cada ona de ries#o omo#,neo!talleres+ oficinas+ etc.".

    Aun&ue normalmente estos índices están referidos a accidentes con 'aja+ podrá calcularsetam'i,n este índice inclu%endo los accidentes con % sin 'aja+ de inter,s interno para la empresa.

    El n-mero total de orasom're tra'ajadas se calcula se#-n la recomendaci$n de la O8T a partirde la expresi$n) 

    ( )( )( ) D'  Hd  (m N"H&  =

    donde:

    Pm = mero de traDajadores eL6estos al riesgoHd  = %oras traDajadas 6or daD  = (as laDoraDles o traDajados

    NOTA) Tome en cuenta las consideraciones anteriores. Ind!e de >ra0edadRelaciona el n+mero de )ornadas perdidas por accidentes durante un período de tiempo " eltotal de ,oras,ombre traba)adas durante dic,o período de tiempo% /e calcula por la e(presi$n:

    542 x N"H& 

     N)(A '%  =

    donde:

    !  = I,dice de graedadN"PA = mero de jor,adas 6Nrdidas 6or accide,te

    NTHM  = mero total de KorasEKomDre traDajadas

    Pro!esor: Ricardo 6apata 7%  -F

  • 8/18/2019 3) Variables Bi

    48/53

    ULARE :APUNTE IIIVariables Bidimensionales

     

    El Indice de #ravedad representa el n+mero de )ornadas perdidas por los accidentes detraba)o por cada mil ,oras traba)adas%

    En su c&lculo deben tenerse en cuenta las si#uientes consideraciones: 

    Las anteriormente numeradas para la determinaci$n del l!%eber&n considerarse los días naturales%Las )ornadas perdidas se determinar&n sumando las correspondientes a las incapacidades

    temporales las incapacidades permanentes " muertes calculadas se#+n la escala o baremode equivalencia entre la naturale'a de la lesi$n Dporcenta)e de incapacidad " las )ornadas perdidas equivalentes% En el si#uiente cuadro se inclu"e el baremo establecido en la citada orden para determinarlas )ornadas perdidas equivalentes%

     

    Natura#e*a de #a #e$!"nPorenta7e de!na)a!dade$

    ?ornada detraa7o )erd!do

  • 8/18/2019 3) Variables Bi

    49/53

    ULARE :APUNTE IIIVariables Bidimensionales

    7e#uera total 422 222P8rdida del oido Duno solo 42 22/ordera total 2 5 222

     Para el c&lculo del l# teniendo en cuenta las consideraciones apuntadas se aplicar& lae(presi$n: 

     N"H& 

     x )b )t  '% 

    542ED   +=

    do,de 

    !  = I,dice de graedad

    "t  =

    or,adas 6erdidas 6or los accide,tes Oe diero,lgar a i,ca6acidades tem6oralesA co,ta,do das,atrales H si, i,clir el da del accide,te H el dade la i,cor6oraci,.

    "b =Jor,adas eOiale,tes de las i,ca6acidades6erma,e,tes seg, el Daremo a,terior.

    NTHM  = mero total de KorasEKomDre traDajadas

     En relaci$n a los #rados de incapacidades laborales dice: 7uando los ries#os se reali'an pueden producir: I% Incapacidad temporalII% Incapacidad permanente parcialIII% Incapacidad permanente total "IV% La muerte Incapacidad temporal es la p8rdida de las !acultades o aptitudes que imposibilite parcial ototalmente a una persona para desempe1ar su traba)o por al#+n tiempo% Incapacidad permanente parcial es la disminuci$n de las !acultades o aptitudes de una persona para traba)ar% Incapacidad permanente total es la p8rdida de !acultades o aptitudes de una persona que laimposibilita para desempe1ar cualquier traba)o por el resto de su vida% 

    Pro!esor: Ricardo 6apata 7%  -K

  • 8/18/2019 3) Variables Bi

    50/53

    ULARE :APUNTE IIIVariables Bidimensionales

    I!dice de I!cide!ciaRelaciona el n+mero de accidentes re#istrados en un período de tiempo " el n+mero mediode personas e(puestas al ries#o considerado% /e calcula por la e(presi$n:

    542 x N&($ 

     N"A 'i =

    do,de 

    i  = I,dice de i,cide,ciaNTA = mero total de accide,tes

    NMP#  = mero medio de 6erso,as eL6estas 

    Representa el n+mero de accidentes en )ornada de traba)o con ba)a por cada mil personase(puestas% /e utili'a cuando no se conoce el n+mero de ,oras,ombre traba)adas resultando +til paraevaluar la peli#rosidad cuando el n+mero de personas e(puestas al ries#o es variable de undía a otro%

    ;ura!"n med!a de #a$ a7a$Relaciona las )ornadas perdidas por incapacidades en un período de tiempo " los accidentesen )ornada de traba)o con ba)a ocurridos en dic,o período% /e calcula por la e(presi$n: 

    542 x 'f  

     '% 

     NA*

     N)(A D&*   ==

    donde:

    DM$ = (raci, media de las Dajas

    N"PA = mero de Jor,adas 6erdidas 6or accide,teNA$ = mero de accide,tes co, Daja

     que representa el n+mero de )ornadas perdidas por cada accidente con ba)a% @nd!e de 'reuen!a de a!dente$ morta#e$Relaciona el n+mero de accidentes mortales re#istrados en la )ornada de traba)o en un

    Pro!esor: Ricardo 6apata 7%  2

  • 8/18/2019 3) Variables Bi

    51/53

    ULARE :APUNTE IIIVariables Bidimensionales

     periodo de tiempo " el n+mero de accidentes mortales re#istrados en )ornada de traba)o enun periodo de tiempo " el n+mero de ,oras,ombre traba)adas en dic,o periodo se calculaasí:

    I42 x N"H& 

     NA&  'fm =

     donde:

    fm = I,dice de rece,cia de accide,tes mortalesNAM  = mero de accide,tes mortales

    NTHM  = mero de KorasEKomDre traDajadas 

    que representa el n+mero de accidentes mortales ocurridos por cada cien millones de ,orastraba)adas% 

    I!dice de i!cide!cia de accide!tes "rtalesRelaciona el n+mero de accidentes mortales re#istrados en )ornada de traba)o en un períodode tiempo " el n+mero medio de personas e(puestas% /e calcula por la e(presi$n:

    A42 x N($ 

     NA&  'fm =

     donde:

    NP#  = mero de 6erso,as eL6estas que representa el n+mero de accidentes mortales ocurridos por cada cien mil personas

    e(puestas% Pueden utili'arse otros índices estadísticos tales como: Porce,taje de Koras 6erdidas 6or accide,tes.

      %oras traDajadas 6or accide,te. I,dice de segridad.

      asa de actiidades de segridad 

    Pro!esor: Ricardo 6apata 7%  4

  • 8/18/2019 3) Variables Bi

    52/53

    ULARE :APUNTE IIIVariables Bidimensionales

    Porenta7e de ora$ )erd!da$ )or a!dente relaciona las ,oras perdidas con eln+mero de ,oras,ombre traba)adas en un período de tiempo determinado% /e calcula por lae(presi$n: 

    *42(straba)ada,ombre,orasde N+mero

     perdidas,orasde N+mero perdidas,orasdePorcenta)e

    −=

    que representa las ,oras perdidas por accidente de cada cien ,oras de traba)o% 

    oras   −=

    que representa cada cu&ntas ,oras de traba)o se produce un accidente% Ind!e de $egur!dad: relaciona los accidentes re#istrados en un período de tiempo conlos traba)adores e(puestos " las ,oras,ombre traba)adas% /e calcula por la e(presi$n: 

    straba)ada,ombre,orasdetotal N+mero

    42accidentesdetotal N+mero

    e(puestosrestraba)adode N+mero

    Is

     x

    =

    que representa el n+mero de traba)adores e(puestos al ries#o por cada accidente " cien mil,oras traba)adas% Ta$a de at!0!dade$ de #a $egur!dad: se#+n E%=% >incJle" " =%E% /tulber# la tasa deactividades de la se#uridad se puede determinar por la e(presi$n  

    straba)ada,ombre,orasdetotal N+mero

    42se#uridad de sActividadeTA/

     x x

    =

    En la que las actividades de se#uridad se calcular&n para un período determinado sumandolos si#uientes t8rminos: 

    Pro!esor: Ricardo 6apata 7%  *

  • 8/18/2019 3) Variables Bi

    53/53

    ULARE :APUNTE IIIVariables Bidimensionales

    isposiciones de se#uridad prescritas%enuncias de pr&cticas inse#uras%In!ormes de situaciones inse#uras% N+mero de asambleas o reuniones de se#uridad celebradas%

     La comparaci$n de las curvas determinadas para los mismos períodos de tiempos Dsemanasmeses a1os etc% de los I! " de la TA/ nos permitir& establecer conclusiones acerca de lautilidad de las actividades de se#uridad e!ectuadas por la empresa%