3) variables bi
TRANSCRIPT
-
8/18/2019 3) Variables Bi
1/53
ULARE :APUNTE IIIVariables Bidimensionales
DISTRIBUCIONES BIDIMENSIONALES.
INTRODUCCIÓN.
En este capítulo nos dedicaremos a adquirir los conceptos de variable estadística bidimensional de tablas de !recuencias " de dia#ramas de dispersi$n% A continuaci$n nosdedicaremos al c&lculo de los par&metros m&s importantes que intervienen en unadistribuci$n bidimensional tales como las medias varian'as " desviaciones típicas de cadauna de las variables estadísticas unidimensionales que componen la variable estadística bidimensional% Acabando por anali'ar la correlaci$n e(istente entre ambas variables "aprendiendo a calcular la recta de re#resi$n cuando ten#a sentido%
VARIABLES ESTADÍSTICAS BIDIMENSIONALES.
Vamos a traba)ar sobre una serie de !en$menos en los que para cada observaci$n se
obtiene un par de medidas%
Por e)emplo:
• E(tensi$n en*
km " n+mero de ,abitantes de los distintos países de Europa%• In#resos " #astos de cada una de las !amilias de los traba)adores de una empresa%• Puntuaciones obtenidas en un test de !luide' verbal por un #rupo de alumnos de -.
de E%/%0% e in#resos anuales de sus padres%• Producci$n " ventas de una !&brica%• N+mero de a1os a!iliados a un partido político " nivel de satis!acci$n con dic,o
partido de un militante%• Edad " #rado de psicomotricidad de un #rupo !ormado por -2 minusv&lidos
mentales%• N+mero de ,oras que dedican los escolares a ver televisi$n " posici$n econ$mica de
sus padres%• Renta nacional " n+mero de universitarios de los distintos países de 3!rica%• Edad " n+mero de días que !altan al traba)o los empleados de una !&brica%
A estas variables estadísticas resultantes de la observaci$n de un !en$meno respectode dos modalidades se las llama variables estadísticas bidie!si"!ales%
Las variables estadísticas bidie!si"!ales las representaremos por el par ( ) X Y
donde X es una variable estadística unidimensional que toma los valores 4 * 5 %%%% k x x x x e Y
es otra variable estadística unidimensional que toma los valores 4 * 5 %%%% k y y y y % Por tanto
la variable estadística bidimensional ( ) X Y
toma estos valores:
Pro!esor: Ricardo 6apata 7% 4
-
8/18/2019 3) Variables Bi
2/53
ULARE :APUNTE IIIVariables Bidimensionales
( ) ( ) ( ) ( )4 4 * * 5 5 %%%%% k k x y x y x y x y o tambi8n ( ) 4i i x y i k ≤ ≤ %
TABLAS BIDIMENSIONALES DE #RECUENCIAS.
Las tablas de !recuencias bidimensionales pueden ser: simples o de doble entrada%
Tablas si$les: Una tabla de !recuencias simple es la que reco#e en !ilas o
columnas las !recuencias de los valores ( ) 4i i x y i k ≤ ≤ de la variable%
X 4 x * x 5 x %%%% k x
Y 4
y*
y 5 y %%%% k y
ni 4n *n 5n %%%% k n
Tablas de d"ble e!trada: Una tabla de doble entrada es la que reco#e las
!recuencias de los ( ) 4 4i j x y i k j p≤ ≤ ≤ ≤ de las variables%
Y
X 4
y*
y 5 y %%%% p y
4 x 44n 4*n 45n %%%% 4 pn
* x
*4n **n *5n %%%% * pn
5 x
54n
5*n
55n %%%% 5 pn
%%%% %%%% %%%% %%%% %%%% %%%%k
x4k n *k n 5k n %%%% kpn
#RECUENCIAS.
#RECUENCIAS MAR%INALES.
/i en una tabla de doble entrada sumamos las !recuencias absolutas por !ilas " por columnas obtenemos una nueva !ila " una nueva columna: son las &rec'e!ciasar(i!ales.
Y
X
4 y * y 5 y %%%% p y
4 x
44n
4*n
45n %%%% 4 pn 49n
* x
*4n **n *5n %%%% * pn *9n
Pro!esor: Ricardo 6apata 7% *
-
8/18/2019 3) Variables Bi
3/53
ULARE :APUNTE IIIVariables Bidimensionales
5 x 54n 5*n 55n %%%% 5 pn 59n
%%%% %%%% %%%% %%%% %%%% %%%% %%%%
k x 4k n *k n 5k n %%%% kpn 9k n
94n 9*n 95n %%%% 9 pn
4 4
pk
iji j
n N = = =∑∑Estas !recuencias obtenidas tienen en cuenta una sola variable " se puede construir
con ellas dos distribuciones unidimensionales " obtener los par&metros representativos%
I/TRIBU7I;N
-
8/18/2019 3) Variables Bi
4/53
ULARE :APUNTE IIIVariables Bidimensionales
/i en una tabla de doble entrada nos centramos en los valores de una variable con lacondici$n de que el correspondiente valor de la otra sea !i)o tenemos una distribuci$nunidimensional llamada distribuci$n de la variable en cuesti$n condicionada al valor tomado como re!erencia en la otra variable%
I/TRIBU7I;N E X 70NI7I0NAA A jY y=
X
Y=y
j
j y
4 x 4 jn
* x * jn
5 x 5 jn%%%% %%%%
k x kjn
I/TRIBU7I;N E Y 70NI7I0NAA A i X x=
Y
X=xi
4 y
* y 5 y %%%% p y
i x 4in *in 5in %%%% ipn
Las frecuencias relati!as conicionaas nos "ermiten conocer el tanto "or ciento
e los !alores e una !ariable conicionaa a caa !alor e la otra !ariable.
DIA%RAMAS DE DIS)ERSIÓN.
Los valores de una variable estadística bidimensional son pares de n+meros reales
de la !orma ( ) 4 4i j x y i k j p≤ ≤ ≤ ≤ % /i representamos estos pares en un sistema dee)es cartesianos se obtiene un con)unto de puntos sobre el plano% A este con)unto de puntosse le denomina dia(raa de dis$ersi*! " !'be de $'!t"s%
/i la relaci$n que e(iste entre las dos variables no si#ue nin#una le" ni !$rmula sedir& que e(iste una relaci*! estadística% /in embar#o al comparar dos variables para lascuales e(iste una !$rmula que las relacione diremos que e(iste una relaci*! &'!ci"!al%
Pro!esor: Ricardo 6apata 7% -
-
8/18/2019 3) Variables Bi
5/53
ULARE :APUNTE IIIVariables Bidimensionales
La nube e "untos es la re"resentaci#n gr$fica e las istribuciones
biimensionales. Caa "unto tiene "or coorenaas el "ar e !alores %ue toman las
!ariables.
Las nube de puntos nos permite apreciar si ,a" una ma"or o menor relaci$n entre
las variables%
Tambi8n a partir de una nube de puntos se puede obtener la distribuci$n bidimensional correspondiente%
>abr& nubes de puntos donde los puntos est8n mu" ale)ados unos de otros en estecaso se dice que la dis$ersi*! es (ra!de% Por el contrario en los casos en donde los puntosest8n mu" pr$(imos se dice que la nube de puntos est& mu" c"!ce!trada%MEDIAS+ VARIAN,AS - COVARIAN,A DE UNA VARIABLEESTADÍSTICA BIDIMENSIONAL.
7onsideremos una variable estadística bidimensional ( ) X Y
cu"a distribuci$nviene dada por la tabla de !recuencias que aparece a continuaci$n:
Y X
4 y
* y
5 y %%%% p y
4 x 44n 4*n 45n %%%% 4 pn 49n
* x *4n **n *5n %%%% * pn *9n
5 x
54n
5*n
55n %%%% 5 pn 59n
%%%% %%%% %%%% %%%% %%%% %%%% %%%%
k x
4k n *k n 5k n %%%% kpn 9k n
94n
9*n 95n %%%% 9 pn
4 4
pk
ij
i j
n N = =
=∑∑
Recordemos las de!iniciones de media " varian'a para las distribuciones de variableestadística unidimensional:
-
8/18/2019 3) Variables Bi
6/53
ULARE :APUNTE IIIVariables Bidimensionales
Varian'a de la variable ?:
( )*
9* 4
9k
i i
i X
x x n
s N
=
−=
∑
Varian'a de la variable @:
( )*
9
4*
9 p
j j
j
Y
y y n
s N
=
−=
∑
A la raí' cuadrada positiva de las varian'as se le llama desviaci$n típica " se
representa por X s " por Y s %
COVARIAN,A.
DE#INICIÓN.
/e llama c"varia!a o varia!a c"!/'!ta de una variable bidimensional ( ) X Y
ala media aritm8tica de los productos de las desviaciones de cada una de las variablesrespecto a sus medias respectivas%
La covarian'a se representa por XY s o XY σ %
C0LCULO DE LA COVARIAN,A.
/ea la variable estadística bidimensional representada por el par ( ) X Y
donde X es
una variable estadística unidimensional que toma los valores 4 * 5 %%%% k x x x x e Y es otra
variable estadística unidimensional que toma los valores 4 * 5 %%%%
p y y y y
% La variable
estadística bidimensional ( ) X Y
toma los valores que aparecen en la si#uiente tabla:
Y
X
4 y * y 5 y %%%% p y
4 x 44n 4*n 45n %%%% 4 pn 49n
* x *4n **n *5n %%%% * pn *9n
5 x 54n 5*n 55n %%%% 5 pn 59n
%%%% %%%% %%%% %%%% %%%% %%%% %%%%
k x 4k n *k n 5k n %%%% kpn 9k n
Pro!esor: Ricardo 6apata 7%
-
8/18/2019 3) Variables Bi
7/53
ULARE :APUNTE IIIVariables Bidimensionales
94n 9*n 95n %%%% 9 pn
4 4
pk
ij
i j
n N = =
=∑∑
/i los datos de las variables X o Y estuviesen a#rupados en intervalos los i x "Co los
j y 4 4i k j p≤ ≤ ≤ ≤ ,acen re!erencia a las marcas de clase%
La covarian'a de la variable estadística bidimensional viene dada por lase(presiones Dequivalentes:
( ) ( )4 4
9 9 pk
i j ij
i j
XY
x x y y n
s N
= =
− −=
∑∑ o
4 4
9 9
9
pk
i j ij
i j
XY
x y n
s x y N
= == −∑∑
CORRELACIÓN - RE%RESIÓN.
CONCE)TO %ENERAL DE CORRELACIÓN.
Representamos a continuaci$n varios dia#ramas de dispersi$n:
Pro!esor: Ricardo 6apata 7% F
-
8/18/2019 3) Variables Bi
8/53
-
8/18/2019 3) Variables Bi
9/53
ULARE :APUNTE IIIVariables Bidimensionales
a% Es una relaci$n lineal positiva !uncional% b% Es una relaci$n lineal positiva !uerte%c% Es una relaci$n lineal positiva d8bil%d% Es una relaci$n lineal ne#ativa !uncional%
e% Es una relaci$n lineal ne#ativa !uerte%!% Es una relaci$n lineal ne#ativa d8bil%#% Relaci$n curvilínea positiva !uncional%,% Relaci$n curvilínea positiva !uerte%i% Relaci$n curvilínea positiva d8bil% )% Relaci$n curvilínea ne#ativa !uncional%J% Relaci$n curvilínea ne#ativa !uerte%l% Relaci$n curvilínea ne#ativa d8bil%m% No e(iste relaci$n%
e una manera #eneral llamaremos c"rrelaci*! a la teoría que trata de estudiar larelaci$n o dependencia que e(iste entre las dos variables que intervienen en unadistribuci$n bidimensional%
7on arre#lo a lo visto anteriormente se dice que:
4% La c"rrelaci*! es li!eal " c'rvilí!ea se#+n que el dia#rama de puntos secondense en torno a una línea recta o una curva respectivamente%
*% La c"rrelaci*! es $"sitiva " directa cuando a medida que crece una variable laotra tambi8n crece%La c"rrelaci*! es !e(ativa " i!versa cuando a medida que crece una variable
la otra decrece%La c"rrelaci*! es !'la cuando no e(iste nin#una relaci$n entre ambasvariables% En este caso los puntos del dia#rama est&n esparcidos al a'ar sin!ormar nin#una línea " se dice que las variables est&n i!c"rreladas%
5% La c"rrelaci*! es de ti$" &'!ci"!al si e(iste una !unci$n tal que todos losvalores de la distribuci$n la satis!acen%En caso contrario ser& tanto m&s !uerte o m&s d8bil dependiendo de la ma"or omenor tendencia de los valores de la distribuci$n a satis!acer una determinada!unci$n%
COE#ICIENTE DE CORRELACIÓN LINEAL.
El procedimiento m&s !recuentemente utili'ado para asi#nar valores a las posiblescorrelaciones entre las variables es el c"e&icie!te de c"rrelaci*! li!eal de )ears"!.
Pro!esor: Ricardo 6apata 7% K
-
8/18/2019 3) Variables Bi
10/53
ULARE :APUNTE IIIVariables Bidimensionales
El coe!iciente de correlaci$n de Pearson se de!ine mediante la si#uiente e(presi$n:
9 XY
X Y
sr
s s=
0B/ERVA7I0NE/:
4% El c&lculo pr&ctico del coe!iciente de correlaci$n lineal r M resulta mu" sencillo
una ve' que se sabe calcular la covarian'a de la variable ( ) X Y
así como lasdesviaciones típicas de las variables X e Y %
*% El si#no del coe!iciente r M viene dado por el si#no de la covarian'a "a que lasdesviaciones típicas son siempre positivas% Así pues el si#no de la covarian'adecide el comportamiento de la correlaci$n:
• /i la covarian'a es positiva la correlaci$n es directa%• /i la covarian'a es ne#ativa la correlaci$n es inversa%• /i la covarian'a es nula no e(iste correlaci$n%
5% /e demuestra que el coe!iciente de correlaci$n lineal es un n+mero realcomprendido entre 4 " 4%
-% /i 4r = − se puede demostrar que todos los valores de la variable bidimensional( ) X Y se encuentran situados sobre una rectaO en consecuencia satis!acen laecuaci$n de una recta% Entonces se dice que entre las variables ? e @ e(iste unade$e!de!cia &'!ci"!al.
% /i 4 2r − < < la correlaci$n es ne#ativa " ser& tanto m&s !uerte a medida que r se apro(ima m&s a 4 " tanto m&s d8bil a medida que se apro(ima a 2% En este
caso se dice que las variables X e Y est&n en de$e!de!cia aleat"ria%% /i 2r = entonces no e(iste nin#+n tipo de relaci$n entre las dos variables% Eneste caso se dice que las variables X e Y son aleat"riae!te i!de$e!die!tes%
F% /i 2 4r < < la correlaci$n es positiva " ser& tanto m&s !uerte a medida que r seapro(ima a 4 " tanto m&s d8bil a medida que se apro(ima a 2% En este caso sedice que las variables X e Y est&n en de$e!de!cia aleat"ria%
% /i 4r = se puede demostrar que todos los valores de la variable bidimensional( ) X Y se encuentran situados sobre una rectaO en consecuencia satis!acen laecuaci$n de una recta% En este caso se dice que entre las variables ? e @ e(isteuna de$e!de!cia &'!ci"!al%
VAL0RE/ E r Intensidad de la correlaci$n4r = 7orrelaci$n per!ecta
Pro!esor: Ricardo 6apata 7% 42
-
8/18/2019 3) Variables Bi
11/53
ULARE :APUNTE IIIVariables Bidimensionales
2 4r < < 7orrelaci$n mu" alta
2B 2r < < 7orrelaci$n alta
2- 2Br < < 7orrelaci$n moderada
2* 2-r < < 7orrelaci$n ba)a2 2*r < < 7orrelaci$n mu" ba)a
2r = 7orrelaci$n nula
RE%RESIÓN.
/upon#amos que tenemos un dia#rama de dispersi$n " tratamos de construir unalínea que se apro(ime lo me)or posible a la nube de puntos: a este recta le llamaremos lí!eade re(resi*!%
A,ora bien el m8todo para conse#uir la línea que me)or se apro(ime a una nube de puntos no parece !&cil% 7$mo primera apro(imaci$n vamos a ver un m8todo mu" sencilloque se denomina m8todo #r&!ico%
Este m8todo consiste en obtener a o)oM la línea que consideramos m&srepresentativa del aspecto que presenta la nube de puntos% Pero es obvio que este m8todo es poco ri#uroso " mu" sub)etivo dependiendo en #ran medida del acierto " la pericia delsu)eto que lo realice%
CONCE)TO %ENERAL DE RE%RESIÓN.
7onsideramos una variable estadística bidimensional ( ) X Y
para la que se ,acomprobado que e(iste una correlaci$n !uerte entre las variables X e Y % En ese caso elan&lisis de la re#resi$n permite obtener la ecuaci$n de la !unci$n matem&tica que me)or sea)usta al dia#rama de dispersi$n%
Pero Gqu8 entendemos por la línea que me)or se a)usta al dia#rama dedispersi$nMH% Es !&cil comprender que se trata de aquella línea que ,a#a que lasdesviaciones de los puntos de la nube respecto de los correspondientes de la línea sea lomenor posible% En estas condiciones diremos que es la línea que menos se separa de la nubede puntos%
A la ,ora de reali'ar el a)uste de una línea de re#resi$n a una nube de puntos e(istela posibilidad de apro(imar 8sta mediante una recta una par&bola una c+bica unae(ponencial una lo#arítmica etc% Nosotros nos limitaremos al estudio de la re#resi$nlineal Dmediante una recta%
ESTUDIO ANALÍTICO DE LA RE%RESIÓN LINEAL.
Pro!esor: Ricardo 6apata 7% 44
-
8/18/2019 3) Variables Bi
12/53
ULARE :APUNTE IIIVariables Bidimensionales
/upon#amos que una ve' estudiada la correlaci$n e(istente entre las dos variables X
e Y que componen una variable bidimensional ( ) X Y
se observa que dic,as variablesest&n !uertemente correladas " que el dia#rama de dispersi$n se puede a)ustar mediante una
recta%
/upon#amos que la variable ( ) X Y
toma los valores ( ) 4 4i j x y i k j p≤ ≤ ≤ ≤ como aparece en la tabla si#uiente:
Y
X
4 y
* y
5 y %%%% p y
4 x 44n 4*n 45n %%%% 4 pn 49n
* x
*4n **n *5n %%%% * pn *9n
5 x 54n 5*n 55n %%%% 5 pn 59n
%%%% %%%% %%%% %%%% %%%% %%%% %%%%
k x
4k n *k n 5k n %%%% kpn 9k n
94n
9*n
95n %%%% 9 pn
4 4
pk
ij
i j
n N = =
=∑∑
7onsideremos X como variable independiente e Y como variable dependiente de X %
Entonces se trata de encontrar la ecuaci$n de una recta de la !orma 9 y a x b= + que sea laque me)or se a)uste a la nube de puntos: la recta de re(resi*! de - s"bre 1 %
Así pues el problema queda reducido al c&lculo de los par&metros aM " bM condos condiciones:
• La recta de re#resi$n debe pasar por el punto( ) x y
%
• La suma( )( )
*
4 4
9 9 pk
i i ij
i j
y a x b f N = =
− + =∑∑ debe ser mínima%
Para el c&lculo de estos par&metros que permiten obtener la recta que me)or se
apro(ima a la nube de puntos usaremos el denominado m8todo de los mínimos cuadrados%
/ea( )
*
4 4
9 9 pk
ij i i
i j
D f y a x b= =
= − + ∑∑% Buscamos para un aM dado el valor de bM que
,ace D mínimo%
Pro!esor: Ricardo 6apata 7% 4*
-
8/18/2019 3) Variables Bi
13/53
ULARE :APUNTE IIIVariables Bidimensionales
La derivada de respecto a bM es:
( ) ( )4 4* 9 9 * 9 pk
ij i i
i j
D f y a x b y a x b
b = =
∂ = − − − = − − − ÷∂ ∑∑
Por tanto el mínimo parcial alcan'ado ,aciendo variar bM para un aM dado es:
9b y a x= − Del mínimo se obtiene donde la derivada se anula%
Esta relaci$n entre aM " bM e(presa #eom8tricamente que la recta buscada pasa por
el punto( ) x y
%
Llamamos a,ora
( )**
4
4 4 4 4
9 9 9 9 9 p pk k
ij i i ij i i
i j i j
D f y a x y a x f y y a x x= = = =
= − − + = − − − ∑∑ ∑∑
" consideramos:( ) ( )( )4
4 4
* 9 9 9 pk
ij i i i
i j
D f x x y y a x x
b = =
∂= − − − − − ÷∂
∑∑
el valor de aM que anula esta derivada es:
( ) ( )
( )
4 4
*
4 4
9 9
9
pk
ij i i
i j
pk
ij i
i j
f x x y y
a
f x x
= =
= =
− −=
−
∑∑
∑∑ es decir:
*
XY
X
sa
s=
En de!initiva
( )* * *9 9 9 9 XY XY XY
X X X
s s s y a x b x y x x x y
s s s= + = + − = − +
0 lo que es lo mismo conocida la pendiente " un punto por el que pasa la recta dea)uste es:
( )* 9 XY X
s y y x x
s− = −
Pro!esor: Ricardo 6apata 7% 45
-
8/18/2019 3) Variables Bi
14/53
ULARE :APUNTE IIIVariables Bidimensionales
A esta recta de re#resi$n( )* 9 XY
X
s y y x x
s− = −
se le llama recta de re(resi*! de -s"bre 1.
A partir de esta recta podemos calcular con cierta apro(imaci$n los valores de yMconocidos los de xM sin m&s que sustituir estos +ltimos en la ecuaci$n% A estos c&lculos seles llama estiaci"!es o $revisi"!es%
An&lo#amente se puede obtener la recta de re#resi$n de ? sobre @ cu"a !ormasería:
( )* 9 XY Y
s x x y y
s− = −
A partir de esta recta podemos calcular con cierta apro(imaci$n los valores de xMconocidos los de yM sin m&s que sustituir estos +ltimos en la ecuaci$n%
No obstante Gqu8 !iabilidad podemos conceder a estos c&lculos obtenidos a trav8sde las rectas de re#resi$nH%
La !iabilidad ser& tanto ma"or cuanto ma"or sea el coe!iciente de correlaci$n linealen valor absoluto% Así pues si r M est& mu" pr$(imo a cero no tiene sentido reali'ar nin#+ntipo de estimaciones o previsiones% /i r M est& mu" pr$(imo a 4 o a 4 probablemente losvalores reales ser&n pr$(imos a nuestras estimaciones " si r 4 o r 4 las estimacionesreali'adas coincidir&n con los valores reales%
Pero incluso para valores de r M pr$(imos a 4 o a 4 las estimaciones que
obten#amos pueden resultar poco !iablesO por e)emplo cuando se pretende e(trapolar m&sall& del recorrido de los datos observados%
Pro!esor: Ricardo 6apata 7% 4-
-
8/18/2019 3) Variables Bi
15/53
ULARE :APUNTE IIIVariables Bidimensionales
ANÁLISIS DE VARIANZA
ANOVA
Pro!esor: Ricardo 6apata 7% 4
-
8/18/2019 3) Variables Bi
16/53
ULARE :APUNTE IIIVariables Bidimensionales
CONTENIDO
1. ANOVA
2. Ejercicios
Pro!esor: Ricardo 6apata 7% 4
-
8/18/2019 3) Variables Bi
17/53
ULARE :APUNTE IIIVariables Bidimensionales
3. Teoría de experimentos de un solo factorANALISIS DE VARIANZA DE
UN FACTOR (ANOVA 1 VIA)
El análisis de la variana de un factor !ANOVA" es una metodolo#ía para analiar la variaci$n entre
muestras % la variaci$n al interior de las mismas mediante la determinaci$n de varianas. Es llamado
de una vía por&ue analia un varia'le independiente o (actor ej) Velocidad. *omo tal+ es un m,todo
estadístico -til para comparar dos o más medias po'lacionales. El ANOVA de un criterio nos permite
poner a prue'a ip$tesis tales como)
k H µ µ µ µ ===== %%%%5*42
%:4 diferentes sonles poblacionamediasdosmenos Al H
/os supuestos en &ue se 'asa la prue'a t de dos muestras &ue utilia muestras independientes
son)
1. Am'as po'laciones son normales.
2. /as varianas po'lacionales son i#uales+ esto es+ %*
*
*
4 σ σ =
El estadístico tiene una distri'uci$n muestral resultando)
*
*
w
b
s
s Fc =
El valor crítico para la prue'a ( es)
EE4D4D −− nk k F α
0onde el n-mero de #rados de li'ertad para el numerador es 1 % para el denominador es !n1"+
siendo α el nivel de si#nificancia.
n-mero de muestras.
Pro!esor: Ricardo 6apata 7% 4F
-
8/18/2019 3) Variables Bi
18/53
ULARE :APUNTE IIIVariables Bidimensionales
4or ejemplo)
Ejemplo: 5e tienen 16 empleados seleccionados al aar &ue se someten a3 diferentes cursos de entrenamiento) 4ro#rama 1+ 4ro#rama 2 % 4ro#rama 3.
*omo los empleados se seleccionan aleatoriamente para cada pro#rama
el dise7o se denomina 085E9O *O:4/ETA:ENTE A/EATO;8
-
8/18/2019 3) Variables Bi
19/53
ULARE :APUNTE IIIVariables Bidimensionales
V!"#!$#%& e&'"e lo *#+e"e&'e '"!'!m#e&'o o Variaci$n entre muestras o variaci$n entre
pro#rama 1+ pro#rama 2 % pro#rama 3
E(E*TO 0E /A :E08A 0E *A0A T;ATA:8ENTO ;E54E*TO A /A :E08A >ENE;A/
*
4
ED X X r !"# jr
j
j −= ∑=
5*T; 6!BC.@ ?1.3333"2 @!?1 ?1.3333"2 @!?@ ?1.333"2
5*T; [email protected]
, V!"#!$#%& *e&'"o *e -& '"!'!m#e&'o o m-e'"! o pro#rama dado &ue no todos los empleados
dentro de un mismo pro#rama o'tuvieron los mismos puntajes. 5e denomina Variaci$n dentro de los
tratamientos.
VA;8A*8=N 0ENT;O 0E/ T;ATA:8ENTO O VA;8A*8=N 0E/ E;;O;
*A0A VA/O; ;E54E*TO A /A :E08A 0E 5 T;ATA:8ENTO
*
44
ED jc
j
ij
r
i
X X !$ −= ∑∑==
SCE . SCT / SCTR . 10
2 3RADOS DE LI4ERTADPro!esor: Ricardo 6apata 7% 4K
-
8/18/2019 3) Variables Bi
20/53
ULARE :APUNTE IIIVariables Bidimensionales
>rados de li'ertad totales n 1 161 13
>rados de li'ertad de los tratamientos c 1 3 1 2
>rados de li'ertad del error #l. Totales #l. Tratamientos 13 2 11#l 5*T #l 5*T; #l 5*E
#l 5*E #l 5*T #l 5*T; !n 1" !c 1" n c
5 CUADRADOS MEDIOS (5uma *uadradosF >rados li'ertad"
*:T *uadrado medio total 5*T F !n1" 1C.6
*:T; *uadrado medio del tratamiento 5*T; F !c 1" 32.C
*:E *uadrado medio del error 5*EF #le. 1D.C
ESTAD6STICO DE PRUE4A F$ Y ESTAD6STICO F CR6TICO DE ALFA
(c *:T; F *:E 1.946745562
cncador deno %l numerador %l alfa F F −−= 4min%% α
*álculo de ( con Excel
085T;.(.8NV!A/(A+ >/. T;+ >/. E;;" 085T;.(.8NV!G.G@+ 2+ 11" 3.C?22CBC@B
!"#$%&'&"
'!& (#"#$%&'!
(istr. )
*omo (c es menor a (alfa no se recaa Ho % las medias son i#uales.
Pro!esor: Ricardo 6apata 7% *2
-
8/18/2019 3) Variables Bi
21/53
ULARE :APUNTE IIIVariables Bidimensionales
7 VALOR P DE F$
4 distr.f!(c+ #l. 5*Tr+ #l. 5*E" distr.f!1.C6D+ 2+ 11" 0.18898099*omo 4 es ma%or a alfa no se recaa Ho
CONCLUSION: NO HAI 5(8*8ENTE EV80EN*8A 4A;A ;E*HAA/E5
Pro!esor: Ricardo 6apata 7% *4
-
8/18/2019 3) Variables Bi
22/53
-
8/18/2019 3) Variables Bi
23/53
ULARE :APUNTE IIIVariables Bidimensionales
7
USO DE MINITA4
S'!' < ANOVA < O&e =!> (U&'!$?e*)
en ;esponses in separate columns 8ndicar las columnas de datos
En *onfidence /evel C@K
5eleccionar *omparisons Tue% @K
OL
One-way ANOVA: Programa 1, Programa 2, Programa 3
Source DF SS MS F P
Factor 2 65.7 32.9 1.94 0.189Error 11 186.0 16.9
Total 13 251.7
S = 4.112 R-Sq = 26.11 R-Sq!a"#$ = 12.67
%&"'('"ual 95 )%* For Mea& +a*e" o&
Poole" StDe(
,e(el Mea& StDe( ------------------------------------
Pro/raa 1 4 80.000 5.715 !------------------------$
Pro/raa 2 5 81.000 2.236 !---------------------$
Pro/raa 3 5 85.000 4.123 !---------------------$
------------------------------------
77.0 80.5 84.0 87.5Poole" StDe( = 4.112
NOTA: 5i los 8ntervalos de confiana se traslapan+ las medias son i#uales estadísticamente
Tue 95 S'ulta&eou* )o&'"e&ce %&ter(al*
ll Pa'r'*e )oar'*o&*
%&"'('"ual co&'"e&ce le(el = 97.94
Pro/raa 1 *utracte" ro
,oer )e&ter :er ------------------------------------
Pro/raa 2 -6.451 1.000 8.451 !-----------------------$
Pro/raa 3 -2.451 5.000 12.451 !-----------------------$
------------------------------------
-6.0 0.0 6.0 12.0
Pro/raa 2 *utracte" ro
Pro!esor: Ricardo 6apata 7% *5
-
8/18/2019 3) Variables Bi
24/53
ULARE :APUNTE IIIVariables Bidimensionales
,oer )e&ter :er ------------------------------------
Pro/raa 3 -3.025 4.000 11.025 !---------------------$
------------------------------------
-6.0 0.0 6.0 12.0
Pro!esor: Ricardo 6apata 7% *-
-
8/18/2019 3) Variables Bi
25/53
ULARE :APUNTE IIIVariables Bidimensionales
NOTA: 5i el cero se encuentra en el intervalo de confiana de la diferencia entre medias+ este par de
medias no son diferentes. E@ERCICIOS:
1 *uatro cataliadores &ue pueden afectar la concentraci$n de un componente en una mecla
lí&uida de tres componentes están siendo investi#ado.
5e o'tienen las si#uientes concentraciones)
C!'!l#;!*o"A 4 C D
50 5, 51 5B57 525 52 2BB502 57 552 5550 55, 517
52B
4ara determinar si existe diferencia si#nificativa en el nivel de :atemáticas de 6 #rupos de
estudiantes de 8n#eniería se reali$ un examen aleatorio a D individuos por #rupo. 0etermine
cuales son los #rupos en los cuales existen diferencias a un C@K de nivel de confiana.
& $ (
75 78 55 4
93 91 72
78 97 49 871 82 4 77
3 85 70 5
7 77 8 95
, /as calificaciones en el examen a 1? empleados de tres unidades de ne#ocio
5e muestran a continuaci$n)
4ro'ar si no a% diferencia entre las unidades a un @K de nivel de si#nificancia.
A J *?@ B1 @CB@ B@ D6?2 B3 D2BD B6 DCB1 DC B@?@ ?2 DB
Pro!esor: Ricardo 6apata 7% *
-
8/18/2019 3) Variables Bi
26/53
ULARE :APUNTE IIIVariables Bidimensionales
2 4ro'ar si a% diferencia en los tiempos de servicio de 6 unidades de ne#ocio para el mismo
servicio a un nivel de si#nificancia del @K.
A J * [email protected] ?.B 11.1 C.CB.? B.6 1G.3 [email protected] C.6 C.B 12.1B.6 1G.1 1G.3 1G.??.6 C.2 C.2 11.3B.3 C.? ?.? 11.@
Pro!esor: Ricardo 6apata 7% *
-
8/18/2019 3) Variables Bi
27/53
ULARE :APUNTE IIIVariables Bidimensionales
, TEOR6A DE E8PERIMENTOS DE UN SOLO FACTOR
n esta parte se analia el caso en &ue se desea conocer el efecto de un solo factor ovaria'le independiente so're la característica de calidad &ue s, esta analiando. Esto
implica &ue a fin de poder detectar su efecto+ este factor se de'e de variar manteniendo el
resto de los factores en un valor fijo.EEpe"#me&'o #& "e'"#$$#o&e e& l! !le!'o"#e*!*
uando se desea analiar el efecto de un factor so're una varia'le dependiente o
característica de calidad es necesario el variar el Mnivel valor de ese factor. A cada
diferente nivel al cual se realia el experimento se le conoce como tratamiento. 4or
ejemplo si el factor es el proveedor los diferentes niveles o serian proveedor A+ proveedor J+
proveedor *+ etc. + si el factor es el tipo de proceso los tratamientos serian proceso 1+ proceso 2. 5i
el factor es temperatura los diferentes niveles serian por ejemplo 1G+ 2G+ 3G % 6G *+etc.
*4or otro lado en cada nivel del factor se efect-an una serie de prue'as+ a cada una de estas prue'as
se les conoce como replicaciones E/ factor se considera fijo.
Ejemplo 1: 5upon#a &ue se desea sa'er si los ejes &ue surten cuatro proveedores tienen diferente
resistencia a la tracci$n. 4ara ello se decide llevar a ca'o un experimento de un solo factor donde la
varia'le dependiente es la resistencia a la tracci$n del eje medida en L#sFcm 2 % el factor es el
proveedor. El factor tiene cuatro niveles o tratamientos diferentes. no para cada proveedor
!llámelos 8+ 88+ 888+ 8V" se decide pro'ar @ ejes de cada proveedor aciendo un total de 2G prue'as
ejecutadas en la misma ma&uina de prue'a % con ,l mismo operario !recuerde &ue el resto de losfactores se de'en de mantener a un nivel fijo".
4ara &ue el experimento sea aleatorio se numeran los ejes del 1 al 2G % se selecciona al aar un
n-mero entre 1 % 2G. 5e#-n ,l numero seleccionado es el si#uiente eje &ue se prue'a. 0e esta
Pro!esor: Ricardo 6apata 7% *F
-
8/18/2019 3) Variables Bi
28/53
ULARE :APUNTE IIIVariables Bidimensionales
manera+ el si#uiente eje a pro'ar es seleccionado sin nin#una restricci$n. 5upon#a. &ue los
resultados de experimento se muestran en la ta'la si#uiente)
P"oee*o" I II III IV@D D6 6@ 62@@ D1 6D 3CD2 @G 6@ 6@@C @@ 3C 63DG @D 63 61
El proveedor factor
Tratamiento 8+ 88+ 888+ 8V
*on cinco replicaciones en cada tratamiento.
O'servando la ta'la se MveM &ue existen evidentemente diferencias entre la resistencia de los ejes de
un proveedor a otro. 4ero tam'i,n existen entre los ejes de un mismo proveedor+ entonces+ Pla
diferencia detectada entre+ los ejes de un proveedor % otro existe realmenteQ O Pla diferencia es
de'ida al aarQ+ /a erramienta estadística conocida como análisis de variana !ANOVA" puede
a%udar a despejar esta duda.
4ara esto supon#a un caso #eneral como si#ue) 5i define Iij como el valor correspondiente de la
varia'le dependiente o característica de calidad de la i,sima o'servaci$n o replicaci$n 'ajo el
tratamiento j+ los resultados de un experimento de un solo factor con tratamientos % n replicas u
o'servaciones por tratamiento seria)
T"!'!m#e&'o
(el)
Oe"!$#o&e To'!le P"ome*#o
1 I11 I12 ... I1n I1. ..
2 I21 I22 ... I2n I2. .2
3 I31 I32 ... I3n I3. .3
... ... ... ... ... ... ...
Pro!esor: Ricardo 6apata 7% *
-
8/18/2019 3) Variables Bi
29/53
ULARE :APUNTE IIIVariables Bidimensionales
L I1 I2 ... In I. .:
Este caso se puede representar mediante el modelo estadístico lineal)
ij jij ;
-
8/18/2019 3) Variables Bi
30/53
ULARE :APUNTE IIIVariables Bidimensionales
..C,..
..
,1A2A...Ai co, .C,.
.
,
1i
:
1 j
ij
ii
,
1i
iji
=
=
==
=
∑∑
∑
= =
=
N n es ,l numero total de o'servaciones
/as ip$tesis en este caso son)
Ho) τ j GR para todo valor de j.H1) τ j ≠ GR para al menos un valor de j.
%o si$ni&ica '#e el &actor (los niveles bajo est#dio) no tiene e&ecto sobre la variable de!endiente % 1
'#e si lo tiene, esto es '#e e*iste di&erencia, estad+stica. ec#erde tambin '#e la i!/tesis n#la se
as#me como cierta a menos '#e los datos indi'#en lo contrario.
0escomposici$n de la suma total de cuadrados
a denominaci$n de análisis de variana resulta de descomponer la varia'ilidad total de los
datos en sus partes componentes. /a suma total de cuadrados corre#ida es)/( ) ( )
#
:
1 j
,
1i
2:
1 j
2:
1 j
,
1i
2
****tr **
.iij..i.,..ij
+=
−+−=− ∑∑∑∑∑
= === =
0onde)
Pro!esor: Ricardo 6apata 7% 52
-
8/18/2019 3) Variables Bi
31/53
-
8/18/2019 3) Variables Bi
32/53
ULARE :APUNTE IIIVariables Bidimensionales
tratamientos de un solo factor el si#uiente paso es el analiar en detalle cual de los tratamientos
es el mejor % cuales son i#uales.
Aplicando el ANOVA a los datos del ejemplo 2.2 se tiene)
∑∑= =
=+++=4
1 j
5
1i
2222 5194041...5556Yij
Entonces+ calculando las sumas de cuadrados tenemos &ue)
55T @1+C6G S !1GGD2"F2G 133?.2
55tr 2C22F@ 2?D2F@ 21?2F@ 21G2F@ S1GGD2F2G [email protected]
55E 55T S 55tr 133?.2 S [email protected] 2G3.2
:5tr 55trF!1" [email protected]!3 1" 3B?.2
:5E 55EF!n" 2G3.2F!2G6" 12.BG
Pro!esor: Ricardo 6apata 7% 5*
Totales Promedios
Yi
I 56 55 62 59 60 292 58.4
II 64 61 50 55 56 286 57.2
III 45 46 45 39 43 218 43.6
IV 42 39 45 43 41 210 42
Y..= 1006 40.24
..
.
-
8/18/2019 3) Variables Bi
33/53
ULARE :APUNTE IIIVariables Bidimensionales
Esto se resume en la si#uiente ta'la)
F-e&'e
De e""o" SS 3L MS F
(actor o tratamientos 55tr113@ S 1 3 :5tr 3B?.3:5trF:5E
2C.BCError 55E2G3.2 N S 1D :5E12.BTotal 55T133?.2 N S 1 1C
0onde (G :5trF:5E 3B?.3F12.BG2C.BC con 3 #rados de li'ertad en el numerador % 1D #rados de
li'ertad en el denominador.
5i el nivel de aceptaci$n !error tipo 8" lo fijamos en @K+ esto es+ α G.G@+ de la ta'la de la funci$n (
se tiene &ue)
(α+3+1D 3.26
0ado &ue (G 2C.BC 3.26 ( G.G@+3+1D
Se concl#e '#e %o se recaa el &actor !roveedor a&ecta la variable resistencia a la tracci/n.
Epe"#me&'o $o& -& olo +!$'o" > *#+e"e&'e &me"o *e le$'-"! po" '"!'!m#e&'o (o $!o
*e!l!&$e!*o)
uando por al#una ra$n ,l numero de lecturas &ue se tienen 'ajo cada tratamiento es
diferente+ di#amos E****
liDertaddegrados1E:co,>**
liDertaddegrados1Eco,>
..**
#
:
1 j
tr
:
1 j
,
1i
2
E2
ij
=
−=
=
∑
∑∑
=
= =
N
Y
n
Y
i
i** %%%
Pro!esor: Ricardo 6apata 7% 55
-
8/18/2019 3) Variables Bi
34/53
ULARE :APUNTE IIIVariables Bidimensionales
Es+ sin em'ar#o+ desea'le &ue ,l numero de muestras sea i#ual 'ajo cada tratamiento+ puesto &ue
el poder de la prue'a se maximia cuando ,l numero de muestras es i#ual.
Ejemplo : El tiempo de respuesta en milise#undos fue determinado para tres tipos diferentes de
circuitos % los resultados son)
*on un nivel de si#nificaci$n de α G.G@. PTiene los circuitos diferente tiempo de respuestaQ
3R n1 DR n2 3R n3 6R N D 3 6 13
12.29474.98E37.24E
474.9813
1754
353
73
7
C?..C,.B
37.242355.72993
13
17518...129
C?..Bij
tr #
2222
:
1 j
2i
2itr
22222
:
1 j
,
1i
22
===
=−++
=−=
=−
=−++++
=−=
∑
∑∑
=
= =
/a ta'la ANOVA es)
Pro!esor: Ricardo 6apata 7% 5-
otales Promedios
tr i
I 9 12 10 8 15 13 7 11.17
II 20 23 30 73 24.33
III 5 8 1 35 8.75
.. 175 14.75
!Dseracio,es .i
..=
-
8/18/2019 3) Variables Bi
35/53
ULARE :APUNTE IIIVariables Bidimensionales
F-e&'e
De e""o"SS 3L MS
F
(actor o tratamientos 55tr6B6.C? S 1 2 :5tr 23B.6C:5trF:5E
16.D6Error 55E1D2.2C N S 1G :5E1D.22Total 55TD3B.26 N S 1 12
ado '#e .05,2,10 3 4.10, se concl#e '#e los circ#itos m#estran di&erentes tiem!os de res!#esta.
Estimaci$n de parámetros del modelo
continuaci$n+ se desarrollan estimadores para los parámetros del modelo de clasificaci$n en
un sentido)Aijiij ;
-
8/18/2019 3) Variables Bi
36/53
ULARE :APUNTE IIIVariables Bidimensionales
n estimador puntual para µi podría ser .04.152537=F ==
24.404.1580.10...
-
8/18/2019 3) Variables Bi
37/53
ULARE :APUNTE IIIVariables Bidimensionales
( )
[ ]B%*B2%*4
%
2B%2B%*B2%*4% *C
±
±=
± −
bieno
n
& t Y
$ k N i α
por tanto+ el intervalo deseado es 1?.C@ ≤ µ ≤ 26.2@
Estimaci$n de la varia'le de respuesta
a descomposici$n de la varia'ilidad en las o'servaciones por medio del análisis de variancia+ esuna relaci$n puramente al#e'raica./
ijiij ;
-
8/18/2019 3) Variables Bi
38/53
ULARE :APUNTE IIIVariables Bidimensionales
El examen de los residuos de'e ser automático en el análisis de variancia. Si el modelo es
adec#ado, los resid#os no deben tener estr#ct#ra.
*omparaci$n de medias de tratamientos individuales
upon#amos &ue al efectuar un análisis de variancia para un modelo de efectos fijos la)
ip$tesis nula es recaada. 5e conclu%e &ue existe diferencia entre las medias+ aun&ue no
se especifi&ue exactamente c#al de ellas es di&erente. En esta situaci$n puede ser -til
realiar comparaciones adicionales entre #rupos de medias de los tratamientos. /a media del i
,simo tratamiento se define mediante µi µ τi % su estimaci$n es .i . /as comparaciones entre
medias de tratamientos se realian en t,rminos de los totales de tratamientos Ii. O de los promedios
de tratamientos .i . /os procedimientos para efectuar estas comparaciones se conocen como
mtodos de com!araci/n mlti!le
5
M'o*o *e l! MGm! D#+e"e&$#! S#H+#$!'#! (LSD *el #&Hl le!' #H+#$!&' *#++e"e&$e)
upon#amos &ue despu,s de a'er recaado la ip$tesis nula+ con 'ase en una prue'a
de análisis de variancia+ se desea pro'ar Ho) µi µ j para toda i ≠ j. Esto puede acerse
empleando la estadística t)
5
+
−=
ji
#
jio
,
1
,
1M*
..t
5uponiendo una ip$tesis alterna 'ilateral+ la pareja de medias µi+ µ j se consideran diferentes
5í ji#:A2CG ji ,C1,C1BM*t.. +>− −
/a cantidad)
+= −
ji
#:GC2A
,
1
,
1Mt(
Pro!esor: Ricardo 6apata 7% 5
-
8/18/2019 3) Variables Bi
39/53
ULARE :APUNTE IIIVariables Bidimensionales
5e denomina mínima diferencia si#nificativa. 5i el dise7o es 'alanceado+ entonces n1 n2 n n.
4ara usar el procedimiento de la /50+ simplemente se comparan las diferencias o'servadas entrecada par de promedios con el valor correspondiente de la /50. 5i+ se conclu%e &ue las medias
po'lacionales µi µ j son diferentes.
Ejemplo 2: 4ara ilustrar este procedimiento+ si se usan los datos del Ejemplo 2.3 el valor de la /50
con α .G@ es)
3.755
2(8.06)2.086
n
1
n
1!t"!#
ji$%&'(2)
=
=
+= −
4or tanto+ una pareja de medias difieren si#nificativamente si el valor a'soluto de la diferencia de
promedios en los tratamientos correspondientes es ma%or &ue 3.B@. /os cinco promedios detratamiento son)
10.8.Y 21.6.Y
16.6.Y 15.4.Y 9.8.Y
54
321
==
===
I las diferencias de los promedios son)
Pro!esor: Ricardo 6apata 7% 5K
-
8/18/2019 3) Variables Bi
40/53
-
8/18/2019 3) Variables Bi
41/53
ULARE :APUNTE IIIVariables Bidimensionales
:i1
:i
==I%
==I%o
≠=
4ara i 1+ 2+...+ 1. El procedimiento de 0unnett es una modificaci$n de la prue'a t. 4ara cada
ip$tesis se calculan las diferencias &ue se o'servan en las medias mu,strales)
1E:1A2A...Aico,:.i. =−
/a ip$tesis nula Ho) µi µ es recaada con un nivel de error tipo 8 se#-n alfa sí)
+−>−
:i
#G
,
1
,
1M?1AB:d:.i.
En donde la constante dα ! 1+ f" se encuentra en la Ta'la 8U del Ap,ndice del texto de 0ise7o %
Análisis de Experimentos de 0ou#las *. :ont#omer% !son posi'les tanto prue'as unilaterales como
'ilaterales". Ha% &ue notar &ue alfa constitu%e el nivel de si#nificaci$n conjunto asociado a las 1
prue'as.
Ejemplo 5: 4ara ilustrar la prue'a de 0unnett+ consid,rense los datos del Ejemplo 3+ % su p$n#ase
&ue el tratamiento @ es el control. En este ejemplo+ @+ 1 6+ f 2G+ ni n @+ % con un nivel
del @K se encuentra en la Ta'la 8U del Ap,ndice &ue d G.G@ !6+2G" 2.D@. 4or tanto+ la diferencia crítica
es)
4.75
2B8.0?2.5
,
2M#d.05B4A20? ==
Pro!esor: Ricardo 6apata 7% -4
-
8/18/2019 3) Variables Bi
42/53
ULARE :APUNTE IIIVariables Bidimensionales
!Ha% &ue notar &ue esta es una simplificaci$n de la Ecuaci$n anterior % &ue resulta de un dise7o
'alanceado." En consecuencia+ un tratamiento de'e considerarse si#nificativamente diferente del
control si la diferencia es ma%or &ue 6.BD. /as diferencias o'servadas son)
10.810.821...5>s4
.810.817...5>s3
4.10.815.4..5>s2
1.010.89.8..5>s1
54
53
52
51
=−=−
=−=−
=−=−
−=−=−
5$lo las diferencias ...>. 5453 −− indican una diferencia si#nificativa al ser comparadas con
el controlR por tanto+ se conclu%e &ue µ3 µ@ % µ6 µ@. Es conveniente usar más o'servaciones para
el tratamiento de control !es decir+ n " &ue para los otros tratamientos !o sea+ n+ suponiendo el mismo
n-mero de o'servaciones en los otros 1 tratamientos" cuando se comparan tratamientos con un
control. 0e'e ele#irse la ra$n n F n aproximadamente i#ual a la raí cuadrada del n-mero total de
tratamientos. En otras pala'ras+ se eli#e nFn : S-po#$#o&e *el !&9l## *e !"#!&;!
Al aplicar un análisis de variana se acen las si#uientes suposiciones si#uientes)
1. El proceso esta en control estadístico !esta'le". Esto es+ se pueden repetir % las causas de
variaci$n se an eliminado.
2. /a distri'uci$n de la po'laci$n &ue se muestra es normal.
3. /a variana de los errores dentro de los niveles del factor es la misma) esto es+ la
varia'ilidad natural dentro de cada tratamiento es la misma de un tratamiento a otro.
3"!+#$! *e "e#*-o $o&'"! el !lo" !j-'!*o *e ijHR
Pro!esor: Ricardo 6apata 7% -*
-
8/18/2019 3) Variables Bi
43/53
ULARE :APUNTE IIIVariables Bidimensionales
i el modelo es correcto % las suposiciones se satisfacen+ los residuos no de'en tener al#-n
patr$n+ ni de'en estar relacionados con al#una varia'le+ inclu%endo la respuesta I ij. na
compro'aci$n sencilla consiste en #raficar los residuos contra los valores ajustados ijHR
!de'e recordarse &ue para el modelo en un sentido i.Eij HHR el promedio del tratamiento i,simo". En
esta #rafica no de'e revelarse nin#-n patr$n o'vio en la si#uiente fi#ura se #rafican los residuos
contra los valores ajustados de los datos de la resistencia a la tensi$n del ejemplo 2.3 Nin#-n patr$n
inusual es evidente.5
>rafica de residuos contra valores ajustados
n efecto &ue en ocasiones revela la #rafica es el de una variana varia'le. Al#unas veces la
variana de las o'servaciones lo ace. Esto resulta cuando el error es proporcional a la ma#nitud dela o'servaci$n !com-nmente esto sucede en instrumentos de medici$n S el error es proporcional a la
escala de la lectura". 5i este es el caso+ los residuos aumenta a medida &ue Iij lo ace+ % la #rafica
de los residuos contra ij parecerá un em'udo &ue se ensanca o un altavo. /a variana varia'le
tam'i,n ocurre en casos cu%os datos no tienen distri'uci$n normal % están ses#ados+ por&ue en las
distri'uciones ses#adas la variana tiende a ser funci$n de la media.
1 I&'"o*-$$#%& ! l! e'!*G'#$! *e !$$#*e&'e
Cl!#+#$!$#%& *e lo !$$#*e&'e
, S#'em! *e Cl!#+#$!$#%&
2 6&*#$e E'!*G'#$o
Pro!esor: Ricardo 6apata 7% -5
-
8/18/2019 3) Variables Bi
44/53
ULARE :APUNTE IIIVariables Bidimensionales
1. Introdu!"n a #a e$tad%$t!a de a!dente$
El tratamiento estadístico de los accidentes constitu%e una t,cnica #eneral analítica de #ran
rendimiento en se#uridad al permitir el control so're el n-mero de accidentes+ sus causas+ #ravedad+localiaci$n de puestos de tra'ajo con ries#o+ onas del cuerpo más expuestas % cuantas
circunstancias pueden incidir en los accidentes.
A lo lar#o de distintos períodos de tiempo esto posi'ilita conocer la situaci$n so're el #rado de
accidenta'ilidad de un sector o rama de actividad+ forma de producirse el accidente+ onas del
cuerpo afectado+ etc,tera %a partir de los datos o'tenidos+ consecuencia de una clara % correcta
clasificaci$n+ orientar la actuaci$n de las t,cnicas operativas de se#uridad.
No o'stante el induda'le valor de esta t,cnica para conocer la evoluci$n de la accidenta'ilidad
dentro de una misma empresa+ presenta el pro'lema de la disparidad de criterios existentes en su
tratamiento+ tanto a nivel nacional como internacional+ por lo &ue los datos estadísticos+
denominados índices Estadísticos+ s$lo podrán ser comparados cuando se conocan los verdaderos
criterios &ue an intervenido en su determinaci$n.
2. a$!'!a!"n de #o$ a!dente$
4ara poder actuar so're los accidentes de tra'ajo+ es preciso sa'er cuándoW+ d$ndeW + c$moW %por &u,W se producen+ %a &ue s$lo a partir de este conocimiento+ fruto de una exaustiva
clasificaci$n+ se podrán esta'lecer las t,cnicas adecuadas para su prevenci$n.
(actores de clasificaci$n)
/os factores más importantes de clasificaci$n utiliados en los distintos sistemas % recomendadospor la O8T son los si#uientes)
(orma o t!)o de a!dente) refleja las circunstancias en &ue ocurri$ el accidente. /anaturalea del contacto o forma en &ue ,ste se a producido entre la persona afectada % el o'jeto osu'stancia &ue causa la lesi$n !atrapamiento+ caídas+ electrocuci$n+ etc."
Pro!esor: Ricardo 6apata 7% --
-
8/18/2019 3) Variables Bi
45/53
ULARE :APUNTE IIIVariables Bidimensionales
A)arato o agente mater!a# au$ante: o'jeto+ su'stancia o condici$n del tra'ajo &ueprodujo el accidente con o sin lesi$n !veículo+ erramienta+ ma&uinaria+ etc." 5e puede distin#uirentre) a#ente material ori#en del accidente % a#ente material ori#en de lesi$n.
Natura#e*a de #a #e$!"n: tipo de lesi$n física sufrida por el tra'ajador !luxaci$n+ fractura+des#arramiento+ amputaci$n+ etc."
+!a!"n de #a #e$!"n: parte del cuerpo donde se localia la lesi$n !mano+ ca'ea+ ojos+ etc.". /a American National 5tandards 8nstitute !AN58" introduce+ además+ otros factores complementarios. Parte de# agente mater!a#: parte del a#ente material &ue se relaciona más directamente conel accidente !elementos de una má&uinaerramienta+ muela a'rasiva+ etc." Al i#ual &ue en el a#entematerial se puede considerar una do'le faceta+ como ori#en de accidente o como ori#en de lesi$n.
&ond!!"n )e#!gro$a: causa t,cnica relacionada con el accidente.
Ato !n$eguro) causa umana o imprudencia relacionada con el accidente.
/os factores se7alados se pueden completar con otros+ de induda'le valor en se#uridad+ tales como)Actividad industrial % tama7o de la empresaR /u#ar del accidenteR 5exo % edad del accidentadoR4rofesi$n+ calificaci$n+ experiencia del accidentado+ tipo de contratoR :es del a7o+ día de la semana+ora del día+ etc.
3. S!$tema$ de a$!'!a!"nJasado en los factores anteriores se an esta'lecido dos sistemas de clasificaci$n de accidentes)
a$!'!a!"n $!m)#e: en#lo'a en una -nica ta'la factores diversos+ inclu%e al#unos de lossi#uientes factores)
1. M/u!na$ 1.1 Motore$ 1.2 Tran$m!$!one$ 1.3 A)arato$ de e#e0a!"n 1. M/u!na$ - erram!enta$ y otra$ m/u!na$
2. Tran$)orte$ 2.1 (erroarr!#e$
2.2 aro$ 2.3 Ve%u#o$3. E4)#o$!one$, !nend!o$. Su$tan!a$ t"4!a$, ard!ente$ o orro$!0a$5. E#etr!!dad6. &a%da de# traa7ador 8. P!$ada$ de o7eto$ y o/ue$ ontra o7eto$
Pro!esor: Ricardo 6apata 7% -
-
8/18/2019 3) Variables Bi
46/53
ULARE :APUNTE IIIVariables Bidimensionales
9. &a%da de o7eto$. ;errume$ 1. Man!)u#a!"n de o7eto$ $!n a)arato$ men!o$11.
-
8/18/2019 3) Variables Bi
47/53
ULARE :APUNTE IIIVariables Bidimensionales
Esto representa el n-mero de accidentes ocurridos en jornada de tra'ajo con 'aja 6or cada mill$nde oras tra'ajadas por el colectivo expuesto al ries#o. En su cálculo de'en tenerse en cuenta lassi#uientes consideraciones)
5$lo de'erán incluirse los accidentes ocurridos dentro de las oras de tra'ajo.
5$lo de'erán conta'iliarse las oras reales de exposici$n al ries#o+ descartando porconsi#uiente+ permisos+ vacaciones+ enfermedad+ etc.
0e'erá tenerse en cuenta &ue no todo el personal de una empresa está expuesto al mismories#o+ por lo &ue de'erán calcularse índices distintos para cada ona de ries#o omo#,neo!talleres+ oficinas+ etc.".
Aun&ue normalmente estos índices están referidos a accidentes con 'aja+ podrá calcularsetam'i,n este índice inclu%endo los accidentes con % sin 'aja+ de inter,s interno para la empresa.
El n-mero total de orasom're tra'ajadas se calcula se#-n la recomendaci$n de la O8T a partirde la expresi$n)
( )( )( ) D' Hd (m N"H& =
donde:
Pm = mero de traDajadores eL6estos al riesgoHd = %oras traDajadas 6or daD = (as laDoraDles o traDajados
NOTA) Tome en cuenta las consideraciones anteriores. Ind!e de >ra0edadRelaciona el n+mero de )ornadas perdidas por accidentes durante un período de tiempo " eltotal de ,oras,ombre traba)adas durante dic,o período de tiempo% /e calcula por la e(presi$n:
542 x N"H&
N)(A '% =
donde:
! = I,dice de graedadN"PA = mero de jor,adas 6Nrdidas 6or accide,te
NTHM = mero total de KorasEKomDre traDajadas
Pro!esor: Ricardo 6apata 7% -F
-
8/18/2019 3) Variables Bi
48/53
ULARE :APUNTE IIIVariables Bidimensionales
El Indice de #ravedad representa el n+mero de )ornadas perdidas por los accidentes detraba)o por cada mil ,oras traba)adas%
En su c&lculo deben tenerse en cuenta las si#uientes consideraciones:
Las anteriormente numeradas para la determinaci$n del l!%eber&n considerarse los días naturales%Las )ornadas perdidas se determinar&n sumando las correspondientes a las incapacidades
temporales las incapacidades permanentes " muertes calculadas se#+n la escala o baremode equivalencia entre la naturale'a de la lesi$n Dporcenta)e de incapacidad " las )ornadas perdidas equivalentes% En el si#uiente cuadro se inclu"e el baremo establecido en la citada orden para determinarlas )ornadas perdidas equivalentes%
Natura#e*a de #a #e$!"nPorenta7e de!na)a!dade$
?ornada detraa7o )erd!do
-
8/18/2019 3) Variables Bi
49/53
ULARE :APUNTE IIIVariables Bidimensionales
7e#uera total 422 222P8rdida del oido Duno solo 42 22/ordera total 2 5 222
Para el c&lculo del l# teniendo en cuenta las consideraciones apuntadas se aplicar& lae(presi$n:
N"H&
x )b )t '%
542ED +=
do,de
! = I,dice de graedad
"t =
or,adas 6erdidas 6or los accide,tes Oe diero,lgar a i,ca6acidades tem6oralesA co,ta,do das,atrales H si, i,clir el da del accide,te H el dade la i,cor6oraci,.
"b =Jor,adas eOiale,tes de las i,ca6acidades6erma,e,tes seg, el Daremo a,terior.
NTHM = mero total de KorasEKomDre traDajadas
En relaci$n a los #rados de incapacidades laborales dice: 7uando los ries#os se reali'an pueden producir: I% Incapacidad temporalII% Incapacidad permanente parcialIII% Incapacidad permanente total "IV% La muerte Incapacidad temporal es la p8rdida de las !acultades o aptitudes que imposibilite parcial ototalmente a una persona para desempe1ar su traba)o por al#+n tiempo% Incapacidad permanente parcial es la disminuci$n de las !acultades o aptitudes de una persona para traba)ar% Incapacidad permanente total es la p8rdida de !acultades o aptitudes de una persona que laimposibilita para desempe1ar cualquier traba)o por el resto de su vida%
Pro!esor: Ricardo 6apata 7% -K
-
8/18/2019 3) Variables Bi
50/53
ULARE :APUNTE IIIVariables Bidimensionales
I!dice de I!cide!ciaRelaciona el n+mero de accidentes re#istrados en un período de tiempo " el n+mero mediode personas e(puestas al ries#o considerado% /e calcula por la e(presi$n:
542 x N&($
N"A 'i =
do,de
i = I,dice de i,cide,ciaNTA = mero total de accide,tes
NMP# = mero medio de 6erso,as eL6estas
Representa el n+mero de accidentes en )ornada de traba)o con ba)a por cada mil personase(puestas% /e utili'a cuando no se conoce el n+mero de ,oras,ombre traba)adas resultando +til paraevaluar la peli#rosidad cuando el n+mero de personas e(puestas al ries#o es variable de undía a otro%
;ura!"n med!a de #a$ a7a$Relaciona las )ornadas perdidas por incapacidades en un período de tiempo " los accidentesen )ornada de traba)o con ba)a ocurridos en dic,o período% /e calcula por la e(presi$n:
542 x 'f
'%
NA*
N)(A D&* ==
donde:
DM$ = (raci, media de las Dajas
N"PA = mero de Jor,adas 6erdidas 6or accide,teNA$ = mero de accide,tes co, Daja
que representa el n+mero de )ornadas perdidas por cada accidente con ba)a% @nd!e de 'reuen!a de a!dente$ morta#e$Relaciona el n+mero de accidentes mortales re#istrados en la )ornada de traba)o en un
Pro!esor: Ricardo 6apata 7% 2
-
8/18/2019 3) Variables Bi
51/53
ULARE :APUNTE IIIVariables Bidimensionales
periodo de tiempo " el n+mero de accidentes mortales re#istrados en )ornada de traba)o enun periodo de tiempo " el n+mero de ,oras,ombre traba)adas en dic,o periodo se calculaasí:
I42 x N"H&
NA& 'fm =
donde:
fm = I,dice de rece,cia de accide,tes mortalesNAM = mero de accide,tes mortales
NTHM = mero de KorasEKomDre traDajadas
que representa el n+mero de accidentes mortales ocurridos por cada cien millones de ,orastraba)adas%
I!dice de i!cide!cia de accide!tes "rtalesRelaciona el n+mero de accidentes mortales re#istrados en )ornada de traba)o en un períodode tiempo " el n+mero medio de personas e(puestas% /e calcula por la e(presi$n:
A42 x N($
NA& 'fm =
donde:
NP# = mero de 6erso,as eL6estas que representa el n+mero de accidentes mortales ocurridos por cada cien mil personas
e(puestas% Pueden utili'arse otros índices estadísticos tales como: Porce,taje de Koras 6erdidas 6or accide,tes.
%oras traDajadas 6or accide,te. I,dice de segridad.
asa de actiidades de segridad
Pro!esor: Ricardo 6apata 7% 4
-
8/18/2019 3) Variables Bi
52/53
ULARE :APUNTE IIIVariables Bidimensionales
Porenta7e de ora$ )erd!da$ )or a!dente relaciona las ,oras perdidas con eln+mero de ,oras,ombre traba)adas en un período de tiempo determinado% /e calcula por lae(presi$n:
*42(straba)ada,ombre,orasde N+mero
perdidas,orasde N+mero perdidas,orasdePorcenta)e
−=
que representa las ,oras perdidas por accidente de cada cien ,oras de traba)o%
oras −=
que representa cada cu&ntas ,oras de traba)o se produce un accidente% Ind!e de $egur!dad: relaciona los accidentes re#istrados en un período de tiempo conlos traba)adores e(puestos " las ,oras,ombre traba)adas% /e calcula por la e(presi$n:
straba)ada,ombre,orasdetotal N+mero
42accidentesdetotal N+mero
e(puestosrestraba)adode N+mero
Is
x
=
que representa el n+mero de traba)adores e(puestos al ries#o por cada accidente " cien mil,oras traba)adas% Ta$a de at!0!dade$ de #a $egur!dad: se#+n E%=% >incJle" " =%E% /tulber# la tasa deactividades de la se#uridad se puede determinar por la e(presi$n
straba)ada,ombre,orasdetotal N+mero
42se#uridad de sActividadeTA/
x x
=
En la que las actividades de se#uridad se calcular&n para un período determinado sumandolos si#uientes t8rminos:
Pro!esor: Ricardo 6apata 7% *
-
8/18/2019 3) Variables Bi
53/53
ULARE :APUNTE IIIVariables Bidimensionales
isposiciones de se#uridad prescritas%enuncias de pr&cticas inse#uras%In!ormes de situaciones inse#uras% N+mero de asambleas o reuniones de se#uridad celebradas%
La comparaci$n de las curvas determinadas para los mismos períodos de tiempos Dsemanasmeses a1os etc% de los I! " de la TA/ nos permitir& establecer conclusiones acerca de lautilidad de las actividades de se#uridad e!ectuadas por la empresa%