tests no parametricos en forma secuencial

54
TESTS NO PARAMETRICOS EN FORMA SECUENCI,~L Jose R o ~L~.',,i Iast;i.tut:o Inve~t:igaeiones Estad/~tieas 0.--INTRODUCCIdN Segfin \VALD [1~, la expresi6n m~s general del problema de la inferencia estadlstica es: ,(sea Sun sistema de subciases de una cier- ta clase ~ de funciones de distribucidn. Para cada elemento s de % se considera la hipdtesis H~ que expresa que la distribuci6n descono- cida F es un elemento de s; se representa por H, el sistema de todas esas hip6tesis y el problema consiste en decidir, por muestreo, qu,} elementos de H~ se deber& aceptar.~ En el caso en que S se compone sdtb de dos elementos: uno. una subclase o~ de ~, y et otro, ~ el complemento en ~, tenemos el problema del contraste de hipotesis como caso particular del pro- blema general de la inferencia estadistica. En el tipo m~is frecuente de problemas de contraste de hipdtesis la clase D. es topol6gicamente equivalente a un espacio euclideo de nfimero finito de dimensiones, o en otras palabras, ce, da elemento de la clase ~ es una funcidn de distribucidn F de k par/~metros (k finito) F(.v 1 .% ..... c~ ; 0~ 0., ... %) pudiendo, considerarse F como tm punto en el espacio euclideo k-di- mensional, representando este espacio la clase O.. En este caso, la hip6tesis Hto de que F pertenece a t.~, siendo (,~ una subclase de D., recibe el hombre de hipdtesis parameStrica, pt,es la subclase c0 vienc caracterizada por unos determinados valores de k par&metros que corresponden a las k dimensiones de ~, ven caso contrario, en que no es equivalente, a un espacio euclfdeo de ntimero finito de di- mensiones, la hip6tesis Hco se llama no param~trica. Este hombre de Hipdtesis ~7o paramdtrica, aunque usado actual- mente por todos los autores, conduce a confusidn algunas veces, pues hay problemas no param~tricos, como ejemplo [-> puede see el

Upload: jose-romani

Post on 25-Aug-2016

215 views

Category:

Documents


1 download

TRANSCRIPT

Page 1: Tests no parametricos en forma secuencial

TESTS NO PARAMETRICOS EN FORMA SECUENCI,~L

J o s e R o ~L~.',,i

Iast;i.tut:o Inve~t:igaeiones Estad/~tieas

0.--INTRODUCCIdN

Segfin \VALD [1~, la expres i6n m~s general del p r o b l e m a de la in ferenc ia estadls t ica es: ,(sea S u n s i s tema de subciases de una cier- ta clase ~ de func iones de d is t r ibucidn . P a r a cada e lemento s de % se cons idera la hipdtesis H~ que expresa que la d is t r ibuci6n descono- cida F es un e lemento de s ; se r ep resen ta por H, el s i s tema de todas

esas hip6tes is y el p r o b l e m a consis te en decidir, por mues t reo , qu,} e lementos de H~ se deber& aceptar .~

En el caso en que S se c o m p o n e sdtb de dos e l e m e n t o s : uno.

una subclase o~ de ~ , y et otro, ~ el complemen to en ~ , t enemos el p r o b l e m a del cont ras te de h ipotes i s como caso par t icular del pro- b lema genera l de la inferencia es tadis t ica .

En el tipo m~is f recuente de p r o b l e m a s de cont ras te de hipdtes is la clase D. es t opo l6g i camen te equ iva len te a un espacio eucl ideo de nfimero finito de d imens iones , o en ot ras pa labras , ce, da e lemento de la clase ~ es una funcidn de d is t r ibuc idn F de k par/~metros (k finito)

F(.v 1 .% .....c~ ; 0~ 0., ... %)

pudiendo, cons iderarse F como tm pun to en el espacio eucl ideo k-di- mens iona l , r ep resen tando este espacio la clase O.. En este caso, la hip6tesis Hto de que F per tenece a t.~, s iendo (,~ una subclase de D., recibe el ho m bre de hipdtes is parameStrica, pt,es la subclase c0 vienc caracter izada por unos d e t e r m i n a d o s valores de k par&metros que cor responden a las k d imens iones de ~, v e n caso contrar io , en que no es equivalente , a un espacio euclfdeo de n t imero finito de di- mensiones , la h ip6tes is Hco se l l ama no param~trica.

Este h o m b r e de Hipdtesis ~7o paramdtrica, aunque usado actual- mente por todos los autores , conduce a confusidn a l g u n a s veces, pues hay p rob lemas no param~tr icos , como e jemplo [-> puede see el

Page 2: Tests no parametricos en forma secuencial

44 JOSE ROMANt

con jun to de todas las func iones de d is t r ibucidn con med iana un ivo- camen te def in ida y to la subclase de ~ de func iones de m e d i a n a cero, y que a lgunos au tores cons ideran p a r a m & r i c o p o r coineidir la m e d i a - na con algt ln par6.metro de la dis t r ibucidn en cier tos casos.

Los m&odos no p a r a m & r i c o s t ienen interds, por se t m u y g e n e , rales las hipdtes is que se hacen sobre la clase f2 de func iones de d i s - t r ibucidn, y, por tanto, se pueden emplea r en aquel los casos pr~icti- cos en que, por t ra tarse de un p r i m e r estudio, no se conoce nada sobre la funci6n de dis t r ibucidn de la var iab le a leator ia de que se. t rata.

Ot ro aspec to interesante de este t ipo de p rob l emas es que el con-. j un to de c~.lculos a que da luga-r la apl icacidn de un test no para- mdtr ico suele ser m/ts sencillo que el c o r r e s p o n d i e n t e - a un tests pa- ram&rico , siendo, por tanto, mils econdmicos de apl icacidn en c u a n - to a la labor s igu ien te a la t o m a de d a t o s ; pero necesi tan en cambio~ m a y o r nf imero de obse rvac iones para a lcanzar la m i s m a precisidn que el test. p a r a m & r i c o an~.logo.

De la ut i l idad e i ,npor tanc ia actual de estos p r o b l e m a s des t aca - mos el hecho de que, en la complet~sima b ib l iogra f ia dada por S.~- VaGE [9-3, se considera como fecha de iniciacidn de los m4todos no. p a r a m & r i c o s el afio 19:36, v al final de 195,3, fecha de publ icac idn de. d icha b iogra f fa pasan de mil los ar t iculos sobre esta mate r ia .

El objeto d e esta m e m o r i a es p resen ta r a l g u n o s tests no para-- m&ricos en fo rma secuencial , de modo que se evfta en par te la des- ven ta j a del m a y o r nfimero de obse rvac iones necesar ias en dichos: m & o d o s no pa ram&ricos , ya que, como es sabido, los m & o d o s der an~lisis sucesional de \ \ ra id llevan cons igo una aprec iab le d i s m i - nuci6n en el nfimero de obse rvac iones necesar ias para con t ras ta r tma'. h ipdtes is con la m i sma precisi6n q u e e n el caso no secuencial . As{, \V~LI~S [4] hac{a ya constar , en el afio 19'J:& hab lando de un deter- m i n a d o p rob l ema no pa ramd t r i co : , P o s i b l e m e n t e , la consideraci6n" del p rob l ema desde ct punto de vis ta de an~!isis secuencial tie \ \ r a i d ser[a m u v tStil.~ C uando comen 'zamos este t rabajo , se~(tn indicaci.dn del profesor A n s e o m b e , no e• en la l i te ra tura ningfin t rabajo ' sobre m&odos no param~}tricos en fo rma secuencial . H o v en dia co- nocemos tan s61o un breve resumen de tin t raba jo de G. NOE-

WU~:a [24:] (no publ icado) , que utiliza pa ra uno de los p r o b l e m a s es- tud iados en esta m em or i a tin p roced imien to ami Iogo al nues t ro , y der que tuv imos conoc imien to cuando ya las l ineas genera les de este t r a - ba jo es taban real izadas .

Page 3: Tests no parametricos en forma secuencial

TESTS NO PARAMETRICOS EN FORMA SECU'ENCIAL 45

Los problemas que t ra ta remos son, en el p r imer capltulo, un test de hipdtesis sobre Ia. mediana . En el s egundo probIerna de 1as dos muestras , y e n el tercero, un test de aleatoriedad.

El desarrollo de cada capftulo es el s iguiente, anfilogo para to- dos ellos. En pr imer lugar se fo rmula el problema, dando a conti- nuacidn una exposicidn de las soluciones no secuenciales ya conoci- dos ; despufis, p resentamos nuest ro solucidn secuencial, con las pr~- p iedades fundamenta les , y por filtimo comparamos esta sotucidn se- cuencial con las anter iores .

No quiero te rminar esta in t roduccidn sin hacer constar mi agra- decimiento al profesor Anscombe, de la Un ive r s idad de Cambr idge , que, como ya he dicho, nos p ropuso este tema de t rabajo duran te su estancia en Madrid, en el Ins t i tu to de Inves t igac iones Estadis t icas al Director de dicho Inst i tu to profesor R{os, a quien fundamen ta lmen- :re se debe que esta memor ia se haya realizado, p o t la direccidn y co- mentar ios a Ia misma, y aI doc tor B~[ar, con quien he d iscut ido a lgu- nos p u n t o s

1. E L PROBLIfMA DE LA MEDIANA

1.O.--Origen del probIema.

Consideremos el probIema de cons t ras ta r la hipdtes[s i t 0 de que ta media ~. de la funci6n de dis t r ibucidn F es ~=~0, En el caso param~- trico para clada clase ~2 de func iones de distr ibuci6n admis ib les te- nemos, en general , un test d i ferente que aprovecha al m~iximo el co- noc imien to de las p rop iedades que poseen las funciones F E l l , en par t icular la forma funcional de las funciones F. Ahora bien, supon- gamos que ~1 es la clase de todas las func iones de dis t r ibucidn tales que F(x) es coat inua . En este caso hemos de cons iderar un test que :sea vfilido para todas las FED-, pero, n a t u r a l m e n t e , en ~.~ existen funciones de dis t r ibucidn que no poseen momento de pr imer orden, pot 1o que no podr~ existir un test de la media v~ilido para todo F de D.~. En este caso se suele sust i tuir et contraste de la media .por el correspondiente contraste de la mediana . Es decir, con t ras ta remos la hipdtesis H 0 de que la mediana de la distr ibucidn F o E ~ ~ es ~=0,,. Para contras tar esta bipdtesis s{ puede haber test ~,~.Iidos pa ra todo F de r y aun para la ctase D-' de funciones de dis t r ibucidn F~x), tales que la ecuacidn F ( ' x ) = ) t iene solucidn tlnica, c!ase que es mSs genera l que D.~ pot comprende r tambi4n funciones d iscont inuas .

Page 4: Tests no parametricos en forma secuencial

46 JOSE ROMANt

1 . 1 . - - S o l u c i o n e s no secuenc ia l e s .

Exis ten diversos tests pa ra contrastav la an ter ior hip6tesis . Cita- remos los tests de W a l s h y T h o m p s o n , po t ser los m~is es tudiados .

1 .1 .1 . - - \Va l sh impone en [3] a !as f tmciones de distvibuci6n F(x) las condiciones :

1) F@) es cont inua.

2) F(x) es sim(krica vespecto de la mediana (que resulta sec tam- bidn la media, si ~sta existe, poc simetrla), es tando dsta def inida sin anabigiiedad.

As[ vemos que la clase D. z de las funciones de d is t r ibuciones que satisfacen las condiciones 1) y '2) es m~is ces t r ingida que la cIase I~1, va que exige la s imetda .

Se contras ta la hip6tesis unilateral 0<00, o bien 0>00, de la si-

gu iente fovma: Sen x,~, xr --- , xcn3 los valoves muest ra les ovde- nados en magn i tud creciente, es decir,

X m ~ X(2) < X(4) . . . ~ X ( n )

y scan m~, m2, ..., mk un con jun to de k enteros tales que

n > / n h > r n . , > m 3 > . . . > m k > O

entonces se verif ica que:

1 1

I lff12 Ill 3 1~2--[

i~=l 11=1 i := l

m k mk--I - - lk- i ~2-i9 - . . . - ilt_ l

ik- I ]k-~ i1=1

Con lo que, segdn se etija el con jun to de las 'm z, se t iene un. test diferente de diversos niveles de s ignif icacidn. P a r a evi tar en cada caso el tenet que calcular para cada con jun to de rnx d ichos n i - veles, YValsh da una tabla con test de niveles de s ignif icacidn me- nores que 6,2 o/ /o Y tamafios muestrales de 4 a 15 inc lus ive ; as~, po r ejemplo, para n = 1 0 y nivel de s ignif icacidn 5,6 %, la regla de decisidn es:

Aceptar ~ < % si

Nax. x~e~ , .~- (x.) + x.o)) < Oo (2),

Page 5: Tests no parametricos en forma secuencial

TES'IS NO PARAMETRICOS EN FORIvIA SECUENCIAL 47

1 . 1 . 2 . - - O t r o test de \Vatsh , dado s imut t&neamente por P i t m a n [5], es el s i gu i en t e :

Sean x~, % . . . . , x~ las obse rvac iones obten idas de una va r i ab le a leator ia ~. con funcidn de d is t r ibucidn F(.v) con t inua (en este caso la clase f2 a es m~is a m p l i a q u e . l a -q~), y sean z, las nuevas variabl 'es

definidas por

z~ = x ~ - 00 (3)

Se cons ideran los 5P con jun tos de valores que se obt ienen dando a

zL los s ignos m~s ( + ) y menos ( - ) , sean zci~ ( i = l , 9, ..., ~l~) Ias medias o rdenadas en m a g n i t u d creciente de cada uno de estos con- juntos , y sea

F - E z, (4)

la media real de la m u e s t r a ; se tiene entonces como regla de de- cisi6n.

a c e p t a r 0 < 0 0 s i ~ ' es menor que '~(r-i)

o bien si la hipdtesis a con t ras ta r es 0 ~ 0 o.

Acep ta r 0~00 si z es m a y o r que *:~2,.-r)

a m b o s test con nivel de s ignif icacidn r 2 n

C o m o vemos, la aiSlicaci6n de este test requiere el cSlculo de 2:' medias , s iendo m u y labor ioso c u a n d o el tamafio de la m u e s t r a es m a y o r que seis.

1 . 1 . 3 . - - T h o m p s o n , en [9], p re sen ta un test de la m e d i a n a que, s impl i f icado [8], es el s i g u i e n t e :

Sea .~ una va r i ab le a leator ia de funci6n de dis t r ibucidn continua. F(:x). y sean

X(I) X(2) ~(3) ~ �9 ~ X(n)

: o r d e n a d a de fo rma que la mues t r a ob ten ida d e

Si :=~, es el cuant i l p, por definici6n, la p robab i l i dad de ob tene r una observac i6n x ~ , es

P (x ~ ~ ) --- p y, p o r tan to , P (x > ~+) = 1 -- p = q (5}

Page 6: Tests no parametricos en forma secuencial

48 JOSE ROMA~'I

por tanto, la probabil idad de que Zck~ sea mayor que ~, ser~. la pro- babi l idad de que, como mgtxi.mo, haya k-1 valores de Ia muestra que sean menores que ~, de donde

k-1

l=o i pi q--~ = in (n __ 7~ _l_ l, t:) (6)

s iendo It(a, b) la funcidn beta incompleta def inida por

It (a, b) - P (a -t- b) fot x:'-' (1 -- cc} u-* d z (7) P (a) P (b)

y tabulada pot Kar l Pearson [12]. Para el caso particular- en que p = q = � 8 9 se simplifica la expresidn quedando

P (0 < zk) = = I0,~ (n - t; + 1, ;.) (8) [=0

'siendo este un test unilateral de la mediana, vMido, como hemos di- ~ho, para toda funci6n de distr ibuci6n continua.

1 . 2 . - - U n tes t s ecuenc ia l de la m e d i a na.

Vamos a considerar el con tenido de la hipdtesis citada en 1.0. Hipdtesis H 0... la mediana de la distribucidn F E f ~ es 0=0 o, sien-

do ~ i la clase de las funciones de distr ibucidn que poseen mediana uMvocamente definida.

P a r a utilizar el m~todo de la razdn de verosimil i tudes desarrollado po t \~rald [10], en su anMisis sucesional, hemos de introducir una hipdtesis a l te rnat iva ; estudiemos detenidamente que la hipdtesis al- te rnat iva es la que debemos introducir .

Parece natural fntroducir las hipdtesis H" la mediana de }a distr ibucidn F~ s es 01>0 o. Ahora bien, si intentamos construir un test vMido para toda dis-

tr ibucidn F ~ ' , nos encontramos que para un mismo par 00 y 0~, <:ualquier test que cons t ruyamos darer, en general, un eomportamiento diferente (en cuanto a potencia y tamafio muestral) para dos distribu- eiones diferentes Fz y F~. Pero si la hipdtesis al ternat iva que hacemos es que 00 no es la mediana, sino un de terminado cuantil p~, el comporta- miento del test ser~. el mismo para todas las distr ibuciones F E ~ ' , lo que ser6., en general, diferente set6. el valor 0~ de la mediana cuando el test nos d~ por resultado el rechazar la hipdtesis nula H 0.

Page 7: Tests no parametricos en forma secuencial

TESTS NO PARAMETRICOS EN FORMA SECUENCIAL 4 9

La hipdtesis a l t e rna t iva es, pues ,

Hz la mediana de la d is t r ibuc i6n FE f2" es 0 , > 0 0, de m o d o q.ue

F(0oIH~)=P, %�89

Hip6 tes i s c!ue s i empre p o d e m o s in t roducir en la prfictica.

Y p o d e m o s enunc ia r el s igu ien te test con hipdtes is a l t e rna t ivas

H o : 0=0 o equ iva len te a F(Oo]Ho)=�89

Kt : 0=0~>.0 o equ iva len te a F((Oo]H~)=p~<�89

Si se toman observac iones suces ivas , sea n el nfimero de obser-

vac iones que son menores que 0 o 9 N el nt lmero total de etlas.

La s iguien te reg la de decisidn da un test de s ignif icacidn a y

de potencia [ - ~ pa ra la h ipdtes is H0, con hipdtesis a l t e rna t iva H,..

Si

l og 1 -- } a - - N log 9 ql log 1 -~3a - N log 2 qt a.~ = > n > : r~ (9)

log P_! log p~ qt q,

(donde ql : l - p ( )

se s igue t omando observac iones .

Si n > a x se acepta la h ipdtes is H 0,

Si n % rx se acepta la h ip6tes i s H I.

En efecto, sean x 1, x2, ..., xx las observac iones suces ivas (su-

pues to que hemos l legado a la N - s i m a con la an ter ior regla de de-

cisidn).

C o n s i d e r e m o s las va r iab les a lea tor ias ~,i definidas de la s igu ien te

m a n e r a :

m=l si xt%0 o

~qi = 0 si x i>0 o

V e a m o s cufil es Ia funci6n de p robab i l i dad de las va r iab les .q con

las dos hipdtes is H 0 y Hr . 4

Page 8: Tests no parametricos en forma secuencial

50 JOSE ROMANI

S u p o n g a m o s cierta H , , es decir, F(%)=-}.

I. r.=l con probabi l idad �89 r,L= 0 con probabi l idad �89

Supues ta cierta H , ; es decir, t : ( 00{H, )=p ,< �89

II. r,~=l COil p robab i l idad pt -r.=O con p :obabi l idad q~=l-p~.

(tO)

luego, el problema de cont ras tar la hipdtesis t-I. con H~ se reduce- al de contras tar si es [ o l I la funcidn de probabi l idad de r,~, p ro - blema que resolveremos de ]a s iguiente forma secuenc[a l :

Si 3 P,x 1 - 3 < - 7 ~ < - - se s iguen t o m a n d o observaciones . 1 - - ~ ~') .vo x ~ "

Si P,x < ~ se acepta I t o (11). Pox- I - ( z

Si P,.~ >/ 1 - } se acepta H~

siendo P.ix la p :obabi l idad de ob tener la muestra, r,l"~,~r,a... "q.~, su- puesto que la hipdtesis H, ( ] = 0 ; !) es cier'ta ; por tanto, si es cier-. ta H 1

P, .~ = p~ q,'~-~ (12)

si hay n r,~ iguales a 1, o to que es equivalente , si flay n xi menores que %: si es cierta H 0

Pox = (' ~ (13)

cualqtfiera que sea el valor cle las "C, con lo qtre [a pTimera de lag acotaciones de (11) puede escribirse

i3 p.q.-n 1 -- - - < . < - (14). I -- (( (�89 (Z

donde despejando g queda

log 1 - c~ N log (2 q~) ]og N log (2 qi) (i5),

log ~ - ]og p--~-~q~,

Page 9: Tests no parametricos en forma secuencial

TESTS NO FARAMETRICOS EN FORMA SECUENCIAL 51

y resul tandc ias (.Los dlt imas acotaciones de (111)

log 1--c~ Nlog2q~ 7 ~ ~- gZx

log p-~ q: 1 - - ~3 (16>

log a N log 2 q,

log p-' q,

con lo que queda demostrado que el test enunciado en (9) es de sig- nificaci6n ~ v de potencia ]--:~.

Tenemos, pues, un test exacto secuencial de ]a mediana para cl caso de la hipdtesis a l te ,na t iva H~.

1.2.1. Ejemplo de la aplicacidn del t e s t . - - C o m o ejempto, vamos a cont ras tar la mediana de una distr ibucidn realizando tin mues t reo artificial, por lo que en este caso conoceremos la distr ibuci6n de la po- blacidn. Y hemos elegido para nues t ro ejemplo la distr ibucidn de Cau- chy po t carecer ~sta de media. P o r no existir tablas tie var iables alea- torias con distr ibucidn de Cauchy , uti l izamos la propiedad de que si ~= es una variable aleatoria con dis t r ibucidn uni forme en el intervalo (0,2r:), la variable ~q=tg ~ es una variable de distr ibucidn de Cauchv de mediana cero. Data los valores de la variable _:. hemos ut i t izado las tablas de nfimeros aleatorios de R o y o y Fer re t [11].

Vamos, pues, a cont ras ta r tas hipdtesis

H 0 : 0 = 0 0 = 0 o s e a P ( ' a ( 0 I F I 0 ) = - ' ~

1 1 H, : 0 = 0, = 1 y, po r tan to , f(y)-

: l + ( y - - 1) 3

de donde

P ( ~ < O ' E I ' ) = l f o 1 dy=larotg(y_l)[ = ~ = p , . ~ 1 § ( y - 1) ~ ~

Uti l izaremos los nlveles ~=0 ,05 y ~=0 ,05 , calculamos, pues, tas cotas c[e (9), cosa que podemos bacer con ]as tablas del final de esta memoria , y con los valores ob ten idos para la variable .q f o rm am o s la tabla s igu ien te :

Page 10: Tests no parametricos en forma secuencial

.52 J O S E R O M A N I

TABLA NOM. I

Ejemplo de aplicacidn del test de Ia medi,qna

N "q ax n rx ~ ~ ax n rx

1 -- 0,739 - - 1 - - 13 - 169,885 8 6 2 2 -- 1,321 - - 2 - - 14 7,898 8 6 2 3 0,018 - - 2 - - 15 1,723 9 6 2 4 2,876 - - 2 - - 16 - -2 ,112 9 7 3 5 0,985 5 2 - - 17 - 0 , 4 3 4 9 8 3 6 - 0,395 5 3 - - 18 - 0,004 10 9 3 7 - 0 , 1 9 9 6 4 - - 19 6~550 10 9 4 8 4,800 6 4 0 20 - -0 ,186 11 10 4 9 0,466 6 4 0 21 - 0 , 9 8 0 Ii II 4

lt) 1,5.tl4 7 4 0 22 -- 1 1 - - 5

11 1,594 7 4 0 22 - - 11 - - 5 12 - 1 , 0 6 7 8 5 1 24 - - 12 -- 6

dando como resul tado aceptar la hip6tesis t-I o en la observacidn nfi-

mero 21.

1.8.--Curva caracteristica de operacidn.

Se define como curva caracterist ica de u n test secuencial una fun- cidn L(0) tal que para cada 0 da la p robabi l idad de aceptar la hip6- tesis nula H0, supuesto qu~ es 0 el ve rdadero valor de[ parSmetro ; ,de modo que l - L ( 0 ) es la potencia del test.

La cur,ca caracterist ica no podemos hallarla expI ic i tamente en funcidn de los valores del parSmetro 0, salvo en el caso en que co- nozcamos el valor F(0) cor respondien te ; es decir, conociendo la fun- cidn de distr ibucidn, con lo que dejar{a de t ener , in te r6s el contraste de la mediana que estudiamos, pero s{ podemos hallar d icha eurva caracterfs t ica en funcidn de los cuant i les p ; teniendo as[ L(p).

La expresidn general para L(p) es [10; p. 96] 1

donde h viene dada por la ecuaci6n

1 -- (2 q~)h (18) P = (2pt) h - (2 q ,~

1 C o m o se sabe , e s t a e x p r e s i 6 n es t a n s610 a p r o x l m a d a , s i e n d o e x a c t a c u a n d o el e~xceso del coc ien te de v e r o s i m i l i t u d e s s o b r e los l i m i t e s A o B, a l t e r m i n a r el p roceso , es desp rec i ab le .

Page 11: Tests no parametricos en forma secuencial

TESTS NO PARAMETRICOS EN FORMA SECUE~NCIAL

con Io que se tiene en fo rma pa ram4t r i ca la ecuaci6n de ta curva ca- racteris t ica. Ahora bien, hay vatores par t i cu la tes de L(p) que pueden calcutarse d i rec tamente , as{ L ( 0 ) = 0 , L(p l )= '~ , g ( � 8 9 L ( 1 ) = I , que resul tan de la m i s m a definici6n de L(p), y con estos cua t ro p u n - tos y el pun to

Io~ 2 qt p ' __~-

log qt -- log p,

que cor responde a h = 0 , y que da el va lor

L ( p ' ) =

log c~ log 1 - c~

LO)

;.e

o R V2

Fro. 1.--Curva caracteristica de operaciiSn.

es suficiente para tener una idea de la fo rma de dicha curva, de la que la f igura 1 representa un eje}nplo tipico.

Como vemos , para valores de p super io res a -} el test da m a y o r p robab i l idad de aceptar la h ip6tes is H . , cuando no es 0 o el ve rdade ro valor de la mediana , cosa que era de esperar po t set la h ip6tes is al-

t e rna t iva H 1 la de set F ( 0 0 ) = p , < � 8 9 V e a m o s cuSl es la modif icaci6n del test cuando la h ip6tes is H

es F(%)=q t> ' , en este caso seria 01-<0,,, 3" en lugar de contar el nd- mero de obse rvac iones .menores qae %, con ta remos el n 6 m e r o de ob- s e r v a c i o n e s mayores que 0,u; pues ser~i

P (~r, > 00~ = 1 - q, = p, < !. (19)

Page 12: Tests no parametricos en forma secuencial

54 Josg ROMANI

de donde podremos poner como razdn de veros imil i tudes

P, x pi n q~,-n

Po-," (~)'~ (~0)

resul tando el mismo test que an te r io rmente sin mils que n serA en

este caso el ndmero de observa.ciones mayo~'es que 0~. y s iendo p el

complementar io a la unidad del valor F(00) , tenemos, pues, que las

tablas que damos ' al final de e~te t r5bajo para los ex t remos de la

acotacidn (9) podrSn utilizarse en ambos casos sin mS, s que la sal-

vedad anter ior . S iendo la curva caracter{stica sim4,trica respecto del

punto -}, como es f~icil ver.

1.4.--Tama~o medio muestraI.

La fdrmula general del tamafio medio muestral es [10; p. 99] t

1 L i p ) log ~ + [1 - L (1))] log

- - ft.

Ev (Y) = (21) p log 2p, -~- (1 - p ) l o g 2 q,

donde L(p), como sabemos, es el valor de la o rdenada de la curva caracter{stica eta el punto p.

De la fdrmula anterior , y teniendo eta cuenta los valores de L(p)

e a los pun tos t), p, p ' ( s iendo p ' = \

hallar los s iguientes va lo res :

log (X

Eo (Y) - log 2. q~.

log 2 q,

log q,-- log p, ) , �89 y I, podemos

(2"))

~l~ + ( 1 - ~ ) l o g 1 - 6 t

Ep, (N) = (23) p, log 2 Pt -I- q, log 2 qt

1--[3 log ~ log I -

Ep, (N) = I24) 1o~ 2 qt log 2 pt

t Repetimos Io dicho para la curva caracter/stica, (,sta f6rmula es s61o apro:dmada.

Page 13: Tests no parametricos en forma secuencial

" I E E I S N(3 P A R A M E T R I C O S EN F O R M A SECUENCIAL

. 3 1 (1 -- a) tog 1~- ~- + ~ log

E~ (N) = , (25) ~- log 2 pt + ,} log 2 q,

o P log i -- ct

E, (N) -- (26) log 9 p~

En la f igura o damos la cu rva cor respondien te al va lor p~=:l./4: y

= = 0 , 0 5 . y '~=0,05, s iendo asl la curva del tamafio medio mues t ra l de l e jemplo 1.9.1, y hemos i,,dicnclo jun to con los valores de p los homd- l ogos de 0.

1 Jo f

I

Ep(MJ

I [ : )"

~5

go, it5

L I [ [

0 0,9.5 t/g, t L+ oo ~t I 0 "~'1 O'

Fro. 2.--Tamafio medio muestral, del ejemplo 1.2.1.

1.5.--Comportamiento deZ test cuando Ia dislribucidn F es rw~'mal.

S u p o n g a m o s po t un m o m e n t o que v a m o s a ap l iear el test deft- n ido en 1.2, y que d e s i g n a r e m o s de a h o r a en adelante po t S, en un caso en que conocemos que la va r i ab le a leator ia en es tudio es una normal de desviacidn tfpica c o n o c i d a ; na tura lmente , son unas con- diciones m u y des favorab les pa ra la apl icaci6n del test S, y a qu e est~i 5asado en hipdtes is mucho m~.s sencillas, pero el c o m p o r t a m i e n t o de nues t ro test, en este caso, nos darfi una idea m u y precisa de la bon- dad del mismo.

Page 14: Tests no parametricos en forma secuencial

56 IOSE ROMANI

Uti l izaremos como comparacidn el test secuencial dado p o t

~Vald [10], que contrasta la media de una dis tr ibucidn normal co-

nocida la desviaci6n tipica, a este test le denomina remos ~V. No va-

inos a desarrol lar lo aqui-, por set de sobra co n o c id o ; vamos finica-

mente, pues, a dar las hipdtesis equivalentes para ambos test y com-

parar la curva caracterist ica de operacidn y, pot 1o tanto, su potencia ,

que es el complemento a la unidad, y el tamafio medfo muestra l .

Sea ~ una variable aleatoria normal de media ~ (desconocida) y

desviacidn tlpica ~ conocida. Y sean las hipdtesis a l ternat ivas equi -

valentes :

Tes t de YVald \V Tes t S

Hipdtes is I-I" 0 l ,=t,o cor responde a P ( ~ < I ~ 0 I H o ) = } = p ,

Hipdtes is H 1 B=t*I cor responde a

P (~ < ~'0 t H,) i f ~ = ~ ( x ; th, ~ ) d x = p l < 5 ao

siendo =?(:v ; ~,, ,) la funcidn de densidad normal de media 1"1 Y des-

viacidn t ipica , .

Vemos, pues, que a cada posible va lor del par~imetro t* le cor res -

ponde b iun[vocamente un pun to p, s iendo la t ransformaci6n

1*o

p = ? (x; p., ~ )dx (27)

o lo que es lo mismo

t) = ~_~-~ ~ (~; 0, 1) 'dt = ,:I) - - (27')

Queremos contras tar ambas hipdtesis con errores de pr imera y s e g u n -

da clase menores que e y ~, respect ivamente .

Las reglas de decisidn para ambos tests sot~

Page 15: Tests no parametricos en forma secuencial

TESTS NO PARAMETRICOS EN FORMA SECUE, NCIAL 57

Test "vV

Se toman observaciones suce-

sivas v se suman, sea S,, la suma de las N observaciones ; si

se verifica

ax < Sx < r~

se s igue tomando observaciones :

Si Sa-.<ax, se acepta:. Ho

Si S x > r s , seaeepta : Ht

Donde

a~" ~ b t, + I% a ~ - - - l o g - - + N

~, - I*o 1 - a 2

Y

~" 1 -- ~ It, 4- I% rs - - l o g ' - - q- N

I ~, - IXo e 2

Test S

Se toman observaciones suce-

sivas y se cuentan los que son

menores que g0, sea este ndme-

ro n, y N el total de observacio- nes ; si se verifica

a s ~ '/9. ~ r x

se s igue tomando observaciones

Si n ) a . ~ , s eacep ta : H0

Si n-.< rs, se aeepta: H,

l )onde

log 1 - c~ N log 2 q, ax -~ -

log 2a_, q,

1-} log c~ N log 2 q,

r x lo~" P '

' q l

La curva caracteristica de operacidn para el test de \Va ld tiene

por expresidn A h ' - 1

Lw (~) - A h -- B h

donde h = p ' § I~o - - 2 I* ( 2 8 )

l h - - l*o

y la correspondiente curva caracterist ica para nuestro test es

A h ' - 1 L~ (p) =

A h' _ B h'

donde h' viene dado por qlh ' - - poh'

(29') P -- p h" qlh" - -

i-~ y tanto en Lw como en Ls es A - , B = - -

I-~

Vamos a vet qu4 relaciones conocernos entre Lw y L~. Es irr-

mediato el s iguiente resultado. En los cuatro puntos ~ = - , c ~ , ~=~0, ~--~.1, tJ-= +.oo, coincidem

Lw y Ls.

Page 16: Tests no parametricos en forma secuencial

.,58 JOSE. ROMANI

Veamos dnicamente clue a los puntos ~,=-~ y ~,= +,:~ les co- r responden respect ivamente los valores de p, p = l y p = 0 ; en efecto,

p o r la t ransformaci6n (27)

( - ) 7 = O ( - g ~ ) ; O = O go ~ = ~ I ) ( - ~ )

Ahora bien, hab[amos visto que L~ (p) t o m a b a los valores

Ls (i) = i; Ls (0) = 0

.y de (28) es f~cil ver que los correspondientes valores de Lw (.~) son

L,,- (-- oQ) = i; L,,- (+ oc) = 0

En cuanto a los puntos t,=,a.0 y ~=.bq correspondientes a p= .} v

p=p,, respect ivamente, coinciden L~ y l.w por el modo de cons- rrucci6n de ambos tests.

Podemos concretar a lgo m~.s sobre el compor tamien to de L~ y L,.. pues si bien las curvas en general no coinciden fuera de l o s cuat ro puntos anteriores, se puede acotar su diferencia po t el s iguiente

TEORE.~A: La diferencia L , r - Ls cumple las sig.uientes acota- .ciones cua lquiem que sean los valores de t*, I*0 Y z :

IL,,.- Lsl < ~ si t~ < l*o

t L,,- - L.~ [ < [3 si t~ > t~, (30)

[ Lw - L~ t < 1 - ~ - } s i ~o < I t < I z,

Demostracidn: Puede comprobarse q u e L , ~ es funci6n creciente

�9 de h, y por ser h decreciente con [,, ser~i L,r decreciente con t*; de

-modo que pot set L w ( t % ) = l - - = v Lw( .%)=} , se tendril

1 > L,,- (it) > 1 -~ si Z• < l.to

i - = > L,r fit) > ~ si ~o < ~ < I*,

> L,,. (lq > 0 si ttl <

(31)

an~.log.amente Ls es creciente con h'; p es creciente con h', pero

es decreciente con ~, por lo q u e e n filtimo t~rmino Ls es decreciente

con t~ y se tendr~.

i ~ Ls(~) > i--~ si ~ < 11 o

1 - • > Ls (I*) > ~ s[ tto-<. ~ < ~ (32)

> Ls (I~) > 0 si Iq< t~.

Page 17: Tests no parametricos en forma secuencial

TESTS NO PARAblETRICOS EN FORMA SECUENC[AL

con lo que restando o rdenadamen te las des igualdades (31) y (32) nos queda

> L , , - ( I t ) - L ~ (p.) > - - a

1 - - L 3 - c ~ > L w ( I ~ ) - L s < t x ) > ~ + c ~ - 1

[] > L,,. (,,~) - L~ (~) > - ,8

para P < Po

para P-o < I i < l*~

para I*, < I*

(.~0')

como quer[amos demost rar .

Vemos, p u e s que f inicamente en el intervalo @0, pq) puede haber

diferencias de importancia entre Lw y Ls.

El compor tamien to de las curvas Lw y L.~ en dicho intervalo de- pende ya de Ios valores par t iculares clue demos a los l)ar~imetros =, ~3,

,ao, ax y ~. Pero, en general , si la diferencia entre [,, y ~ es menor

que ~. L,,. y Ls coinciden prglcticamente.

M~is interesante que estudiar con detalle las curvas caracterlsti-

cas de operacidn en el intervalo (tz., ~-~) es el considerar los tamafios medios muestrales, ya que se toma como criterio de seleccidn entre

dos tests secuenciates de la misma fortaleza (se dice que dos tests se-

cuenciales s v s ' tienen la misma fortaleza, si los valoces de a v 3

asociados con s son iguales a los cor respondientes valores ~' 3" ~3'

asociados con s') ([10], p. 64) tomar aquel que tiene menor tamafio

muestral , tanto con la hipdtesis H . como con la H~.

Se define la eficiencia relativa de dos tests secuenciales s v s ' de la misma fortateza (.c~, ~) por la razdn

E.~0(NIs~ bajo la hipdtesis Ho. E~0 (N Is')

g~, (N Is) bajo la hipdtesis H~ (3t)

Vamos, pues, a calcular estos cocientes para los tests \V de \Vald

v S el definido en 1.2. La expresidn general de E(N) para ambos

tests es

E~ (N [ W) = 9. a'- [L,,. (IL~ log g + It -- L,,-(',~)l lo~ A] (32) I% ~ - - lq ~" - b 2 (It , - - I%5

E~(N I S ) = L s ( ~ - ~ l o g B + [ l - - L s ( I ~ ) l o g A (33) p l og2 p, + (l - p) l o g 2 q,

ya helnos visto que L,r y Ls coinciden, tanto en p.=g.;, como en

la=a0, y recordando que si a=[*o, P= �89 resulta

Page 18: Tests no parametricos en forma secuencial

6 0 J O S E ROMANI

E~0 (NIW) E~ (NI S)

2a~(~-log2p,+~-log2q0 = l o g 2 p , + l o g 2 q ~ (34)

E~,(N I W) 2 ~" (p~ log 2 p~ + q~ log 2 q,)

Ill -- 2 9-o Ixl E~, (N I S) -- 2 Pal~176 (35)

Si ahora hacemos, para simplificar las fdrmulas (34) y (35), ~0=0 y z = l ; transformacidn con la que no se pierde generalidad, pues equivale a tipificar la variable aleatoria, las expresiones (34) y (35). se pueden escribir

R0 - E~. (N[ W) _ log 2 p, + log 2 q, (3~')

E~, (Nt W) p, log 2p ,+q, log2 q, _ _ ,2_ (350

R, E~, (NI S) li~"

Y podemos demostrar el siguiente

TEOREMA :

lira Ro = E m gt = . - - ~ 0,6t ~.t~O p.~O

( 3 6 )

2 Demostracidn: Veremos tan sdlo que l i m R o - , pues resulta

evidente que R1--+R 0 cuando ~--+0, as{, pues, pongamos en lugar de pl y q~ sus expresiones en funciones de t~a

R0 = log 2 p, + log 2 q, - - - - 1 0 G 2 0 ( - - ~'1) -~- log 2 0 (~t,) (37) -- ~i 2 - Ii-"

y ahora tomemos Umites

lira l~o=lim log 2 (b (--g,)+ log 2 �9 (~,~, = lira ~,--0 I~--0 -- Ill I ~,--0

(I) ( - l l , I + (P (~,~

_ �9 (-~t,) ~' (~t 1) + .~ (~t,)'+ �9 (~,) ?' ( ~ , ) - ,~2 0i,) .~'- (0) @ (0)

= lim q)" (-~i) 0~, (I',) = -I + =

~,-o - 2 -- 2

4 2 = ~ ,~-" (0 ) - - - 0 , 6 ~ , ( 3 8 )

Page 19: Tests no parametricos en forma secuencial

TESTS NO FARAMI:YFRICOS EN FORMA SECUENCIAL 61

Es interesante observar que este valor

2 l im Ho - ILI~O 7,

es precisamente la eficiencia asint6t ica de la mediana para muestras de tamafio fijo.

Se puede demost ra r anzi logamente que

l im R0 = ~ (39)

1o que, dos dice que cualquiera que sea la hip6tesis aherna t iva , si H a es la hipdtesis cierta, la eficiencia del test S relativa al test \V es s iempre mayor que 0,50. La eficiencia del test S aumenta al dismi- nuir la diferencia entre t*0 Y v~,, lo que nos indica que el test S au- menta en precisi6n cuando crece la dil~cultad de dist incidn entre

H o y H~. Para ~,~-,a0~3~ ; R 0 ~ 0 , 5 9 , es decir, para todos los casos de la

pr~.ctica

0, 5 9 < R o d 0 , 64: (4:0)

ya que carece de interds el cont ras ta r dos posibles valores de la me- dia que difieran entre si m~.s de tres veces la desviaci6n t{pica.

R e sumiendo la comparaci6n de los tests S y \V tenemos q u e : a) Ambos tests t ienen las p robabi l idades de los errores de [ v [[

tipos pref i jados y respect ivamente iguales. b) Para valores de los par~met ros cuya diferencia sea inferior a

una desviaci6n tipica las potencias de ambos tests son pr~.cticamente equivalentes.

c) La eficiencia relativa del test S respecto deI \V con la hipd- tesis H 0 oscila entre 0,50 y 0,64:; s iendo 0,59<Ro<0,64 siempre que ~ , , - I ,0<3~, finicos casos de interds en la pr~ictica.

d) Las condiciones necesarias pa ra la aplicaci6n del test %V son m u y restr ingidas , mientras que las necesarias pa ra S se cumplen en la total idad de los casos prgmticos que se puedan p r e s e n t a r .

e), Los c~.lcutos necesarios pa ra la aplicacidn del test 1,V inclu- yen la construcci6n de una tabla, en general diferente para cada caso pr&ctico y la suma acumulada de las obse rvac iones ; para el

-test S hace falta una tabla que una vez calculada sirve para otros muchos casos (al final de esta memor ia inclu/mos dicha tabla para a lgunos de los valores de ~, {~ y p) y una enumerac i6n que puede rea- l izarse de memoria .

Page 20: Tests no parametricos en forma secuencial

62 jose ROMANI

Por todo 1o anter ior creemos q u e e n aquellos en que sea econd- mica Ia toma de datos y se necesite rapidez resuhar5 m~is c o n v e n i e n - te aplicar el test S que el test W .

t .6.--Comparaci6n deI test S con ot.ros tests.

Hemos estudiado en et apa r t ado anter ior el test S t omando como medida de su eficacia el compor t amien to frente al test 6p t imo se- cuencial de la media de una dis tr ibuci6n normal , conocida la des- viacidn Cpica. Ahora vamos a compara r el test S, que es esencial- mente no param6trico, con el test T param6tr ico no secuencial , m~s potente, de contrastar la media de una distr ibucidn normal conocida la desviacidn tipica.

1.6.,t_. Como ant~riormente, vamos a contras tar la hipdtesis H~ de que la media de una dis t r ibucidn "normal de var ianza un idad es ~ = 0 ; con la hipdtesis a l ternat iva H~ de que la media es ~ . = ~ z > 0 .

1)esignaremos por N(~, (~) el ndmero de observacione's necesarias para alcanzar, con el test mS.s potente no secuenciat , que des ignare- mos pot T, Ia fortaleza (a, [t). E1 test T es el s igu ien te :

Se halla la media ari tm6tica ~ de las observaciones y si

c ~ . se acepta H 0

v si por el contrar io c<T se rechaza H , (se acepta H~). Los valores de N v c se de te rminan de forma que el test T posea-

la fortaleza (a, [~) deseada, de la s iguiente m a n e r a :

La des igualdad ~.%c es equ iva len te a

y como Ia variable a leator ia -%= ~/Ni,~ es normal de media cero v d e s - viacidn tipica unidad, con la hip6tesis H 0, y queremos que

habr~i de set

r = 1 - (43)

an~.logamen~e si es I-{ 1 la hi'p6tesis cierta, la var iable ~,1= s /N(-~- -~) ser~i tambi~n normal (0, 1) y como ha de set

Page 21: Tests no parametricos en forma secuencial

TESTS NO PARAME' rRICOS EN FORMA SECLrI~NCIAL 63

tendremos

Sean ahora t,, y t~ dos valores tales que

(t.o) = 1 --~ (q) = a

por Io que podremos poaer

~ / N c = t o

, /X (c - , ; . ~ ) = t, de donde

to

V~ N = N(at , l~) - ( t ~ tl)2

I1.I ~

El valor de E~o (N) dado por (o5) es

E~,o (N) = 2

"3

(1 - ~,) log T 2 ~ + ~ l o g , - -

l o g 2 qL + log 2p t

que podemos escribir en la forma

r (td (P (-- t~) d) (to) log ~ + (b ( - to)log (O ( - to)

E~0 (N) = 2 log 2 �9 ( - v-t) + log 2 q~ (lq)

y hallando la eficiencia relativa del test T al test S tenemos

N l ( t , - to) ' , , log 2 (I) (-- IQ + log 2 (I) (~,)

Et~ o (N) 2 ~h' d) (t 1) (I) (-- t~) �9 (to) log ~ + r ( - to) log

(v (to) (~) (-- to) que escr ibiremos

2

N

E> (N~ (t, - to?" log 2 (I) (-Ixl)+log 2 (I) (t~l)

loo" (I) (td r ~--t,) ~(" (I) (to) ~, -6777o) + c~ ( - to) log r to)

=.C (% 6) log 2 (0 (-I~,) +1o~ 2 (I) (t~,)

~'1"-

(45)

(46)

(47).

Page 22: Tests no parametricos en forma secuencial

64 JOSE, ROMANI

el valor de C(e, ~) es independiente de Ixx, Y e[ segundo factor, como vireos en (40), estg acotado inferior y superiormente, y para valores de ~.~<3 podemos poner

N C,(~, ~)= 0,59 C(~, ~ )4 - - g ; ~N-----~ < 0,640 (~, ~) = C.(~, ~) (48)

-a

a continuaci6n damos una tabla de los valores de C t y C_. en fun- .ci6n de a y ~.

TABLA Ns 2

Cotas ms y m S f f m a de la e[iciencia del test S comparado cor~ e~ T

0 t C .

= ~ [ 0,0t 0,0a 0,0s ~ - . . ~ o,ol 0,0a 0,0s /

1,20 1,28 1,31 0,03 1,31 1,39 1,42 1.,11 1,18 1,20 0,05 1,21 1,'28 1,31

que nos permite enunciar el s iguiente

"lqeOP, E~tA: Para los valores usuales de a y a (=~0,0.5 ; . ~ 0 , 0 5 ) y .~,,t->o~3~, el test S, aunque no param~trico, es m~is eficiente que el test param&rico mgts potente no secuencial T , dando ambos la misma fortaleza.

Este resultado aparentemente parad6jico nos indica la importan- cia fundamenta l que tiene en los problemas de la inferencia estadis- tica, el orden con que se wesen tan las realizaciones de un experimen- to a leator io; dando en muchos casos mayor , i n fo rmac i6n , el cono- cimiento de este orden que el valor cuanti tat ivo de la variable.

Por considerar de gran interns este resultado hemos realizado una serie de experiencias para vet c6mo un caso real se ajusta a l a s predicciones te6ricas.

Hemos aplicado ambos tests S v T a cada una de las cien co- l umnas de las tablas de desviaciones aleatorias normales dadas en [147 (pp. '295-304) con las s iguientes h ip6tes is :

Hip6tesis H o / ,=~ .o=0 t ~=0 ,05 ~5=0,0'5 Hip6tesis H~ g.=l~ = 0,674 )

Page 23: Tests no parametricos en forma secuencial

TES'rS NO PARAMETRICOS EN FORMA SECIYENCIAL 65

de modo que N - - (t~ - toV _ (3,290)'- 23,6 (49)

1"1: (0,674)"

es decir N(~, ~)=24, ya que ha de ser N entero y et test T resul ta

Acep ta r H o si es ~%0,34

Acep ta r H I si es ~ :>0,34

el S es el dado en 1.2 con p 1 = 4 ) ( - 0 , 6 7 4 ) = 1 / 4 . Los resul tados fueron los s igu ien tes : Con el test S se rechazd H 0

en cua t ro co lumnas , ndm. 34, 43, 61, 90, cosa que concuerda perfec- t a m e n t e con el va lor ~a=0,05 de la p robab i l i dad de este error .

Con el test T se rechaz6 H o en tres de las co lumnas an te r iores , nfi- m e r o s 43, 61, 90 ; y adem~ts en o t ras cinco, nfim. 4, 11, 51 y 75 ; Men- do in teresante obse rva r que en estas c inco co lumnas e[ test S nece- s i t6 un g ran n d m e r o de obse rvac iones pa ra l legar al resul tado co- r recto (de 32 a 53 observac iones) .

Los pa r~met ros caracteNst icos de la d is t r ibucidn emp{rica del ta- maf io mues t ra l resul taron :

Media m = 19,46 Med iana M. = 16 I. ~ Cuar t i i Q I = 9 3. ~ Cuart i l Q a = 2 5

C o m o vemos , la d is t r ibucidn es m u y asimfitrica, y a c u m u l a d a hacia el or igen , y resul ta que cam en un 75 p o r 100 de las veces hemos neces i tado igual o menor nf imero de obse rvac iones que con el p ro- cedimiento no secuencial . Es in te resante obse rva r que tan s61o en tres

.casos hubo neces idad de pasa r de _48= (O~N (.a, ~)) observac iones . L a eficiencia relat iva en este caso ha resu l tado set

N (T) 24 (S) - 19,46 - 1,2B

m u y de acuerdo con los datos de las tablas de Cx y C. . De todo lo an te r io r se d e s p r e n d e que el test S ademAs de set de

m u y sencilla apl icaeidn es mAs eficiente que el test pa ramdt r i co no secuencia l ~ s potente T .

V e a m o s a h o r a cuA1 es la eficiencia del test no pa ramdt r i co de W a l s h . Es te au to r t oma como eficiencia de un test dado el cociente de dividir el tamaf io mues t ra l del test mAs po ten te en el caso de dis- t r ibuc idn normal (este tamafio mues t ra l no ha de set necesa r iamente

5

Page 24: Tests no parametricos en forma secuencial

6~ JOSE ROMANI

entero) por el tamafio muest ra l del test dado, cuando ambos tests t ienen potencia equ iva l en t e ; esta definici6n creemos que p resen ta el defecto de in tervenir el concepto de ( ,potencia equ iva len te , , que \Va l sh establece as{ ([a] , p. 68): , D o s func iones de potencia con equivalen~ tes en el sig 'uiente s e n t i d o : El 5.tea c o m p r e n d i d a entre las dos cur- vas en la zona en que la po tenc ia del m~s potente es super io r a ta po tenc ia del test d a d o e s igual al 5.rea de la zona en que el test m~Js po ten te tiene potencia inferior al test dado .~ No es dificil c o m p r e n - der clue pueden const rui rse tests q u e e n la zona c o m p r e n d i d a en t r e las hip6tes is a l t e rna t ivas sean c o m p l e t a m e n t e di ferentes y en cambio , segfin la definici6n anterior , se t equ iva len tes por el comportamientc~ en zonas m u y ale jadas de las h ip6tes is a l t e rna t ivas y que por tantc~ carecen de interds.

Ut i l i zando las definiciones an ter iores , y con la t de S tuden t como. test mgts potente , ~vValsh c o m p r u e b a que a p r o x i m a d a m e n t e la eficien~ cia del test por dI d a d o e s de 9.5 po~ 100 ; dec imos a p r o x i m a d a m e n t e por dos ntzones ; la p r imera porqur con las funciones de potencia del test t v det test de \Va l sh es pr{tct icamente impos ib le decir cugmdo son equivalentes , y la s e g u n d a po rque con dis t intos tamar~os m u e s t r a - les va r ia la eficiencia, s iendo el 95 por 100 un t6rmino medio .

Creemos , pues, innecesar io , c o m p a r a r el test S cons t ru ido po t nos- o t ros con el test de \Valsh , ya que v i m o s la comparac i6n f a v o r a b l e que ob t en i amos con el test T m&s potente no secuencial . Adem6.s, el test de \Valsh puede ut i l izarse tan s61o para t ama~os muestrales . menores que diecisdis, que es has ta donde esui mbulado , pues en o t to caso el con j tmto de cAlculos, necesar io pa ra hallar los niveles de s ignif icaci6n es prohib i t ivo .

No conocemos que se h a v a es tud iado el test de T h o m p s o n coa la dis t r ibuci6n normal , pe ro po t las m i s m a s razones an te r io res no j u z g a m o s de inter4s c o m p a r a r el test S con el de T h o m p s o n .

1.7..--R e~umen.

Como resumen diremos clue el test definido en 1.'2 posee propieda-

des en conjunto supe:iores a las de otros tests no param~tricos del

contraste de la mediana, y adn puede utilizarse en muehos easos para-

n%tricos con ventaja. Con Io que hemos conseguido Io que nos pro-

ponlamos en esta primera parte, construir un test que junto con la

ventaja de poder set aplicado a cualquier distribuci6n (que posea me~

diana unlvocamente definida) pueda ser realizado cot~ un ndmero re~ lativamente pequefio de observaciones.

Page 25: Tests no parametricos en forma secuencial

TESTS NO PARAMETRICOS EN FORMA SECUENCIAL 67

~. EL PROBLEMA DE LAS DOS MUESTRAS

9.0.--Origen del problema.

Sea X=(x t , , :x._, . . . . x.) una mues t ra ob ten ida al realizar una expe- r iencia con la var iable aleatoria ~ de funcidn de dis t r ibucidn F, y sea Y=(y~ , y,, . . . . y,~) (no necesar iamente re=n) otra muest ra obtenida ang logamente de la variable r, de funcidn de dis tr ibuci6n G. Quere- mos cont ras tar la hipdtesis H 0 de que F-=--G, con la hipdtesis a l terna- tiva F ~ G . Si F y G sabemos que son funciones normales de igual var ianza, aunque desconocida, se trata en esencia de con t ras ta r la diferencia de medias de dos d is t r ibuciones normales , p rob lema bien conocido y resuelto mediante el test t de S tuden t , que consis te en calcular el v dlor del estad[stico

_ _ 1/ x - -y n . m ( n + m - - 2) t - V S~ ~ + S." " m § n (50~

d o n d e

- ' 2 2 i - x = - - Z xi ; Y ---- - - Yi; S," = (xi--z)" ; S.'=. ( Yi --y)" i = l l = t 1=1 I = l

Si ahora presc indimos de la res tdccidn de set las d is t r ibuciones normales, y no imponemos m{ts condicidn a F y G que las de ser cont inuas , nos encon t ramos con un prob lema no param4tr ico, ya que la ctase de las funciones de dis t r ibucidn admisibIes is. no queda ca- racter izada pot un nfimero finito de parfimetros.

2.1.--SoIuciones no secuenciales.

Se han dado mul t i tud de soluciones a este problema, y aun deI p rob lema m~s ~enerat de las k muestras .

En el caso en que m y n sean g randes y las d is t r ibuciones F y G no demas iado asim~tricos, puede utilizarse el mismo test t. P e ro aqu[ s61o cons ideraremos los test p u r a m e n t e no param~tr icos . Co m o he- mos dicho, hay mul t i tud de e l los ; ci temos los de P i tman [5] , \,Vii- coxon [15], T e r r y [16], Van der \Vaerden [17]', ~,Vald y ~Volfo- witz [18], Epste in [19], S m i n o r f f [20] y Massey [9.1] ami logo at anter ior , y la modificacidn de T s a o [9,0,-] de los dos til t imos.

Es ta enorme cant idad de soluciones es consecuencia na tura l de la g ran var iedad de hipdtesis a t ternat ivas que se pueden presentar .

Page 26: Tests no parametricos en forma secuencial

'8 JOSE ROMANI

tp= i= l

2.1.1. Los cuatro pr imeros test sobre los que Van D a n t z i n g y Heme l r i j k ban realizado un estudio m u y comple to [2311 se basan todos ellos en el s iguiente r a zonamien to :

Sea z 1, ~o . . . . zm+. la muest ra fo rmada o rdenando en sucesidn cre- c iente las x~ y las yt con jun tamente , y sea rt el nf imero de o rden (o rango) que corresponde a x~ en la sucesi6n {z~} ; pues bien, los dis- t intos test util izan como estadist ico los valores (o funciones mon6to- has de dstos)

(ut i i izamos la notaci6n de [-23])

xi P i tman

11

t , = E i=!

?'i \Vi lcoxon

rt

t,z ~--- ' ~ E (Zm+n , r i ) T e r r y i=l.

tw= i= t

(51)

Van ,Vae den

donde E(zm+., ri) es el valor medio del ri -esimo estadistico o rdenado de una muest ra de tamafio m + n de una d is t r ibuci6n normal tipifi- cada, y ~(q) es el cuanti l q de esta misma dis t r ibucidn normal tipi- ficada.

Como vemos, los cuatro tests son anAlogos, y se basan en dist in- tas ponderac iones de los tangos que las x'i poseen dent ro de la rnues- tra {z,}. En realidad, cualquier otra ponderac i6n podr ia servir a n i - logamente . En el caso que dos zi coincidan, caso que pueda presen- tarse en la pr~ictica, aun siendo las tnuestras procedentes de pobla- ciones con funci6n de dis t r ibucidn cont inua , po t la imprec i s idn -de las mediciones, da lugar a inconvenien tes por quedar inde te rminado el orden de a lgunas de las observac iones ; inconvenien te que se salva dando reglas especiales para de t e rmina r en forma sistemAtica, o en forma aleatoria, dicho orden, lo que p roduce una modificacidn de los valores significativos del test cor respondien te .

La dis tr ibuci6n de ti es normal en g randes muestras , y estA ta- bu lada por los dist intos autores para mues t ras pequefias, salvo en el caso de tp, que es diferente para cada mues t ra en part icular , to que represen ta un grave inconveniente en la p~:Actica.

De la potencia de cada uno de ellos, aunque se ha escrito mucho

Page 27: Tests no parametricos en forma secuencial

TESTS NO PARAMETRICOS EN FORY, IA SECUENCIAL 69

poco se puede decir con genera l idad, pues segtln sea la hipdtesis al- ternativa, variarA el test que es mgs p o t e n t e ; y como el mils fAciI de aplicacidn y mejor es tudiado es el de Wi lcoxon , serA el finico de estos cuatro que cons idera remos como tdrmino de comparac idn .

2.1.2. "Wald v Wol fowi t z [18] consideran el ndmero de rachas que se presentan en la sucesidn {z,}, dando el nombre de racha a una sucesi6n de valores de {z~} que per tenecen a la misma poblacidrt x,(yt) comprend ida entre valores de la otra Jr(%) ; as{ la sucesldn

x y y y x x y x y y y x x

cont iene siete rachas. Puede calcularse la d i s t r ibuc i6n deI estadistico [r(m, ,n)=ndmerc~

de rachas en una muest ra fo rmada por m y n e lementos de cada clase, y de aqu~ los niveles de significacidn.

~ E1 test de Eps te in [_19] consiste en 1o s igu ien te : Sear~ ~q. e y~ el estadlst ico de orden r de cada una de las muestras , y sea

%. = m~ix (x~ y,)

Si a,~=x~(=y~) se cuenta el ndmero E~ de y>x~(x>y~) . La dis t r i - bucidn de E~ puede calcularse en funcidn de r para la hipdtesis nuIa F ( x ) = G ( y ) , s iendo f~icil dar la regla de decisidn para cada nivel de significaci6n.

2.1.4. E[ test de Tsao ['22] es una modificaci6n de tos test de Smi rnof f y Massey. Et de Smirnof f , calculado para nmestras peque- fias por Massey, se basa en hallar el valor de

d = m a x I F , ( x ) - G , , , ( y ) l (52)

s iendo I:=(*v)=---~ si es k el ndmero de las .vt que sop. menores que n

y an&logamente para G=(y). Tsao modifica este test cons iderando

~'r = m 3 x I Fn (.7) -- (}m (Y) I (53)

x < m g x (x~ Yr)

siendo r % m i n (m, n) tm ndmero eritero fijado de an temano, como vemos es an~.logo al de Smirnof f , pero sin l legar a cons iderar ta totalidad de los valores de x (6 y).

H e m o s de hacer notar que los tests de Epste in v Tsao son real- mente tests secuenciales si las observaciones de las var iables se obtie-

Page 28: Tests no parametricos en forma secuencial

70 JOSE ROMANI

hen ordenadas en magni tud, co,no ocurre con las experiencias de du- racidn de vida.

En cuanto a la potencia de estos filtimos tests decimos lo mismo que de los cuatro primeros, segfin sea la hipdtesis alternativa, es mils potente uno u otto.

2 . 2 . - - U n teat secueuciaI de las dos rnuestras.

Para utitizar un test basado en la razdn de verosimili tudes nece- s i tamos hacer una hipdtesis al ternativa, pot Io que vamos a plantear concretamente et problema dando la hipdtesis nula y una al ternat iva ; y viendo posteriormente en (tuff forma puede anapliar'se esta hipdtesis al ternativa.

2.2.1. Se realizan (o se pueden realizar) experiencias con las va.- riables aleatorias ~ y r,, de funciones de distr ibucidn F(.v) y G(y) res- pectivamente, que dan lugar a l a s observaciones

~I~ X2~ "''~ Xi~

Yl ' Y2' " ' " Yt,

v hacemos las siguientes

Hipdtesis H o

Hipdtesis H 1

F(x)---G(y) }

G(y) = F(y + c)

F y G desconocidas (54)

c>O

vemos, pues, que ta hipdtesis al ternat iva que int roduclmos es que las diferencias entre F v G sean finicamente en posicidn ; es decir, que una sea la traslacidn de la otra.

Para la construccidn de un test an/tlogo al dado en 1.2.1, nece- s i tamos la siguiente propiedad que enunciamos v demostramos aun- que es bien conocida.

Si ~ y ~ son dos variables aleatorias que poseen la misma funci6n de distribucidn, F(x), se verifica

p(~<,~)=i (6~)

Demostraremos, en primer lugar, que la expresidn anterior es cier- ta cuando las variables tienen la distr ibucidn uni forme en (0, 1).

Tenemos que ] ( x ) = f ( y ) = l es la funcidn de densidad de ~ y r,.

f f ~ fo' roy i ' Y" t 1 ( 5 6 ) - P (~ <-~) = < dx dy -- dy dx -~ y d y = - ~ o 2

Page 29: Tests no parametricos en forma secuencial

TESTS NO PARAMETRICOS EN FORMA SECUENCIAL 71

Si { y .~, poseen cuatquie, 'a otra dis tr ibuci6n F la t rans formac i6n

X = F ( 0 Y = F(r,) (57)

~os da como funci6n de dis t r ibuci6n de las variables a leator ias X e Y la uni forme en (0, 1), pues el recorrido de X (y de Y) est'. Iimi- .tado a (0, 1) y su funci6n de densidad es la unidad, ya que

P(F(a )~ . X ~ F ( b ) ) = e ( a ~ b ) = F ( b ) - F(a) 0 8 )

s iendo a v b dos valores cualesquiera, pot 1o que, si l lamamos F, a la funci6n de dis t r ibuci6n de X, t en em o s :

P(x ~< X <x- + i x ) = F=(x + Ax) - F=(x) = k.v (.59) v

lira F ~ ( a : + k : r ) - - F ~ ( z ) = F ' ~ = I ((10) k x ~ o A a:

Es inmediato vet ahora que s} es F(x) la funci6n de dis t r ibucion de ~, y G ( y ) = F ( y + c ) (con c > 0 ) Ia de ~, se verifica que

P(~ < ~,) = p ~<�89 (6 ! )

pues haciendo r ,+c=~," tendril "4" la misma distribuc.i6n que 6, po t 1,) que podremos poner

CO s e a

cle clonde

P(.~ < ~,') = �89 (62)

P ( ~ + c) = P(.~ - ~ ~ c ) = �89 (63)

P(.~ ~ ) = P(~ - ~, ~ 0 ) < � 8 9 (64)

siempre que la funci6n de dis t r ibuci6n de la var iable a=.~--.q no sea constante en eI intervalo (0, c}, 1o que equivaldrfa a set nula la fun- f i6n de dens idad en dicho in te rva lo ; caso que exclu{mos de nuestro es tudio .

Observemos que s[ bien c mide la separaci6n , f u n c i o n a l , entre F y G, es Pl la medida que interesa desde el pun to de vista estadis- rico, ya que puede ser a muy g rande y e n cambio ser to ta lmente inapreciable desde el punto de vista de la inferencia estadfst ica la di- ferencia entre F y G, y rec iprocamente . Como es fdtcil ver en los dos e jemplos sencillos que c i tamos a cont inuaci6n.

Page 30: Tests no parametricos en forma secuencial

'72 JOSE ROMANI.

F 1 es distr ibucidn normal de media 1 y desviacidn tlpica , = 1 0 0 I G1 , , , 0 ,, , ~=100

{ F~ es la distr ibucidn uni forme en (1, 2) I I ,, (0,

y aunque el valor de c es el mismo en ambos casos, c = l la d i feren-

cia entre F. 2 y G o no puede dar lugar a error de n i n g u n a clase con cualquier experimento aleatorio, aun con una sola observaci6n de y ~q ; mientras q u e e n el pr imer caso har ia falta g ran cant idad de ob-

servaciones para poder d is t ingui r entre F 1 y G1, en realidad mgts err consonanc ia con los valores de

Pl = 0,4972 p a r r el caso I

Pl = 0 ), ,, , [ I

V e m o s que cuanto m~is p r6x imo sea p a cero m~is f,'icil ser~i !a

dist incidn entre F y G.

Ahora podemos enunciar las hip6tesis (54) en la forma s iguiente :

H 0 F(x)-~G(y), es decir, P ( ~ < ~ ) = } ((;5) H , G(y)=F(y+c), es decir, P ( ~ ) = p t < � 8 9

Y de aqui teniendo en cuenta que estas mismas hipdtesis fuerorr

las utit izadas en 1.2.t , s61o que alH era ~'~t*0 enunc iamos el test de la s iguiente fo rma :

Se toman pares de observaciones (x,yl) (x:.,y.)... (xxyx) suces iva- mente, y sea n el nfimero de pares en que x~%yL si este nflmero n

verifica que

[3 - - N l o g 2 qt l o g - - - log 1-- a

log -P• qt

se s iguen tomando observaciones

si n<a,~ se acepta H 0

si n<r x se rechaza [-I n

1-13 N log 2 q, (x

(66) log

s iendo a y [~ como de cos tumbre las probabi t idades de los errores de

pr imera y s egunda clase.

2.3.--Propiedades.

Las propiedades de este test son las mismas que d,~bamos en 1.3

v 1.4 en cuanto a curva caracterist ica de operaci6n y tamafio medio,

Page 31: Tests no parametricos en forma secuencial

TESTS NO PARAMETRIC,.OS EN FORMA SECUENCIAL

mues t ra l y no v a m o s a repet i r los aqui , tan s61o r eco rda remos que se t rata de un test uni la teral como el de 1.0,, po t io que si el v e r d a d e r o

valor de P ( { ~ ) = p es m a y o r que �89 recordando la expres i6n de la curva caracter is t ica dada po t (17.), t end remos una p robab i l i dad de

aceptar H o (es decir, P ( . . ~ ) = � 8 9 m a y o r que 1 - ~ , es decir, una p ro - bab i l idad p r 6x i m a a la un idad de acep ta r una hip6tes is e r r 6 n e a ; de modo que si no s abem os a p r i o r i que p < " convendrdt modif icar el test .

2 . 4 . - - U n t e s t b i l a t e r a l .

Cons ide remos la hip6tes is H x de (54) a m p l i a d a en la f o r m a :

F(y + c) G ( y ) = o bien c > 0 (67}

V ( y - ~ ) Hip6 tes i s H~

es decir, equivalente a

H , = H , +Hi" H,' P (~ < -~) = p, < -:',- (G8) H/~ P(~ ~ ) = pt < �89

1o que equivale a d e s c o m p o n e r la hip6tes is H z en s u m a de (los h i -

p6tesis s impres . Cons ide remos a h o r a el s igu ien te e s q u e m a :

Sea n 1 ndm ero de veces que xi~.yi

y n., . . . y i ~ x t

O b s e r v e m o s que n l + n . _, no es necesa r i amente igual a N, ya q u e

puede darse el caso y i = x t , y dste se con taHa tanto en n , c o m o en n : ,

hacemos notar esto p o t set los casos eQ que y i = & una dificultad err todas las soluciones del p r o b l e m a de las dos mues t ras , mien t r a s que- con este test no represen ta dif icultad n inguna .

Y aho ra ap l iquemos simultf i .neamente el test a los dos n~ ( / = 1 , 2) con las s igu ien tes r e g l a s :

I. Mien t ras ax2>n, :> ra i = 1 , o se s iguen t o m a n d o mues t ras .

I I . T a n . p r o n t o como h i < rx i = 1 . 2 se rechaza H a.

I I I . a) Se s iguen t o m a n d o observacionesa

mien t ras ax > *~., > rx

I ! I . Si n , > a x ( a x > n , > r . ~ ) I I I . b) T a n p ron to como % < r ~ se r e -

(n= > ax ~ chaza H o. ( n , < rx)

[ I I . c) En cuanto n . , > a x se acepta H 0.

( n , > r~)

Page 32: Tests no parametricos en forma secuencial

74 JOSE ROMAN[

E1 esquema anter ior equivale a apl icar dos veces el m i s m o test,

una pa ra cont ras ta r

y otra H 0 P(- ;~r , . )=~ v H ~ P(:.--~-~,)=

i / I-I,, P(~%r,)=�89 y H ~ P(r ,~. :- . )=p,<-~

Na tu r a lmen te , con. esta regla de decisidn los va lores de las p robab i - l idades de p r imera y s e g u n d a clase va no serfin :~ y ~, sino que estaMn

modif icadas . Y hemos de de t e rmina r en qud fo rma . Si con un p r i m e r test r echazamos la h ip6tes is H:, ya no es nece-

sa r io segu i r adelante , pero si se acepta H 0 con el pr i rnero se ha de con t inua r para ver si se acepta tambidn con el s egundo . D e s i g n e m o s ,

pues, po t H0H o el caso I I [ c), po t H o H ~ el caso I I I b) y pot H~ et caso I I , qfle son los dnicos que clan lugar a la t e rminac i6n del test.

Segf in la. decisi6n final que se tome y segfin sea la h ipdtes is cierta se tiene la s igu ien te labia, en la clue damos la p robab i l i dad de error de cada decisi6n.

Resultado final

H.H o HoH , H~

Hip6tesis ~ H~ ~fl -- --

'Cierta t H0 -- (1 -.a)a a

de modo qut: vemos que la p robab i l i dad del error de p r i m e r a clase es

~ = @ - ~ ) ~ + ~ = 2 = - ~-~ (6 .9 )

), la p robab i t idad del de s e g u n d a

~ =,~-~ (70)

P o r tanto, si rea l izamos el e s quem a anter ior con

==1-- ~/1-- ~ y {~= v'~

o b t e n e m o s un test de for ta leza (~1, ~1) ; asi, por e jemplo , si que remos un test bi lateral de for ta leza (0,0.5; 0,05) rea l iza remos el p roceso an- ter ior con

~ = 1 - - , ~ 0,95 = 0,0"263 {3= ,r = 0,2"24

Page 33: Tests no parametricos en forma secuencial

TESTS NO PARAME.TRICOS EN FORMA SECL'ENCIAL 75

Con esta modificaci6n la curva caracteHstica de operaci6n y el tamafio medio muestral sufren la alteraci6n de susti tuir en lugar de

y [3, 1 - - ~ / 1 - ~ y ~/~-respectivamente.

2.5.~AmpIiaci6n de Ias hipdtesis alternativas.

Para la construccidn det test ~ hemos supuesto que la hipdtesis al ternat iva H~ eta

C(v) = F(y + c) (7J.)

equivalente, como dijimos, a que F v G difieren solamente en posi- ci6n_ de forma que resultaba

P({-~,) = p~<�89 (72)

pero vamos a vet que la hip6tesis alte~nativa H~ puede ser mSs ge- neral, ya que la finica propiedad que hemos utilizado en la construc- ci6n del test era la (72), que es mSs amplia que la (71), como indica el s iguiente teorema:

"I'EoRE.~[A: Sea F v G las funciones de distribucidn de las va -

r i ab les ~ y -r,; entonces si se verifica

F(t)<G(t) para todo t finito (73) resuha tambidn :

Demostraci6n :

y, pot tanto,

P ( ~ , ) = p~<�89

Podemos escribir, segfin (73),

P ( ~ t ) . < P ( r ~ t ) para un t fijo (74)

(7.5) (76)

1-- la(~ ~ t ) -<l - P ( {~ t )

P(.~ > . t )<P( -~>t )

y mult ipl icando (74:) y (76)

P ( . ~ t ) P(~>/t)-<P(r~.t .) P (~> t ) (77)

pero el producto del suceso E 1 _ ~ t 9 del suceso E~ .rj~.t es el suceso E=E.~E 2 ~ , ya que si se verifican s imult~neamente ~ t y ~:>t se verifica : , ~ , , es decir, E~, y reclprocamente si {~.~. existe un t tai que { ~ t ~ , . con lo que se cumplen s imuhSneamente E~ y E~, por lo que podemos poner :

P(~*,)-<P(-~ ~ ~) (78)

Page 34: Tests no parametricos en forma secuencial

76 jose ROX~ANZ

pero como la suma de ambas probabi l idades resulta :

P (~ - r , ) = p~<:�89

ha de set la unidad

Como vemos el caso G ( y ) = F ( y + c) es una consecuencia del ante- riot, ya que es

G(y) = F(y + c) ;>F(y)

Las figuras 3 y 4 dan una representacidn gr~ifica de las condieio- nes (71) y (73).

0

Fro. 3

y § C

G

i

t

Q ( 0 �9 1: Ct)

Fm 4

Page 35: Tests no parametricos en forma secuencial

TESTS NO PARAMETRICOS EN FORMA SECUENCIAL 77

Vemos, pues, que el test 9.9.1 podemos utilizarlo con la hipdtesis a l ternat iva m~is general

H 1 G ( t ) > F ( t ) para todo t finito.

9 . 5 . 1 . - - E j e m p l o : V a m o s a considerar el s iguiente ejemplo : en un cultivo de tr igo se utiliza en la actual idad un fertiliza.nte A, y se quiere contras tar un nuevo fertil izante B, de forma que tan s61o interesa co-

nocer si es mejor B que A, ya que si son an&logos o es A mejor que B se seguir la uti l izando A, Es decir, en t4rminos m~is estadlsticos quere- mos contras tar si las variables aleatorias ~, cosecha obtenida con A

y ~ cosecha obtenida con B, son tales que

H 0 F(x)--~G(y) A equivalente a B

H~ F ( t ) > G ( t ) A inferior a B

de manera que

P ( ~ ) = � 8 9

P(~ ~.~ [ H ~ ) - ' - P~<_'e

Por razones de tipo econdmico (pot ser B mucho m&s caro que A)

interesa cambiar de fertil izante s61o en el caso de que la probabil i - clad de obtener con B una cosecha inferior a la obtenida con A sea

p~=0,Ol . Torn'amos los datos de Dixon v Massey ([1.4], p/~g..9_55) y ap l i camos el test "2.2 con a=O,O'L y [3=0,01.

TABLA NI)M. 3

Aplicaci6r~ deL test de las dos muestras

N B A ax n r x

1 28,5 26,3 - - 0 - - 2 3 0 , 0 28 ,6 2" 0 - - 3 2 8 , 8 2 5 , 4 2 0 - - 4 2 5 , 3 2 9 , 2 2 1 - - 5 2 8 , 4 2 7 , 6 2 1 - - 6 26,5 25,6 2 1 - - 7 27,2 26,4 3 1 0 8 29,3 27,7 3 1 0 9 26,2 28,2 3 2 O I0 27,5 29,0 3 3 0

L l e g a n d o a la conclusi6n de que no se debe cambiar de fertilizante.

Page 36: Tests no parametricos en forma secuencial

78 JOSE ROMANI

2.6.--,l[odificacidn deI test.

Hemos visto en los nfimeros anteriores un test de las dos muestras en el caso en que la hipdtesis alternativa fuese H~ G ( y ) = F ( y + c ) ampliada luego a H~ G( t )>F( t ) .

Ahora bien, otras muchas alternativas posibles que quedan fuera de los casos anteriores, como son todas aquellas en que las dis t r ibu- ciones F' y G difieren en dispersidn solamente, o bien difieren en dispersidn y posici6n, pero de tal forma que no se verifica G(t)>F(t).

A continuacidn damos las modificaciones necesarias para poder inctuir estas Mternativas.

9.6.1. Modificaeidn cuando ambas distribuciones tienen igual me- dia (o mediana) conocida, pero pueden tenet diferente dispersidn.

Un ejemplo real de este caso ocurrir~i cuando dos experimentadores diferentes reaticen dos series de mediciones de una constante o mag- nitud flsica, sabiendo que no ha existido error sistemfitico, sino sola- mente experimental ; y se quiere saber si ambos experimentadores son igualmente h~.biles de forma que den la misma precisidn, o si por el contrario uno presenta mayor dispersidn en los datos que el otto.

Sean, pues, { y ~ dos variables aleatorias de la misma media conocida, de funciones de distribucidn F y G, respectivamente, y que-- remos contrastar las hipdtesis

Ho F tiene igual dispersidn que G

H 1 F tiene mayor dispersidn que G

Ahora bien, hemos de precisar qud medida de dispersidn utiliza- mos o qu6 criterio seguimos para afirmar que una distribucidn tiene mayor dispersidn que la otra, ya que si las dos funciones F y G son iguales salvo en el valor de un parS.metro, 6ste podia servirnos como medida de dispersidn y cualquier otra medida podr{a reducirse a 61; pero si F y G son muy diferentes en forma funcionaI, segf in la me- dida que tomemos, sergt la dispersidn de F mayor que la de G o vi- ceversa. Como ejemplo si F es ta distribucidn normal @, ~) y G es la uniforme en (a-h, tz+/z) y tomamos las varianzas como medida: tendr& F mayor dispersidn que G si

,3

Page 37: Tests no parametricos en forma secuencial

TESTS NO PARAMETRICOS EN FORMA SECUENG1AL 79

pero si tomamos el recorr ido intercuati l ico, tendrA G mayor d i s p e r - s idn que F si

h>(1,3S)~ (SO)

y e s f~icil ver que para cada h hay infinitos valores de ~ que satis- facen ambas relaciones a la vez, pues equivalen a

h" h ~- - - > ~" > - - ( 8 1 ) (1,35) ~ ;3

Nosotros diremos que F tiene may o r dispersidn que G si se ve- rifica

P ( [ ~ - ~j < 1"~, - ~[ ) = P l < � 8 9 (8~)

es decir, cuando es ross probable ob tener mayores desviaciones abso- lutas (respecto de la media) con ~ que con ~,. Y diremos que poseen la misma dispersidn cuando

P ( [ ~ - ~ ] < l ~ - : ~ ! ) = � 8 9 (83)

Ahora podemos escribir las. hip6tesis a l ternat ivas de esta maner,a

H~ P ( l ~ - ~ ! < ] ~ - ' ~ l ) = � 8 9 (8t) Ht P([~- ~l<J~-V.I)=p,<�89

se puede aplicar ahora el mismo test 2.9~, sin m4s que cons iderar n como el ntimero de veces que se ver i f ica

en cuan to a las propiedades del test podemos decir que quedan i n - al teradas.

2 .622 . - -Una general izacidn que se presenta inmedia tamente es la de considerar desconocida la media ~x, tanto si es la misma para las dos dis t r ibuciones como si es dis t inta .

De igual forma en un caso y otro podemos poner como hipdtesis .

Ho P(].~,--~2I < ]~,~--~,;])=�89 (85)

H1 P(!_:.~-~.l < I-~,- r,._,[) = p ,< �89

donde ~, y ~.. poseen la misma dis t r ibucida F, y -q, ~.o poseen am- bas la distr ibucidn G.

En efecto, las var iables ~--~_~ y z~-~,_~ poseen la misma media cero y se les puede apl icar el test dado en el nf imero an t e r i o r ; q u e -

Page 38: Tests no parametricos en forma secuencial

~0 JOSE ROMAN~

d a n d o 6ste modif icado de la s iguiente m a n e r a : :Be toman mues t ras sucesivas de tamafio dos de cada una de las dos poblac iones

(x~ x~) (x3 x~) . . . (x.>~ x.~) (y~ y.o) (y~ y~) . . . (y.~_~ y-.0

y se cuenta el nfimero n de veces que

R~({)% Ri(.n) (86) s i endo

R~(~) = [ x. . i_ ,- x ~ [ , Rt@) = [Y2i-t--Y.,.~I

v este nt lmero n es el que se utiliza para dar las reglas de decisidn angdogamente a como hicimos en 2.2.

La curva caracterlst ica de operacidn, en este caso, queda invaria- ble, pero el tamafio medio muestra l viene dupl icado al tomar las ob- servaciones de cada poblacidn a pares, y cons iderar cada par como una unidad a los efectos de la enumerac idn de n.

2 .7 . - -Hipd te s i s rnds generaIes.

Si tenemos dos poblaciones de funciones de dis t r ibuci6n F y G, la comparac idn de fistas puede dar lugar a estos cuatro resul tados,

m u t u a m e n t e excluyentes :

R 0 F = G en el sent ido de que

R 1 F difiere de G en posicidn,

R= F difiere de G en dispers i6n,

e ( l ~ l - =_.~1 < 1~,t- ~l) = p_~<"

R 3 .F dif iere de G en posici6n y dispersidn,

H e m o s cons t ru ldo un test para cont ras ta r R 0 y R , (2.5.) y otro p a r a cont ras tar R o y R~ (~.6.2) con a lgunas s implif icaciones en los casos en que existe algfin otro dato sobre F y G (si se conoce la me- dia, por e jemplo, se utiliza 2.61.1 en lugar de 2.6.2). Pa ra d i s t ingu i r en t re R 0 y R3, cuando no son posibles las o t ras dos a l te rnat ivas R~

Page 39: Tests no parametricos en forma secuencial

TESTS NO PARAMETRICOS EN FORMA SECUENCIAL 8t

y R=, bastarA apl icar cua lquiera de los dos test anter iores , ser& pre- ferible fl,5. por exigir , en media , la mi tad de obse rvac iones que o-.6.2,

a cep t ando R a cuando el test rechace H 0. Si queremos de te rmina r cu41 de las cuatro a l te rna t ivas es la ver -

dadera , ap l i ca remos a m b o s tests sirnult~.neamente, y si los va lores de las p robab i l idades de er ror son ~ y {~, pa ra el test de d i ferencias en posici6n y =', ~3' por e! de d i fe renc ias en dispers idn, los resu l tados que pueden p r e s e n t a r s e y sus respec t ivas p robab i l idades de error son

Hipdtesis RoRo I.I~ i~ ~ RoR., R~R. cierta - -

R o -- a ( l -- a ' ) ( I - a)/3" a.a" R , # ( i - = ' ) -- aB" ( i - = ) # ' R~ ( i - ~ )5 ' 5~" - - # ( I -,c~') R~ 5#" ( i - a ) # " # ( ~ - a ' ) --

~.ndicando con RiRj el resul tado de aceptar la hipdtesis Rt con el p r imec test (de di ferencias en posici6n) y ta hip6tesis Rj en el se- gundo , de m a n e r a que cada una de las posibles decis iones t iene por p robab i l i dades de error

G[ 0 ~ ~ -~- ~ ' - - O~ ~ '

,~ = f3 + ~' - , ~ ' - ~,~' 4 ~ '

Z = ~ + p , - ~,,~ _ ,~ ~,.+ ~ , ;s, = ,~ + ~ , - ~ ~ , - ,~ p , + ~ ~, ~ = ,~,+ ~ - ~ , ~ , - ~.,~ + ,~ ~,

~.., = ,~,~_ p - ,~ ;~._ ,~,,~ + ~,~,

(87)

vemos , pues, que fijados cq y ,8,, no s i empre es posibh: d e t e r m i n a r los va lores de ~; c{, ~3, ~3'; pero, en el caso de hagan los ~=~3=~ '= ;3 ' resul ta

.de donde, si f i jamos ~i=,a', h e m o s de utiliza,"

= 1 - d 1 - :~, = ,S ( 8 8 )

en a m b o s tests.

T a n t o el test 2.6.2. como el 2.5 son tests uni la terales ; por lo que si de las condic iones pa r t i cu la tes del p rob l ema no resulta esta l imi- tacidn habHa que util izar a m b o s tests en la f o r m a bilateral indicada en 2.4:. Si se t ra ta de apl icar los por sepa.rado no supone ccrmplicacidn a lguna , y los resul tados dados all{ para los valores de las p robab i l i - dades de error , valen para este c a s o ; pero si se han de ap l icar con-

j u n t a m e n t e el test de d i fereneias en posicidn y el de dispers idn caben

Page 40: Tests no parametricos en forma secuencial

82 JOSE ROMANI

nueve decisiones diferentes, y si bien podr~a construirse un cuad ro an~.logo al anter ior para hallar los valores efectivos de = y w pa ra cada una de las nueve decisiones, no 1o cons ideramos por set mgts convenien te la aplicaci6n de este otro test.

2 .&- -Un test de las dos muestras vdlido para cuaIquier hip6tesix alternativa.

Consideremos la hipdtesis nula

H o F = G

y la hip6tesis a l ternat iva lo nazis general posible

H~ F ~ G

para contras tar estas hip6tesis hacemos uso del s iguiente teorema de- L e h m a n 1-25"], que no demos t ra remos

Sea x~, x_~ una muest ra de extensi6n dos obtenida de la var ia- ble aleatoria ~ de funci6n de dis t r ibuci6n F, v anS.logamente, y~, Ye respecto de la variable ~q de funcidn de distr ibuci6n G ; entonces se verifica

P [(max xi < min Yi) -+- ( m i n x i > max .@] = .{ i = 1, 2 (89~

si y s61o si F = G ; en el caso en que t : ~ G la p :obabi l idad a n t e r i o r es s iempre mayor que 1/3, que l lamaremos Pl-

Ahora podemos cons t ru i r el s iguiente test de fortaleza (~, ~3). Se- roman muestras sucesivas de tamafio dos de ambos poblac iones

(x, x:) (:c3 x,~ . . . (x-.i-~ x..i)

(YtY:) (Ya Y,) " " (Y'-'i-, Y:i)

sea N el ntlmero total de pares de muestras tomadas (supuesto comer s iempre que se ha l legado a N) y n el ndmero de elias en que los intervalos (x:i_ ~ z..j) (y.q_~ Y.-0 no t ienen puntos c o m u n e s ; en tonces s~

�9 q qz 3 qt l o g B log 2 ]oe 'A log 2

a ~ - - - i N - - < n < N - - r ~ (90) 2pi 2Pl -'2p, 2Pl

log log - - log - - log q~ q, q, ql

se s iguen tomando muestras (donde, como de cos tumbre

A = - - - , B - - , v q ~ = l - p ~

Page 41: Tests no parametricos en forma secuencial

TESTS NO PARAMETRICOS EN FORMA SECLrENCIAL 83

Si n % a se acepta H o.

Si n > r se acepta H~.

R e s u l t a i nmed ia t amen te esta const rucci6n sin mils que -esc r ib i r la raz6n de veros imi l i tudes

Pl~ p~ q,N-,

P0~ (!,)~ (~r ~-''

y de spe j ando n de la acotaci6n

PIN B < Po,~ < A

se obt iene (90).

~.8~1. P r o p i e d a d e s . - - i ' . a curvet caracter{stica de operaci6n

pot expres i6n

A h -- 1 ,3 qt~h _ ~}' Lr A h _ B h , donde P = /L~ q,/l~ - - 0;p,) h

tiene

(91)

y po t definici6n L ( 1 , / 3 ) = l - - = v [.(p,)={~.

El tamafio medio muestra l es

L (r) log B +. (I - L) (7~) log A Ee (N) = (92)

3 ql p l o g 3p , + (1 - p) log --2

que para los valores de p = l / 3 y P = P l torha la expreshSn

(1 -- =)log B q- = log A E~ (N) = 3

3 q, I o g 3 p , + 2 1 o g 2

(93) log 13 4- (1 - - ~) log A

Ep, (1N ~) = 3 q~

p, log ,~p~ + q, log 2

cons ide rando , na tu ra lmen te , que N es el n d m e r o de mues t r a s necesa- rias, por lo que si nos re fe r imos a obse rvac iones t endremos que to- mar el doble de las an ter iores expres iones .

2.8.2. E j e m p l o . - - V a m o s a ap l ica r el test anter ior , con p l = g / 3 ,

de donde resut ta

a ~ = � 8 9 y Ep, (N) = 11,47

Page 42: Tests no parametricos en forma secuencial

8 t j o s e ROMAN~

Las poblac iones son F normal de media 2 y va r i anza 1, y G, as i - mi smo , normal , pero de media cero y va r i anza 4 ; u samos las t ab las

dadas po t I-1~t], pp. 350 y 356.

T.AaLA NIdM. 4

Aplicacidn del test de las dos muestras generalizado

N x~ i-I x2 i ~'2 [-1 Y~-i r x n an

I 2,23'2 1,700 -0,686 0,(i78 - - 1 - - 1,868 1,263 0,106 -0,018 - - 2 - -

3 0,655 2,999 -0,638 3,191 m 2 - - 4 1,288 1,322 -3,088 --0,998 - - 3 - - 5 1,403 2,207 1,017 - 2,496 5 4 0 6 1,564 2,412 0,132 --1,502 6 5 0 7 1,530 2,2"2_4 1,217 -2,380 6 6 1

D a n d o como resul tado rechazar la h ip6tes is nula F = G en la mues t r a s @ t i m a (observacidn catorce, si las con t amos in 'd iv idualmen- te). Si hubi~semos ap t icado el test 2.5, po t t ene t conoc imien to de que podian existir d i ferencias en posicidn en el sent ido de

hubi~semos rechazado la h ipdtes is nula con menos obse rvac iones . Pero claro est~ que sin conoc imien to a l g u n o sobre F v G, el 5nico p roced imien to serfa el empleado .

2 . 9 . - - C o m p a r a d 6 n de los test no secuenciaIes con los sec~enciaIes dados anter iormente .

Y a di j imos que habfa poco conocido sobre sobre el c o m p o r t a - mien to genera l de los tests que resolv{an el p r o b l e m a de las dos mues t ras . La potencia , cuando la d is t r ibuc idn en es tudio es normal. y la h ipdtes is a l te rnat iva , la de di fer i r en posici6/% se ha e s tud iado en fo rma exper imenta l por Eps t e in E26]; pero, an tes de haeer un

es tudio de los resul tados po t dl ob ten idos , v a m o s a des tacar a l g u n a s p rop iedades que poseen los test secuencia les aqui cons t ru idos y que no poseen las otras soluciones no secuenciales .

'2.9.1. Et dnico test que fija Ias p robab i l idades de los e r rores de a m b a s clases para cualquier a l t e rna t iva posible F ~ G es el 2.8. Y si b ien suele necesi tar un g ran nf imero de obse rvac iones en a l g u n o s casos, es el m~.s conven ien te cuando no se conoce n i n g u n a p rop ie - d a d de las pob lac iones a c o m p a r a r . E s decir , es el test lo m~_s a m - plio posible y, po t tanto, de poca eficiencia.

Page 43: Tests no parametricos en forma secuencial

TESTF~ NO PARAME-rRIGOS EN FORMA SECUENCIAL 85

2.9.2. Cuando se sabe que las d i ferencias pueden ser tan s61o en dispers idn, puede ap l icarse el lest 2.6. o, que no es m u y eficiente, ya que se necesitan las obse rvac iones de cada poblac idn por pa re jas . Este inconvenien te se evi ta si se conoce la media comfin de las dis- t r ibuc iones F y G, util.izando 2.6.1, con to que se dupl ica la ef ic iea- cia. No conocemos que se hayan es tudiado los tests no secuenciales con esta a l ternat iva , por 1o que no p o d e m o s hacer una comparac idn en cuan to a potenc{a y t a m a n o mues t ra[ necesar io ; pero no es a v e a - turado el suponer que el test seeuencial aven t a j a en arnbas caracte- r ist icas a Ins no secuenciales a la v i s t a de los resut tados del nf imero s iguien te , en e[ que se c o m p a r a et test 2.~ con ins d iversos tests no secuenciales , s iendo la hipdtesis a l t e rna t iva la de d i f ed r en posicidn

soIamente .

tL9.3. Eps te in [o6] ha es tudiado expe r imen ta lmcn te la curva ca-

racter[st ica de operaci6n de Ins tests de VVilcoxon, \Va ld v W o t f o - witz, Eps t e in y Tsao (estos dos fi l t imos con valores dis t intos de r) de la s igu ien te manera . Apl ic6 cada uno de estos tests a 200 pm'es de mues t r a s de tamafio 10, ob ten idas tie dos d i s t r ibuc iones no rma les de va r i anza u n i d a d ; repi t iendo este proceso cua t ro veces, cada una de ellas con una diferencia de medias d = 0 , 1, 2, 2,: el nivel de s ign i - ficacidn era ==0,05 , y como en a l g u n o s casos, los tests no daban exac tamen te este nivel, se ut i / [zaron decis iones a lea tor izadas p a r t a lcanzar et valor exacto.

D a m n s a cont inuacidn la tabla de Ins resul tados donde W indica el test de Wi lcoxon , \ V \ V el de \Va ld v \Vol fowi tz , E~ el de E p s - tein p,ara r = i , y an6.1ogamente T~ indica el de T s a o pa ra dis t in tos valores de r. Herons afiadido la f l l t ima co lumna, indicada con S, en la que se dan Ins va lores tedricos, no exper imenta les , de t a cu rva caracter is t ica de operaci6n det test 2.2 para p~=O,O'5, ~=0 , 05 v

~,=0,05.

Frecuencia observada de aceptar I.I o (d-O) basada en 200 pares de muestras, cada una. de ellas de tama~o 10, para cada, uno. de los tests W, WW, E y T (darns ,te

[24]) y probabilidad de acepia:r H o (d=O)par~ el test S co,~ p~=0,05.

d W ~VW E, E. E.~ T 3 Tt~ Tm S

0 0,935 0,965 0,95 0,96 0,96 0 , 9 5 5 0,945 0,945 0,9500 1 0,485 0 , 7 9 5 0,655 0,65 0,60 0 , 5 7 5 0,555 0,565 0,3239 2 0,015 0,275 0~16 0,12 0,10 0,065 0,045 0,045 0,0148 3 0 0,02 0,025 0 0 0 0 0 O,(NgO

Page 44: Tests no parametricos en forma secuencial

8 6 JOSE ROMANI

O b s e r v a m o s q u e : pa ra d = 0 los tests W \ V , E.,, E a y T a dan ma-

yo r p robab i l i dad de acep ta r la h ip6tes is nula ( q u e e n este caso es cierta) que S, pero como se han cons t ru ldo de f o r m a que esta pro- bab i l idad sea 0,95. la m i s m a que pa ra S, esta supe r io r idad es apa - rante y estti p roducida po t Ias f luc tuac iones a teator ias p rop i a s del expe r imen to .

P a r a cualquiera de los otros va lores de d, la p robab i l idad de acep- tar H o (en este caso, falsa) es menor que S que con cualquier o t to test, y tan s61o cabr ia supone r pa ra d = g y \V, que la infer ior idad de dste sea debida a f luctuaciones a lea tor ias del mdtodo e x p e r i m e n - t a l ; pues en los dem~is casos, ca lcu lando los in tervalos condidenc ia - les de los valores dados en la tabla , que no son mS.s que es t imacio- nes de un parSmetro b inomia l p, no c o m p r e n d e n al va lor co r respon-

d iente a S. P o d e m o s resumir dic iendo que el test S es, en ct ,anto a potencia ,

super io r a todos los demfis, s iendo el m~s p r6x imo a S el de \Vi l - coxon. \Teamos qud ocurre con el t amaf io mues t ra l .

~.9.4. El tamafio medio mues t ra l del test S, c uando es cierta l;_t

h ip6tes is nula, E0(N/S ) es 3,19, lo que represen ta tan s61o un 35~ p o t 100 de l a s observac iones necesar ias con los otros tests. Es tc tamaf io me- dio toma el .valor m~iximo de 5,87 en el caso de se t d = 0 , 7 8 ; o sea que, en el peor de los casos, tan s61o necesita un .59 por 100 de las obse rvac iones que exigen los o t ros tests.

Eps te in , at cons idera r que las obse rvac iones se han ob ten ido en m a g n i t u d creciente, t oma los tests E v T como secuenciales , segt 'm ya d i j imos en o_.1.4, y da tambi4n los tamaf ios medios mues t ra les quo resul taron de las exper ienc ias y que c o p i a m o s a cont inuac idn :

TABLA NI~IM. 6

Tama~os m.edios muestrales experimentales de Epstein v Tsao

d E I E., Ea Ta

9 2,85 4,99 7,25 7,i7 1 3,84 6.42 8,64 8,02 2 4,77 7,29 8,85 6,80 3 4,96 7,07 8,17 6,11

C o m p a r a n d o los resul tados para d=O con Eo(NIS)=3, .19 , v e m o s que tan sdto E 1 necesi ta menor nf imero de o b s e r v a c i o n e s ; y Io mis -

mo resul ta si d:l:0, t o m a n d o el m~.ximo de E , ( N l S ) = 5 , 8 7 ; pe ro si o b s e r v a m o s nue la potencia de E 1 es m u v inferior a la de S, es ta ii-

Page 45: Tests no parametricos en forma secuencial

"I'E51S NO U3,RAME'IIIIIJO5 151~ ~'fOl~.o\lA. 51~Iok. I'.NELAL 87

gera ven ta ja de necesitar menos obse rvac iones no c o m p e n s a la p~r- d ida de potencia que lleva cons igo . Y as{ podemos t e rminar diciendo que el test S definido en ~.2 es m~s po ten te que cua lquiera de los tests no secuenciales es tudiados an te r io rmente , v ademgts necesitq muchas menos observac iones paca l legar a una d~r'cisidn, pues cn a l g u n o de los casos puede necesi tar tan s61o el 39 pot 100 del ta- mafio mues t ra l requerido poc los tests no secuenciales.

2 . 1 0 . - - R e sum en.

T e r m i n a l n o s as{ este capi tulo, con pa lab ras anMogas a las que di- i imos en el p r imero . H e m o s construld 'o d iversos tests secuenciales del p r o b l e m a de las dos mues t ras , que poseen, en genera l , pr.opiedades super iores a los tie o t ros tests no secuenciales . En par t icular , el test S, def imdo en 0_.2, posee mavoa- potencia y necesita menos observa- clones que otros tests anMogos . H e m o s conseguido , pues, Io que nos p r o p o n i a m o s : d i sminui r el tamaf io muest ra l necesario para los pro- b lemas de las dos mues t ras , sin p~cdida de potencia .

3 . F.L P R O B L E M . \ D E L . \ A I . E . k T O R I E D . V D

3.0. Origen tie[ probIema.

T o d a la Teor{a de Mues t ras de la Estad{st ica se basa en la hipd- -tesis de que tas mues t ras son aleator ias . Se def ine una mues t r a alea- toria de una poblacidn de dens idad f(x) como un valor par t icular

de la var iab le n-d imens ional , cuva dens idad es

f(x~, x.:, . . . , x,) = [ I f(x~ 1=1

Vemos , pues, que equivale esta definicidn a decir que una mues-

t r a es a lea tor ia cuando las obse rvac iones son independ ien tes v to- madas al azar .

Resu l ta , pues, del m a y o r inter4s el c o m p r o b a r si una mues t ra es a leator ia para hacer vMida cualquier pos ter ior apl icacidn de la Teo - ria de Mues t ras .

El p rob l em a de con t ras ta r la a lea tor iedad puede, pues, conside- rarse como un paso par t icu la r del p r o b l e m a de tas k mues t ras , en que cada ur!a de estas m ues t r a s es de extensidn un idad ; de aqu[ que 1as soluciones sean seme jan te s a l as -es tud iadas en el capi tu lo anter ior .

Page 46: Tests no parametricos en forma secuencial

88 ROSE ROMANI

3 . i . - - g o l u c i o n e s no secuencialcs.

En todos los problemas de a lea tor iedad es fundamenta l el ordm~ en que se obt ienen las obse rvac iones ; pues dada una muestra cua l - quiera, s iempre podremos hacer que resuhe s ignif icat iva con un d e - te rminado test por tin cambio adecuado del orden ; pot lo que al da r una mues t ra la cons ideraremos ,siempre o rdenada tat y como se

obtuvo. Tambidn ocurre aqu{ que las hip6tesis a l ternat ivas pueden s e t

m u y numerosas ; noso.tros cons ideraremos una hip6tesis a l te rnat iva de tendencia en el sent ido de que la funci6n de dis tr ibuci6n de la muestra con la hip6tesis H~ es

F (x,, x.., . . . , x,) = 1 - I F (~i + i 0) (94,) i* l

Ent re todas las soluciones c i taremos

3.1.1..--E1 test de "vVald v \Vol fowi tz es an~ilogo al de las d o s muestras sin m&s que considerar las observaciones inferiores a !a mediana, como per tenecientes a una mues t ra M, y ' l a s super iores otra muestra M.,, con t ras tando si ~I~ y M2 poseen la misma d i s t r ibu - ci6n por el me~todo de las rachas.

3 . i . 2 . - - T e s t de correlaci6n de r angos de Kenda l l [~ Sea a:~, &,, ..., x= la muestra que queremos contras tar , si hacemos c o r r e s p o n - der a cada x~ un nfimero entero r~ de te rminado por el lugar que ten- dria % supuesta la mues t ra o rdenada en magn i tud creciente, p o d e - mos hallar el coeficiente de correlacidn de r~ e i ; cuya dis t r ibuci6n en el supuesto de 21eatoriedad puede hallarse f&cilmente.

3.i .a .--Cox v Stuar t ['2_8] cons t ruyen una serie de tests basados, en la expresi6n

C = E w~ hd donde

hij = l 1 si a-, > a-j 0 si :r i < aqj

v ~,,a es una funcidn de peso de t e rminada de manera que dd c o n d i - ciones 6ptimas, segtln tas a l ternat ivas .

Page 47: Tests no parametricos en forma secuencial

TESTS NO PARAMETRICOS EN FORMA SEC!J'ENCIAL 89

3 . 9 . - - U t ~ tes t s ecuenc ia l de a tea tor iedad co~ h ipd t e s i s a I t e rna t i va d:'.

t endenc ia .

A u n q u e en los dos capi tu los an te r io res s u p o n [ a m o s que para los tests secuenciales tom&bamos las obse rvac iones a med ida que se ne- ces i taban, aqul s u p o n d r e m o s que pos eemos una mues t r a x t, x.,, . . . , .,:,

que que remos c o m p r o b a r si es a leator ia , y el p roced imien to ser~. se - cueneial en el sent ido que t o m a r e m o s en consideracidn un nuevo va- lor de la mues t ra x~, si con los va lores anter iores , x, ]'<~i. no hemos. l legado a una decisidn.

H a b l a m o s visto en el cap[tulo an te r io r que si (los var iab les ~, r poseian la m i s m a dis t r ibucidn F(a~) se ver i f icaba

P(~%~) = �89 (95)

y que si, por el contrar io, era G ( y ) = F ( 0 ~ + c ) r e s u l t a b l

Si cons ide ramos que la mues t r a x~, x2, ..., x , , quc queremos con- t rastar , s iendo la hip6tesis a l t e rna t iva la de tendencia (94), est~i for- mada p o t obse rvac iones de las va r i ab l e s ~ y z, bas tar~ apl icar a es- tas dos var iab les cualquier cont ras te de las dos ~mes t ras con la h i - pdtesis a l t e rna t iva (96). De la fo rma de a s igna r cada x, a una u otra- mues t r a dependerS, el c o m p o r t a m i e n t o par t icu lar del test.

En pr inc ip io p e n s a m o s en a t r ibu i r un valor ~,~ a una de estas v a - r iables ficticias, y el s igu ien te a la otra , as[ suces ivamente , con Icy que el test consistir{a en contar el n d m e r o de veces que xt es i n fe r io r a x~+] , y l l amando a este n(Imero .r~ se podr[a ap l icar el test "2_. ~ .

3 . ' 2 .1 . - -Cuando es t~bamos es tud iando las p r o p i e d a d e s de este test t uv imos conoc imien to del resumen de un t raba jo no publ icado de Noe ther [~24-1, que es mfi~ genera l que nuestro m~todo an te r ior en el s igu ien tes aspecto . H a g a m o s

0 si x..~.i + h < .~cez~.i -}- h g = 0, I . . . . Zgb.

t 1 si x ~ g j - b t t : > x e g ~ i § h = 1,2, . . . j

con la h ipdtes is de tendencia , como h a b i a m o s supues to ,

P ( z g ~ = l ) = p ~ , ~ � 8 9 mien t ras que P ( : : ~ = 1) = �89

con la h ipdtes is de a lea tor iedad, y a h o r a se apl ica ya el test c o m o otras veces con tando el n 6 m e r o de z~h iguales a la un idad . Si ]=12

Page 48: Tests no parametricos en forma secuencial

90 JOSE ROMANI

queda, como es f~.cil vet, el test que nosotros comenzamos it estudiar ; pe ro Noether s igue m&s adelante diciendo que existe un ntlmero /

que es 6pt imo en el sentido de que el nf lmem medio de observacio- nes necesaHo" para el test correspondiente a este /" es inferior al co- r respondiente para cualquier otro j.

No conocemos en los distintos casos cu&les son los valores 6pti-

mos de /', ya clue el resumen no los cita.

Noether compara este test (no sabemos si con el valor 6pr imo de

j o con cualquier otro valor) cort los test no secuenciales de rachas v de correlaci6n de rangos, y obtiene, como era de esperar conociend.)

los resultados de los caphulos anteriores, que et test secuencial ne-

cesita en media menor ntlmero de observaciones. Cox y Stuar t citan clue tambi4n ocurre esto comparAndolo con los tests de la clase C pop ellos definida.

3 . ' 2 .~ general izaci6n que parece set que Noether no ha con-

s iderado es la de admit i r hip6tesis al ternat ivas de tendencia en dis. persi6n, y que s iguiendo los mdtodos del cap[tulo anterior es f~cil de corttrastar. Se puede aplicar el test dado en 9,.4.2 tomando con-

venientemente el criterio de dividir la muestra total en dos submues -

tras v comparando dstas entre s[. Pos ib lemente a la vista deI t rabajo de Noether cabr{a la posibil idad de de te rminar este criterio de forma

que el valor medio del nfimero de observaciones necesario s minimo.

No hemos querido realizar este estudio mientras no tuvidsemos conocimiento completo de los resul tados de Noether .

3 . 2 . 3 . - - P a r a terminar diremos que tambi4n en el caso de los test de aleatoriedad supone ventaja el considerar un test secuencial en forma an~iloga a los const ruldos en los capkulos anteriores, y si no

l~acemos un estudio m&s completo de estos test se debe a qt, e existen :resultados sobre esta materia, que si bien no estfm pubt icados inte-

gramente , se han dado a conocer por un resumen, y que representan runa general izaci6n de los tests que habiamos construldo.

Page 49: Tests no parametricos en forma secuencial

TES ' [S NO PARAMETRICOS EN FORMA SEC:UENCIAL 91

B I BLI OGRAFIA

[1] WALt?, A.--Sobre los principios de la inferencia estadistica. TP~BaJOs ;-E ESTaDisTICa. Vol. 1I. Cuad. II. 1981, p. 113.

[2] SAVAGE, I. R.--Bibliography of Nonparametric Statistics an related topics. Jo,r. Am. Stc~t. Ass. Vol. 48. N6m. 264, 1-954, pp. 84"4-.006.

[3] WaLSm J. E.--Some significance test for the median wieh are valid under very general conditio.ns. A~*n.Mc~th Strut. Vol XX, 1949, p. 64.

[4] ~,VmKss, S. S.--Order Statistics. Bull. Am. Math. Soc Vol. 54, 1948, pfi- ginas 6-50.

~8] PITMAN, E. J. G.--Significance tests wich may be applied to samples from any population. ]our. Royal Stat. Soc. Supplement Vol. 4, 1937, pp. 119-1:~0.

[6] W1ccoxos, F.--Individuat Comparisons by ranking methods. Biometrics. Vol. 1, 1946, pp. 80-82.

[7] Moots, A. M.--lntrodutMn to theory of statistics. New York, 1950 (McGraw_ Hill), pp. 107-108.

[8] Rios, S.--lntroduccidn a los n%todos tie la Estadlstiea. 2. ~ porte. Madrid, 1954~ pp. '273.

[9] THo~Psox, W. R.--On confidence ranges for the median and other expce- t,tions d}gtributions for populations of unknown distribution form. Ann. Math. Stat. Vol. 7, 1936, pp. 12'~-128.

[10] \VM.~, A.--Sequential analisys. New York, 1917 (Wiley). [11] Rovo, J,. y F|.:RaER, S..--Tablas de nfimer<~saleatorios v estadfsticas. Ins-

tituto de tnvestigaciones Estadisricas. Madrid, 19.55. [12] P~.al~sox, K.--Tables of the incomplete beta function. Can,t, ridge, 1932 (Cam.

bridge Universitv Press). [1.3] Cf~,~.mcR, H.--Mathematical Methods of Statistics. Princeton, 1946 (Prince-

ton University Press). [14] l)txox, W. J. y Mass,Y, F. ] .--Introduction to statistical analisys. New

York, 19,5! (McGraw-Hill). I1.5] W~r.coxo~. F- - Indiv idual Comparisons bv ranking methods. Iliomr

Vol. 1, 1946, pp. 80-82. [16] TERaV, M. E.--Some rank order test wich are most powerful against ~pecific

parametric alternatives. Ann..Ma.th. Stat. Vol. 23, 1952, pp. 346-366. [17] V:~N t)~.:u W,u.:~D~:N, B. L.--Order test for the two sample problem and

their power. Indag'r Mathem.aticae. Vol. 14, 1052, pp. 453-458. [18] EPSTEIN, B.--Tables for the distribution of the number of exceedaaces.

Am~. Math. Star. Vel. 25, 1954,'pp. 762-768. [19] WOLD, A. v Wo~.vowrCz, ] . - -On a test whether two samples are from the

same popuiatioil. Ann. Math. St~t. Vol. XI, 1940,, pp. 147-162. [20] SmnNOFv.--Tables for estimating the goodnes of fit of empirical distribu-

t!ons. Ann. 3[arth. S ia l VcA. XIV, 1943, pp. 66-$7. [21] Mass[v, F. J. Jr . - -The distributidn of the maximum de~iation between two

cumulative step functions. Ann. Math. 'Stat . VoL 2:?,, 1951, pp. 125-128. [22] Ts*o, 'C. K.--An extension of Massey's distribution of the maximum de-

warren of two cumulative step functions. An~. Math. Star. Vol. 25, pfi- ginas .587-592.

[2;3] VAN Da.~Tzm, D. v HEUEELmJK, J.~Statistical methods based on few assupmt[cns. Bull. I)zst. Inter..gtatist. Tome XXXIV

[24] NOETHr G.--Abstract of A sequential test of randomness againts linear trend. A,n . MaSh. Star. Vol. 25, 1954, pp. 1.76.

[25] LC.~MaN, E. L.~Consistency and unbiasedness of certain non parametric test. ;bin. :lItzth. Star. Vot. 22, 1981, pp. 16#-179.

['26] Eesr~rN. B.--Comparisons of some non parametric tests againts normal alternatives with en application to life testing. ]our. Am. Stat. Ass. Vol. 50, 19,55, pp. 8~-4-9(1~?.

[27] KEND*tCL, M. G. - -Rank correlation methcds. London, 1948 (Griffin). [28] Cox, D. R. v Sru.~R'r, S.--Some 9ui&k sing test for trend in locatidn and

dispersidn. Bi:ometrica. Vol. 4'2, 19~5, pp. 80-95.

Page 50: Tests no parametricos en forma secuencial

92 jos~ ROMANI

D E S C R I P C I O N D E LAS T A B L A S

En la Tabla I presentamos las vatores de ax y rx del test S (1.2} deducidos de la fdrmula (I6}, que podemos escribir :

log ~/(i - - a) log 2 q, a s - - N

log p,/q, log pi/q 1

1o~ (1 --~)/a log 2 q,

logpl /q I log lh/ql

que en el piano (n, N) representan un par de rectas para le las . Las tablas dan las ecuaeiones de estas rectas (con cuatro cifl'as decimales exactas en la pendiente y ordenadas en el origen) para valores de Pl de 0,0~, a 0,45, con. inerementos de 0,0-5, m~is los extremos p l=0 ,01 ; y p~=0,49. Los valores de a y fl yueden ser 0,05 ; 0,03 ; 0,0], en cualquier combinaci6n posible.

Consider:mu~s qu,: e:-.le coniunto de valores es suficiente para los casos mfi~. frecuentes de aplicaci6n.

En la Tabla ~I presentamos los tamafio.s medios muestrales para las mismas combinaeiones de pl, ~z y fl, que la tabla anterior y con las dos al ternativas H~ ciertc~ y H~ cierta, dedueidos de las f6rmulas (~8) y (25)..

TABLA I . --Valores de~ ar y r~ en funcidn de p~, a y ft.

a =0,05 B=o,o5

))l

0,01 0,05 0,10 0,15 0,29 0,25 0,30 0,35 0,40 0,45 0,49

(l N

0,6408 + N. 0,1487 1,0009+ N. 0,2180 1,3401 + N, 0,2674 1,6975 + N. 0,3059 2,1204 + N. 0,3385 2,6301 + N. 0,3s 3,4751 + N. 0,3971 4,6574 + N. 0,4238 7,2619+ N. 0,4497

14,6730+ N. 0,4750 73,~:011 + N. 0,4950

T X

-- 0,6408 + N. 0,1487 - - 1 , 0 0 0 0 + N . 0,2180 - 1,3401+N. 0,2674 - 1,6975+N. 0;3059 - 2 ,1294+N. 0,3385 - 2 ,680!+N. 0,3691 - 3,4751+N. 0,3971 - 4,6574+N. 0,4938 -- 7,2619+N. 0,4497 -14 ,6730+ N. 0,4750 --73,6011+ N. 0,4950

fl=0,03 a=0 ,06

0,01 0,05 0,1o 0,15 0,29 0,25 0,30 0,35 0,40 0,45 0,49

0,7519 + N. 0,1487 ] ,1785+ N. 0,2180 1.5726+ N. 0,2674 1,9920+ N. 0,8059 2,4883+ N. 0,33~5 3,1451 + N. 0,8691 4,0780+ N. 0,8971 5,5817 + N. 0,4238 8,52.17 + N. 0,4497

17,2186+ N. 0,4750 86,370.1 + N . 0,4950

-- 0,6153+N. 0,1487 - ].,0070+ N. 0,2180 - 1,3496+N. 0,2674 - ] ,7095+N. 0,3059 - 2,1364+N. 0,3385 - 2,6991+N. 0,3601 - 3,4997+N. 0,3971 - 4,7901 + N . 0,4238 - 7,3133+N. 0,4497 --14,7768+N. 0,4750" --74,1719+ N. 0,4950

Page 51: Tests no parametricos en forma secuencial

TESTS NO PARAMETRICOS F-,N FORMA SECUENCIAL 93

TABLA NO~t. 1 (Continuaci6n)

a =0,55 fi=O,Ol

Pl (IN

0,01 0,05 0,I0 0,15 0,20 0,25 0,30 0,3.5 0,40 0,45 0,49

0,9910+ N. 0,1487 1,5466 + N. 0,2180 2,W56+ N. 0,2674 2,6253+ N. 0,3C59 3,2795+ N. 0,3385 4,1451+ N. 0,3691 5,3746+N. 0,3971 7,3564+ N. 0,4238

11,2312+ N. 0,4497 22,6933+ N. 0,4750

113,8317+ N. 0,49.50

r N

- 0,6497+ N. 0,1487 - 1,0140+N. 0,2180 - ] ,3588 + N. 0,2674 - 1,7212+N. 0,3059 - 2,1501+ N. 0,3385 - 2 ,7177+N. 0,3691 - 3,5238 +N. 0,3971 - 4,8231+ N. 0,4238 - 7,3636+N. 0,4497 --14,87854 N. 0,4750 -74,6321+ N. 0;4950

a =0,03 fl=0,05

P l aN r~-

0,01 0,05 0,10 0,15 0,20 0,25 0,50 0,35 0,40 0,45 0,40

a =O,03 fi=o,o3

0,5453+ N. 0,1487 1,0070+ N. 0,2180 1,$496 + N. 0,2674 1,7095+ N. 0,3059 2,1354+ N. 0,3385 2,6991 + N. 0,3601 3,4997 + N. 0,3971 4,7901 + N. 0,4238 7,3133+ N. 0,4497

14,7768+ N. 0,4750 74,1219+ N. 0,4950

QX

0,7565"+ N. 0,1487 1,1806+ N. 0,2180 1,5820+ N. 0,2674 2,C040 + N. 0,3059 2,5033+ N. (),3385 3,1641 + N. 0,3691 4,1026 + N. 0,3971 5,6153+ N. 0.4238 8,5731 + N. 0.4497

17,3224+ N. (),4750 86,8909+ N. 0,4950

P,

0,01 0 , ~ 0,10 0,15 0,20 0 , ~ 0,50 0,35 0 , ~ 0,45 0,49

-- 0,7519+N. 0,1487 - ],1735+N. 0,2180 -- 1,5726+N. 0,2674 - 1,9920+N. 0,3059

- 2,4883+N. 0,3385 - 3,1451+N. 0,3691 - 4,0780+N. 0,3971

- 5,5817+N. 0,4238 - 8,5217+N. 0,4497 -17,2186+N. 0,4750 -86,3701 + N. 0,4950

- 0,7565+N. 0,1487 - 1,1806+N. 0,2180 -- 1,5820+N. 0,2674 - 2,0040+N. 0,3059 - 2,5033+N. 0,3385 -- 3,I641+N. 0,3891 -- 4,1026+N: 0,3971 -- 5,6153+N. 0,4238 - 8,5731+N. 0,4407 -17,3223+ N. 0,4750 -86,8909 + N. 0,4950

Page 52: Tests no parametricos en forma secuencial

9 ~ JOSE IZOMANI

TaBf.,~ NO.m 1 (Contin,,aci6n)

a = 0,03 fl=0,01

]Jl (iN rN

0,91 0,05 0,10 0,15 0,20 0,25 0,30 0,35 0,40 0,45 (),49

0,9956 + N. 0,1487 1,5537 + N. 0,2180 2,C~320+ N. 0.,2674 2,6373+ N. 0,3059 3,2945+ N. 9,3:385 4,1641 + N . 0,3691 5,39~o2+ N. 0,3071 7,3900+ N. 0,4238

11,2826 + N. 0,4497 22,797l + N. 0,4750

114,3525+ N. 0,4950

-- 0,7609+N. 0,1487 - 1,1875+N. 0,2180 - 1,5913+N. 0,2674 - 270157 + N. 0,3059 - 2,5180+N. 0,3385 - 3,1827+N. 0,3691 -- 4,1267+N. 0,3971 - 5,6483+N. 0,4238 -- S,6234 + N. 0,4497 - 17,42ll + N. 0,4750 - 8 7 , 1010+ N. 0,4950

a=O,Ol fl=O,05

p~ ax r~

0,6497 + N. 0,1487 1,0140+ N. 0,2180 1,3,588 + N. 0,2674 1,7212+ N. 0,3059 2,150l + N. 0,3385 2,7177 + N. 0,3691 3,5238 + N. 0,3971 4,8231 + N. 0,4238 7,3636 + N. 0;4497

14,8785+ N. 0,4750 74,6321 + N. 0,4950

0,0l 0,05 0,10 0,15 0,20 0,25 0,30 0,35 0,40 0,45 0,49

- - 0 ,99 [0+N. 0,1487 - - 1,5466+N. 0,2180 -- 2,0756+N. 0,2674 - 9,6253+N. 0,3059 - 3,2795+N. 0,3385 - 4,1451+ N. 0,3691 - 5,37,16+N. 0,3971 - 7,3564 + N. 0,42.'38 - 11,2312 + N. 0,4497 - 22,6933+ N. 0,4750 -113,8317 + N. 0,4950

a=0,01 a=0 ,03

])1 aN r~

0,01 0,06 0,10 0,15 0,20 0,25 0,30 0,35 0,40 0 , 4 5

0,49

0,7609 + N. 0,1487 1,1875+ N. 0,2180 1,5913+ N. 0,2674 2,0157+ N. 0,3059 2,5180+ N. 0,338.5 3,1827 + N. 0,3691 4,1267 + N. 0,3971 5,8463 + N. 0,4238 8,6234+ N. 0,4497

17,4241 + N. 0,4750 87,4010+ N. 0,49.50

- - 0,9956+N. 0,1487 -- 1,5537+N. 0,2180 - 2.0820+N. 0,2674 - - 2.6373+ N. 0,3059 -- 3,2945+N. 0,3385. -- 4,16414N. 0,3691 - - 5,3992+N. 0,3971 -- 7,30C0+N. 0,4238 -- 11,2826+ N. 0,4497 - 22,7971+N. 0,4750 - 114,35-o,5 + N. 0,4950.

Page 53: Tests no parametricos en forma secuencial

TESTS NO PARAMETRICOS EN FORMA SECLrENCIAL 95

"I-ABLA N~M. I (ContinuaciSn)

a=0,01 t~=O,Ol

0,01 0,05 0,19 0,15 0,20 0,25 0,30 0,35 0,40 0,45 0,49

1,00(JO+ N. 0,1487 1,5606+ N. 0,2180 2,0913+ N. 0,2274 2~6491 + N. 0,3059 3,3092+ N. 0,3385 4,1827 + N. 0.3691 5,4233+ N. 0,3971 7,42:30+ N. 0,4238

11,33;~0+ N. 0,4497 22,8988+ N. 0,4750

114,8626+ N. 0,49-)0

- 1,0Or 0,1487 - 1,5606+N. 0,g180 - 2,09i3+N. 0,2674

- - 2,6491 + N. 0,3059 - 3,3092+N. 0,3385

- - 4,1827 + N'. 0,3691 -- 5 , 4~3+ N. 0,3971 - 7,4230+N. 0,4238 - 11,33.30+N. 0,4497 - 22,8988+N. 0,4750 -114,8626+ N. 0,4950

TABLA I[,--Valo-res de E(NIS:} para H a y H~, e~ funciSn de PL a y fl Hipdtesis H o cierta

(~=0,05 a=0,05 q=0,05 a=0,03 a=0,03 a=O,O5 am0,01 a=0,01 '7..=0,01 P' ~=o,o5 ~=o,o3 ~=o,ol !3=o,o5 ~=o,os ~=o,oi ~=o,o5 ~=o,o3 3=o,ot

0,01 0,05 0,10 0,15 0,20 0,95 0,30 0,35 0,40 0,45 0,49

1,64 1,94 2;59 1,72 2,02 2,68 1,80 2,12 2,78 3,19 3,77 5,03 3,34 3,94 5,22 3,50 5,03 5,42 5,19 6,14 8,18 5,43 6,40 8,48 5,70 6,68 8,82 7,87 0,31 12,41 8,24 9,71 12,87 8,64 10,15 i3,37

11,88 14,05 18,72 12,43 14,64 19,42 13,04 15,31 20,2"2 18,43 21,80 29,05 19,28 22,72 30,13 2.0,24 23,75 31,52 30,41 35,96 47,93 31,81 37,49 49,02 33,39 38,68 51,67 57,12 67,55 90,02 59,76 70,43 93,38 62.72 73,62 97,65

130,05 15,3,81 204,97 136,06 160,35 212,61 142,81 167,62 220,98 535,30 628,47 843,72 560,05 6G6,05 875,16 587,86 689,95 909,63 11.509 13.612 18.140 12.041 14.101 18.816 12.639 14.834 ].9.557

Hip6tesis H~ cierta

q.=O~05 rZ=0~05 a=0,05 (A=0,03 r~ =0,03 r z =0 ,O3 rZ=n .01 O:=h ,Ol a=O,O[ P~ ~=o.o5 ~=o,oa ~=o,~t 1=o,o5 ~=o,o3 ~=o,ot ~=o,o5 ~=o.o~ ~=o.o,

0,01 0,05 0,10 0,15 0,20 0,25 0,30 0,35 0,40 0,45 0,49

4,16 4,35 4,57 4,92 5,13 5,36 6,56 6,80 7,07 5,36 5,61 5,88 6,34 6,61 B,91 8,44 8,76 9,10 7,29 7,54 7,91 8,52 8,88 9,28 ]1,35 11,77 12,24 9,80 10,26 10,77 11,59 12,09 12.64 15',45 16,03 16,66

13,75 14,39 15,10 16,26 16,95 17,72 21,67 22;48 23,37 20,26 21,20 22,25 23,96 24,98 26,12 31,94 33,36 34,43 32,24 33,73 35,37 38,13 39,75 41,55 50,81 52,70 54,78 57,55 60,20 r 68,06 70,95 74,17 .90170 94,08 97,78

132,28 138,40 145,28 156,46 163.11 170,51 208,51 216.28 '224,79 584,05 597,38 601,85 648,I9 675.76 706.38 863,81 896,00 931,28 12.975 13.729 14.249 15.346 15.999 16.723 20.450 .'2'1.2'13 22.048

Page 54: Tests no parametricos en forma secuencial

S U M M A R Y

This paper is concerned with tests of distribution free methods in sequential form. One of the most outstanding features of this methods is the broad field of .application, we don't need almost any assumption about the distribution function of the random variable that we study. Unfortunately this distribution Dee me~ thods need a. large sample size to get the neccessary accuracy, so the usefulness of sequential methods that hare great savings in average sample size. The distri- bution free test in sequential form has two very important proprieties, broad field of application and a small average sample size.

In the first chapter the author give a test S~ for the median of any distribu- tion, that, in the case of normal distribution has one relative efficiency of 60 % againts Wald sequential test, and about. 120 % against current most powerful test. So we can use this test S instead of the most powerful test with advantage in sample size and in numerical calculus, because the test S is very simple.

In the second chapter, the previous tests S is adapted to , two sample problem, , in first t ime with al ternative hypothesis of differences in loc~,tion, and then ge- neralized to any alternative. With normal distribution and alternative hypothesis of differences in location the test presented by the author is most powerful and smaller in sample size than other usual tests, Wi l coxon Wald and Wolfowitz, Epstein, Tsao.

tn the chapter three the author study the tests of randomness in a similar way.