6 553 151 4

14
ESTADÍSTICA ESPAÑOLA Vol. 44, Núm. 151, 2002, págs. 351 a 364 Estimador de máxima verosimilitud para la media poblacional cuando el diseño muestral asigna probabilidades de selección proporcionales al tamaño de la unidad por JESÚS BESCOS SINDE Universidad de Castilla-La Mancha RESUMEN Este artículo muestra que es posible obtener un estimador de má- xima verosimilitud (EMV) para la media poblacional de una población finita, condicionado a un diseño muestral particular, usual en la prácti- ca muestral. Tal diseño consiste en asignar a cada unidad poblacional una probabilidad de selección proporcional a su tamaño (en términos de la característica bajo estudio o alguna variable correlacionada). El estimador obtenido es la media armónica muestral, del que se estu- dian su sesgo y varianza. La idea básica subyacente al artículo es que la función paramétri- ca de verosimilitud puede depender de cómo se observan los datos. Hacemos uso de este hecho para derivar el estimador propuesto. Para finalizar, caracterizamos cierta situación donde el diseño muestral (el modo cómo se observan los datos) es irrelevante para función de verosimilitud eventual.

Upload: leandro-castro

Post on 06-Apr-2016

225 views

Category:

Documents


4 download

DESCRIPTION

 

TRANSCRIPT

Page 1: 6 553 151 4

ESTADÍSTICA ESPAÑOLAVol. 44, Núm. 151, 2002, págs. 351 a 364

Estimador de máxima verosimilitudpara la media poblacional cuando el

diseño muestral asigna probabilidadesde selección proporcionales al tamaño

de la unidad

porJESÚS BESCOS SINDE

Universidad de Castilla-La Mancha

RESUMEN

Este artículo muestra que es posible obtener un estimador de má-xima verosimilitud (EMV) para la media poblacional de una poblaciónfinita, condicionado a un diseño muestral particular, usual en la prácti-ca muestral. Tal diseño consiste en asignar a cada unidad poblacionaluna probabilidad de selección proporcional a su tamaño (en términosde la característica bajo estudio o alguna variable correlacionada). Elestimador obtenido es la media armónica muestral, del que se estu-dian su sesgo y varianza.

La idea básica subyacente al artículo es que la función paramétri-ca de verosimilitud puede depender de cómo se observan los datos.Hacemos uso de este hecho para derivar el estimador propuesto.

Para finalizar, caracterizamos cierta situación donde el diseñomuestral (el modo cómo se observan los datos) es irrelevante parafunción de verosimilitud eventual.

Page 2: 6 553 151 4

352 ESTADÍSTICA ESPAÑOLA

Palabras clave: Verosimilitud y diseño muestral/Estimadores de má-xima verosimilitud.

Clasificación AMS: 62D05 Sampling Theory, Sample Surveys.

1. INTRODUCCIÓN

Este artículo está estructurado como sigue:

1. Es usual en la Teoría del muestreo en poblaciones finitas referir la notación alas unidades elementales que componen la población. En lugar de centrarnos enlas unidades elementales, preferimos trabajar con la distribución de frecuenciaspoblacional. La notación necesaria a tal fin se desarrolla en la primera parte de esteartículo.

2. Supongamos que estamos estudiando la composición demográfica de los ho-gares de una determinada región geográfica. Supongamos además que dispone-mos de esta información referida a un censo realizado en un momento anterior. Esposible hacer uso de esta información complementaria a la hora de realizar eldiseño muestral, para asignar probabilidades de selección a las unidades poblacio-nales, de modo que obtengamos ganancias de precisión en las estimacionesrealizadas. La segunda parte del artículo analiza un diseño particular, empleado enla práctica, que permite obtener un estimador concreto por máxima verosimilitudpara la media poblacional.

3. La tercera parte presenta una simulación con el fin de ilustrar los resultadosteóricos alcanzados en la segunda parte.

4. El cuarto apartado desarrolla el caso donde las probabilidades de selecciónse asignan a través de una variable diferente a la estudiada. Como se razonarámás adelante, resulta ser el caso de mayor interés práctico.

5. El último apartado recoge las conclusiones principales.

2. PRELIMINARES

Es común en la Teoría del Muestreo en Poblaciones Finitas trabajar con las uni-dades individuales que conforman la población, habitualmente denotadas Ui.

Así, es usual representar la población a través de un vector de N (tamaño po-blacional) unidades elementales (U1, U2, U3,......... Ui,......... UN) en cada una de lascuales la característica estudiada, X, toma valores (X1, X2, X3,......... Xi......... XN),donde el superíndice denota la unidad i.

Page 3: 6 553 151 4

ESTIMADOR DE MÁXIMA VEROSIMILITUD PARA LA MEDIA POBLACIONAL CUANDO EL DISEÑO MUESTRAL ASIGNA… 353

La variable X toma ‘k’ valores, donde k<=N, pues no puede haber más valoresque unidades individuales. Sea Xh el valor h de la variable X cuya frecuencia relati-va poblacional es fh.

Sea ( )

≠=

=h

i

h

i

iX

XXsi0

XXsi1UI

h

Es obvio que ( )i

N

1i

XhUI

N

1f

h∑=

=

Por lo tanto, la distribución poblacional de frecuencias de la variable X se repre-sentará mediante un vector (X1 , X2 ,....Xh ,.....Xk) con sus correspondientes frecuen-cias (f1 , f2,....fh ,....fk).

A continuación mostramos como el muestreo probabilístico, i.e. la selecciónaleatoria de unidades Ui, mediante la asignación a priori a cada unidad de unadeterminada probabilidad de selección, denotada Pi, induce una estructura defrecuencias aparente sobre los valores de X, que no coincide necesariamente conla distribución poblacional de sus frecuencias (fh) .

Restringimos el análisis al muestreo aleatorio simple con reposición en sus dosmodalidades: probabilidades de selección iguales y desiguales.

Una vez que las probabilidades de selección, Pi, han sido asignadas, la probabi-lidad de observar el valor Xh en la muestra -probabilidad que denominamos fre-cuencia aparente de Xh y denotamos P(Observar Xh)-, se obtiene aplicando elteorema de la probabilidad total:

[ ]SU/XXP*P)XObservar(Pih

i

N

1i

ih∈== ∑

=

donde el condicionamiento se refiere a haber seleccionado la unidad Ui. Obsér-vese que el suceso ‘Observar Xh’ significa ‘seleccionar Xh’ (valor h-ésimo de lavariable X) que, conviene recordar, no es lo mismo que ‘seleccionar Xi ‘ (valor de Xasociado a la unidad i-ésima) resulta inmediato que:

[ ] ( )iXih

iUISU/XXP

h

=∈=

puesto que la unidad Ui presenta (o no ) el valor Xh con probabilidad condicionada0 o 1. Luego:

Page 4: 6 553 151 4

354 ESTADÍSTICA ESPAÑOLA

( ) [ ] ( )iX

N

1i

iih

i

N

1i

ih���������������� �� �

h∑∑==

=∈== (1)

Si las probabilidades de selección son iguales N

1Pi

= , entonces:

( ) ( )hiX

N

1i

h����

����� �� �

h

== ∑=

es decir, en el caso de probabilidades de selección iguales, las frecuencias apa-rentes coinciden con las frecuencias poblacionales. Cada una de las sucesivasselecciones de la muestra tiene una estructura probabilística idéntica a la estructurade frecuencias de la población.

Si se emplean probabilidades desiguales de selección (Pi ) las frecuencias apa-rentes no coinciden con las frecuencias poblacionales. Es como si se trabajasesobre una población subyacente ‘diferente’.

3. ESTIMADOR DE MÁXIMA VEROSIMILITUD PARA LA MEDIA POBLACIO-NAL

Un caso interesante surge cuando se emplean probabilidades de selección demodo que

X

XP

i

i= (1b)

siendo X el total poblacional de Xi.

Obsérvese que este es el esquema ideal de probabilidades de selección paraestimar la media poblacional a través del estimador lineal insesgado propuesto por

Hansen y Hurwitz(1943), cuya expresión es NPn

Xn

1i i

i

HH ∑=

∧=θ

Combinando (1) y (1b) obtenemos :

Page 5: 6 553 151 4

ESTIMADOR DE MÁXIMA VEROSIMILITUD PARA LA MEDIA POBLACIONAL CUANDO EL DISEÑO MUESTRAL ASIGNA… 355

( ) ( ) ( )

( ) ( )1h1h1

h

i

i

iX

N

1i

i

iX

N

1i

ih

�����

��

����

��������� �� �

hh

==

−==

=

==

∑∑ (2)

donde F1(Xh) es la proporción acumulada de la característica X hasta el valor Xh. Enotras palabras, bajo este esquema de muestreo, la frecuencia aparente de Xh sepuede obtener empleando la función de acumulación F1(X), como la función dedistribución de las probabilidades de selección

Puesto que el tamaño poblacional es N, se puede expresar el total poblacional,X, como N veces la media poblacional -denotada θ- y, puesto que Nfh es el númerode unidades poblacionales que presentan el valor Xh, es posible expresar la fre-cuencia aparente como:

( )θ

==

=

∑hhhhh

i

i

h

Xf

N

XNf

X

XX

X

XObservarP (3)

Esta expresión, al relacionar el parámetro θ con las probabilidades de observarlos distintos valores Xh, permite obtener un estimador mediante el método demáxima verosimilitud para θ -l a media poblacional- como sigue:

Se puede imaginar el proceso de muestreo como una selección aleatoria repeti-da sobre una población multinomial con modalidades X1.....Xk y probabilidades deselección dadas por las frecuencias aparentes Xhfh/θ . La expresión general de lafunción de soporte (logaritmo de la función de verosimilitud) será:

( ) [ ]∑=

θ=θK

1h

hh)(plnnS

Aquí nh es la frecuencia absoluta muestral y, ph(θ) la probabilidad -que hemosidentificado con las frecuencias aparentes- de cada modalidad, previamente deno-tada P(Observar Xh) .

Como es sabido, dada la muestra, el estimador de máxima verosimilitud para

ph(θ) es n

n)(p h

h=θ

∧, siendo n el tamaño muestral. Una vez realizada la selección,

Xh es fijo y entonces

Page 6: 6 553 151 4

356 ESTADÍSTICA ESPAÑOLA

∧∧∧

θ=

θ=θ h

h

hh

h

fX

fX)(p

de modo que

∑∑∑

=

==∧

∧∧

=θ⇒=θ

=

θ

=

=

θ⇒=

θ

k

1h

h

h

k

1h h

h

k

1h

h

h

h

h

hhhh

h

nX

1

n

Xn

n1f

1fnrestriccioladadapero,

Xn

nf

n

nfX

(4)

Hemos obtenido el estimador para la media poblacional, θ, cuando el esquemamuestral emplea probabilidades de selección proporcionales al tamaño de cadaunidad (en términos de la característica bajo estudio). Queremos destacar que elestimador es la media armónica muestral, y no contiene las probabilidades deselección.

Hemos alcanzado el resultado anterior, estableciendo las probabilidades de se-lección según (1b). No obstante, el estimador propuesto puede ser útil incluso en elcaso de desconocer el total poblacional, como fue sugerido por un evaluadoranónimo en una versión previa de este artículo. Consideremos, por ejemplo, elmuestreo sobre una región agrícola para determinar la superficie media de cultivode las fincas. Si el muestreo es espacialmente uniforme, las probabilidades deselección resultan proporcionales al tamaño de las unidades.

A fin de evaluar el sesgo y la varianza en el muestreo del estimador, comence-mos por evaluar estas características referidas al inverso del estimador. Esto es:

∑=

∧==θ

k

1h

h

h

nX

1

n

1Sy

S

1

En primer lugar

θ=

θ=

θ===

=

∑∑∑∑∑

=====

∧ 1fn

n

1fXn

X

1

n

1pn

X

1

n

1)n(E

X

1

n

1n

X

1

n

1ESE

k

1h

h

k

1h

hf

h

k

1h

h

h

k

1h

h

h

k

1h

h

h

(5)

Page 7: 6 553 151 4

ESTIMADOR DE MÁXIMA VEROSIMILITUD PARA LA MEDIA POBLACIONAL CUANDO EL DISEÑO MUESTRAL ASIGNA… 357

La varianza se obtiene empleando las propiedades de la distribución multino-mial:

∑∑

∑ ∑∑

≠=

= ≠=

−+−

=+=

=

k

lh

lh

lh

2

k

1h

hh2

h

2

k

1h

k

lh

lh

lh

2h2

h

2

k

1h

h

h

)ppn(XX

1

n

1)p1(np

X

1

n

1

)n,n(CovXX

1

n

1)n(V

X

1

n

1n

X

1

n

1VV �

utilizando (3) y agrupando convenientemente, se llega a:

θ−

θ=

∧ 1

H

1

n

1V � (6)

donde H es la media armónica poblacional de la característica X.

Expandiendo 1 S∧

en serie de Taylor hasta orden 2 alrededor de 1/θ

R1

S1

S

S

12

32 +

θ−θ+

θ−θ−θ==θ

∧∧

∧ (7)

Despreciando los términos contenidos en R, tomando esperanzas en (7), com-binadas con los resultados (5) y (6)

θ−θ+θ=

θ+θ≈=

θ

θ−θ+

θ−θ−θ≈=

θ

∧∧

1

H

1

nSV)

S

1(EE

1SE

1SE)

S

1(EE

2

3

2

32

(8)

Lo que prueba que el estimador MV es insesgado para muestras de gran tama-ño, pues el sesgo asintótico es nulo

01

H

1

nlim

2

n=

θ−θ

∞→

La varianza en el muestreo del estimador se puede obtener empleando de nue-vo la expansión en serie de Taylor (7), esta vez hasta primer orden, para llegar a:

Page 8: 6 553 151 4

358 ESTADÍSTICA ESPAÑOLA

2

4

2

2

2

1S

1S

'R1

S

S

1

θ−θ≈

θ−θ

θ−θ≈θ−θ

+

θ−θ−θ==θ

∧∧

∧∧

Tomando esperanzas y considerando un tamaño muestral suficientementegrande para despreciar el sesgo -en caso contrario el resultado siguiente se referi-ría el Error Cuadrático medio del estimador- obtenemos:

−θθ=

θ−θ=

θ−

θθ=θ≈θ

∧∧1

Hn

1

H

1

n

1

H

1

n

1)S(V)(V

23

44 (9)

La varianza del estimador depende de la proporción en que θ excede a H.

Puesto que θ∧

es asintóticamente insesgado y su varianza converge a 0 a medi-da que n aumenta, θ es consistente en probabilidad.

El error de muestreo -la desviación típica del estimador- será menor que el co-rrespondiente al del estimador en el muestreo aleatorio simple con probabilidadesde selección iguales, siempre que1:

n1

Hn

σ≤

−θθ

donde σ es la desviación típica poblacional de X. Reordenando la expresión ante-rior:

H))CV(1()CV(1H

1H

2

x

2

x+≤θ⇒≤

−θ⇒

θσ≤

−θ

(10)

i.e. el estimador propuesto para θ, mejora a su homólogo con probabilidades deselección iguales, cuando la distancia entre la media poblacional y la media armó-nica poblacional, no exceda cierta magnitud, que puede expresarse en términos de

1 Recuérdese que el estimador para la media poblacional en el caso de probabilida-des iguales de selección es la media muestral, cuya varianza en el muestreo es σ2/n,donde σ2 es la varianza poblacional de X.

Page 9: 6 553 151 4

ESTIMADOR DE MÁXIMA VEROSIMILITUD PARA LA MEDIA POBLACIONAL CUANDO EL DISEÑO MUESTRAL ASIGNA… 359

la variabilidad relativa de la característica X a través de su coeficiente de variación(CV) .

4. UN CASO SIMULADO.

A fin de ejemplificar los resultados teóricos alcanzados en la sección anterior,realizamos ahora una simulación sencilla comparando el Error Cuadrático Medio delos dos procedimientos de estimación de la media poblacional: probabilidadesiguales de selección y probabilidades de selección dadas por (1.b).

Sea X la característica bajo estudio con valores {10,20,30,40,50,200} y frecuen-cias poblacionales {10/62,20/62,15/62,10/62,5/62,10/62,2/62}.(Nótese que setrabaja directamente con la distribución de frecuencias poblacional de X y no conlas unidades individuales)

Resulta fácil comprobar que

0488,3322,1092

8695,21H0645,33

2 =σ=σ

==θ (11)

Esto es, se satisface la condición (10) de modo que el esquema de muestreocon probabilidades de selección dadas por (1.b) debe mejorar a su análogo conprobabilidades iguales de selección.

Para cada tamaño muestral (n) entre 2 y 65 se generaron 60 vectores aleatorios(n números reales del intervalo [0,1]) que se compararon: en primer lugar con la

función de distribución {F1 , F2, ..Fj.. Fk-1,1} - donde F fj ii

j

==∑

1

- lo que permite

obtener la muestra aleatoria con probabilidades iguales de selección y, en segundolugar, con la distribución acumulada de probabilidades {p1, p1+p2,........1} -pi defini-da en (3)- de forma que se obtiene la muestra con probabilidades de seleccióndadas por (1b).

La simulación confirma los resultados alcanzados por consideraciones teóricas,el EMV de θ mejora a su homólogo con probabilidades iguales, siendo alrededor de2 veces más eficiente en términos de su Error Cuadrático Medio (que equivale a lavarianza en muestra suficientemente grandes que permitan despreciar el sesgo).Esta medida de la eficiencia relativa podría haberse anticipado considerando elcociente de las varianzas de los estimadores ( )[ ] 22

1H σ−θθ particularizado a los

datos (11).

Los resultados de la simulación se resumen en la tabla siguiente. Las columnas2ª y 3ª muestran, respectivamente el Error Cuadrático Medio del Estimador en loscasos A: Probabilidades de selección dadas por (1.b), y B: Probabilidades de

Page 10: 6 553 151 4

360 ESTADÍSTICA ESPAÑOLA

selección iguales. El Error Cuadrático Medio y es Sesgo se adjetivan “empíricos”porque se determinaron a partir de la distribución en el muestreo del estimador en60 muestras independientes para cada tamaño muestral considerado. La 4ª colum-na se obtiene como cociente de los errores cuadráticos medios.

Las dos últimas columnas recogen el sesgo correspondiente a ambos procedi-mientos de estimación. Es evidente que en el caso A el sesgo converge a 0 amedida que aumenta el tamaño muestral.

Tamañomuestra

ECM 60

empírico muestras

Eficiencia Sesgo empírico 60 muestras

A. Pi (1b) B. Pi iguales (A/B)*100 C. Pi (1b) D. Pi Iguales

2 403,94 669,30 60,35% 7,58 1,693 289,40 274,26 105,52% 5,81 -1,734 155,16 147,71 105,04% 3,49 -2,945 276,44 171,56 161,13% 3,33 -2,966 167,68 109,08 153,73% 2,69 -1,457 119,49 110,78 107,86% 2,59 -1,858 153,99 253,85 60,66% 4,72 3,419 148,17 119,98 123,50% 2,33 -1,06

10 62,70 107,89 58,12% 0,37 -1,5611 80,40 118,75 67,70% 1,71 0,2112 50,50 70,23 71,91% 1,18 -0,2213 44,84 63,46 70,66% 1,38 -0,8514 63,07 101,78 61,97% 1,54 0,9415 59,97 66,61 90,03% 1,70 0,4520 27,88 51,15 54,51% 0,50 -1,0625 24,18 43,90 55,07% -0,14 -0,4035 21,77 28,17 77,28% 0,55 -0,1045 15,82 27,13 58,33% 0,18 0,0455 8,18 16,81 48,68% 0,42 0,3465 7,07 14,93 47,38% -0,28 -0,30

5. ASIGNADO PROBABILIDADES DE SELECCIÓN A TRAVÉS DE UNA TER-CERA VARIABLE

Antes de finalizar, debemos estudiar el efecto del esquema de muestreo (1b)cuando estamos interesados en estimar la media poblacional de otra característica,digamos Y. Tal será el caso de mayor interés práctico, pues podemos hacer uso dela información suplementaria disponible sobre X para mejorar nuestras estimacio-nes sobre Y.

Page 11: 6 553 151 4

ESTIMADOR DE MÁXIMA VEROSIMILITUD PARA LA MEDIA POBLACIONAL CUANDO EL DISEÑO MUESTRAL ASIGNA… 361

La característica Y tendrá una distribución de frecuencias sobre la población to-mando valores (Y1 , Y2 ,....Yj ,.....,Ym) con frecuencias respectivas (fy1 , fy2,....fyj

,...,,.fym) -el subíndice y se emplea para evitar la confusión con las frecuencias deX, denotadas fh. Puesto que no hay razón para que las características X e Y debanpresentar el mismo número de modalidades, suponemos k#m.

Con probabilidades de selección dadas por (1b), la probabilidad de observar Yj

(su frecuencia aparente) será:

( ) ( ) ( )�

��

��

����

��������� �� �

jji

i

iY

N

1i

i

iY

N

1i

ij jj=

====

∑∑∑==

Donde X.j es el total poblacional de X condicionado a Yj, i.e.: total de X en ma-nos de las unidades que presentan la modalidad Yj. Considerando que el númerode unidades poblacionales que presentan Yj es Nfyj , y denotando por x j. la corres-pondiente media condicionada, podemos escribir:

( )θ

=�

�������� �� �

jyj

j (12)

Supongamos ahora que ambas variables (X e Y) están relacionadas de modoque el lugar geométrico de las medias condicionadas de X a los distintos valores deY es lineal. Es decir la curva de regresión x/y is jj bYa.x += . Consecuentemente

yx ba θ+=θ , donde la letra θ denota la media poblacional y el subíndice se refierea la característica en cuestión (X o Y). Sustituyendo convenientemente

( )����

������

�������� �� �

y

jjy

x

jjy

j θ+

+=

θ=

Si a=0 es obvio que:

( )y

jyj

y

jyjj

Yf

Nb

bYNfY.ObsP

θ=

θ=

La anterior expresión, referida a Yj es análoga a (3) - referida a Xh - y hemosconcluido que el EMV de θy es homólogo al obtenido para θx en (4). Por supuesto,las expresiones para el sesgo y la varianza en el muestreo del estimador de θy son

Page 12: 6 553 151 4

362 ESTADÍSTICA ESPAÑOLA

análogas a las del estimador de θx - (8) y (9) - realizando las sustituciones perti-nentes.

El estimador obtenido para la media ( o total ) poblacional de cualquier caracte-rística Y, puede emplearse siempre que dispongamos de información acerca deuna variable linealmente correlacionada (con a=0), que nos capacite para definir lasprobabilidades de selección Pi del modo (1b)

6. CONCLUSIONES

La función de verosimilitud paramétrica es una relación funcional que liga ciertosparámetros con las observaciones realizadas a través de la estructura de probabili-dades que las genera. Este artículo presenta un ejemplo de cómo esta idea básicapuede aplicarse para la obtención de una estimador MV en una situación particular:la estimación de la media poblacional cuando se dispone de información suple-mentaria que nos capacita para establecer las probabilidades de selección como(1b)

Al mismo tiempo, los resultados de la sección 3 nos permiten una comprensiónmejor de la irrelevancia (o no ) del diseño muestral sobre la función de verosimilitud.La expresión (12)

( )θ

=�

�������� �� �

jyj

j

se puede reescribir, en el caso de que X e Y sean estadísticamente independientes-las medias condicionadas de X a los diferentes valores de Y serían iguales a lamedia poblacional θx - como

( ) yjj ����� �� � =

Bajo el diseño muestral (1b) e independencia estadística entre X e Y, las fre-cuencias aparentes de los valores de Y son iguales a sus frecuencias poblaciona-les. Por tanto, si pudiésemos especificar una relación paramétrica ligando Yj con fyj ,el diseño muestral (1b) sería irrelevante para la verosimilitud de los parámetroscontenidos eventualmente en tal especificación.

Page 13: 6 553 151 4

ESTIMADOR DE MÁXIMA VEROSIMILITUD PARA LA MEDIA POBLACIONAL CUANDO EL DISEÑO MUESTRAL ASIGNA… 363

REFERENCIAS

BASU, D. (1969) «Role of the sufficiency and likelihood principles in sample surveytheory» Sankhya, Serie A, Vol 31

EDWARDS, A. (1972) «Likelihood» Cambridge University Press.

HANSEN, M. & HURWITZ, W, (1943) «On the theory of sampling from finite population».Ann. Math. Star Vol 14.

HANSEN, M., HURWITZ, W AND MADOW W.(1956) «Sample survey Methods andTheory» John Wiley.

ROYALL R.M. (1997) «Statistical Evidence» Chapman & Hall

STUART, A. (1962) «Basic Ideas of Scientific Sampling» Griffin’s statistical mono-graphs & courses.2

Page 14: 6 553 151 4

364 ESTADÍSTICA ESPAÑOLA

MAXIMUM LIKELIHOOD ESTIMATOR FOR POPULATION MEANWHEN SAMPLE DESIGN ASSIGNS SELECTION PROBABILITIES

PROPORTIONAL TO UNIT SIZE

SUMMARY

This paper shows that is possible to obtain a maximum likelihoodestimator (MLE) for the population mean of finite population condi-tioned to a particular sampling design commonly used in samplingpractice. Sampling design which assigns to each population unit a se-lection probability proportional to unit’s size (in terms of the character-istic under study or some correlated variable). This estimator is thesample harmonic mean. Estimator’s sampling bias and variance arediscussed.

The basic idea underlying this paper is that parametric likelihoodfunction may depend on the way we observe the data. We make useof this fact to derive the estimator here proposed.

At the end, we characterise certain situation where sampling de-sign (the way we observe the data) is irrelevant to the eventual likeli-hood function.

Keywords: Likelihood and sampling design/Maximum likelihood esti-mators.

AMS Classification: 62D05 Sampling Theory, Sample Surveys.