asimetría simetría · salud de su poseedor, sino también de que es portador de genes deseables...

41
Notas de Estadística Mag. Liliana Ghersi 156 UNIDAD Nº6 DISTRIBUCIONES DE CARACTERÍSTICAS MUESTRALES “La belleza de los genes:...Según Thornhill, citado por The Economist, hasta un milímetro o dos de asimetría en las proporciones corporales tienen su importancia en el balance final. El investigador y sus colegas sostienen que la simetría nos hace atractivos porque se relaciona íntimamente con la habilidad de los genes de ciertos individuos de rechazar agresiones durante el desarrollo de su embrión. Eso sería un indicador no sólo de la buena salud de su poseedor, sino también de que es portador de genes deseables para transmitir a nuestros hijos” Revista La Nación 28/9/97. “Salta: Un niño fue gestado en la cavidad abdominal de su madre, en un raro caso de embarazo extrauterino que pudo llegar hasta el parto y que algunos consideraron “casi un milagro”...”Nadie pensó que había algo fuera de lo común hasta que el 17 de marzo llegó a la clínica para efectuarse una ecografía; y se constató que el feto estaba en la cavidad abdominal, entre los intestinos, el hepiplón y las vías urinarias. El embarazo continuó y el martes 24 se realizó la cesárea, una operación de alto riesgo, ya que hubo que extraer al niño del abdomen y de inmediato retirar la placenta que estaba en la cavidad. La intervención demandó dos horas.....Una consulta por Internet realizada desde la clínica reveló que sólo hay cinco casos similares en todo el mundo....Este matrimonio humilde que deseaba ardientemente un hijo se convirtió en protagonista de un caso que seguramente despertará interés científico. La Nación 26/3/98. Se demostró también que el estrés es un factor de riesgo importante aún cuando se tuvo en cuenta el vicio de fumar, la falta de ejercicio físico y la mala alimentación entre otros. En los estudios.... sometieron a 276 voluntarios sanos de 18 a 55 años a exámenes psicológicos antes de ponerlos en cuarentena y depositar virus del resfrío en sus fosas nasales. Durante los cinco día siguientes los voluntarios -a cada uno se le pagó 800 dólares- fueron revisados para establecer quién presentaba evidentes síntomas de resfrío” La Nación 19/5/98. “Ficha Técnica: La encuesta de Gallup fue realizada entre 2426 votantes de la capital, 25 partidos del Gran Buenos Aires, y el resto de esa provincia; Córdoba y Santa Fe -que suman 32 localidades del área bajo estudio- mediante entrevista personales y domiciliarias que se efectuaron entre el 18 y el 22 del actual. Se utilizó un método muestral probabilístico polietápico y estratificado, tomando en cuenta sexo y edad en el hogar. Se estima en el 2,7% el margen de error en los totales de toda la muestra” La Nación 28/3/99 DISEÑOS DE MUESTREOS PROBABILÍSTICOS: MUESTREO ALEATORIO SIMPLE:

Upload: others

Post on 18-Mar-2020

3 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: asimetría simetría · salud de su poseedor, sino también de que es portador de genes deseables para transmitir a nuestros hijos” Revista La Nación 28/9/97. “Salta: Un niño

Notas de Estadística

Mag. Liliana Ghersi

156

UNIDAD Nº6

DISTRIBUCIONES DE CARACTERÍSTICAS MUESTRALES

“La belleza de los genes:...Según Thornhill, citado por The Economist, hasta un milímetro o

dos de asimetría en las proporciones corporales tienen su importancia en el balance final.

El investigador y sus colegas sostienen que la simetría nos hace atractivos porque se

relaciona íntimamente con la habilidad de los genes de ciertos individuos de rechazar

agresiones durante el desarrollo de su embrión. Eso sería un indicador no sólo de la buena

salud de su poseedor, sino también de que es portador de genes deseables para transmitir a

nuestros hijos” Revista La Nación 28/9/97.

“Salta: Un niño fue gestado en la cavidad abdominal de su madre, en un raro caso de

embarazo extrauterino que pudo llegar hasta el parto y que algunos consideraron “casi un

milagro”...”Nadie pensó que había algo fuera de lo común hasta que el 17 de marzo llegó a

la clínica para efectuarse una ecografía; y se constató que el feto estaba en la cavidad

abdominal, entre los intestinos, el hepiplón y las vías urinarias. El embarazo continuó y el

martes 24 se realizó la cesárea, una operación de alto riesgo, ya que hubo que extraer al

niño del abdomen y de inmediato retirar la placenta que estaba en la cavidad. La

intervención demandó dos horas.....Una consulta por Internet realizada desde la clínica

reveló que sólo hay cinco casos similares en todo el mundo....Este matrimonio humilde que

deseaba ardientemente un hijo se convirtió en protagonista de un caso que seguramente

despertará interés científico. La Nación 26/3/98.

Se demostró también que el estrés es un factor de riesgo importante aún cuando se tuvo en

cuenta el vicio de fumar, la falta de ejercicio físico y la mala alimentación entre otros. En

los estudios.... sometieron a 276 voluntarios sanos de 18 a 55 años a exámenes psicológicos

antes de ponerlos en cuarentena y depositar virus del resfrío en sus fosas nasales. Durante

los cinco día siguientes los voluntarios -a cada uno se le pagó 800 dólares- fueron revisados

para establecer quién presentaba evidentes síntomas de resfrío” La Nación 19/5/98.

“Ficha Técnica: La encuesta de Gallup fue realizada entre 2426 votantes de la capital, 25

partidos del Gran Buenos Aires, y el resto de esa provincia; Córdoba y Santa Fe -que suman

32 localidades del área bajo estudio- mediante entrevista personales y domiciliarias que se

efectuaron entre el 18 y el 22 del actual. Se utilizó un método muestral probabilístico

polietápico y estratificado, tomando en cuenta sexo y edad en el hogar. Se estima en el 2,7%

el margen de error en los totales de toda la muestra” La Nación 28/3/99

DISEÑOS DE MUESTREOS PROBABILÍSTICOS:

MUESTREO ALEATORIO SIMPLE:

Page 2: asimetría simetría · salud de su poseedor, sino también de que es portador de genes deseables para transmitir a nuestros hijos” Revista La Nación 28/9/97. “Salta: Un niño

Notas de Estadística

Mag. Liliana Ghersi

157

Es el prototipo de muestreo, en referencia al cual se definen las fórmulas básicas para la

determinación del tamaño de muestra y del error muestral. Es de fácil realización, pero para

su implementación se debe contar con el marco muestral que ayude a contactar a las

unidades de la población que hayan sido aleatoriamente elegidas. El procedimiento

adoptado, debe garantizar: la equiprobabilidad de participación en la muestra para cada

elemento de la población.; la selección muestral debe ser totalmente aleatoria hasta alcanzar

el tamaño de muestra definido, si bien es conveniente extraer un número mayor de

elementos a los efectos de sustituir elementos en el caso de ser necesario. Generalmente la

selección de unidades es sin reemplazamiento, aunque en algunas oportunidades puede

utilizarse el reemplazamiento (un elemento puede ser seleccionado más de una vez).

Cuando el marco muestral, se halla en soporte magnético, el proceso de selección se agiliza

considerablemente a partir de algún programa diseñado para tal fin; de no ser posible esta

alternativa es común recurrir a tablas de números aleatorios. La dispersión que se alcanza

en la muestra puede redundar negativamente en los costos de la investigación cuando se

encuesta mediante entrevista personal. Hoy es posible superar este inconveniente a partir de

la existencia de la multiplicidad de medios multimediales.

Ejemplo:

Supóngase que se desea realizar una encuesta a los alumnos de Economía y Negocios de

UNSAM. El marco de muestreo puede ser la base de datos de alumnos (teniendo en cuenta

que no se presenten duplicaciones o faltantes). Luego por un proceso que genere números

aleatorios se eligen a los n alumnos que conformarán la muestra.

MUESTREO ALEATORIO SISTEMÁTICO:

Exige un marco muestral aleatoriamente ordenado y nominativo. Sólo el primer elemento

de la muestra se elige al azar y luego al número que le corresponde al elemento elegido se

le adiciona el coeficiente de elevación para elegir al siguiente y así sucesivamente y en

forma recursiva se eligen todos los elementos. El coeficiente de elevación surge de dividir

el tamaño total de la población por el tamaño de la muestra.

Ejemplo: Si se tiene una base de datos con 10000 alumnos (marco muestral) y se desea

tomar una muestra de 250 alumnos; el coeficiente de elevación será: 10000/250 o sea será

4. Si el primer elemento elegido aleatoriamente resultó ser el identificado con el número 2;

los tres consecutivos siguientes serán el 6, el 10 y el 14.

MUESTREO ALEATORIO ESTRATIFICADO:

Este método es muy utilizado siempre que se dispone de información sobre características

de la población de interés. Consiste en clasificar a la población del marco muestral en

grupos o “estratos” mutuamente excluyentes (internamente homogéneos y diferentes de los

otros grupos), con respecto a las características consignadas en el marco muestral. De lo

cual surge que en la muestra estarán presentes elementos que tienen baja probabilidad de ser

Page 3: asimetría simetría · salud de su poseedor, sino también de que es portador de genes deseables para transmitir a nuestros hijos” Revista La Nación 28/9/97. “Salta: Un niño

Notas de Estadística

Mag. Liliana Ghersi

158

elegidos aleatoriamente en forma simple o sistemática; asimismo se pueden aplicar

diferentes métodos para la selección de la muestra y también para la captación de la

información de interés y; las estimaciones de los parámetros poblacionales probablemente

sean más precisas al reducirse la variabilidad al interior de cada grupo (homogeneidad)

Las variables que generalmente están presentes son las de género y edad; y a las cuales se

suelen sumar variables de tipo sociales, económicas y/o demográficas. De existir diversas

secuencias de estratificación hay que elegir aquella que responda a la relevancia de cada

variable (la que más discrimina debe ser la primera elegida)

Un vez determinada la estratificación, corresponder afijar la muestra en cada estrato,

entendiéndose por afijar la acción de distribuir el tamaño muestral global entre los estratos;

puede ser proporcional o no proporcional.

A -ESTRATIFICADO PROPORCIONAL:

En este caso, la distribución se hace de acuerdo al peso relativo del estrato en el conjunto

poblacional.

B – ESTRATIFICADO NO PROPORCIONAL:

Si no es proporcional puede darse de diversas maneras: por afijación simple, asignando el

mismo tamaño muestral a cada estrato; por afijación óptima, donde no solamente se tiene

en cuenta el peso relativo del estrato sino que además se tiene en cuenta su heterogeneidad

respecto de la variable de estratificación, de manera que a mayor peso y mayor variabilidad,

mayor tamaño muestral; y por último por afijación dirigida, o sea para algún estrato se

desea una cantidad determinada de elementos y para el resto se afija proporcionalmente.

Cuando el proceso se realiza por medio de un sistema computarizado estadístico, como los

mismos están parametrizados, sólo basta con indicarle al paquete los pesos a asignar a cada

uno de los estratos y automáticamente se cumplimentará la ponderación y procederá a

posteriori a la tabulación conjunta y al análisis de la información.

Si bien, este tipo de muestreo complejiza los cálculos estadísticos, facilita el trabajo de

campo y pueden utilizarse herramientas más precisas y pertinentes para el objetivo de la

investigación.

Ejemplo:

En la Facultad de Ciencias Económicas de la UBA se quiere realizar una encuesta para

conocer el grado de satisfacción de los alumnos por la enseñanza impartida. Para garantizar

que en la muestra estén representados alumnos de los distintos niveles académicos, se

decide estratificar la población por nivel. A partir de un estudio preliminar se conoce la

Page 4: asimetría simetría · salud de su poseedor, sino también de que es portador de genes deseables para transmitir a nuestros hijos” Revista La Nación 28/9/97. “Salta: Un niño

Notas de Estadística

Mag. Liliana Ghersi

159

distribución de la población en estudio respecto de si estaban satisfechos o no por la

enseñanza recibida. Se presenta a continuación, la distribución:

Nivel Población

Porcentaje

Satisfechos

1° Tramo 20000 45,00%

2° Tramo 15000 60,00%

Ciclo Profesional 40000 65,00%

Posgrado 5000 80,00%

Total 80000 60,00%

Definir el tamaño de muestra, o sea la cantidad de alumnos a encuestar, para que la

investigación tenga un error máximo de 2% y el nivel de confianza sea del 95,5%; y la

distribución en los estratos de acuerdo con los tres criterios principales de afijación (simple,

proporcional y óptima)

Recordemos que el tamaño de muestra, viene dado de acuerdo a la siguiente relación:

ppzNE

Nppzn

1*1

*1*

22

2

Por lo tanto, tomando las condiciones del problema se tiene:

Error Máximo= 0,02

Nivel de Confianza= 0,955

z= 2

n= 2330,125366

Para definir la afijación simple, una vez obtenida la cantidad de elementos que contendrá la

muestra, se toma por cada estrato la misma cantidad, o sea:

Afijación Simple= n/Cantidad de Estratos

Afijación Simple= 582,5

Por lo tanto se arriba a la siguiente distribución de elementos dentro de la muestra:

Nivel Población

Afijación

Simple

1° Tramo 20000 582

2° Tramo 15000 582

Ciclo Profesional 40000 582

Posgrado 5000 582

Total 80000 2328

Page 5: asimetría simetría · salud de su poseedor, sino también de que es portador de genes deseables para transmitir a nuestros hijos” Revista La Nación 28/9/97. “Salta: Un niño

Notas de Estadística

Mag. Liliana Ghersi

160

Para definir la afijación proporcional, una vez obtenida la cantidad de elementos que

contendrá la muestra, se toma por cada estrato la cantidad correspondiente a la distribución

que deviene de los estratos (en nuestro caso nivel), o sea:

Nivel Población

Proporción

según Nivel

PsN (PsN)*n

Afijación

Proporcional

1° Tramo 20000 0,25 582,5313414 582

2° Tramo 15000 0,1875 436,898506 437

Ciclo Profesional 40000 0,5 1165,062683 1165

Posgrado 5000 0,0625 145,6328353 146

Total 80000 1 2330,125366 2330

Obsérvese, que ha aumentado la cantidad de alumnos del nivel ciclo profesional en la

composición de la muestra y ha disminuido la cantidad de alumnos del nivel posgrado,

también disminuye la cantidad de alumnos del nivel segundo tramo y se mantiene

constante la cantidad de alumnos del nivel primer tramo.

Para la determinación de la afijación óptima se requiere de la varianza de la variable

proporción que surge en cada estrato o bien de la variable proporción en la totalidad.

Téngase como referencia para el cálculo en cada estrato, la situación sobre la totalidad de la

población:

2400)60100(*60)( totalVar

Por lo tanto se arriba a la siguiente matriz de datos:

Nivel

Porcentaje

según Nivel

PsN Varianza (PsN)*Var. Proporción

Afijación

Óptima

1° Tramo 25,00% 2475 5767060,28 0,282857143 625

2° Tramo 18,75% 2400 5592300,877 0,274285714 455

Ciclo Profesional 50,00% 2275 5301035,207 0,26 1149

Posgrado 6,25% 1600 3728200,585 0,182857143 101

Total 1 2400 20388596,95 1 2330

Donde la afijación óptima deviene de aplicar la proporción al tamaño de muestra.

Y para hacer más evidente las diferencias que surgen de los diversos tipos de afijación se

presenta la siguiente tabla conjunta (deviene de las tablas generadas anteriormente en forma

marginal), respecto de las afijaciones solicitadas:

Page 6: asimetría simetría · salud de su poseedor, sino también de que es portador de genes deseables para transmitir a nuestros hijos” Revista La Nación 28/9/97. “Salta: Un niño

Notas de Estadística

Mag. Liliana Ghersi

161

Nivel Población

Afijaciön

Simple Proporcional Óptima

1° Tramo 20000 582 582 625

2° Tramo 15000 582 437 455

Ciclo Profesional 40000 582 1165 1149

Posgrado 5000 582 146 101

Total 80000 2328 2330 2330

MUESTREO ALEATORIO POR CONGLOMERADOS:

Es un método indicado para ser aplicado cuando la población está espacialmente dispersa.

Como en el muestreo estratificado, en el de conglomerados también se procede a la

selección aleatoria de conjuntos de población; pero ahora denominados conglomerados, en

lugar de estratos. Los conglomerados pueden ser demarcaciones territoriales de la población

de interés (país, provincia, departamento, otro); también pueden ser instituciones (colegios,

hospitales, unidades penitenciarias, otros) o bien conglomerados artificiales como, por

ejemplo, las urnas electorales. Se trata de extraer, mediante algún procedimiento aleatorio,

una muestra de conglomerados y, en los seleccionados, elegir también aleatoriamente, las

unidades que compondrán la muestra.

La unidad de muestreo es el conglomerado; es por ello que se extrae una muestra de

conglomerados y luego se eligen en dichos conglomerados a los individuos que

conformarán la muestra. El error de muestreo por conglomerados, disminuye a medida que

aumenta la heterogeneidad dentro del conglomerado; ahora bien, como no siempre los

conglomerados elegidos resultan ser heterogéneos internamente, suelen no representar

adecuadamente a la variedad de los componentes de la población, redundando en una

pérdida de precisión en las estimaciones muestrales.

Pero a pesar de esta debilidad, se utiliza en muchos casos, ya que permite minimizar los

costos de la encuesta, ya que se reducen los desplazamientos de los entrevistadores y por

ende el tiempo de realización de la encuesta.

Sudman (1976) recomienda tener en cuenta las siguientes apreciaciones, para la selección

de los conglomerados: han de estar bien definidos y delimitados; el número de elementos

que pertenecen al conglomerado debe ser conocido al menos aproximadamente; deben ser

pocos y deberían ser aquellos que reducen el error muestral y no tienen por qué estar

definidos idénticamente en todos los lugares.

Este tipo de muestreo puede ser monoetápico, cuando todas las unidades de población en

los conglomerados elegidos integran la muestra; bietápico, o sea cuando la selección

muestral continúa dentro de cada conglomerado, o lo que es equivalente a decir que en cada

Page 7: asimetría simetría · salud de su poseedor, sino también de que es portador de genes deseables para transmitir a nuestros hijos” Revista La Nación 28/9/97. “Salta: Un niño

Notas de Estadística

Mag. Liliana Ghersi

162

conglomerado elegido se procede a elegir una muestra. Ahora bien, si la elección aleatoria

de las unidades últimas de la muestra prosigue, se está ante un muestreo por conglomerados

polietápico (la cantidad de fases puede variar). En encuestas nacionales a la población en

general, la habitual es utilizar muestreo por conglomerados polifásico (se asume como

polietápico), que incluye la previa estratificación de la población de estudio. Se recomienda

acceder al sitio del INDEC, para profundizar en la metodología adoptada por el mismo.

VARIABLES ALEATORIAS MUESTRALES

Sea X una variable aleatoria, y sea n el tamaño de muestra predeterminado, si se eligen

aleatoriamente n elementos, de manera tal que cada elemento tenga la misma posibilidad de

ser elegido, se tiene entonces un valor de la variable aleatoria n-dimensional muestra.

Sea entonces la variable n-dimensional: (X1, X2, X3, ........, Xn), cualquier función aplicada a

dicha variable aleatoria también será una variable aleatoria. Dos funciones muy utilizadas

en la estadística muestral son:

f x x x x

x

nxn

i

i

n

( , , ,...., )1 2 31

donde x

denota a la variable aleatoria media muestral -promedio de coordenadas

muestrales-.

2º - g x x x x

x x

nsn

i

i

n

( , , ,...., )1 2 3

2

1 2

donde s2 denota a la variable aleatoria varianza muestral - promedio de los desvíos

cuadráticos de las coordenadas muestrales respecto de la media muestral correspondiente-

1 - VARIABLE ALEATORIA MEDIA MUESTRAL:

1.1- DISTRIBUCION DE LA MEDIA MUESTRAL

1º) Sea X una variable aleatoria -no importa qué distribución tenga-; y sea n 30, con nN;

aplicando el Teorema Central del límite; podemos admitir que:

_

Page 8: asimetría simetría · salud de su poseedor, sino también de que es portador de genes deseables para transmitir a nuestros hijos” Revista La Nación 28/9/97. “Salta: Un niño

Notas de Estadística

Mag. Liliana Ghersi

163

Xn tiene una distribución aproximadamente normal -o normal en el caso de provenir de una

población con distribución normal-

2º) Sea X un variable aleatoria con distribución normal, n<30 y dispersión conocida;

podemos entonces afirmar que:

_

Xn tiene una distribución normal con dispersión conocida.

3º) Sea X un variable aleatoria con distribución normal, n<30 y dispersión desconocida;

podemos entonces afirmar que:

_

Xn tiene una distribución normal con dispersión desconocida; pero generalmente estaremos

ante una situación en la que se desconocen ambos parámetros poblacionales, por lo tanto es

necesario pivotearnos en otra variable aleatoria a los efectos de sortear el problema de la

falta de información sobre la totalidad; dicha variable será la llamada t de Student. De

manera tal que:

x t nx

sn n

x

1 1

4º) Sea X un variable aleatoria con distribución distinta a la distribución normal, y n<30

En este curso no intentaremos abordar la problemática concerniente a la situación muestral.

TEOREMA CENTRAL DEL LIMITE –UNA DEMOSTRACIÓN-

Se presenta la demostración del teorema del limite central para el caso en el cual

existe la función generadora de momentos para las variables aleatorias en la muestra. La

demostración depende de un resultado fundamental de la teoría de la probabilidad, que no

se va a demostrar en este trabajo, pero que se enuncia a continuación:

Sean Yn y Y variables aleatorias con funciones generadoras de momentos n(t) y (t)

respectivamente. Si

lim n(t) = (t)

n

para todo valor real de t, entonces la función de distribución de Yn converge a la función de

distribución de Y cuando n

El enunciado formal del teorema del limite central se presenta a continuación:

Page 9: asimetría simetría · salud de su poseedor, sino también de que es portador de genes deseables para transmitir a nuestros hijos” Revista La Nación 28/9/97. “Salta: Un niño

Notas de Estadística

Mag. Liliana Ghersi

164

Sean Y1 Y2 .......... Yn variables aleatorias independientes y distribuidas idénticamente con

E(Yi) = y Var(Yi) = 2

< . Defínase la variable aleatoria estanzarizada Un; de manera tal

que:

n

μYU n

, en donde

n

1i

i_

n

YY

entonces la función de distribución Un converge a una función de distribución normal

estándar cuando n

Defínanse las variables aleatorias

1

0

)(

)(

;

i

i

ii

zVar

zE

Yz

La función generadora de momentos de la variable aleatoria Zi , Zi(t) puede expresarse

como

....)E(z3!

t

2!

t1(t)

3

i

32

zi

Además,

n

1i

n

1i

ii

nn

z

n

σ

nμY

n

σ

μYU

Ya que las variables Yi son independientes, se deduce que las variables Zi son

independientes para i = 1, 2, ............... , n

Recuérdese que la función generadora de moment

os de la suma de variables aleatorias independientes es el producto de sus funciones

generadoras de momentos individuales. Por lo tanto

n

3

i

2

3

32n

ziu ...)E(z

n3!

t

n2!

t1)

n

t((t)

n

Page 10: asimetría simetría · salud de su poseedor, sino también de que es portador de genes deseables para transmitir a nuestros hijos” Revista La Nación 28/9/97. “Salta: Un niño

Notas de Estadística

Mag. Liliana Ghersi

165

Aplicando limite de )(tnu cuando n , considerando el limite de ))(ln( t

nu , en donde

...)E(z

n3!

t

n2!

t1nln)

n

t(ln(t)ln

3

i

2

3

32n

ziun

El desarrollo de ln(1+x) en una serie estándar es

.....4

x

3

x

2

xxx)ln(1

432

con

...)E(z

n3!

t

n2!

tx 3

i

2

3

32

resulta

...)E(z

n3!

t

n2!

t1n...)

4

x

3

x

2

xn(xx)nln(1(t)ln

3

i

2

3

32432

un

En donde los términos subsecuentes en el desarrollo contienen x3, x

4 y así sucesivamente.

Al multiplicar por n, el primer termino t2/2 ,no depende de n, mientras que todos los demás

términos tienen a n, con un exponente positivo, en el denominador.

2

t(t))(ln(lim

2

nn

o sea:

2

t

nn

2

e(t)lim

que es la función generatriz de momentos de una variable aleatoria normal estándar. Por el

teorema previo, concluimos que Un tiene una distribución que converge a la función de

distribución de una variable aleatoria normal estándar

1.2 - PARAMETROS DE LA DISTRIBUCION:

Si la variable aleatoria correspondiente a la característica poblacional en estudio tiene:

Page 11: asimetría simetría · salud de su poseedor, sino también de que es portador de genes deseables para transmitir a nuestros hijos” Revista La Nación 28/9/97. “Salta: Un niño

Notas de Estadística

Mag. Liliana Ghersi

166

E x

Var x

2

la variable aleatoria media muestral para n predeterminado (n tamaño de muestra)

tiene: E x( )

(Observe que el resultado no depende de n) , y;

Var xn

( )

2

(Observe que en este caso el resultado depende de n, que a valores

mayores para el tamaño de muestra elegido valores más cercanos a cero -aplique límite para

n creciendo ilimitadamente).

Veamos qué nos dicen estas igualdades:

1º) El valor esperado de la variable aleatoria poblacional es congruente con el valor

esperado de la variable aleatoria media muestra;

2º) La varianza de la variable aleatoria media muestral es la enésima parte de la varianza de

la variable aleatoria poblacional; por lo tanto esta variable aleatoria está más concentrada

alrededor del valor que la variable aleatoria poblacional, y en la medida que el tamaño de

muestra elegido sea mayor, la variable aleatoria media muestral que se genera tiene menor

variabilidad, o sea los valores cercanos a la media tienen una alta probabilidad de presen-

tarse cuando se practique el experimento.

Por lo tanto, se espera que los valores que arroje la misma, en general , sean valores

cercanos al valor -en la práctica este valor no es conocido y resulta interesante

determinarlo- Piense por ejemplo en el monto promedio de recaudación de un impuesto;

conocer dicho valor permite estimar con qué disponibilidades cuenta el Estado para afrontar

sus operaciones.

CONVERGENCIA ESTOCASTICA DE LA VARIABLE ALEATORIA MEDIA

MUESTRAL

La variable aleatoria media muestral proveniente de una variable aleatoria con valor

esperado μx y dispersión σx converge en probabilidad al valor μx.

Demostración: Por el teorema de Tchebichev se tiene que:

1εn

σ1límεμxPlím;

εn

σ1εμxP

n

σtε Si

;t

11

n

σtμxP

t

11xtDispxExP

2x

nxn

n

2x

xnx

2x

xn

2n

Que es lo que se quería demostrar; pues se ha arribado a la siguiente conclusión: en la

medida que el tamaño de muestra aumenta, se genera una variable aleatoria media

muestral que para una determinada distancia entre los valores que toma dicha variable y

el valor esperado de la variable poblacional el suceso que los valores de dicha variable

Page 12: asimetría simetría · salud de su poseedor, sino también de que es portador de genes deseables para transmitir a nuestros hijos” Revista La Nación 28/9/97. “Salta: Un niño

Notas de Estadística

Mag. Liliana Ghersi

167

disten del valor esperado en menos de la distancia elegida tiene una probabilidad mayor

en la medida que el tamaño de la muestra aumenta.

Gráficamente:

DISTRIBUCION DE LA VARIABLE ALEATORIA PROPORCION MUESTRAL:

Si en lugar de trabajar con variables cuantitativas se examinan variables cualitativas, la

característica que se suele considerar es la proporción de éxitos. Por ejemplo, a un

encuestador político, le interesaría estimar la proporción real de votos que obtendrá un

candidato particular o a un auditor le interesaría determinar la tasa real de ocurrencia de un

tipo particular de error.

La variable aleatoria proporcional muestral viene dada por la siguiente igualdad:

p

x

n

ii

n

1

siendo Xi variables de Bernoulli para todo I = 1,2,…………n.

A esta altura, no cabe duda de que el alumno está en condiciones de demostrar, a modo de

ejercicio,

Que E p p( )

(recordar que “p” es el parámetro de la distribución binomial) y que la

varianza de la variable proporción es igual a Var ppq

n( )

Además, puede afirmarse que, la variable proporción sigue una distribución

aproximadamente normal ( ¿por qué? )

EJEMPLOS DE VARIABLES ALEATORIAS MEDIAS MUESTRALES

SU DISTRIBUCIÓN Y SUS PARÁMETROS

Supóngase que se tiene la variable aleatoria cuya función de probabilidad se presenta en el

cuadro siguiente:

Page 13: asimetría simetría · salud de su poseedor, sino también de que es portador de genes deseables para transmitir a nuestros hijos” Revista La Nación 28/9/97. “Salta: Un niño

Notas de Estadística

Mag. Liliana Ghersi

168

X P(X) X P(x) XX P(x)

1 0,1 0,1 0,1

2 0,4 0,8 1,6

3 0,4 1,2 3,6

4 0,1 0,4 1,6

1 2,5 6,9

E(X) 2,5

Varianza(X) 0,65

Dispersión(X) 0,80622577

Es interesante observar que la misma tiene una distribución perfectamente simétrica, la

gráfica de la misma es:

Variable aleatoria

0

0,1

0,2

0,3

0,4

0,5

1 2 3 4

Serie2

Ahora bien, si se toman muestras de 2 elementos, se genera la siguiente variable aleatoria:

x )x(p

)x(px

)x(px 2

1 0,01 0,01 0,01

1,5 0,08 0,12 0,18

2 0,24 0,48 0,96

2,5 0,34 0,85 2,125

3 0,24 0,72 2,16

3,5 0,08 0,28 0,98

4 0,01 0,04 0,16

1 2,5 6,575

)x(E

2,5

)x(Var

0,325

)x(Disp

0,57008771

Page 14: asimetría simetría · salud de su poseedor, sino también de que es portador de genes deseables para transmitir a nuestros hijos” Revista La Nación 28/9/97. “Salta: Un niño

Notas de Estadística

Mag. Liliana Ghersi

169

Como se ve, el valor esperado coincide con el valor esperado de la variable de la población

de la cual proviene y la varianza coincide con la mitad de la varianza de aquélla.

Supóngase ahora, que se tiene la siguiente variable aleatoria, cuya distribución presenta una

asimetría a izquierda:

x )x(xp )x(xp )x(px 2

1 0,1 0,1 0,1

2 0,3 0,6 1,2

3 0,4 1,2 3,6

4 0,2 0,8 3,2

1 2,7 8,1

E(X) 2,7

Varianza(X) 0,81

Dispersión(X) 0,9

La gráfica de la misma es:

Variable Aleatoria X

0

0,1

0,2

0,3

0,4

0,5

1 2 3 4

P(X)

Como se puede apreciar presenta un sesgo hacia la izquierda.

Ahora bien, si se toman aleatoriamente muestras de 2 elementos cada una, se genera la

variable media muestral sobre muestras de dos elementos. A continuación se detalla dicha

variable y sus parámetros:

x )x(p

)x(px

)x(px 2

1 0,01 0,01 0,01

1,5 0,06 0,09 0,135

2 0,17 0,34 0,68

2,5 0,28 0,7 1,75

3 0,28 0,84 2,52

Page 15: asimetría simetría · salud de su poseedor, sino también de que es portador de genes deseables para transmitir a nuestros hijos” Revista La Nación 28/9/97. “Salta: Un niño

Notas de Estadística

Mag. Liliana Ghersi

170

3,5 0,16 0,56 1,96

4 0,04 0,16 0,64

1 2,7 7,695

)x(E

2,7

)x(Var

0,405

)x(Disp

0,6363961

Obsérvese que el valor esperado coincide con el valor esperado de la variable de la

población y que la varianza es la mitad de la varianza de la población.

La gráfica de la misma es:

Media Muestral n=2

0

0,1

0,2

0,3

1 1,5 2 2,5 3 3,5 4

Serie2

Es interesante observar que la distribución tiene forma semejante a la silueta de una

campana.

Ahora bien, si se toman aleatoriamente muestras de 3 elementos cada una, se genera la

variable media muestral sobre muestras de tres elementos. A continuación se detalla dicha

variable y sus parámetros

x )x(p

)x(px

)x(px 2

1 0,001 0,001 0,001

1,33333333 0,009 0,012 0,016

1,66666667 0,039 0,065 0,10833333

2 0,105 0,21 0,42

2,33333333 0,192 0,448 1,04533333

2,66666667 0,246 0,656 1,74933334

3 0,22 0,66 1,98

3,33333333 0,132 0,44 1,46666666

3,66666667 0,048 0,176 0,64533333

Page 16: asimetría simetría · salud de su poseedor, sino también de que es portador de genes deseables para transmitir a nuestros hijos” Revista La Nación 28/9/97. “Salta: Un niño

Notas de Estadística

Mag. Liliana Ghersi

171

4 0,008 0,032 0,128

1 2,7 7,56

)x(E

2,7

)x(Var

0,27

)x(Disp

0,51961524

Obsérvese que el valor esperado coincide con el valor esperado de la variable de la

población y que la varianza es la tercera parte de la varianza de la población.

La gráfica de la misma es:

Media Muestral n=3

00,05

0,10,15

0,20,25

0,3

1

1,33

3333

1,66

6667 2

2,33

3333

2,66

6667 3

3,33

3333

3,66

6667 4

Serie2

Ahora bien, si se toman aleatoriamente muestras de 4 elementos cada una, se genera la

variable media muestral sobre muestras de cuatro elementos. A continuación se detalla

dicha variable y sus parámetros

x )x(p

)x(px

)x(px 2

1 0,0001 0,0001 0,0001

1,25 0,0012 0,0015 0,001875

1,5 0,007 0,0105 0,01575

1,75 0,026 0,0455 0,079625

2 0,0681 0,1362 0,2724

2,25 0,132 0,297 0,66825

2,5 0,1936 0,484 1,21

2,75 0,216 0,594 1,6335

3 0,1816 0,5448 1,6344

3,25 0,112 0,364 1,183

3,5 0,048 0,168 0,588

3,75 0,0128 0,048 0,18

Page 17: asimetría simetría · salud de su poseedor, sino también de que es portador de genes deseables para transmitir a nuestros hijos” Revista La Nación 28/9/97. “Salta: Un niño

Notas de Estadística

Mag. Liliana Ghersi

172

4 0,0016 0,0064 0,0256

1 2,7 7,4925

)x(E

2,7

)x(Var

0,2025

)x(Disp

0,45

Nuevamente, el valor esperado coincide con el valor esperado de la variable de la

población y que la varianza es la cuarta parte de la varianza de la población; la gráfica

correspondiente es:

Media Muestral n=4

00,050,1

0,150,2

0,25

11,

5 22,

5 33,

5 4

Serie2

Sea ahora, una nueva variable aleatoria, que responde a la distribución que se presenta en

tabla conjuntamente con su valor esperado y su dispersión:

x )x(xp )x(xp )x(px 2

1 0,05 0,05 0,05

2 0,1 0,2 0,4

3 0,55 1,65 4,95

4 0,3 1,2 4,8

1 3,1 10,2

E(X) 3,1

Varianza(X) 0,59

Dispersión(X) 0,76811457

Es evidente que la distribución de esta variable es más asimétrica que la presentada

anteriormente, su gráfica es:

Page 18: asimetría simetría · salud de su poseedor, sino también de que es portador de genes deseables para transmitir a nuestros hijos” Revista La Nación 28/9/97. “Salta: Un niño

Notas de Estadística

Mag. Liliana Ghersi

173

Variable aleatoria

0

0,2

0,4

0,6

1 2 3 4

Serie2

Si se toman muestras aleatorias de dos elementos, se genera la siguiente variable aleatoria:

x )x(p

)x(px

)x(px 2

1 0,0025 0,0025 0,0025

1,5 0,01 0,015 0,0225

2 0,065 0,13 0,26

2,5 0,14 0,35 0,875

3 0,3625 1,0875 3,2625

3,5 0,33 1,155 4,0425

4 0,09 0,36 1,44

1 3,1 9,905

)x(E

3,1

)x(Var

0,295

)x(Disp

0,54313902

Y la gráfica de la misma es:

Media muestral n=2

0

0,1

0,2

0,3

0,4

1 1,5 2 2,5 3 3,5 4

Serie2

Page 19: asimetría simetría · salud de su poseedor, sino también de que es portador de genes deseables para transmitir a nuestros hijos” Revista La Nación 28/9/97. “Salta: Un niño

Notas de Estadística

Mag. Liliana Ghersi

174

La silueta que describe tiene una fuerte disparidad con respecto a una forma campanular,

situación que deviene de la asimetría que se presenta en la distribución de la variable

aleatoria de la población.

Si se toman muestras aleatorias de tres elementos, se genera la siguiente variable aleatoria:

x )x(p

)x(px

)x(px 2

1 0,000125 0,000125 0,000125

1,33333333 0,00075 0,001 0,00133333

1,66666667 0,005625 0,009375 0,015625

2 0,01975 0,0395 0,079

2,33333333 0,070875 0,165375 0,385875

2,66666667 0,14925 0,398 1,06133334

3 0,278875 0,836625 2,509875

3,33333333 0,29925 0,9975 3,32499999

3,66666667 0,1485 0,5445 1,9965

4 0,027 0,108 0,432

1 3,1 9,80666667

)x(E

3,1

)x(Var

0,19666667

)x(Disp

0,44347116

La gráfica de la distribución es:

Media muestral n=3

0

0,1

0,2

0,3

0,4

1

1,6

7

2,3

3 3

3,6

7

Serie2

Y por último, si se toman muestras de 4 elementos, se tiene la siguiente variable aleatoria:

x )x(p

)x(px

)x(px 2

Page 20: asimetría simetría · salud de su poseedor, sino también de que es portador de genes deseables para transmitir a nuestros hijos” Revista La Nación 28/9/97. “Salta: Un niño

Notas de Estadística

Mag. Liliana Ghersi

175

1 0,00000625 0,00000625 0,00000625

1,25 0,00005 0,0000625 7,8125E-05

1,5 0,000425 0,0006375 0,00095625

1,75 0,002 0,0035 0,006125

2 0,0088375 0,017675 0,03535

2,25 0,0271 0,060975 0,13719375

2,5 0,073775 0,1844375 0,46109375

2,75 0,1462 0,40205 1,1056375

3 0,23550625 0,70651875 2,11955625

3,25 0,26445 0,8594625 2,79325313

3,5 0,17415 0,609525 2,1333375

3,75 0,0594 0,22275 0,8353125

4 0,0081 0,0324 0,1296

1 3,1 9,7575

)x(E

3,1

)x(Var

0,1475

)x(Disp

0,38405729

La gráfica que le corresponde es:

Media muestral n=4

0

0,05

0,1

0,15

0,2

0,25

0,3

11,

5 22,

5 33,

5 4

Serie2

Conviene observar, cómo se va perfilando una simetría interesante hacia la derecha de la

distribución y una cola alargada hacia la izquierda de la misma, producto todo ello de la

distribución de la variable poblacional de la cual deviene.

Desde otra óptica:

Page 21: asimetría simetría · salud de su poseedor, sino también de que es portador de genes deseables para transmitir a nuestros hijos” Revista La Nación 28/9/97. “Salta: Un niño

Notas de Estadística

Mag. Liliana Ghersi

176

a) el eje de simetría para la distribución de la primera variable presentada coincide con

el valor de la esperanza matemática: 2.5, también se realiza la igualdad para todas

las distribuciones de las medias muestrales presentadas.

b) El “eje de simetría” para las distribuciones de las medias muestrales

correspondientes a la segunda y la tercera variable presentada , en la medida que el

tamaño de muestra aumenta tiende al valor esperado de cada una de las respectivas

variables. Es claro que en todas las distribuciones existe asimetría, pero también es

evidente que al aumentar el tamaño de muestra en la zona que contiene al valor

esperado se puede encontrar una forma bastante simétrica con respecto a dicho

valor.

2 - VARIABLE ALEATORIA VARIANZA MUESTRAL

2.1 - DISTRIBUCION DE LA VARIABLE ALEATORIA VARIANZA MUESTRAL

Si X tiene distribución normal, se tiene entonces que

s

x x

n

i

i

n

2

2

1

donde s2 denota a la variable aleatoria varianza muestral - promedio de los desvíos

cuadráticos de las coordenadas muestrales respecto de la media muestral correspondiente

como dijimos anteriormente-,

Y ns2

2 tiene distribución ²n-1; donde n-1 indica los grados de libertad de la misma.

En este curso no se trabajará con la varianza muestral para casos en que provenga de una

población con distribución distinta a la normal.

2.1 -PARAMETROS DE LA VARIANZA MUESTRAL

E s nn

2 1 2

(Observe que el resultado depende de n, a valores más grande de n, valores esperados más

parecidos a ²)

Var s n

n

2 2 2 42

(También aquí el resultado depende de n, y si aplica límite para n creciendo ilimitadamente

obtiene el valor cero)

Sea la variable:

Page 22: asimetría simetría · salud de su poseedor, sino también de que es portador de genes deseables para transmitir a nuestros hijos” Revista La Nación 28/9/97. “Salta: Un niño

Notas de Estadística

Mag. Liliana Ghersi

177

x p(x) x*p(x) x*x*p(x)

0 0,25 0 0

1 0,5 0,5 0,5

2 0,25 0,5 1

1 1 1,5

var(x)= 0,5 disp(x)= 0,70710678

Si se toman muestras de tres elementos, se obtienen las siguientes ternas aleatorias que

conforman la variable muestra correspondiente:

x1 x2 x3 m(x) s2 p(x1,x2;x3)

0 0 0 0 0 0,015625

0 0 1 0,33333333 0,22222222 0,03125

0 0 2 0,66666667 0,88888889 0,015625

0 1 0 0,33333333 0,22222222 0,03125

0 1 1 0,66666667 0,22222222 0,0625

0 1 2 1 0,66666667 0,03125

0 2 0 0,66666667 0,88888889 0,015625

0 2 1 1 0,66666667 0,03125

0 2 2 1,33333333 0,88888889 0,015625

1 0 0 0,33333333 0,22222222 0,03125

1 0 1 0,66666667 0,22222222 0,0625

1 0 2 1 0,66666667 0,03125

1 1 0 0,66666667 0,22222222 0,0625

1 1 1 1 0 0,125

1 1 2 1,33333333 0,22222222 0,0625

1 2 0 1 0,66666667 0,03125

1 2 1 1,33333333 0,22222222 0,0625

1 2 2 1,66666667 0,22222222 0,03125

2 0 0 0,66666667 0,88888889 0,015625

2 0 1 1 0,66666667 0,03125

2 0 2 1,33333333 0,88888889 0,015625

2 1 0 1 0,66666667 0,03125

2 1 1 1,33333333 0,22222222 0,0625

2 1 2 1,66666667 0,22222222 0,03125

2 2 0 1,33333333 0,88888889 0,015625

2 2 1 1,66666667 0,22222222 0,03125

2 2 2 2 0 0,015625

1

Reordenando los valores de la variable varianza muestral y generando dicha variable, se

llega a la siguiente tabla:

Page 23: asimetría simetría · salud de su poseedor, sino también de que es portador de genes deseables para transmitir a nuestros hijos” Revista La Nación 28/9/97. “Salta: Un niño

Notas de Estadística

Mag. Liliana Ghersi

178

s2 p(s2) (s2)2

0 0,15625 0

0,22222222 0,5625 0,04938272

0,66666667 0,1875 0,44444444

0,88888889 0,09375 0,79012346

1

E(s2)= 0,33333333 Var(s2)= 0,07407407

De la cual surge que el valor esperado de dicha variable coincide con (2/3)*0,5, o sea

coincide con el producto entre la varianza de la variable poblacional y el cociente entre

(n.1) y n (tamaño muestral). Debe tenerse en cuenta que no se ha partido de una variable

continu con distribución normal.

A continuación se presenta la gráfica de la distribución respectiva:

0

0,1

0,2

0,3

0,4

0,5

0,6

0 0,222222222 0,666666667 0,888888889

Distribución de la varianza muestral para n=3

3- MOMENTOS DE ORDEN SUPERIOR MUESTRALES

Los momentos de una variable aleatoria, sirven para describir el comportamiento de la

misma; ya hemos hablado del momento absoluto primero -que no es más que el valor

esperado de dicha variable- y del momento segundo centrado -que es la varianza de aquélla-

También nos hemos remitido a los momentos muestrales de primer y segundo orden; pero

tenemos a los momento centrados de orden superior -que también nos informan del

comportamiento de la variable aleatoria poblacional-; ya sean poblacionales como

muestrales

Page 24: asimetría simetría · salud de su poseedor, sino también de que es portador de genes deseables para transmitir a nuestros hijos” Revista La Nación 28/9/97. “Salta: Un niño

Notas de Estadística

Mag. Liliana Ghersi

179

Tomando los momentos de orden superior centrados poblacionales, se tiene que:

Si : 3/3

= 0 la variable aleatoria tiene distribución simétrica respecto de la media, donde

3 es el momento tercero centrado y m3 el momento muestral correspondiente .Cuando hay

más valores de variable ubicados a la izquierda de la media diremos que la serie es

simétrica a izquierda o que presenta una asimetría a derecha; y tendremos 3/3

>0 .Vale

para el caso contrario.

Si 4/4 - 3 = 0 diremos que la distribución es mesocúrtica -con 4 momento centrado

cuarto-; si la diferencia es menor a cero diremos que es platicúrtica o en promedio más baja

que la normal y leptocúrticua ó en promedio más alta que la normal.

Pasamos a detallar los momentos centrado muestrales, tanto tercero como cuarto -para datos

simples y datos agrupados-:

3

3

1

x x

n

i

i

n

3

3

1

x x f

fi

i i

i

n

i

4

4

1

x x

n

i

i

n

4

4

1

x x f

fi

i i

i

n

i

5.4 Esta tabla pertenece a valores de variable monto de próxima factura a emitirse y los

cuales han sido ajustados a una distribución normal con media 50 y dispersión 5; de

acuerdo al ejercicio 7 de la práctica 4.

A continuación se muestra una tabla con valores promedio muestrales sobre muestras de 3

elementos y un total de 40 muestras generados aleatoriamente:

Li Ls Valor

Prome-

dio

Frecuen-

cia

xi*f x´2*f(x´) x´

3*f(x´) x´

4*f(x´) Frec.

Acumula

da

44 46 45 2 90 67.28 -390.22 2263.3 2

46 48 47 7 329 101.08 -384.1 1459.6 9

48 50 49 7 343 22.68 -40.824 73.4832 16

50 52 51 12 612 0.48 0.096 0.0192 28

Page 25: asimetría simetría · salud de su poseedor, sino también de que es portador de genes deseables para transmitir a nuestros hijos” Revista La Nación 28/9/97. “Salta: Un niño

Notas de Estadística

Mag. Liliana Ghersi

180

52 54 53 5 265 24.2 53.24 117.128 33

54 56 55 3 165 52.92 222.264 933.509 36

56 58 57 4 228 153.76 953.312 5910.53 40

40 50.8 10.56 10.344 268.939

Con 850.´ ii xx

As= 0.30143

K= -0.5883

Observe que la media de las medias muestrales obtenidas arroja un valor de 50.8 u.m.; y la

varianza un valor de 10 o sea una dispersión de 3.16 -piense que 88723

5. -

Por ser el momento tercero centrado positivo se concluye que hay un predominio de los

valores que se encuentran más a la derecha -los más grandes- Estamos comparando con una

curva correspondiente a una distribución normal; que por fundamentación teórica sabemos

que esta variable tiene.

No se olvide que son valores muestrales o sea momentos centrados muestrales

m

m

e

o

5020 16

122 50 0 666 50 666

505

5 72 50 0833 50833

* . .

* . .

Observe que media, mediana y modo no son congruentes, por lo tanto podríamos decir que

la distribución no es simétrica; tenga en cuenta que son semejantes y todos se encuentran en

el mismo intervalo.

Si analizamos si existe exceso -en cuanto a altura máxima- se tiene:

4/s4 - 3 = -0.5883;

por lo tanto es más baja la distribución empírica que la distribución normal.

Page 26: asimetría simetría · salud de su poseedor, sino también de que es portador de genes deseables para transmitir a nuestros hijos” Revista La Nación 28/9/97. “Salta: Un niño

Notas de Estadística

Mag. Liliana Ghersi

181

DIST RIBUCION EMPIRICA

MEDIA MUEST RAL N=3

0

5

10

15

45 47 49 51 53 55 57

Y la distribución empírica de frecuencias acumuladas es:

DIST RIBUCION ACUMULADA

EMPRIRICA PARA MEDIA

MUEST RAL N=3

0

5

10

15

20

25

30

35

40

45 47 49 51 53 55 57

A continuación se muestra una tabla con valores varianzas muestrales sobre muestras de 3

elementos y un total de 40 muestras generados aleatoriamente:

Li Ls Valor

Prome-

dio

Frecuen-

cia

xi*f x´2*f(x´) x´

3*f(x´) x´

4*f(x´) Frecuencia

Acumulada

Page 27: asimetría simetría · salud de su poseedor, sino también de que es portador de genes deseables para transmitir a nuestros hijos” Revista La Nación 28/9/97. “Salta: Un niño

Notas de Estadística

Mag. Liliana Ghersi

182

0 11 5.5 21 115.5 15881.3 -436734 8578710.94 21

11 22 16.5 11 181.5 2994.75 -49413 1111800.94 32

22 33 27.5 3 82.5 90.75 -499.13 13725.9375 35

33 44 38.5 2 77 60.5 332.75 13725.9375 37

44 55 49.5 1 49.5 272.25 4492.13 74120.0625 38

55 66 60.5 1 60.5 756.25 20796.9 8578710.94 39

66 77 71.5 1 71.5 1482.25 1482.25 32955975.9 40

40 15.95 538.45 -11489 12831692.7

As= -0.9195

K= 41.2581429

Con 850.´ ii xx

Observe los valores obtenidos, y recuerde:

E(s²) = ((n-1)/n)*² = (2/3)25 = 16.6 y

Var(s²)= (2*(n-1)/n²)*4= 277.7

me = 0 + [(20-0)/21]*11 = 10,476

mo = 0+ [21/(21+10)]*11 = 7.45

m

m

e

o

020 0

2111 10 476

021

21 1011 7 45

* .

* .

Observe que media, mediana y modo son distintos por lo tanto podemos afirmar que la serie

no es simétrica; situación lógica ya que la distribución madre no es simétrica.

A partir del momento tercero, se puede comprobar que esta serie es asimétrica positiva, o

sea hay muchos valores cercanos al origen. En cuanto a la altura, se puede aceptar que está

dentro de las más altas.

Page 28: asimetría simetría · salud de su poseedor, sino también de que es portador de genes deseables para transmitir a nuestros hijos” Revista La Nación 28/9/97. “Salta: Un niño

Notas de Estadística

Mag. Liliana Ghersi

183

Ahora bien, si en vez de tomar muestras de 3 elementos tomamos muestras de 12

elementos, analicemos lo que sucede -los valores son los mismos reagrupados-:

PARA LA MEDIA MUESTRAL:

Page 29: asimetría simetría · salud de su poseedor, sino también de que es portador de genes deseables para transmitir a nuestros hijos” Revista La Nación 28/9/97. “Salta: Un niño

Notas de Estadística

Mag. Liliana Ghersi

184

Con 849.´ ii xx

Li Ls Valor

Prome-

Dio

Fre-

Cuencia

xi*f x´2*f(x´) x´

3*f(x´) x´

4*f(x´) Frec.

Acumu-

Lada

46.5 48 47.25 2 94.5 25.205 -89.478 317.646 2

48 49.5 48.75 2 97.5 8.405 -17.23 35.322 4

49.5 51 50.25 4 201 1.21 -0.6655 0.36602 8

51 52.5 51.75 1 51.75 0.9025 0.85738 0.81451 9

52.5 54 53.25 1 53.25 6.0025 14.7061 36.03 10

10 49.8 4.1725 -9.181 39.0179

AS= -3.3005

K= -0.7589

Analice usted los valores obtenidos. Compare.

DIST RIBUCION EMPIRICA

MEDIA MUEST RAL N=12

0

1

2

3

4

48.3 49.8 51.3 52.8 54.3

Compare los gráficos para n=3 y n=12.

Page 30: asimetría simetría · salud de su poseedor, sino también de que es portador de genes deseables para transmitir a nuestros hijos” Revista La Nación 28/9/97. “Salta: Un niño

Notas de Estadística

Mag. Liliana Ghersi

185

D IS T R IB U C IO N A C U M U L A D A

M E D IA S M U E S T R A L E S N = 1 2

0

2

4

6

8

10

47.3 48.8 50.3 51.8 53.3

VALORES VARIANZA MUESTRAL:

Con 849.´ ii xx

Page 31: asimetría simetría · salud de su poseedor, sino también de que es portador de genes deseables para transmitir a nuestros hijos” Revista La Nación 28/9/97. “Salta: Un niño

Notas de Estadística

Mag. Liliana Ghersi

186

Li Ls Valor

Prome-

Dio

Fre-

Cuenc

ia

xi*f x´2*f(x´) x´

3*f(x´) x´

4*f(x´) Frec.

Acumu-

Lada

7.5 15.5 11.5 4 46 5041 -178956 6352920 4

15.5 23.5 19.5 2 39 1512.5 -41594 1143828 6

23.5 31.5 27.5 1 27.5 380.25 -7414.9 144590 7

31.5 39.5 35.5 3 106.5 396.75 -4562.6 52470.2 10

10 21.9 733.05 -23253 769381

AS= -1.1716

K= 1.43177

DIST RIBUION EMPIRICA VARIANZA

MUEST RAL N=12

0

0.5

1

1.5

2

2.5

3

3.5

4

11.5 19.5 27.5 35.5

Page 32: asimetría simetría · salud de su poseedor, sino también de que es portador de genes deseables para transmitir a nuestros hijos” Revista La Nación 28/9/97. “Salta: Un niño

Notas de Estadística

Mag. Liliana Ghersi

187

DIST RIBUCION ACUMULADA

EMPIRICA VARIANZA

MUEST RAL N=12

0

2

4

6

8

10

11.5 19.5 27.5 35.5

7 - Sea la variable aleatoria monto de factura próxima a emitirse, como la que hemos

presentado en la práctica anterior; X: N( 50,5); si se toman aleatoriamente muestras de 3

elementos; calcule las siguientes probabilidades:

7.1 - Que la media muestral no supere los 50 pesos.

7.2 - Que la media muestral supere los 50 pesos

7.3 - P x

60

7.4 - P x

40

7.5 - P x40 60

7.6 - P x x40 60 70

/

7.7 -El monto promedio muestral de las 3 facturas próximas a emitirse no difiera de 50

pesos en más de 10 pesos.

7.8 -El monto promedio de 3 facturas próxima a emitirse difiera de su valor esperado en

más de 5 pesos.

7.9 - Cuál es el monto promedio muestral de las 3 facturas próximas a emitirse que es

superado por el 80% de los promedios muestrales (n=3) montos de factura próxima a

emitirse?

Compare todos los resultados con los ítems semejantes del ejercicio 7 práctica 4.

7.10 - Que la dispersión muestral supere los 5 pesos

7.11 - Que la dispersión muestral supere los 2 pesos

Page 33: asimetría simetría · salud de su poseedor, sino también de que es portador de genes deseables para transmitir a nuestros hijos” Revista La Nación 28/9/97. “Salta: Un niño

Notas de Estadística

Mag. Liliana Ghersi

188

7.12 - Que la dispersión muestral se encuentre entre 2 y 7 pesos

7.13 - Que la dispersión muestral supere los 5 pesos sabiendo que supera los 2 pesos.

7.14 - Que la dispersión muestral supere los 2 pesos, sabiendo que la media muestral supera

los 50 pesos.

_

Solución: recuerde que X N:{50, 5/3); aquí se conocen los dos parámetros poblacionales.

7.1 - 5050 .

xP ; pues 50 es el valor esperado de la variable. O sea en el 50% de los

casos que se practique el experimento de medir la confianza del monto promedio a facturar

en las próximas 3 facturas a emitir se espera que el mismo sea por un monto menor a 50

pesos

7.2 - P x

50 05. ; Interprete.

7.3 - P x Px

Px

6050

5

3

60 50

5

3

50

5

3

346 0 9997. .

Es decir que de 10000 veces que practique el experimento de medir la confianza del monto

promedio muestral a facturar en las próximas 3 facturas a emitir -elegidas aleatoriamente-

espero que 9997 sean promedio muestrales de 3 facturas que se emitan por un monto menor

a 60 pesos.

Compare los valores de probabilidad y los valores de variables estandarizadas.

7.4 - 00030999701463

3

5

50

3

5

5040

3

5

5040 ...

x

Px

PxP

Es decir que de 10000 veces que practique el experimento de medir la confianza del monto

promedio muestral a facturar en las próximas 3 facturas a emitir -elegidas aleatoriamente-

espero que 3 sean promedios muestrales que se emitan por un monto menor a 40 pesos.

Compare con los valores empíricos acumulados.

7.5-

P x Px

Px

40 6040 50

5

3

50

5

3

60 50

5

3

34650

5

3

346 0 9997 1 0 9997 0 9994

. . . ( . ) .

Interprete los resultados, actividad que le propongo haga para todos los ítems restantes

Page 34: asimetría simetría · salud de su poseedor, sino también de que es portador de genes deseables para transmitir a nuestros hijos” Revista La Nación 28/9/97. “Salta: Un niño

Notas de Estadística

Mag. Liliana Ghersi

189

7.6 - 99940

926

3

5

50

99940

3

5

5070

3

5

50

3

5

5060

3

5

50

3

5

5040706040 .

.

.//

xP

xxPxxP

7.7 -El monto promedio de 3 facturas próxima a emitirse no difiera de 50 pesos en más de

10 pesos.

P x P x Px

50 10 10 50 1010

5

3

50

5

3

10

5

3

0 9994. (ver 7.5)

7.8 -El monto promedio de 3 facturas próxima a emitirse difiera de su valor esperado en

más de 5 pesos.

P x P x P x Px

50 5 1 50 5 1 5 50 5 1 17350

5

3

173 1 0 91636 0 08366. . . .

7.9 - Cuál es el monto promedio muestral de las 3 facturas próximas a emitirse que es

superado por el 80% de los promedios muestrales (n=3) montos de factura próxima a

emitirse?

5747

3

5

50840

3

5

50

3

5

50

3

5

50

3

5

5080

..

.

AA

AxP

xAPxAP

O sea el monto promedio muestral de 3 facturas próximas a emitirse, que es superado por el

80% de los montos promedio muestrales de 3 facturas próximas a emitirse es 47.724.

7.10 - Que la dispersión muestral supere los 5 pesos

Como proviene de una población normal s²

3 2

2

s

tendrá una distribución χ² con 2 grados de libertad.

Page 35: asimetría simetría · salud de su poseedor, sino también de que es portador de genes deseables para transmitir a nuestros hijos” Revista La Nación 28/9/97. “Salta: Un niño

Notas de Estadística

Mag. Liliana Ghersi

190

P s Ps

Ps2

2

2

2

225

33 1

33 1 0 75 0 25

. .

7.11 - Que la dispersión muestral supere los 2 pesos

P s Ps

Ps2

2

2

2

24

33 016

30 48 1 015 085

* . . . .

7.12 - Que la dispersión muestral se encuentre entre 2 y 7 pesos

P s Ps

Ps

Ps

4 49 3 0163

3 196

3588

30 48 0 95 015 08

22

2

2

2

2

2

* . * .

. . . . .

7.13 - Que la dispersión muestral supere los 5 pesos sabiendo que supera los 2 pesos.

3125080

250

4803

33

16033

33

425

2

2

2

2

2

2

2

222

..

.

.

.*//

sP

sP

ssPssP

7.14 - Que la dispersión muestral supere los 2 pesos, sabiendo que la media muestral supera

los 50 pesos. _

Por el lema de Fisher, tenga presente que s² y X son variables aleatorias independientes, por

lo tanto:

P s x P s Ps

Ps2 2

2

2

2

24 50 4

33 016

30 48 1 015 085

/ * . . . .

8 - Realice el ejercicio, pero tomando muestras de 12 elementos y luego de 36 elementos; y

compare los resultados.

9- Suponga ahora que la dispersión de la variable aleatoria monto de próxima factura a

emitirse no es conocida y se sabe que la dispersión muestral es 5, pero el tamaño de

muestra es 36; calcule las probabilidades solicitadas en el ejercicio 7, en lo pertinente al

promedio muestral.

Solución: por ser el tamaño de muestra mayor a 30, se puede tomar X N:(50,5) a partir

de lo que enuncia el teorema de Linderberg:

Si X1, X2, X3, ....Xn, es una sucesión finita de variables aleatorias independientes, que tiene

la misma distribución probabilística, con media: y dispersión: comunes Xi

Page 36: asimetría simetría · salud de su poseedor, sino también de que es portador de genes deseables para transmitir a nuestros hijos” Revista La Nación 28/9/97. “Salta: Un niño

Notas de Estadística

Mag. Liliana Ghersi

191

Z Xn i

i

n

1

es asintóticamente normal con: media = n,y dispersión = n.

9.1 - Que la media muestral no supere los 50 pesos.

9.2 - Que la media muestral supere los 50 pesos

9.3 - P x

60

9.4 - P x

40

9.5 - P x40 60

9.6 - P x x40 60 70

/

9.7 -El monto promedio muestral de las 3 facturas próximas a emitirse no difiera de 50

pesos en más de 10 pesos.

9.8 -El monto promedio de 3 facturas próxima a emitirse difiera de su valor esperado en

más de 5 pesos.

9.9 - Cuál es el monto promedio muestral de las 3 facturas próximas a emitirse que es

superado por el 80% de los promedios muestrales (n=3) montos de factura próxima a

emitirse?

Compare todos los resultados con los ítems semejantes del ejercicio 7 práctica 4 y el

ejercicio 7 de esta práctica.

_

9.1 - P(X 50) = 0.5; pues 50 es el valor esperado de la variable. O sea en el 50% de los

casos que se practique el experimento de medir la confianza del monto promedio a facturar

en las próximas 36 facturas a emitir se espera que el mismo sea por un monto menor a 50

pesos

_

9.2 - P(X 50) = 0.5 Interprete.

9.3 - 112

6

5

50

36

5

5060

36

5

5060

x

Px

PxP

Es decir que de 10000 veces que practique el experimento de medir la confianza del monto

promedio muestral a facturar en las próximas 36 facturas a emitir -elegidas

aleatoriamente- espero que 10000 sean promedio muestrales de 36 facturas que se emitan

por un monto menor a 60 pesos.

Compare los valores de probabilidad y los valores de variables estandarizadas.

Page 37: asimetría simetría · salud de su poseedor, sino también de que es portador de genes deseables para transmitir a nuestros hijos” Revista La Nación 28/9/97. “Salta: Un niño

Notas de Estadística

Mag. Liliana Ghersi

192

9.4 - 01112

6

5

50

36

5

5040

36

5

5040

x

Px

PxP

Es decir que de 10000 veces que practique el experimento de medir la confianza del monto

promedio muestral a facturar en las próximas 36 facturas a emitir -elegidas aleatoriamente-

espero que ninguna sean promedios muestrales que se emitan por un monto menor a 40

pesos.

Compare con los valores empíricos acumulados.

9.5 - P x Px

Px

40 6040 50

5

36

50

5

36

60 50

5

36

1250

5

36

12 1

Interprete los resultados, actividad que le propongo haga para todos los ítems restantes

9.6 - P x x Px x

Px

40 60 7040 50

5

36

50

5

36

60 50

5

36

50

5

36

70 50

5

36

1

50

5

36

20

1

/ /

9.7 -El monto promedio de 36 facturas próxima a emitirse no difiera de 50 pesos en más de

10 pesos.

1

36

5

10

36

5

50

36

5

1010501060401050

x

PxPxPxP

(ver 7.5 y 7.7)

9.8 -El monto promedio de 36 facturas próxima a emitirse difiera de su valor esperado en

más de 5 pesos.

0116

36

5

5061550515501550

x

PxPxPxP

Page 38: asimetría simetría · salud de su poseedor, sino también de que es portador de genes deseables para transmitir a nuestros hijos” Revista La Nación 28/9/97. “Salta: Un niño

Notas de Estadística

Mag. Liliana Ghersi

193

9.9 - Cuál es el monto promedio muestral de las 36 facturas próximas a emitirse que es

superado por el 80% de los promedios muestrales (n=36) montos de factura próxima a

emitirse?

36

5

50

36

5

50

36

5

50

36

5

5080

AxP

xAPxAP .

0 8450

5

36

49 3. .

A

A

O sea el monto promedio muestral de 36 facturas próximas a emitirse, que es superado por

el 80% de los montos promedio muestrales de 36 facturas próximas a emitirse es 49.3.

Observe como el valor de variable aleatoria se ha acercado al valor esperado, respecto de

los otros ejercicios -para la misma proporción-

10- Suponga ahora que la dispersión de la variable aleatoria monto de próxima factura a

emitirse no es conocida y se sabe que la dispersión muestral es 5,; calcule las

probabilidades solicitadas en el ejercicio 7, en lo pertinente al promedio muestral.

Solución: como la variable poblacional tiene distribución normal, y el tamaño de la muestra

es menor a 30, se puede utilizar para medir la expectativa correspondiente la variable t de

Student; para el caso de n=3 se tiene:

5

5022

xt

10.1 - Que la media muestral no supere los 50 pesos.

10.2 - Que la media muestral supere los 50 pesos

10.3 -

60xP

10.4 -

40xP

10.5 -

6040 xP

Page 39: asimetría simetría · salud de su poseedor, sino también de que es portador de genes deseables para transmitir a nuestros hijos” Revista La Nación 28/9/97. “Salta: Un niño

Notas de Estadística

Mag. Liliana Ghersi

194

10.6 -

706040 xxP /

10.7 -El monto promedio muestral de las 3 facturas próximas a emitirse no difiera de 50

pesos en más de 10 pesos.

10.8 -El monto promedio de 3 facturas próximas a emitirse difiera de su valor esperado en

más de 5 pesos.

10.9 - Cuál es el monto promedio muestral de las 3 facturas próximas a emitirse que es

superado por el 80% de los promedios muestrales (n=3) montos de factura próxima a

emitirse?

Compare todos los resultados con los ítems semejantes del ejercicio 7 práctica 4 y el

ejercicio 7 y 8 de esta práctica.

10.1 - 5005

50250 .

x

PxP

pues 50 es el valor esperado de la variable. O sea en el 50% de los casos que se practique el

experimento de medir la confianza del monto promedio a facturar en las próximas 36

facturas a emitir se espera que el mismo sea por un monto menor a 50 pesos

10.2 - 5005

50250 .

x

PxP Interprete.

10.3 - 9605

102

5

502

5

50602

5

50260 .

x

Px

PxP

Es decir que de 10000 veces que practique el experimento de medir la confianza del monto

promedio muestral a facturar en las próximas 3 facturas a emitir -elegidas aleatoriamente-

espero que 9600 sean promedio muestrales de 3 facturas que se emitan por un monto menor

a 60 pesos.

Compare los valores de probabilidad y los valores de variables estandarizadas.

10.4 - P x Px

Px

40 2

50

52

40 50

52

50

52

10

50 04.

Es decir que de 10000 veces que practique el experimento de medir la confianza del monto

promedio muestral a facturar en las próximas 3 facturas a emitir -elegidas aleatoriamente-

espero que 400 sean promedios muestrales que se emitan por un monto menor a 40 pesos.

Compare con los valores empíricos acumulados.

10.5 - 9200409605

102

5

502

5

102

5

50602

5

502

5

504026040 ...

x

Px

PxP

Interprete los resultados, actividad que le propongo haga para todos los ítems restantes

Page 40: asimetría simetría · salud de su poseedor, sino también de que es portador de genes deseables para transmitir a nuestros hijos” Revista La Nación 28/9/97. “Salta: Un niño

Notas de Estadística

Mag. Liliana Ghersi

195

10.6 -

9201

040960

5

50702

5

502

5

102

5

502

5

102

5

50702

5

502

5

50602

5

502

5

50402706040

...

//

xP

xP

xxPxxP

10.7 -El monto promedio de 3 facturas próxima a emitirse no difiera de 50 pesos en más de

10 pesos.

9200409605

102

5

502

5

102

5

50602

5

502

5

50402

10501060401050

...

xP

xP

xPxPxP

(ver 9.5)

10.8 -El monto promedio de 36 facturas próxima a emitirse difiera de su valor esperado

en más de 5 pesos.

801090125

50212

5

52

5

502

5

52

5

50552

5

502

5

50452

5550451551550

...)()(

xP

xP

xP

xPxPxP

10.9 - Cuál es el monto promedio muestral de las 3 facturas próximas a emitirse que es

superado por el 80% de los promedios muestrales (n=36) montos de factura próxima a

emitirse?

25

502

5

502

5

5080 2

AtP

xAPxAP .

Page 41: asimetría simetría · salud de su poseedor, sino también de que es portador de genes deseables para transmitir a nuestros hijos” Revista La Nación 28/9/97. “Salta: Un niño

Notas de Estadística

Mag. Liliana Ghersi

196

0 8450

5

2

47 02. .

A

A

O sea el monto promedio muestral de 3 facturas próximas a emitirse, que es superado por el

80% de los montos promedio muestrales de 3 facturas próximas a emitirse es 47.02.

11- Realice el ejercicio para muestras de 12 elementos, suponiendo que no se conoce la

dispersión de la población y la de la muestra es 5. No se olvide las comparaciones.