distribuciones estadistica
DESCRIPTION
Distribuciones estadisticasTRANSCRIPT
![Page 1: Distribuciones Estadistica](https://reader036.vdocuments.site/reader036/viewer/2022082209/5695d5041a28ab9b02a3b6c6/html5/thumbnails/1.jpg)
Selección de distribuciones de probabilidad
Georgina Flesia
FaMAF
30 de abril, 2013
![Page 2: Distribuciones Estadistica](https://reader036.vdocuments.site/reader036/viewer/2022082209/5695d5041a28ab9b02a3b6c6/html5/thumbnails/2.jpg)
Análisis estadístico de datos simulados
I Los sistemas reales tienen fuentes de aleatoriedad:
Tipo de sistema Fuente de aleatoriedad
Fabricación Tiempos de procesamientoTiempos de fallaTiempos de reparación de máquinas
Defensa Tiempos de arribo y carga útilde aviones o misiles.Errores de lanzamiento.
Comunicaciones Tiempos entre llegadas de mensajes.Longitudes de mensajes.
Transporte Tiempo de embarqueTiempos entre arribos a un subte...
![Page 3: Distribuciones Estadistica](https://reader036.vdocuments.site/reader036/viewer/2022082209/5695d5041a28ab9b02a3b6c6/html5/thumbnails/3.jpg)
Simulación a partir de los datos
Para simular un sistema real es necesario:I Representar cada fuente de aleatoriedad de acuerdo a una
distribución de probabilidad.I Elegir adecuadamente la distribución, para no afectar los
resultados de la simulación.
¿Cómo elegir una distribución? ¿Cómo simular un sistema a partirde un conjunto de observaciones?
I Utilizando los datos directamente.I Realizando el muestreo a partir de la distribución empírica de los
datos.I Utilizando técnicas de inferencia estadística.
I Elección de una distribución teórica.I Estimación de parámetros.I Tests de bondad de ajuste.I Simulación a partir de la distribución teórica.
![Page 4: Distribuciones Estadistica](https://reader036.vdocuments.site/reader036/viewer/2022082209/5695d5041a28ab9b02a3b6c6/html5/thumbnails/4.jpg)
Elección de una distribución
Utilizar los datos directamente:I Sólo reproduce datos históricos.I En general es una información insuficiente para realizar
simulaciones.I Es útil para comparar dos sistemas, para hacer una validación
del modelo existente con el simulado.Distribución empírica:
I Reproduce datos intermedios (datos continuos).I Es recomendable si no se pueden ajustar los datos a una
distribución teórica.
![Page 5: Distribuciones Estadistica](https://reader036.vdocuments.site/reader036/viewer/2022082209/5695d5041a28ab9b02a3b6c6/html5/thumbnails/5.jpg)
Inferencia estadística de un modelo
Inferencia estadística vs. distribución empírica:I Las distribuciones empíricas pueden tener irregularidades si hay
pocos datos, una distribución teórica suaviza los datos.I Puede obtenerse información aún fuera del rango de los datos
observados.I Puede ser necesario imponer un determinado tipo de
distribución, por el tipo de modelo que se desea simular.I No es necesario almacenar los datos observados ni las
correspondientes probabilidades acumuladas.I Es fácil modificar los parámetros.I Puede no existir una distribución adecuada.I Generación de valores extremos no deseados.
![Page 6: Distribuciones Estadistica](https://reader036.vdocuments.site/reader036/viewer/2022082209/5695d5041a28ab9b02a3b6c6/html5/thumbnails/6.jpg)
Distribuciones de probabilidad más utilizadas
Continuas:I Uniforme: Para cantidades que varían "aleatoriamente" entre
valores a y b, y que no se conocen más datos.I Exponencial: Tiempos entre llegadas de "clientes" a un sistema,
y que ocurren a una tasa constante. Tiempos de falla demáquinas.
I Gamma, Weibull: Tiempo de servicio, tiempos de reparación.I Normal: Errores. Sumas grandes→ Teorema central del límite.I Otras: (Law & Kelton, cap. 6)
Parámetros:I de posición: (normal, uniforme)I de escala: (normal, uniforme, exponencial, lognormal)I de forma: (Gamma, Weibull, lognormal)
![Page 7: Distribuciones Estadistica](https://reader036.vdocuments.site/reader036/viewer/2022082209/5695d5041a28ab9b02a3b6c6/html5/thumbnails/7.jpg)
Distribución uniforme
I f (x) = 1b−a I(a,b)(x)
I a: posición, b − a: escala.I Rango: a < x < b.I Media: a+b
2 .
I Varianza: (b−a)2
2 .
![Page 8: Distribuciones Estadistica](https://reader036.vdocuments.site/reader036/viewer/2022082209/5695d5041a28ab9b02a3b6c6/html5/thumbnails/8.jpg)
Distribución Gamma(α, β)
I f (x) = β−αxα−1 exp(−x/β)Γ(α)
I α: forma, β: escala.I Rango: x > 0.I Media: αβ.I Varianza: αβ2.I NOTACIÓN para βI α = 1⇒ Exponencial
![Page 9: Distribuciones Estadistica](https://reader036.vdocuments.site/reader036/viewer/2022082209/5695d5041a28ab9b02a3b6c6/html5/thumbnails/9.jpg)
Distribución Weibull (α, β)
I f (x) = αβ−αxα−1 e−(x/β)α
I α: forma, β: escala.I Rango: x > 0.I Media: β
αΓ( 1α
).
![Page 10: Distribuciones Estadistica](https://reader036.vdocuments.site/reader036/viewer/2022082209/5695d5041a28ab9b02a3b6c6/html5/thumbnails/10.jpg)
Distribución Normal(µ, σ2)
I f (x) =1√2πσ
exp(−(x − µ)2/(2σ2))
I µ: posición, σ: escala.I Rango: R.I Media: µ.I Varianza: σ2.
![Page 11: Distribuciones Estadistica](https://reader036.vdocuments.site/reader036/viewer/2022082209/5695d5041a28ab9b02a3b6c6/html5/thumbnails/11.jpg)
Distribución Lognormal(µ, σ2)
I f (x) = 1x√
2πσ2e−(log(x)−µ)2/(2σ2)
I σ: forma, µ: escala.I Rango: x > 0.I Media: eµ+σ2/2.I Varianza: e2µ+σ‘
(eσ2 − 1).
![Page 12: Distribuciones Estadistica](https://reader036.vdocuments.site/reader036/viewer/2022082209/5695d5041a28ab9b02a3b6c6/html5/thumbnails/12.jpg)
Distribuciones de probabilidad más utilizadas
Discretas:I Bernoulli.I Uniforme discreta.I Geométrica: número de observaciones hasta detectar el primer
error.I Binomial negativa: número de observaciones hasta detectar el
n-ésimo error.I Poisson: Número de eventos en un intervalo de tiempo, si
ocurren a tasa constante.
![Page 13: Distribuciones Estadistica](https://reader036.vdocuments.site/reader036/viewer/2022082209/5695d5041a28ab9b02a3b6c6/html5/thumbnails/13.jpg)
Distribución Binomial
n = 5, p = 0.1 n = 5, p = 0.5 n = 5, p = 0.8
![Page 14: Distribuciones Estadistica](https://reader036.vdocuments.site/reader036/viewer/2022082209/5695d5041a28ab9b02a3b6c6/html5/thumbnails/14.jpg)
Distribución Geométrica
p = 0.25 p = 0.5
![Page 15: Distribuciones Estadistica](https://reader036.vdocuments.site/reader036/viewer/2022082209/5695d5041a28ab9b02a3b6c6/html5/thumbnails/15.jpg)
Distribución Poisson
![Page 16: Distribuciones Estadistica](https://reader036.vdocuments.site/reader036/viewer/2022082209/5695d5041a28ab9b02a3b6c6/html5/thumbnails/16.jpg)
Distribución Poisson
Corresponde a λ = 25.
![Page 17: Distribuciones Estadistica](https://reader036.vdocuments.site/reader036/viewer/2022082209/5695d5041a28ab9b02a3b6c6/html5/thumbnails/17.jpg)
Distribución empíricaI Supongamos que se tienen disponibles los datos observados
Y1 = y1, Y2 = y2, . . . ,Yn = yn Y1,Y2, . . . ,Yn, se define ladistribución empírica de la muestra a la función
Fe(x) =#{i | Yi ≤ x}
n.
I Fe(x): proporción de valores observados menores o iguales a x .I Si se ordena los datos en forma creciente :
y(j) = j − ésimo valor más pequeño
y(1) < y(2) < · · · < y(n).
Distribución empírica ⇒ Fe(x) =
0 x < y(1)1n y(1) ≤ x < y(2)
...jn y(j) ≤ x < y(j+1)
...1 y(n) ≤ x
![Page 18: Distribuciones Estadistica](https://reader036.vdocuments.site/reader036/viewer/2022082209/5695d5041a28ab9b02a3b6c6/html5/thumbnails/18.jpg)
Gráficamente
F (x)
y(1) y(3)y(2) y(4) y(5)
1
![Page 19: Distribuciones Estadistica](https://reader036.vdocuments.site/reader036/viewer/2022082209/5695d5041a28ab9b02a3b6c6/html5/thumbnails/19.jpg)
Técnicas de prueba de independencia
Para ciertos tests, es necesario asumir independencia de los datosobservados.Ejemplos de no independencia:
I Datos de temperaturas a lo largo de un día.I Tiempos de demora en una cola de espera.
TécnicasI Gráficos de correlación: ρj .I Diagramas de dispersión (scattering): (Xi ,Xi+1).I Tests no paramétricos.
![Page 20: Distribuciones Estadistica](https://reader036.vdocuments.site/reader036/viewer/2022082209/5695d5041a28ab9b02a3b6c6/html5/thumbnails/20.jpg)
Inferencia estadística de un modelo1. Elegir una o más distribuciones apropiadas.2. Estimación de parámetros de la distribución elegida.3. Pruebas (tests) de bondad de ajuste.
I Hipótesis nula: Fe(x) es “cercana” a F (x).I Estadístico de Kolmogorov-Smirnov
D ≡ maxx|Fe(x)− F (x)| , −∞ < x <∞.
4. Si es necesario, corregir la distribución adoptada.
Elegir una distribuciónI Conocer el origen de los datos.I Estimar algunas medidas a partir de los datos:
I Media, mediana, máximo y mínimo, coeficiente de variación,desviación estándar, coeficiente de asimetría.
I Histograma.I q-cuantiles, diagramas de caja (box-plots)I Q −Q plots y P − P plots.
![Page 21: Distribuciones Estadistica](https://reader036.vdocuments.site/reader036/viewer/2022082209/5695d5041a28ab9b02a3b6c6/html5/thumbnails/21.jpg)
Medidas útiles
Parámetro Estimador EstimaMin, Max X(1), X(n) rangoMedia µ X (n) Tendencia central
Mediana m =
{X(n+1)/212 (Xn/2 + X(n/2+1))
Tendencia central.
Varianza σ2 S2(n) Variabilidad
c.v.=σµ cv(n) =
√S2(n)
X(n)Variabilidad
τ τ = S2(n)
X(n)Variabilidad
Asimetría ν = E [(X−µ)3](σ2)3/2 ν(n) =
∑i (Xi−X(n))3/n[S2(n)]3/2 Simetría