variable aleatoria discreta y continuas unidad 1

17
1 Instituto tecnológico de Campeche Ing. Química Iván Alberto Aguirre medina Análisis de datos experimentales Misión Formar Ingenieros químicos con una sólida preparación científico- tecnológica y una conciencia social que les permita contribuir al desarrollo nacional sustentable y a incrementar la calidad de vida del ser humano. Visión Ser el mejor programa de Ingeniería Química de Latinoamérica, gozar de gran prestigio a nivel mundial, estar acreditado, por la alta calidad científica, tecnológica y humana de sus egresados, quienes ejercen un gran impacto en su entorno laboral y caracterizarse por una interacción dinámica con el sector industrial

Upload: alvertho-medina

Post on 10-Jul-2015

1.745 views

Category:

Documents


2 download

TRANSCRIPT

Page 1: Variable aleatoria discreta y continuas unidad 1

1

Instituto tecnológico de

Campeche

Ing. Química

Iván Alberto Aguirre medina

Análisis de datos experimentales

Misión

Formar Ingenieros químicos con una sólida preparación científico-tecnológica y una conciencia social que les permita contribuir al desarrollo nacional sustentable y a incrementar la calidad de vida del ser humano.

Visión

Ser el mejor programa de Ingeniería Química de Latinoamérica, gozar de gran prestigio a nivel mundial, estar acreditado, por la alta calidad científica, tecnológica y humana de sus egresados, quienes ejercen un gran impacto en su entorno laboral y caracterizarse por una interacción dinámica con el sector industrial

Page 2: Variable aleatoria discreta y continuas unidad 1

2

Índice

Variable aleatoria discreta--------------------------------------------3

Distribución uniforme ----------------------------------------------------------------------------4

Distribución binomial -----------------------------------------------------------------------------4

Distribución multinomial ------------------------------------------------------------------------6

Distribución hipergeométrica-------------------------------------------------------------------6

Distribución multihipergeométrica------------------------------------------------------------8

Distribución de poisson--------------------------------------------------------------------------8

Variable aleatoria continúa---------------------------------------10

Distribución normal o de Gauss-----------------------------------------------------------------------------------11

Distribución exponencial---------------------------------------------------------------------------------------------13

Distribución Chi-cuadrado-------------------------------------------------------------------------------------------14

Distribución T de Student--------------------------------------------------------------------------------------------15

Conclusión---------------------------------------------------------------------------17

Biografía------------------------------------------------------------------------------17

Page 3: Variable aleatoria discreta y continuas unidad 1

3

Variable Aleatoria Discreta

Las variables aleatorias pueden ser discretas y continuas. trataremos de explicar extensamente

las variables aleatorias continuas (v. a. c.), pero de momento, con el objeto de visualizar la

diferencia entre ellas, podemos decir que las discretas surgen generalmente al contar, mientras

que las continuas aparecen cuando se mide.

na variable aleatoria continua teóricamente puede asumir cualquier valor entre dos límites dados, o

sea que sus variaciones son infinitesimales, mientras que en las variables aleatorias discretas

existen “saltos” o “interrupciones” entre los valores que puede tomar.

De acuerdo a lo anterior podemos decir que:

Una variable aleatoria X es discreta, si solamente puede tomar un conjunto numerable de valores.

Como ejemplos de variables aleatorias discretas podemos mencionar: el número de libros en una

biblioteca, el número de habitantes en una población, la cantidad de dinero que una persona trae

En su bolsillo, el número de aves en un gallinero, el número de admisiones diarias a un hospital, el

número de accidentes automovilísticos en una carretera durante un año, etc.

Sea X una variable aleatoria asociada con un experimento aleatorio. Si el resultado de un

experimento es a, entonces decimos que en esta prueba la variable aleatoria X ha tomado el valor

a, o que hemos observado el valor X = a.

Una variable aleatoria tiene las siguientes propiedades:

1. La variable aleatoria X es un evento que se define en el espacio muestral S del experimento y

sus valores son números reales.

2. Sea a cualquier número real y sea I cualquier intervalo de S. Entonces el conjunto de todos los

valores para los que X = a tiene una probabilidad bien definida y lo mismo se cumple para todos los

valores de X que están en I.

Ejemplo 4. 1. Sea el experimento de lanzar 3 veces una moneda y representemos por X el evento

del número de caras que aparecen. Encontrar los valores que puede tomar la variable aleatoria.

Solución.

El espacio muestral de lanzar 3 veces una moneda es:

S = { ccc, cc+, c+c, +cc, c++, +c+, ++c, +++}

Si solamente nos interesa el número de caras que aparecen, entonces al punto muestral (+++) le

corresponde el valor cero porque no hay ninguna cara, a cada punto muestral donde hay una cara

(c++, +c+, ++c) le corresponde el valor 1 y así los demás puntos muestrales. Por lo tanto:

X(+++) = 0

(c++) = X(+x+) = X(++c) = 1

X(cc+) = X(c+c) = X(+cc) = 2

Page 4: Variable aleatoria discreta y continuas unidad 1

4

X(ccc) = 3

Distribución uniforme

La distribución uniforme es la que corresponde a una variable que toma todos sus valores, x1, x2... , xk, con igual probabilidad; el espacio muestral debe ser finito.

Si la variable tiene k posibles valores, su función de probabilidad sería:

Donde k es el parámetro de la distribución (un parámetro es un valor que sirve para determinar la función de probabilidad o densidad de una variable aleatoria

La media y la varianza de la variable uniforme se calculan por las expresiones:

El histograma de la función toma el aspecto de un rectángulo, por ello, a la distribución uniforme se le suele llamar distribución rectangular.

Distribución binomial

La distribución binomial es típica de las variables que proceden de un experimento que cumple las siguientes condiciones:

1) El experimento está compuesto de n pruebas iguales, siendo n un número natural fijo.

2) Cada prueba resulta en un suceso que cumple las propiedades de la variable binómica o de Bernouilli, es decir, sólo existen dos posibles resultados, mutuamente excluyentes, que se denominan generalmente como éxito y fracaso.

Page 5: Variable aleatoria discreta y continuas unidad 1

5

3) La probabilidad del ‚éxito (o del fracaso) es constante en todas las pruebas. P(éxito) = p ; P(fracaso) = 1 - p = q

4) Las pruebas son estadísticamente independientes,

En estas condiciones, la variable aleatoria X que cuenta el número de ‚éxitos en las n pruebas se llama variable binomial. Evidentemente, el espacio muestra estar compuesto por los números enteros del 0 al n. Se suele decir que una variable binómica cuenta objetos de un tipo determinado en un muestreo de n elementos con reemplazamiento.

La función de probabilidad de la variable binomial se representa como b(x,n,p) siendo n el número de pruebas y p la probabilidad del ‚éxito. n y p son los parámetros de la distribución.

La manera más fácil de calcular de valor de números combinatorios, como los incluidos en la expresión anterior, es utilizando el triángulo de Tartaglia

La media y la varianza de la variable binomial se calculan como:

Media = μ = n p

Varianza = σ2 = n p q

Gráficamente el aspecto de la distribución depende de que sea o no simétrica Por ejemplo, el caso en que n = 4:

Page 6: Variable aleatoria discreta y continuas unidad 1

6

Distribución multinomial

La distribución multinomial es esencialmente igual a la binomial con la única diferencia de que cada prueba tiene más de dos posibles resultados mutuamente excluyentes.

Si tenemos K resultados posibles (Ei , i = 1, ... , K) con probabilidades fijas (pi , i = 1, ... , K), la variable que expresa el número de resultados de cada tipo obtenidos en n pruebas independientes tiene distribución multinomial.

La probabilidad de obtener x1 resultados E1, x2 resultados E2, etc. se representa como:

Los parámetros de la distribución son p1,..., pK y n.

Distribución hipergeométrica

Una variable tiene distribución hipergeométrica si procede de un experimento que cumple las siguientes condiciones:

1) Se toma una muestra de tamaño n, sin reemplazamiento, de un conjunto finito de N objetos.

2) K de los N objetos se pueden clasificar como ‚éxitos y N - K como fracasos.

Page 7: Variable aleatoria discreta y continuas unidad 1

7

X cuenta el número de ‚éxitos obtenidos en la muestra. El espacio muestral es el conjunto de los números enteros de 0 a n, ó de 0 a K si K < n.

En este caso, la probabilidad del ‚éxito en pruebas sucesivas no es constante pues depende del resultado de las pruebas anteriores. Por tanto, las pruebas no son independientes entre sí.

La función de probabilidad de la variable hipergeométrica es:

Los parámetros de la distribución son n, N y K.

Los valores de la media y la varianza se calculan según las ecuaciones:

Si n es pequeño, con relación a N (n << N), la probabilidad de un ‚éxito variar muy poco de una prueba a otra, así pues, la variable, en este caso, es esencialmente binomial; en esta situación, N suele ser muy grande y los números combinatorios se vuelven prácticamente inmanejables, así pues, la probabilidades se calculan más cómodamente aproximando por las ecuaciones de una binomial con p = K / N.

La media de la variable aproximada (μ = n p = n (K / N)) es la misma que la de la variable antes de la aproximación; sin embargo, la varianza de la variable binomial es ligeramente superior a la de la hipergeométrica.

El factor por el que difieren ser siempre menor que 1 y tan próximo a 1 como cierto sea que n << N.

El aspecto de la distribución es bastante similar al de la binomial. Como ejemplo, mostramos los casos análogos a los de las binomiales del apartado anterior (p inicial = 0,25 y n = 4)

Page 8: Variable aleatoria discreta y continuas unidad 1

8

Distribución multihipergeométrica

Este variable se define igual que la hipergeométrica con la única diferencia de que se supone que el conjunto de objetos sobre el que se muestrea se divide en R grupos de A1, A2,..., AR objetos y la variable describe el número de objetos de cada tipo que se han obtenido (x1, x2,..., xR)

Esta situación es análoga a la planteada en el caso de la distribución multinomial. La función de probabilidad es:

Distribución de poisson

Una variable de tipo poisson cuenta ‚éxitos (es decir, objetos de un tipo determinado) que ocurren en una región del espacio o del tiempo.

El experimento que la genera debe cumplir las siguientes condiciones:

1. El número de éxitos que ocurren en cada región del tiempo o del espacio es independiente de lo que ocurra en cualquier otro tiempo o espacio disjunto del anterior.

2. La probabilidad de un ‚éxito en un tiempo o espacio pequeño es proporcional al tamaño de este y no depende de lo que ocurra fuera de él.

3. La probabilidad de encontrar uno o más ‚éxitos en una región del tiempo o del espacio tiende a cero a medida que se reducen las dimensiones de la región en estudio.

Como consecuencia de estas condiciones, las variables Poisson típicas son variables en las que se cuentan sucesos raros.

Page 9: Variable aleatoria discreta y continuas unidad 1

9

La función de probabilidad de una variable Poisson es:

El parámetro de la distribución es λ que es igual a la media y a la varianza de la variable.

Esta característica puede servirnos para identificar a una variable Poisson en casos en que se presenten serias dificultades para verificar los postulados de definición.

La distribución de Poisson se puede considerar como el límite al que tiende la distribución

binomial cuando n tiende a y p tiende a 0, siendo np constante (y menor que 7); en esta situación sería difícil calcular probabilidades en una variable binomial y, por tanto, se utiliza una aproximación a través de una variable Poisson con media l = n p.

La varianza de la variable aproximada es ligeramente superior a la de la variable binomial.

Las variables Poisson cumplen la propiedad de que la suma de variables Poisson independientes es otra Poisson con media igual a la suma las medias.

El aspecto de la distribución depende muchísimo de la magnitud de la media. Como ejemplo, mostramos tres casos con λ = 0,5 (arriba a la izquierda), λ = 1,5 (arriba a la derecha) y λ = 5 (abajo) Obsérvese que la asimetría de la distribución disminuye al crecer λ y que, en paralelo, la gráfica empieza a tener un aspecto acampanado.

Page 10: Variable aleatoria discreta y continuas unidad 1

10

Variable aleatoria continúa

Una variable aleatoria X es continua si su función de distribución es una función continua.

En la práctica, se corresponden con variables asociadas con experimentos en los cuales la variable

medida puede tomar cualquier valor en un intervalo: mediciones biométricas, intervalos de tiempo,

áreas, etc.

Ejemplos

Resultado de un generador de números aleatorios entre 0 y 1. Es el ejemplo más sencillo que

podemos considerar, es un caso particular de una familia de variables aleatorias que tienen una

distribución uniforme en un intervalo [a, b]. Se corresponde con la elección al azar de cualquier

valor entre a y b.

Estatura de una persona elegida al azar en una población. El valor que se obtenga será una

medición en cualquier unidad de longitud (m, cm, etc.) dentro de unos límites condicionados por la

naturaleza de la variable. El resultado es impredecible con antelación, pero existen intervalos de

valores más probables que otros debido a la distribución de alturas en la población. Más adelante

veremos que, generalmente, variables biométricas como la altura se adaptan un modelo de

distribución denominado distribución Normal y representado por una campana de Gauss.

Dentro de las variables aleatorias continuas tenemos las variables aleatorias absolutamente

continuas.

Diremos que una variable aleatoria X continua tiene una distribución absolutamente continua si

existe una función real f, positiva e integrable en el conjunto de números reales, tal que la función

de distribuciónF de X se puede expresar como

Una variable aleatoria con distribución absolutamente continua, por extensión, se clasifica como

variable aleatoria absolutamente continua.

En el presente manual, todas las variables aleatorias continuas con las que trabajemos pertenecen al grupo de las variables absolutamente continuas, en particular, los ejemplos y casos expuestos

Distribución normal o de Gauss

La distribución normal fue definida por De Moivre en 1733 y es la distribución de mayor importancia en el campo de la estadística.

Una variable es normal cuando se ajusta a la ley de los grandes números, es decir, cuando sus valores son el resultado de medir reiteradamente una magnitud sobre la que influyen infinitas causas de efecto infinitesimal.

Las variables normales tienen una función de densidad con forma de campana a la que se llama campana de Gauss.

Su función de densidad es la siguiente:

Page 11: Variable aleatoria discreta y continuas unidad 1

11

Los parámetros de la distribución son la media y la desviación típica, μ y σ, respectivamente. Como consecuencia, en una variable normal, media y desviación típica no deben estar correlacionadas en ningún caso (como desgraciadamente ocurre en la inmensa mayoría de las variables aleatorias reales que se asemejan a la normal.

La curva normal cumple las siguientes propiedades:

1) El máximo de la curva coincide con la media.

2) Es perfectamente simétrica respecto a la media (g1 = 0).

3) La curva tiene dos puntos de inflexión situados a una desviación típica de la media. Es convexa entre ambos puntos de inflexión y cóncava en ambas colas.

4) Sus colas son asintóticas al eje X.

Para calcular probabilidades en intervalos de valores de la variable, habría que integrar la función de densidad entre los extremos del intervalo. por desgracia (o por suerte), la función de densidad normal no tiene primitiva, es decir, no se puede integrar. Por ello la única solución es referirse a tablas de la función de distribución de la variable (calculadas por integración numérica)

Page 12: Variable aleatoria discreta y continuas unidad 1

12

Estas tablas tendrían que ser de triple entrada (μ, σ, valor) y el asunto tendría una complejidad enorme.

Afortunadamente, cualquier que sea la variable normal, X, se puede establecer una correspondencia de sus valores con los de otra variable con distribución normal, media 0 y varianza 1, a la que se llama variable normal tipificada o Z. La equivalencia entre ambas variables se obtiene mediante la ecuación:

La función de distribución de la variable normal tipificada está tabulada y, simplemente, consultando en las tablas se pueden calcular probabilidades en cualquier intervalo que nos interese.

De forma análoga a lo pasaba con las variables Poisson, la suma de variables normales independientes es otra normal.

Histograma de una normal idealizada Histograma de una muestra de una variable normal

Distribución Gamma (Γ)

La distribución gamma se define a partir de la función gamma, cuya ecuación es:

La función de densidad de la distribución gamma es:

Page 13: Variable aleatoria discreta y continuas unidad 1

13

α y β son los parámetros de la distribución.

La media y la varianza de la variable gamma son:

Distribución exponencial

Es un caso particular de la distribución gamma cuando α = 1. Su función de densidad es:

Su parámetro es β.

La media y la varianza de la distribución exponencial son:

Page 14: Variable aleatoria discreta y continuas unidad 1

14

Distribución Chi-cuadrado

Es otro caso particular de la distribución gamma para el caso β = 2 y α = n / 2, siendo n un número natural.

Su función de densidad es:

El parámetro de la distribución es y su media y su varianza son, respectivamente:

Otra forma de definir la distribución es la siguiente: Supongamos que tenemos n

variables aleatorias normales independientes, X1,..., Xn, con media μi y varianza (i = 1 ... n), la variable definida como

tiene distribución con n grados de libertad y se le denomina n.

Variables chi-cuadrado con valores de progresivamente

mayores son cada vez menos asimétricas.

Page 15: Variable aleatoria discreta y continuas unidad 1

15

Distribución T de Student

Supongamos dos variables aleatorias independientes, una normal tipificada, Z , y otra con distribución con grados de libertad, la variable definida según la ecuación:

tiene distribución t con grados de libertad.

La función de densidad de la distribución t es:

El parámetro de la distribución t es

Esta distribución es simétrica respecto al eje Y y sus colas se aproximan asintóticamente al eje X. Es similar a la distribución Z salvo que es platicúrtica y, por tanto, más aplanada.

Cuando n tiende a infinito, t tiende asintóticamente a Z y se pueden considerar prácticamente iguales para valores de n mayores o iguales que 30..

Variables T con valores de progresivamente mayores

son cada vez menos platicúrticas

Page 16: Variable aleatoria discreta y continuas unidad 1

16

Comparación entre la variable T y la normal tipificado.

Distribución F de Snedecor

Sean U y V dos variables aleatorias independientes con distribución con 1 y 2 grados de libertad, respectivamente. La variable definida según la ecuación:

tiene distribución F con 1, 2 grados de libertad.

La función de densidad de la distribución F es:

Los parámetros de la variable F son sus grados de libertad 1 y 2.

Las distribuciones F tienen una propiedad que se utiliza en la construcción de tablas que es la siguiente:

Llamemos f al valor de una distribución F con 1 y 2 grados de libertad que cumple la condición, P(F > f ) = α; llamemos f al valor de una distribución F con 1 y 2 grados de libertad que cumple la condición, P(F > f ) = 1- α. Ambos valores están relacionados de modo que uno es el inverso del otro.

Page 17: Variable aleatoria discreta y continuas unidad 1

17

Variables F con distintos valores de 1, 2

Conclusión

Las variables aleatorias suelen tomar valores reales, pero se pueden considerar valores

aleatorios como valores lógicos, funciones... El término elemento aleatorio se utiliza para

englobar todo ese tipo de conceptos relacionados. Un concepto relacionado es el

de proceso estocástico, un conjunto de variables aleatorias ordenadas (habitualmente por

orden o tiempo).

Biografía

http://www.slideshare.net/colcaxsiempre/variables-aleatorias-discretas-y-continuas

http://www.itapizaco.edu.mx/~joseluis/apuntes/estadistica/distribuciones%20discretas.pdf

http://www.ditutor.com/estadistica/variables_tipos.html

http://www.dm.uba.ar/materias/estadistica_Q/2008/1/EstadQuimVsAsContinuas.pdf