1.4. distribuciones discretas notables · : variables aleatorias y distribuciones de probabilidad...

28
: VARIABLES ALEATORIAS Y DISTRIBUCIONES DE PROBABILIDAD 36 1.4. Distribuciones discretas notables 1.4.1. Distribución uniforme discreta Es la distribución de probabilidad de una variable aleatoria que toma un número finito k de valores, siendo todos equiprobables. Su función de probabilidad es de la forma: X x 1 x 2 x 3 ...... ........ x k PX x i ( ) = 1 k 1 k 1 k ....... ........ 1 k y su media y varianza son: µ = = = = = = = EX xp x k k x i i i k i i k i i k [ ] 1 1 1 1 1 σ µ µ µ 2 2 1 2 1 2 1 1 1 = = = = = = = VX x p x k k x i i i k i i k i i k [ ] ( ) ( ) ( ) Ejemplo: Si X = ”Resultado obtenido al lanzar un dado equilibradoµ = = = = = = = EX px i i i i k i [ ] , 1 1 6 1 6 1 6 21 35 σ µ 2 2 1 2 1 6 1 6 35 2 91 = = = = = = VX p x i i i i k i [ ] ( ) ( ,) ,

Upload: vuanh

Post on 15-Oct-2018

258 views

Category:

Documents


2 download

TRANSCRIPT

: VARIABLES ALEATORIAS Y DISTRIBUCIONES DE PROBABILIDAD

36

1.4. Distribuciones discretas notables

1.4.1. Distribución uniforme discreta

Es la distribución de probabilidad de una variable aleatoria que tomaun número finito k de valores, siendo todos equiprobables. Sufunción de probabilidad es de la forma:

X x1 x2 x3...... ........ xk

P X xi( )=1k

1k

1k

....... ........ 1k

y su media y varianza son:

µ = = = == = =∑ ∑ ∑E X x p x

k kxi i

i

k

ii

k

ii

k

[ ]1 1 1

1 1

σ µ µ µ2 2

1

2

1

2

1

1 1= = − = − = −= = =∑ ∑ ∑V X x p x

k kxi i

i

k

ii

k

ii

k

[ ] ( ) ( ) ( )

Ejemplo:

Si X = ”Resultado obtenido al lanzar un dado equilibrado”

µ = = = = == =∑ ∑E X p x ii ii

k

i[ ] ,

1 1

616

16

21 3 5

σ µ2 2

1

2

1

616

3 5 2 91= = − = − == =∑ ∑V X p x ii ii

k

i[ ] ( ) ( , ) ,

: VARIABLES ALEATORIAS Y DISTRIBUCIONES DE PROBABILIDAD

37

1.4.2. Distribución de Bernoulli

Es la distribución de probabilidad de una variable aleatoria que sóloadmite dos resultados “éxito” o “fracaso” ( 1 ó 0 ) siendo susprobabilidades respectivas p y 1-p, con 0 1≤ ≤p .

Su función de probabilidad es, por tanto:

f x P X x p p para xx x( ) ( ) ( )= = = − =−1 0 11 ó

o, expresada de otra forma:

f P X pf P X p

( ) ( )( ) ( )1 10 0 1= = == = = −

Su media y varianza vienen dadas por:

µ

σ µ

= = = + − =

= = − = − + − − = −

=

=

E X p x p p p

V X p x p p p p p p

i ii

k

i ii

k

[ ] • ( ) •

[ ] ( ) ( ) ( )( ) ( )

1

2 2 2 2

1

1 1 0

1 1 0 1

Ejemplo 1:

Si se realiza el experimento aleatorio consistente en lanzar una monedaequlibrada y se define la variable aleatoria:

X =RST01

si sale carasi sale cruz

entonces X Be≈ FHGIKJ

12

La función de probabilidad en este caso es:

P X

P X

( )

( )

= =

= = − =

1 12

0 1 12

12

y la media y varianza:

µ

σ

X

X

p

p p

= =

= − = =

12

1 12

12

14

2 ( )

: VARIABLES ALEATORIAS Y DISTRIBUCIONES DE PROBABILIDAD

38

Ejemplo 2:

Se realiza el experimento aleatorio consistente en lanzar un dado equilibrado yse define la variable aleatoria:

X =RST10

si sale múltiplo de 3si no sale múltiplo de 3

La función de probabilidad en este caso es:

P X

P X

( )

( )

= = =

= = − = =

UV||

W||

1 26

13

0 1 26

46

23

y por tanto:

X Be≈ FHGIKJ

23

: VARIABLES ALEATORIAS Y DISTRIBUCIONES DE PROBABILIDAD

39

1.4.3. Distribución binomial B(n,p)

Es la distribución de probabilidad de la variable aleatoria:X = “Número de éxitos obtenidos al repetir n veces un

experimento de Bernoulli, siendo p la probabilidad deéxito en cada experimento, y siendo cada repeticiónindependiente de las anteriores”

La variable binomial suele denotarse como:

X B n p≈ ( , )Obviamente, al realizar n experimentos sólo son posibles entre 0 yn éxitos, luego X n∈{ , , ,...., }0 1 2Su función de probabilidad es:

f x P X xnx

p p para x nn px n x

, ( ) ( ) ( ) ; , , ,....,= = =FHGIKJ − =−1 0 1 2

Es evidente que cada una de estas probabilidades es no negativa. Es fácilcomprobar también que la suma de todas las probabilidades para x = 0, 1, 2,...,n es 1. En efecto:

P X n P X P X P X nf f f nn

p pn

p pn

p pnn

p p

p p

n n n n n n

n

∈ = = + = + + = =

= + + + =

=FHGIKJ − +

FHGIKJ − +

FHGIKJ − + +

FHGIKJ − =

= − + =

− − − −

0 1 0 10 1

01

11

21 1

1 1

0 0 1 1 2 2

, ,..., ( ) ... ( )( ) ( ) ... ( )

( ) ( ) ( ) ...... ( )

( )

l qc h b g

b g(hemos empleado simplemente la expresión del desarrollo del binomio deNewton)

La media y varianza de la distribución binomial son:

µσ

X

X

n pn p p

= ⋅

= ⋅ ⋅ −2 1( )

: VARIABLES ALEATORIAS Y DISTRIBUCIONES DE PROBABILIDAD

40

Ejemplo:Se sabe que en una población de ballenas la proporción de machos es del 40%(o lo que es lo mismo, si se elige al azar un ejemplar de esta población, laprobabilidad de que sea macho es P(macho)=0.4). Supongamos que se eligenal azar 3 ejemplares de entre todas las capturas del pasado año. Determinar lafunción de probabilidad de la variable:

X = ”Número de machos entre los 3 elegidos”

Al elegir un individuo de la población y observar su sexo, solo hay dosresultados posibles: macho o hembra, con probabilidades respectivas 0.4 y 0.6.La variable X es, por tanto, B(3, 0.4), y:

P X xx

p p para x siendo p

P X P X

P X P X

x n x( ) ( ) ; , , , .

( ) . ( . ) . . ( ) . ( . ) . . .

( ) . ( . ) . . . ( ) .

= =FHGIKJ − = =

= =FHGIKJ = ⋅ ⋅ = = =

FHGIKJ = ⋅ ⋅ =

= =FHGIKJ = ⋅ ⋅ = = =

FHGIKJ

− −

31 0 1 2 3 0 4

030

0 4 0 6 1 1 0 216 0 216 131

0 4 0 6 3 0 4 0 36 0 432

232

0 4 0 6 3 016 0 6 0 288 333

0

0 3 0 1 3 1

2 3 2 4 0 6 0 4 0 0643 3 3 3( . ) . .− = =

: VARIABLES ALEATORIAS Y DISTRIBUCIONES DE PROBABILIDAD

41

1.4.4. Distribución binomial negativa BN(k,p)

Supongamos que un experimento de Bernoulli (con probabilidad pde éxito) se repite sucesivas veces independientes hasta que seobserva el k-ésimo éxito (por ejemplo, se tira una moneda al airesucesivas veces hasta que sale cara por k-ésima vez). Sedenomina distribución binomial negativa a la distribución deprobabilidad de la variable aleatoria:X = “Número de experimentos que ha sido necesario realizar

hasta obtener el k-ésimo éxito”La variable binomial negativa suele denotarse como:

X BN k p≈ ( , )Obviamente, para obtener k éxitos será necesario hacer comomínimo k experimentos. Por tanto X k k k∈ + +{ , , ,....}1 2

Ejemplo:Se sabe que en una población de ballenas la proporción de machos es del40%. Si estas ballenas son habitualmente solitarias, ¿cuál es la probabilidad deque para conseguir 3 machos haya que capturar 15 ejemplares?Sea

X=”Número de ejemplares que se capturan hasta conseguir tres machos”

De acuerdo con lo visto, Y≈BN(3, 0.4). Ahora bien, si es preciso capturar 15ejemplares para obtener el tercer macho, entonces debe ocurrir que entre los14 primeros ejemplares capturados haya 2 machos y 12 hembras, y que eldecimoquinto ejemplar capturado sea macho. Si llamamos

Y =”número de machos capturados entre 14 ballenas”Z = “Sexo del decimoquinto ejemplar”

se tiene que, debido a la independencia entre las capturas sucesivas:

P X P Y Z Macho P Y P Z Macho( ) ( " ") ( ) ( " ")= = = ∩ = = = ⋅ =15 2 2b gc hObviamente la variable Y sigue una distribución binomial B(14, 0.4), y la Z unadistribución de Bernoulli de parámetro 0.4. Por tanto:

P X P Y P Z Macho( ) ( ) ( " ") . . . . .= = = ⋅ = =FHGIKJ ⋅ ⋅ ⋅ =

FHGIKJ ⋅ ⋅15 2

142

0 4 0 6 0 4142

0 4 0 62 12 3 12

: VARIABLES ALEATORIAS Y DISTRIBUCIONES DE PROBABILIDAD

42

Razonando como en este ejemplo, es fácil ver que la expresióngeneral de la función de probabilidad de una variable condistribución binomial negativa BN(k,p) es:

P X x f x k pxk

p p para x k k kk x k( ) ( ; , ) ( ) ; , , , ....= = =−−FHGIKJ − = + +−1

11 1 2

La media y varianza de esta distribución son:

µ

σ

X

X

pk p

p

=

= −

1

122

( )

: VARIABLES ALEATORIAS Y DISTRIBUCIONES DE PROBABILIDAD

43

1.4.5. Distribución geométrica Geo(p)

Es una Binomial Negativa con k=1, y probabilidad p de éxito, estoes:X = “Número de experimentos independientes de Bernoulli que

es preciso realizar hasta que ocurre el primer éxito”Se denota como:

X Geo p≈ ( )Obviamente, para obtener el primer éxito es preciso realizar almenos un experimento. Por tanto X∈{1,2,3, ...}.Su función de probabilidad es de la forma:

P X x p p xx( ) ( ) ; , , ,.....= = − ⋅ =−1 1 2 31

y su media y varianza son:

22

1 1X X

pp p

µ σ −= =

Ejemplo:El 75% de los sujetos de una población pertenecen al grupo sanguíneo A+.Supongamos que los donantes de sangre llegan al azar al centro de extracción.Si se elige un día arbitrario, determinar la función de probabilidad de la variable: X =”nº de individuos a los que se les extrae sangre hasta conseguir uno con el

grupo A+”

1

1 1 0

2 1 1

3 1 2

4 1 3

( ) (0.75)( ) (1 )

( 1) (1 ) 0,25 0,75 0.75( 2) (1 ) 0, 25 0,75 0.1875( 3) (1 ) 0,25 0,75 0.046875( 4) (1 ) 0, 25 0,75 0.01171875

x

X Geo p GeoP X x p p

P X p pP X p pP X p pP X p p

≈ ≡= = −

= = − = ⋅ == = − = ⋅ == = − = ⋅ == = − = ⋅ =

Podemos interpretar estas probabilidades del siguiente modo: el 75% de losdías el primer individuo al que se extrae sangre es A+; el 18.75% de los días, elprimer A+ es el segundo individuo al que se pincha; el 4.68% de los días espreciso pinchar a 3 para conseguir el primer A+…

: VARIABLES ALEATORIAS Y DISTRIBUCIONES DE PROBABILIDAD

44

1.4.6. Distribución Hipergeométrica.

Supongamos que se dispone de una población finita de tamaño N,que está dividida en dos grupos (r éxitos y N-r fracasos). Sedenomina distribución Hipergeométrica a la distribución deprobabilidad de la variable aleatoria:

X = “Número de éxitos obtenidos al extraer al azar y sinreemplazamiento n objetos de esta población”

La variable con distribución hipergeométrica suele denotarse como:

( , , )X H n N r≈Si llamamos p a la proporción de éxitos en la población, esto es,

rpN

=

la distribución geométrica puede denotarse también como:

( , , )X H n N p≈La función de probabilidad de esta variable aleatoria es:

{ } { }( ) , 0, ( ) ,....., ,

r N rx n x

P X x x Max n N r Min r nNn

− − = = = − −

Su media y varianza vienen dadas por:

( ) ( ) ( )22

· ·

· (1 )( 1) ( 1)

X

X

n r n pNr N r n N n N n

n p pN N N

µ

σ

= =

− − −= = −

− −

NOTA: Es evidente que si en el experimento donde surge la distribución hipergeométrica serealiza reemplazamiento, la variable X considerada tendría distribución binomial. Debeseñalarse que, aún habiendo reemplazamiento, si N es grande es muy difícil que un mismoobjeto de la población sea elegido aleatoriamente dos ó más veces, lo que es equivalente aque no haya reemplazamiento. Ello significa que la distribución hipergeométrica se vapareciendo cada vez más a la binomial a medida que N crece.

: VARIABLES ALEATORIAS Y DISTRIBUCIONES DE PROBABILIDAD

45

Ejemplo:De una urna en la que hay 10 bolas blancas y 5 bolas negras, se extraen

8 bolas sin reemplazamiento. ¿Cual es la probabilidad de que entre estas ochohaya 4 bolas negras?

Sea:

X = “nº de bolas negras en la muestra” H(n,N,r) donde:

815

5

nNr

===

Entonces:

5 15 5 5 104 8 4 4 4

( 4) 0.163115 158 8

P X

− − = = = =

: VARIABLES ALEATORIAS Y DISTRIBUCIONES DE PROBABILIDAD

46

1.4.7. Distribución de Poisson P(λ)

Una variable aleatoria discreta se dice que es una variable dePoisson, si su función de probabilidad es de la forma:

P X xx

e xx

( )!

; , , , , ....= = =−λ λ 0 1 2 3

siendo λ un valor real positivo.Su media y su varianza son:

µ λσ λ

X

X

=

=2

La distribución de Poisson surge como límite de la distribuciónbinomial B(n,p) cuando n y p 0, a la vez que el productonp . En efecto, si X B(n,p) entonces:

0 0

lim ( ) lim (1 ) lim 1

! ( 1)...( 1)lim 1 lim 1( )! ! !

( 1)...( 1)lim

k n kk n k

n n np pnp np

k n k k n k

n n

n

n nP X k p p

k k n n

n n n n kn k k n n k n n

n n n kn

λ λ

λ λ

λ λ λ λ

−−

→∞ →∞ →∞→ →→ →

− −

→∞ →∞

→∞

= = − = − =

− − + = − = − = −

− − += 1!

1 1lim 1 1 ... 1 1 1! !

n kk

k

n kk k

n

k n

k ek n n n n k

λ

λ λ

λ λ λ λ

−−

→∞

− = − = ⋅ ⋅ − ⋅ ⋅ − − − =

Para entender el sentido real de este paso al límite consideremos elejemplo siguiente:

Ejemplo:En un bosque frondoso, donde todos los árboles son igualmente aptos paraque construyan sus nidos las aves de cierta especie, podemos suponer (en unaprimera aproximación) que el sitio donde se construye cada nido se elige alazar. Se sabe, además, que por término medio esas aves construyen 24 nidospor km2. Si elegimos un área con una extensión de 2 km2, ¿cuál es laprobabilidad de que en la misma se encuentren más de 50 nidos?

: VARIABLES ALEATORIAS Y DISTRIBUCIONES DE PROBABILIDAD

47

Para resolver esta cuestión, consideremos que en el área objeto de estudiotrazamos una cuadrícula lo suficientemente fina como para que en cadarecuadro sólo pueda haber como máximo un nido. De esta forma, el problemade cuántos nidos hay en esta área es equivalente al problema de determinarcuántos cuadros de la cuadrícula están ocupados (por un nido).

Dado que los nidos se sitúan completamente al azar, y en cada recuadro puedehaber (éxito) o no haber (fracaso) un nido, la variable:

X = “Número de recuadros del área ocupados por un nido”

sigue una distribución binomial B(n,p) donde n = número total de recuadros p = probabilidad de que un recuadro se encuentre ocupado por un nido.

Si bien sabemos cuánto vale n, no conocemos el valor de p. No obstante,sabemos que el número medio de nidos por km2 es de 24, y por tanto, elnúmero medio en una zona de 2 km2 será de 48. Este número medio deberácoincidir con la esperanza de la variable X, que al seguir una distribuciónbinomial es E[X]=np. Por tanto, np= 48, de donde,

48pn

=

Por tanto, la respuesta a nuestra pregunta sería:50

0

50 50

0 0

( 50) 1 ( 50) 1 ( )

48 481 (1 ) 1 1

kn kk

k n k

k k

P X P X p X k

n np p

k k n n

=

−−

= =

> = − ≤ = − = =

= − − = − −

∑ ∑Evidentemente el valor obtenido depende de n, esto es, del número derecuadros en que hayamos dividido nuestra área de estudio. Distintos valoresde n producirán distintas probabilidades. Podemos, pues, preguntarnos cuál esel valor n adecuado. Recordemos que la única restricción que hemos realizadoal definir n es que en cada recuadro pueda haber como máximo un solo nido;ello en la práctica significa que los recuadros deben ser muy pequeños, ó loque es lo mismo, que n debe ser muy grande. De ahí que la solución correcta

: VARIABLES ALEATORIAS Y DISTRIBUCIONES DE PROBABILIDAD

48

se obtendría al tomar en la expresión anterior el límite cuando n. Obsérveseque de la definición de p se sigue que cuando n ocurre que p0 a la vezque el producto np se mantiene constante e igual a 48. Este es justamente ellímite que conduce, como hemos visto, a la función de probabilidad de Poissoncon = np= 48. Por tanto:

50

0

50 5048

0 0048

( 50) 1 ( 50) 1 ( )

481 lim (1 ) 1 1 0.648 0.352!

k

kk n k

nk kpnp

P X P X p X k

np p e

k k

=

− −

→∞= =→=

> = − ≤ = − = =

= − − = − = − =

∑ ∑

Si quisiéramos calcular la probabilidad de que en esa zona no hubiese ningúnnido calcularíamos simplemente:

048 -2148( 0) 1.425164 10

0!P X e−= = = ⋅

La probabilidad de que hubiesen exactamente 50 nidos sería:50

48 48( 50) 0.0540569950!

P X e−= = =

En general, la distribución de Poisson constituye un modelo deprobabilidad adecuado para aquellas variables aleatorias quecuentan el número de puntos que se encuentran en cierto espaciocontinuo, siempre y cuando estos puntos se encuentren repartidoscompletamente al azar. A modo de ejemplo podemos citar:

− Número de nidos en una zona boscosa (los puntos son los nidos y elespacio continuo es el área donde se ubica la zona boscosa)

− Número de estrellas en cierta porción del firmamento (los puntos sonlas estrellas y el espacio continuo es el área que se está observando)

− Número de copépodos en un volumen de agua determinado (lospuntos son los copépodos y el espacio continuo donde se encuentranes el volumen de agua)

− Número de llamadas telefónicas recibidas en una centralita a lo largode un día (los puntos son los instantes en que se producen lasllamadas, y el espacio continuo en que se sitúan estos puntos es eltiempo transcurrido entre las 0 y las 24 horas)

− Número de peces que desovan en una zona de cría (los puntos sonlos peces y el espacio continuo en que se ubican es el volumen de lazona de cría)

NOTA: si la distribución de los puntos no fuese completamente al azar (porejemplo, si los peces tendiesen a desovar en grupo la posición de cada pez nosería completamente aleatoria, sino que dependería de donde estuviesen losdemás miembros del grupo) la distribución de Poisson no sería la adecuada.

: VARIABLES ALEATORIAS Y DISTRIBUCIONES DE PROBABILIDAD

49

La distribución de Poisson constituye una buena aproximación de labinomial B(n,p) cuando se dan las condiciones siguientes:

1) n es grande (n≥20)2) p es pequeño (p≤0.05)

en cuyo caso

( , ) ( )B n p P λ≅ , siendo n pλ = ⋅

Ejemplo:Supongamos que un microcircuito consta de 300 componentes, siendo laprobabilidad de fallo de cada uno de 0.005. Para que el microcircuito funcionetienen que estar operativos todos los componentes. ¿Cuál es la probabilidad deque falle el microcircuito?

Si llamamos:X = “Número de componentes que fallan en el microcircuito”se tiene que X B(300, 0.005).Por tanto:P(falle el microcircuito) = P(falle alguno de sus componentes) =

1-P(no falle ningún componente) = 1 – P(X = 0) =

= 0 300 0 3003001 0.005 (1 0.005) 1 0.995 1 0.2222922=0.7777078

0−

− − = − = −

Para obtener esta probabilidad hemos tenido que hallar 0.995 elevado a 300,cálculo que no es sencillo, incluso para una calculadora (aquí se ha obtenidoutilizando ordenador). Dado que se cumplen las condiciones 1 y 2 citadas másarriba, la variable X puede aproximarse mediante una distribución de Poissonde parámetro np = 1.5. Con esta aproximación:

P(fallo) =0

1.5 1.51 ( 0) 1 1 0.2231302 0.77686980!

P X e−− = = − = − =

Este valor sí que puede ser fácilmente obtenido con calculadora. La diferenciacon el valor exacto, obtenido antes, es de 0.0008379603. Por tanto vemos quela aproximación mediante la distribución de Poisson funciona razonablementebien y es aconsejable su uso cuando no se dispone de medios informáticosavanzados.

: VARIABLES ALEATORIAS Y DISTRIBUCIONES DE PROBABILIDAD

1.5. Distribuciones continuas notables

1.5.1. Distribución uniforme en (a,b)Una variable aleatoria X sigue una distribución uniforme en elintervalo real (a,b), y se denota X U(a,b), si y solo si su funciónde densidad de probabilidad viene dada por:

f x a b b asi a x b

en otro casoa b

b a

X

X

( ; , )

( )

= −< <R

S|T|

= +

= −

1

0

21

122 2

µ

σ

En la práctica, esta distribución corresponde a variables del tipo:X = “Resultado de elegir al azar un valor del intervalo (a,b), siendo

equiprobables todos los valores del mismo”

Ejemplo:X = “Disuna cuerde ambo

50

X U≈ ( , )2 6

tancia, medida desde el extremo inicial, a la que se rompeda homogénea de 1 metro cuando se tira con igual fuerzas extremos” U(0,1),

: VARIABLES ALEATORIAS Y DISTRIBUCIONES DE PROBABILIDAD

51

1.5.2. Distribución exponencialUna variable aleatoria X sigue una distribución exponencial deparámetro , y se denota X exp(), si y solo si su función dedensidad de probabilidad viene dada por:

f x e si x

en otro caso

x

X

X

( ) = >RS|T|

=

=

−1 0

0

2 2

θ

µ θσ θ

θ

X Exp≈ ( )2

En la práctica, esta distribución aparece asociada a variables quemiden la distancia entre sucesos puntuales que se dispersancompletamente al azar en un medio continuo y que, por tanto,tienen distribución de Poisson (tales como, por ejemplo, el tiempotranscurrido entre la caída de dos rayos sucesivos durante unatormenta, la distancia entre dos nidos de ave en un bosque, eltiempo transcurrido entre dos llamadas telefónicas, etc.).

Ejemplo:El número de rayos que caen durante la fase central de unatormenta tropical sigue una distribución de Poisson de media =22rayos por minuto. ¿Cuál es la probabilidad de que entre la caída dedos rayos sucesivos transcurran como mucho 3 segundos?

: VARIABLES ALEATORIAS Y DISTRIBUCIONES DE PROBABILIDAD

52

Si llamamos:

X = “Tiempo transcurrido entre dos rayos sucesivos”

debemos calcular la probabilidad de que X sea menor que 3. Para elloconsideremos la variable:

Y = “Número de rayos que caen en 3 segundos”Dado que durante la fase central de la tormenta caen por término medio 22

rayos por minuto, y 3 segundos es la vigésima parte de un minuto ( 120

min.),

cabe esperar que cada 3 segundos caigan, por término medio 122 1,120⋅ =

rayos. Por tanto la variable Y sigue una distribución de Poisson de parámetro1,1. Entonces:

1,1( 3) 1 ( 3) 1 ( 0) 1P X P X P Y e−≤ = − > = − = = −

(Hemos usado aquí el hecho de que el suceso {X>3}, esto es, que pasen másde 3 segundos entre dos rayos sucesivos, es igual que el suceso {Y=0}, que enun periodo de 3 segundos no caiga ningún rayo, y por tanto las probabilidadesde ambos sucesos coinciden).En general, si llamamos t al tiempo (en minutos) transcurrido entre dos rayossucesivos, la expresión anterior puede generalizarse como:

( ) 1 , 0tP X t e tλ−≤ = − ≥

Esta expresión es, por definición, la función de distribución de la variablealeatoria X:

( )( )F t P X t= ≤

y por tanto, la función de densidad será su derivada:

( ) '( ) , 0tf t F t e tλλ −= = ≥De esta forma, hemos comprobado que la función de densidad de ladistribución exponencial (de parámetro 1/) aparece asociada a la distanciaentre eventos puntuales cuyo número sigue una distribución de Poisson (deparámetro ).

: VARIABLES ALEATORIAS Y DISTRIBUCIONES DE PROBABILIDAD

53

1.5.3. Distribución gammaUna variable aleatoria X sigue una distribución Gamma deparámetros y , denotada como X Gamma(,), con >0 y >0,si y solo si su función de densidad de probabilidad viene dada por:

1

22

0( ) ( )

0

x

X

X

x e si xf x

en otro caso

αα ββ

α

αµβασβ

− −>= Γ

=

=

donde Γ( )a y e dya y= − −∞z 1

0 es la función Gamma, que cumple las siguientes

propiedades:i) Γ Γ( ) ( ) ( )a a a= − −1 1

ii) Γ( ) ( )!n n n N= − ∀ ∈1

X Gamma≈ ( , . )2 8 4

En el caso particular de que = n entero y =n, la variable X Gamma(n,n)es la que se obtiene como resultado de sumar n variables con distribuciónexponencial de idéntico parámetro . Siguiendo con el ejemplo de la páginaanterior el tiempo transcurrido hasta la caída de los próximos tres rayos de latormenta seguiría una distribución Gamma(3,322) Gamma(3,66).

: VARIABLES ALEATORIAS Y DISTRIBUCIONES DE PROBABILIDAD

54

1.5.4. Distribución betaUna variable aleatoria X sigue una distribución Beta de parámetros y , denotada como X Beta(,), con >0 y >0, si y solo si sufunción de densidad de probabilidad viene dada por:

f xx x si x

en otro caso

X

X

( )( )

( ) • ( )( )

( ) ( )

=+ − < <R

S|T|

=+

=+ + +

− −ΓΓ Γ

α βα β

µ αα β

σ αβα β α β

α β1 1

22

1 0 1

0

1

X Beta≈ ( . , . )4 2 2 3

Una de las principales aplicaciones de la distribución Beta es elajuste de distribuciones teóricas a datos empíricos, ya que sufunción de distribución adopta formas muy diversas según cuálessean los valores de y , tal como podemos comprobar en lossiguientes gráficos:

: VARIABLES ALEATORIAS Y DISTRIBUCIONES DE PROBABILIDAD

55

0.0 0.2 0.4 0.6 0.8 1.0

0.6

0.8

1.0

1.2

1.4

Beta(1,1)

y

x6

0.0 0.2 0.4 0.6 0.8 1.0

1.0

1.5

2.0

2.5

3.0

Beta(0.5,0.5)

y

x5

0.0 0.2 0.4 0.6 0.8 1.0

0.0

0.5

1.0

1.5

2.0

Beta(2,1)

y

x4

0.0 0.2 0.4 0.6 0.8 1.0

0.0

0.5

1.0

1.5

2.0

Beta(3,4)

y

x3

0.0 0.2 0.4 0.6 0.8 1.0

01

23

45

6

Beta(0.5,1.5)

y

x2

0.0 0.2 0.4 0.6 0.8 1.0

0.0

0.5

1.0

1.5

2.0

2.5

3.0

Beta(1,3)

y

x

: VARIABLES ALEATORIAS Y DISTRIBUCIONES DE PROBABILIDAD

56

1.5.5. Distribución normalUna variable aleatoria X sigue una distribución Normal deparámetros (media) y (desviación típica), y se denota comoX N(,), con >0, si y solo si su función de densidad deprobabilidad viene dada por:

f x e xx

X

X

( ) = − ∞ < < ∞RS|T|

=

=

−−FHGIKJ1

2

12

2 2

2

σ π

µ µσ σ

µσ

Nótese que f(x) es una función simétrica respecto a µ, esto es f(µ-x) = f(µ+x)

En la práctica, la distribución normal aparece asociada a variablesaleatorias que se comportan de tal manera que lo más probable esobservar valores en torno a la media; y que los valores cada vezmás alejados de la media, bien sea hacia arriba o hacia abajo, vansiendo progresivamente más difíciles de observar.Muchas variables biológicas se comportan aproximadamente deesta forma: la talla, el peso, la temperatura corporal, etc. Tambiénse comportan de esta manera los errores de medida. La distribuciónnormal es una de las más frecuentes en la naturaleza, cosa que sejustifica por la acción del teorema central del límite, que veremosmás adelante. Este teorema indica que si una variable se obtienecomo resultado de la suma de efectos de muchas otras variablesindependientes, la variable resultante tiene necesariamentedistribución normal.

El aspecto de lafunción de densidad dela distribución normales el de una curva enforma de campana,como la que semuestra en la gráficade la izquierda,obtenida para el casoparticular en que X ≈N(5,2)

-2 0 2 4 6 8 10 12

0.00

0.05

0.10

0.15

0.20

µ

x7

: VARIABLES ALEATORIAS Y DISTRIBUCIONES DE PROBABILIDAD

La distribución normal estándarEl caso particular en que X sigue una distribución normal conµ σ= =0 1y se conoce con el nombre de distribución normalestándar:

f x e xx

X

X

( ) = − ∞ < < ∞RST

==

−12

01

12

2

2

πµσ

La distribución normal estándar se suele denotar con la letra Z, y talcomo se aprecia en la siguiente gráfica, correspondiente a dichadistribución, prácticamente toda su probabilidad se concentra entre–4 y 4, esto es, P Z( )− ≤ ≤ ≅4 4 1:

57

: VARIABLES ALEATORIAS Y DISTRIBUCIONES DE PROBABILIDAD

Teorema: (Tipificación de una variable normal)Si X ≈ N(,), entonces:

Z X N= − ≈µσ

( , )0 1

Consecuencia importante de este teorema:Este teorema nos permite calcular las probabilidades asociadas acualquier variable aleatoria N(,) en función de las probabilidadesasociadas a la normal estándar N(0,1). En efecto:

P X x P X x P X x P Z x( )≤ = − ≤ − = − ≤ −FHG

IKJ = ≤ −FHG

IKJµ µ µ

σµ

σµ

σb g

Dicho de otro modo, si llamamos:

la igualdad anterior puede e

FX (

Recordemos que al procesdividirla por su valor típico sLos valores de la función dese encuentran tabulados. FX(x) para una variable X tipificar el valor de x, restán

el correspondiente valor FZFHG

FX (x) = P(X≤ )

FZ (z) = P(Z≤ z

x

58

xpresarse como:

x F xZ) = −FHGIKJ

µσ

o de restar a una variable su media ye le denomina tipificación de la variable. distribución FZ (z) de la variable N(0,1)De esta forma, si deseamos calcular≈ N(,), simplemente procederemos adole µ y dividiendo por σ, y buscaremos

x − IKJ

µσ

en la mencionada tabla.

),

: VARIABLES ALEATORIAS Y DISTRIBUCIONES DE PROBABILIDAD

59

Sumas y Promedios de variables con distribución normal.

Una propiedad importante de la distribución normal es la siguiente:Si X1, X2, ..., Xn son variables aleatorias independientes tales que Xi≈ N(µi,σi) ∀i, entonces:

S X X X N

XX X X

nN

n n

n n n n

nn n n

= + + + ≈ + + + + + +

=+ + +

≈+ + + + + +F

HGIKJ

1 2 1 2 12

22 2

1 2 1 2 12

22 2

... ... , ...

... ...,

...

µ µ µ σ σ σ

µ µ µ σ σ σ

e j

En el caso particular de que todas las Xi tengan las mismas media yvarianza, esto es, µ µ σ σi i i= = ∀, 2 2 , las expresiones anteriores sereducen a:

S X X X N n n

X X X Xn

Nn

n n

nn

= + + + ≈

=+ + +

≈ FHGIKJ

1 2

1 2

... ,

...,

µ σ

µ σ

d i

Cambio de escala de variables con distribución normal.Si una variable normal X se cambia de escala (se multiplica por unaconstante k, la variable resultante es también normal con la media yla desviación típica multiplicadas por el mismo factor de escala, estoes:

Si X N Y k X N k k≈ ⇒ = ⋅ ≈( , ) ( , )µ σ µ σ

: VARIABLES ALEATORIAS Y DISTRIBUCIONES DE PROBABILIDAD

60

1.5.6. Distribuciones relacionadas con la Normal

1.5.6.1. Distribución χχχχ2 de Pearson

Una variable aleatoria X sigue una distribución Chi-Cuadrado dePearson con n grados de libertad (χ n

2 ) si y solo si su función dedensidad de probabilidad viene dada por:

f xn

x e x

nn

n

n x

( ) = FHGIKJ

≤ < ∞

RS||

T||

=

=

− −1

22

0

2

2

21

2

2

Γ

µσ

Esta variable puede verse como un caso particular de la Gamma,

concretamente la Gamma n2

12

,FHGIKJ

Seguidamente se muestra la gráfica de la χ n2 para diversos valores

de n:

0 5 10 15 20 25

0.0

0.1

0.2

0.3

0.4

0.5

x

y

: VARIABLES ALEATORIAS Y DISTRIBUCIONES DE PROBABILIDAD

61

Si Z1, Z2, ..., Zn son n variables aleatorias N(0,1) independientes,puede probarse que la suma de sus cuadrados:

X Z Z Zn= + + +12

22 2...

sigue una distribución Chi-Cuadrado con n grados de libertad.En la práctica la distribución χ n

2 aparece asociada a problemas deinferencia sobre la varianza de poblaciones con distribución normal.

1.5.6.2. Distribución F de Fisher-SnedecorUna variable aleatoria X sigue una distribución F de Fisher-Snedecor con n grados de libertad (Fm,n) si y solo si su funciónde densidad de probabilidad viene dada por:

f xm n m n

m nx n mx x

nn

n m nm n n

m n

m m n

( )

, ( )( ) ( )

=

+FHGIKJ

FHGIKJFHGIKJ

+ ≤ < ∞

RS||

T||

=−

= + −− −

− −+

2 2

21

2

22

2

2

2 2

0

22 2

2 4

Γ

Γ Γb g

µ σ

A continuación se representa la función de densidad de la Fm,n paradiversos valores de m y n :

0 1 2 3 4 5 6

0.0

0.1

0.2

0.3

0.4

0.5

0.6

0.7

x

y5

: VARIABLES ALEATORIAS Y DISTRIBUCIONES DE PROBABILIDAD

62

Si X es una variable aleatoria con distribución χm2 e Y es otra

variable independiente de la anterior y con distribución χ n2 , puede

probarse que la variable:

U X mY n

=

sigue una distribución F de Fisher-Snedecor con m y n grados delibertad. Expresado de otra forma:

χ

χ

m

nm n

m

n

F

2

2 ≈ ,

De aquí se sigue también la siguiente propiedad de la distribución F:

Si X FX

Fm n n m≈ ⇒ ≈, ,1

En la práctica, la distribución F aparece en problemas de inferenciaestadística en los que a partir de información muestral es precisodecidir sobre la igualdad o no de dos varianzas poblacionalesdesconocidas.

1.5.6.3. Distribución t de StudentUna variable aleatoria X sigue una distribución t de Student con ngrados de libertad (tn) si y solo si su función de densidad deprobabilidad viene dada por:

f x

n

n nxn

x

n

( ) =

+FHGIKJFHGIKJ

+FHGIKJ − ∞ < < ∞

RS||

T||

−+Γ

Γ

12

2

12

12

π

A continuación se representa la función de densidad de la tn paradiversos valores de n. Como puede apreciarse, esta distribución essimétrica respecto al eje de ordenadas y también tiene una formaacampanada (aunque algo más estrecha que la normal). Encualquier caso, a medida que se incrementa n la forma de estadistribución se parece cada vez más a la N(0,1). A partir de n≥30, latn es prácticamente indistinguible de la N(0,1).

: VARIABLES ALEATORIAS Y DISTRIBUCIONES DE PROBABILIDAD

63

Si Z es una variable aleatoria con distribución N(0,1) e Y es otravariable independiente de la anterior y con distribución χ n

2 , puedeprobarse que la variable:

T ZY n

=

sigue una distribución t de Student con n grados de libertad.Expresado de otra forma:

N

n

tn

n( , )0 1

2χ≈

Si nos damos cuenta que la N ( , )0 1 112≈ χ , tenemos que:

t N

n

n

nn

F F tn

n

n

n nn n n≈ ≅ = ≅ ⇒ ≈( , )

, ,0 1 12

2

212

2 1 12

χ

χ

χχχ

b g

En la práctica, la distribución t aparece en problemas de inferenciaestadística en los que es preciso decidir sobre el valor(desconocido) de la media de una población cuando no se conocetampoco el valor de la varianza en dicha población.

-4 -2 0 2 4

0.0

0.1

0.2

0.3

0.4

0.5

x

y