transformaciones de variables...

47
TRANSFORMACIONES DE VARIABLES ALEATORIAS Covarianza Transformaciones de Transformaciones de N Transformaciones de N N Autor Dr. Hernán Rey Ultima actualización: Abril 2010

Upload: vucong

Post on 27-Jun-2019

228 views

Category:

Documents


0 download

TRANSCRIPT

TRANSFORMACIONES DE VARIABLES ALEATORIAS

Covarianza

Transformaciones de →

Transformaciones de N→

Transformaciones de N→ N

AutorDr. Hernán Rey

Ultima actualización: Abril 2010

COVARIANZALa covarianza entre X e Y se define como la esperanza del producto de las VAs “centradas”, es decir, se restan sus medias antes de multiplicarlas.

( )( )( ),σ µ µ= − −X Y X YE X YEsto permite medir cómo varían ambas variables en conjunto. Si las variables centradas tienen el mismo signo en promedio, σX,Y>0. Si tienen signos opuestos, σX,Y<0. Una expresión alternativa es:

( ),σ µ µ= ⋅ −X Y X YE X Y

Si X e Y son independientes: ( ) µ µ⇒ ⋅ = X YE X Y

( ) ( ) ( ), ,∞ ∞

−∞ −∞

⋅ = ⋅∫ ∫ X YE X Y x y f x y dxdy

TEOREMA

( ) ( )X Y Y Xxf x dx yf y dy µ µ∞ ∞

−∞ −∞

= =∫ ∫, 0X Yσ⇒ =

Si X e Y son independientes

COROLARIO

Si la covarianza entre dos variables es nula, decimos queestán descorrelacionadas. LA INDEPENDENCIA ES MAS

FUERTE QUE LA DESCORRELACION (σXY=0⇒independencia)

Las variables son dependientes pero están descorrelacionadas

EJEMPLO

( ) 1 1 12Xf x x= ⋅ − < <1

Sea X la corriente instantánea en un circuito con densidad:

1 1 1 3

2,

1 0 1

1 02 2X Y

xxy y x dydx dxσ− −

⇒ = ⋅ = = =∫ ∫ ∫1

Sea Y la potencia disipada en un resistor de 1Ω. Luego, Y=X2

( ) 2,

1, 1 12X Yf x y x y x= ⋅ − < < ⋅ =1 1

[ ],0X X Y E XYµ σ= ⇒ =

( ) 2, ,

1, 1 12X Y X Yxyf x y dydx xy x y x dydxσ

∞ ∞ ∞ ∞

−∞ −∞ −∞ −∞

= = ⋅ − < < ⋅ =∫ ∫ ∫ ∫ 1 1

Si dos variables tienen el módulo de ρ cercano a uno diremos que están altamente correlacionadas.

,,

X YX Y

X Y

σρ

σ σ= , 1X Yρ⇒ ≤

El resultado de la covarianza puede ser cualquier número real. Por eso, existe una definición normalizada denominada coeficiente de correlación:

Veamos ahora la varianza de la suma de dos variables.

( ) ( )( )( ) ( ) ( )( )( )2 22σ µ µ µ µ+ = + − + = − + −X Y X Y X YE X Y E X Y

( )( ) ( )( ) ( )( )( )2 2 2µ µ µ µ= − + − + − −X Y X YE X E Y E X Y2 2

,2X Y X Yσ σ σ= + + si las VAs están descorrelacionadas, la varianza de la suma es la suma de las varianzas

En general, si X1,X2,…,Xm son independientes,

( )2

1 1

m m

i i i ii i

Var a X a Var X= =

= ⋅

∑ ∑

( ),2 1 0ρσ σ

+ = + ≥

X Y

X Y

X YVar

( ),2 1 0ρσ σ

− = − ≥

X Y

X Y

X YVar

,1 1 1 1

,i j

n m n m

i j X Yi j i j

Cov X Y σ= = = =

=

∑ ∑ ∑∑Propiedad:

-

-

- -

-

-

La importancia de que dos variables esténcorrelacionadas es que conociendo el

resultado de una de ellas puedo reducir laincertidumbre respecto del resultado de la otra

0 0.25 0.5 0.75 1

0

0.5

1

fXY(x,y)=1en el cuadrado unitario

, 0X Yσ =0 0.5 1

0

0.5

1

fXY(x,y)=3/2

fXY(x,y)=1/2

, 0X Yσ <

TRANSFORMACION DE VARIABLE UNIDIMENSIONAL (R→R)

Asuma que X es una VA cuyo espacio muestral es Ω y su función de distribución es FX(x). Sea Y=φ (X), una función de R→R.

ENTONCES Y ES UNA VA cuyo espacio muestral es Ω !!!!

Podemos conocer su función de distribución FY(y)?Para ello se utiliza el siguiente principio: “Dos sucesos equivalentes deben tener asociada la misma probabilidad”

E A B≡ ≡

: ( )B x x Aφ= ∈

( ) ( ) ( )P E P A P B⇒ = =

, ,A B⊂ ⊂

Ω Xφ

Y

E ⊂ Ω : ( )E X Bω ω= ∈ B es la imagen de Ea través de la VA XA es la imagen de Ba través de φ

: ( )E Y Aω ω= ∈ A es la imagen de E a través de la VA Y

( ) ( ) ( ) ( )( ) ( )YP W P Y u F u P X u P X Qφ⇒ = ≤ = = ≤ = ∈

Sea X una VA continua cuya densidad es:

Podemos ahora definir los eventos:

: ( )Q x x uφ= ≤ :W y Y u= ≤

P(X∈Q) puede obtenerse a partir de FX(x). Si X es discreta y se cuenta con pX(x), P(X∈Q) surge de sumar las masas puntuales que se hallan en Q. Si X es continua, P(X ∈ Q) surge de integrar fX(x) sobre la región definida por Q.

EJEMPLO

( ) 12

xXf x e−=

Se quiere la densidad de Y=X2.En primer lugar vemos que el soporte de X, que son todos los reales, es mapeado por φ(x) en los reales no negativos. Entonces, la distribución de Y es nula para todo y<0.

Si ahora elegimos el evento Y≤y, con y≥0,

Así, puede obtenerse la función de distribución de Y. Si se quiere la densidad (y existe), sólo debe tomarse la derivada.

( ) ( )( )

2YF y P X y

P y X y

= ≤

= − ≤ ≤

El planteo de equivalencia de sucesos es la base de toda transformación de variables, sin importar cómo sean las variables o las funciones que las vinculan !!!

-1 0 1

y

x

y=φ(

x)

y− y

( ) 1 1 02

yx y

y

e dx e y− −

= = − ≥∫ 1

( ) ( ) 1 02

yY Y

df y F y e ydy y

−⇒ = = ⋅ ≥1

X

Y= φ

(X)

φ-1(y) x

y

φ(x)

Si la función φ es biyectiva, el mapeo entre los soportes de X e Y seráuno a uno. Luego, puede definirse el mapeo inverso:

1( )X Yφ −=Si φ es estrictamente creciente:

( ],A y= −∞

( )( 1,B yφ − = −∞

( ) ( )( )

( )( )1

1y

Y X XF y f x dx F yφ

φ−

−∞

= =∫

( ) ( )( ) ( )( ) ( )11 1

Y X X

d ydf y F y f ydy dy

φφ φ

−− −⇒ = =

X

Y= φ

(X)

φ-1(y) x

y

φ(x)

Si φ es estrictamente decreciente:

( ],A y= −∞

( )( 1 ,B yφ − = ∞

( ) ( )( )

( )( )1

11

Y Xy

X

F y f x dx

F y

φ

φ

=

= −

( ) ( )( ) ( )11

Y X

d yf y f y

dyφ

φ−

−⇒ = −

( ) ( )( ) ( )11

Y X

d yf y f y

dyφ

φ−

−⇒ =Por lo tanto, si φes estrictamente monótona,

Otra interpretación sería la de tomar unevento de longitud dx y mapearlo a uno delongitud dy. Luego, la probabilidad de cada

uno de ellos se puede aproximar por el valorde la función de densidad en el centro delentorno donde se coloca el diferencial. Porser equivalentes, puede plantearse luegofY(y) dy = fX(x) dx. El valor absoluto vieneluego para considerar la diferencia entre

el caso creciente y decreciente

-2 -1.4142 -0.7071 0 0.7071 1.4142 2

0.5

2

x

y

φ1(x)φ2(x)

Retomemos el ejemplo previo. La función Y=X2 no es biyectiva. Sin embargo, podemos descomponerla en dos funciones biyectivas:

EJEMPLO

( ) 21 0x x xφ = ⋅ ≥1

( ) 22 0x x xφ = ⋅ <1

Para armar la densidad de Y, sólo debemos tener en cuenta los aportes de cada una de las funciones φ

( )11 y yφ − = ( )1

2 y yφ − = −

( ) ( )( ) ( ) ( )( ) ( )1 11 21 1

1 2Y X X

d y d yf y f y f y

dy dyφ φ

φ φ− −

− −⇒ = +

( ) 1 1 1 1 1 02 22 2 2

yx xY

x y x y

f y e e e yy y y

−−

= =−

−⇒ = ⋅ + ⋅ = ⋅ ≥1

EJEMPLO

Si bien ir directamente de una densidad a otra puede ser más simple en algunos casos (dado que no requiere el paso por las funciones dedistribución), en otros puede presentar complicaciones. Veamos un ejemplo.

Un fabricante de caños posee una máquina que produce piezas cuya longitud X se distribuye según:

( ) 0xXf x e x−= ⋅ ≥1

Un cliente especial está dispuesto a pagar una gran suma de dinero por 100000 caños, pero la condición es que la longitud Y de los mismos estédistribuida según:

( ) 13 0 1/ 4 1/ 4 13Yf y y y= ⋅ ≤ ≤ + ⋅ < <1 1El costo que supondría apagar la máquina, recalibrarla, hacer los 100000 caños, y luego volverla al estado original es excesivo. Sin embargo, justo cuando estaba por rechazar el trabajo, uno de sus empleados le dice: “Podemos hacerlo. Sólo consiga una máquina de precisión para cortar 100000 caños de la producción original”. Así lo hicieron y el jefe le dijo al empleado: “Todavía no entiendo cómo hiciste para satisfacer las especificaciones del cliente”. Qué fue lo que hizo el empleado?

Para analizar el problema hagamos primero un esquema que indique cómo deben ser las densidades mapeadas. Notar que para que los caños sean “cortables”, se requiere φ(x)≤x ∀x.

Luego, para todo 0 ≤ y ≤ ¼,

( ) ( )( )( )

( )1

11

111

0

3 1y

yxP Y y y P X y e dx eφ

φφ−

−−− −≤ = = ≤ = = −∫

( ) ( ) 11 0 ln 4

3

xey x xφ−−

⇒ = = ⋅ ≤ ≤1

( ) ( ) ( ) 2 1 3 ln 4xy x e xφ −⇒ = = − ⋅ >1

0.25

1

( ) ( ) ( )( )

( )

( )12

12

12

1 13

yx

y

P Y y y P X y

e dx e φ

φ

φ

∞−−

≥ = − = ≥

= =∫0 ln(4) 7

0

0.25

1

x

y

φ2

φ1

Resolverlo con la formula de lasdensidades requiere la resolución

de ecuaciones diferenciales

Si ahora analizamos ¼ ≤ y ≤ 1,

EJEMPLO

Qué sucede si la función no puede analizarse como biyectiva de a tramos? Nuevamente, el concepto de sucesos equivalentes nos ayudará.

Un conversor analógico digital utiliza una función escalera. Si la entrada se distribuye según: ( ) 0 10 ,

50Xxf x x= ⋅ ≤ <1

la salida será una VA discreta que sólo puede tomar los valores 0,1,…,9.

0 1 2 3 4 5 6 7 8 9 100

1

2

3

4

5

6

7

8

9

10

X

Y

Para encontrar su función de probabilidad planteamos la equivalencia:

( )1 2 1, 0,1, ,950 100

k

k

x kP Y k dx k+ +

= = = =∫ …

Si y=φ (x)=cte. en un intervalo donde fX(x)>0,entonces habrá masa puntual en Y=cte.

0 1 2 3 4 5 6 7 8 90

0.02

0.04

0.06

0.08

0.1

0.12

0.14

0.16

0.18

0.2

y

PY

(y)

0

-a

0

x

y

EJEMPLO

Otra posibilidad es la de transformar una VA continua en una mixta.

En un diodo Zener ideal, la relación entre la tensión Y y la corriente Xpuede observarse en la figura.

( ) 1 1Xf x x x= ⋅ − ≤ ≤1Suponga que la corriente se distribuye según

Luego, para los 1 ≥ y ≥ 0, Y=X

( ) 21 10 0 1 1 1

2 2 2YyF y a y y y

⇒ = ⋅ − ≤ < + + ⋅ ≤ ≤ + ⋅ >

1 1 1

Al recorrer a y desde -∞ , lo primero que aparece es Y = -a. Por equivalencia:

( ) ( )0

1

102

P Y a P X xdx−

= − = < = − =∫

( ) ( ) 0 2

1 0

1 0 12 2

y

YyF y P X y xdx xdx y

= ≤ = − + = + ⋅ ≤ ≤

∫ ∫ 1

TRANSFORMACION MULTIDIMENSIONAL ( ) N →

Ω 2( ),X Y

( ),x yφZ

E A B≡ ≡

( ) , : ( , )B x y x y Aφ= ∈

( ) ( ) ( )P E P A P B⇒ = =

2, ,A B⊂ ⊂E ⊂ Ω

( ) : ( ), ( )E X Y Bω ω ω= ∈B es la imagen de E a través de la VA (X,Y)

A es la imagen de Ba través de φ

: ( )E Z Aω ω= ∈ A es la imagen de E a través de la VA Z=φ(X,Y)

( ) ( ) ( ) ( )( ),ZP W P Z u F u P X Y uφ⇒ = ≤ = = ≤ =

Podemos ahora definir los eventos:

( ) , : ( , )Q x y x y uφ= ≤ :W z Z u= ≤

( )( ) ( ), continua

,, ,X Y

X YQ

P X Y Q f x y dxdy= ∈ = ∫∫

( ) , :B x y x y z= + ≤( , ]A z= −∞

Para cada valor de z, se define un recinto que se encuentra por debajo de una recta que corta al eje Y en Y=z y al X en X=z. La probabilidad pedida surge de integrar (o sumar) la conjunta en ese recinto. En el caso continuo,

( ) ( ), ,z x

Z X YF z f x y dydx∞ −

−∞ −∞

⇒ = ∫ ∫

( ) ( ) ( ) ( )ZP A P Z z F z P X Y z⇒ = ≤ = = + ≤

( ) ( ), ,Z X Yf z f x z x dx∞

−∞

⇒ = −∫

Una de las transformaciones esenciales es la suma de VAs. Sean X e Ydos VAs. Se desea hallar la distribución de Z=X+Y. Aplicamos nuevamente la idea de sucesos equivalentes:

Derivando...

( ), ,X YB

f x y dxdy= ∫∫ ( ), ,X YBp x y= ∑

0 z

0

z

X

Y

X+Y=z

( ) ( ) ( )Z X Yf z f u f z u du∞

−∞

⇒ = −∫

A esta operación se la denomina integral de convolución y se utiliza en numerosas ramas de la matemática.

( ) ( ) ( )Z X Yf z f z u f u du∞

−∞

≡ = −∫

La densidad de la suma de dos VAs independientesestá dada por la integral de convolución de las

densidades de cada una de ellas.SE DEBE TENER ESPECIAL CUIDADO AL EVALUAR

LOS LIMITES DE LA INTEGRAL (QUE PUEDENDEPENDER DE z Y DEBE VERSE DONDE

LAS DENSIDADES SON NO NULAS)

Si X e Y son independientes…

-1 -0.5 0 0.5 1 1.5 2-0.2

0

0.2

0.4

0.6

0.8

1

1.2

x

y

z=-1

z=0 z=2

z=3

EJEMPLO

( ) 3ZF z z= ≥1

0 2z≤ <

2 3z≤ <

1( ) 1 23Xf x x= ⋅ − ≤ <1 ( ) 2 0 1Yf y y y= ⋅ ≤ <1

X e Y son VAs independientes. Hallar la distribución de Z=X+Y

( )( )( )

( )ZF z P Z z

P X Y z

P Y z X

= ≤

= + ≤

= ≤ −

1 2

2

2( ) 13Z

z z y

F z ydxdy− −

= − ∫ ∫ ( )1

2

2

2 21 23 3z

z y y dy−

= − − +∫( )321

9 3 9zz −

= + +1 0z− ≤ <

( )31

0 1

12( )3 9

z yz

Z

zF z ydxdy

−+

+= =∫ ∫ 1

0

2 1 1( ) (0)3 9 3

z y

Z Zy

F z F ydxdy z−

= + = +∫ ∫

-1 -0.5 0 0.5 1 1.5 2 2.5 3

0

0.1

0.2

0.3

0.4

0.5

0.6

0.7

0.8

0.9

1

Z

F Z(z)

En este caso la conjunta tiene una únicaexpresión en todo su soporte. Si tuviese

más, daría lugar quizás a un mayor númerode expresiones diferentes a lo largo del

soporte de la VA Z.

EJEMPLO

X e Y son VAs i.i.d. con distribución uniforme en (0,1). Si X + Y < 1, entonces W = X, si no, W = 2Y. Halle la función de densidad de W.

Para poder aplicar la transformación es necesario saber en qué recinto me encuentro. Descomponiendo a W en (X+Y≤1)U(X+Y>1) y aplicando probabilidad total puede escribirse

( ) ( ) ( ) ( ) ( )( )( )1 1WF w P W w P W w X Y X Y= ≤ = ≤ ∩ + ≤ ∪ + >X

Y

1

1

0

W=X

W=2Y

( ) ( )( ) ( ) ( )( )1 / 2 1P X w X Y P Y w X Y= ≤ ∩ + < + ≤ ∩ + ≥

( ) ( )( ) ( ) ( )( )( )1 1P W w X Y W w X Y= ≤ ∩ + ≤ ∪ ≤ ∩ + >

( ) 21 1 10 1 1

2 2w

w w− −

⋅ < < + ⋅ ≥1 1

( ) 2

23 10 1 1 2 1 28 2 8W

wF w w w w w w = − ⋅ < < + + ⋅ ≤ < + ⋅ ≥

1 1 1

( ) ( )( ) ( ) ( )( )1 / 2 1P X w X Y P Y w X Y= ≤ ∩ + < + ≤ ∩ + ≥

X

Y

1

1

0 wX

Y

1

1

0

w/2

21 10 2 2

2 2 2w w w ⋅ < < + ⋅ ≥

1 1

( ) 31 0 1 1 24 4W

wf w w w w = − ⋅ < < + ⋅ ≤ <

1 1

MAXIMO Y MINIMO

( )1 2min , , , nY T T T= …

Un cierto dispositivo posee n componentes conectados en serie, de modo que deja de funcionar si alguno de los componentes falla. Sea Tiel tiempo hasta la falla para cada componente. Sea Y el tiempo hasta la falla del dispositivo, luego:

( ) ( )1 21 ( ) , , ,Y nF t P Y t P T t T t T t− = > = > > >…Para calcular esta probabilidad se requiere la densidad conjunta de los tiempos hasta la falla de los n componentes. Sin embargo, si las VAsson independientes, vale:

( ) ( ) ( )1 2( ) nP Y t P T t P T t P T t> = > > >Si además las n VAs son idénticamente distribuidas, surge:

( ) ( )( )1 1n

Y TF t F t− = − ( ) ( )( ) ( )11

−⇒ = −

nY T Tf t n F t f t

( )1 2max , , , nW T T T= …

Suponga ahora que los n componentes están conectados en paralelo. En este caso, el dispositivo falla cuando fallan todos. Si W es el tiempo hasta la falla del dispositivo, luego:

( ) ( )1 2( ) , , ,W nF t P W t P T t T t T t= ≤ = ≤ ≤ ≤…

Al igual que antes, en el caso general se requiere la densidad conjunta de los tiempos hasta la falla de los n componentes. Sin embargo, si las VAs son i.i.d.:

( ) ( )nW TF t F t=

( ) ( ) ( )1−⇒ = nW T Tf t nF t f t

Sea XM=max(X1,X2,…Xn). Si las Xi son iid con distribución exponencial de parámetro 1, hallar la distribución de Y=XM /n cuando n tiende a infinito.

EJEMPLO

( ) ( ) 1 0i

uXF u e u−= − ⋅ ≥1

( ) ( ) 1 0nny

YF y e y−⇒ = − ⋅ ≥1

( ) lim 1 0YnF y y

→∞⇒ = ⋅ ≥1

ES DECIR QUE LA VA DEGENERA EN UNA DISCRETA CON P(Y=0) = 1 !!!

( ) ( ) 1 0M

nxXF x e x−= − ⋅ ≥1

b1 b1 +∆y1

b2

b2 +∆y2

y1

y 2 A

Suponga que contamos con la densidad conjunta de N variables X1,X2,…,XN. Si hacemos un mapeo multidimensional a otras N variables Y1,Y2,…,YN, podemos conocer la nueva conjunta?

CAMBIO DE VARIABLE MULTIDIMENSIONAL ( ) N N→

( )1 1 1 2,Y X Xφ=

( )2 2 1 2,Y X Xφ=

( )1 2, 1 2,X Xf x x

( )1 2, 1 2,Y Yf y y

El principio para resolverlo es nuevamente el de sucesos equivalentes.

Si en particular el mapeo es continuo y biyectivo (entre los dos espacios de N), existe el mapeo inverso:

( )11 1 1 2,X Y Yφ −= ( )1

2 2 1 2,X Y Yφ −=

( ) 1 2 1 1 1 1 2 2 2 2, : ,A y y b y b y b y b y= ≤ ≤ + ∆ ≤ ≤ + ∆

( ) ( )1 2, 1 2 1 2,Y YP A f y y y y⇒ ≈ ∆ ∆

Si ∆y1 y ∆y2 son pequeños

Asumamos también que las derivadas parciales de las funciones φi y φi

-1 existen y son continuas. Esto es análogo a pedir la monotonía de las funciones en el caso unidimensional. Definamos el evento A:

Ahora debemos identificar el suceso equivalente de A, es decir:

El área de B puede aproximarse por la del paralelogramo que contiene a B.

( ) ( ) ( )( ) 1 2 1 1 2 2 1 2, : , , ,B x x x x x x Aφ φ= ∈Debido a la hipótesis de continuidad, el recinto que contiene a A se transformará en un recinto B en el plano (X1,X2) también limitado por cuatro curvas (aunque no necesariamente rectas)

( ) ( ) ( )( )1 2 1 2

1 1, 1 2 1 2 , 1 1 1 2 2 2 1 2, , , ,Y Y X Xf y y y y f x y y x y y Bφ φ− −⇒ ∆ ∆ = = =

El área de B

d1

d1

d2 d2

c1

c1

c2

c2

1 2 2 1B c d c d≈ −

1 2

1 2

c cB

d d≈

x1

x 2

a1=φ1-1(b1,b2)

∂x1∂y2∆y2

a2=φ2-1(b1,b2)

∂x2∂y2∆y2

∂x2∂y1∆y1

∂x1∂y1∆y1

B

( )( )1 1 2 2 2 1 2 1 2 12B c d c d c d c c d d≈ + + − − −

Como el jacobiano puede ser positivo o negativo, tomaremos su módulo.

( )11 1 21

2 2

,y yxy y

φ −∂∂=

∂ ∂( )1

1 1 21

1 1

,y yxy y

φ −∂∂=

∂ ∂

( )( )

1 2 1 22 2

2 2 2 2 1 21 2 1 2

1 2 1 2 1 21 1

1 1 1 1

,,

x x x xy yy y y y x x

B y y y yx x x x y yy yy y y y

∂ ∂ ∂ ∂∆ ∆

∂ ∂ ∂ ∂ ∂⇒ ≈ = ∆ ∆ = ∆ ∆

∂ ∂ ∂ ∂ ∂∆ ∆

∂ ∂ ∂ ∂ JACOBIANO DE TRANSFORMACION

( ) ( ) ( )( )1 2 1 2

1 1

1 21 1, 1 2 , 1 1 1 2 2 2 1 2

2 2

1 2

, , , , detY Y X X

x xy y

f y y f x y y x y yx xy y

φ φ− −

∂ ∂ ∂ ∂ ⇒ = = = ∂ ∂ ∂ ∂

( )12 1 22

1 1

,y yxy y

φ −∂∂=

∂ ∂

( )12 1 22

2 2

,y yxy y

φ −∂∂=

∂ ∂

X e Y son VAs. independientes U(0,1). Halle la conjunta de Z,U si se mapea:

EJEMPLO

( )2ln cos 2Z X Yπ= −

( )2ln sin 2U X Yπ= −

2 2

2Z U

X e+

−=

1 arctan2

ZYUπ

=

( ) ( )( )2 2 2 22 ln cos 2 sin 2π π+ = − +Z U X Y Y ( )tan 2π=Z YU

( )( )

( ) ( )

2 2 2 2

2 22 2

2

2 2 2 2

, 1det, 2

2 2

z u z u

z uze uex yeu zz u

z u z uπ

π π

+ +− −

+−

− − ∂

= =−∂ + +

( ) ( )2 2

22,

1, ,2

z u

Z Uf z u e z uπ

+−

⇒ = ∀ ∈

Si calculamos las marginales, vemos que ambas tienen la forma:

( )2

21 2

i

If i e iπ

−= ∀ ∈ ,i z u= GAUSSIANA (O NORMAL)

ESTANDAR

Como la conjunta de X e Y vale 1 dentro del cuadrado unitario,

Este mapeo permite generar númerosaleatorios de una VA normal estándar

a partir de valores U(0,1)

Otro punto importante es la independencia.Vemos aquí que X e Y son independientes, y

también lo son Z y U. ESTO NO SUCEDEEN GENERAL CUANDO SE EFECTUA UN

MAPEO DONDE φ1 Y φ2 DEPENDEN AMBAS DE X E Y.

0

0

X

Y

Volvamos al ejemplo del tiro al blanco. Sean X e Y las coordenadas cartesianas del punto de impacto y la conjunta igual a:

EJEMPLO

2 2R X Y= +

tan YX

Θ =

cos= ΘX R

sinY R= Θ

( )( )

cos sin,det

sin cos,rx y

rrr

θ θθ θθ

−∂ = = ∂

( ), ,Rf r θΘ⇒ =

es una campana con el máximo en (0,0)

( ) 2

222 0

r

Rrf r e rσ

σ−

= ⋅ ≥1

( )2 2

22, 2

1,2

x y

X Yf x y e σ

πσ

+−

=( ) 2

2

,

1/16

x y

σ

∀ ∈

=

RAYLEIGH

0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 10

0.5

1

1.5

2

2.5

r

f R(r)

-1

-0.5

0

0.5

1

-1

-0.5

0

0.5

10

0.5

1

1.5

2

2.5

3

XY

f X,Y

(x,y

)

2

222 0 0 2

2

rr e rσ θ ππσ

−= ⋅ ≥ ⋅ ≤ <1 1

( ) 1 0 22

f θ θ ππΘ = ⋅ ≤ <1 Los ángulos de impacto son equiprobables

Si bien el máximo de la conjunta Normal esta en(0,0), el máximo de la Rayleigh esta desplazado del 0.Esto se debe a que la superficie de los aros de ancho

dr en coordenadas polares crece con r (y es justamentelo que compensa el jacobiano de transformación) y la

conjunta cae mas lento.

TEOREMAUna importante propiedad de las VAs independientes es que pueden heredar esta propiedad. Sean X1,X2,…,Xn independientes y el mapeo:

( )( )

( )

1

1 1 2

1 1

1 1 1 2

2 2 1 2

1 2

, , ,

, , ,

, , ,m m

k

k k k

m m k k n

Y X X X

Y X X X

Y X X X

φ

φ

φ− −

+ +

+ +

=

=

=

Cuando m≤n, cada Yi es una función de un subconjunto de las Xi, y las Yino tienen Xis en común. El evento

[ ]1 1 2 2, , , m mY y Y y Y y≤ ≤ ≤…

es equivalente a:

( ) ( )1 1 11 1 2 1 1 2, , , , , , , ,m mk m k k n mX X X y X X X yφ φ

− −+ + ≤ ≤ … … …

Como las Xi son independientes y las funciones φi no comparten ninguna Xi, la probabilidad del evento anterior es el producto de las de cada uno de los eventos que lo forman.

( ) ( )1 2, , 1 2

1

, , ,m i

m

Y Y Y m Y ii

F y y y F y=

⇒ = ∏… …

( ) ( )1 2, , 1 2

1

, , ,m i

m

Y Y Y m Y ii

f y y y f y=

⇒ = ∏… … LAS Yi SONINDEPENDIENTES

A través de esta propiedad podemos justificar cómoencontrar la densidad de la suma de n VAs indep. Si

Sn=X1+X2+…+Xn, la densidad de Sn será la convoluciónde las densidades de Sn-1 y Xn, ya que ambas son

independientes.

BONUS TRACKS

EJEMPLO

( ) 2 2,

1, 1X Yf x y x yπ

= ⋅ + <1

Las variables no son independientes. La media de cada marginal es 0. Luego,

2

2

1 1

,1 1

1 0x

X Y

x

xy dydxσπ

− − −

= =∫ ∫

Las variables son dependientes pero están descorrelacionadas

Sea X el número de caras en los primeros dos tiros de una moneda legal y sea Y el número de caras en el tercer tiro. Hallar la distribución de X, Y, Z=X-Y, W=X*Y.

EJEMPLO

1/81/8X=21/41/4X=11/81/8X=0Y=1Y=0( ) ( ) ( )0 0, 0 0, 1 1/ 4P X P X Y P X Y= = = = + = = =

( ) ( ) ( )1 1, 0 1, 1 1/ 2P X P X Y P X Y= = = = + = = =

( ) ( ) ( )2 2, 0 2, 1 1/ 4P X P X Y P X Y= = = = + = = =

( ) ( ) ( ) ( )0 0, 0 1, 0 2, 0 1/ 2P Y P X Y P X Y P X Y= = = = + = = + = = =( ) ( ) ( ) ( )1 0, 1 1, 1 2, 1 1/ 2P Y P X Y P X Y P X Y= = = = + = = + = = =

( ) ( )1 0, 1 1/ 8P Z P X Y= − = = = =( ) ( ) ( )0 0, 0 1, 1 3 / 8P Z P X Y P X Y= = = = + = = =( ) ( ) ( )1 1, 0 1, 1 3 / 8P Z P X Y P X Y= = = = + = = =( ) ( )2 2, 0 1/ 8P Z P X Y= = = = =

( ) ( )2 2, 1 1 / 8P W P X Y= = = = =

( ) ( ) ( )( ) ( )

0 0, 0 0, 1

1, 0 2, 0 5 / 8

P W P X Y P X Y

P X Y P X Y

= = = = + = =

+ = = + = = =

( ) ( )1 1, 1 1 / 4P W P X Y= = = = =

-1 0 2

-1

0

2

3

U

Z

Z=U

Z=U+1

EJEMPLO (el anterior de suma pero usando convolución)

Los límites de la integral dependen del valor de z=x+y que se esté analizando.

( ) 0 1 o 3Zf z z z= < − >

( ) ( )2

1

2 11 0, ( ) 13 3

z

Zz f z z u du z−

− ≤ < = − = +∫( )

1

2 10 2, ( )3 3

z

Zz

z f z z u du−

≤ < = − =∫( ) ( )( )

22

1

2 12 3, ( ) 1 23 3Z

z

z f z z u du z−

≤ < = − = − −∫

( ) 2( ) ( ) 1 2 13X Yf u f z u z u u u z u− = − ⋅ − ≤ < ⋅ ≤ < +1 1

1( ) 1 23Xf x x= ⋅ − ≤ <1

( ) 2 0 1Yf y y y= ⋅ ≤ <1

Dadas P(X = a) = r, P(max(X,Y) = a) = s, y P(min(X,Y) = a) = t, muestre que puede expresarse u = P(Y = a) en función de r, s, y t.

EJEMPLO

( )( ) ( ) ( ) ( )max , , , ,P X Y a P X a Y a P X a Y a P X a Y a= = = < + < = + = =

( )( ) ( ) ( ) ( )min , , , ,P X Y a P X a Y a P X a Y a P X a Y a= = = > + > = + = =

( )( ) ( )( ) ( ) ( )max , min ,P X Y a P X Y a P X a P Y a⇒ = + = = = + =

u s t r⇒ = + −

El cambio multidimensional visto de N en N puedetambién usarse para resolver los cambios vistos antesde N en . Para ello, el cambio que se desea realizar

se coloca como la φ1 y luego se “inventan” otras N-1 φs.Al obtener la nueva conjunta, podemos luego marginarla

sobre la primer variable que es la que nos interesa.

Sin embargo esto debe hacerse con sumo cuidado yaque las variables inventadas deben garantizar que el

mapeo sea biyectivo. Caso contrario se debe ver al mapeocomo una unión de mapeos biyectivos y considerar losaportes de cada tramo. Esto no es fácil de ver con N>1,

por lo que pueden cometerse errores graves

EJEMPLO

El siguiente ejemplo permite recalcar la “peligrosidad” del método del jacobiano. Esto es similar al caso Y=X2 que vimos antes, donde debíamos considerar el aporte de cada rama de la parábola. En el caso multidimensional es más difícil visualizar este tipo de cosas. Por ello, es preferible utilizarlo sólo cuando los mapeos sean biyectivos.

Entonces, hay que ser muy cuidadoso cuando se inventa una variable auxiliar para hacer un cambio usando el jacobiano. Veamos lo que ocurre si así no se hiciera.X e Y son U(-½,½) e independientes. Se desea la densidad de Z=X2+Y2

1) Sucesos equivalentes (Función de distribución)

( ) ( )2 2P Z z P X Y z≤ = + ≤

Para cada z, se busca la intersección entre un círculo de radio z½ y el cuadrado donde esta definida la conjunta de X e Y.

( ) 0, 0ZF z z= <

( ) 1 1/ 2ZF z z= ⋅ ≥1

( ) 0 1/ 4ZF z z zπ= ⋅ ≤ <1

1/ 4 1/ 2z≤ <

( )2

1/ 4 1/ 2

1/ 2

1 4z

Z

z x

F z dydx− −

− −

= − ∫ ∫1/ 4

2

1/ 2

11 42

z

z x dx− −

= − − −∫

( ) 1 1 1 1 12 2 arcsin 1 arcsin4 4 4 22ZF z z z z

z z

= − + − − − − ⋅ ≤ < 1

( ) 1/ 4 10 1/ 4 2 arcsin 1 arcsin 1/ 4 1/ 22Zf z z z

z zπ

⇒ = ⋅ < < + − − − − ⋅ ≤ < 1 1

El de arr izq

-0.5 -0.25 0 0.25 0.5

-0.5

-0.25

0

0.25

0.5

x

y

2 2Z X Y= +

2a) Método del jacobiano2U X=

Este mapeo no es biyectivo, (x,y) y (-x,y) son mapeados al mismo (z,u).Por ello, no pueden definirse las transformaciones inversas X=g1(Z,U) y Y=g2(Z,U). U=X tampoco sirve.

2b) Método del jacobiano2 2Z X Y= +

cosX Z U= sinY Z U=

0

0.1

0.2

0.3

0.4

0.5

0.6

u

z

0 π/4 π/2 3π/4 π 5π/4 3π/2 7π/4 2π

2

1/ 41 sin

ZU

=− 2

1/ 41 cos

ZU

=−

( )( )

1 12 2

1 12 2

1 cos sin, 12det1, 2sin cos2

z u z ux yz u z u z u

− ∂= =

arctan YUX

=

-0.05 0 0.05 0.1 0.15 0.2 0.250

0.05

0.1

0.15

0.2

0.25

0.3

0.35

0.4

0.45

0.5

x

y

0 1/ 4z≤ <

1/ 4 1/ 2z≤ <

( )2

0

12Zf z du

π

π= =∫

( )

1/ 4arccos 1

1/ 4arcsin 1

142

z

Z

z

f z du

= ∫

1/ 4 1/ 42 arccos 1 arcsin 1z z

= − − −

1/ 4 12 arcsin 1 arcsin2z z

= − − − −

-1 -0.5 0 0.5 10

0.2

0.4

0.6

0.8

1

1.2

1.4

1.6

1.8

2

w

z

EJEMPLOX e Y son U(0,1) e independientes. Sean Z=X+Y y W=X-Y. Hallar la covarianza entre Z y W.

( ) ,1, 1 1 22Z Wf z w w w z w= ⋅ − < < ⋅ < < −1 1

0Wµ =0 2 1 2

,1 02 2

w w

Z Ww w

zw zwdzdw dzdwσ+ −

− −

⇒ = +∫ ∫ ∫ ∫

( )( ) ( )( )0 1

2 22 2

1 0

2 24 4w ww w dw w w dw

= − − + + −∫ ∫

, 0Z Wσ⇒ =

X e Y son independientes, y por lo tantodescorrelacionadas. Z y W siguen siendo

descorrelacionadas, pero claramenteson dependientes.