taller 2 probabilidad copia

48
TALLER PRÁCTICO DE PROBABILIDADES Y ESTADÍSTICA INFERENCIAL ACTIVIDAD NÚMERO 2 VARIABLES ALEATORIAS, DISTRIBUCIONES DE PROBABILIDAD Y MEDIDAS ESTADÍSTICAS BIVARIANTES EULER USAMA MAFLA ING. OSCAR JAVIER HERNANDEZ SIERRA

Upload: maflajo

Post on 05-Aug-2015

185 views

Category:

Documents


7 download

TRANSCRIPT

Page 1: Taller 2 Probabilidad Copia

TALLER PRÁCTICO DE PROBABILIDADES Y ESTADÍSTICA INFERENCIALACTIVIDAD NÚMERO 2

VARIABLES ALEATORIAS, DISTRIBUCIONES DE PROBABILIDAD Y MEDIDAS ESTADÍSTICAS BIVARIANTES

EULER USAMA MAFLA

ING. OSCAR JAVIER HERNANDEZ SIERRA

UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIAESCUELA DE CIENCIAS BÁSICAS, TECNOLOGÍA E INGENIERÍA

PROBABILIDADBOGOTÁ

2012

Page 2: Taller 2 Probabilidad Copia

1. Distribuciones de Probabilidad.

1.1. Distribución Probabilística.

1.1.1. Esperanza matemática.

Definición.

Se entiende por esperanza matemática, al valor esperado de una variable aleatoria discreta o continua. [1]

La media o esperanza de X da un valor típico o promedio de los valores de X y por esta razón se le llama medida de centralización; es decir, el valor esperado o media, indica la tendencia central de los datos. Es el valor alrededor del cual tienden a agruparse los datos de una distribución. [2]

En el caso de una variable aleatoria discreta, se calcula multiplicando cada valor posible por su probabilidad y sumando sus resultados. En el caso de una variable aleatoria continua, se debe recurrir al concepto de integral que se estudia en el cálculo integral. Generalmente se expresa por medio de la letra griega µ (parámetro) para el universo y con la notación E(X) ó X (estadística) para una muestra.

Para una variable aleatoria discreta X que puede tener los valores x1, x2,…, xn la esperanza de X se define como:

E (X )=x1P (X=x1 )+…+xnP (X=xn )=∑j=1

n

x j P (X=x j )

o igualmente, si P (X=x j )=f (x j ), entonces:

E (X )=x1 f (x1 )+…+ xn f (xn )=∑j=1

n

x j f (x j )=∑j=1

n

xf ( x )

Donde la última suma se toma sobre todos los valores apropiados de x. En la última expresión, para el caso especial en que las probabilidades son iguales, se tiene que:

E (X )=x1+x1+…+xn

n

Que se le llama media aritmética o simplemente la rnedia de x1, x2, …, xn.

Para una variable aleatoria continua X que tiene una función de densidad f(x) la esperanza de X se define como:

E (X )=∫−∞

xf (x)dx

A la esperanza de X frecuentemente se le llama la media de X y se denota por µx o simplemente µ cuando se sobreentiende la variable aleatoria determinada.

Page 3: Taller 2 Probabilidad Copia

Ejemplos:(Ejercicios desarrollados bajo fórmulas y calculadora)

1. Supóngase un juego con un dado. En este juego el jugador gana $20 si obtiene 2, $40 si obtiene 4, pierde $30 si obtiene 6; en tanto que ni pierde ni gana si obtiene otro resultado. Hallar la suma esperada de dinero ganado.

Solución:

Sea X la variable aleatoria que representa la cantidad de dinero ganada en cualquier lanzamiento. Las posibles cantidades de dinero ganado cuando el dado resulta 1, 2, …, 6 son x1, x2, …, x6 respectivamente con probabilidades f(x1), f(x2), …, f(x6). La función de probabilidad para X se indica en la tabla. Así, el valor esperado o esperanza es:

E (X )=(0 )( 16 )+ (20 )( 16 )+(0 )( 16 )+(40 )( 16 )+ (0 )( 16 )+(−30 )( 16 )=5x j

0 +20 0 +40 0 -30

f (x¿¿ j)¿ 1/6 1/6 1/6 1/6 1/6 1/6

Se deduce que el jugador puede esperar una ganancia de $5. Por tanto en un juego honrado es de esperarse pagar $5 por jugar.

2. La función de densidad de una variable aleatoria X estará dada por:

f ( x )={ 12x ,0<x<2

¿0 , de otra forma}El valor esperado de X es:

E (X )=∫−∞

xf ( x )dx=¿∫0

2

x ( 12 x)dx=∫02x2

2dx=[ x36 ]

0

2

=43

¿

3. La empresa Merril Lynch Global Fund se especializa en obligaciones a largo plazo de países extranjeros. Interesa saber la tasa de interés de estas obligaciones. Una muestra aleatoria de seis bonos reveló lo siguiente:

Artículo Tasa de interés %Bonos del gobierno de Australia 9.50Bonos del gobierno de Bélgica 7.25Bonos del gobierno de Canadá 6.50Bonos del gobierno de Francia 4.75

Bonos del gobierno de Italia 12.00Bonos del gobierno de España 8.30

Page 4: Taller 2 Probabilidad Copia

¿Cuál es la media de las tasas de interés en esta muestra de obligaciones a largo lazo?

Solución:

Como la media muestral está dada por:

Mediamuestral= sumade todos los valores d el amuestranúmerode todos los valores en lamuestra

X=∑ X

n=9.50%+7.25%+6.50%+4.75%+12.00%+8.30%

6=48.3%6

=8.05%

Ejemplo:(Ejercicio desarrollado en un libro de EXCEL)

Ver Ejemplos 1 y 2 en la Hoja 1 de Excel

1.1.2. Varianza de variables aleatorias.

Definición. [3] y[4]

La varianza es una medida de dispersión de la información, da una idea de la dispersión de la variable aleatoria respecto del valor esperado. Se obtiene como el promedio de los cuadrados de las desviaciones de los valores de la variable respecto de su media aritmética o esperanza.

Para datos simples (datos no agrupados) suele utilizarse la siguiente expresión para calcular la varianza poblacional de dichos datos no agrupados:

Var (X )=σ2=∑(x i−µ)2

N

NOTA: Los datos no están agrupados cuando no están tabulados en una distribución de frecuencias.

A la raíz cuadrada positiva de la varianza poblacional, σ , se la llama desviación estándar poblacional.

σ=√∑ (x i−µ)2

N

La varianza muestral se calcula mediante la siguiente expresión:

σ 2=∑ (x i−µ)2

n−1

Donde n es el número total de observaciones muestrales.

Page 5: Taller 2 Probabilidad Copia

Observación:

La sumatoria ∑ (x i−µ)2 también puede expresarse como:

∑ (x i−µ)2=∑ X2−(∑ X )2

n

Donde X es el valor de cada observación en la muestra.

De ahí que la varianza muestral pueda evaluarse más fácilmente mediante calculadora, con:

σ 2=∑ X2−

(∑ X )2

nn−1

Luego la desviación estándar sería:

σ=√∑ X2−(∑ X )2

nn−1

Ahora, si los datos de un estudio están en forma agrupada (en una distribución de frecuencias), la desviación estándar muestral puede

aproximarse al sustituir ∑ X2por ∑ f X2 y ∑ X por ∑ fX .

La expresión para calcular la desviación estándar muestral en éste caso sería:

σ=√∑ f X2−(∑ fX )2

nn−1

Dónde:

σ es la desviación estándar muestral.X es el punto medio de una clase.f es la frecuencia de clase.n es el número total de observaciones de la muestra.

Page 6: Taller 2 Probabilidad Copia

Asimismo, para datos agrupados, de acuerdo a la expresión inicialmente dada, la varianza suele calcularse como:

σ 2=∑ (x i−µ)2 ∙ f in−1

Dónde:

x i :marcadeclase f i : frecuenciadeclase n : tamañode lamuestra μ :mediaaritmética La varianza mide la distancia existente entre los valores de la serie y la media. La varianza siempre será mayor que cero. Mientras más se aproxima a cero, más concentrados están los valores de la serie alrededor de la media.

Por el contrario, mientras mayor sea la varianza, significa que más dispersos están los datos. A pesar de ello, la varianza tiene el inconveniente de ser poco significativa, ya que se mide en el cuadrado de la unidad de la variable. Por ejemplo, si la variable viene dada en cm, la varianza vendrá en cm2 .

Ejemplo 1:(Ejercicio desarrollado bajo formulas y calculadora)

Las edades de los miembros de una junta directiva son: 38, 26, 13 , 41 y 22 años. Cuál es la varianza de esa población?

Solución:

Registraremos en una tabla los datos, para un mayor orden:Edad (x) x i−µ (x i−µ)2

38261341

__22 140

+10-2

-15+13

-6

100 4

225169

__36534

μ=∑ x

N=1405

=28

σ 2=∑ (x−μ)2

N

= 5345

=106.8

Ejemplo 2:(Ejercicio desarrollado en un libro de EXCEL)

Ver hoja 2 en Excel donde se calculan: desviación estándar de éstos datos, y la varianza muestral.

Page 7: Taller 2 Probabilidad Copia

Una muestra de las cantidades que los empleados de Dupree Company invierten quincenalmente en el plan de participación de utilidades, se organizó en una distribución de frecuencias para su estudio (ver tabla). ¿Cuál es la desviación estándar de estos datos?. ¿Cuál es la varianza muestral?.

Cantidad invertida (en dólares) Número de empleados30 hasta 35 335 hasta 40 740 hasta 45 1145 hasta 50 2250 hasta 55 40 55 hasta 60 2460 hasta 65 965 hasta 70 4

Tabla 1. Muestra de las inversiones quincenales (en dólares) realizadas por los empleados de acuerdo con el plan de participación de utilidades.

Solución:

Ver hoja 2 en Excel donde se calculan: desviación estándar de éstos datos, y la varianza muestral.

1.1.3. Teorema de Chébyshev.

Definición.

Para un conjunto cualquiera de observaciones (muestra o población) la proporción mínima de los valores que se encuentran dentro de k

desviaciones estándar desde la media es por lo menos 1−1

k2 , donde k es

una constante mayor que 1. [3]

Ejemplo: En el ejemplo anterior hecho en Excel, la media aritmética de la cantidad quincenal que depositan los empleados de la empresa XXXX en el plan de participación de utilidades fue $51.54 dólares y se obtuvo una desviación estándar de $7.51 dólares. Al menos, ¿qué porcentaje de las contribuciones se encuentra entre más 3.5 desviaciones estándar, y menos 3.5 desviaciones estándar, respecto de la media?

Solución:

En éste caso, k=3.5; por lo tanto el porcentaje pedido es de:

1−1

k2=1− 1

(3.5)2=1− 1

12.25=0.92=92%

1.2. Distribuciones de Probabilidad Discreta.

Page 8: Taller 2 Probabilidad Copia

1.2.1. Concepto [5].

Una distribución de probabilidad indica en una lista todos los resultados posibles de un experimento junto con la probabilidad correspondiente a cada uno de ellos.Toda distribución de probabilidad discreta es generada por una variable aleatoria discreta x, la cual puede tomar diferentes valores de manera aleatoria, siendo éstos valores enteros y contando con un número finito de ellos.

1.2.2. Distribución Uniforme discreta.

Definición. [6]

Se tiene una distribución uniforme discreta cuando el resultado de una experiencia aleatoria puede ser un conjunto finito de n posibles resultados, todos ellos igualmente probables.

Ejemplo:

Un ejemplo puede ser la variable X, puntuación en el lanzamiento de un dado regular. Esta variable toma seis valores posibles que siguen una distribución uniforme discreta en {1, 2, 3, 4, 5, 6 }, todos con la misma probabilidad p = 1/6. La función de densidad de esta variable estará representada por:

f ( k )=P [ X=k ]=16≈0.1667 , k=1 ,2,3 ,4 ,5 ,6

La función de densidad gráficamente se representaría así:

Y la función de distribución se representaría mediante:

Page 9: Taller 2 Probabilidad Copia

En general, si la variable X puede tomar n=(k=1,2 ,…,n)valores, todos con igual probabilidad, su función de densidad será:

f ( k )=P [ X=k ]=1n, k=1,2 ,…n

1.2.3.Distribución Binomial.

Definición. [7]

La distribución binomial o de Bernoulli está asociada a experimentos del siguiente tipo:

- Realizamos n veces cierto experimento en el que consideramos sólo la posibilidad de éxito o fracaso.

- La obtención de éxito o fracaso en cada ocasión es independiente de la obtención de éxito o fracaso en las demás ocasiones.

- La probabilidad de obtener éxito o fracaso siempre es la misma en cada ocasión.

Definición formal:

Si realizamos n veces un experimento en el que podemos obtener éxito, E, con probabilidad p y fracaso, F, con probabilidad q (q = 1 – p ), diremos que estamos ante una distribución binomial de parámetros n y p, y lo representaremos por Bin (n; p). En este caso la probabilidad de obtener k éxitos viene dada por:

p (X=k )=(nk ) ∙ pk ∙ qn−k=(nk) ∙ pk ∙(1−p)n−k

Donde

(nk)Indica la combinatoria entre n y k

Nota:

Page 10: Taller 2 Probabilidad Copia

Obsérvese que las probabilidades de éxito y fracaso son complementarias, es decir, q = 1 – p y p = 1 – q . Basta con saber una de ellas para calcular la otra.

Ejemplo 1:(Ejercicio desarrollado bajo formulas y calculadora)

Supongamos que la probabilidad de que una pareja tenga un hijo o una hija

es igual, es decir ( 12=0.5). Calcular la probabilidad de que una familia con 6

descendientes tenga 2 hijos.

Solución:

Llamemos: Éxito = E = “tener hijo” ; entonces: p ( E ) = 0.5Y llamemos Fracaso = F = “tener hija” ; luego, p( F ) = 0.5

Estamos por tanto ante una distribución binomial, Bin (6 ; 0.5) y nos piden p(X=2).

Aplicando la fórmula se tiene que:

p (X=2 )=(62)∙ (0.5 )2 ∙ (0.5 )4=0.2344

Observación:

La elección de éxito o fracaso es subjetiva y depende de la elección de la persona que resuelve el problema, pero teniendo cuidado de plantear correctamente lo que se pide. En el caso concreto del ejemplo anterior, si:

Éxito = “tener hija”, como nos piden la probabilidad de que una familia con 6 hijos tenga 2 hijos, si el éxito es tener hija hemos de plantearnos cuál es la probabilidad de tener 4 éxitos (4 hijas). Por lo tanto, en éste caso tendríamos:

p (X=4 )=(64) ∙ (0.5 )4 ∙ (0.5 )2=0.2344

Como se puede apreciar, el resultado es el mismo, aunque hay que ser consecuente a la hora de elegir el éxito y el fracaso y la pregunta que nos hagan.

Ejemplo 2:(Ejercicio desarrollado en un libro de EXCEL)

Ver hoja 3 en Excel

Distribución Binomial Negativa

Definición.

Page 11: Taller 2 Probabilidad Copia

Puede definirse como una generalización del modelo Geométrico o de Pascal. Así, dado un suceso A y su complementario Ac, cuando X representa el número de veces que se da Ac (ausencias, fallos, etc.) hasta que se produce r veces el suceso A, en una serie de repeticiones de la experiencia aleatoria en condiciones independientes, decimos que X sigue la distribución Binomial negativa. Nótese que, cuando r = 1, tenemos exactamente el modelo geométrico.

Este modelo queda definido por dos parámetros p (la probabilidad de A: p = P(A)) y r (el número de veces que debe producirse A para que detengamos la experiencia).La función de densidad viene dada por:

f ( k )=P [ X=k ]=(k+r−1r−1 ) prqk ,k=0 ,1 ,2 ,…

Donde q representa el complementario de p: q = 1 - p

Ejemplo:

Para investigar a una empresa y salvarla de la crisis, ha de ser es necesario hacer ciertas interventorías en 5 departamentos independientes. Las medidas a aplicar son tal que si todo va bien, lo que ocurre con probabilidad de 7/11, el departamento se salva, pero si no es así deberá esperarse un tiempo suficiente para intervenirlo de nuevo. Se evaluarán mediante intervención de nuevo sus departamentos hasta que 4 de los 5 departamentos funcionen correctamente. ¿Cuál es el valor esperado de intervenciones que se espera se lleven a cabo en la empresa? ¿Cuál es la probabilidad de que se necesiten 10 intervenciones?

Solución

Este es un ejemplo claro de experimento aleatorio regido por una ley binomial negativa, ya que se realizan intervenciones hasta que se obtengan 4 departamentos libres de investigación, y éste es el criterio que se utiliza para detener la investigación.

Identificando los parámetros se tiene:

X = número de intervenciones hasta obtener r = 4 con resultado positivo

X→Bn(r=4 , p= 711)↔P [ X=k ]=(k+r−1k )qk pr

Lo que nos interesa es medir el número de intervenciones, Y, más que el número de éxitos hasta el r-ésimo fracaso. La relación entre ambas variables aleatorias es muy simple:

Y=X+r

Page 12: Taller 2 Probabilidad Copia

Luego:

E [Y ]=E [ X+r ]=E [ X ]+r= r pq

+r=4 ∙711411

+4=11

Luego el número esperado de intervenciones que se le aplicará a la empresa es de 11. La probabilidad de que el número de intervenciones sea Y = 10, es la de que X= 10 – 4 = 6

Por lo tanto:

P [Y=10 ]=P [ X=6 ]=(6+4−16 )q6 p4=84 ( 411)6

( 711 )4

=0.03185

Distribución Binomial Geométrica.

Definición [8]

Si una variable aleatoria discreta X definida en un espacio de probabilidad representa el número de repeticiones necesarias de un experimento de Bernoulli para obtener el primer éxito, entonces tiene por función de densidad:

P (X=x )=qx−1 p

Dónde:

P (X=x ) : Función de densidad de la variable aleatoria con distribución

geométrica.

x : Número de experimentos hasta que aparece el primer éxito.

p : Probabilidad de éxito.

q : Probabilidad de fracaso: q = 1 – p

Ejemplo:

De la carrera de economía, se encontró que el 60% de los alumnos son hombres, calcular probabilidad de extraer el primer hombre a la cuarta ocasión que extraemos un alumno de la carrera.

Page 13: Taller 2 Probabilidad Copia

Solución:

Sea: Éxito= el alumno seleccionado sea hombre

x = 4p = 0.60q = 0.40

P [ X=4 ]=(0.40)4−1 (0.60 )=(0.40 )3 (0.60 )=0.0384=3.84%

1.2.4. Distribución Hipergeométrica.

Definición. [4]

Recordando que, la distribución binomial es que la probabilidad de éxito permanezca igual de un ensayo a otro. Cuando el muestreo se realiza sin reposición y la muestra se obtiene de una población relativamente pequeña, la probabilidad de éxito no permanece igual de un ensayo a otro, y no se debe utilizar la distribución binomial.

En vez de ésta, debe aplicarse la distribución hipergeométrica.

Por tanto: 1) si se selecciona una muestra de una población finita, sin reposición, y, 2) si el tamaño de la muestra n es mayor que 5% del tamaño N de la población, entonces se utiliza la distribución hipergeométrica para determinar la probabilidad de un número específico de éxitos o fracasos. Esta distribución resulta muy adecuada cuando el tamaño de la población es pequeño.Observación: Cuando el tamaño de la población (N) es muy grande, la ley hipergeométrica tiende a aproximarse a la binomial

La distribución hipergeométrica está dada por:

P (X )=(Sx)(N−S

n−x )(Nn )

Dónde: N: es el tamaño de la población.S: es la cantidad de éxitos en la población.x: es el número de éxitos en la muestra. Puede ser 0, 1, 2, 3, …n: es el tamaño de la muestra, o el número de ensayos. Ejemplo 1:(Ejercicio desarrollado bajo formulas y calculadora)

Se tiene una baraja de cartas españolas (N = 40 naipes), de las cuales nos vamos a interesar en el palo de oros (S = 10 naipes de un mismo tipo).

Page 14: Taller 2 Probabilidad Copia

Supongamos que de esa baraja extraemos n = 8 cartas de una vez (sin reemplazamiento; es decir, sin reposición) y se nos plantea el problema de calcular la probabilidad de que hayan x = 2 cartas de oro (exactamente) en esa extracción. La respuesta a este problema es:

P [2oros enun grupode 8cartas ]= casos favorablescasos posibles

¿(2naipes entre los oros ) ∙ (6naipes de otros palos )

(8naipes cualesquiera )

¿(Sx )(N−S

n−x )(Nn )

=(102 )(306 )

(408 )=45 ∙59377576904685

=0.347

Ejemplo 2:(Ejercicio desarrollado en un libro de EXCEL)

Ver hoja 4 en Excel

1.2.5. Distribución de Poisson.

Definición.[5]

La distribución de Poisson se utiliza en situaciones donde los sucesos son impredecibles o de ocurrencia aleatoria. En otras palabras no se sabe el total de posibles resultados.

Permite determinar la probabilidad de ocurrencia de un suceso con resultado discreto. Es muy útil cuando la muestra o segmento n es grande y la probabilidad de éxitos p es pequeña.

Se utiliza cuando la probabilidad del evento que nos interesa se distribuye dentro de un segmento n dado como por ejemplo distancia, área, volumen o tiempo definido; es decir, en este tipo de experimentos los éxitos buscados son expresados por unidad de área, tiempo, pieza, etc:

- # de defectos de una tela por m2

- # de aviones que aterrizan en un aeropuerto por día, hora, minuto, etc.- # de bacterias por cm2 de cultivo- # de llamadas telefónicas a un conmutador por hora, minuto, etc.- # de llegadas de embarcaciones a  un puerto por día, mes, etc.

Para determinar la probabilidad de que ocurran x éxitos por unidad de tiempo, área, o producto, la fórmula a utilizar sería:

Page 15: Taller 2 Probabilidad Copia

p ( x , μ )= μxe−μ

x !

Dónde:

p(x, μ) = probabilidad de que ocurran x éxitos, cuando el número promedio de ocurrencia de ellos es μ.μ = media o promedio de éxitos por unidad de tiempo, área o producto.x = variable que nos denota el número de éxitos que se desea que ocurra.

Observación:

En esta distribución el número de éxitos que ocurren por unidad de tiempo, área o producto es totalmente al azar y que cada intervalo de tiempo es independiente de otro intervalo dado, así como cada área es independiente de otra área dada y cada producto es independiente de otro producto dado.

Ejemplo 1:(Ejercicio desarrollado bajo formulas y calculadora)

Si un banco recibe en promedio 6 cheques sin fondo por día, ¿cuáles son las probabilidades de que reciba:a) cuatro cheques sin fondo en un día dado?.b) 10 cheques sin fondos en cualquiera de dos días consecutivos?

Solución:

a)x = # de cheques sin fondo que llegan al banco en un día cualquiera = 0, 1, 2, 3, …μ = 6 cheques sin fondo por día

Remplazando, tenemos:

P ( x=4 , μ=6 )=64 e−6

4 !=0.13392

Ejemplo 2:(Ejercicio desarrollado en un libro de EXCEL)

Ver hoja 5 en Excel

1.3. Distribuciones de Probabilidad Continua.

1.3.1.Concepto [9].

El comportamiento de una variable aleatoria queda descrito por su distribución de probabilidad.

Page 16: Taller 2 Probabilidad Copia

- A menudo, las observaciones de diferentes experimentos estadísticos tienen el mismo tipo general de comportamiento.

- En consecuencia, las variables aleatorias continuas asociadas se pueden describir con la misma distribución de probabilidad y se pueden representar mediante una sola fórmula.

1.3.2.Distribución Uniforme Continua.

Definición [9].

La distribución uniforme continua es la más simple de todas las distribuciones continuas de probabilidad, ya que:

- Se caracteriza por una función de densidad que es “plana”, y por ello la probabilidad es uniforme en un intervalo cerrado.

- La función de densidad de la variable aleatoria uniforme continua X en el intervalo [A,B] es:

f ( x ; A ,B )={ 1B−A

A ≤x ≤B

¿0otrocaso }La media y la varianza de a distribución uniforme continua f ( x ; A ,B )son respectivamente:

μ= A+B2

y σ 2=(B−A)2

12

Ejemplo:

El precio medio del galón de gasolina durante el próximo año en Colombia se estima que puede oscilar entre 8500 y 9000 pesos. Podría ser, por tanto, de 8600 pesos, o de 8650 pesos, o de 8740.5 pesos, o de 8810.53 pesos, etc. Hay infinitas posibilidades, todas ellas con la misma probabilidad.

Su función de densidad, aquella que nos permite conocer la probabilidad que tiene cada punto del intervalo, viene definida por:

f ( x )= 1B−A

Entonces la función de distribución del ejemplo, sería:

f ( x )= 19000−8500

= 1500

=0.002

El valor medio esperado, de ésta distribución es:

E ( x )=8500+90002

=8750

Page 17: Taller 2 Probabilidad Copia

Por lo tanto, el precio medio esperado del galón de gasolina para el próximo año es de 8750 pesos

1.3.3. Distribución Normal.

Definición [9].

La distribución continua de probabilidad más importante en todo el campo de la estadística es la distribución normal. Su gráfica se denomina curva normal, es una curva con forma de campana, la cual describe aproximadamente muchos fenómenos que ocurren en la naturaleza, la industria y la investigación.

La distribución normal a menudo se denomina distribución gaussiana, en honor de Karl Friedrich Gauss.

Una variable aleatoria continua X que tiene la distribución en forma de campana se llama variable aleatoria normal. La ecuación matemática para la distribución de probabilidad de la variable normal depende de los dos parámetros μ y σ, su media y desviación estándar, respectivamente. De aquí se denota los valores de la densidad de X con n(x; μ, σ).

La función de densidad de la variable aleatoria normal X, con media μ y varianza σ 2, es:

n ( x ; μ , σ )= 1σ √2 π

e−12 ( x−μ

σ )2

,−∞< x<+∞

Una vez que se especifican μ y σ , la curva normal queda determinada por completo.

Área bajo la curva normal:

La curva de cualquier distribución continua de probabilidad o función de densidad se construye de modo que el área bajo la curva limitada por las

Page 18: Taller 2 Probabilidad Copia

dos ordenadas x = a y x = b es igual a la probabilidad de que la variable aleatoria X tome un valor entre x = a y x = b.

P (a<X<b )=∫a

b

n ( x ; μ ,σ )dx= 1σ √2π∫a

b

e−12 ( x−μ

σ )2

Como se puede apreciar, el área bajo la curva entre cualesquiera dos valores también depende de los valores μ y σ. La dificultad que se encuentra al resolver las integrales de funciones de densidad normal necesita de la tabulación de las áreas de la curva normal para una referencia rápida. Sería una tarea sin fin intentar establecer tablas separadas para cada valor concebible de μ y σ.

Para lo anterior, se puede transformar un conjunto de observaciones de cualquier variable aleatoria normal X a un nuevo conjunto de observaciones de una variable aleatoria normal llamada Z con μ = 0 y σ2 = 1. Esto se puede realizar mediante la transformación:

Z= X−μσ

Siempre que X tome un valor x, el valor correspondiente de Z estará dado por: z = (x – μ)/σ.

Por lo tanto, si X cae entre los valores a y b, la variable aleatoria Z caerá entre los valores correspondientes z1 = (a – μ)/σ y z2 = (b – μ)/σ.

En consecuencia:

p (a<X<b )= 1σ √2 π∫a

b

e−12 ( x−μ

σ )2

dx

∫z1

z2

n(z ;0 ,1)dx

P (a<X<b )=P(z1<Z<z2)

Donde Z se ve como una variable aleatoria normal con μ = 0 y σ2 = 1

La distribución de una variable aleatoria normal con μ = 0 y σ2 = 1 se llama distribución normal estándar.

Page 19: Taller 2 Probabilidad Copia

La siguiente tabla, muestra algunos de los valores calculados del área bajo la curva normal P( Z< z ):

Page 20: Taller 2 Probabilidad Copia

Aplicaciones:

- Las mediciones físicas en áreas como los experimentos meteorológicos, estudios de lluvia y mediciones de partes fabricadas a menudo se explican mejor con una distribución normal.

- Los errores en las mediciones científicas se aproximan extremadamente bien mediante una distribución normal.

Ejemplo 1: [10]

(Ejercicio desarrollado bajo formulas y calculadora)

Una empresa instala en una ciudad 20.000 bombillas para su iluminación. La duración de una bombilla sigue una distribución normal con media 302 días y desviación típica 40 días. Calcular. a) ¿Cuántas bombillas es de esperar que se fundan antes de 365 días? ¿Cuántas durarán más de 400 días?

Solución:

Page 21: Taller 2 Probabilidad Copia

a) Tipificamos el valor 365  →  z = (365 - 302) / 40 = 1,575 P (X ≤ 365) = P (z  ≤ 1,575)

Al observar la tabla de distribución normal: P (z  ≤ 1,575 )= 0,9418

Luego el 94,18% de las lámparas, es decir 20.000 ∙ 0.9418 = 18.836 bombillas se fundirán antes de  365 días.

b) Tipificamos el valor 400  →  z = (400 - 302) / 40 = 2,45P (X > 400) = P (z  > 2,45) = 1 - P (z ≤ 2,45 ) = 1 - 0,9929 = 0,0071 (según la tabla).

Entonces el 0,71% de las lámparas, es decir 20.000 ∙ 0.0071 = 142 bombillas durarán más de 400 días.

Ejemplo 2: (Ejercicio desarrollado bajo formulas y calculadora)

La vida media de una lámpara, según el fabricante, es de 68 meses, con una desviación típica de 5. Se supone que se distribuye según una distribución normal En un lote de 10.000 lámparas. a) ¿Cuántas lámparas superarán previsiblemente los 75 meses?. b) ¿Cuántos lámparas se estropearán antes de 60 meses?

a)z = (75 - 68) / 5 = 1,4P (X > 75) = (z > 1,4) = 1 - P (z ≤ 1,4) = 1 - 0,9192 = 0,0808

Luego, el 8,08% de las lámparas (808 lámparas) superarán los 75 meses

b)t = (60 - 68) / 5 = -1,6P (X ≤ 60) = (z  ≤  -1,6) = P (z > 1,6) = 1 - P (z ≤  1,6) = 0,0548

Luego, el 5,48% del lote (548 lámparas) no llegarán probablemente a durar 60 meses

Ejemplo 3:(Ejercicio desarrollado en un libro de EXCEL)

Ver hoja 6 de Excel

1.3.4. Distribución Exponencial.

Definición [11].

La distribución exponencial es el equivalente continuo de la distribución geométrica discreta. Esta ley de distribución describe procesos en los que:

Page 22: Taller 2 Probabilidad Copia

Nos interesa saber el tiempo hasta que ocurre determinado evento, sabiendo que,

el tiempo que pueda ocurrir desde cualquier instante dado t, hasta que ello ocurra en un instante tf (tiempo final), no depende del tiempo transcurrido anteriormente en el que no ha pasado nada.

A pesar de que la distribución Normal puede utilizarse para resolver muchos problemas en ingeniería y ciencias, existen aún numerosas situaciones que requieren diferentes tipos de funciones de densidad, tales como la exponencial y la gamma y algunas otras como la Weibull, etc. [12] La distribución exponencial es un caso especial de la distribución gamma, ambas tienen un gran número de aplicaciones. Las distribuciones exponencial y gamma juegan un papel importante tanto en teoría de colas como en problemas de confiabilidad. El tiempo entre las llegadas en las instalaciones de servicio y el tiempo de falla de los componentes y sistemas eléctricos, frecuentemente involucran la distribución exponencial. La relación entre la gamma y la exponencial permite que la distribución gamma se utilice en tipos similares de problemas.

La curva de distribución exponencial se caracteriza por tener la siguiente forma: [13]

La distribución exponencial se usa como modelo para la distribución de tiempos entre la presentación de eventos sucesivos. Existe un tipo de variable aleatoria que obedece a una distribución exponencial la cuál se define como el tiempo que ocurre desde un instante dado hasta que ocurre el primer suceso.

Se dice que una variable aleatoria continua tiene una distribución exponencial con parámetro λ > 0 si:- su función de densidad es:

f (x)={λ e−λx , para todo x≥0¿0de otromodo }

Page 23: Taller 2 Probabilidad Copia

Y su gráfica respectiva es de la siguiente forma:

La esperanza o valor esperado en la distribución exponencial es: E [ X ]=1λ

Su varianza es: V (X )= 1

λ2

Su respectiva función de distribución acumulada es:

F ( x )=P (X ≤ x )={ 0 , para x<0¿1−e− λx , para x≥0}

Cuya gráfica sería:

Sea X una distribución exponencial, entonces: P(X > a + t | X > a) = P( X >t )

Ejemplo 1:(Ejercicio desarrollado bajo formulas y calculadora)

Suponga que el tiempo de respuesta X en cierta terminal de computadora en línea (el tiempo transcurrido entre el fin de la consulta del usuario y el

Page 24: Taller 2 Probabilidad Copia

principio de la respuesta del sistema a esa consulta) tiene una distribución exponencial con tiempo esperado de respuesta igual a 5 s. ¿Cuál es la probabilidad de que el tiempo de respuesta sea a lo sumo 10 s?

Solución:

Datos:

E (X )=1λ=5 s Por lo tanto: λ = 0.2

Obteniendo la distribución acumulada:

F (10 )=1−e−(0.2 ∙ (10 ))=1−e−2≈0.865

P (X ≤10 )=F (10 )=0.86

La probabilidad de que el tiempo de respuesta esté entre 5 y 10 segundos es:

P (5≤ X ≤10 )=F (10 )−F (5 )=(1−e−2)−(1−e−1 )≈0.233

Ejemplo 2:(Ejercicio desarrollado en un libro de EXCEL)

(PENDIENTE ) Ver

1.3.5. Distribución Chi-Cuadrado.

Definición. [14] y [15]

La distribución Chi Cuadrado (léase: Ji cuadrado), es una distribución cuadrática de la probabilidad que utiliza básicamente variables aleatorias continuas. La Distribución Chi Cuadrado de la probabilidad se denota mediante la letra griega minúscula ji elevada al cuadrado (χ2), y consiste en establecer un espacio continuo delimitado por la suma de los cuadrados de n variables aleatorias que son independientes entre sí, espacio dentro del cual la variable X puede asumir cualquiera de los infinitos valores que lo conforman, y por tanto para establecer el valor aproximado de una variable X dentro de ese espacio se procede a incluir una estimación de sus posibles límites que están dados por los distintos grados de libertad que pueden existir entre las variables aleatorias analizadas que dan origen al referido espacio.

Así, la Distribución Chi Cuadrado en un delimitado espacio conjuga un determinado número de variables aleatorias independientes entre sí, con unos valores de probabilidad ubicados entre 1 y 0 que son atribuibles a esas variables, y con unos límites de la probabilidad para el verdadero valor de X delimitados por los grados de libertad atribuibles a las variables aleatorias analizadas.

Page 25: Taller 2 Probabilidad Copia

La Distribución Chi Cuadrado permite calcular la probabilidad existente para que una variable X, que tiene un determinado grado de libertad frente a otras variables del mismo conjunto, permanezca dentro de unos límites ideales previstos para X cuando tiene ese específico grado de libertad o independencia. En otras palabras, la Distribución Chi Cuadrado suministra un modelo ideal sobre los límites probables que deberían regir las fluctuaciones en la aparición de un determinado valor aleatorio X dependiendo del grado de libertad que tiene ese valor frente a otras variables similares dentro de un conjunto de datos analizados. La fórmula matemática para calcular la probabilidad de que una variable X permanezca dentro del límite ideal correspondiente al respectivo grado de libertad es la siguiente:

Función de densidad de probabilidad:

f ( X )= χ2k (X )= 12k/2Γ (k /2)

∙ xk2−1∙ e

− x2 , si x>0

Espacio paramétrico: Grados de libertad: k∈ {1,2,3 ,.. }

Valor esperado: k

Varianza: 2k

Función generadora de momentos: ( 11−2 t )

k2 parat<1

2

En esta ecuación la letra k que aparece como un subíndice de la expresión

χ2 indica el grado de libertad que se toma como límite para calcular la probabilidad de la variable aleatoria X. Esta ecuación para ser despejada requiere el uso de la compleja Función Gamma (Γ ), y por tanto generalmente para solucionar esta ecuación se emplean métodos basados en la consulta de tablas o en el uso de algoritmos para ordenador que permiten obtener los valores de probabilidad respectivos.

Tabla de distribución Chi Cuadrado (fragmento)

x/k 1 2 3 4 5 6 7 8 9 10

0,2 0,345279 0,095163 0,022411 0,004679 0,000886 0,000155 0,00025 0,000004 0,000001 0,000000

0,4 0,472911 0,181269 0,059758 0,017523 0,004670 0,001148 0,000263 0,000057 0,000012 0,000002

0,6 0,561422 0,259182 0,103568 0,036936 0,011997 0,003599 0,001008 0,000266 0,000066 0,000016

Page 26: Taller 2 Probabilidad Copia

0,8 0,628907 0,329680 0,150 33 0,061552 0,022967 0,007926 0,002556 0,000776 0,000223 0,000061

1,0 0,682689 0,393469 0,198748 0,090204 0,037434 0,014388 0,005171 0,001752 0,000562 0,000172

1,2 0,726678 0,451188 0,246996 0,121901 0,055123 0,023115 0,009073 0,003358 0,001179 0,000394

1,4 0,763276 0,503415 0,294465 0,155805 0,075687 0,034142 0,014429 0,005753 0,002177 0,000786

1,6 0,794097 0,550671 0,340610 0,191208 0,098751 0,047423 0,021356 0,009080 0,003665 0,001411

1,8 0,820287 0,593430 0,385065 0,227518 0,123932 0,062857 0,029924 0,013459 0,005750 0,002344

2,0 0,842701 0,632121 0,427593 0,264241 0,150855 0,080301 0,040160 0,018988 0,008532 0,003660

2,2 0,861989 0,667129 0,468052 0,300971 0,179164 0,099584 0,052053 0,025742 0,012104 0,005435

2,4 0,878665 0,698806 0,506365 0,337373 0,208526 0,120513 0,065563 0,033769 0,016547 0,007746

2,6 0,893136 0,727468 0,542510 0,373177 0,238635 0,142888 0,080619 0,043095 0,021928 0,010663

2,8 0,905736 0,753403 0,576500 0,408167 0,269214 0,166502 0,097133 0,053725 0,028301 0,014253

3,0 0,916735 0,776870 0,608375 0,442175 0,300014 0,191153 0,114998 0,065642 0,035705 0,018576

3,2 0,926362 0,798103 0,638195 0,475069 0,330817 0,216642 0,134095 0,078813 0,044165 0,023682

3,4 0,934804 0,817316 0,666035 0,506754 0,361430 0,242777 0,154299 0,093189 0,053692 0,029615

3,6 0,942220 0,834701 0,691978 0,537163 0,391687 0,269379 0,175477 0,108708 0,064284 0,036407

Page 27: Taller 2 Probabilidad Copia

3,8 0,948747 0,850431 0,716114 0,566251 0,421445 0,296280 0,197496 0,125298 0,075924 0,044081

4,0 0,954500 0,864665 0,738536 0,593994 0,450584 0,323324 0,220223 0,142877 0,088587 0,052653

4,2 0,959576 0,877544 0,759338 0,620385 0,479005 0,350369 0,243525 0,161357 0,102237 0,062126

4,4 0,964061 0,889197 0,778615 0,645430 0,506626 0,377286 0,267277 0,180648 0,116829 0,072496

4,6 0,968028 0,899741 0,796458 0,669146 0,533384 0,403961 0,291355 0,200653 0,132308 0,083751

4,8 0,971540 0,909282 0,812958 0,691559 0,559227 0,430291 0,315645 0,221277 0,148617 0,095869

5,0 0,974653 0,917915 0,828203 0,712703 0,584120 0,456187 0,340037 0,242424 0,165692 0,108822

Fuente: http://es.wikibooks.org/wiki/Tablas_estad%C3%ADsticas/Distribuci%C3%B3n_chi-cuadrado

Ejemplo 1:(Ejercicio desarrollado bajo formulas y calculadora)

Calcular la distribución de probabilidad de una variable estadística chi-cuadrado, de 6 grados de libertad y sea mayor de 3,4.

Solución:

P ( χ26>3.4 )=1−P ( χ26<3.4 )

Al buscar en la tabla, se tiene que:

P ( χ26<3.4 )=0.242777Con lo cual:

P ( χ26>3.4 )=1−0.242777Por lo tanto:

( χ26>3.4)=0.757223

Ejemplo 2:(Ejercicio desarrollado en un libro de EXCEL)

Page 28: Taller 2 Probabilidad Copia

Ver hoja 8 en Excel

1.3.6. Distribución T-Student.

Definición.[16] En la generalidad de los casos, no disponemos de la desviación estándar de la población, sino de una estimación calculada a partir de una muestra extraída de la misma y por lo tanto no podemos calcular Z.

En estos casos calculamos el estadístico T:

T=μ−xs

Donde:

s=√∑ (x−x i )2

n−1Donde s es la desviación estándar muestral, calculada con n – 1 grados de libertad.

El estadístico T tiene una distribución que se denomina distribución T de Student, que está tabulada para 1, 2, 3, ... etc. grados de libertad de la muestra con la cual se calculó la desviación estándar. La distribución T tiene en cuenta la incertidumbre en la estimación de la desviación estándar de la población, porque en realidad la tabla de T contiene las distribuciones de probabilidades para distintos grados de libertad.

La distribución T es más ancha que la distribución normal tipificada para un número de grados de libertad pequeño. Cuando los grados de libertad tienden a infinito, la distribución T tiende a coincidir con la distribución normal estándar. Es decir, en la medida que aumentemos el número de observaciones de la muestra, la desviación estándar calculada estará más próxima a la desviación estándar de la población y entonces la distribución T correspondiente se acerca a la distribución normal estándar. El uso de la distribución T presupone que la población con que estamos trabajando tiene una distribución normal.

Por otra parte [17], la distribución t de Student, tiene por función de densidad:

Page 29: Taller 2 Probabilidad Copia

t n ( x )= 1

√nπ∙Γ ( n+12 )Γ ( n2 )

∙(1+ x2

n )−n+12

Donde el parámetro n de tn , se denomina grados de libertad de la distribución.

La distribución t de Student existe para todos los valores de x reales, y es simétrica respecto al eje y.

La distribución de probabilidad de esta función para valores menores de

un x dado, que representamos por P (t n<x )

P (t n<x )=∫−∞

x

tn(u)du

Donde

∫−∞

x

t n (u )du=¿∫−∞

x1

√nπ∙Γ ( n+12 )Γ ( n2 )

∙(1+ x2

n )−n+12 du¿

Para el cálculo de ésta integral existen distintos tipos de Tabla de Distribución t de Student, en la que para distintos valores de n y de x se puede buscar su probabilidad acumulada p.

Una de esas tablas es la siguiente:

Tabla de distribución t de Student

x\n 1 2 4 5 6 7 8 9 10 15 20 25 30 40 50

0,00

0,500

0,500

0,500

0,500

0,500

0,500

0,500

0,500

0,500

0,500

0,500

0,500

0,500

0,500

0,500

0,05

0,516

0,518

0,519

0,519

0,519

0,519

0,519

0,519

0,519

0,520

0,520

0,520

0,520

0,520

0,520

0,10

0,532

0,535

0,537

0,538

0,538

0,538

0,539

0,539

0,539

0,539

0,539

0,539

0,539

0,540

0,540

Page 30: Taller 2 Probabilidad Copia

0,15

0,547

0,553

0,556

0,557

0,557

0,558

0,558

0,558

0,558

0,559

0,559

0,559

0,559

0,559

0,559

0,20

0,563

0,570

0,574

0,575

0,576

0,576

0,577

0,577

0,577

0,578

0,578

0,578

0,579

0,579

0,579

0,25

0,578

0,587

0,593

0,594

0,595

0,595

0,596

0,596

0,596

0,597

0,597

0,598

0,598

0,598

0,598

0,30

0,593

0,604

0,610

0,612

0,613

0,614

0,614

0,615

0,615

0,616

0,616

0,617

0,617

0,617

0,617

0,35

0,607

0,620

0,628

0,630

0,631

0,632

0,632

0,633

0,633

0,634

0,635

0,635

0,636

0,636

0,636

0,40

0,621

0,636

0,645

0,647

0,648

0,649

0,650

0,651

0,651

0,653

0,653

0,654

0,654

0,654

0,655

0,45

0,635

0,652

0,662

0,664

0,666

0,667

0,668

0,668

0,669

0,670

0,671

0,672

0,672

0,672

0,673

0,50

0,648

0,667

0,678

0,681

0,683

0,684

0,685

0,685

0,686

0,688

0,689

0,689

0,690

0,690

0,690

0,55

0,660

0,681

0,694

0,697

0,699

0,700

0,701

0,702

0,703

0,705

0,706

0,706

0,707

0,707

0,708

0,60

0,672

0,695

0,710

0,713

0,715

0,716

0,717

0,718

0,719

0,721

0,722

0,723

0,723

0,724

0,724

0,65

0,683

0,709

0,724

0,728

0,730

0,732

0,733

0,734

0,735

0,737

0,738

0,739

0,740

0,740

0,741

0,70

0,694

0,722

0,739

0,742

0,745

0,747

0,748

0,749

0,750

0,753

0,754

0,755

0,755

0,756

0,756

Page 31: Taller 2 Probabilidad Copia

0,75

0,705

0,734

0,753

0,756

0,759

0,761

0,763

0,764

0,765

0,768

0,769

0,770

0,770

0,771

0,772

0,80

0,715

0,746

0,766

0,770

0,773

0,775

0,777

0,778

0,779

0,782

0,783

0,784

0,785

0,786

0,786

0,85

0,724

0,758

0,778

0,783

0,786

0,788

0,790

0,791

0,792

0,796

0,797

0,798

0,799

0,800

0,800

0,90

0,733

0,768

0,790

0,795

0,799

0,801

0,803

0,804

0,805

0,809

0,811

0,812

0,812

0,813

0,814

0,95

0,742

0,779

0,802

0,807

0,811

0,813

0,815

0,817

0,818

0,821

0,823

0,824

0,825

0,826

0,827

En esta tabla hay dos entradas, en la fila superior están los valores de n para los que se ha calculado la probabilidad, en la columna de la izquierda los de x, para x igual o mayor que cero, en incrementos de 0,05, para cada valor de n y de la x correspondiente tenemos la probabilidad acumulada, expresada con tres cifras decimales.

Ejemplo 1:(Ejercicio desarrollado bajo formulas y calculadora)

¿Cuál es la probabilidad de que una variable t de Student de 6 grados de libertad deja a la izquierda de -0,75?

Solución:Se pide:

P (t 6←0.75 )

Como no hay valores negativos en la tabla, se toma:

P (t 6←1.45 )=1−P (t 6<0.75 )En la tabla, se encuentra que:

P (t 6<0.75 )=0.759Por lo tanto:

P (t 6←1.45 )=1−0.759=0.241

Ejemplo 2:(Ejercicio desarrollado en un libro de EXCEL)

Page 32: Taller 2 Probabilidad Copia

Ver hoja 9 de Excel

1.3.7. Otras distribuciones continuas utilizadas.

Mencione una distribución no mencionada anteriormente en el documento . (DISTRIBUCION GAMMA pendiente ejemplo)

Definición. Es una función asimétrica, que tiende a la simetría a ciertos valores de sus dos parámetros.

Ejemplo:

Mencione una distribución no mencionada anteriormente en el documento . (DISTRIBUCION BETA pendiente ejemplo)

Definición. Es una familia de distribuciones sesgadas, se usa para modelar variación de la proporción o porcentajes de una cantidad.

Ejemplo:

Mencione una distribución no mencionada anteriormente en el documento . (DISTRIIBUCION WEIBULL pendiente ejemplo)

Definición. Fue creada para el análisis de fallas, como también para la tasa de riesgo creciente o decreciente; muy útil para describir patrones de falla.

Ejemplo:

2. Medidas Estadísticas Bivariantes

Definición.[18]

Con bastante frecuencia en estadística se desea determinar la relación, si existe, entre dos variables como entre edad y peso, peso y estatura, años de educación y salario, cantidad de ejercicio diario y nivel de colesterol, entre otros. Sean x y y, las dos variables, los datos consistirán en una lista de pares de valores numéricos:

(x1 , y1 ) , (x2 , y2 ) , (x3, y3 ) ,…, ( xn, yn )

Page 33: Taller 2 Probabilidad Copia

Donde los primeros valores corresponden a la variables x y los segundos valors corresponden a la variable y. Al igual que sucede con una sola variable, se pueden describir esos datos bivariados en forma gráfica y numérica. El interés principal es determinar si hay una relación matemática, como por ejemplo una relación lineal, entre los datos.

Debe tenerse en cuenta que una relación estadística entre dos variables no necesariamente implica que hay una relación causal entre ellos. Por ejemplo, una fuerte relación entre peso y estatura no implica que una variable cause la otra. Por otra parte, comer más, generalmente aumenta el peso de una persona, pero esto, generalmente, no significa que habrá un aumento en la estatura de la persona. 2.1. Diagrama de dispersión.

2.1.1. Definición [18].

Considérese una lista de pares de valores numéricos que represente las variables x y y. La dispersión de puntos o el diagrama de dispersión de los datos es, simplemente, una representación de los pares de valores como puntos en un plano de coordenadas R 2. La representación indica algunas veces una relación entre los puntos.

Ejemplo 1:(Ejercicio desarrollado bajo formulas y calculadora)

Se tienen los siguientes datos, donde x representa la temperatura diaria promedio en una planta de producción, en grados Fahrenheit, y representa el consumo diario correspondiente de gas natural en dicha planta, en pies cúbicos.

x 50 45 40 38 32 40 55y 2.5 5.0 6.2 7.4 8.3 4.7 1.8

Los pares de puntos a representar en el plano cartesiano son:(50, 2.5), (45, 5.0), (40, 6.2), (38, 7.4), (32, 8.3), (40, 4.7) y (55, 1.8)

El diagrama de dispersión obtenido es:

30 35 40 45 50 55 600123456789

Diagrama consumo - temperatura

Temperatura (Farenheit)

Cons

umo

(pie

s cúb

icos)

Page 34: Taller 2 Probabilidad Copia

Ejemplo 2:(Ejercicio desarrollado en un libro de EXCEL)

Ver hoja 10 de Excel

2.2. Regresión.

2.2.1. Definición [19].

La regresión es una técnica estadística utilizada para simular la relación existente entre dos o más variables. Por lo tanto se puede emplear para construir un modelo que permita predecir el comportamiento de una variable dada. La regresión es muy utilizada para interpretar situaciones reales, pero comúnmente se hace de mala forma, por lo cual es necesario realizar una selección adecuada de las variables que van a construir las ecuaciones de la regresión, ya que tomar variables que no tengan relación en la práctica, nos arrojará un modelo carente de sentido, es decir ilógico.

Según sea la dispersión de los datos (nube de puntos) en el plano cartesiano, pueden darse alguna de las siguientes relaciones, Lineal, Logarítmica, Exponencial, Cuadrática, entre otras. 

2.2.2. Regresión Lineal Simple.

Definición [20].

La Regresión lineal simple.  Tiene como objeto estudiar cómo los cambios en una variable, no aleatoria, afectan a una variable aleatoria, en el caso de existir una relación funcional entre ambas variables que puede ser establecida por una expresión lineal, es decir,  su representación gráfica es una línea recta.  Cuando la relación lineal concierne al valor medio o esperado de la variable aleatoria, estamos ante un modelo de regresión lineal simple. La respuesta aleatoria al valor x de la variable controlada se designa por Yx y, según lo establecido, se tendrá 

E (Y x )=μx=α+ βx

Donde α y β son los coeficientes de regresión

De manera equivalente, otra  formulación del modelo de regresión lineal simple sería: si xi es un valor de la variable predictora y Yi la variable respuesta que le corresponde, entonces 

Y i=α+β xi+E i

Donde Ei es el error o desviación aleatoria de Yi.   

Page 35: Taller 2 Probabilidad Copia

Ejemplo 1:(Ejercicio desarrollado bajo formulas y calculadora)

En el diagrama de dispersión obtenido en el ejemplo 1, donde se relacionan consumo de gas natural contra temperatura, es posible hallar mediante Excel, una línea recta que caracterice dicha relación entre las variables.

Al colocar una línea de tendencia lineal en Excel, se obtiene la siguiente gráfica, con su correspondiente ecuación de la recta, con un error o desviación aleatoria:

Ver Hoja 10 en Excel

La ecuación de la recta que muestra Excel es:

y= -0,2959x + 17,809 con un error o desviación aleatoria dada por: R² = 0,9143

Ejemplo 2:(Ejercicio desarrollado en un libro de EXCEL)

Ver Hoja 10 en Excel

2.2.3. Regresión Múltiple.

Definición.[21]

Este tipo de regresión, se presenta cuando dos o más variables independientes influyen sobre una variable dependiente. Ejemplo: Y = f(x, w, z).

Dicha relación entre la variable dependiente y las m variables independientes, tendrá la siguiente forma:

Y=a+b1 x1+b2 x2+b3 x3+…+bmxm

Ejemplo 1:

Una empresa de desarrollo de software establece relacionar sus ventas en función del número de pedidos de los tipos de software que desarrolla (Bancario, Educativo y Automatización), para atender 10 proyectos en el presente año.

En la siguiente tabla se representan: Y (Ventas en miles de pesos) , X (# de pedidos de software bancario), W (# de pedidos de software educativo) y Z (# de pedidos de software de automatización).

Page 36: Taller 2 Probabilidad Copia

Y X W Z440 50 105 75455 40 140 68470 35 110 70510 45 130 64506 51 125 67480 55 115 72460 53 100 70500 48 103 73490 38 118 69450 44 98 74

Al ingresar los datos en Excel, (ver Hoja 11 en Excel) en las columnas Y, X, W y Z y realizar la regresión con esos datos, a través de la opción análisis de datos, (activando la opción de complementos en la hoja de Excel) en una hoja nueva (ver Hoja 12 en Excel) saldrán los coeficientes b1, b2 y b3, de la expresión dada anteriormente.

Resultados obtenidos:

b1= 0,82305187

b2= -0,26272198

b3= -4,75565393

2.3. Correlación.

Definición [22].

La correlación  trata de establecer la relación o dependencia que existe entre las dos variables que intervienen en una  distribución bidimensional .

Es decir, determinar si los cambios en una de las variables influyen en los cambios de la otra. En caso de que suceda, diremos que las variables están correlacionadas o que hay correlación  entre ellas.

Ejemplo 1:(Ejercicio desarrollado bajo formulas y calculadora)

Bibliografía e infografía

Page 37: Taller 2 Probabilidad Copia

[1] SPIEGEL, Murray R. Teoría y problemas de probabilidad y estadística. Serie de compendios Schaum. Mc. Graw Hill. México. 1976. Págs. 76 y ss.

[2] http://sigma.poligran.edu.co/politecnico/apoyo/Decisiones/curso/apendice.pdf

[3] Asurza O. Herminia. Glosario básico de términos estadísticos. Instituto Nacional de Estadística e Informática. Lima. 2006. Pág. 66. Disponible en: www.inei.gob.pe/biblioineipub/bancopub/Est/Lib0900/Libro.pdf

[4] LIND, Douglas A., MARCHAL, William G. y MASON, Robert D. Estadística para Administración y Economía. Ed. 11. Editorial Alfaomega. México. 2004. p. 99-113.

[5] LUNA GÁNDARA, Rita. Distribuciones de probabilidad. Curso de probabilidad y estadística. Departamento Ingeniería Industrial. Instituto Tecnológico de Chihuahua (ITCH) .http://www.itch.edu.mx/academic/industrial/sabaticorita/_private/04Distribuciones%20de%20Probabilidad.htm

[6] Departamento de Estadística. La distribución uniforme discreta. Universitat de Barcelona. 2007.http://www.ub.edu/stat/GrupsInnovacio/Statmedia/demo/Temas/Capitulo3/B0C3m1t8.htm

[7] PEREZ OLANO, Javier. Distribución binomial y distribución normal. Matemáticas. España. 2004. http://sauce.pntic.mec.es/~jpeo0002/Archivos/PDF/T03.pdf

[8] DIAZ, Francisca, BARON, Francisco, SANCHEZ, Elisa y PARRAS, Luis. Distribución binomial negativa. Bioestadística y aplicaciones. Universidad de Málaga. http://www.bioestadistica.uma.es/libro/node72.htm

[9] RAMIREZ B., Kryscia Daviana. Algunas distribuciones continuas de Probabilidad. Probabilidad y estadística. UCR-ECCI (Escuela de ciencias de la computación e informática). http://www.kramirez.net/ProbaEstad/Material/Presentaciones/DistribucionesProbabilidadContinuas.pdf

[10] HERNANDEZ, Juan Luis. Distribución normal: Ejemplos. Web de Tecnología Eléctrica. Estadística.http://www.tuveras.com/estadistica/normal/ejemplos.htm

[11] DIAZ, Francisca, BARON, Francisco, SANCHEZ, Elisa y PARRAS, Luis. Distribución exponencial. Bioestadística y aplicaciones. Universidad de Málaga. http://www.bioestadistica.uma.es/libro/node78.htm

[12] LUNA GÁNDARA, Rita. Distribución exponencial. Curso de probabilidad y estadística. Departamento Ingeniería Industrial. Instituto Tecnológico de Chihuahua (ITCH) http://www.itch.edu.mx/academic/industrial/sabaticorita/_private/03Distribucion%20Exponencial.htm

[13] TAFOYA, Héctor; CRUZ, Ariel y PEÑA, Jennifer. Distribución exponencial y de Poisson. Curso de Métodos cuantitativos y simulación (Raúl Monroy). Departamento de Ciencias de la computación. Tecnológico de Monterrey. http://homepage.cem.itesm.mx/raulm/

[14] GARCIA, Nelson. ¿Qué es y cómo se calcula la distribución Chi Cuadrado?. Web page: Eye in the Sky. la verdad científica sobre los juegos de azar. http://www.eyeintheskygroup.com/Azar-Ciencia/Analisis-Estadistico-Juegos-de-Azar/Calculo-Distribucion-Chi-Ji-Cuadrado.htm

Page 38: Taller 2 Probabilidad Copia

[15] GALBIATI, Jorge. Distribución Ji Cuadrado.. y T de Student. Revista Digital Letra Media. http://www.jorgegalbiati.cl/nuevo_06/jicuad.pdf, y http://www.jorgegalbiati.cl/nuevo_06/tstud.pdf

[16] HERVÁS, José Antonio. Manual para el control estadístico de procesos. Funciones de distribución de probabilidades. http://www.matematicasypoesia.com.es/Estadist/ManualCPE04p2.htm

[17]  Ruiz C. M; Morcillo A. M. C; García G. J; CASTILLO V. C; Curso de Probabilidad y Estadística Ed. Universidad de Málaga. 2000. p: 143. Disponible en: http://es.wikibooks.org/wiki/Tablas_estad%C3%ADsticas/Distribuci%C3%B3n_t_de_Student

[18] LIPSCHUTZ, Seymour y LIPSON, Marc L. Teoría y problemas de probabilidad. Segunda edición. Mc. Graw Hill. Colombia. 2001. P. 263-265.

[19] BOLIVAR. Mónica. Monografía en línea: Regresión y Correlación. http://www.monografias.com/trabajos14/estadistica/estadistica.shtml

[20] LOPEZ S., Jesús, PEREZ, Alberto, ZAMORA, Javier y otros. Regresión lineal simple. Departamento de Matemática Aplicada. Facultad de Biología. Universidad Complutense de Madrid. http://e-stadistica.bio.ucm.es/mod_regresion/regresion_2.html

[21]ROBLES, Daniel A. Monografía en línea: Regresión Múltiple. http://www.monografias.com/trabajos30/regresion-multiple/regresion-multiple.shtml

[22]VITUTOR. Correlación. http://www.vitutor.com/estadistica/bi/correlacion.html