modulo listo

Upload: marcelo-bosquez-elizabeth-rosero

Post on 22-Jul-2015

371 views

Category:

Documents


1 download

TRANSCRIPT

UNIVERSIDAD CENTRAL DEL ECUADORSEDE SANTO DOMINGO

CARRERA DE COMERCIO Y ADMINISTRACION

ESTADISTICA APLICADA

Tercero A

AUTORA: Gabriela Elizabeth Rosero TUTOR : MSc. Nelson Landzuri

Santo Domingo, Enero 2012

UNIVERSIDAD CENTRAL DEL ECUADOR

ESTADISTICA APLICADA

INDICEINTRODUCCION .................................................................................. 5

UNIDAD I .............................................................................................. 6 OBJETIVOS ........................................................................................ 6 CONOCIMIENTOS PREVIOS DE LA ESTADISTICA DESCRIPTIVA . 7

Medidas de posicin: media, moda, mediana............................... 12 Medidas de variacin: varianza y desviacin tpica. .................... 23 ACTIVIDADES .................................................................................... 27 EVALUACION ..................................................................................... 29

UNIDAD II PROBABILIDAD ................................................................................ 30 OBJETIVOS ....................................................................................... 30

Definicin: probabilidad, eventos, experimentos y resultados ...... 31 Espacio y punto muestral ............................................................. 32 Propiedades ................................................................................. 33 Probabilidad excluyente, condicional e independiente ............... 33 Esperanza matemtica ................................................................. 34 Tabla de probabilidad y de contingencias .................................... 35 Anlisis combinatorio: permutacin y combinacin ...................... 36 ACTIVIDADES .................................................................................... 38 EVALUACION ..................................................................................... 39

UNIDAD III OBJETIVOS ....................................................................................... 40 DISTRIBUCION DE PROBABILIDADES DISCRETAS Y CONTINUAS....................................................................................... 41 2

UNIVERSIDAD CENTRAL DEL ECUADOR

ESTADISTICA APLICADA

Variables aleatorias. .................................................................... 42 Distribuciones discretas y continuas de probabilidad. ................. 46 Distribuciones empricas: la media, desviacin estndar y la varianza ................................................................................. 62 Teorema de chebischev ............................................................... 69 Varianza covarianza (ANOVA) .................................................... 71 Distribucin uniforme discreta ..................................................... 73 Distribucin binorial y multinorial ................................................. 74 Distribucin hipergeomtrica ........................................................ 76 Distribucin posson ...................................................................... 79 Distribucin normal. ..................................................................... 82 Distribucin exponencial ............................................................... 85 ACTIVIDADES ................................................................................... 89 EVALUACION ..................................................................................... 91

UNIDAD IV PRUEBAS DE HIPOTESIS ................................................................ 92 OBJETIVOS ....................................................................................... 92

Prueba de hiptesis para media poblacional ................................ 93 Prueba de hiptesis de la varianza. ............................................. 93 Prueba Ji cuadrada ..................................................................... 97 ACTIVIDADES .................................................................................... 99 EVALUACION ................................................................................... 100

UNIDAD V DISTRIBUCIONES DE MUESTREO ................................................ 101 OBJETIVO ........................................................................................ 101

Muestreo aleatorio ...................................................................... 102 3

UNIVERSIDAD CENTRAL DEL ECUADOR

ESTADISTICA APLICADA

Distribuciones mustrales........................................................... 107 Distribuciones mustrales de medias. ...................................... 112 Distribucin t de student ............................................................. 113 Distribucin F.............................................................................. 125 ACTIVIDADES .................................................................................. 135 EVALUACION ................................................................................... 136

BIBLIOGRAFIA ................................................................................. 137

4

UNIVERSIDAD CENTRAL DEL ECUADOR

ESTADISTICA APLICADA

INTRODUCCION

La Estadstica es una disciplina que utiliza recursos matemticos para organizar y resumir una gran cantidad de datos obtenidos de la realidad, e inferir conclusiones respecto de ellos. Por ejemplo, la estadstica interviene cuando se quiere conocer el estado sanitario de un pas, a travs de ciertos parmetros como la tasa de morbilidad o mortalidad de la poblacin. En este caso la estadstica describe la muestra en trminos de datos organizados y resumidos, y luego infiere conclusiones respecto de la poblacin. Aplicada a la investigacin cientfica, tambin infiere cuando provee los medios matemticos para establecer si una hiptesis debe o no ser rechazada. La estadstica puede aplicarse a cualquier mbito de la realidad, y por ello es utilizada en fsica, qumica, biologa, medicina, astronoma, psicologa, sociologa, lingstica, demografa, etc.

5

UNIVERSIDAD CENTRAL DEL ECUADOR

ESTADISTICA APLICADA

UNIDAD ICONTENIDOS CONOCIMIENTOS PREVIOS DE LA ESTADISTICA DESCRIPTIVA

Medidas de posicin: media, moda, mediana Medidas de variacin: varianza y desviacin tpica.

OBJETIVOS: Conocer sobre la Estadstica Descriptiva y describir sus caractersticas principales. Determinar cuales son las Medidas de Posicion y Variacion; sus caracteristicas y para que sirven. Realizar ejercicios practicos, mediante la modelacin matemtica y estadstica

6

UNIVERSIDAD CENTRAL DEL ECUADOR

ESTADISTICA APLICADA

CONOCIMIENTOS PREVIOS DE LA ESTADISTICA DESCRIPTIVAINTRODUCCIN Una de las ramas de la Estadstica ms accesible a la mayora de la poblacin es la Descriptiva. Esta parte se dedica nica y exclusivamente al ordenamiento y tratamiento mecnico de la informacin para su presentacin por medio de tablas y de representaciones grficas, as como de la obtencin de algunos parmetros tiles para la explicacin de la informacin. La Estadstica Descriptiva es la parte que conocemos desde los cursos de educacin primaria, que se ensea en los siguientes niveles y que, por lo general, no pasa a ser un anlisis ms profundo de la informacin. Es un primer acercamiento a la informacin y, por esa misma razn, es la manera de presentar la informacin ante cualquier lector, ya sea especialista o no. Sin embargo, lo anterior no quiere decir que carezca de metodologa o algo similar, sino que, al contrario, por ser un medio accesible a la mayora de la poblacin humana, resulta de suma importancia considerar para as evitar malentendidos, tergiversaciones o errores. Estadstica Descriptiva e Inferencial Estadstica Descriptiva se refiere a la recoleccin, presentacin, descripcin, anlisis e interpretacin de una coleccin de datos, esencialmente consiste en resumir stos con uno o dos elementos de informacin (medidas descriptivas) que caracterizan la totalidad de los mismos. La estadstica Descriptiva es el mtodo de obtener de un conjunto de datos conclusiones sobre si mismos y no sobrepasan el conocimiento proporcionado por stos. Puede utilizarse para resumir o describir cualquier conjunto ya sea que se trate de una poblacin o de una muestra, cuando en la etapa preliminar de la Inferencia Estadstica se conocen los elementos de una muestra. Estadstica Inferencial se refiere al proceso de lograr generalizaciones acerca de las propiedades del todo, poblacin, partiendo de lo especfico, muestra. las cuales llevan implcitos una serie de riesgos. Para que stas generalizaciones sean vlidas la muestra deben ser representativa de la poblacin y la calidad de la informacin debe ser controlada, adems puesto que las conclusiones as extradas estn sujetas a errores, se tendr que especificar el riesgo o probabilidad que con que se pueden cometer esos errores. La estadstica inferencial es el conjunto de tcnicas que se utiliza para obtener conclusiones que sobrepasan los lmites del conocimiento aportado por los datos, busca obtener informacin de un

7

UNIVERSIDAD CENTRAL DEL ECUADOR

ESTADISTICA APLICADA

colectivo mediante un metdico procedimiento del manejo de datos de la muestra. En sus particularidades la Inferencia distingue la Estimacin y la Contrastacin de Hiptesis. Es estimacin cuando se usan las caractersticas de la muestra para hacer inferencias sobre las caractersticas de la poblacin. Es contrastacin de hiptesis cuando se usa la informacin de la muestra para responder a interrogantes sobre la poblacin. Anlisis estadstico El anlisis estadstico es todo el proceso de organizacin, procesamiento, reduccin e interpretacin de datos para realizar inferencias. Representacin de tronco y hoja

Un mtodo para iniciar el anlisis exploratorio de los datos, previo al uso de los mtodos estadsticos tradicionales, y que adems proporciona informacin rpida, visual y es relativamente nueva, es la representacin grfica de tronco y hoja. Esta representacin se basa en la ordenacin de los datos a manera de grfico, pero sin llegar a ello, utilizando las decenas y las unidades. Esta tcnica se puede encontrar en el libro de Freund y Simon, pero comentaremos su uso a travs del siguiente ejemplo que contiene las calificaciones obtenidas en una prueba de matemticas:78 66 93 73 61 76 100 81 70 83 83 64 88 91 74 70 97 77 72 86

Ahora pensaremos en cada uno de los datos separando las decenas de las unidades, es decir, el nmero 51 se ver como 5 | 1. De esta manera las decenas se pondrn en una columna, en forma vertical, y las unidades a su derecha:6 7 8 9 10 1 8 3 3 0 6 0 8 7 4 4 2 3 6 0 7 1 3 6 1

Para entenderle un poco ms, hemos de decir que el primer rengln que dice 6 | 1 6 4 quiere decir que entre la lista de datos se encuentran los valores 61, 66 y 64.

8

UNIVERSIDAD CENTRAL DEL ECUADOR

ESTADISTICA APLICADA

Esta es la representacin grfica tronco y hoja, donde cada rengln es una posicin de tronco y cada dgito de la derecha es una hoja. El procedimiento para realizarla es primero empezar con los troncos, es decir la columna de la izquierda, y despus dato por dato ir llenando las hojas a la derecha de la lnea vertical, en el tronco correspondiente. Adems, si se desean tener los datos ordenados, y hay gente que lo prefiere as, se pueden ordenar las hojas en cada rengln para que la representacin quede como sigue:6 7 8 9 10 1 0 1 1 0 4 0 3 3 6 2 3 4 6 7 8 3 6 8 7

En realidad una representacin de tronco y hojas presenta la misma informacin que la lista original de datos, pero de una manera mucho ms compacta (especialmente si la lista de datos es ms grande) y manejable. Sin embargo, informacin ms compleja resulta un poco ms difcil de manejar, por lo que en ocasiones conviene redondear los datos, ignorar sus partes decimales o utilizar las centenas u otras posiciones de los nmeros para las troncos. En cada uno de esos casos conviene hacer alguna anotacin, o poner una nota, a fin que los lectores puedan identificar las adecuaciones realizadas y as poder interpretar lo que se quiere transmitir. Para mostrar la informacin de manera ms clara, es posible modificar el nmero de posiciones del posiciones del tronco, aumentndola o disminuyndola de acuerdo a las necesidades particulares de cada problema. Por ejemplo, con los datos del examen anterior, se pueden dividir en dos cada posicin del tronco, utilizando la primera posicin para disponer las hojas 0, 1, 2, 3 y 4, y la segunda posicin para las hojas restantes. De esta manera, se obtiene la representacin grfica de doble tronco:66+ 77+ 88+ 99+ 101 6 0 6 1 6 1 7 0 4 0 2 3 4 7 8 3 3 8 3

9

UNIVERSIDAD CENTRAL DEL ECUADOR

ESTADISTICA APLICADA

Con esto se han duplicado el nmero de posiciones del tronco, con la intencin de buscar una mayor claridad en la presentacin. Esta manera de representacin inicial de los datos no la profundizaremos ms, sino que la utilizaremos ms adelante en algunos casos para, precisamente, presentar una representacin inicial de la informacin obtenida.

Poblacin Y Muestra

Cuando se realiza un estudio de investigacin, se pretende generalmente inferir o generalizar resultados de una muestra a una poblacin. Se estudia en particular a un reducido nmero de individuos a los que tenemos acceso con la idea de poder generalizar los hallazgos a la poblacin de la cual esa muestra procede. Este proceso de inferencia se efecta por medio de mtodos estadsticos basados en la probabilidad. La poblacin representa el conjunto grande de individuos que deseamos estudiar y generalmente suele ser inaccesible. Es, en definitiva, un colectivo homogneo que rene unas caractersticas determinadas. La muestra es el conjunto menor de individuos (subconjunto de la poblacin accesible y limitado sobre el que realizamos las mediciones o el experimento con la idea de obtener conclusiones generalizables a la poblacin ). El individuo es cada uno de los componentes de la poblacin y la muestra. La muestra debe ser representativa de la poblacin y con ello queremos decir que cualquier individuo de la poblacin en estudio debe haber tenido la misma probabilidad de ser elegido. Las razones para estudiar muestras en lugar de poblaciones son diversas y entre ellas podemos sealar 3: a. Ahorrar tiempo. Estudiar a menos individuos es evidente que lleva menos tiempo. b. Como consecuencia del punto anterior ahorraremos costes. c. Estudiar la totalidad de los pacientes o personas con una caracterstica determinada en muchas ocasiones puede ser una tarea inaccesible o imposible de realizar. d. Aumentar la calidad del estudio. Al disponer de ms tiempo y recursos, las observaciones y mediciones realizadas a un reducido nmero de individuos pueden ser ms exactas y plurales que si las tuvisemos que realizar a una poblacin. e. La seleccin de muestras especficas nos permitir reducir la heterogeneidad de una poblacin al indicar los criterios de inclusin y/o exclusin.

10

UNIVERSIDAD CENTRAL DEL ECUADOR

ESTADISTICA APLICADA

Tipo de datos

Lo que estudiamos en cada individuo de la muestra son las variables (edad, sexo, peso, talla, tensin arterial sistlica, etctera). Los datos son los valores que toma la variable en cada caso. Lo que vamos a realizar es medir, es decir, asignar valores a las variables incluidas en el estudio. Deberemos adems concretar la escala de medida que aplicaremos a cada variable. La naturaleza de las observaciones ser de gran importancia a la hora de elegir el mtodo estadstico ms apropiado para abordar su anlisis. Con este fin, clasificaremos las variables, a grandes rasgos, en dos tipos 3-5: variables cuantitativas o variables cualitativas. a. Variables cuantitativas. Son las variables que pueden medirse, cuantificarse o expresarse numricamente. Las variables cuantitativas pueden ser de dos tipos: o Variables cuantitativas continuas, si admiten tomar cualquier valor dentro de un rango numrico determinado (edad, peso, talla). o Variables cuantitativas discretas, si no admiten todos los valores intermedios en un rango. Suelen tomar solamente valores enteros (nmero de hijos, nmero de partos, nmero de hermanos, etc).

b. Variables cualitativas. Este tipo de variables representan una cualidad o atributo que clasifica a cada caso en una de varias categoras. La situacin ms sencilla es aquella en la que se clasifica cada caso en uno de dos grupos (hombre/mujer, enfermo/sano, fumador/no fumador). Son datos dicotmicos o binarios. Como resulta obvio, en muchas ocasiones este tipo de clasificacin no es suficiente y se requiere de un mayor nmero de categoras (color de los ojos, grupo sanguneo, profesin, etctera). En el proceso de medicin de estas variables, se pueden utilizar dos escalas:o

o

Escalas nominales: sta es una forma de observar o medir en la que los datos se ajustan por categoras que no mantienen una relacin de orden entre s (color de los ojos, sexo, profesin, presencia o ausencia de un factor de riesgo o enfermedad, etctera). Escalas ordinales: en las escalas utilizadas, existe un cierto orden o jerarqua entre las categoras (grados de disnea, estadiaje de un tumor, etc.).

11

UNIVERSIDAD CENTRAL DEL ECUADOR

ESTADISTICA APLICADA

MEDIDAS DE POSICION

Las medidas de posicin nos facilitan informacin sobre la serie de datos que estamos analizando. La descripcin de un conjunto de datos, incluye como un elemento de importancia la ubicacin de stos dentro de un contexto de valores posible. Una vez definidos los conceptos bsicos en el estudio de una distribucin de frecuencias de una variable, estudiaremos las distintas formas de resumir dichas distribuciones mediante medidas de posicin (o de centralizacin), teniendo presente el error cometido en el resumen mediante las correspondientes medidas de dispersin. Se trata de encontrar unas medidas que sinteticen las distribuciones de frecuencias. En vez de manejar todos los datos sobre las variables, tarea que puede ser pesada, podemos caracterizar su distribucin de frecuencias mediante algunos valores numricos, eligiendo como resumen de los datos un valor central alrededor del cual se encuentran distribuidos los valores de la variable Son medidas estadsticas cuyo valor representa el valor del dato que se encuentra en el centro de la distribucin de frecuencia, por lo que tambin se les llama "Medidas de Tendencia Central ". Las m ed id a s d e p osici n dividen un conjunto de datos en grupos con el mismo nmero de individuos. Para calcular las med id a s de po sici n es necesario que los d a t o s estn ordenados. Supongamos que queremos describir de una forma breve y precisa los resultados obtenidos por un conjunto de alumnos en un cierto examen; diramos: a) La nota media de la clase es de 6,5. b) La mitad de los alumnos han obtenido una nota inferior a 5. c) La nota que ms veces se repite es el 4,5. En la expresin a) se utiliza como medida la media aritmtica o simplemente la media. En la b) se emplea como medida la mediana, que es el valor promedio que deja por debajo de ella la mitad de las notas y por encima de ella la otra mitad. Y en la c) se usa el valor de la nota que ms veces se ha repetido en ese examen, este valor es la moda.

12

UNIVERSIDAD CENTRAL DEL ECUADOR

ESTADISTICA APLICADA

MEDIA ( X )Media aritmtica o simplemente media; es el promedio aritmtico de las observaciones, es decir, el cociente entre la suma de todos los datos y el numero de ellos. Si xi es el valor de la variable y ni su frecuencia, tenemos que:

Si los datos estn agrupados utilizamos las marcas de clase, es decir ci en vez de xi. Propiedades de la media aritmtica 1. La suma de las desviaciones de todas las puntuaciones de una distribucin respecto a la media de la misma igual a cero.

La suma de las desviaciones de los nmeros 8, 3, 5, 12, 10 de su media aritmtica 7.6 es igual a 0:8 7.6 + 3 7.6 + 5 7.6 + 12 7.6 + 10 7.6 = = 0. 4 4.6 2.6 + 4. 4 + 2. 4 = 0

2. La suma de los cuadrados de las desviaciones de los valores de la variable con respecto a un nmero cualquiera se hace mnima cuando dicho nmero coincide con la media aritmtica.

3. Si a todos los valores de la variable se les suma un mismo nmero, la media aritmtica queda aumentada en dicho nmero. 4. Si todos los valores de la variable se multiplican por un mismo nmero la media aritmtica queda multiplicada por dicho nmero. Media aritmtica para datos no agrupados Podemos diferenciar la frmula del promedio simple para datos poblaciones y muestrales:

13

UNIVERSIDAD CENTRAL DEL ECUADOR

ESTADISTICA APLICADA

Observe que la variacin de ambas frmulas radica en el tamao de los datos (N identifica el tamao de la poblacin, mientras que n el de la muestra). Ejemplo: El profesor de la materia de estadstica desea conocer el promedio de las notas finales de los 10 alumnos de la clase. Las notas de los alumnos son: 3,2 3,0 3,1 3,5 2,4 3,8 4,0 4,2 3,5 4,0

Cul es el promedio de notas de los alumnos de la clase? SOLUCIN Aplicando la frmula para datos no agrupados tenemos: Cabe anotar que en el ejemplo estamos hablando de una poblacin correspondiente a todos los alumnos de la clase (10 alumnos en total). El promedio de las notas es de 3,47. Modifiquemos la primera nota por 0,0 y calculemos nuevamente la media aritmtica. En este caso la media pasa de 3,47 a 3,15. Esta variacin notoria se debi a que la media aritmtica es sensible a los valores extremos cuando tratamos con pocos datos. El 0,0 es una nota atpica comparada con las dems, que estn ubicadas entre 3,0 y 4,2. Media aritmtica para datos agrupados Cuando los datos se agrupan en tablas tipo A, la media aritmtica es igual a la divisin de la sumatoria del producto de las clases por la frecuencia sobre el nmero de datos. La sumatoria parte desde el primer intervalo de clase (i = 1) hasta el ltimo (Nc), siendo Xi la clase del intervalo i. Cuando los datos se agrupan en tablas de frecuencias tipo B, el clculo de la media vara un poco, ya que existe una prdida de informacin en el momento en que se trabaja con intervalos de frecuencia y no con los datos directamente (los datos se agrupan por intervalo, desconociendo el valor exacto de cada uno de ellos).

14

UNIVERSIDAD CENTRAL DEL ECUADOR

ESTADISTICA APLICADA

Las marcas de clases (Mc) cumple la funcin de representar los intervalos de clase. Ejemplo: media aritmtica para datos agrupados en tablas tipo A La siguiente tabla de frecuencia muestra el nmero de preguntas de 81 encuestados sobre un Test que consta de solo seis preguntas.

Preguntas Buenas 1 2 3 4 5 6

Personas 15 13 8 19 21 5

SOLUCIN

PASO 1:

Realizar la sumatoria del producto resultante de las clases por su frecuencia absoluta. Para efectos del clculo de la media, deberamos sumar 15 veces el valor 1, 13 veces el valor 2, 8 veces el valor 3, hasta llegar a la ltima clase:

PASO 2: Dividir la sumatoria sobre el nmero total de datos.En promedio los encuestados contestaron aproximadamente 3 (el valor exacto es 3,41) preguntas buenas.

Ejemplo: media aritmtica para datos agrupados en tablas tipo B Calcular la media para los datos distribuidos en la siguiente tabla de frecuencia:

15

UNIVERSIDAD CENTRAL DEL ECUADOR

ESTADISTICA APLICADA

Ni 1 2 3 4 5 6 7 8

Lm 40,0 48,1 56,1 64,1 72,1 80,1 88,1 96,1

Ls 48,1 56,1 64,1 72,1 80,1 88,1 96,1 104,0

f 3 8 11 32 21 18 14 1

Mc 44,1 52,1 60,1 68,1 76,1 84,1 92,1 100,1

SOLUCIN Las marcas de clase representan a los intervalos de clase, por ejemplo, suponemos que la marca de clase para el primer intervalo (44,1) se repite 3 veces, al desconocer los 3 valores exactos que estn dentro de dicho intervalo.

PASO 1: Realizar la sumatoria del producto resultante entre las marcasde clase por su frecuencia absoluta.

PASO 2: Dividir la sumatoria sobre el nmero total de datos.Ejemplo: comparativa entre el clculo de la media aritmtica para datos no agrupados y datos agrupados en tablas tipo B Calcular la media aritmtica a los siguientes datos sin agrupar y agrupndolos en una tabla de frecuencia tipo B (suponga que los datos son poblacionales): 47,8 18,6 18,6 12,8 33,6 23,1 11,0 21,0 43,1 40,9 12,4 32,0 26,3 18,1 15,2 35,4 12,4 11,1 38,1 33,2 44,0 49,4 21,4 16,8 48,2 26,2 41,4 30,6 12,4 37,0

16

UNIVERSIDAD CENTRAL DEL ECUADOR

ESTADISTICA APLICADA

SOLUCIN Calculemos la media para los datos sin agrupar: Luego construyamos la tabla tipo B y calculemos su media aritmtica con el fin de comparar ambos resultados:

Ni 1 2 3 4 5 6

Lm 11,00 17,41 23,81 30,21 36,61 43,01

Ls 17,41 23,81 30,21 36,61 43,01 49,40

f 8 6 2 5 4 5

Mc 14,21 20,61 27,01 33,41 39,81 46,21

Total

30

PASO 1: Realizar la sumatoria del producto resultante entre las marcasde clase por su frecuencia absoluta.

PASO 2: Dividir la sumatoria sobre el nmero total de datos.Podemos ver claramente una diferencia entre ambas medias: 27,74 para los datos no agrupados y 28,29 para los datos agrupados. Esta diferencia radica que en la tabla tipo B existe una perdida de informacin, al agrupar los datos en los intervalos de clase. El valor de la media exacta es el calculado para los datos no agrupados, pero dada la proximidad de la media para los datos agrupados, se tomar esta ltima como cierta.

17

UNIVERSIDAD CENTRAL DEL ECUADOR

ESTADISTICA APLICADA

MEDIANA (Me)Es el valor que separa por la mitad las observaciones ordenadas de menor a mayor, de tal forma que el 50% de estas son menores que la mediana y el otro 50% son mayores. Si el nmero de datos es impar la mediana ser el valor central, si es par tomaremos como mediana la media aritmtica de los dos valores centrales.

Es el valor que ocupa el lugar central de todos los datos cuando stos estn ordenados de menor a mayor. La mediana se representa por Me. La mediana se puede hallar slo para variables cuantitativas.

Caractersticas de la mediana1. No est definida algebraicamente 2. Cuando la localizacin del elemento central puede ser determinada y los lmites de clase mediana son conocidos, la mediana para la distribucin de frecuencias puede ser calculada por interpolacin, no importando que sta contenga intervalos abiertos, cerrados, iguales o diferentes. 3. La suma de los valores absolutos, sin considerar el signo, de las desviaciones individuales respecto a la mediana es mnimo. Clculo de la mediana 1. Ordenamos los datos de menor a mayor. 2. Si la serie tiene un nmero impar de medidas la mediana es la puntuacin central de la misma. Ej. 2, 3, 4, 4, 5, 5, 5, 6, 6Me= 5

18

UNIVERSIDAD CENTRAL DEL ECUADOR

ESTADISTICA APLICADA

3. Si la serie tiene un nmero par de puntuaciones la mediana es la media entre las dos puntuaciones centrales. 7, 8, 9, 10, 11, 12 Me= 9.5

Clculo de la mediana para datos agrupados La mediana se encuentra en el intervalo donde la frecuencia acumulada llega hasta la mitad de la suma de las frecuencias absolutas.

Es decir tenemos que buscar el intervalo en el que se encuentre

.

Me = mediana Li = es el lmite inferior de la clase donde se encuentra la mediana.

=es la semisuma de las frecuencias absolutas. nb =numero de observaciones bajo el intervalo critico. nd = numero de observaciones dentro del intervalo critico. i = intervalo ic = intervalo critico por el cual pasa la mediana. La mediana es independiente de las amplitudes de los intervalos.

Ejemplo: Calcular la mediana de una distribucin estadstica que viene dada por la siguiente tabla:

19

UNIVERSIDAD CENTRAL DEL ECUADOR

ESTADISTICA APLICADA

X 115-129 100-114 85-99 70-84 total

fi 1 4 8 2 15

Fa 15 14 10 2

xm

N/2 = 100 / 2 = 50129.5

Li = 84.5114.5

nb = 299.5 84.5

nd = 8 i= 15

[ ] Me= 84.5+15(0.6875) Me= 84.5+10.31 Me= 94.81

MODA (Mo)Es el valor de la variable que ms veces se repite, es decir, aquella cuya frecuencia absoluta es mayor. No tiene por qu ser nica.

Se representa por Mo. Se puede hallar la moda para variables cualitativas y cuantitativas. 20

UNIVERSIDAD CENTRAL DEL ECUADOR

ESTADISTICA APLICADA

Caractersticas de la Moda. 1. Representa ms elementos que cualquier otro valor 2. La moda no permite conocer la mayor parte de los datos 3. Algunas veces el azar interviene de manera importante y hace que un valor no representativo se repita frecuentemente. 4. Puede usarse para datos cuantitativos como cualitativos 5. Cuando se tienen dos o ms modas es difcil su interpretacin. Clculo de la moda para datos simples Hallar la moda de la distribucin: 2, 3, 3, 4, 4, 4, 5, 5 Mo= 4

Si en un grupo hay dos o varias puntuaciones con la misma frecuencia y esa frecuencia es la mxima, la distribucin es bimodal o multimodal, es decir, tiene varias modas. 1, 1, 1, 4, 4, 5, 5, 5, 7, 8, 9, 9, 9Mo= 1, 5, 9 Cuando todas las puntuaciones de un grupo tienen la misma frecuencia, no hay moda. 2, 2, 3, 3, 6, 6, 9, 9 Si dos puntuaciones adyacentes tienen la frecuencia mxima, la moda es el promedio de las dos puntuaciones adyacentes. 0, 1, 3, 3, 5, 5, 7, 8 Mo = 4

Hallar la moda de los siguientes datos:12-12-13-13-15-14-16-18-19-14-16-12-15-14-15-12-15-14-18

Mo = 12 Clculo de la moda para datos agrupados: Todos los intervalos tienen la misma amplitud.

21

UNIVERSIDAD CENTRAL DEL ECUADOR

ESTADISTICA APLICADA

Li es el lmite inferior de la clase modal. fi es la frecuencia absoluta de la clase modal. fi--1 es la frecuencia absoluta inmediatamente inferior a la en clase modal. fi-+1 es la frecuencia absoluta inmediatamente posterior a la clase modal. ai es la amplitud de la clase. Tambin se utiliza otra frmula de la moda que da un valor aproximado de sta:

Ejemplo Calcular la moda de una distribucin estadstica que viene dada por la siguiente tabla:X [60, 63) [63, 66) [66, 69) [69, 72) [72, 75) total fi 5 18 42 27 8 100 Xm 61.5 64.5 67.5 70.5 73.5

Mo= 67.5

22

UNIVERSIDAD CENTRAL DEL ECUADOR

ESTADISTICA APLICADA

MEDIDAS DE VARIACIONLas medidas de variacin, tambin llamadas medidas de variabilidad, muestran la variabilidad de una distribucin, indicando por medio de un nmero, si las diferentes puntuaciones de una variable estn muy alejadas de la mediana media. Cuanto mayor sea ese valor, mayor ser la variabilidad, cuanto menor sea, ms homognea ser a la mediana media. As se sabe si todos los casos son parecidos o varan mucho entre ellos. Para calcular la variabilidad que una distribucin tiene respecto de su media, se calcula la media de las desviaciones de las puntuaciones respecto a la media aritmtica. Pero la suma de las desviaciones es siempre cero, as que se adoptan dos clases de estrategias para salvar este problema. Una es tomando las desviaciones en valor absoluto (Desviacin media) y otra es tomando las desviaciones al cuadrado (Varianza).

VARIANZALa varianza es la media aritmtica del cuadrado de las desviaciones respecto a la media de una distribucin estadstica. La varianza se representa por .

Varianza

para

datos

agrupados

23

UNIVERSIDAD CENTRAL DEL ECUADOR

ESTADISTICA APLICADA

Para simplificar el clculo de la varianza vamos o utilizar las siguientes expresiones que son equivalentes a las anteriores.

Varianza para datos agrupados

Ejercicios de varianza Calcular la varianza de la distribucin para datos simples:9, 3, 8, 8, 9, 8, 9, 18

Calcular la varianza de la distribucin de la tabla para datos agrupados:xi [10, 20) [20, 30) [30,40) [40, 50) [50, 60 [60,70) [70, 80) 15 25 35 45 55 65 75 1 8 10 9 8 4 2 42 fi xi fi 15 200 350 405 440 260 150 1 820 xi2 fi 225 5000 12 250 18 225 24 200 16 900 11 250 88 050

24

UNIVERSIDAD CENTRAL DEL ECUADOR

ESTADISTICA APLICADA

DESVIACION TIPICAConcepto estadstico. La desviacin tpica (DT) o desviacin estndar es la medida ms til de la variabilidad de los resultados de una muestra. La DT es una medida de la magnitud en que se desvan las diversas puntuaciones obtenidas de su valor medio. Si las puntuaciones se agrupan estrechamente en torno a la media, la DT er relativamente pequea; si se extienden en todas direcciones, la DT ser relativamente grande. Para calcular la desviacin tpica primero calculamos el valor medio; a continuacin, hallamos las diferencias entre los valores observados y el valor medio; despus, elevamos al cuadrado estas diferencias y las sumamos; dividimos el resultado entre el nmero de elementos de los que hemos obtenido una medida, y, finalmente, extraemos la raz cuadrada. La desviacin tpica es la raz cuadrada de la varianza. FORMULA:

Esta medida nos permite determinar el promedio aritmtico de fluctuacin de los datos respecto a su punto central o media. La desviacin estndar nos da como resultado un valor numrico que representa el promedio de diferencia que hay entre los datos y la media. Para calcular la desviacin estndar basta con hallar la raz cuadrada de la varianza, por lo tanto su ecuacin sera:

Ecuacin 5-8

Para comprender el concepto de las medidas de distribucin vamos a suponer que el gerente de una empresa de alimentos desea saber que 25

UNIVERSIDAD CENTRAL DEL ECUADOR

ESTADISTICA APLICADA

tanto varan los pesos de los empaques (en gramos), de uno de sus productos; por lo que opta por seleccionar al azar cinco unidades de ellos para pesarlos. Los productos tienen los siguientes pesos (490, 500, 510, 515 y 520) gramos respectivamente. Por lo que su media es:

La varianza sera:

Por lo tanto la desviacin estndar sera:

Propiedades de la desviacin tpica 1. La desviacin tpica ser siempre un valor positivo o cero, en el caso de que las puntuaciones sean iguales. 2. Si a todos los valores de la variable se les suma un nmero la desviacin tpica no vara. 3. Si todos los valores de la variable se multiplican por un nmero la desviacin tpica queda multiplicada por dicho nmero. 4. Si tenemos varias distribuciones con la misma media y conocemos sus respectivas desviaciones tpicas se puede calcular la desviacin tpica total. Observaciones sobre la desviacin tpica La desviacin tpica, al igual que la media y la varianza, es un ndice muy sensible a las puntuaciones extremas. En los casos que no se pueda hallar la media tampoco ser posible hallar la desviacin tpica. Cuanta ms pequea sea la desviacin tpica mayor ser la concentracin de datos alrededor de la media.

26

UNIVERSIDAD CENTRAL DEL ECUADOR

ESTADISTICA APLICADA

ACTIVIDADES1) Buscar la media, la mediana y la moda de los siguientes nmeros: 25 15 28 29 25 26 21 26 2) En un estudio que se realiz en un asilo de ancianos, se tom las edades de los envejecientes que pueden caminar sin dificultades. Buscar la media, la mediana y la moda de las siguientes edades. 69 73 65 70 71 74 65 69 60 62 3) Se escogi un saln de clases de cuarto grado, con un total de 25 estudiantes, y se les pidi que calificaran del 1 al 5 un programa televisivo. (5 = Excelente 4 = Bueno 3 = Regular 4 = No muy bueno 1 = Fatal) Estos fueron los resultados: 1334122251451535141221235 Buscar la media, la moda y la mediana. 4) Un pediatra obtuvo la siguiente tabla sobre los meses de edad de 50 nios de su consulta en el momento de andar por primera vez. Hallar la Varianza

Meses

Nios

9

1

10

4

11

9

12

16

13

11

14

8

15

1

27

UNIVERSIDAD CENTRAL DEL ECUADOR

ESTADISTICA APLICADA

5)

En un examen de matemticas los 30 alumnos de una clase han obtenido las puntuaciones recogidas en la siguiente tabla:Calificaciones [0,1) [1,2) [2,3) [3,4) [4,5) [5,6) [6,7) [7,8) [8,9) [9,10) N alumnos 2 2 3 6 7 6 1 1 1 1

Halla la varianza y la desviacin tpica.

6)

Hallar la media, moda, mediana, varianza y desviacion tipica con los siguientes datos.

X120 110 100 95 80 70 50 1 20 18 32 20 15 10

F

X6 - 10 11 15 16 20 21 25 26 30

f4 11 7 3 6

28

UNIVERSIDAD CENTRAL DEL ECUADOR

ESTADISTICA APLICADA

EVALUACION1) CUALES SON DESCRIPTIVA. LAS CARACTERISTICAS DE LA ESTADISTICA

_______________________________________________________________ _______________________________________________________________ _______________________________________________________________ _______________________________________________________________ 2) CUALES SON LAS MEDIDAS DE POSICION _______________________________________________________________ _______________________________________________________________ _______________________________________________________________ 3) CUALES SON LAS MEDIDAS DE VARIACION _______________________________________________________________ _______________________________________________________________ _______________________________________________________________ 4) QUE ES LA VARIANZA _______________________________________________________________ _______________________________________________________________ _______________________________________________________________ 5) QUE ES LA DESVIACION TIPICA _______________________________________________________________ _______________________________________________________________ _______________________________________________________________ 6) CUALES SON LAS PROPIEDADES DE LA DESVIACION TIPICA _______________________________________________________________ _______________________________________________________________ _______________________________________________________________

29

UNIVERSIDAD CENTRAL DEL ECUADOR

ESTADISTICA APLICADA

UNIDAD IICONTENIDOS PROBABILIDAD

Definicin: probabilidad, eventos, experimentos y resultados Espacio y punto muestral Propiedades Probabilidad excluyente, condicional e independiente Esperanza matemtica Tabla de probabilidad y de contingencias Anlisis combinatorio: permutacin y combinacin

OBJETIVOS: Conocer sobre la probabilidad y sus caractersticas Determinar cules son las propiedades de la probabilidad Realizar ejercicios prcticos para mediante la modelacin matemtica y estadstica

30

UNIVERSIDAD CENTRAL DEL ECUADOR

ESTADISTICA APLICADA

PROBABILIDADDEFINICION La teora de probabilidades se ocupa de asignar un cierto nmero a cada posible resultado que pueda ocurrir en un experimento aleatorio con el fin de cuantificar dichos resultados y saber si un suceso es ms probable que otro. Con este fin introduciremos algunas definiciones. La probabilidad de un suceso es un numero comprendido entre 0 y 1que indica las posibilidades que tiene de verificarse cuando se realiza un experimento aleatorio. Probabilidad de eventos Para calcular la probabilidad de eventos es necesario que stos se comporten de una manera ms o menos estable. Precisamente, se echa mano de la regularidad estadstica, que es la propiedad de los fenmenos aleatorios, y que consiste en que al aumentar el nmero de repeticiones de un experimento en condiciones prcticamente constantes, la frecuencia relativa de ocurrencia para cada evento tiende a un valor fijo. Sin embargo, al momento de definir la probabilidad de un evento podemos tomar en cuenta los siguientes criterios: 1. La probabilidad subjetiva de un evento se la asigna la persona que hace el estudio, y depende del conocimiento que esta persona tenga sobre el tema. Precisamente por su carcter de subjetividad no se considera con validez cientfica, aunque en la vida diaria es de las ms comunes que se utilizan al no apoyarse ms que en el sentido comn y los conocimientos previos, y no en resultados estadsticos. 2. La probabilidad frecuencial de un evento es el valor fijo al que tienden las frecuencias relativas de ocurrencia del evento de acuerdo a la regularidad estadstica. Esta definicin sera la ms real, pero proporciona probabilidades aproximadas, es decir, proporciona estimaciones y no valores reales. Adems, los resultados son a posteriori, pues se necesita realizar el experimento para poder obtenerlo. 3. La probabilidad clsica de un evento E, que denotaremos por P(E), se define como el nmero de eventos elementales que componen al evento E, entre el nmero de eventos elementales que componen el espacio muestral:

31

UNIVERSIDAD CENTRAL DEL ECUADOR

ESTADISTICA APLICADA

Probabilidad de experimentos Son los experimentos de los que podemos predecir el resultado antes de que se realicen. Ejemplo. Si dejamos caer una piedra desde una ventana sabemos sin lugar a dudas que la piedra bajara. Si la arrojamos hacia arriba sabemos que subir durante un determinado intervalo de tiempo: pero despus bajara

ESPACIO Y PUNTO MUESTRA PUNTO MUESTRAL Cada uno de los resultados de un experimento aleatorio. ESPACIO MUESTRAL

La totalidad de los puntos mustrales. Ejemplo: consideremos el experimento aleatorio E que consiste en arrojar dos monedas balanceadas, siendo c = cara y x = seca. El espacio mustral ser: S = {(c; c), (c; x), (x; c), (x, x)} El espacio muestral es un conjunto de puntos tal que cada punto representa uno y slo uno de los resultados posibles de un experimento aleatorio.Espacio muestral discreto:

Si contiene un nmero finito o infinito numerable de puntos mustrales. Ejemplo: se tiene una urna con bolillas del 1 al 20. Se extrae una. S = {1, 2, 3..., 20} (finito)Espacio muestral continu:

Si contiene una infinidad no numerable de puntos mustrales. Ejemplo: su utiliza una balanza de precisin para pesar partculas metlicas. S= { X: 0 < X < infinito) 32

UNIVERSIDAD CENTRAL DEL ECUADOR

ESTADISTICA APLICADA

PROPIEDADES DE LA PROBABILIDAD 1 La suma de las probabilidades de un suceso y su contrario vale 1, por tanto la probabilidad del suceso contrario es:

2 Probabilidad del suceso imposible es cero.

Probabilidad condicional En esta seccin examinaremos como la probabilidad de ciertos eventos depende o se ve influida por la ocurrencia de otros. Para ello veremos algunos ejemplos. Ejemplo 1: Consideremos dos cajas, la caja 1 contiene 3 esferitas blancas y 4 rojas y la caja 2 contiene 8 blancas y 4 rojas. Se selecciona una caja al azar y luego se extrae una esfera al azar. Hallar la probabilidad de que la esfera sea blanca. Solucin: Sea A el evento de seleccionar la caja 1 y AC el evento de seleccionar la caja 2, entonces P(A) = P(AC) = 1/2 ya que cualquiera de las dos cajas tiene la misma probabilidad de ser extrada. Sea B el evento de seleccionar una esfera blanca, entonces P(B/A) = 3/7 ya que en la caja 1 hay 3 esferas blancas en un total de 7 y P(B/AC) = 8/12 porque en la caja 2 hay 8 esferas blancas en un total de 12. Ahora bien, por la proposicin 3.5 tenemos:

Probabilidad Independiente La independencia de dos eventos AyB quiere decir que el saber que A sucedi no modifica la probabilidad de que B tambin haya sucedido. Como consecuencia saber que A no sucedi tampoco puede afectar a la probabilidad B. Hacemos una demostracin formal en el pizarrn. Podemos poner esto diciendo que 33

UNIVERSIDAD CENTRAL DEL ECUADOR

ESTADISTICA APLICADA

Si A y B son independientes, tambin lo son las tres siguientes pares: A y B : A y B. A y B (estamos usando el apostrofe para denotar complemento). Cuando se tiene tres eventos se puede presentar una situacin muy curiosa. Puede pasar que A y B sean independientes y A y C sean independientes y B y C tambin sean independientes Pero A,B y CON sean independientes El ejemplo clsico es el de un experimento resultados igualmente probables: 1, 2,3 y 4. Si el resultado es 1. A gana y nadie mas. Si el resultado es 2. B gana y nadie mas. Si el resultado es 3. C gana y nadie mas pero si el resultado es 4. Los tres A, B y C ganan. Usted puede calcular las probabilidades para darse cuenta que: P(A Y B) = P (A) P (B) P(A Y C)= P(A) P P(B Y C) = P(B) P Pero P(A Y BY C) no es igual a P(A) P(B) P aleatorio con cuatro posibles

ESPERANZA MATEMTICAEn estadstica la esperanza matemtica (tambin llamada esperanza, valor esperado, media poblacional o media) de una variable aleatoria X, es el nmero que formaliza la idea de valor medio de un fenmeno aleatorio.

Cuando la variable aleatoria es discreta, la esperanza es igual a la suma de la probabilidad de cada posible suceso aleatorio multiplicado por el valor de dicho suceso. Por lo tanto, representa la cantidad media que se "espera" como resultado de un experimento aleatorio cuando la probabilidad de cada suceso se mantiene constante y el experimento se repite un elevado nmero de veces. Cabe decir que el valor que toma la esperanza matemtica en algunos casos 34

UNIVERSIDAD CENTRAL DEL ECUADOR

ESTADISTICA APLICADA

puede no ser "esperado" en el sentido ms general de la palabra - el valor de la esperanza puede ser improbable o incluso imposible. Por ejemplo, el valor esperado cuando tiramos un dado equilibrado de 6 caras es 3,5. Podemos hacer el clculo

y cabe destacar que 3,5 no es un valor posible al rodar el dado. En este caso, en el que todos los sucesos son de igual probabilidad, la esperanza es igual a la media aritmtica. Una aplicacin comn de la esperanza matemtica es en las apuestas o los juegos de azar. Por ejemplo, la ruleta americana tiene 38 casillas equiprobables. La ganancia para acertar una apuesta a un solo nmero paga de 35 a 1 (es decir, cobramos 35 veces lo que hemos apostado y recuperamos la apuesta, as que recibimos 36 veces lo que hemos apostado). Por tanto, considerando los 38 posibles resultados, la esperanza matemtica del beneficio para apostar a un solo nmero es: Que es -0,0526 aproximadamente. Por lo tanto uno esperara, en media, perder unos 5 cntimos por cada euro que apuesta, y el valor esperado para apostar 1 euro son 0.9474 euros. En el mundo de las apuestas, un juego donde el beneficio esperado es cero (no ganamos ni perdemos) se llama un "juego justo". Nota: El primer parntesis es la "esperanza" de perder tu apuesta de $1, por eso es negativo el valor. El segundo parntesis es la esperanza matemtica de ganar los $35. La esperanza matemtica del beneficio es el valor esperado a ganar menos el valor esperado a perder.

TABLAS DE PROBABILIDAD Y DE CONTINGENCIATablas de Contingencia Un mtodo til para clasificar los datos obtenidos en un recuento es mediante las tablas de contingencia. 35

UNIVERSIDAD CENTRAL DEL ECUADOR

ESTADISTICA APLICADA

Se trata de tablas en cuyas celdas figuran probabilidades, y en la cual podemos determinar unas probabilidades conociendo otras de la tabla. Ejemplo Se sortea un viaje a Roma entre los 120 mejores clientes de una agencia de automviles. De ellos, 65 son mujeres, 80 estn casados y 45 son mujeres casadas. Se pide: 1 Cul ser la probabilidad de que le toque el viaje a un hombre soltero? 2 Si del afortunado se sabe que es casado, cul ser la probabilidad de que sea una mujer?

ANLISIS DE COMBINACIONES Y PERMUTACIONESAs que en matemticas usamos un lenguaje ms preciso: Si el orden no importa, es una combinacin. Si el orden s importa es una permutacin.

36

UNIVERSIDAD CENTRAL DEL ECUADOR

ESTADISTICA APLICADA

Permutaciones con repeticin Son las ms fciles de calcular. Si tienes n cosas para elegir y eliges r de ellas, las permutaciones posibles son: n n ... (r veces) = nr (Porque hay n posibilidades para la primera eleccin, DESPUS hay n posibilidades para la segunda eleccin, y as.) Por ejemplo en la cerradura de arriba, hay 10 nmeros para elegir (0,1,...,9) y eliges 3 de ellos: 10 10 ... (3 veces) = 103 = 1000 permutaciones As que la frmula es simplemente: nr donde n es el nmero de cosas que puedes elegir, y eliges r de ellas (Se puede repetir, el orden importa).

COMBINACIONESTambin hay dos tipos de combinaciones (recuerda que ahora el orden no importa): 1. Se puede repetir: como monedas en tu bolsillo (5,5,5,10,10) 2. Sin repeticin: como nmeros de lotera (2,14,15,27,30,33) Combinaciones sin repeticin As funciona la lotera. Los nmeros se eligen de uno en uno, y si tienes los nmeros de la suerte (da igual el orden) entonces has ganado! La manera ms fcil de explicarlo es:

imaginemos que el orden s importa (permutaciones), despus lo cambiamos para que el orden no importe.

Volviendo a las bolas de billar, digamos que queremos saber qu 3 bolas se

37

UNIVERSIDAD CENTRAL DEL ECUADOR

ESTADISTICA APLICADA

ACTIVIDADESRESOLVER LOS SIGUIENTES PROBLEMAS 1. En una ciudad el 60 % de sus habitantes son aficionados al ftbol, el 30 % son aficionados al baloncesto y el 25 % a ambos deportes. a) Son independientes los sucesos ser aficionado al ftbol y ser aficionado al baloncesto?. b) Si una persona no es aficionada al ftbol, cul es la probabilidad de que no sea aficionada al baloncesto? c) Si una persona no es aficionada al baloncesto, cul es la probabilidad de que sea aficionada al ftbol? 2. De 150 pacientes, 90 tienen una enfermedad cardiaca, 50 tienen cncer y 20 tienen ambas enfermedades. a) Determinar la probabilidad de que una persona tomada al azar tenga una sola de las dos enfermedades. (Indicacin: si transformas los datos dados a porcentaje el problema se asemeja mucho al resto)

3. En una clase hay 10 alumnas rubias, 20 morenas, cinco alumnos rubios y 10 morenos. Un da asisten 45 alumnos, encontrar la probabilidad de que un alumno: a. Sea hombre. b. Sea mujer morena. c. Sea hombre o mujer.

4. Se lanzan dos dados al aire y se anota la suma de los puntos obtenidos. Se pide: a. 1La probabilidad de que salga el 7. b. 2La probabilidad de que el nmero obtenido sea par. c. 3La probabilidad de que el nmero obtenido sea mltiplo de tres

38

UNIVERSIDAD CENTRAL DEL ECUADOR

ESTADISTICA APLICADA

EVALUACION

1)

QUE ES LA PROBALDAD.

_______________________________________________________________ _______________________________________________________________ _______________________________________________________________ _______________________________________________________________ 2) ESCRIBIR CUALES SON LAS PROPIEDADES DE LA PROBABILIDAD

_______________________________________________________________ _______________________________________________________________ _______________________________________________________________ 3) QUE SE NECESITA PARA CALCULAR LA PROBABILIDAD DE EVENTOS _______________________________________________________________ _______________________________________________________________ _______________________________________________________________ 4) QUE ES LA PROBABILIDAD DE EXPERIMENTOS

_______________________________________________________________ _______________________________________________________________ _______________________________________________________________ 5) QUE ES LA ESPERANZA MATEMATICA

_______________________________________________________________ _______________________________________________________________ _______________________________________________________________

39

UNIVERSIDAD CENTRAL DEL ECUADOR

ESTADISTICA APLICADA

UNIDAD IIiCONTENIDOSDISTRIBUCION DE PROBABILIDADES DISCRETAS Y CONTINUAS Variables aleatorias. Distribuciones discretas y continuas de probabilidad. Distribuciones empricas: la media, desviacin estndar y la varianza Teorema de chebischev Varianza covarianza (ANOVA) Distribucin uniforme discreta Distribucin binorial y multinorial Distribucin hipergeomtrica Distribucin posson Distribucin normal. Distribucin exponencial ACTIVIDADES EVALUACION

OBJETIVOS: Conocer sobre la distribucin de probabilidades discretas y continuas, para su respectivo estudio. Analizar sobre las caractersticas de cada una de la distribucin de probabilidades. Resolver los diferentes ejercicios, para su respectiva comprencion.

40

UNIVERSIDAD CENTRAL DEL ECUADOR

ESTADISTICA APLICADA

DISTIBUCION DE PROBABILIDADES DISCRETAS Y CONTINUASUna distribucin de probabilidad indica toda la gama de valores que pueden representarse como resultado de un experimento. Una distribucin de probabilidad es similar al distribucin de frecuencias relativas .Sin embargo, en vez de describir el pasado, describe la probabilidad que un evento se realice en el futuro, constituye una herramienta fundamental para la prospectiva, puesto que se puede disear un escenario de acontecimientos futuros considerando las tendencias actuales de diversos fenmenos naturales. Las decisiones estadsticas basadas en la estadstica inferencial son fundamentales en la investigacin que son evaluadas en trminos de distribucin de probabilidades.

La distribucin Normal suele conocerse como la "campana de Gauss".

Qu es una distribucin de probabilidad? Muestra todos los resultados posibles de un experimento y la probabilidad de cada resultado. Supongamos que se quiere saber el nmero de caras que se obtienen al lanzar cuatro veces una moneda al aire? Es obvio que, el hecho de que la moneda caiga de costado se descarta. Los posibles resultados son: cero caras, una cara, dos caras, tres caras y cuatro caras. Si realizamos el experimento obtenemos el siguiente espacio muestral:

41

UNIVERSIDAD CENTRAL DEL ECUADOR

ESTADISTICA APLICADA

NUMERO FRECUENCIA DISTRIBUCIN DE DE PROBABILIDADES CARAS 0 1 2 3 4 1 4 6 4 1 1/16 4/16 6/16 4/16 1/16

VARIABLES ALEATORIASUna Variable es cualquier caracterstica que puede tomar distintos valores. Por ejemplo: Temperatura, Presin, Coeficiente Intelectual, Peso, Estatura, etc. Se dice que una Variable es Aleatoria porque involucra la probabilidad de los resultados del espacio muestral, y dicha variable es una funcin definida sobre el Espacio Muestral, de manera que transforma todos los posibles resultados del espacio muestral en cantidades numricas. En trminos ms precisos, VARIABLE ALEATORIA: Es una funcin que asigna un nmero real a cada resultado del Espacio Muestral de un Experimento Aleatorio.

S

R

Por ejemplo, se sacan dos pelotas en sucesin, sin reemplazo, de una urna que contiene 4 pelotas rojas y 3 negras. La Variable aleatoria X esta definida como: Nmero de pelotas rojas. 42

UNIVERSIDAD CENTRAL DEL ECUADOR

ESTADISTICA APLICADA

El Espacio muestral de este experimento ser: S = {RR, RN, NR, NN} Puesto que el elemento RR contiene 2 pelotas rojas, se le asigna una valor numrico de 2. Los elementos RN y NR contienen 1 pelota roja, entonces se le asigna un valor de 1 y a NN se le asigna un valor de 0. Los resultados posibles y los valores de la Variable aleatoria X, donde X es el nmero de pelotas rojas, son:S S RR NN RN NR X 2 0 1 1

X Con frecuencia se utilizar la abreviatura VA, en lugar de Variable aleatoria. Las VA suelen representarse con letras Maysculas X, Y, Z, etc. del alfabeto y con letras Minsculas x, y, z, etc. se representa cierto valor particular de la VA correspondiente. El conjunto de los posibles valores de la VA X se denomina rango de X. DISTRIBUCION DE PROBABILIDAD DE UNA VARIABLE ALEATORIA La distribucin de probabilidad de una v.a. X, tambin llamada funcin de distribucin de X es la funcin FX(x), que asigna a cada evento definido sobre X una probabilidad dada por la siguiente expresin:

y de manera que se cumplan las siguientes tres condiciones: 1. y 2. Es continua por la derecha. 3. Es montona no decreciente. La distribucin de probabilidad de una variable aleatoria, describe tericamente la forma en que varan los resultados de un experimento aleatorio. Intuitivamente se tratara de una lista de los resultados posibles de un experimento con las probabilidades que se esperaran ver asociadas con cada resultado.

43

UNIVERSIDAD CENTRAL DEL ECUADOR

ESTADISTICA APLICADA

FUNCION DE DENSIDAD DE UNA VARIABLE ALEATORIA CONTINUA La funcin de densidad de probabilidad (FDP) o, simplemente, funcin de densidad, representada comnmente como f(x), se utiliza con el propsito de conocer cmo se distribuyen las probabilidades de un suceso o evento, en relacin al resultado del suceso. La FDP es la derivada (ordinaria o en el sentido de las distribuciones) de la funcin de distribucin de probabilidad F(x), o de manera inversa, la funcin de distribucin es la integral de la funcin de densidad:

La funcin de densidad de una v.a. determina la concentracin de probabilidad alrededor de los valores de una variable aleatoria continua. FUNCIONES DE VARIABLES ALEATORIAS

Sea

una

variable

aleatoria

sobre

y

una funcin

medible

de

Borel , entonces ser tambin una variable aleatoria sobre , dado que la composicin de funciones medibles es tambin es medible a no ser que g sea una funcin medible de Lebesgue. El mismo procedimiento que permite ir de un espacio de probabilidad a puede ser utilizado para obtener la distribucin de de probabilidad acumulada de es . La funcin

Si la funcin g es invertible, es decir g-1 existe, y es montona creciente, entonces la anterior relacin puede ser extendida para obttener

y, trabajando de nuevo bajo las mismas hiptesis de invertibilidad de g y asumiendo adems diferenciabilidad, podemos hallar la relacin entre las funciones de densidad de probabilidad al diferenciar ambos trminos respecto de y, obteniendo

. Si g no es invertible pero cada y tiene un nmero finito de races, entonces la relacin previa con la funcin de densidad de probabilidad puede generalizarse como

44

UNIVERSIDAD CENTRAL DEL ECUADOR

ESTADISTICA APLICADA

donde xi = gi-1(y). Las frmulas de densidad no requieren que g sea creciente. PARAMETROS DE UNA VARIABLE ALEATORIA La funcin de densidad o la distribucin de probabilidad de una v.a. contiene exhaustivamente toda la informacin sobre la variable. Sin embargo resulta conveniente resumir sus caractersticas principales con unos cuantos valores numricos. Estos son, fundamentalmente la esperanza y la varianza. Esperanza La esperanza matemtica (o simplemente esperanza) o valor esperado de una v.a. es la suma del producto de la probabilidad de cada suceso por el valor de dicho suceso. Si todos los sucesos son de igual probabilidad la esperanza es la media aritmtica. Para una variable aleatoria discreta con valores posibles y sus probabilidades representadas por la funcin de probabilidad p(xi) la esperanza se calcula como:

Para una variable aleatoria continua la esperanza se calcula mediante la integral de todos los valores y la funcin de densidad :

o La esperanza tambin se suele simbolizar con El concepto de esperanza se asocia comnmente en los juegos de azar al de beneficio medio o beneficio esperado a largo plazo. Varianza La varianza es una medida de dispersin de una variable aleatoria respecto a su esperanza . Se define como la esperanza de la transformacin : o bien CLASIFICACIN VARIABLE:

45

UNIVERSIDAD CENTRAL DEL ECUADOR

ESTADISTICA APLICADA

1. VARIABLE ALEATORIA DISCRETA: Es aquella variable que puede tomar un nmero de valores finito o infinito contable, y stos pueden arreglarse en una secuencia que corresponde con los enteros positivos. Generalmente las VA discretas representan datos que se cuentan, tales como: nmero de artculos defectuosos de una muestra de k artculos, nmero de accidentes por ao en una va rpida. En el ejemplo anterior de las bolas rojas y negras, dado que los valores posibles de X eran 0, 1 y 2, se dice que X es una VA discreta. 2. VARIABLE ALEATORIA CONTINUA: Es aquella cuyo conjunto de valores abarca todo un intervalo de valores en la recta numrica. Generalmente la VA continuas representan datos medidos, tales como: alturas, pesos, temperaturas, distancias o periodos de vida. Tanto las variables aleatorias Discretas como Continuas pueden asumir cada uno de sus valores con una cierta probabilidad.

DISTRIBUCIN DISCRETA Y CONTINUA DE PROBABILIDAD

DISTRIBUCION DISCRETA DE PROBABLIDAD Una distribucin de probabilidades para una variable aleatoria discreta es un listado mutuamente excluyente de todos los resultados numricos posibles para esa variable aleatoria tal que una probabilidad especfica de ocurrencia se asocia con cada resultado. El valor esperado de una variable aleatoria discreta es un promedio ponderado de todos los posibles resultados, donde las ponderaciones son las probabilidades asociadas con cada uno de los resultados.

Donde: Xi = i-simo resultado de X, la variable discreta de inters. P(Xi) = probabilidad de ocurrencia del i-simo resultado de X La varianza de una variable aleatoria discreta (s 2) se define como el promedio ponderado de los cuadros de las diferencias entre cada resultado posible y su media (los pesos son las probabilidades de los resultados posibles).

46

UNIVERSIDAD CENTRAL DEL ECUADOR

ESTADISTICA APLICADA

Donde: Xi = i-simo resultado de X, la variable discreta de inters. P(Xi) = probabilidad de ocurrencia del i-simo resultado de X Las distribuciones de probabilidades discretas ms importantes son: 1. Distribucin Binomial, y 2. Distribucin de Poisson 1. Distribucion binomial La distribucin binomial es una distribucin de probabilidades que surge al cumplirse cinco condiciones: 1. Existe una serie de N ensayos, 2. En cada ensayo hay slo dos posibles resultados, 3. En cada ensayo, los dos resultados posibles son mutuamente excluyentes, 4. Los resultados de cada ensayo son independientes entre si, y 5. La probabilidad de cada resultado posible en cualquier ensayo es la misma de un ensayo a otro.Cuando se cumple estas condiciones, la distribucin binomial proporciona cada resultado

posible de los N ensayos y la probabilidad de obtener cada uno de estos resultados. Para este tipo de distribucin de probabilidad, la funcin matemtica es la siguiente:

Donde: P(X) = probabilidad de X xitos dados los parmetros n y p n = tamao de la muestra p = probabilidad de xito 1 p = probabilidad de fracaso X = numero de xitos en la muestra ( X = 0, 1, 2, .. n) El trmino indica la probabilidad de obtener X xitos de n

observaciones en una secuencia especfica. En trmino indica cuantas combinaciones de los X xitos entre n observaciones son posibles. Entonces dado el nmero de observaciones n y la probabilidad de xito p, la probabilidad de X xitos es: P(X) = (numero de de secuencia posibles) x (probabilidad de un secuencia especifica) 47

UNIVERSIDAD CENTRAL DEL ECUADOR

ESTADISTICA APLICADA

Por eso que llegamos a la funcin matemtica que representa esta distribucin. Veamos un ejemplo: Supngase que en cierta poblacin el 52 por ciento de todos los nacimientos que se registraron son varones. Si aleatoriamente se escogen cinco registros de nacimientos dentro de esa poblacin, cul es la probabilidad de que exactamente tres de ellos pertenezcan a varones? Tenemos los siguientes datos: N = 5 X = 3 p = 0.52 Este problema los solucionamos con el Excel. Vamos a insertar funcin:

Escogemos en Seleccionar una categora, a las Estadsticas. Y dentro de las estadsticas, escogemos a la DISTR.BINOM. Ingresamos la informacin del problema y listo. P(X=3) = 0.3239

48

UNIVERSIDAD CENTRAL DEL ECUADOR

ESTADISTICA APLICADA

2. Distribucion de poisson Se dice que existe un proceso de Poisson si podemos observar eventos discretos en un rea de oportunidad un intervalo continuo (de tiempo, longitud, superficie, etc.) de tal manera que si se reduce lo suficiente el rea de oportunidad o el intervalo, 1. La probabilidad de observar exactamente un xito en el intervalo es constante. 2. La probabilidad de obtener ms de un xito en el intervalo es 0. 3. La probabilidad de observar un xito en cualquier intervalo es estadsticamente independiente de la de cualquier otro intervalo. Esta distribucin se aplica en situaciones como: El numero de pacientes que llegan al servicio de emergencia de un hospital en un intervalo de tiempo. El numero de radiaciones radiactivas que se recibe en un lapso de tiempo, El numero de glbulos blancos que se cuentan en una muestra dada. El numero de partos triples por ao Su utilidad en el rea de la salud es muy amplia. La expresin matemtica para la distribucin de Poisson para obtener X xitos, dado que se esperan l xitos es:

Donde: P(X) = probabilidad de X xitos dado el valor de l l = esperanza del nmero de xitos. 49

UNIVERSIDAD CENTRAL DEL ECUADOR

ESTADISTICA APLICADA

e = constante matemtica, con valor aproximado 2.711828 X = nmero de xitos por unidad La distribucin de Poisson se considera una buena aproximacin a la distribucin binomial, en el caso que np < 5 y p < 0.1 n > 100 y p < 0.05 y en ese caso l = np. El interes por sustituir la distribucin Binomial por una distribucin de Poisson se debe a que esta ultima depende unicamente de un solo parmetro, l , y la binomial de dos, n y p. Veamos un ejemplo: Si en promedio, llegan tres pacientes por minuto al servicio de emergencia del hospital del Nio durante la hora del almuerzo. Cul es la probabilidad de que en un minuto dado, lleguen exactamente dos pacientes? Y Cul es la probabilidad de que lleguen ms de dos pacientes en un minuto dado? Datos: l = 3 pacientes por minuto P(X=2) = ? Para resolver esto utilizamos al Excel. De las funciones estadsticas, seleccionamos la funcin POISSON.

Ingresamos la informacin que tenemos: y listo, tenemos el resultado: P(X=2) = 0.2240

50

UNIVERSIDAD CENTRAL DEL ECUADOR

ESTADISTICA APLICADA

Para resolver la segunda parte del problema P(X>2) = ? Con el Excel encontraremos P(X 2) y hacemos el siguiente clculo: P(X > 2 ) = 1 - P(X 2) Utilizando nuevamente el Excel:

51

UNIVERSIDAD CENTRAL DEL ECUADOR

ESTADISTICA APLICADA

Entonces: P(X>2) = 1 0.4232 = 0.5768

DISTRIBUCIN CONTINUA DE PROBABILIDAD

Una distribucin de probabilidad continua, la distribucin normal. En teora de la probabilidad una distribucin de probabilidad se llama continua si su funcin de distribucin es continua. Puesto que la funcin de distribucin de una variable aleatoria X viene dada por , la definicin implica que en una distribucin de probabilidad continua X se cumple P[X = a] = 0 para todo nmero real a, esto es, la probabilidad de que X tome el valor a es cero para cualquier valor de a. Si la distribucin de X es continua, se llama a X variable aleatoria continua. En las distribuciones de probabilidad continuas, la distribucin de probabilidad es la integral de la funcin de densidad, por lo que tenemos entonces que:

Mientras que en una distribucin de probabilidad discreta un suceso con probabilidad cero es imposible, no se da el caso en una variable aleatoria continua. Por ejemplo, si se mide la anchura de una hoja de roble, el resultado 3,5 cm es posible, pero tiene probabilidad cero porque hay infinitos valores posibles entre 3 cm y 4 cm. Cada uno de esos valores individuales tiene probabilidad cero, aunque la probabilidad de ese intervalo no lo es. Esta aparente paradoja se resuelve por el hecho de que la probabilidad de que X tome algn valor en un conjunto infinito como un intervalo, no puede calcularse mediante la adicin simple de probabilidades de valores individuales. Formalmente, cada valor tiene una probabilidad infinitesimal que estadsticamente equivale a cero. Existe una definicin alternativa ms rigurosa en la que el trmino "distribucin de probabilidad continua" se reserva a distribuciones que tienen funcin de 52

UNIVERSIDAD CENTRAL DEL ECUADOR

ESTADISTICA APLICADA

densidad de probabilidad. Estas funciones se llaman, con ms precisin, variables aleatorias absolutamente continuas (vase el Teorema de RadonNikodym). Para una variable aleatoria X absolutamente continua es equivalente decir que la probabilidad P[X = a] = 0 para todo nmero real a, en virtud de que hay un incontables conjuntos de medida de Lebesgue cero (por ejemplo, el conjunto de Cantor). Una variable aleatoria con la distribucin de Cantor es continua de acuerdo con la primera definicin, pero segn la segunda, no es absolutamente continua. Tampoco es discreta, ni una media ponderada de variables discretas y absolutamente continuas. En aplicaciones prcticas, las variables aleatorias a menudo ofrece una distribucin discreta o absolutamente continua, aunque tambin aparezcan de forma natural mezclas de los dos tipos. Para una variable continua hay infinitos valores posibles de la variable y entre cada dos de ellos se pueden definir infinitos valores ms. En estas condiciones no es posible deducir la probabilidad de un valor puntual de la variable; como se puede hacer en el caso de va discretas, pero es posible calcular la probabilidad acumulada hasta un cierto valor (funcin de distribucin de probabilidad), y se puede analizar como cambia la probabilidad acumulada en cada punto (estos cambios no son probabilidades sino otro concepto: la funcin de densidad. En el caso de variable continua la distribucin de probabilidad es la integral de la funcin de densidad, por lo que tenemos entonces que:

Sea X una va continua, una distribucin de probabilidad o funcin de densidad de probabilidad (FDP) de X es una funcin f(x) tal que, para cualesquiera dos nmeros a y b siendo .

La grfica de f(x) se conoce a veces como curva de densidad, la probabilidad de que X tome un valor en el intervalo [a,b] es el rea bajo la curva de la funcin de densidad; as, la funcin mide concentracin de probabilidad alrededor de los valores de una variable aleatoria continua.

rea bajo la curva de f(x) entre a y b

Para que f(x) sea una FDP (FDP = f(x)) sea legtima, debe satisfacer las siguientes dos condiciones: 53

UNIVERSIDAD CENTRAL DEL ECUADOR

ESTADISTICA APLICADA

1. f(x)

0 para toda x.

2.

Ya que la probabilidad es siempre un nmero positivo, la FDP es una funcin no decreciente que cumple: 1. Es decir, la probabilidad de todo el espacio muestral es 1. 2. Es decir, la probabilidad del suceso nulo es cero. Distribuciones continuas Las distribuciones de variable continua ms importantes son las siguientes: Distribucin Beta Distribucin exponencial Distribucin F Distribucin Gamma Distribucin ji cuadrado Distribucin normal Distribucin t de Student

DISTRIBUCIN BETA En estadstica la distribucin beta es una distribucin de probabilidad continua con dos parmetros a y b cuya funcin de densidad para valores 0 < x < 1 es

Aqu es la funcin gamma. El valor esperado y la varianza de una variable aleatoria X con distribucin beta son

.

Un caso especial de la distribucin beta con a = 1 y b = 1 es la distribucin uniforme en el intervalo [0, 1]. 54

UNIVERSIDAD CENTRAL DEL ECUADOR

ESTADISTICA APLICADA

Para relacionar con la muestra se iguala E[X] a la media y V[X] a la varianza y de despejan a y b. DISTRIBUCIN EXPONENCIAL En estadstica la distribucin exponencial es una distribucin de probabilidad continua con un parmetro > 0 cuya funcin de densidad es:

Su funcin de distribucin es:

Donde e representa el nmero e. El valor esperado y la varianza de una variable aleatoria X con distribucin exponencial son:

Ejemplo Ejemplos para la distribucin exponencial es la distribucin de la longitud de los intervalos de variable continua que transcuren entre la ocurrencia de dos sucesos "raros", que se distribuyen segn la distribucin de Poisson. Calcular variables aleatorias Se pueden calcular una variable aleatoria de distribucin exponencial x por medio de una variable aleatoria de distribucin uniforme u = U(0,1):

o, dado que (1 u) es tambin una variable aleatoria con distribucin U(0,1), puede utilizarse la versin ms eficiente:

55

UNIVERSIDAD CENTRAL DEL ECUADOR

ESTADISTICA APLICADA

Relaciones La suma de k variables aleatorias independientes de distribucin exponencial con parmetro es una variable aleatoria de distribucin gamma. DISTRIBUCIN F Usada en teora de probabilidad y estadstica, la distribucin F es una distribucin de probabilidad continua. Tambin se la conoce como distribucin F de Snedecor (por George Snedecor) o como distribucin F de FisherSnedecor. Una variable aleatoria de distribucin F se construye como el siguiente cociente:

donde U1 y U2 siguen una distribucin chi-cuadrado con d1 y d2 grados de libertad respectivamente, y U1 y U2 son estadsticamente independientes. La distribucin F aparece frecuentemente como la distribucin nula de una prueba estadstica, especialmente en el anlisis de varianza. Vase el test F. La funcin de densidad de una F(d1, d2) viene dada por

para todo nmero real x 0, donde d1 y d2 son enteros positivos, y B es la funcin beta. La funcin de distribucin es

donde I es la funcin beta incompleta regularizada.

Distribuciones relacionadas es una distribucin ji-cuadrada cuando . 56 para

UNIVERSIDAD CENTRAL DEL ECUADOR

ESTADISTICA APLICADA

Distribucin gamma En estadstica la distribucin gamma es una distribucin de probabilidad continua con dos parmetros k y cuya funcin de densidad para valores x > 0 es

Aqu e es el nmero e y es la funcin gamma. Para valores la aquella es (k) = (k 1)! (el factorial de k 1). En este caso - por ejemplo para describir un proceso de Poisson - se llaman la distribicin distribucin Erlang con un parmetro = 1 / . El valor esperado y la varianza de una variable aleatoria X de distribucin gamma son

E[X] = k / = k V[X] = k / 2 = k2Relaciones El tiempo hasta que el suceso nmero k ocurre en un Proceso de Poisson de intensidad es una variable aleatoria con distribucin gamma. Eso es la suma de k variables aleatorias independientes de distribucin exponencial con parmetro .

Distribucin o Ji cuadrado En estadstica, la distribucin (de Pearson), llamada Chi cuadrado o Ji cuadrado, es una distribucin de probabilidad continua con un parmetro k que representa los grados de libertad de la variable aleatoria

donde Zi son variables aleatorias normales independientes de media cero y varianza uno. El que la variable aleatoria X tenga esta distribucin se representa habitualmente as: . Es conveniente tener en cuenta que la letra griega se transcribe al latn como chi1 y se pronuncia en castellano como ji.2 3 PROPIEDADES Funcin de densidad 57

UNIVERSIDAD CENTRAL DEL ECUADOR

ESTADISTICA APLICADA

Su funcin de densidad es:

Donde es la funcin gamma. Funcin de distribucin acumulada Su funcin de distribucin es

Donde es la funcin gamma incompleta. El valor esperado y la varianza de una variable aleatoria X con distribucin son, respectivamente, k y 2k. Relacin con otras distribuciones La distribucin es un caso especial de la distribucin gamma. De hecho, Como consecuencia, cuando k = 2, la distribucin es una distribucin exponencial de media k = 2. Cuando k es suficientemente grande, como consecuencia del teorema central del lmite, puede aproximarse por una distribucin normal:

Aplicaciones La distribucin tiene muchas aplicaciones en inferencia estadstica. La ms conocida es la de la denominada prueba utilizada como prueba de independencia y como prueba de bondad de ajuste y en la estimacin de varianzas. Pero tambin est involucrada en el problema de estimar la media de una poblacin normalmente distribuida y en el problema de estimar la pendiente de una recta de regresin lineal, a travs de su papel en la distribucin t de Student. 58

UNIVERSIDAD CENTRAL DEL ECUADOR

ESTADISTICA APLICADA

Aparece tambin en todos los problemas de anlisis de varianza por su relacin con la distribucin F de Snedecor, que es la distribucin del cociente de dos variables aleatorias independientes con distribucin .

Distribucin normal En estadstica y probabilidad se llama distribucin normal, distribucin de Gauss o distribucin gaussiana, a una de las distribuciones de probabilidad de variable continua que con ms frecuencia aparece en fenmenos reales. La grfica de su funcin de densidad tiene una forma acampanada y es simtrica respecto de un determinado parmetro. Esta curva se conoce como campana de Gauss. La importancia de esta distribucin radica en que permite modelar numerosos fenmenos naturales, sociales y psicolgicos. Mientras que los mecanismos que subyacen a gran parte de este tipo de fenmenos son desconocidos, por la enorme cantidad de variables incontrolables que en ellos intervienen, el uso del modelo normal puede justificarse asumiendo que cada observacin se obtiene como la suma de unas pocas causas independientes. De hecho, la estadstica es un modelo matemtico que slo permite describir un fenmeno, sin explicacin alguna. Para la explicacin causal es preciso el diseo experimental, de ah que al uso de la estadstica en psicologa y sociologa sea conocido como mtodo correlacional. La distribucin normal tambin es importante por su relacin con la estimacin por mnimos cuadrados, uno de los mtodos de estimacin ms simples y antiguos. Algunos ejemplos de variables asociadas a fenmenos naturales que siguen el modelo de la normal son: caracteres morfolgicos de individuos como la estatura; caracteres fisiolgicos como el efecto de un frmaco; caracteres sociolgicos como el consumo de cierto producto por un mismo grupo de individuos; caracteres psicolgicos como el cociente intelectual; nivel de ruido en telecomunicaciones; errores cometidos al medir ciertas magnitudes; etc. La distribucin normal tambin aparece en muchas reas de la propia estadstica. Por ejemplo, la distribucin muestral de las medias muestrales es aproximadamente normal, cuando la distribucin de la poblacin de la cual se extrae la muestra no es normal. Adems, la distribucin normal maximiza la entropa entre todas las distribuciones con media y varianza conocidas, lo cual la convierte en la eleccin natural de la distribucin subyacente a una lista de datos resumidos en trminos de media muestral y varianza. La distribucin normal es la ms extendida en estadstica y muchos test estadsticos estn basados en una supuesta "normalidad". En probabilidad, la distribucin normal aparece como el lmite de varias distribuciones de probabilidad continuas y discretas 59

UNIVERSIDAD CENTRAL DEL ECUADOR

ESTADISTICA APLICADA

Propiedades Algunas propiedades de la distribucin normal son: 1. Es simtrica respecto de su media, ; Distribucin de probabilidad alrededor de la media en una distribucin N(, ). 2. La moda y la mediana son ambas iguales a la media, ; 3. Los puntos de inflexin de la curva se dan para x = y x = + . 4. Distribucin de probabilidad en un entorno de la media: 1) En el intervalo [ - , + ] se encuentra comprendida, aproximadamente, el 68,26% de la distribucin; 2) En el intervalo [ - 2, + 2] se encuentra, aproximadamente, el 95,44% de la distribucin; 3) Por su parte, en el intervalo [ -3, + 3] se encuentra comprendida, aproximadamente, el 99,74% de la distribucin. Estas propiedades son de gran utilidad para el establecimiento de intervalos de confianza. Por otra parte, el hecho de que prcticamente la totalidad de la distribucin se encuentre a tres desviaciones tpicas de la media justifica los lmites de las tablas empleadas habitualmente en la normal estndar. 5. Si X ~ N(, 2) y a y b son nmeros reales, entonces (aX + b) ~ N(a+b, a22). 6. Si X ~ N(x, x2) e Y ~ N(y, y2) son variables aleatorias normales independientes, entonces: Su suma est normalmente distribuida con U = X + Y ~ N(x + y, x2 + y2) (demostracin). Recprocamente, si dos variables aleatorias independientes tienen una suma normalmente distribuida, deben ser normales (Teorema de Crmer). Su diferencia est normalmente distribuida con . Si las varianzas de X e Y son iguales, entonces U y V son independientes entre s. La divergencia de Kullback-Leibler,

7. Si e son variables independientes normalmente distribuidas, entonces:o

aleatorias

Su producto XY sigue una distribucin con densidad p dada por

donde K0 es una funcin de Bessel modificada de segundo tipo. 60

UNIVERSIDAD CENTRAL DEL ECUADOR

ESTADISTICA APLICADA

Su cociente sigue una distribucin de Cauchy con X / YCauchy(0,X / Y). De este modo la distribucin de Cauchy es un tipo especial de distribucin cociente. 8. Si son variables normales estndar independientes, entonces libertad. 9. Si sigue una distribucin con n grados de son variables normales estndar independientes, y la varianza

entonces la media muestral

muestral son independientes. Esta propiedad caracteriza a las distribuciones normales y contribuye a explicar por qu el test-F no es robusto respecto a la no-normalidad). Distribucin t de Student En probabilidad y estadstica, la distribucin t (de Student) es una distribucin de probabilidad que surge del problema de estimar la media de una poblacin normalmente distribuida cuando el tamao de la muestra es pequeo. Aparece de manera natural al realizar la prueba t de Student para la determinacin de las diferencias entre dos medias muestrales y para la construccin del intervalo de confianza para la diferencia entre las medias de dos poblaciones cuando se desconoce la desviacin tpica de una poblacin y sta debe ser estimada a partir de los datos de una muestra. Caracterizacin La distribucin t de Student es la distribucin de probabilidad del cociente

donde Z tiene una distribucin normal de media nula y varianza 1 V tiene una distribucin chi-cuadrado con grados de libertad Z y V son independientes

Si es una constante no nula, el cociente es una variable aleatoria que sigue la distribucin t de Student no central con parmetro de no-centralidad . Aparicin y especificaciones de la distribucin t de Student Supongamos que X1,..., Xn son variables aleatorias independientes distribuidas normalmente, con media y varianza 2. Sea la media muestral. Entonces 61

UNIVERSIDAD CENTRAL DEL ECUADOR

ESTADISTICA APLICADA

sigue una distribucin normal de media 0 y varianza 1. Sin embargo, dado que la desviacin estndar no siempre es conocida de antemano, Gosset estudi un cociente relacionado,

donde

es la varianza muestral y demostr que la funcin de densidad de T es

donde es igual a n 1. La distribucin de T se llama ahora la distribucin-t de Student. El parmetro representa el nmero de grados de libertad. La distribucin depende de , pero no de o , lo cual es muy importante en la prctica. Intervalos de confianza derivados de la distribucin t de Student El procedimiento para el clculo del intervalo de confianza basado en la t de Student consiste en estimar la desviacin tpica de los datos S y calcular el error estndar de la media , siendo entonces el intervalo de confianza

para la media = . Es este resultado el que se utiliza en el test de Student: puesto que la diferencia de las medias de muestras de dos distribuciones normales se distribuye tambin normalmente, la distribucin t puede usarse para examinar si esa diferencia puede razonablemente suponerse igual a cero. para efectos prcticos el valor esperado y la varianza son: E(t(n))= 0 y Var (t(n-1)) = n/(n-2) para n > 3

DISTRIBUCINES EMPIRICASLa distribucin emprica asociada a una muestra es la ley de probabilidad sobre el conjunto de las modalidades, que afecta a cada observacin con el peso . La idea es la siguiente. Supongamos que queremos aumentar artificialmente la cantidad de datos. La forma ms simple sera sacar aleatoriamente nuevos valores a partir de los valores ya observados, 62

UNIVERSIDAD CENTRAL DEL ECUADOR

ESTADISTICA APLICADA

respetando sus frecuencias. En otras palabras, se simulara la distribucin emprica.

Sean los . Para

una muestra, denotamos:

los diferentes valores que toman

el nmero de veces que el valor

aparece o sea el efectivo del valor

. La

distribucin emprica de la muestra es la ley de probabilidad conjunto , tal que:

sobre el

La media, la varianza y la desviacin estndar pueden ser vistas como carctersticas probabilistas de la distribucin emprica. La media de la muestra es la esperanza de su distribucin emprica. Para un carcter discreto, la moda de la distribucin emprica es el valor que tiene la frecuencia ms alta. Para un carcter continuo agrupado en clases de amplitudes iguales, hablamos de clase modal. Una distribucin emprica se llama unimodal si la frecuencia maximal es significativamente mayor que las otras. Puede ser bimodal o multimodal en otros casos. Para estudiar una distribucin emprica, la primera etapa consiste en ordenar los datos en orden creciente, es decir escribir sus estadgrafos de orden. Distribucion Normal Una de las distribuciones tericas mejor estudiadas en los textos de bioestadstica y ms utilizada en la prctica es la distribucin normal, tambin llamada distribucin gaussiana. Su importancia se debe fundamentalmente a la frecuencia con la que distintas variables asociadas a fenmenos naturales y cotidianos siguen, aproximadamente, esta distribucin. Caracteres morfolgicos (como la talla o el peso), o psicolgicos (como el cociente intelectual) son ejemplos de variables de las que frecuentemente se asume que siguen una distribucin normal. 63

UNIVERSIDAD CENTRAL DEL ECUADOR

ESTADISTICA APLICADA

La distribucin normal fue reconocida por primera vez por el francs Abraham de Moivre (1667-1754). Posteriormente, Carl Friedrich Gauss (1777-1855) elabor desarrollos ms profundos y formul la ecuacin de la curva; de ah que tambin se la conozca, ms comnmente, como la "campana de Gauss". La distribucin de una variable normal est completamente determinada por dos parmetros, su media y su desviacin estndar, denotadas generalmente por y . Con esta notacin, la densidad de la normal viene dada por la ecuacin:

Ecuacin 1:

Que determina la curva en forma de campana. As, se dice que una caracterstica denota como Ecuacin 1. sigue una distribucin normal de media y varianza , y se , si su funcin de densidad viene dada por la

Al igual que ocurra con un histograma, en el que el rea de cada rectngulo es proporcional al nmero de datos en el rango de valores correspondiente si, en el eje horizontal se levantan perpendiculares en dos puntos a y b, el rea bajo la curva delimitada por esas lneas indica la probabilidad de que la variable de inters, X, tome un valor cualquiera en ese intervalo. Puesto que la curva alcanza su mayor altura en torno a la media, mientras que sus "ramas" se extienden asintticamente hacia los ejes, cuando una variable siga una distribucin normal, ser mucho ms probable observar un dato cercano al valor medio que uno que se encuentre muy alejado de ste. Propiedades de la distribucin normal: La distribucin normal posee ciertas propiedades importantes que conviene destacar: A. Tiene una nica moda, que coincide con su media y su mediana. B. La curva normal es asinttica al eje de abscisas. Por ello, cualquier valor entre y es tericamente posible. El rea total bajo la curva es, por tanto, igual a 1. C. Es simtrica con respecto a su media . Segn esto, para este tipo de variables existe una probabilidad de un 50% de observar un dato mayor que la media, y un 50% de observar un dato menor. D. La distancia entre la lnea trazada en la media y el punto de inflexin de la curva es igual a una desviacin tpica ( ). Cuanto mayor sea , ms aplanada ser la curva de la densidad. E. El rea bajo la curva comprendida entre los valores situados aproximadamente a dos desviaciones estndar de la media es igual a 64

UNIVERSIDAD CENTRAL DEL ECUADOR

ESTADISTICA APLICADA

0.95. En concreto, existe un 95% de posibilidades de observar un valor comprendido en el intervalo . F. La forma de la campana de Gauss depende de los parmetros y . La media indica la posicin de la campana, de modo que para diferentes valores de la grfica es desplazada a lo largo del eje horizontal. Por otra parte, la desviacin estndar determina el grado de apuntamiento de la curva. Cuanto mayor sea el valor de , ms se dispersarn los datos en torno a la media y la curva ser ms plana. Un valor pequeo de este parmetro indica, por tanto, una gran probabilidad de obtener datos cercanos al valor medio de la distribucin. Como se deduce de este ltimo apartado, no existe una nica distribucin normal, sino una familia de distribuciones con una forma comn, diferenciadas por los valores de su media y su varianza. De entre todas ellas, la ms utilizada es la distribucin normal estndar, que corresponde a una distribucin de media 0 y varianza 1. As, la expresin que define su densidad se puede obtener de la Ecuacin 1, resultando:

Es importante conocer que, a partir de cualquier variable X que siga una distribucin , se puede obtener otra caracterstica Z con una distribucin normal estndar, sin ms que efectuar la transformacin:

Ecuacin 2:

Distribucin Bimodal Hablaremos de una distribucin bimodal de los datos, cuando encontremos dos modas, es decir, dos datos que tengan la misma frecuencia absoluta mxima. Una distribucin trimodal de los datos es en la que encontramos tres modas. Si todas las variables tienen la misma frecuencia diremos que no hay moda. El intervalo modal es el de mayor frecuencia absoluta. Cuando tratamos con datos agrupados antes de definir la moda, se ha de definir el intervalo modal.

65

UNIVERSIDAD CENTRAL DEL ECUADOR

ESTADISTICA APLICADA

La moda, cuando los datos estn agrupados, es un punto que divide al intervalo modal en dos partes de la forma p y c-p, siendo c la amplitud del

intervalo, que verifiquen que: Siendo la frecuencia absoluta del intervalo modal las frecuencias absolutas de