apunte estadística

71
UNIDAD DE ESTADÍSTICA Y PROBABILIDADES Material de Referencia Primer Nivel de Educación Media de Adultos Eugenio Saavedra Gallardo

Upload: siul-prueba

Post on 26-Sep-2015

50 views

Category:

Documents


3 download

DESCRIPTION

estadisticas

TRANSCRIPT

  • UNIDAD DE ESTADSTICA Y PROBABILIDADES

    Material de Referencia Primer Nivel de Educacin Media de Adultos

    Eugenio Saavedra Gallardo

  • 1

    Muestras y poblaciones en estadstica 3 Algunas razones para considerar muestra en lugar de poblacin 5

    Qu se puede esperar de una muestra? 5

    El tamao de la muestra y la forma de seleccionarla 6

    Cmo escoger una muestra representativa 7

    Variables y datos 9 Clasificacin de las variables 10

    Variables cualitativas 11

    Variables Cuantitativas 14

    Cmo pueden presentarse los datos? 17 Datos a granel 17

    Datos en tablas de frecuencias 17

    Datos en un diagrama de tallo y hoja 18

    Datos agrupados 19

    Datos en un grfico 20

    Medidas de tendencia central 28 La Moda 28

    El Promedio (o media aritmtica) 32

    La Mediana 37

    Modelo de Probabilidad de Laplace 40 Experimentos aleatorios equiprobables 40

    El Modelo de Laplace y sus propiedades bsicas 50

    Acerca del Tringulo de Pascal 58 Nmeros factoriales 67

    Combinatoria 67

    ndice

  • 2

  • 3

    Suponga que un curso de su establecimiento realizar una convivencia para finalizar el ao escolar y se le ha pedido a usted comprar el queso que se consumir en la fiesta. Usted concurre a un supermercado y el vendedor le ofrece 3 marcas diferentes de queso (cuyo precio es el mismo). Como usted no sabe por cual decidirse, le pide al vendedor que le de una probadita de cada una de las marcas, para luego decidir cual comprar. En otras palabras, usted toma una muestra de cada una de las marcas y, luego, juzga cmo ser la calidad del trozo completo de queso, bajo el razonable supuesto que la probadita tiene el mismo sabor que el trozo completo. Exactamente este mismo principio opera en estadstica. Usualmente, en estadstica se emplean muestras para sacar conclusiones acerca de grupos enteros o poblaciones. Ac la palabra poblacin no necesariamente significa las personas que viven en un pas o regin. Definicin. En estadstica, una poblacin se define como una coleccin de personas, objetos o tems en los cuales se tiene algn inters, esto es, interesa medir o determinar alguna caracterstica de sus elementos (tambin se les denomina unidades). Este conjunto de inters lo define uno mismo. Definicin. Una muestra de una poblacin es una coleccin de personas o tems tomados desde sta. En otras palabras, una muestra es un subconjunto de la poblacin. Cabe sealar que lo importante es que la poblacin contenga todas las personas o tems, cualquiera sea el modo en que stas estn definidas y que la muestra sea lo ms representativa de la poblacin. Ejemplos: a) Poblacin: Establecimientos educacionales de la regin metropolitana que participaron en el

    SIMCE el ao 2007.

    Muestra posible: Establecimientos educacionales de la comuna de Huechuraba que participaron en el SIMCE el ao 2007.

    b) Poblacin: Establecimientos educacionales de Chile que participaron en el SIMCE el ao

    2007.

    Muestra Posible: Establecimientos educacionales de la Regin Metropolitana que participaron en el SIMCE el ao 2007.

    c) Poblacin: Das del ao 2007.

    Muestra Posible: Das del ao 2007. d) Poblacin: Das feriados del ao 2007.

    Muestras y poblaciones en estadstica

  • 4

    Muestra posible: Das domingos del ao 2007. e) Poblacin: Ballenas que hay en los ocanos del planeta tierra.

    Muestra posible: Ballenas que han sido capturadas el ao 2007 con fines cientficos. f) Poblacin: Polgonos (figuras geomtricas).

    Muestra posible: Cuadrilteros. g) Poblacin: Cuadrilteros.

    Muestra posible: paralelogramos.

    h) Poblacin: Ratones portadores del virus Hanta en Chile.

    Muestra posible: Ratones portadores del virus Hanta en Chile que han sido capturados.

    i) Poblacin: Los nmeros naturales.

    Muestra posible: Los nmeros primos.

    j) Poblacin: Los tarros de duraznos en conserva que producir una compaa durante el

    segundo semestre del ao 2008. Muestra posible: Los tarros de duraznos en conserva que produjo la compaa en los meses de enero y febrero de 2008.

    k) Poblacin: Los alumnos del (de los) colegio(s) donde usted trabaja.

    Muestra posible: Los alumnos del (de los) colegio(s) donde usted trabaja y cuyo apellido paterno comienza con la letra C.

    l) Poblacin: Las personas con nacionalidad chilena.

    Muestra posible: Las personas con nacionalidad chilena que viven en Isla de Pascua.

    m) Poblacin: Las maletas de las personas que arriban desde el extranjero al aeropuerto Arturo

    Merino Bentez en un da del ao.

    Muestra posible: las maletas que fueron revisadas por personal de aduana ese da del ao.

  • 5

    Algunas razones para considerar muestras en lugar de poblaciones A continuacin se explicitan algunas de las razones que explican la necesidad de hacer estudios a partir de muestras en vez de considerar la poblacin completa. i) Poblaciones muy grandes (incluso de tamao infinito). En este caso podra no disponerse del tiempo o los recursos para identificar cada elemento de la poblacin para la realizacin de un cierto estudio. Por ejemplo, las descritas en los ejemplos l), m). ii) Dificultad para identificar los elementos (tambin conocidos como unidades) de la poblacin (incluso imposible). Este sera el caso de las poblaciones de los ejemplos e), h), j). iii) El proceso para identificar la poblacin es destructivo. Por ejemplo, si la poblacin son los tarros de duraznos en conserva producidos por una compaa el da de ayer, y se quiere realizar un control de calidad del peso drenado de los tarros, entonces los tarros deben ser abiertos (destruidos). iv) Hay razones ticas o de seguridad. Si la poblacin son todas las personas a los que se les detect el Sida el ao 2007 y se quiere realizar una entrevista para la televisin, entonces se mostrar slo a aquellos que acepten. Qu se puede esperar de una muestra? Supongamos que un establecimiento educacional quiere saber cul es el nmero de hermanos que tiene cada alumno. Si elegimos una muestra de esta poblacin y el alumno Alberto Prez es del colegio pero no esta en la muestra, podemos decir algo del nmero de hermanos de Alberto Perez? La respuesta es que no. En general, una muestra entrega escasa informacin sobre valores individuales de elementos de la poblacin. Sin embargo, en la mayora de las veces estamos interesados en caractersticas globales de los elementos de la poblacin. Por ejemplo, nos interesa saber la proporcin de elementos que cumplen alguna condicin. En el ejemplo podra ser: la proporcin de alumnos del colegio que tienen ms de 3 hermanos o promedio de hermanos en el colegio). En general, podemos afirmar que una muestra proporciona ms informacin de caractersticas globales (conocidos como parmetros) de la poblacin que sobre valores individuales de elementos de sta. Cuando hemos tomado una muestra de la poblacin esperamos que sta sea representativa de ella, esto es, que todas las caractersticas de la poblacin estn reflejadas en la muestra. Mientras mejor refleje la muestra a la poblacin, mejor sern las conclusiones que se obtendrn de la poblacin basada en la muestra. El proceso de obtener conclusiones sobre caractersticas de la poblacin en base a una muestra es conocido en estadstica como Inferencia estadstica y no ser tratado en el estudio de esta unidad, pues corresponde a tpicos ms avanzados.

  • 6

    Por ejemplo, si la poblacin son los alumnos de su curso y al escoger 5 alumnos en la ltima prueba de matemticas resulta que el promedio es 5,6, podremos concluir que el promedio del curso (poblacin) en la ltima prueba de matemtica es aproximadamente 5,6? El tamao de la muestra y la forma de seleccionarla Desde el punto de vista estadstico (es decir, desde el punto de vista de los mtodos para describir y analizar datos), el tamao de una muestra est relacionado con el tipo de conclusin y el grado de precisin que se espera obtener de la muestra respecto de la poblacin. No est relacionado con el tamao relativo que tendra la muestra respecto al tamao de la poblacin. Ejemplo. La Universidad de Santiago de Chile a raz de la toma de la Universidad en el mes de junio de 2008, contrat una empresa que realiza encuestas de opinin para que consultase entre los estudiantes de la Universidad si estaban de acuerdo o no con la toma del plantel. Esta empresa consultora consider una muestra de 400 estudiantes (del orden del 2% de la poblacin). Ejemplo. El CEP (Centro de Estudios Pblicos) realiz una encuesta nacional de opinin pblica en junio-julio de 2006 acerca de la calidad de la educacin en Chile. La poblacin considerada fue la de todos los chilenos de 18 aos y ms residentes a lo largo del pas (en base al censo de 2002). En esa encuesta se consider a 1505 personas, esto es, del orden de un 0,01% de la poblacin en estudio. Los ejemplos siguientes ilustran casos en donde la muestra seleccionada no refleja fielmente el comportamiento de la poblacin completa. Ejemplo. En un colegio trabajan 20 profesores, de los cuales 5 son mujeres (25%) y 15 hombres (75%). Si se considera a los profesores de su colegio como una muestra de todos los profesores del pas, entonces con esta informacin sera aventurado afirmar que alrededor de un 25% de los profesores del pas son mujeres. En este sentido, malas elecciones de una muestra corren el riesgo de ser sesgadas, es decir, de que las caractersticas de la poblacin no se reflejen en la misma proporcin en la muestra. En otras palabras, se genera un sesgo que enfatiza una caracterstica sobre otra y eso, por lo tanto, distorsiona las conclusiones que se pueden extraer de esa muestra. Ejemplo. Si se estuviese investigando los rasgos fsicos de los chilenos y se escogiese una muestra con personas slo de Rapa Nui (Isla de Pascua), entonces, nuestra conclusin acerca de la poblacin (en este caso todos los chilenos) podra ser que, en general, los chilenos tienen rasgos polinsicos. Claramente, la muestra escogida tiene un sesgo (Rapa Nui no es representativa de los rasgos fsicos de todos los chilenos.

  • 7

    Cmo escoger una muestra representativa Consideremos como ejemplo un grupo de estudiantes pertenecientes a un establecimiento educacional que imparte educacin para adultos (pensemos que son 300). Supongamos que estamos interesados en conocer el manejo (nada, poco, suficiente) que tienen los estudiantes adultos en el manejo del computador, en particular, en el uso de planilla Excel. Consideremos como muestra a todos aquellos estudiantes que alguna vez ha participado de una capacitacin en computacin. Si obtenemos que un 80% de ellos tiene un manejo suficiente de la planilla Excel, claramente podramos estar equivocados. En este caso, los estudiantes que tienen capacitacin ya tienen un entrenamiento previo. Para el ejemplo anterior, una mejor forma de escoger la muestra sera considerar la lista (orden alfabtico) de los estudiantes del establecimiento (poblacin), enumerndolos del 1 hasta el 300. Ahora, en pedazos de papel (digamos de 2 centmetros por 2 centmetros) escribimos los nmeros 1, 2, ,300, los ponemos en una bolsa no transparente y sacamos (por ejemplo) 25 de estos papelitos. A los estudiantes de la lista correspondientes a los nmeros obtenidos en los papelitos se les realiza la respectiva consulta. De esta forma cada estudiante tiene igual chance de ser escogido para ser incluido en la muestra, por lo que la muestra ahora sera ms representativa de la poblacin. Esta forma de elegir muestras, donde cada elemento de la poblacin tiene igual chance de ser escogido para ser incluido en la muestra se llama muestreo aleatorio simple. El mtodo anterior es ms o menos simple cuando la poblacin es relativamente pequea, aunque puede ser tedioso. En el caso de poblaciones grandes, claramente es poco practicable. Cualquiera sea el caso, otra forma de escoger una muestra aleatoria simple desde una poblacin de tamao finito es usando una planilla Excel y la generacin de nmeros aleatorios entre 0 y 1. Para esto, primero se coloca en la barra superior la instruccin =ALEATORIO() y luego se presiona la tecla Enter. Despus se multiplica el nmero obtenido por N (tamao de la poblacin) y a continuacin se redondea hacia arriba. Finalmente, se repite este procedimiento n veces (n es el tamao de la muestra). En caso de obtener un nmero que ya ha sido generado, repetir el procedimiento para generar un nmero que an no haya salido. Por ejemplo, si N = 300 y el nmero aleatorio generado es v = 0,1291407, entonces se multiplica N por v y se redondea hacia arriba. Luego,

    N v = 300 0.1291407 = 38,74221. As, el primer elemento escogido de la poblacin es aquel que fue identificado con el nmero 39. En el caso que N es grande, la solucin que hemos dado anteriormente podra an ser un poco engorrosa. Una forma de simplificar la eleccin de la muestra la mostraremos a travs del ejemplo siguiente. En el ao 2003, 159.000 estudiantes rindieron la PSU. De esta poblacin escogeremos una muestra aleatoria de 1300 estudiantes. Para ello, primeramente 159.000 se divide por 1300 y luego se redondea hacia abajo, es decir, obtenemos el nmero 122. Ahora se elige al azar un

  • 8

    nmero entre 1 y 122 (esto se puede hacer va la generacin de un nmero aleatorio). Para este ejemplo el nmero aleatorio que se gener fue v = 0.28935411, por lo que el nmero escogido entre 1 y 122 es 36. Finalmente, los 1300 elementos escogidos de la poblacin sern aquellos identificados con los nmeros:

    36, 36 + 1 122, 36 + 2 122, 36 + 3 122, , 36 + 1298 122, 36 + 1299 122

    Supongamos ahora que de los 300 estudiantes adultos hay 180 mujeres (60%) y 120 hombres (40%). Si realizamos un muestreo aleatorio simple de tamao, por ejemplo, 40, no tenemos garanta que sta muestra contenga la misma proporcin de mujeres y hombres que hay en la poblacin. Si nosotros queremos asegurar que los hombres y las mujeres (se les llama estratos) estn presentes en la muestra en las mismas proporciones como lo estn en la poblacin, entonces primero consideramos una lista con slo las mujeres (en este caso numeradas del 1 al 180) y luego una lista con slo los hombres (en este caso numerados del 1 al 120). Luego se obtiene una muestra aleatoria simple (con el procedimiento descrito anteriormente) de tamao 24 (60% de 40) desde el estrato de las mujeres y otra de tamao 16 (40% de 40) del estrato de los hombres. Estas dos muestras se renen obteniendo lo que se conoce como muestra aleatoria estratificada. Ejemplo. Una fundacin tiene 3 establecimientos de educacin para adultos. Uno tiene 600 alumnos, el otro 400 alumnos y el ltimo 1.000 alumnos. De la poblacin de 2.000 alumnos se sacar una muestra de 80, con el fin de realizarles una encuesta para saber que talleres de oficio seran de su preferencia. Como una forma de que los 3 establecimientos queden representados en la misma proporcin como lo estn la poblacin, se consideran 3 muestras aleatorias simples, una por cada establecimiento, esto es, una de cada estrato. Del primer establecimiento se extrae una muestra aleatoria simple de tamao 24 (30% de 80), del segundo establecimiento se extrae una muestra aleatoria simple de tamao 16 (20% de 80) y del tercero una muestra aleatoria simple de tamao 40 (50% de 80). La reunin de las tres muestras ser nuestra muestra aleatoria estratificada.

  • 9

    Como vimos anteriormente, el estudio de una poblacin o muestra significa (en estadstica) medir o determinar alguna caracterstica de sus elementos. Como sta caracterstica vara de un elemento a otro (en la poblacin o muestra segn corresponda) se acostumbra a llamar variable a esta caracterstica. Por ejemplo, si consideramos la poblacin compuesta por los estudiantes adultos, algunas variables que podramos considerar son: Sexo, oficio en el cual se ha desempeado, nmero de hijos, edad (en meses), acceso a Internet (bajo, medio, avanzado), grupo sanguneo, etc. Las variables son clasificadas de acuerdo al conjunto de valores posibles que estas pueden tener. Esta clasificacin la desarrollaremos ms adelante. Tambin, los valores que obtenemos al considerar una caracterstica sobre cada uno de los elementos de la poblacin o muestra los llamaremos datos. En general, datos muestrales pueden ser analizados incluyendo cualquiera o todos los siguientes objetivos: Obtener una visin panormica de la distribucin de los datos obtenidos de la muestra,

    identificando cualquier caracterstica de inters que pudiera estar presente. Usualmente, esto requerir que los datos sean arreglados u organizados en alguna forma de tabla y, tal vez, tambin requerir la representacin de los datos organizados mediante un grfico o diagrama. Valores numricos que resumen informacin tambin pueden ser determinados aqu.

    Determinar una medida numrica que resuma, de alguna manera, el centro de los datos;

    por ejemplo, el promedio. A menudo, habr ms de una de estas medidas que sea apropiada para estos fines. A este tipo de medidas se les conoce como medidas de tendencia central o localizacin central. Es importante mencionar que la utilizacin de un solo valor (como el promedio, por ejemplo) es una drstica reduccin de los datos y suele contener escasa informacin sobre el verdadero comportamiento de estos.

    Determinar una medida numrica que resuma el grado de dispersin entre los valores de la

    muestra. Por ejemplo, dos grupos de estudiantes adultos rindieron exmenes libres obteniendo las siguientes notas.

    Grupo A 5,1 4,9 5,2 4,8

    Grupo B 2,2 6,8 4,0 7,0

    Variables y datos

  • 10

    Vemos que tanto el grupo A como el grupo B tienen el mismo promedio, 5.0, pero las notas del grupo B estn ms disparejas que las del grupo A. Las medidas que resumen este tipo de variabilidad se conocen como medidas de dispersin. Los mtodos empleados para obtener los objetivos antes mencionados se conocen con el nombre de Estadstica Descriptiva. Hoy en da, tambin se usa Anlisis Exploratorio de Datos para referirse a estos mtodos.

    Clasificacin de las Variables Las variables se presentan en dos tipos diferentes; a saber, cualitativas y cuantitativas, de acuerdo al tipo de datos usados para medir su valor. Las variables cualitativas son aquellas que se pueden expresar como categoras (por ejemplo, blanco/negro/rojo; si/no; alto/bajo; muy de acuerdo/de acuerdo/neutro/en desacuerdo/totalmente en desacuerdo; malo/regular/bueno). Las variables cuantitativas, en cambio, son aquellas que se pueden expresar en valores numricos (por ejemplo, altura de una persona, nmero de pulsaciones por minuto, edad, tiempo de reaccin a un estimulo). Las variables cualitativas se subdividen en nominales y ordinales y las variables cuantitativas en discretas y continuas. El siguiente esquema ilustra la forma en que se clasifican las variables.

    Es muy importante que podamos establecer con qu tipo de variables estamos tratando, porque los mtodos que podemos usar en cualquier anlisis, ya sea descriptivo o inferencial, dependen crucialmente del tipo de variable usada. Algunos procedimientos pueden ser usados con un tipo de variables, pero no con otro tipo, como veremos ms adelante, de manera que la identificacin correcta de un tipo de variable es fundamental para evitar errores en su anlisis. Establecer diferencias entre tipos de variables, significa, en el fondo, establecer diferencias entre tipos de datos.

    Variable

    Cualitativa

    Cuantitativa

    Ordinal

    Continua

    Nominal

    Discreta

  • 11

    Variables Cualitativas Variable cualitativa nominal Una variable se dice cualitativa nominal si datos nominales son usados para medir su valor. Diremos que los datos son nominales si: estos consisten en etiquetas simples o categoras tales como femenino/masculino; si/no;

    casado/soltero; sangre tipo A, tipo B, tipo 0, tipo AB, etc. y las categoras o etiquetas no tienen un orden inherente; esto es, no importa si escribimos

    masculino/femenino o femenino/masculino o si escribimos tipo de sangre A, 0, AB, B o tipo de sangre 0, AB, A, B, etc. En otras palabras, el orden de las categoras es completamente arbitrario y no afecta el anlisis.

    Las categoras que se usan con variables nominales son invariablemente alfabticas o no numricas. Debido a esto no podemos usar las reglas usuales de la aritmtica con variables nominales, por ejemplo, no podemos encontrar el sexo promedio de 10 hombres y 20 mujeres sumndolos y dividiendo por 30 (como podramos encontrar el promedio de 10 cm y 20 cm haciendo la suma:

    .cm152

    cm20cm10 =+ Ejemplo. Una encuesta realizada por la Cmara Chilena del Libro en 1999, encuest a 17.458 personas mayores de 15 aos, de las ciudades de Santiago, Valparaso y Concepcin. En la encuesta se les consult, entre otras cosas, acerca de las razones por las cuales compra o comprara libros. Las respuestas que se registraron fueron: cultura general, ayuda a capacitarse, aumentar conocimientos, satisfaccin personal y otras razones. La variable que est midindose en este caso es razones para comprar un libro y toma uno de los cuatro valores antes mencionados. La tabla siguiente resume la informacin recogida en la encuesta.

    Razones para comprar un libro Total Cultura General 10708 Ayuda a Capacitarse 2416 Aumento de Conocimientos 3015 Satisfaccin Personal 1007 Otras 312 Total 17458

  • 12

    Variable cualitativa ordinal

    Una variable se dice cualitativa ordinal si datos ordinales son usados para medir su valor. Diremos que los datos son ordinales si

    estos constan de categoras tales como satisfecho/insatisfecho, nivel escolar superior/medio/bajo, rendimiento en matemtica muy bueno/regular/malo, etc.

    las categoras tienen un orden natural o inherente, como en el caso de los ejemplos anteriores. En los datos ordinales se tiene un orden natural pero, no se puede cuantificar (es decir, medir precisamente) la diferencia entre las categoras. En consecuencia, al igual que para las variables nominales, no se pueden aplicar las reglas ordinarias de la aritmtica a datos ordinales.

    Ejemplo. Los siguientes datos muestran los resultados de estudios realizados por una compaa de telefona mvil acerca de la calidad de atencin que ellos entregan a sus clientes.

    Respuestas de los clientes % de clientes

    Mala 13,4

    Regular 47,5

    Buena 34,2

    Muy Buena 4,9

    Total 100

    La variable aqu es grado de satisfaccin del cliente y puede asumir cualquiera de los cuatro valores que muestra la tabla, desde mala (13,4% de clientes) hasta muy buena (4,9% de clientes). Es comn que se coloquen las categoras en la primera columna y que stas se encuentren ordenadas en forma ascendente o descendente, respecto del orden inherente dentro de las categoras. En nuestro caso, el orden natural es mala, regular, buena y muy buena o en su defecto, muy buena, buena, regular y mala.

    En consecuencia, podemos decir que los clientes que respondieron muy buena, estn ms satisfechos con la atencin que entrega la compaa que aquellos que slo respondieron buena. Sin embargo, no se puede decir cuanto ms satisfechos estn estos clientes. Las respuestas de los clientes son juicios subjetivos, que no han sido medidos con algn instrumento cientfico y que, adems pueden cambiar en cualquier momento.

    Por esta razn, no podemos, por ejemplo, decir que un cliente que respondi que la atencin era muy buena se sienta el doble de satisfecho que uno que respondi buena, o una vez y media ms satisfecho, o un 35% ms satisfecho, etc. En otras palabras, no podemos decir exactamente cual es la diferencia entre las categoras. En consecuencia, aunque las categoras en datos

  • 13

    ordinales pueden ser ordenadas, no es posible decir algo acerca del tamao de la diferencia entre stas.

    La variable ordinal vista en el ejemplo anterior tiene como valores categoras (que tienen un orden inherente) las cuales son alfabticas o no numricas. Pero, tambin es comn que las categoras tomen forma de nmeros. Ejemplos de este tipo de variables son las escalas de clasificacin, como la escala Apgar (usada para evaluar la salud de un nio recin nacido) o la escala de Mercalli para medir la intensidad de los temblores, etc.

    En muchos casos, las escalas de clasificacin requieren la completacin de un cuestionario, el que usualmente requiere de juicios subjetivos, y/o la eleccin entre categoras cuyo lmite es confuso. Por ejemplo muy bueno y bueno o totalmente de acuerdo y de acuerdo. Entonces, los datos provenientes de estas escalas no son exactamente mediciones, por lo que son datos ordinales numricos.

    Ejemplo. El test de Apgar es un test que se realiza a un nio recin nacido para evaluar su estado general de salud. La siguiente tabla muestra los parmetros en que se basa el test y las puntuaciones que se asignan en el Test de Apgar.

    Signo 0 1 2

    Frecuencia cardiaca (pulsaciones/minuto) Ausente 100

    Esfuerzo respiratorio Ausente Lento, irregular Bueno, llora

    Tono muscular Laxo de extremidades Cierta flexin Movimiento activo

    Respuesta a sonda nasal (luego_de limpiar

    rea_ORL) Sin respuesta Mueca Tose o estornuda

    Color Azulado, plido Cuerpo rosado, extremidades

    azuladas

    Completamente rosado

    La suma de los puntos obtenidos en los cinco parmetros es el valor que tiene el test Apgar del recin nacido.

    Si el test arroja un valor mayor que 7 (8, 9 10) indica que el nio presenta buen estado general de salud. Luego, segn va bajando de 7, significa que su estado es menos bueno.

    En consecuencia, el resultado del test Apgar es un nmero que puede ser 0, 1, 2,... , 10, por lo que los datos resultantes son de tipo ordinal numrico, ya que el hecho de que un recin nacido tenga Apgar 10 no significa que es el doble ms saludable que uno con Apgar 5; es decir, no se pueden realizar operaciones aritmticas con estos valores.

  • 14

    En resumen, variables ordinales pueden tomar tanto valores no numricos como numricos y, en ambos casos, existe un orden natural entre ellos. Sin embargo, en el caso numrico no es posible realizar sumas, multiplicaciones, etc.

    Variable cuantitativa

    Una variable se dice cuantitativa si datos numricos (tambin llamados mtricos) son usados para medir su valor. Diremos que los datos son numricos si:

    estos consisten en valores especficamente definidos, tales como 15C, 25C, 3100 cm, 29 cm, 11 cm, 3kg, 1,7kg, 8,2kg, etc.

    y si x, z, x+h, z+h son datos, entonces z x = (z+h) (x+h). Esta ltima propiedad es una diferencia fundamental que existe entre datos ordinales numricos y datos numricos o mtricos. Recordemos que en el ejemplo del Test de Apgar esta propiedad no se cumpla, ya que la diferencia entre un puntaje de 5 con uno de 10 no era necesariamente lo mismo que la diferencia entre un puntaje de 3 con uno de 8.

    Por ejemplo, la temperatura, el peso, la altura, el nmero de hijos, son variables numricas o mtricas.

    Datos numricos son nmeros reales. Es decir, que pertenecen al conjunto de los nmeros reales y, por lo tanto, las operaciones aritmticas (suma, resta, multiplicacin y divisin) son vlidas con este tipo de datos. Tambin, es posible calcular el promedio u otras medidas numricas cuando se dispone de datos mtricos. Por ejemplo, se puede calcular la altura promedio de dos alumnos que miden 1,68 m y 1,72 m, sumando y luego dividiendo por dos (se obtiene 1,70 m).

    Variables cuantitativas tienen unidades de medida lo que no ocurra con variables nominales y ordinales, por ejemplo, el peso se mide en mg, gr, kg, etc.; la altura se mide en cm, m, etc.; la temperatura se mide en grados Celsius, etc. Tambin el conteo de objetos o cosas son variables cuantitativas, por ejemplo, el nmero de hijos, el nmero de ratones con Hanta virus en Chile, etc.

    Ejemplo. Consideremos el rea (en cm2) de 5 tringulos

    Tringulo 1 2 3 4 5

    rea (cm2) 40 50 55 70 80

  • 15

    En este caso la diferencia entre el primer y el segundo tringulo es exactamente la misma que la diferencia entre el cuarto y el quinto. En otras palabras si x = 40, z = 50 y h = 30, entonces z x = (z + h) (x + h).

    Tambin, vemos que el rea de 80 cm2 es exactamente el doble que el rea de 40 cm2, y podemos sumar el rea de los cinco tringulos y, luego, dividir por cinco para obtener el rea promedio de estos. En otras palabras, podemos usar todas las operaciones aritmticas con estos datos numricos.

    En resumen las variables cuantitativas son medidas con datos que constan de nmeros reales (que pertenecen al conjunto de los nmeros reales), a los cuales se les pueden aplicar todas las operaciones algebraicas vlidas con este tipo de nmeros. Por esta razn, existe una amplia gama de mtodos para presentar, resumir y analizar variables cuantitativas, como lo veremos ms adelante.

    Finalmente, las variables cuantitativas siempre tienen asociadas unidades de medida.

    Como vimos anteriormente, las variables cualitativas las podemos subdividir en variables nominales y ordinales, estas ltimas, a su vez, las podemos clasificar en alfabticas y numricas. En el caso de variables cuantitativas tambin existe una subdivisin, clasificndose en discretas y continuas.

    Variables cuantitativas discretas

    Diremos que una variable cuantitativa es discreta si el nmero de posibles valores que asume es un conjunto contable (es decir, es finito o numerable).

    Frecuentemente, provienen de conteo de cosas, tales como nmero de accidentes de trnsito, nmero de fumadores en Chile, nmero de hijos, etc.

    Variables cuantitativas continuas

    Diremos que una variable cuantitativa es continua si el conjunto de posibles valores que asume es un conjunto no contable. Por ejemplo, la edad de una persona es una variable continua, aunque pareciera ser discreta porque uno aproxima su edad a lo aos que tiene, y no contabiliza los meses, das, minutos, segundos, etc. Usualmente, variables continuas provienen de mediciones de cosas, por ejemplo, peso, altura, tiempo, volumen, temperatura, presin, etc.

  • 16

    El siguiente diagrama esquematiza lo que hemos visto en esta seccin.

    Tipos de Variables

    Cualitativas Cuantitativas

    Nominales (Categoras)

    Ordinales Discretas (Nmeros)

    Continuas (Nmeros)

    Alfabticas (categoras)

    Numricas (nmeros)

    No hay un orden Inherente en las

    categoras

    Hay un orden natural entre las categoras o

    entre los nmeros

    Asociadas a conteo de cosas

    Asociadas a mediciones

    de cosas

    Las operaciones algebraicas no son validas Las operaciones algebraicas son validas

  • 17

    Como dijimos anteriormente, es importante poder establecer el tipo de variables con los cuales se est trabajando ya que los mtodos de anlisis dependern del tipo de sta. De igual manera es importante observar la forma en que se presentan los datos, pues su anlisis tambin depender de esa presentacin. Datos a granel Se muestran uno a uno todos los datos. Por ejemplo, la edad en meses de 116 estudiantes que ingresan a 1er nivel medio de educacin para adultos.

    474 552 599 304 547 362 554 305 423 536 557 564 608 682 445 739 462 366 221 454 522 500 329 485 253 720 443 255 462 392 255 460 221 453 453 646 552 588 574 220 264 204 582 474 446 418 445 462 354 520 606 577 517 545 427 520 459 385 277 405 522 412 539 456 702 383 483 605 413 390 338 331 459 252 564 409 375 496 432 767 254 640 220 344 564 384 396 443 278 542 542 505 432 300 352 649 587 304 516 349 363 570 651 447 327 256 578 475 396 325 544 539 355 540 508 589

    Por ejemplo, el nmero 304 significa que un estudiante tiene 25 aos y 4 meses. En este caso la variable considerada (edad) es cuantitativa continua (el tiempo se midi en meses como una forma de aproximacin a la edad exacta). Datos en tabla de frecuencia Se muestran los datos en una tabla, donde aparece el dato con su respectiva frecuencia (nmero de veces que se repite). Por ejemplo, la tabla siguiente muestra los resultados de una consulta que se realiz en un colegio de Buin sobre el nmero de hermanos que tena cada alumno.

    Nmero de hermanos Frecuencia

    0 55 1 221 2 167 3 95 4 42 5 8 6 2 7 1

    Total 591

    Cmo pueden presentarse los datos?

  • 18

    Por ejemplo, el nmero 221 significa que hubo 221 alumnos que declararon que tenan 1 hermano. En este caso la variable considerada, nmero de hermanos, es cuantitativa discreta. En muchas ocasiones, al lado de la columna frecuencia, aparece la columna frecuencia relativa (que es la frecuencia dividida por el total) y tambin la columna frecuencia relativa porcentual (que es la frecuencia relativa multiplicada por 100%). Por ejemplo, en la fila 3, la frecuencia relativa y la relativa porcentual seran 167/591 y (167/591)*100%, respectivamente.

    Nmero de hermanos Frecuencia

    Frecuencia relativa

    Frecuencia relativa

    porcentual

    0 55 093,059155 = 9,3%

    1 221 374,0591221 = 37,4%

    2 167 283,0591167 = 28,3%

    3 95 161,059195 = 16,1%

    4 42 071,059142 = 7,1%

    5 8 013,05918 = 1,3%

    6 2 003,05912 = 0,3%

    7 1 002,05911 = 0,2%

    Total 591 1 100% Datos en un diagrama de tallo y hoja Se muestran los datos a travs de un diagrama que permite mayor simplicidad para su anlisis. Por ejemplo, los consumos mensuales de gas de caera (medida en metros cbicos), entre el 1 de diciembre de 1998 y el 30 de noviembre de 2001, de un cierto hogar de Santiago, se muestran en el diagrama de tallo y hoja siguiente. En este caso el tallo representa la decena y las hojas las unidades.

  • 19

    Tallos Hojas 1 9 2 8 2 4 0 8 3 0 1 2 6 8 2 7 8 9 5 0 5 4 7 5 7 7 3 9 7 6 6 7 0 5 6 4 0 8 7 9 7 10 5 7 8 3

    Por ejemplo, la fila significa que tenemos los datos 28, 22, 24, 20 y 28.

    Tambin, la fila significa que tenemos los datos 105, 107, 108 y 103. En

    el caso de la fila significa que no hay datos de la forma sesenta y algo. No

    significa que se tiene el dato 60.

    En este ejemplo, la variable considerada (consumo de gas) es cuantitativa continua. Datos agrupados Se muestran los datos en una tabla donde aparece el nmero de datos que se encuentran en un intervalo determinado, pero no se sabe exactamente cuales son los datos. Ejemplo. los siguientes datos son puntajes de matemtica de la prueba SIMCE 2001, en establecimientos de la zona norte del pas.

    Intervalo Frecuencia

    [190 210[ 10

    [210 230[ 55

    [230 250[ 40

    [250 270[ 26

    [270 290[ 26

    [290 310[ 20

    [310 330[ 14

    [330 350] 9

    Total 200

  • 20

    Ac, por ejemplo, la frecuencia 10 significa que hay 10 datos que son mayores o iguales a 190 (por esto el smbolo [ antes del 190) y menores que 210 (por esto el smbolo [ despus del 210), pero no se sabe el valor exacto de cada uno de los 10 datos. Tambin, en la penltima fila de la tabla, la frecuencia 9 significa que hay 9 datos que son mayores o iguales a 330 y menores o iguales que 350. Datos en un grfico Se muestran los datos en una representacin grfica. Esta representacin permite observar rpidamente patrones de comportamiento de los datos. Es comn (pero no excluyente de otras formas) que grficos de barras se usen tanto para variables cualitativas como cuantitativas. Tambin, grficos de torta son ms comunes en datos cualitativos y grficos de lnea en datos cuantitativos con alguna base cronolgica. Finalmente el histograma es un grfico particular de barras que se usa para datos cuantitativos (agrupados). Grficos de barras Si los datos son cualitativos y en un nmero suficientemente pequeo de categoras (lo cual a menudo significar no numrico), entonces, un grfico de barras es apropiado. No hay una regla para el nmero mximo de categoras que puedan ser representadas en un grfico de barras; no obstante, construir demasiadas categoras no ayudar al propsito de proveer informacin efectiva. Los grficos de barras pueden ser simples, mostrando slo una variable, o mltiples, mostrando varias variables. No obstante, graficar demasiadas variables en un mismo diagrama, probablemente confundir la informacin que pudiere obtenerse del grfico de barras, esto es, dar un cuadro claro de las caractersticas esenciales de los datos. Convencionalmente, un grfico de barras tiene la frecuencia o frecuencia relativa porcentual (porcentaje) en el eje vertical y las categoras en el eje horizontal. Se dibuja una barra por cada categora con una altura igual a su frecuencia o frecuencia relativa porcentual; todas las barras tienen la misma longitud en su base, y todas las barras estn separadas por espacios iguales. La longitud de la base y la divisin en espacios son asuntos de eleccin (restringidos, por supuesto, por el tamao de la pgina), y el nmero de categoras que un grfico de barras puede exhibir, est limitado por la misma consideracin. Ejemplo. Grfico de barras que muestra los resultados de una encuesta realizada a 400 personas mayores de 18 aos pertenecientes a los grupos ABC1 y C2 de la Regin Metropolitana sobre Tiempo Libre, una de las preguntas realizada fue Cuntas veces ha ido al cine el ltimo mes?

  • 21

    Cuntas veces ha ido al cine el ltimo mes?

    112

    48

    12

    204

    8 16

    0

    50

    100

    150

    200

    250

    Una vez Dos veces Tres o msveces

    Ninguna No le gusta Ns/Nr

    El valor 48 sobre la barra asociada a dos veces significa que hubo 48 personas que han ido dos veces al cine en el ltimo mes. Mismo grfico anterior, pero ahora con barras horizontales.

    Cuntas veces ha ido al cine el ltimo mes

    112

    48

    12

    204

    8

    16

    0 50 100 150 200 250

    Una vez

    Dos veces

    Tres o ms veces

    Ninguna

    No le gusta

    Ns/Nr

  • 22

    Ejemplo. Resultados de la encuesta realizada por la Cmara Chilena del Libro acerca de las razones para comprar libros.

    Razones para comprar libros

    60,56

    15,0717,62

    4,821,93

    60,03

    12,7316,96

    6,621,66

    0

    10

    20

    30

    40

    50

    60

    70

    Cultura General Ayuda a Capacitarse Aumento deConocimiento

    satisfaccin Personal Otros

    Razones

    %

    HombresMujeres

    Las dos barras sobre la opcin Cultura General, significa que el 60,56% de los hombres y el 60,03% de las mujeres compran libros por cultura general. Ejemplo. Los datos siguientes corresponden a puntos de rating promedio hogar, desde 1 de marzo al 5 de noviembre 2003. Fuente, El Mercurio de Santiago, 09 de noviembre de 2003. Cabe recordar que el sistema a travs del cual se mide este tipo de rating es el People Meter. El principal objetivo del People Meter es la medicin de una muestra de audiencia televisiva, con el objeto de estimar indicadores de rating en toda la poblacin. El tamao la muestra es del orden de 400 hogares del Gran Santiago, escogidos probabilsticamente. Esta muestra de hogares representa aproximadamente a 2000 personas. Adems, la muestra de hogares es clasificada de acuerdo al nivel socioeconmico en 4 niveles: Alto (ABC1). Medio Alto (C2). Medio Bajo (C3,) y Bajo (D). Tambin existe otro tipo de caracterizaciones en funcin de otras variables que son de inters para las empresas publicitarias (para ms informacin sobre el People Meter visite el sitio Web www.peoplemeter.cl).

    Teletrece 24 Horas Meganoticias ChilevisinNoticias

    Telediario

    26,3%

    22,3% 11,5%

    9,8% 5,2%

  • 23

    Debemos sealar que en el grfico anterior existen fuertes distorsiones que podran entregar informacin que no es real.

    En primer lugar, la barra asociada a Teletrece tiene un ancho de 2.2 cm, mientras los anchos de todas las otras son iguales a 2.1 cm.

    Adems, si consideramos como punto de referencia la altura de la barra asociada a Telediario (0.5 cm), entonces la altura asociada a la barra Teletrece debera ser 2.53 cm, en lugar de los 4.60 cm que muestra el grfico.

    As, el rea asociada a Teletrece debera ser 5.31 cm2, en lugar de los 10.12 cm2 que muestra el grfico anterior. Es decir, el rea correspondiente a la barra de Teletrece es un 97% ms grande de lo que debera ser.

    Histograma El histograma es un grfico de barras particular. Se usa habitualmente para representar grficamente variables continuas, cuyos valores se agrupan en intervalos. En este grfico las barras son contiguas (pegadas) y la altura de cada barra es proporcional a la frecuencia relativa porcentual del respectivo intervalo. La altura de la barra es la frecuencia relativa porcentual del intervalo, dividida por el largo de su base. As, el rea de esa barra corresponde exactamente a la frecuencia relativa porcentual del respectivo intervalo. De esta forma, la suma de las reas de todas las barras es 100%. En algunos casos en lugar de frecuencia relativa porcentual se usa frecuencia relativa o simplemente frecuencia. Ejemplo. El grfico siguiente representa el histograma para los datos del ejemplo sobre los 200 puntajes de matemticas en la prueba SINCE 2001, en establecimientos de la zona norte del pas.

    5%

    27,50%

    20%

    13% 13%10%

    7%4,50%

    0%

    5%

    10%

    15%

    20%

    25%

    30%

    [190-210[ [210-230[ [230-250[ [250-270[ [270-290[ [290-310[ [310-330[ [330-350[

  • 24

    As, la barra sobre el intervalo [190-210[ tiene rea correspondiente al 5% del rea total del grfico. En efecto, para este caso tenemos que la frecuencia es 10, por lo que la frecuencia

    relativa es 05,0591167 = y la frecuencia relativa porcentual, entonces, corresponde a %5%10005,0 = .

    Luego, dado que la medida de la base del intervalo es 20, entonces la altura de esta barra debe ser

    25,0205 = para que el rea sea exactamente 5%.

    Grficos de torta Los grficos de torta proporcionan una alternativa para el grfico simple de barra y una de sus ventajas es que resultan familiares para la mayora de los lectores. El ngulo en el centro de cada tajada de la torta (de un ngulo total de 360) es igual a la frecuencia de su categora respectiva, comparada con la frecuencia total. Es decir. se obtiene al multiplicar 360 por la frecuencia relativa de la categora que se desea representar. Ejemplo. El siguiente grfico de torta ilustra algunas de las opiniones que tienen los residentes de la Regin Metropolitana respecto de la situacin actual que exhibe el funcionamiento del sistema de trasporte pblico Transantiago.

    Que es lo peor del Transantiago?

    40,70%

    20,30%

    17%

    16,70%

    5,30%

    La frecuenciaLos recorridos

    Que van llenasMuchos transbordosOtro

    Por ejemplo, para encontrar el ngulo asociado a debemos multiplicar la frecuencia relativa asociada a esta categora por 360. En consecuencia, el ngulo asociado a la categora los recorridos es 0,203 360 = 73,08.

  • 25

    Los grficos de torta y los grficos de barra son maneras efectivas de ilustrar las caractersticas de mayor importancia de los datos muestrales y la eleccin de ellos es a menudo subjetiva. Sin embargo, un grfico de torta puede ser ms apropiado si el propsito es comparar la frecuencia de cada categora con la frecuencia total, en vez de compararla con la frecuencia de otra categora. En el caso de comparacin entre frecuencias, podra preferirse un grfico de barras. La limitacin principal de un grfico de torta es que puede representar solamente una variable, aunque desde luego, varios grficos de torta pueden ser usados para representar varias variables. Ejemplo. El siguiente grfico de torta representa los resultados de la encuesta realizada por la Cmara Chilena del Libro acerca de las razones para comprar libros.

    Hombres

    60,56%15,07%

    17,62%

    4,82%1,93%

    Cultura General

    Ayuda a Capacitarse

    Aumento de Conocimiento

    Satisfaccin Personal

    Otros

    Mujeres

    62,03%12,73%

    16,96%

    6,62% 1,66%

    Cultura General

    Ayuda a Capacitarse

    Aumento de Conocimiento

    Satisfaccin Personal

    Otros

    En resumen, los grficos de torta son una alternativa frente a los grficos de barras y son bastante simples de realizar. El tamao, es decir, el dimetro de un grfico de torta es arbitrario. Tambin, el ngulo de cada tajada de la torta es proporcional a la frecuencia de la clase (o categora) correspondiente en la distribucin de frecuencias. Finalmente, como dijimos anteriormente, cada grfico de torta puede mostrar solamente una variable.

  • 26

    Grficos de Lnea

    Los grficos de lnea son usados comnmente como una forma de exhibir datos, particularmente si los datos tienen una base cronolgica, es decir, si los datos consisten en mediciones regulares en el tiempo, digamos cada minuto, da, semana, ao, etc. Es comn anotar el tiempo en el eje horizontal y la frecuencia de una o ms categoras en el eje vertical.

    Ejemplo. El siguiente grfico corresponde a las toneladas de locos (aproximadas) extradas en el litoral chileno entre los aos 1950 y 1990.

    Ejemplo. Tasas brutas de natalidad y mortalidad (por mil) en Chile, en el perodo 1900-2000.

    Ao 1900 1910 1920 1930 1940 1950 1960 1970 1980 1990 2000

    Natalidad 38.4 39.5 39.4 39.8 36.4 31.0 37.5 26.4 22.2 23.3 18.3

    Mortalidad 31.5 30.7 31.0 24.7 21.3 15.0 12.5 8.7 6.6 6.0 5.4 Por ejemplo, en el ao 1970 la tasa de mortalidad fue de 8,7 y la de natalidad 26,4.

  • 27

    Datos en un diagrama de puntos Los datos se muestran a travs de un grfico de puntos (pares ordenados), donde la abscisa representa el dato y la ordenada su frecuencia. Por ejemplo, el grfico siguiente representa el nmero de hijos de profesores de matemticas participantes de un curso de perfeccionamiento.

    0

    5

    10

    15

    20

    25

    0 1 2 3 4 5 6

    Para una mejor visualizacin es comn unir con una lnea el punto con el eje de las abscisas. Por ejemplo, el par (0,10) significa que 10 profesores (del total de 51) no tienen hijos. En este caso, la variable considerada es cuantitativa discreta.

  • 28

    Las medidas de resumen que se utilizan comnmente para describir, en alguna forma, el centro de un conjunto de datos son: La moda El promedio (tambin conocido como media aritmtica o simplemente media) La mediana Cada una de estas medidas representa la idea de centro en diferentes formas y, la eleccin y clculo de estas, en cualquier conjunto de datos, depender de al menos tres factores. Los aspectos de la localizacin central que se pretende capturar. El tipo de datos de que se dispone, o sea, si los datos son nominales, ordinales o numricos. La forma como se representan los datos, es decir, si los datos se representan en una tabla de

    frecuencia, agrupados, en un grfico, etc. Es preciso mencionar nuevamente que la utilizacin de un slo valor para representar un conjunto de datos es una drstica reduccin de estos. En general este valor contiene muy poca informacin sobre el comportamiento de los datos. La Moda La moda interpreta el significado de centro como el dato que ms se repite. Ejemplo. Al lanzar 10 veces dos dados honestos y observar, en cada lanzamiento, la suma de las pintas de los dados, se obtuvieron los siguientes resultados.

    8, 2, 8, 7, 11, 8, 10, 5, 11, 8.

    Entonces la moda es el dato 8 (es el que ms se repite, se repite 4 veces). Ejemplo. Las notas de matemtica de Pedro durante el primer semestre 2008 fueron:

    6,2 5,1 6,2 4,6 5,9 4,6 6,2 5,5 4,6.

    Medidas de tendencia central

  • 29

    Par este conjunto de datos existen dos modas, las que corresponden a las notas 4,6 y 6,2 (cada nota se repite 3 veces). Ejemplo. La tabla siguiente muestra los resultados, en el 1er nivel medio de educacin para adultos de un establecimiento educacional, sobre una consulta que se realiz acerca del nmero de hijos que tena cada estudiante.

    Nmero de hijos Frecuencia

    0 22

    1 56

    2 82

    3 16

    4 9

    Total 185 Para estos datos la moda es el dato 2 (es el que ms se repite, 82 veces). Ejemplo. La tabla siguiente muestra los ingresos mensuales (en miles de pesos) de 80 familias de cierta comuna de Santiago.

    Intervalo Frecuencia

    [159 189[ 3

    [189 219[ 8

    [219 249[ 12

    [249 279[ 16

    [279 309[ 21

    [309 339[ 11

    [339 369] 9

    Total 80 En este caso no conocemos exactamente cules son los datos (el ingreso mensual de cada una de las 80 familias). Para suplir este desconocimiento, supondremos que los datos que pertenecen a un intervalo, son todos iguales al punto medio de ste. Por ejemplo, supondremos que los 3 datos que pertenecen al intervalo [159 189[, son iguales a 174 (que es el punto medio entre 159 y 189). De esta forma obtenemos los siguientes datos ficticios (presentados en una tabla de frecuencia).

  • 30

    Punto Medio Frecuencia 174 3 204 8 234 12 264 16 294 21 324 11 354 9

    Total 80 En consecuencia, la moda es 294 (es el dato que ms se repite, se repite 21 veces). Notar que la moda corresponde al punto medio del intervalo con mayor frecuencia. Ejemplo. Los estudiantes de segundo nivel medio de adultos de un establecimiento educacional deben optar a los diversos talleres de oficio que ofrece la institucin. Para tal efecto, se consulta acerca de cul de los siguientes talleres escogeran: soldadura, instalador elctrico, carpintero mueblista, manipulador de alimentos, artesano textil. Los resultados se muestran en la siguiente tabla.

    Taller Preferido Nmero de alumnos soldadura 18

    instalador elctrico 9 carpintero mueblista 13

    manipulador de alimentos 11 artesano textil 9

    Total 60 Para estos datos la moda es el dato (categora) soldadura (es el dato que ms se repite, se repite 18 veces). Ejemplo. La tabla siguiente muestra los ndices de calidad del aire en la comuna de Pudahuel, durante todo el mes de agosto de 1999, medidos cada una hora.

    Calidad del aire Frecuencia Peligroso 3

    Crtico 9 Malo 36

    Regular 173 Bueno 503 Total 724

  • 31

    En este caso la moda es el dato (categora) Bueno. Este dato es el que ms se repite, se repite 503 veces. Ejemplo. El siguiente grfico de torta representa una muestra de personas afiliados a cuatro AFP.

    22%

    24%

    5%

    49%

    AFP 1

    AFP 2

    AFP 3

    AFP 4

    Para estos datos la moda es la categora AFP 4. Esta categora (dato) es la que ms se repite, ya que tiene el ms alto porcentaje de afiliados (48,5%). Ejemplo. Se simulan 1000 lanzamientos de un dado junto a una moneda (ambos honestos). Los resultados se muestran en el grfico de barras siguiente.

    2000 LANZAMIENTOS

    0

    2

    4

    6

    8

    10

    12

    1C 1S 2C 2S 3C 3S 4C 4S 5C 5S 6C 6S

    Resultados

    Frec

    uenc

    ia R

    elat

    iva

    Porc

    entu

    al

    La notacin, por ejemplo, 1C, significa que en el dado sale el nmero 1 y en la moneda sale cara. En este caso la moda es el resultado 2S, pues es el dato que ms se repite, ya que tiene la mayor frecuencia relativa porcentual (es la barra ms alta). Cabe mencionar que los datos en este caso son las categoras 1C, 1S, 2C, , etc.

  • 32

    Observaciones - La moda es una medida de tendencia central que puede calcularse en cualquier tipo de datos (cosa que no ocurrir con las otras medidas que veremos ms adelante). - La moda no necesariamente es nica (como se vio en ejemplos anteriores).

    El Promedio (o media aritmtica) El promedio es una de las medidas de tendencia central ms comnmente usada. Si disponemos de n datos, entonces el promedio es el valor que se obtiene al sumar todos los datos y luego dividir sta suma por n. Es comn anotar X para simbolizar el promedio. Observacin Para calcular el promedio de un conjunto de datos es necesario, como dijimos anteriormente, sumar los datos. Por esta razn, el promedio no se puede calcular cuando tenemos datos que provienen de variables cualitativas, pues en este caso, las operaciones algebraicas (por ejemplo, suma) no son vlidas. Ejemplo. Un comerciante tiene cuatro mallas de papas. La malla A tiene 25 kg, la malla B 13 kg, la malla C 48 kg, y la malla D tiene 34 kg. Si el comerciante decide repartir las papas de modo que todas las mallas queden con igual peso, cunto pesarn las mallas despus de la reparticin?

    Algunas posibles reparticiones

    Malla A Malla B Malla C Malla D

    17 Kg

    1 Kg

    4 Kg

    Malla A Malla B Malla C Malla D

    13 Kg

    5 Kg

    4 Kg

  • 33

    En ambos casos cada malla ahora pesar 30 kg. Notar que 30 kg corresponde al promedio de los datos 25kg, 13kg, 48kg, 34kg. En este sentido decimos que esas mallas de papas pesan en promedio 30 kg. Ejemplo. Juan obtuvo en matemticas, durante el primer semestre de 2008, las siguientes notas:

    5,8 6,2 5,3 4,4 6,6 4,1. Entonces el promedio de las notas de Juan en el primer semestre de 2008 fue:

    4,56

    1,46,64,43,52,68,5x =+++++= .

    Esto es, 5,4 es un representante de las notas de Juan. En este mismo sentido, cuando un docente informa que su curso, tuvo promedio 5,6 en matemticas, est nombrando al representante del curso, no dice la nota de cada uno de sus alumnos. Cul es la suma de los errores de representacin en las notas de Juan? Se llama error de representacin de un dato a la diferencia entre el dato y el promedio. Para el caso de las notas de Juan, los errores de representacin son: 5,8 5,4 = 0,4 4,4 5,4 = -1,0 6,2 5,4 = 0,8 6,6 5,4 = 1,2 5,3 5,4 = -0,1 4,1 5,4 = -1,3 En consecuencia, la suma de los errores de representacin de las notas de Juan es:

    0,4 + 0,8 + (-0,1) + (-1,0) + 1,2 + (-1,3) = 0. En el caso de las mallas de papas, los errores de representacin son: 25kg 30kg = 5kg 48kg 30kg = 18kg 13kg 30kg = 17kg 34kg 30kg = 4kg As, la suma de los errores de representacin en la malla de papas es:

    5kg + (17kg) + 18kg + 4kg = 0kg.

  • 34

    Ser siempre verdad que la suma de los errores de representacin es igual a cero? Sean n1 x,...,x , n datos. Entonces la suma de los errores de representacin es cero. Para evitar abstraccin, asumimos que n =3, la demostracin general es totalmente anloga. Datos: 321 ,, xxx

    Promedio: 3

    xxxx 321

    ++= Errores de representacin: ( )xx 1 ( )xx 2 ( )xx 3 Suma de errores de representacin: xxxxxx 321 ++= ( ) x3xxx 321 ++=

    ( )

    ++++=3

    xxx3xxx 321321

    ( ) ( )321321 xxxxxx ++++= 0= Ejemplo. La tabla siguiente muestra el nmero de personas que viven en cada uno de los 16 departamentos de un edificio de 4 pisos.

    N de personas Cantidad de deptos. 1 1 2 3 3 2 4 7 5 2

    Total 16 Entonces el nmero promedio de personas que viven por departamento ser igual al nmero total de personas que viven en el edificio, dividido por 16. El promedio en este caso puede ser interpretado de la siguiente forma:

  • 35

    Las personas se reparten en los 16 departamentos de modo que cada uno de los departamentos quede con la misma cantidad de personas. Cul es el total de personas que viven en el edificio? Hay 1 departamento en el cual vive 1 persona. Hay 3 departamentos, en cada uno de los cuales viven 2 personas, luego en estos 3

    departamentos viven en total 6 personas. Hay 2 departamentos, en cada uno de los cuales viven 3 personas, luego en estos 2

    departamentos viven en total 6 personas. Hay 7 departamentos, en cada uno de los cuales viven 4 personas, luego en estos 7

    departamentos viven en total 28 personas. Hay 2 departamentos, en cada uno de los cuales viven 5 personas, luego en estos 2

    departamentos viven en total 10 personas. Por lo tanto, el total de personas que vive en el edificio es:

    512574233211 =++++ . En consecuencia, el nmero promedio de personas que viven por departamento es igual a

    1875,31651x == .

    El valor 1875,3x = se interpreta en el sentido que cada departamento quedar con aproximadamente 3 personas. Por ejemplo: 13 departamentos, cada uno con 3 personas. 3 departamentos, cada uno con 4 personas. Ejemplo. Las notas de un curso de 40 alumnos se muestran en la siguiente tabla:

    Notas Frecuencia [1,0 2,0[ 0 [2,0 3,0[ 3 [3,0 4,0[ 7 [4,0 5,0[ 10 [5,0 6,0[ 15 [6,0 7,0] 5

    Total 40

  • 36

    Si deseamos calcular el promedio, tendramos que sumar las notas de los 40 alumnos. El problema es que no conocemos exactamente cuales son las notas (slo sabemos cuantas notas hay en cada intervalo). Para suplir este desconocimiento, usamos el mismo argumento descrito en el clculo de la moda para el caso del ingreso mensual de cada una de 80 familias. En este caso obtenemos la tabla de frecuencia:

    Punto Medio Frecuencia 1,5 0 2,5 3 3,5 7 4,5 10 5,5 15 6,5 5

    Total 40 Ahora, usando el mismo procedimiento descrito en el ejemplo anterior, obtenemos que:

    4055,6155,5105,475,335,205,1x +++++= ,

    esto es, 8,4x = . Si conociramos exactamente las 40 notas, el promedio sera, seguramente, diferente (pero parecido). La razn de la posible discrepancia es que el clculo que hacemos a travs de los puntos medios es una aproximacin (por el desconocimiento de los datos exactos). Ejemplo. Una prueba de matemtica la rindieron 30 alumnos, obteniendo promedio 4,6. Seis alumnos rindieron la prueba posteriormente (faltaron el da de la prueba), obteniendo promedio 3,5. Cul es la nota promedio de la prueba finalmente? Como son 36 alumnos en el curso, debemos sumar sus notas y dividir por 36. Como el promedio de los 30 alumnos que rindieron la prueba inicialmente es 4,6, entonces

    30alumnos30losdenotaslasdesuma6,4 = .

    O sea, alumnos30losdenotaslasdesuma306,4 = . Anlogamente, retrasadosalumnos6losdenotaslasdesuma65,3 = .

  • 37

    As, alumnos36losdenotaslasdesuma65,3306,4 =+ .

    Por lo tanto,

    36

    65,3306,4x += , esto es,

    3665,3

    36306,4x += = 4,4.

    En el caso en que la prueba la hubiesen rendido inicialmente 18 alumnos y los que faltaron hubiesen sido 18, entonces

    36

    185,3186,4x += . O sea,

    36185,3

    36186,4x += ,

    por lo que

    215,3

    216,4x += .

    En consecuencia, slo en este caso se tendra que:

    1,42

    5,36,4x =+= . La Mediana La mediana identifica el valor central de un conjunto de datos. O sea, aproximadamente la mitad (50%) de los datos ser igual o menor que la mediana y la otra mitad ser igual o mayor que sta. Observacin Para identificar el valor central, debemos ordenar los datos en forma creciente. Adems, en el caso de haber dos valores centrales, estos debern ser promediados. En consecuencia, la mediana no se puede calcular cuando tenemos datos que provienen de variables cualitativas.

  • 38

    Ejemplo. Pedro tiene 5 notas en la asignatura de matemticas y Diego 6. Las notas son las siguientes:

    Pedro 6,1 4,2 5,4 5,7 3,1 Diego 4,3 4,8 6,6 4,6 3,4 5,7

    Ordenando los datos de menor a mayor se obtiene:

    Pedro 3,1 4,2 5,4 5,7 6,1 Diego 3,4 4,3 4,6 4,8 5,7 6,6

    Para Pedro, el centro est en el tercer lugar, por lo que el valor central, o sea la mediana, corresponde al valor 5,4. Para Diego, hay dos centros, ubicados en los lugares tercero y cuarto. Por lo tanto la mediana corresponde al promedio entre los valores 4,6 y 4,8. Esto es, la mediana es igual 4,7. Cabe mencionar que el promedio de notas tanto para Pedro como para Diego es igual a 4,9. En general, si el nmero de datos es impar, se obtendr un nico centro, mientras que en el caso en que el nmero de datos sea par, habr dos centros. Cmo obtener el lugar donde est(n) el(los) centro(s)?. Se calcula el valor (n de datos + 1) 0,5. Si este nmero es entero (cosa que ocurrir cuando el nmero de datos sea impar), entonces el centro est en el lugar (n de datos + 1) 0,5. Si no fuese entero (cosa que ocurrir cuando n sea par), los centros estarn en los lugares [(n de datos + 1) 0,5] y su sucesor, donde [(n de datos + 1) 0,5] representa la parte entera del nmero (n de datos + 1) 0,5. Ejemplo. La tabla siguiente muestra el nmero de calzado de 36 estudiantes que cursan 2do nivel medio de adultos.

    N de calzado Frecuencia 37 4 38 3 39 4 40 8 41 6 42 6 43 5

    Total 36

  • 39

    Encontremos la mediana para estos datos. Primeramente, como el nmero de datos es 36, entonces:

    (n de datos + 1) 0,5 = (36 + 1) 0,5 = 18,5.

    As, los centros estn ubicados en los lugares 18 y 19. Ordenemos de menor a mayor los 36 datos. Posiciones 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18datos 37 37 37 37 38 38 38 39 39 39 39 40 40 40 40 40 40 40 Posiciones 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36datos 40 41 41 41 41 41 41 42 42 42 42 42 42 43 43 43 43 43 Por lo tanto, el dato ubicado en el lugar 18 es 40 y el dato ubicado en el lugar 19 tambin es 40.

    En consecuencia, la mediana para estos datos es 402

    4040 =+ . Observaciones Para un conjunto de datos existe una nica mediana (no como en el caso de la moda, en que

    pueden haber, dos, tres, etc.). Al igual que en el caso de la moda, la mediana no usa toda la informacin presente en los

    datos, la mediana se calcula usando slo el(los) valor(es) central(es), los otros datos no son usados.

  • 40

    En general, un experimento aleatorio es cualquier experimento cuyo resultado no puede ser predicho con certeza, aunque el resultado sea uno y slo uno, de varios resultados bien definidos. As, no es posible decir por anticipado cul de stos ser.

    Primeramente estudiaremos una serie de experimentos aleatorios relativamente simples, de manera de descubrir alguna ley que los rija.

    Experimentos aleatorios equiprobables Experimento 1: Se lanza una moneda normal y se observa si sale cara o sello. En este caso el resultado no puede ser predicho con certeza, aunque el resultado sea uno y solo uno de los resultados cara; sello.

    Hemos realizado una tirada cuando lanzamos una vez la moneda. Los resultados posibles de una tirada son: sello (0), cara (1). Realizamos 15 tiradas de la moneda, y obtuvimos la secuencia

    1 1 0 1 0 0 1 1 1 0 1 1 0 0 1

    Entonces, en las 15 tiradas, salieron 6 sellos y 9 caras.

    Realizamos, nuevamente, 15 tiradas de la moneda y obtuvimos la secuencia

    0 0 1 0 0 1 0 0 0 0 1 1 0 1 0

    o sea, en este caso salieron 10 sellos y 5 caras.

    Realiza 15 tiradas de una moneda normal, cuntos sellos obtuviste?, cuntas caras? Compara tus resultados con los de alguna otra persona.

    Posiblemente el nmero de caras (y por consecuencia el de sellos) resulte diferente de los conseguidos por nosotros anteriormente.

    Podramos decir entonces, que el nmero de caras que obtenemos al lanzar la moneda 15 veces depende del azar.

    Existir algn patrn o tendencia que siga la proporcin de las caras, o de los sellos, despus de lanzar la moneda 15 veces, 35 veces, 100 veces, o un gran nmero de veces?

    Esta proporcin (que depender del azar) es la que se modela matemticamente. Por esta razn, realizaremos muchas tiradas de la moneda. Como lanzar, por ejemplo, 300 veces la moneda, es un poco lento y engorroso, los lanzamientos se simulan en el computador.

    Las tablas siguientes muestran los resultados obtenidos en una simulacin.

    Modelo de probabilidades de Laplace

  • 41

    Columna uno: Indica el nmero de veces que se tira la moneda.

    Columna dos: Indica el nmero de sellos que se obtuvieron al tirar la moneda la cantidad de veces que indica la columna uno.

    Columna tres: Indica el nmero de caras que se obtuvieron al tirar la moneda la cantidad de veces que indica la columna uno.

    Columna cuatro: Indica la columna dos dividida por la columna uno (a esta proporcin la llamaremos frecuencia relativa del sello y la anotaremos por f0).

    Columna cinco: Indica la columna tres dividida por la columna uno (a esta proporcin la llamaremos frecuencia relativa de la cara, y la anotaremos por f1)

    N de veces que se lanza la

    moneda

    N de veces que ocurre sello

    N de veces que ocurre cara

    Frecuencia Relativa del sello

    ( f0 )

    Frecuencia Relativa de la cara

    ( f1 ) 1 0 1 0,0000 1,0000 2 1 1 0,5000 0,5000 3 1 2 0,3333 0,6667 4 3 1 0,7500 0,2500 5 3 2 0,6000 0,4000 6 6 0 1,0000 0,0000 7 3 4 0,4286 0,5714 8 6 2 0,7500 0,2500 9 7 2 0,7778 0,2222 10 6 4 0,6000 0,4000

    Tabla a)

    Grfico 1: Frecuencia relativa de los sellos obtenidos segn la Tabla a)

  • 42

    La tabla siguiente muestra las frecuencias relativas (tanto para la cara como para el sello) obtenidas al lanzar una moneda el nmero de veces que indica la primera columna.

    N de veces que se lanza la

    moneda

    N de veces que ocurre sello

    N de veces que ocurre cara

    Frecuencia Relativa del sello

    (f0)

    Frecuencia Relativa de la cara

    (f1) 10 5 5 0,5000 0,5000 20 12 8 0,6000 0,4000 30 11 19 0,3667 0,6333 40 18 22 0,4500 0,5500 50 27 23 0,5400 0,4600 60 31 29 0,5167 0,4833 70 31 39 0,4429 0,5571 80 36 44 0,4500 0,5500 90 43 47 0,4778 0,5222 100 40 60 0,4000 0,6000 150 67 83 0,4467 0,5533 200 111 89 0,5550 0,4450 250 136 114 0,5440 0,4560 300 147 153 0,4900 0,5100 350 165 185 0,4714 0,5286 400 205 195 0,5125 0,4875 450 237 213 0,5267 0,4733 500 251 249 0,5020 0,4980 550 255 295 0,4636 0,5364 600 325 275 0,5417 0,4583 650 315 335 0,4846 0,5154 700 359 341 0,5129 0,4871 750 367 383 0,4893 0,5107 800 409 391 0,5113 0,4888 850 408 442 0,4800 0,5200 900 446 454 0,4956 0,5044 950 492 458 0,5179 0,4821 1000 498 502 0,4980 0,5020

    Tabla b)

  • 43

    Grfico 2: Frecuencia relativa de los sellos segn Tabla b)

    De lo anterior, podemos observar que mientras mayor es el numero de tiradas que realizarnos, las

    frecuencias relativas varan muy poco obtenindose que f0 es cercano a 21 que f1 es

    cercano a 21 .

    Como dijimos anteriormente, los resultados posibles al lanzar una moneda son sello (0) y cara (1). Estos elementos forman un conjunto que llamaremos espacio muestral y que se acostumbra escribir con la letra . Al nmero de elementos del conjunto lo anotamos # .

    { }1,0= y 2# =

    Como, por ejemplo, A = {0}, es subconjunto de , entonces A se llamar suceso. En este caso, el suceso A representa el hecho que en la moneda lanzada result sello.

    Las Tablas a) y b) motivan la siguiente definicin de probabilidad para el suceso A= {0}. Que anotamos P(A),

    ( ) == ##5,0 AAP .

    De igual forma, si B es el suceso sali cara al lanzar la moneda, es decir, B = {1}, entonces, se define:

    ( ) == #B#5,0BP .

    Es comn referirse al nmero de elementos de A (o de B) como nmero de casos favorables. Al nmero de elementos de se le conoce como nmero de casos totales o posibles.

  • 44

    Experimento 2: Se lanza un dado honesto y se observa su cara superior. Al igual que en el Experimento 1, diremos que hemos realizado una tirada cuando lanzamos una vez el dado. Los resultados posibles de una tirada son: 1, 2, 3, 4, 5, 6. Realizamos 20 tiradas del dado y obtuvimos los siguientes resultados:

    en 5 ocasiones sali uno, en 1 ocasin sali dos, en 2 ocasiones sali tres, en 3 ocasiones sali cuatro, en 4 ocasiones sali cinco, en 5 ocasiones sali seis.

    Realizamos nuevamente, 20 tiradas del dado, obtenindose que

    en 3 ocasiones sali uno, en 2 ocasin sali dos, en 6 ocasiones sali tres, en 5 ocasiones sali cuatro, en 4 ocasiones sali cinco, en 0 ocasiones sali seis.

    Realiza 20 tiradas de un dado normal (no cargado), en cuntas ocasiones te sali 1, 2, 3, 4, 5 6? Compara los resultados con otras personas y con los obtenidos por nosotros anteriormente. Con seguridad, los resultados que t obtengas o que obtengan otras personas sern diferentes de los nuestros.

    Podramos decir, nuevamente, que el nmero de veces que obtenemos 1, 2, 3, 4, 5 y 6, al lanzar un dado 20 veces, depende del azar.

    Existir algn patrn o tendencia que siga la proporcin de 1, 2, 3, 4, 5 6, despus lanzar el dado 20 veces. 100 veces, o un gran nmero de veces?.

    Tabla c), muestra los resultados obtenidos en una simulacin.

    Columna uno: Indica el nmero de veces que se tira el dado.

    Columna dos: Indica el nmero de veces que sali uno al tirar el dado la cantidad de veces que indica la columna uno.

    Columna tres: Indica el nmero de veces que sali dos al tirar el dado la cantidad de veces que indica la columna uno.

    Columna cuatro, cinco, seis y siete tienen anloga interpretacin a la columna tres.

  • 45

    N de veces que se lanza

    el dado

    N de veces que sale uno

    N de veces que sale

    dos

    N de veces que sale

    tres

    N de veces que sale cuatro

    N de veces que sale

    cinco

    N de veces que sale

    seis 10 2 2 4 0 0 2 20 2 3 4 4 4 3 30 4 2 6 5 7 6 40 8 9 8 3 9 3 50 7 11 10 5 11 6 60 12 10 10 9 13 6 70 14 16 9 8 14 9 80 15 19 12 10 14 10 90 16 18 12 14 15 15 100 18 21 15 17 16 13 150 24 28 26 22 26 24 200 30 38 31 32 33 36 250 42 45 40 41 39 43

    Tabla c) La primera columna de la tabla siguiente, Tabla d), es la columna dos de la tabla c) dividida por la columna uno de la Tabla c), la llamamos frecuencia relativa del uno, y se anota f1. Anlogas interpretaciones tienen el resto de las columnas de la tabla d).

    Frecuencia Relativa del

    uno (f1)

    Frecuencia Relativa del

    dos (f2)

    Frecuencia Relativa del

    tres (f3)

    Frecuencia Relativa del cuatro (f4)

    Frecuencia Relativa del

    cinco (f5)

    Frecuencia Relativa del

    seis (f6) 0,2000 0,2000 0,4000 0,0000 0,0000 0,2000 0,1000 0,1500 0,2000 0,2000 0,2000 0,1500 0,1333 0,0667 0,2000 0,1667 0,2333 0,2000 0,2000 0,2250 0,2000 0,0750 0,2250 0,0750 0,1400 0,2200 0,2000 0,1000 0,2200 0,1200 0,2000 0,1667 0,1667 0,1500 0,2167 0,1000 0,2000 0,2286 0,1286 0,1143 0,2000 0,1286 0,1875 0,2375 0,1500 0,1250 0,1750 0,1250 0,1778 0,2000 0,1333 0,1556 0,1667 0,1667 0,1800 0,2100 0,1500 0,1700 0,1600 0,1300 0,1600 0,1867 0,1733 0,1467 0,1733 0,1600 0,1500 0,1900 0,1550 0,1600 0,1650 0,1800 0,1640 0,1800 0,1600 0,1640 0,1560 0,1720

    Tabla d)

  • 46

    Nuevamente, podemos observar que mientras mayor es el nmero de tiradas que realizamos, las

    frecuencias relativas varan muy poco, obtenindose que fi es cercano a 61 , para i {1, 2, 3, 4,

    5, 6}.

    Grfico 3: Frecuencia relativa de los unos obtenidos de acuerdo a la Tabla d)

    Grfico 4: Frecuencia relativa de los seis obtenidos segn la Tabla d)

    En este experimento, el espacio muestral resultante es: { }6,5,4,3,2,1= y 6# = . Si Ai = {i}, para i {1, 2, 3, 4, 5, 6}, entonces Ai representa el suceso sali el nmero i al lanzar el dado. La tabla anterior motiva la siguiente definicin de probabilidad para el suceso Ai, que anotamos P(Ai),

    ( )61=iAP

  • 47

    Desde la tabla anterior, tambin podemos observar que la cantidad de veces que sale nmero par, es aproximadamente la mitad de las veces que se tira el dado, lo que motiva la siguiente definicin de probabilidad para el suceso A={2,4,6}, que representa el hecho que sale par al lanzar el dado. ( ) { }( ) { }( ) { }( )642 PPPAP ++=

    ( )61

    61

    61 ++=AP

    =63

    = ## A

    Ms an, se puede verificar, a partir de la tabla anterior, que si A es un suceso cualquiera, esto es, cualquier subconjunto de , entonces la proporcin de veces que ocurre A respecto del total de tiradas del dado, es aproximadamente igual a #

    A# , lo que sugiere la definicin:

    P(A) = { }( )

    AjjP

    = Aj 6

    1

    = A#61

    = ## A

    Cabe sealar que el smbolo se lee sumatoria, y representa la suma de los nmeros que esta indique. En nuestro caso, { }( )

    AjjP , significa que se deben sumar los nmeros { }( )jP , cuando j

    recorre todo el conjunto A.

  • 48

    Experimento 3: Se lanzan tres monedas honestas y se observa si sali cara o sello en cada una de las monedas. Diremos que hemos realizado una tirada cuando lanzamos las tres monedas una vez. Los resultados posibles de una tirada son:

    Moneda 1 Moneda 2 Moneda 3 C C C C C S C S C S C C C S S S C S S S C S S S

    Realizamos ahora 30 tiradas y obtuvimos los siguientes resultados. La ltima columna de la tabla indica el nmero de veces que ocurri el resultado, dividido por 30.

    Resultado Moneda 1

    Moneda 2 Moneda 3 Nmero de veces que ocurri el resultado

    Frecuencia relativa

    C C C 2 0,0667 C C S 3 0,1000 C S C 1 0,0333 S C C 7 0,2333 C S S 6 0,2000 S C S 2 0,0667 S S C 4 0,1333 S S S 5 0,1667

    Tabla e)

    Por ejemplo, en cinco oportunidades las tres monedas resultaron sello.

    Repetir el experimento, pero ahora en lugar de 30 tiradas, hacer 50 tiradas, 100 tiradas y 500 tiradas.

    Los resultados que se obtendrn mostrarn que a medida que aumenta el total de tiradas, las frecuencias relativas comenzarn a variar muy poco, obtenindose que el nmero de veces que

  • 49

    salen tres sellos, dividido por el total de lanzamientos realizados, es aproximadamente igual a 81 .

    Lo mismo ocurre para cualquiera de los otros siete resultados.

    El espacio muestral para este experimento es:

    s)}s,(s,sc),(s,s),c,(s,s),s,(c,c),c,(s,c),s,(c,s),c,(c,c),c,{(c,= y 8# = Si A = {(s, s, s)}, entonces A representa que en las tres monedas sali sello, y definimos:

    P(A) = 81 .

    Similarmente, definimos por 81 a la probabilidad de cualquier suceso con un solo elemento

    (suceso elemental).

    Cul es la probabilidad de que en dos monedas salga cara y en una sello?.

    Si A={(c,c,s), (c,s,c), (s,c,c)}, es decir, A representa el suceso en dos monedas sale cara y en una sello (sin importar en cuales monedas), entonces, definimos

    P(A)= P({(c,c,s)}) + P({(c,s,c)}) + P({(s,c,c)})

    = 81

    81

    81 ++

    = 83

    = ## A .

    Los resultados experimentales deberan indicar que el nmero de veces que en dos monedas sale

    cara y en una sello, es aproximadamente igual a 83 , ms an, experimentalmente se puede

    verificar que si A es cualquier suceso, esto es, A es cualquier subconjunto de , entonces la proporcin de veces que ocurre A, respecto del total de lanzamientos realizados es,

    aproximadamente igual a ## A , lo que motiva la definicin:

    ( ) { }( ) ==== ###

    81

    81 AAaPAP

    AaAa

  • 50

    El Modelo de Laplace y sus propiedades bsicas

    Observemos que los experimentos aleatorios estudiados anteriormente tienen las siguientes caractersticas en comn.

    i) Existe nmero finito (digamos n) de resultados posibles del experimento. Cada resultado lo llamamos suceso elemental. La unin de todos los sucesos elementales es el espacio muestral .

    ii) Todos los sucesos elementales son igualmente probables.

    iii) Todo suceso A es la unin de m sucesos elementales, donde m n. Estas caractersticas motivan la siguiente definicin.

    Definicin. Sea conjunto no vaco, = {a1, a2, . . .,an} y A subconjunto de tal que #A = m. Se define la probabilidad de A, se anota P(A), como:

    posiblescasosdenfavorablescasosden

    nmAAP

    )( ==#

    #= .

    Al par ( ,P), se le conoce como Modelo de Probabilidades de Laplace, tambin llamado Modelo de Probabilidades Equiprobable.

    Este modelo representa la siguiente situacin experimental:

    Se tiene un experimento aleatorio, cuyo conjunto de resultados posibles es , el cual es finito. Cada resultado de es igualmente probable (equiprobable). Algunas propiedades que se desprenden de la definicin del Modelo de Laplace son las siguientes.

    a) Para todo suceso A, 0 P(A) 1. b) P( )= 1 c) P()=0 d) Si A B = , entonces P(A B) = P(A) + P(B). e) Para todo suceso A, P(AC) = 1 P(A) (complemento respecto de ) f) Si A B, entonces P(A) P(B).

  • 51

    Estas afirmaciones se verifican usando las siguientes propiedades de cardinalidad de un conjunto finito.

    #() = 0, #AC = # - #A, #(A B)= #A + #B - # (A B). Otras propiedades complementarias.

    g) Si A y B son sucesos cualquiera, entonces

    P(ABC) = P(A) P(AB) Y

    P(AC B) = P(B) P(AB). h) Si B1, B2,,Bn, forman una particin de B, entonces

    P(B)=P(B1) + P(B2) + + P(Bn).

    Esta propiedad generaliza d), para el caso de n sucesos (n 3). i) Si A y B son sucesos cualquiera, entonces:

    P(A B) = P(A) + P(B) P(A B). Esta propiedad es una generalizacin de d) al caso en que los sucesos A y B tienen interseccin no necesariamente vaca. Observar que si A B = , entonces P(AB)= 0, por lo que esta propiedad se reduce a d).

    Ejemplo. Se lanzan dos dados honestos. Calcular la probabilidad de que ambas caras superiores de los dados muestren nmero primo. Para dar respuesta a la pregunta seguiremos el siguiente esquema de respuestas. Cul es el experimento aleatorio?

    En este caso el experimento aleatorio es Lanzar dos dados honestos. Cul es el conjunto de todos los resultados que pueden darse en el experimento

    aleatorio? es decir, Cul es el espacio muestral ?

  • 52

    En este caso son todas las parejas que se muestran en la tabla de doble entrada siguiente:

    Dado 2 Dado 1 1 2 3 4 5 6

    1 (1,1) (1,2) (1,3) (1,4) (1,5) (1,6)

    2 (2,1) (2,2) (2,3) (2,4) (2,5) (2,6)

    3 (3,1) (3,2) (3,3) (3,4) (3,5) (3,6)

    4 (4,1) (4,2) (4,3) (4,4) (4,5) (4,6)

    5 (5,1) (5,2) (5,3) (5,4) (5,5) (5,6)

    6 (6,1) (6,2) (6,3) (6,4) (6,5) (6,6) Cuntos elementos tiene ?, es decir, Cul es el valor de # ?

    En este caso # = 36. Cul es el suceso en el que estamos interesados en calcular su probabilidad?

    En este caso el suceso (lo anotamos con la letra A), que es un subconjunto de , sern algunas de los pares ordenados que se encuentran en la tabla anterior.

    Cules pares ordenados?

    Aquellos que cumplen la condicin que pide el problema. En este caso que ambos nmeros del par ordenado sean primos.

    Dado 2

    Dado 1 1 2 3 4 5 6

    1 (1,1) (1,2) (1,3) (1,4) (1,5) (1,6)

    2 (2,1) (2,2) (2,3) (2,4) (2,5) (2,6)

    3 (3,1) (3,2) (3,3) (3,4) (3,5) (3,6)

    4 (4,1) (4,2) (4,3) (4,4) (4,5) (4,6)

    5 (5,1) (5,2) (5,3) (5,4) (5,5) (5,6)

    6 (6,1) (6,2) (6,3) (6,4) (6,5) (6,6) Cuntos elementos tiene el suceso?, es decir, Cul es el valor de #A?

    En este caso #A= 9.

  • 53

    En conclusin, la probabilidad de que ambas caras superiores de los dados muestren nmero primo es

    ( )41

    369 ==#

    #= AAP . Si usramos una escala porcentual para calcular P(A), entonces P(A) sera 25%. Ejemplo. Se lanzan al aire 4 monedas de $100, las cuales son honestas. Cul es la probabilidad de que en al menos 3 de las monedas salga cara? Para responder la interrogante seguiremos el mismo esquema del ejemplo anterior. Cul es el experimento aleatorio?

    Lanzar 4 monedas honestas de $100. Cul es el espacio muestral?

    El espacio muestral son todos los cudruples que se muestran a continuacin:

    (C,C,C,C) , (C,C,C,S) , (C,C,S,C) , (C,C,S,S)

    (C,S,C,C) , (C,S,C,S) , (C,S,S,C) , (C,S,S,S)

    (S,C,C,C) , (S,C,C,S) , (S,C,S,C) , (S,C,S,S)

    (S,S,C,C) , (S,S,C,S) , (S,S,S,C) , (S,S,S,S) Por ejemplo, (c,c,c,s) significa que en la moneda 1, 2 y 3 sali cara y en la moneda 4 sali sello. Los siguientes diagramas de rbol muestran grficamente todos los cudruples.

    C

    S C

    C C S S

    C S C S C S C S

    S

    S C

    C C S S

    C S C S C S C S

  • 54

    Cuntos elementos tiene el espacio muestral?

    # = 16. Cul es el suceso en el que estamos interesados en calcular su probabilidad?

    El suceso, que lo anotamos con la letra A, son todos los cudruples que cumplen la condicin: en al menos 3 de las monedas sale cara.

    (C,C,C,C) , (C,C,C,S) , (C,C,S,C) , (C,C,S,S)

    (C,S,C,C) , (C,S,C,S) , (C,S,S,C) , (C,S,S,S)

    (S,C,C,C) , (S,C,C,S) , (S,C,S,C) , (S,C,S,S)

    (S,S,C,C) , (S,S,C,S) , (S,S,S,C) , (S,S,S,S) Cuntos elementos tiene el suceso A?

    #A = 5. En consecuencia, la probabilidad de que al lanzar 4 monedas honestas en al menos 3 salga cara es

    ( )165=#

    #= AAP .

    Si usamos una escala porcentual para calcular P(A), entonces P(A) sera 31,25%. Ejemplo. Una caja no transparente contiene fichas (todas de idntico tamao y textura) numeradas del 13 al 37. Se saca al azar una ficha de la caja y se observa su nmero. Su usted repitiera este experimento 3000 veces, En qu porcentaje, aproximadamente, de esas repeticiones ocurrira que el nmero obtenido es divisible por 7? Para responder esta pregunta calcularemos la probabilidad de que al sacar una ficha de la caja, el nmero sea divisible por 7. Ahora seguimos el esquema anteriormente desarrollado. Cul es el experimento aleatorio?

    Extraer una ficha de la caja. Cul es el espacio muestral?

    El espacio muestral son todas las fichas (nmeros) de la caja.

  • 55

    Cuntos elementos tiene el espacio muestral?

    # = 25 (notar que 37 12 = 25). Cul es el suceso en el que estamos interesados en calcular su probabilidad?

    El suceso, que lo anotaremos con la letra A, son todas las fichas que cumplen la condicin: el nmero de la ficha es divisible por 7.

    Cuntos elementos tiene el suceso A?

    #A = 4. O sea, la probabilidad de que al sacar una ficha de la caja el nmero de la ficha sea divisible por 7 es

    ( )254=#

    #= AAP .

    13 14 15 16 17 18 19 20

    21 22 23 24 25 26

    27 28 29 30

    32 33

    36

    31 34

    35

    37

    13 14 15 16 17 18 19 20

    21 22 23 24 25 26

    27 28 29 30

    32 33

    36

    31 34

    35

    37

  • 56

    Si usamos una escala porcentual para calcular P(A), entonces P(A) sera 16%. En consecuencia, en aproximadamente 16% de las repeticiones ocurrira que el nmero de la ficha sera divisible por 7. Ejemplo. Una bolsa no transparente contiene 800 fichas, del mismo tamao y textura. De las 800 fichas, 174, son blancas y el resto negras. Cul es el nmero de fichas blancas que deben agregarse a la bolsa para que, al extraer al azar una ficha, la probabilidad de que sta sea negra sea igual a 0,4? Usemos nuevamente el esquema de resolucin visto anteriormente, suponiendo que son b las fichas blancas que se han agregado. Cul es el experimento aleatorio?

    Extraer una ficha de la bolsa no transparente. Cul es el espacio muestral?

    El espacio muestral son las 800 + b fichas de la bolsa. Cuntos elementos tiene el espacio muestral?

    # = 800 + b. Cul es el suceso en el que estamos interesados en calcular su probabilidad?

    El suceso, que lo anotaremos con la letra N, son todas las fichas que cumplen la condicin, esto es, que son negras.

    Cuntos elementos tiene el suceso N?

    #N = 626. Notar que inicialmente haba 800 fichas en la bolsa, de las cuales 174 eran blancas, por lo que haban 626 negras. Despus de agregar n fichas a la bolsa, siguen habiendo 626 negras, pues las fichas que se agregaron eran de color blanco. Por lo tanto, la probabilidad de que al sacar una ficha de la bolsa, sta sea negra es

    ( )n

    NNP +=##=

    800626 .

  • 57

    Pero el problema impone la condicin de que P(N)=0,4, por lo que se tiene la ecuacin:

    4,0800

    626 =+ n .

    O sea, ( ) 4,0800626 += b ,

    de donde

    4,04,0800626 = b .

    Esto es,

    b=4,0320626 .

    En conclusin, se deben agregar b = 675 fichas blancas a la bolsa, para que la probabilidad de sacar una ficha negra sea igual a 0,4. Observacin Notar que para calcular la probabilidad de un suceso cualquiera con el Modelo de Laplace, no es necesario mostrar los elementos del espacio muestral ni tampoco los elementos del suceso. Basta con saber cuntos elementos tiene el espacio muestral y cuantos elementos tiene el suceso. Esta es la razn por la cual son tan tiles las tcnicas de conteo (permutaciones, combinaciones, etc.) en el clculo de probabilidades con el Modelo de Laplace.

  • 58

    Un curso tiene 25 alumnos, de los cuales 10 son mujeres y 15 son hombres. Se realiza un experimento que consiste en elegir (al azar) 2 alumnos, para representar al curso en un acto del Colegio. Para efectuar la eleccin, se numeran 25 pelotitas desde el 1 hasta el 25, y se echan a una bolsa no transparente. Se escogen dos pelotitas desde la bolsa. Pueden sacarse las dos al mismo tiempo o sacar una primero, y luego la segunda, sin devolver la primera. Esta ltima modalidad es la que adoptamos. El nmero escogido, corresponde al alumno que lleva ese nmero en la lista del curso. Diremos que ocurri M si el nmero escogido corresponde a una alumna mujer, en caso contrario, es decir, si el nmero escogido corresponde a un alumno hombre, diremos que ocurri H.

    Lista del Curso

    1. Cisterna, Antonia 2. Contreras, Jos 3. Diez, Mario 4. Duarte, Juana 5. Fuentes, Erwin 6. Glvez, Claudio 7. Gorostiza, Mara 8. Gonzlez, Rosario 9. Gutirrez, Fabin 10. Lagos, Andrs 11. Melndez, Gladys 12. Mndez, Carlos 13. Morales, Andrea 14. Muoz, Carlos 15. Navarrete, Vctor 16. Orellana, Natacha 17. Pez, Enzo 18. Romero, Daniel 19. Toro, Francisco 20. Torres, Pamela 21. Valds, Julio 22. Vallejos, Vanessa 23. Villarroel, Gonzalo 24. Zamora, Miguel 25. Zamorano, Patricia

    Segn la lista de curso, las alumnas mujeres corresponden a los nmeros 1, 4, 7, 8, 11, 13, 16, 20, 22, 25 y los alumnos hombres a los nmeros 2, 3, 5, 6, 9, 10, 12, 14, 15, 17, 18, 19, 21, 23 y 24.

    Acerca del tringulo de Pascal

  • 59

    As, si en la primera pelotita sale el 13 y en la segunda el 6, significa que se ha escogido a los alumnos Andrea y Claudio. En cambio, si las pelotitas escogidas fuesen la 23 y la 15, los alumnos escogidos seran Gonzalo y Vctor. Notar que en el primer caso se obtuvo un hombre y una mujer, mientras en el segundo caso fueron dos hombres Si slo nos interesa saber si el alumno escogido fue hombre o mujer, entonces los ejemplos anteriores podramos escribirlos en la forma siguiente:

    Este diagrama de forma de rbol nos servir para escribir todas las posibles combinaciones hombre-mujer que podran ocurrir cuando se escogen 2 alumnos del curso. El rbol (binario) para representar todas las combinaciones posibles de hombre mujer es el siguiente.

    Observar que este rbol tiene en total 4 ramas, que verifican lo siguiente:

    HH: En una rama aparece 0 M y 2 H (la rama del rbol que est ms a la derecha) MH: En dos ramas aparecen 1 M y 1 H MM: En una rama aparecen 2 M y 0 H

  • 60

    El nmero de ramas que muestran las distintas cantidades de M y H la podemos escribir horizontalmente como la secuencia

    1 2 1 HH MH MM

    Supongamos ahora que en lugar de escoger dos alumnos para representar al curso en el acto del colegio, es necesario escoger 3. Cul sera el rbol para representar las diferentes combinaciones de M y H que podran darse? Nuevamente, para escoger a los 3 representantes, introducimos en la bolsa 25 pelotitas y luego escogemos al azar tres de estas (sacamos la primera pelotita, luego la segunda, sin devolver la primera, despus la tercera, sin devolver las anteriores). Por ejemplo, si en la primera pelotita sale el 8, en la segunda el 21 y en la tercera significa que se ha escogido a los alumnos Rosario, Julio y Erwin. En cambio, si las pelotitas escogidas fuesen la 24, la 6 y la 15, los alumnos escogidos seran Miguel, Claudio y Vctor. Nuevamente, si slo nos interesa saber si el alumno escogido fue hombre o mujer, entonces los ejemplos anteriores podemos escribirlos en la siguiente forma:

    Adems, el rbol (binario) para representar todas las combinaciones posibles hombre-mujer, que podran darse cuando se escogen tres alumnos es el siguiente.

  • 61

    Notar que ste rbol tiene