distribuciones

61
Estadística General Tema: Recolección de Datos

Upload: gabriel-liuba

Post on 16-Jul-2016

8 views

Category:

Documents


0 download

DESCRIPTION

Como poder elaborar desarrollar distribuciones de frecuencias

TRANSCRIPT

Estadstica Descriptiva

Estadstica General

Tema: Recoleccin de Datos

Para qu necesitamos Recolectar Datos?Proporcionan la introduccin imprescindible para un estudio de investigacin.Medir el desempeo en un servicio o proceso de produccin.Ayudar en la formulacin de alternativas para la toma de decisiones.Satisfacer nuestra curiosidad.

Ejemplos:Un gerente desea investigar si la calidad del servicio o de los productos se ajustan a los estndares de la compaa.El investigador de mercados busca las caractersticas que distinguen un producto del de sus competidores.

Ejemplos:El inversionista potencial desea determinar qu compaas de qu industrias es probable que hayan acelerado el crecimiento en un periodo de recuperacin econmica.El fabricante farmacutico necesita determinar si una nueva medicina es ms eficaz que las actualmente en uso. Los Datos pueden concebirse como informacin numrica necesaria para ayudarnos a tomar una decisin con ms bases en una situacin particular.

Tcnicas e Instrumentos1. Encuesta: Su instrumento es el Cuestionario. Se formulan preguntas respecto a opiniones, actitudes, comportamiento y otras caractersticas.Despus las respuestas se editan, codifican y tabulan para su anlisis.Tcnicas e Instrumentos2. Entrevista:Su instrumento es la Gua de Preguntas.Es un dilogo flexible, permite hacer preguntas ms de una vez (repregunta).Tanto el entrevistador como el (los) entrevistado (s) deben tener conocimientos fundamentados del tema en discusin.Tcnicas e Instrumentos3. Observacin:Su instrumento es la Gua de Observacin.a) Observacin Experimental: El investigador influye sobre los elementos de estudio. Ej: Prueba de medicamentos, Ensayos de nuevos mtodos de enseanza, etc.b) Observacin No Experimental: El investigador toma los datos tal y como los encuentra. Ej: Trfico, Rating, Supervisin.Tcnicas e Instrumentos4. Anlisis Documental:Su instrumento es la Ficha de Registro.Consiste en recabar informacin relacionada al tema de investigacin de todas las fuentes disponibles: Tesis, Revistas, Pginas Web, Libros, Historias Clnicas, Expedientes judiciales, Registro de ventas, Historial de Notas, Documentales, etc.Estas fuentes deben ser vlidas para citarse.Diseo del CuestionarioPreguntas Cerradas:rea de carrera profesional:Ciencias ()Letras()Mdicas ()Otra()Preguntas Abiertas:Qu opina del acoso sexual en lugares de trabajo?Diseo del CuestionarioPreguntas Semi-Abiertas:Qu deporte practica?Ftbol ()Voley ()Ciclismo ()Natacin ()Otro ()..Consideraciones ticasLa informacin obtenida debe ser de inters, estrictamente, para el estudio. Mantener el anonimato de las fuentes, si fuera requerido.Utilizar un lenguaje adecuado para las personas involucradas en el estudio.No sesgar (acomodar) los resultados obtenidos. aleatoriedad.Una leccin muy importante del anlisis de datos: mirar los datos

W. Edwards DemingFsico-Matemtico y Estadstico norteamericano.(1900 1993)Captulo 2Cmo ordenar los datos para hacer una distribucin de frecuencias?

This template can be used as a starter file for presenting training materials in a group setting.

SectionsRight-click on a slide to add sections. Sections can help to organize your slides or facilitate collaboration between multiple authors.

NotesUse the Notes section for delivery notes or to provide additional details for the audience. View these notes in Presentation View during your presentation. Keep in mind the font size (important for accessibility, visibility, videotaping, and online production)

Coordinated colors Pay particular attention to the graphs, charts, and text boxes. Consider that attendees will print in black and white or grayscale. Run a test print to make sure your colors work when printed in pure black and white and grayscale.

Graphics, tables, and graphsKeep it simple: If possible, use consistent, non-distracting styles and colors.Label all graphs and tables.

14En este caso, resolveremos un ejemplo. Ordenaremos los datos que se encuentran en la siguiente tabla:2019121918121222191714222014121425251421221515142218201515242128201719

Give a brief overview of the presentation. Describe the major focus of the presentation and why it is important.Introduce each of the major topics.To provide a road map for the audience, you can repeat this Overview slide throughout the presentation, highlighting the particular topic you will discuss next.15PASO 1De acuerdo al tamao del grupo (n), debes definir cuntas clases es adecuado tener. Utilizamos la siguiente frmula: k= nn= nmero de observaciones, k= clasesEn nuestro ejemplo, hay 35 datos, por ello:k= 35= 5.916 clases

Give a brief overview of the presentation. Describe the major focus of the presentation and why it is important.Introduce each of the major topics.To provide a road map for the audience, you can repeat this Overview slide throughout the presentation, highlighting the particular topic you will discuss next.16

PASO 2Obtenemos el recorrido o amplitud (A):De acuerdo a la siguiente frmula:A= dato mayor dato menor En nuestro ejemplo:A= 28-12=16This is another option for an Overview slides using transitions.

17

PASO 3Con la informacion anterior, determinamos el ancho de cada intervalo(i) con:i= A/ n

En nuestro ejemplo: i= 16/5.91 =2.70Podemos usar intervalos de ancho 3 o 2, en este caso usaremos 2, ya que el entero de las clases lo aproximamos al entero mayor.

This is another option for an Overview slides using transitions.

18

Paso 4Podemos comenzar a construir la tabla, primero, con las clases aparentes, empezamos con el menor valor de la distribucin y les sumamos el ancho del intervalo (i), hasta cubrir el valor ms alto de la serie:Clases aparentes12-1415-1718-2021-2324-2627-29This is another option for an Overview slides using transitions.

19

PASO 5Ahora podemos determinar las clases reales. Restamos 0.5 del lmite inferior de cada clase aparente y sumamos 0.5 al lmite superior de cada clase aparente.Clases reales11.5-14.514.5-17.517.5-20.520.5-23.523.5-26.526.5-29.5This is another option for an Overview slides using transitions.

20

PASO 6Ahora podemos obtener la marca de clase, la cual es el punto medio de las clases reales y se obtiene a travs de :Marca de clase= (lri+lrs)/2Donde lri: lmite real inferiorlrs: lmite real superior. Un ejemplo en nuestro caso sera (11.5+14.5)/2= 13La tabla nos quedara as:Marca de clase131619222528This is another option for an Overview slides using transitions.

21

PASO 7Ahora podemos colocar las frecuencias (f), que son la cantidad de veces que aparece un valor. Esto lo hacemos a travs del recuento, en el ejemplo tendramos:

Clases aparentesClases realesMarca de clasef12-1411.5-14.513915-1714.5-17.516618-2017.5-20.5191121-2320.5-23.522524-2623.5-26.525327-2926.5-29.5281This is another option for an Overview slides using transitions.

22

PASO 8Ahora podemos colocar las frecuencias acumuladas (F), que son las frecuencias absolutas sumadas en cada clase. Esto lo hacemos a travs del recuento, en el ejemplo tendramos:

Clases aparentesClases realesMarca de clasefF12-1411.5-14.5139915-1714.5-17.51661518-2017.5-20.519112621-2320.5-23.52253124-2623.5-26.52533427-2926.5-29.528135This is another option for an Overview slides using transitions.

23

PASO 9Ahora podemos colocar las frecuencias relativas (fr), que son las frecuencias absolutas divididas entre el total. Es decir que fr= f/n

Clases aparentesClases realesMarca de clasefFfr12-1411.5-14.513990.2571415-1714.5-17.5166150.1714318-2017.5-20.51911260.3142921-2320.5-23.5225310.1428624-2623.5-26.5253340.0857127-2926.5-29.5281350.02857This is another option for an Overview slides using transitions.

24

PASO 10Ahora podemos colocar las frecuencias relativas porcentuales(%), que se obtienen multiplicando las frecuencias relativas por 100. Por ejemplo: 0.2571 *100=25.71%Clases aparentesClases realesMarca de clasefFfr%12-1411.5-14.513990.2571425.71%15-1714.5-17.5166150.1714317.14%18-2017.5-20.51911260.3142931.43%21-2320.5-23.5225310.1428614.29%24-2623.5-26.5253340.085718.57%27-2926.5-29.5281350.028572.86%This is another option for an Overview slides using transitions.

25

Hemos construido exitosamente una tabla de distribucin de frecuencias.

This is another option for an Overview slides using transitions.

26Distribuciones de Frecuencias1. Agrupacin de datos2. Frecuencias y distribucionesDistribucin de frecuenciasCuando se realiza una investigacin se obtiene un conglomerado de datos que deben ser organizados en un orden, arreglo o secuencia lgica.Al ordenarse y clasificarse los datos obtenidos, se realiza una distribucin de frecuencias.Datos crudos (sin agrupar)Hombre, mujer, mujer, mujer, hombre, hombre, mujer, mujer, hombre, hombre, hombre, hombre, hombre, mujer, mujer, hombre, hombre, mujer, mujer, hombre, mujer, mujer, mujer, mujer, mujer, hombre, hombre, mujer, mujer, hombre, hombre, hombre, hombre, hombre, mujer, mujer, hombre, hombre, mujer, mujer, hombre, mujer, mujer, mujer, mujer, mujer, hombre, hombre, mujer, mujer, hombre, hombre, hombre, hombre, hombre, mujer, mujer, hombre, hombre, mujer, mujer, hombre, mujer, mujer, mujer, mujer, mujer, hombre, hombre, mujer, mujer, hombre, hombre, hombre, hombre, hombre, mujer, mujer, hombre, hombre, mujer, mujer, hombre, mujer, mujer, mujer, mujer, mujer, hombre, hombre, mujer, mujer, hombre, hombre, hombre, hombre, hombre, mujer, mujer, hombre, hombre, mujer, mujer, hombre, mujer, mujer, mujer, mujer, mujer, hombre, hombre, mujer, mujer, hombre, hombre, hombre, hombre, hombre, mujer, mujer, hombre, hombre, mujer, mujer, hombre, mujer, mujer, mujer, mujer, mujer, hombre, hombre, mujer, mujer, hombre, hombre, hombre, hombre, hombreRaw Data36, 27, 21, 35, 35, 36, 27, 31, 35, 28, 24, 26, 36, 38, 22, 23, 39, 25, 21, 27, 39, 25, 33, 23, 29, 32, 23, 23, 26, 26, 39, 24, 22, 35, 25, 31, 35, 22, 32, 21, 32, 25, 34, 33, 24, 25, 36, 34, 24, 33, 26, 23, 35, 32, 23, 24, 31, 24, 35, 34, 38, 22, 23, 39, 25, 21, 27, 39, 25, 33, 23, 29, 32, 23, 23, 26, 26, 39, 24, 22, 35, 25, 31, 35, 22, 32, 21, 32, 25, 34, 33, 24, 25, 36, 34, 24, 33, 26, 23, 35, 32, 23, 24, 31, 24, 35, 34, 36, 27, 21, 35, 35, 36, 27, 31, 35, 28, 24, 26, 36, 38, 22, 23, 39, 25, 21, 27, 39, 25, 33, 23, 29, 32, 23, 23, 26, 26, 39, 24, 22, 35, 25, 31, 35, 22, 32, 21, 36, 27, 21, 35, 35, 36, 27, 31, 35, 28, 24, 26, 36, 38, 22, 23, 39, 25, 21, 27, 39, 25, 33, 23, 29, 32, 23, 23, 26, 26, 39, 24, 22, 35, 25, 31, 35, 22, 32, 21, 36, 27, 21, 35, 35, 36, 27, 31, 35, 28, 24, 26, 36, 38, 22, 23, 39, 25, 21, 27, 39, 25, 33, 23, 29, 32, 23, 23, 26, 26, 39, 24, 22, 35, 25, 31, 35, 22, 32, 21, 36, 27, 21, 35, 35, 36, 27, 31, 35, 28, 24, 26, 36, 38, 22, 23, 39, 25, 21, 27, 39, 25, 33, 23, 29, 32, 23, 23, 26, 26, 39, 24, 22, 35, 25, 31, 35, 22, 32, 21Datos crudos (sin agrupar)Ordenacin de los datosEs una colocacin de los datos numricos en orden de mayor a menor (o viceversa). La diferencia entre el mayor y el menor de los nmeros se llama rango o recorrido de datos. Cualitativos Orden alfabtico Escribir, primero el que ms se repite, luego el que sigue y as sucesivamenteCuantitativos Forma creciente (menor al mayor)Forma decreciente (mayor al menor) Ordenacin de datosCrudos: Hombre, mujer, mujer, mujer, hombre, hombre, mujer, mujer, hombre, hombre, hombre, hombre, hombre, mujer, mujer, hombre, hombre, mujer, mujer, hombreOrdenados: hombre, hombre, hombre, hombre, hombre, hombre, hombre, hombre, hombre, hombre, hombre, mujer, mujer, mujer, mujer, mujer, mujer, mujer, mujer, mujerOrdenacin de datosCrudos: 36, 27, 21, 35, 35, 36, 27, 31, 35, 28, 24, 26, 36, 38, 22, 23, 39, 25, 21, 27, 39, 25, 33, 23, 29, 32, 23Ordenados: 21, 21, 22, 23, 23, 23, 24, 25, 25, 26, 27, 27, 27, 28, 29, 31, 32, 33, 35, 35, 35, 36, 36, 36, 38, 39, 39Agrupacin de datosCuando la muestra es de menos de 20, entonces estos datos son analizados sin necesidad de formar clases con ellos y a esto es a lo que se le llama tratamiento de datos no agrupados. Anterior diapositiva.Datos no agrupadosEdadFrecuencia212221233241252261273281291311321331353363381392Una tabla con 16 renglones

No es muy prctica!Agrupacin de datosCuando la muestra consta de 20 o ms datos, lo aconsejable es agrupar los datos en clases y a partir de stas determinar las caractersticas de la muestra.Pasos paraDatos nominales y ordinales1. Ordenar los datos.Determinar en qu orden quedarn las categoras.2. Determinar las frecuencias de cada clase.3. Determinar la Frecuencia Relativa.En caso de escala ordinal, se puede obtener Frecuencia Acumulada y Relativa Acumulada.La frecuencia puede ser absoluta (f), nmero que indica la cantidad de veces que la variable toma un cierto valor, o relativa (fr), divisin entre la frecuencia absoluta y el nmero total de observaciones

Datos agrupados (nominal)GneroFrecuenciaFrecuencia RelativaHombre110.52Mujer100.48Datos agrupados (ordinal)EscolaridadFFrFrecuencia AcumuladaPrimaria150.4115Secundaria120.3227Preparatoria100.2737Ejemplo:Datos:Nominal: Hombres y mujeres en el saln.Ordinal: Nivel de acuerdo con escuelas de tiempo completo (De acuerdo, Indeciso/a, Desacuerdo).Ordenar datosFrecuencia absolutaFrecuencia RelativaOrdinal: Frecuencia Acumulada y Relativa Acumulada

Armar tabla.Agrupacin de datosDatos cuantitativosDeben formarse clases de igual tamao (tamao de clase: C)Recomendacin: El total de grupos o clases no debe ser menor a 5 ni mayor a 15 ( 20).Frecuencias y distribucionesLa distribucin de frecuencias simple es una tabla que se construye con base en los siguientes datos: clase o variable (valores numricos) en orden descendente o ascendente, marcas de clase y frecuencia. ClaseMarca de claseFrecuencia0-2153-5436-8729-11104Frecuencias y distribucionesPor qu del 2 se va al 3?Por qu no inicia el rengln dos, con el nmero 2?ClaseMarca de claseFrecuencia0-2153-5336-8529-1174Cuando NO necesitamos armar clases?

Pasos paraDatos cuantitativos1. Ordenar los datos.2. Obtener el rango y cantidad de datos.3. Determinar cuntas clases tendr la tabla (entre 5 y 15).Raz de n.Regla de Sturgess.Otras necesidades.Regla de SturgesCalcula el nmero de intervalos por la siguiente frmula.k = 1 + 3.332[log(n)]Ejemplo:K = 1 + 3.322 [log (n)]K = 1 + 3.322 [log (25)]K = 1 + 3.322 [log (1.39)]K = 1+ 4.61 = 5.61 = 6Ordenacin de datosCrudos: 36, 27, 21, 35, 35, 36, 27, 31, 35, 28, 24, 26, 36, 38, 22, 23, 39, 25, 21, 27, 39, 25, 33, 23, 29, 32, 23Ordenados: 21, 21, 22, 23, 23, 23, 24, 25, 25, 26, 27, 27, 27, 28, 29, 31, 32, 33, 35, 35, 35, 36, 36, 36, 38, 39, 39Cmo armar una distribucin de frecuencias de estos datos?Pasos paraDatos cuantitativos2c < n. -------- Ejemplo: n = 1521 = 2 ----------------------- 2 < 15 ? Si22 = 2x2 = 4 --------------- 4 < 15 ? Si23 = 2x2x2 = 8 ------------ 8 < 15 ? Si24 = 2x2x2x2 = 16 ------- 16 < 15 ? No!

Por lo tanto, C = 3

Nota: los dos mtodos pueden dar distintos resultados.Regla: 2c < n, por lo general dar un resultado menor. Usarlo cuando n > 50Pasos paraDatos cuantitativosPasos paraDatos cuantitativosPasos paraDatos cuantitativosNo. ClaseLmitesLmites realesMarca de clase (X)FFAFrFrA11 30.5 3.52440.3330.33324 63.5 6.556100.500.83337 96.5 9.582120.1661FrecuenciasFrecuencias AcumuladasFrecuencias RelativasFrecuencias Relativas AcumuladasInferiorSuperiorTotal de datos (n)EjemploOrdenar datosCrudos: 36, 27, 21, 35, 35, 36, 27, 31, 35, 28, 24, 26, 36, 38, 22, 23, 39, 25, 21, 27, 39, 25, 33, 23, 29, 32, 23Ordenados: 21, 21, 22, 23, 23, 23, 24, 25, 25, 26, 27, 27, 27, 28, 29, 31, 32, 33, 35, 35, 35, 36, 36, 36, 38, 39, 39No. ClaseLmitesLmites realesMarca de clase (X)FFAFrFrA121-2420.5-24.522.5770.260.26225-2824.5-28.526.57140.260.52329-3228.5-32.530.53170.110.63433-3632.5-36.534.57240.260.89537-4036.5-40.538.53270.111.00Usando mtodo 1 (para la cantidad de clases, raz de n)No. ClaseLmitesLmites realesMarca de clase (X)FFAFrFrA121-2520.5-25.523990.330.33226-3025.5-30.5286150.220.56331-3530.5-35.5336210.220.78436-4035.5-40.5386270.221.00Usando mtodo 2 (para la cantidad de clases, 2c < n)Ejercicio: Cantidad de horas de estudio a la semanaCrudos: 6, 5, 3, 1, 8, 5, 12, 10, 1, 2, 3, 2, 4, 2, 4, 6, 3, 2, 5, 4

Ordenados: 1, 1, 2, 2, 2, 2, 3, 3, 3, 4, 4, 4, 5, 5, 5, 6, 6, 8, 10, 12No. ClaseLmitesLmites realesMarca de clase (X)FFAFrFrA11 30.5 3.52990.450.4524 63.5 6.558170.400.8537 96.5 9.581180.050.90410 129.5 12.5112200.101.00Usando mtodos 1 y 2 (para la cantidad de clases)Calificaciones89, 85, 85, 84, 83, 82, 89, 81, 78, 79, 84, 88, 77, 88, 74, 86, 100, 93, 84, 81, 88, 78, 90, 100, 95, 94, 86, 91, 86, 99, 85, 85, 85, 73No. ClaseLmitesLmites realesMarca de clase (X)FFAFrFrA173-7872.5-78.575.555279-8478.5-84.581.5813385-90491-96597-10234No. ClaseLmitesLmites realesMarca de clase (X)FFAFrFrA173-7772.5-77.575278-8277.5-82.580383-87488-92593-97698-102Otros ejercicios en el salnDatos:Cantidad de personas que viven en la misma casa.Cantidad de horas que pasa en la computadora a la semana.Aplicar pasos.Hoja de ejerciciosConceptos 1/3Clase: cada rengln de una distribucin de frecuencia, es un grupo de datos.Intervalo: rango de datos incluido en cada clase.Lmites de clase, superior e inferior: lmites extremos de cada clase.Lmites Reales de clase (o fronteras de clase): se obtienen sumando el lmite superior de un intervalo de clase con el lmite inferior de la clase siguiente y dividindolos entre dos.Marca de clase: punto medio de cada clase y se obtiene sumando los lmites de clase y dividindolos entre dos.Conceptos 2/3Tamao de clase:la diferencia entre los lmites reales de clase, la diferencia entre los lmites de clase ms una unidad (la misma que se est trabajando) la diferencia entre las marcas de clase.Frecuencias acumuladas.- la suma de cada frecuencia con la frecuencia de todas las clases superiores.

Conceptos 3/3Frecuencias relativas: Dividiendo cada frecuencia entre el nmero total de observaciones (o multiplicndolas por 100 para tenerlas en forma de porcentaje). Frecuencias relativas acumuladas: La suma de cada frecuencia relativa con las frecuencias relativas de todas las clases superiores.Tambin se pueden obtener dividiendo cada frecuencia acumulada entre el total de frecuencias por 100. Rango: Dato ms alto menos dato ms bajo. Distribucin de frecuencias.