copia de cartilla de aplicaciones estadisitcas( asb).pdf
TRANSCRIPT
-
8/19/2019 Copia de Cartilla de Aplicaciones estadisitcas( ASB).pdf
1/48
GUÍA DI DACTICA DEL MODULO
APLI CACIONES ESTADI STI CAS
PRESENTACIÓN
El propósito de esta guía es facilitar su aprendizaje en el módulo de
APLICACIONES ESTADISTICAS. A lo largo de las siguientes páginas encontrará
información útil del módulo, de cómo contactar conmigo, de la plataforma informática
que vamos a utilizar, de los objetivos didácticos de la asignatura y de las competencias
que va a adquirir tras el seguimiento, del temario, de la metodología que seguiremos
durante el curso, de la bibliografía, de los criterios de evaluación y de dónde consultar el
calendario de exámenes y mecanismo de tutoría. Además encontrará las Guía de Trabajo
independiente que deberá realizar antes o después de cada semana, según le indique.
Favor lea esta Guía con atención e interés y que si tiene cualquier problema para su
interpretación me lo haga saber.
EL MODULO
El módulo de Aplicaciones Estadísticas se ha desarrollado con el fin de brindar los
conocimientos científicos necesarios para el futuro desarrollo del ejercicio profesional de
los estudiantes. Las necesidades de nuestra sociedad tecnificada requieren de los
profesionales de hoy la capacidad de recopilar, organizar, analizar, presentar y argumentar
sus decisiones con base en la información disponible por ellos. Además, los invita a que
asuman posturas críticas que construyan sociedad con base en los conocimientos
aprendidos de manera autónoma y responsable.
De esta manera, el estudio de la Estadística se caracteriza por formar a los futuros
profesionales en el campo científico y ético, al permitirles acceder a los elementos teóricos
que constituyen la ciencia y al exigirles asumir actitudes de construcción social.
Así, desde la unidad UNO se trata el tema de la representación de los datos a través de
tablas y diagramas, interpretación de los resultados presentados por medio de las medidas
de tendencia central y medidas de dispersión, regresión y correlación de variables.
El estudio de la Estadística se ha convertido en uno de los pilares de las carreras
profesionales, tecnológicas y técnicas actualmente, al ofrecer a los futuros profesionales
elementos para la toma de decisiones en diversos contextos y situaciones. Sin embargo, el
estudio de esta ciencia en el siglo XX se ha caracterizado por la incorporación de la
-
8/19/2019 Copia de Cartilla de Aplicaciones estadisitcas( ASB).pdf
2/48
probabilidad como herramienta que sustenta y fundamenta los análisis y conclusiones de la
Estadística.
EL PROFESOR
Mi nombre es Alexis Sierra Barrera y durante el modulo seré su profesor,
tanto de los grupos virtuales y presenciales. Profesor de La Escuela de Estudios
Técnicos y Tecnológicos de la Universidad Tecnológica de Bolívar. Soy Ingeniero
Industrial y Especialista en Gestión de Producción y Calidad. Es parte de mi tarea
docente facilitarle su labor universitaria por lo que puede contactar conmigo para
cualquier cuestión académica, a través de mi correo electrónico
PLATAFORMA DEL MODULO
Durante el curso utilizaremos como plataforma informática SAVIO. Usted es
miembro de la misma de forma automática, por estar matriculado en mi modulo. Su uso
es muy sencillo, pero si todavía no lo ha usado nunca puede aprender a hacerlo
siguiendo las indicaciones del manual que puede descargarse en esta dirección:
http://www.unitecnologica.edu.co/educacionadistancia/descargas
Ingreso al portal de SAVIO:
http://www.unitecnologica.edu.co/educacionadistancia/
Permítame hacerle unas recomendaciones, asegúrese de usar el correo
institucional ( [email protected]) par a comunicarse dentro de la comunidaduniversitaria. Por otro lado asegure de cambiar la clave frecuentemente y no compartirla.
mailto:[email protected]:[email protected]://www.unitecnologica.edu.co/educacionadistancia/descargashttp://www.unitecnologica.edu.co/educacionadistancia/http://www.unitecnologica.edu.co/educacionadistancia/mailto:[email protected])mailto:[email protected])mailto:[email protected])mailto:[email protected])http://www.unitecnologica.edu.co/educacionadistancia/http://www.unitecnologica.edu.co/educacionadistancia/descargasmailto:[email protected]
-
8/19/2019 Copia de Cartilla de Aplicaciones estadisitcas( ASB).pdf
3/48
3
INTENCIONES EDUCATIVAS
El curso aporta a la formación integral del estudiante en los dominios cognitivos y socio afectivos.
En lo cognitivo el estudiante a través de la solución de problemas adquiere los conocimientos que le
permiten la aplicación y la comunicación de los saberes relacionados con su carrera tecnológica.
En lo socio afectivo se generan los intereses y necesidades que le permitirán desenvolverse como
profesionales competentes en su vida laboral
OBJETIVOS Y COMPETENCIAS A DESARROLLAR
Al concluir el modulo, deberá haber cumplido los siguientes objetivos:
Aplicar los conceptos de la estadística en el planteamiento, organización,
análisis, resolución y presentación de situaciones problema de manera
responsable y eficaz, que aporte a la construcción social desde su ámbito
laboral.
Por otro lado, tendrá oportunidad de poner en práctica y mejorar sus
competencias genéricas relacionadas con: la capacidad de organizar datos, de analizar
comportamientos de fenómenos fisicos, así como las capacidades de aplicación de la
teoría a la práctica, de adaptación ante nuevas situaciones y de análisis crítico.
-
8/19/2019 Copia de Cartilla de Aplicaciones estadisitcas( ASB).pdf
4/48
4
TEMARIO DEL MODULO
Unidad 1:
HISTORIA E IMPORTANCIA DE LA ESTADÍSTICA.
La estadística y su importancia en las decisiones del hombre
RECOLECCIÓN DE DATOS Y GRAF ICAS
Tabla de Frecuencias
Gráficas Estadísticas
Unidad 2:
MEDIDAS DE TENDENCIA CENTRAL
Media, Mediana y Moda para Datos Sueltos
Media, Mediana y Moda para Datos Agrupados
Unidad 3:
MEDI DAS DE DI SPERSIÓN.
Rango de Variación, Desviación Media, Desviación Típica y Varianza Para Datos
Sueltos
Rango de Variación, Desviación Media, Desviación Típica y Varianza para Datos
Agrupados
Unidad 4:
MEDI DAS DE DISTRIBUCIÓN: FRACTILES .
Cuartiles, Deciles y Percentiles para datos sueltos
Cuartiles, Deciles y Percentiles para datos Agrupados
Unidad 5:
REGRESIÓN Y CORRELACIÓN L INEAL
Modelación de los datos estadísticos por medio de funciones
-
8/19/2019 Copia de Cartilla de Aplicaciones estadisitcas( ASB).pdf
5/48
PLAN DE CURSO
METODOLOGÍA
La metodología de esta asignatura tiene una doble vertiente: teórica y práctica.
Enseñanza teórica independiente: Comprenderán lecturas diarias del material asignado
en la plataforma SAVIO y las cuales tendrán actividades independientes para entregar
y hacer seguimiento de apropiación.
Enseñanza práctica: Los conocimientos teóricos adquiridos durante las lecturas y
foros y actividades independientes se harán mediante la interacción de los alumnos y bajo
la orientación del profesor en las sesiones presenciales.
EVALUACIÓN
La evaluación en el curso está concebida como un proceso que permitirá ir
revisando paso a paso el desempeño del estudiante en términos de desarrollo de
competencias y ganancia de habilidades, se evaluara en una escala de 0 a 5.
Los conocimientos teóricos del módulo se evaluarán en una prueba final escrita
a realizar en las fechas asignadas posteriormente.
Los conocimientos prácticos se evaluarán mediante casos prácticos y las Guias
de Trabajo independientes relacionados con el tema correspondiente
-
8/19/2019 Copia de Cartilla de Aplicaciones estadisitcas( ASB).pdf
6/48
De acuerdo a las políticas de la Universidad Tecnológica de Bolívar, la nota
final será el promedio de notas parciales, cada una de ellas con una ponderación igual.
Cada evaluación se valorará de acuerdo con las actividades realizadas, así:
• 60% Talleres, quices, Investigaciones, foros de la plataforma SAVIO
• 40% Actividades en la etapa presencial y examen
BIBLIOGRAFIA
RPS-Qualitas Consultoría de Calidad y Laboratorio S.L. Regresión Lineal en Excel
Medidas de Tendencia Central En Excel. www. monografía.com
Matos Navas Rodolfo Enrique. Modulo Introductorio, Excel Básico: Una aplicación a la
estadística.2007
LLINAS SOLANO, Humberto; ROJAS ÁLVAREZ, Carlos. Estadística descriptiva y distribuciones de
probabilidad; ediciones Uninorte, 2005.
MARTÍNEZ BENCARDINO, Ciro. Estadística y muestreo; Ecoe ediciones, décimo segunda edición,
2005.
PAGANO R, Roberto. Estadística para las ciencias del comportamiento; Thompson editorial, séptima
edición, 2006
Salinas O., José. “Análisis Estadístico para la Toma de Decisiones en Administración y Economía”.
1998. Universidad del Pacífico. Lima-Perú. Números Índices .pg. 361-376
-
8/19/2019 Copia de Cartilla de Aplicaciones estadisitcas( ASB).pdf
7/48
GUIAS DE TRABAJO
UNIDAD 1:
HISTORIA E IMPORTANCIA DE LA ESTADÍSTICA.
La estadística es una ciencia tan antigua como la escritura; sus orígenes se remontan a los
recuentos de personas, animales y bienes representados en pieles, rocas, maderos y cuevas.
Para encontrar su primer desarrollo es preciso indagar entre las más antiguas
civilizaciones. Se sabe que antes de la invención de los números, en el antiguo Oriente
Medio se utilizaban guijarros para contar diferentes objetos con fines mercantiles, lo cual
ha permitido identificar dos pasos en la evolución de la contabilidad; el inicial,
hacia 8000 a. C., “cuando se utilizaban cuentas de diversas formas para contar diferentes
mercancías en una correspondencia de uno a uno”. Luego, una vez aparecida la escritura,
“los signos impresos que mostraban unidades de medida de granos pasaron a indicar
(…) números abstractos”
La invención de los números revolucionó la contabilidad y la comunicación porque
proporcionó un sistema aplicable a todos los objetos existentes. De ahí la importancia de
estos conocimientos para la supervivencia de las sociedades, algunas de las cuales lograron
un elevado refinamiento, como China y Roma.
El término “estadística” es de origen latino, pero sus funciones han sido necesarias en los Estados de prácticamente todas las épocas. Cabe recordar que los historiadores distinguen
tres grados de desarrollo en esta ciencia, según produjera datos protoestadísticos,
provenientes de fuentes arqueológicas; preestadísticos, de fuentes concebidas para otros
objetivos, como registros de nacimientos y defunciones, aduanas, etcétera; y estadísticos
propiamente dichos, derivados de fuentes elaboradas específicamente para registro de
la población.
La estadística cumplía funciones vitales para la existencia de las grandes ciudades. Los gobernantes debían conocer el número de personas capaces de trabajar o de tomar las
armas, la cantidad de alimentos necesarios para sostenerlas, la producción en granos,
cabezas de ganado y otros bienes existentes en un momento y lugar determinados. Este
conocimiento se basaba en la realización periódica de conteos y estaba destinada al cobro
de tributos, indispensables para sostener los aparatos burocrático, militar y religioso. No
obstante, carecemos de información sobre las bases para los conteos, que podían ser de
riqueza material y no de gente, o de ciudadanos libres, omitiendo esclavos, mujeres y niños
1
.
1 Instituto Nacional de Estadísticas y Geografía (México)
-
8/19/2019 Copia de Cartilla de Aplicaciones estadisitcas( ASB).pdf
8/48
Los comienzos de la estadística pueden ser hallados en el antiguo Egipto, cuyos faraones lograron
recopilar, hacia el año 3050 antes de Cristo, prolijos datos relativos a la población y la riqueza del
país. De acuerdo al historiador griego Heródoto, dicho registro de riqueza y población se hizo con
el objetivo de preparar la construcción de las pirámides. En el mismo Egipto, Ramsés II hizo un
censo de las tierras con el objeto de verificar un nuevo reparto. En el antiguo Israel la Biblia dareferencias, en el libro de los Números, de los datos estadísticos obtenidos en dos recuentos de la
población hebrea. El rey David por otra parte, ordenó a Joab, general del ejército hacer un censo de
Israel con la finalidad de conocer el número de la población. También los chinos efectuaron censos
hace más de cuarenta siglos. Los griegos efectuaron censos periódicamente con fines tributarios,
sociales (división de tierras) y militares (cálculo de recursos y hombres disponibles). La
investigación histórica revela que se realizaron 69 censos para calcular los impuestos, determinar
los derechos de voto y ponderar la potencia guerrera. Pero fueron los romanos, maestros de la
organización política, quienes mejor supieron emplear los recursos de la estadística. Cada cincoaños realizaban un censo de la población y sus funcionarios públicos tenían la obligación de anotar
nacimientos, defunciones y matrimonios, sin olvidar los recuentos periódicos del ganado y de las
riquezas contenidas en las tierras conquistadas. Para el nacimiento de Cristo sucedía uno de estos
empadronamientos de la población bajo la autoridad del imperio. Durante los mil años siguientes a
la caída del imperio Romano se realizaron muy pocas operaciones Estadísticas, con la notable
excepción de las relaciones de tierras pertenecientes a la Iglesia, compiladas por Pipino el Breve en
el 758 y por Carlomagno en el 762 DC. Durante el siglo IX se realizaron en Francia algunos censos
parciales de siervos. En Inglaterra, Guillermo el Conquistador recopiló el Domesday Book o librodel Gran Catastro para el año 1086, un documento de la propiedad, extensión y valor de las tierras
de Inglaterra. Esa obra fue el primer compendio estadístico de Inglaterra. Aunque Carlomagno, en
Francia; y Guillermo el Conquistador, en Inglaterra, trataron de revivir la técnica romana, los
métodos estadísticos permanecieron casi olvidados durante la Edad Media. Durante los siglos XV,
XVI, y XVII, hombres como Leonardo de Vinci, Nicolás Copérnico, Galileo, Neper, William Harvey,
Sir Francis Bacon y René Descartes, hicieron grandes operaciones al método científico, de tal forma
que cuando se crearon los Estados Nacionales y surgió como fuerza el comercio internacional
existía ya un método capaz de aplicarse a los datos económicos. Para el año 1532 empezaron a
registrarse en Inglaterra las defunciones debido al temor que Enrique VII tenía por la peste. Más o
menos por la misma época, en Francia la ley exigió a los clérigos registrar los bautismos,
fallecimientos y matrimonios. Durante un brote de peste que apareció a fines de la década de 1500,
el gobierno inglés comenzó a publicar estadísticas semanales de los decesos. Esa costumbre
continuó muchos años, y en 1632 estos Bills of Mortality (Cuentas de Mortalidad) contenían los
nacimientos y fallecimientos por sexo. En 1662, el capitán John Graunt usó documentos que
abarcaban treinta años y efectuó predicciones sobre el número de personas que morirían de varias
enfermedades y sobre las proporciones de nacimientos de varones y mujeres que cabría esperar. El
trabajo de Graunt, condensado en su obra Natural and Political Observations...Made upon the Bills
of Mortality (Observaciones Políticas y Naturales ... Hechas a partir de las Cuentas de Mortalidad),
-
8/19/2019 Copia de Cartilla de Aplicaciones estadisitcas( ASB).pdf
9/48
fue un esfuerzo innovador en el análisis estadístico. Por el año 1540 el alemán Sebastián Muster
realizó una compilación estadística de los recursos nacionales, comprensiva de datos sobre
organización política, instrucciones sociales, comercio y poderío militar. Durante el siglo XVII
aportó indicaciones más concretas de métodos de observación y análisis cuantitativo y amplió los
campos de la inferencia y la teoría Estadística. Los eruditos del siglo XVII demostraron especialinterés por la Estadística Demográfica como resultado de la especulación sobre si la población
aumentaba, decrecía o permanecía estática. En los tiempos modernos tales métodos fueron
resucitados por algunos reyes que necesitaban conocer las riquezas monetarias y el potencial
humano de sus respectivos países. El primer empleo de los datos estadísticos para fines ajenos a la
política tuvo lugar en 1691 y estuvo a cargo de Gaspar Neumann, un profesor alemán que vivía en
Breslau. Este investigador se propuso destruir la antigua creencia popular de que en los años
terminados en siete moría más gente que en los restantes, y para lograrlo hurgó pacientemente en
los archivos parroquiales de la ciudad. Después de revisar miles de partidas de defunción pudodemostrar que en tales años no fallecían más personas que en los demás. Los procedimientos de
Neumann fueron conocidos por el astrónomo inglés Halley, descubridor del cometa que lleva su
nombre, quien los aplicó al estudio de la vida humana. Sus cálculos sirvieron de base para las tablas
de mortalidad que hoy utilizan todas las compañías de seguros. Durante el siglo XVII y principios
del XVIII, matemáticos como Bernoulli, Francis Maseres, Lagrange y Laplace desarrollaron la
teoría de probabilidades. No obstante durante cierto tiempo, la teoría
de las probabilidades limitó su aplicación a los juegos de azar y hasta el siglo XVIII no comenzó a
aplicarse a los grandes problemas científicos. Godofredo Achenwall, profesor de la Universidad deGotinga, acuñó en 1760 la palabra estadística, que extrajo del término italiano statista (estadista).
Creía, y con sobrada razón, que los datos de la nueva ciencia serían el aliado más eficaz del
gobernante consciente. La raíz remota de la palabra se halla, por otra parte, en el término latino
status, que significa estado o situación; Esta etimología aumenta el valor intrínseco de la palabra,
cuanto la estadística revela el sentido cuantitativo de las más variadas situaciones. Jacques
Quételect es quien aplica las Estadísticas a las ciencias sociales. Este interpretó la teoría de la
probabilidad para su uso en las ciencias sociales y resolver la aplicación del principio de promedios
y de la variabilidad a los fenómenos sociales. Quételect fue el primero en realizar la aplicación
práctica de todo el método Estadístico, entonces conocido, a las diversas ramas de la ciencia.
Entretanto, en el período del 1800 al 1820 se desarrollaron dos conceptos matemáticos
fundamentales para la teoría Estadística; la teoría de los errores de observación, aportada por
Laplace y Gauss; y la teoría de los mínimos cuadrados desarrollada por Laplace, Gauss y Legendre.
A finales del siglo XIX, Sir Francis Gaston ideó el método conocido por Correlación, que tenía por
objeto medir la influencia relativa de los factores sobre las variables. De aquí partió el desarrollo
del coeficiente de correlación creado por Karl Pearson y otros cultivadores de la ciencia biométrica
como J. Pease Norton, R. H. Hooker y G. Udny Yule, que efectuaron amplios estudios sobre la
medida de las relaciones. Los progresos más recientes en el campo de la Estadística se refieren al
ulterior desarrollo del cálculo de probabilidades, particularmente en la rama denominada
-
8/19/2019 Copia de Cartilla de Aplicaciones estadisitcas( ASB).pdf
10/48
indeterminismo o relatividad, se ha demostrado que el determinismo fue reconocido en la Física
como resultado de las investigaciones atómicas y que este principio se juzga aplicable tanto a las
ciencias sociales como a las físicas
Etapas de Desarrol lo de la Estadísti ca
La historia de la estadística está resumida en tres grandes etapas o fases.1.- Primera F ase : Los Censos: Desde el momento en que se constituye una autoridad política, la
idea de inventariar de una forma más o menos regular la población y las riquezas existentes en el
territorio está ligada a la conciencia de soberanía y a los primeros esfuerzos administrativos.
2.- Segunda Fase : De la Descripción de los Conjuntos a la Aritmética Política: Las ideas
mercantilistas extrañan una intensificación de este tipo de investigación. Colbert multiplica las
encuestas sobre artículos manufacturados, el comercio y la población: los intendentes del Reino
envían a París sus memorias. Vauban, más conocido por sus fortificaciones o su Dime Royale, que
es la primera propuesta de un impuesto sobre los ingresos, se señala como el verdadero precursor
de los sondeos. Más tarde, Bufón se preocupa de esos problemas antes de dedicarse a la historia
natural. La escuela inglesa proporciona un nuevo progreso al superar la fase puramente descriptiva.
Sus tres principales representantes son Graunt, Petty y Halley. El penúltimo es autor de la famosa
Aritmética Política. Chaptal, ministro del interior francés, publica en 1801 el primer censo general
de población, desarrolla los estudios industriales, de las producciones y los cambios, haciéndose
sistemáticos durante las dos terceras partes del siglo XIX
3.- Tercera Fase : Estadística y Cálculo de Probabilidades: El cálculo de probabilidades se
incorpora rápidamente como un instrumento de análisis extremadamente poderoso para el estudio
de los fenómenos económicos y sociales y en general para el estudio de fenómenos “cuyas causas
son demasiados complejas para conocerlos totalmente y hacer posible su análisis”.
División de la Estadística
La Estadística para su mejor estudio se ha dividido en dos grandes ramas: la Estadística Descriptiva
y la Inferencial.
Estadística Descriptiva: consiste sobre todo en la presentación de datos en forma de tablas y
gráficas. Esta comprende cualquier actividad relacionada con los datos y está diseñada para
resumir o describir los mismos sin factores pertinentes adicionales; esto es, sin intentar inferir nada
que vaya más allá de los datos, como tales.
Estadística Inferencial: se deriva de muestras, de observaciones hechas sólo acerca de una parte de
un conjunto numeroso de elementos y esto implica que su análisis requiere de generalizaciones que
van más allá de los datos. Como consecuencia, la característica más importante del reciente
crecimiento de la estadística ha sido un cambio en el énfasis de los métodos que describen a métodos
que sirven para hacer generalizaciones. La Estadística Inferencial investiga o analiza una población
partiendo de una muestra tomada.
2
22 Manual de Estadística de David Ruiz , Editado por eumed·net 2004 ISBN: 84-688-6153-7
-
8/19/2019 Copia de Cartilla de Aplicaciones estadisitcas( ASB).pdf
11/48
RECOLECCIÓN DE DATOS Y GRAFICAS
Tabla de Frecuen cias : Las Tablas de frecuencias son herramientas de
Estadística donde se colocan los datos en columnas representando los distintos
valores recogidos en la muestra y las frecuencias (las veces) en que ocurren.
Frecuencia absoluta
La frecuencia absoluta (ni) es el número de veces que aparece un determinado
valor en un estudio estadístico. Número de veces que se repite el í-esimo valor de
la variable. La suma de las frecuencias absolutas es igual al número total de datos,
que se representa por n
Frecuencia absoluta acumulada
La Frecuencia absoluta acumulada (Ni) es la suma de las frecuencias absolutas de
todos los valores inferiores o iguales al valor considerado.
N1 = n1
N2 = n1 + n2 = N1 + n2
N3 = n1 + n2 + n3 = N2 + n3
Nk = n
Frecuen cia relativa:
La frecuencia relativa (fi) es la proporción de veces que se repite un determinado
dato.
La frecuencia relativa es el cociente entre la frecuencia absoluta de un determinado
valor y el número total de datos.
fi = ni/n
La suma de las frecuencias relativas es igual a 1..
-
8/19/2019 Copia de Cartilla de Aplicaciones estadisitcas( ASB).pdf
12/48
Frecuencia relat iva acumulada
La frecuencia relativa acumulada (Fi) es el número de observaciones menores o iguales al
í-esimo valor de la variable pero en forma relativa.
F1 = f l
F2 = f1+ f2 = F1 + f2
F3 = f1+ f2 + f3 = F2 + f3
Fk = 1
Ejemplo:
Supongamos que se tiene una población de 2000 cajas y se desea examinarlas,
con el fin de determinar el número de piezas defectuosas que contiene cada caja.
No existe presupuesto para realizar la investigación detallada, por lo tanto se
selecciona una muestra de tamaño 20.
Tabla de frecuenc ias:
-
8/19/2019 Copia de Cartilla de Aplicaciones estadisitcas( ASB).pdf
13/48
Gráfi co s:
Diagrama de Frecuencias:
Diagrama de frecuencia acumulada:
TABLA DE FRECUENCIA DE DATOS AGRUPADOS
Cuando los datos contienen una gran cantidad de elementos, para facilitar los
cálculos es necesario agruparlos, a estos grupos se los llama intervalos o clases.
Un intervalo es una serie de números incluidos entre dos extremos, así por ejemplo,
el intervalo 40 – 45 está formado por 40, 41, 42, 43, 44 y 45, siendo 40 el límite
inferior, 45 el límite superior, 39,5 límite real inferior (límite inferior disminuido en 5
décimas) y 40,5 el límite real superior (límite superior aumentado en 5 décimas) 3.
3 http://www.monografias.com/trabajos87/distribucion-frecuencias-datos-agrupados-intervalos/distribucion-
frecuencias-datos-agrupados-intervalos.shtml#ixzz3shpjPUel
-
8/19/2019 Copia de Cartilla de Aplicaciones estadisitcas( ASB).pdf
14/48
Reglas:
1-Determinar el valor máximo y mínimo de los datos.
Xmin
Xmax2-Calcular el recorrido R:
R = Xmax – Xmin
3-Calcule el número de intervalos (m) :
Se usa la regla de sturges:
m = 1 +3,3 log n
Se aproxima hacia el entero superior o inferior.
n= tamaño de la muestra
4- Calcular la ancho del intervalo (C) :
=( ( ))/
Cuando el valor de C no es exacto, se debe redondear al valor superior más cercano. Esto
altera el valor de rango por lo que es necesario efectuar un ajuste así:
Nuevo R = m * C
-
8/19/2019 Copia de Cartilla de Aplicaciones estadisitcas( ASB).pdf
15/48
Grafica de datos:
0
10
20
30
40
50
60
243,1 246,1 249,1 252,1 255,1 258,1 261,1 264,0
240 243,1 246,1 249,1 252,1 255,1 258,1 261,1
Grafico deFrecuencias
Frec
-
8/19/2019 Copia de Cartilla de Aplicaciones estadisitcas( ASB).pdf
16/48
UNIDAD 2:
MEDIDAS DE TENDENCIA CENTRAL
Media, Mediana y Mod a para Datos Sueltos
Definiciones:
UNIDAD: es el objeto que observamos, cuando es una persona nos referimos a él comosujeto.OBSERVACIÓN: es la actividad, información o característica que registramos de la unidad.Una característica que varía de unidad en unidad se llama VARIABLE y una colección devariables la llamamos Base de Datos.
Variable Cualitativa : Las variables cualitativas son aquellas que permiten la expresión de
una característica, una categoría, un atributo o una cualidad.
Ej: una persona puede estar “viva” o “muerta”, no hay una tercera opción.
Variable Cualitativa nominal: Una variable cualitativa nominal presenta modalidades nonuméricas que no admiten un criterio de orden.Ej: El estado civil, con las siguientes
modalidades: soltero, casado, separado, divorciado y viudo.
Variable cualitativa ordinal: Una variable cualitativa ordinal presenta modalidades no
númericas, en las que existe un orden. Ej: Medallas de una prueba deportiva: oro, plata,
bronce.
Variable Cuantitativ a : Una variable cuantitativa es la que se expresa mediante un número,
por tanto se pueden realizar operaciones aritméticas con ella.
Variable discreta:
Una variable discreta es aquella que toma valores aislados, es decir noadmite valores intermedios entre dos valores específicos. Ej: El número de hermanos de 4
amigos: 2, 1, 0, 1
-
8/19/2019 Copia de Cartilla de Aplicaciones estadisitcas( ASB).pdf
17/48
Variable continua: Una variable continua es aquella que puede tomar valores comprendidos
entre dos números. Ej: La altura de los 4 amigos: 1.73, 1.82, 1.77, 1.69
LA MEDIA:
Es la medida de posición más utilizada, se define como la suma de los valores observadosdividido entre el número de observaciones.
Se representa: M(x), Ӯ, Ẋ
Para Datos no agrup ados :
Ejemplo:
Se tienen 6 observaciones: 6,2,8,4,5,7
Ẋ=6+2+8+4++7
6= 5,3
Para datos agrup ados :Si los datos vienen agrupados en una tabla de frecuencias, la expresión de la media es:
-
8/19/2019 Copia de Cartilla de Aplicaciones estadisitcas( ASB).pdf
18/48
Ejemplo:
LA MEDIANA
Es el valor que ocupa el lugar central de todos los datos cuando éstos están ordenados de
menor a mayor. La mediana se representa por Me. La mediana se puede hallar sólo para
variables cuantitativas.
Cálculo de la mediana para datos agrupados:
La mediana se encuentra en el intervalo donde la frecuencia acumulada llega hasta
la mitad de la suma de las frecuencias absolutas.
Tenemos que buscar el intervalo en el que se encuentre
Li= es el límite inferior de la clase donde se encuentra la mediana
F i -1= frecuencia acumulada anterior a la clase mediana.
a i =la amplitud de la clase.
-
8/19/2019 Copia de Cartilla de Aplicaciones estadisitcas( ASB).pdf
19/48
Ejemplo:
Cálculo de la mediana para datos no agrupados:
1- Ordenamos los datos de menor a mayor.
2 -Si la serie tiene un número impar de medidas la mediana es la puntuación central de la
misma.
2, 3, 4, 4, 5, 5, 5, 6, 6 Me= 5
3 -Si la serie tiene un número par de puntuaciones la mediana es la media entre las dos
puntuaciones centrales.
7, 8, 9, 10, 11, 12 Me= 9.5
-
8/19/2019 Copia de Cartilla de Aplicaciones estadisitcas( ASB).pdf
20/48
LA MODA:
La moda es el valor que tiene mayor frecuencia absoluta.
Se representa por Mo.
Se puede hallar la moda para variables cualitativas y cuantitativas.
Cálcu lo de la mod a para datos no agru pados:
Hallar la moda de la distribución:
2, 3, 3, 4, 4, 4, 5, 5 Mo= 4
Si en un grupo hay dos o varias puntuaciones con la misma frecuencia y esa frecuencia
es la máxima, la distribución es bimodal o multimodal, es decir, tiene varias modas.
1, 1, 1, 4, 4, 5, 5, 5, 7, 8, 9, 9, 9 Mo= 1, 5, 9
Cuando todas las puntuaciones de un grupo tienen la misma frecuencia, no hay moda.
2, 2, 3, 3, 6, 6, 9, 9
Si dos puntuaciones adyacentes tienen la frecuencia máxima, la moda es el promedio
de las dos puntuaciones adyacentes.
0, 1, 3, 3, 5, 5, 7, 8 Mo = 4
Cálcu lo de la mod a para datos agru pado s
Todos los intervalos tienen la misma amplitud.
-
8/19/2019 Copia de Cartilla de Aplicaciones estadisitcas( ASB).pdf
21/48
Li-1 = l límite inferior de la clase modal.
fi = la frecuencia absoluta de la clase modal.
fi — 1 = la frecuencia absoluta inmediatamente inferior a la en clase modal.
fi-+1 = la frecuencia absoluta inmediatamente posterior a la clase modal.
ai = la amplitud de la clase.
Ejemplo:
UNIDAD 3:
UNI DADES DE DI SPERSION
En el caso de las variables con valores que pueden definirse en términos de alguna escala
de medida de igual intervalo, puede usarse un tipo de indicador que permite apreciar el
grado de dispersión o variabilidad existente en el grupo de variantes en estudio.
A estos indicadores les llamamos medidas de dispersión, por cuanto que están referidos a lavariabilidad que exhiben los valores de las observaciones
Las medidas de tendencia central tienen como objetivo el sintetizar los datos en un valor
representativo, las medidas de dispersión nos dicen hasta que punto estas medidas de
tendencia central son representativas como síntesis de la información. Las medidas de
dispersión cuantifican la separación, la dispersión, la variabilidad de los valores de la
distribución respecto al valor central.
-
8/19/2019 Copia de Cartilla de Aplicaciones estadisitcas( ASB).pdf
22/48
LA DISPERSIÓN.
Al igual que sucede con cualquier conjunto de datos, la media, la mediana y la moda sólo
nos revelan una parte de la información que necesitamos acerca de las características de los
datos. Para aumentar nuestro entendimiento del patrón de los datos, debemos medir
también su dispersión, extensión o variabilidad.
La dispersión es importante porque:
Proporciona información adicional que permite juzgar la confiabilidad de la medida de
tendencia central. Si los datos se encuentran ampliamente dispersos, la posición central es
menos representativa de los datos.
Ya que existen problemas característicos para datos ampliamente dispersos, debemos ser
capaces de distinguir que presentan esa dispersión antes de abordar esos problemas.
Quizá se desee comparar las dispersiones de diferentes muestras. Si no se desea tener unaamplia dispersión de valores con respecto al centro de distribución o esto presenta riesgos
inaceptables, necesitamos tener habilidad de reconocerlo y evitar escoger distribuciones
que tengan las dispersiones más grandes.
Las principales medidas de dispersión son tres: El rango, la desviación media y la
desviación estándar. De manera semejante a las medidas de tendencia central, las medidas
de dispersión deben considerarse en sus dos opciones: cuando no están agrupados los datos
y cuando están por intervalos.
EL RANGO:
El rango es la diferencia entre los datos mayor y menor del conjunto. También se le suele
llamar “recorrido” . En un conjunto de datos, mientras mayor sea el rango, mayor será su
dispersión y, a la inversa, mientras menor sea su rango, menor su dispersión.
En los casos de las temperaturas del ejemplo anterior, el rango de “A” es R = 22 - 19.3 =2.7, en cambio, el de “B” es B = 39 - (-3) = 42.
Rango para datos no agrupados;
R = Xmáx.-Xmín = Xn-X1
-
8/19/2019 Copia de Cartilla de Aplicaciones estadisitcas( ASB).pdf
23/48
Rango para datos agrupados:
Con datos agrupados no se saben los valores máximos y mínimos. Si no hay intervalos de
clases abiertos podemos aproximar el rango mediante el uso de los límites de clases. Se
aproxima el rango tomando el límite superior de la última clase menos el límite inferior de
la primera clase.
R= (lim. Sup. de la clase n – lim. I nf . De la clase 1)
Propiedades del Rango o Recorrido:
El recorrido es la medida de dispersión más sencilla de calcular e interpretar puesto que
simplemente es la distancia entre los valores extremos (máximo y mínimo) en una
distribución
Puesto que el recorrido se basa en los valores extremos éste tiende s ser errático. No es
extraño que en una distribución de datos económicos o comerciales incluya a unos pocos
valores en extremo pequeños o grandes. Cuando tal cosa sucede, entonces el recorrido
solamente mide la dispersión con respecto a esos valores anormales, ignorando a los demás
valores de la variable.
La principal desventaja del recorrido es que sólo esta influenciado por los valores
extremos,, puesto que no cuenta con los demás valores de la variable. Por tal razón, siempre
existe el peligro de que el recorrido ofrezca una descripción distorsionada de la dispersión.
En el control de la calidad se hace un uso extenso del recorrido cuando la distribución a
utilizarse no la distorsionan y cuando el ahorro del tiempo al hacer los cálculos es un factor
de importancia.
-
8/19/2019 Copia de Cartilla de Aplicaciones estadisitcas( ASB).pdf
24/48
DESVIACION MEDIA:
Se define como la media de los valores absolutos de las diferencias entre los valores que
toma la variable y su mediana.
Dado un conjunto de datos cuya media aritmética o promedio es, la diferencia o la distancia
x de cada valor nominal x a la media aritmética se llama desviación del dato x con respecto
a la media. Es decir, es una medición de cuánto se alejó cada valor nominal x x de la media.
La media de los datos anteriores es:
La desviación del dato x = 50 con respecto de la media x es d =−= 50 75 25
La desviación del dato x = 60 con respecto de la media x es d = 60 75 15 − =
y así sucesivamente
LA DESVIACIÓN MEDIA PARA FRECUENCIAS SIMPLES (No agrupados)
Cuando los datos recolectados han sido organizados en una tabla de frecuencias simples, esdecir, sin agrupar, la desviación media DM se calcula por medio de la fórmula:
-
8/19/2019 Copia de Cartilla de Aplicaciones estadisitcas( ASB).pdf
25/48
Ejemplo:
-
8/19/2019 Copia de Cartilla de Aplicaciones estadisitcas( ASB).pdf
26/48
LA DESVIACIÓN MEDIA CON TABLAS POR INTERVALOS ( agrupados)
INTERVALO f x f * x´4-9 12 6,5 78 18,36 220,32
´10-15 11 12,5 137,5 12,36 135,96
´16-21 13 18,5 240,5 6,36 82,68
´22-27 19 24,5 465,5 0,36 6,84
´28-33 21 30,5 640,5 5,64 118,44
´34-39 16 36,5 584 11,64 186,24
´40-45 8 42,5 340 17,64 141,12
TOTALES 100 2486 891,6
Lo que quiere decir que el promedio de alejamiento de todos los valores respecto a la media
es de 8,916
DESVIACION TI PICA o ESTANDAR:
La siguiente medida de dispersión se llama desviación estándar, porque con ella se pueden
estandarizar en todos los casos, todas las desviaciones de datos recolectados.
La desviación estándar se simboliza con la letra griega σ si se trata de una población y con
la letra s si se trata de una muestra.
Aquí el truco para quitar los valores negativos de la resta de x − x es, aproximadamente,
elevar al cuadrado y luego regresar con una raíz cuadrada.
LA DESVIACIÓN ESTÁNDAR PARA FRECUENCIAS SIMPLES ( no ordenados)
Cuando los datos están ordenados en una distribución de frecuencias simples, la desviación
estándar para una población se calcula mediante la fórmula:
| − _| f * | − _|
-
8/19/2019 Copia de Cartilla de Aplicaciones estadisitcas( ASB).pdf
27/48
en donde σ = desviación e stándar de la población σ
f = frecuencia
x = valor nominal
= media aritmética
Cuando los datos están ordenados en una distribución de frecuencias simples, la desviación
estándar para una muestra se calcula mediante la fórmula
-
8/19/2019 Copia de Cartilla de Aplicaciones estadisitcas( ASB).pdf
28/48
LA DESVIACIÓN ESTÁNDAR PARA FRECUENCIAS POR INTERVALOS(agrupados)
Cuando los datos han sido organizados en clases o intervalos, la desviación estándar se
obtiene de manera similar a los procesos anteriores, es decir, con la misma fórmula
aplicada a la organización de frecuencias simples, solamente que x debe ser el punto medio
del intervalo
-
8/19/2019 Copia de Cartilla de Aplicaciones estadisitcas( ASB).pdf
29/48
-
8/19/2019 Copia de Cartilla de Aplicaciones estadisitcas( ASB).pdf
30/48
VARIANZA:
Se define como la media aritmética de los cuadrados de las desviaciones respecto a la
media.
Propiedades de la varianza
σ2≥ La varianza es un valor positivo, como ya se ha comentado anteriormente, la
igualdad sólo se da en el caso de que todas las muestras sean iguales.
Si a todos los datos se les suma una constante, la varianza sigue siendo la misma.
Si todos los datos se multiplican por una constante, la varianza queda multiplicada
por el cuadrado de la constante.
Si se disponen de varias distribuciones con la misma media y se calculan las
distintas varianzas, se puede hallar la varianza total aplicando la fórmula
Var ianza para datos no agrupados:
Más específicamente, la varianza es una medida de que tan cerca, o que tan lejos están los
diferentes valores de su propia media aritmética. Cuando más lejos están las Xi de su propia
media aritmética, mayor es la varianza; cuando más cerca estén las Xi a su media menos es
la varianza.
-
8/19/2019 Copia de Cartilla de Aplicaciones estadisitcas( ASB).pdf
31/48
Ejemplo:
En un partido de baloncesto, se tiene la siguiente anotación en los jugadores de un equipo:
0,2,4,5,8,10,10,15,38. Calcular la varianza de las puntuaciones de los jugadores del equipo.
Cálculo de la varianza para datos agrupados:
En el caso de N muestras agrupadas en n clases se aplica la fórmula:
Ejemplo:
La altura en cm de los jugadores de un equipo está en la siguiente tabla. Calcular la
varianza.
Intervalos
Inf Sup Xi fi
160 170 165 1
170 180 175 2
180 190 185 4
190 200 195 3
200 210 205 2
-
8/19/2019 Copia de Cartilla de Aplicaciones estadisitcas( ASB).pdf
32/48
Adicionar a la tabla las siguientes columnas:
-
8/19/2019 Copia de Cartilla de Aplicaciones estadisitcas( ASB).pdf
33/48
UNIDAD 4:
MEDI DAS DE DISTRIBUCIÓN: FRACTILES .
Las Medidas de Posición, también conocidas como Otras Medidas de Dispersión, son otrasmedidas que resultan ser más prácticos para precisar ciertas situaciones en las que se busca
describir la variación o dispersión en un conjunto de datos.
Tanto las medidas de tendencia central como de dispersión en ocasiones son insuficientes
sobre todo cuando en ocasiones deseamos presentar el análisis con respecto a la posición
que ocupa la información que para nosotros resulta relevante, así por ejemplo, podemos
hablar de dividir la información a la mitad, realizado por la mediana, en cuatro partes, en
cinco, en diez o quizá en otro tipo de divisiones.
Cuar ti les para datos no agrupados:
Son medidas de posición que dividen en cuatro partes porcentuales iguales a una
distribución ordenada de datos.
La forma de calcular los cuartiles cuando los datos no están agrupados se da a través del
siguiente concepto.
Para un número de n observaciones en el que los datos no son representados en clases, una
vez ordenados los datos la posición de los cuartiles se pueden localizar de la siguiente
forma:
En el caso en que la posición no corresponda exactamente con la posición la interpolación se realiza de la siguiente forma:
-
8/19/2019 Copia de Cartilla de Aplicaciones estadisitcas( ASB).pdf
34/48
Ejemplo. Consideremos la siguiente tabla de temperaturas reportadas en un experimento:
Cuar ti les para datos agrupados:
Para datos agrupados los cuartiles debe e primer lugar buscar la clase donde se encuentra
En la tabla de frecuencias acumuladas
-
8/19/2019 Copia de Cartilla de Aplicaciones estadisitcas( ASB).pdf
35/48
L i es el l ímite inferior de la clase donde se encuentra la
mediana.
N es la suma de las frecuencias absolutas.
F i -1 es la frecuencia acumulada anterior a la clase
mediana.
a i es la amplitud de la clase.
Ejemplo:
Calcular los cuartiles de la distribución de la tabla:
-
8/19/2019 Copia de Cartilla de Aplicaciones estadisitcas( ASB).pdf
36/48
Deciles
Los deciles son los nueve valores que dividen la serie de datos en diez partes iguales.
Los deciles dan los valores correspondientes al 10%, al 20%... y al 90% de los datos.
Deciles para datos no agrupados :
Paso1: Ordenamos los datos de menor a mayor
Paso2: Dividir las observaciones en 10 partes iguales cada parte representa el 10% deltotal
-
8/19/2019 Copia de Cartilla de Aplicaciones estadisitcas( ASB).pdf
37/48
Paso3: Buscamos el lugar que ocupa cada decil mediante la expresión
Cuando es par :
Cuando es impar:
. ( 1)10
Di= Li + (Ls- Li)* excedente posición k
-
8/19/2019 Copia de Cartilla de Aplicaciones estadisitcas( ASB).pdf
38/48
Ejemplo:
Calcular los deciles de los datos ordenados:
Decil es para datos agrupados:
En primer lugar buscamos la clase donde se encuentra
en la tabla de las frecuencias acumuladas.
Li es el límite inferior de la clase donde se encuentra la mediana.
N es la suma de las frecuencias absolutas.
Fi-1 es la frecuencia acumulada anterior a la clase mediana.
ai es la amplitud de la clase.
-
8/19/2019 Copia de Cartilla de Aplicaciones estadisitcas( ASB).pdf
39/48
Ejemplo:
-
8/19/2019 Copia de Cartilla de Aplicaciones estadisitcas( ASB).pdf
40/48
Percentiles.
Los percentiles son los 99 valores que dividen la serie de datos en 100 partes iguales.
Los percentiles dan los valores correspondientes al 1%, al 2%... y al 99% de los datos.
P50 coincide con la mediana.
En primer lugar buscamos la clase donde se encuentra
, en la tabla de las frecuencias acumuladas. Luego usamos la fórmula:
Li es el límite inferior de la clase donde se encuentra la mediana.
N es la suma de las frecuencias absolutas.
Fi-1 es la frecuencia acumulada anterior a la clase mediana.
ai es la amplitud de la clase.
-
8/19/2019 Copia de Cartilla de Aplicaciones estadisitcas( ASB).pdf
41/48
Ejemplo:
Calcular el percentil 35 y 60 de la distribución de la tabla:
-
8/19/2019 Copia de Cartilla de Aplicaciones estadisitcas( ASB).pdf
42/48
UNIDAD 5:
REGRESIÓN Y CORRELACIÓN L INEAL 4
Regresión :
Es un método estadístico desarrollado para investigar relaciones entre variables.
El análisis de regresión genera una ecuación matemática que permite describir la relación
existente entre dos variables. Se obtiene una línea conocida como línea de regresión que
nos describe la relación o dependencia entre las dos variables.
Esta línea o función matemática, en el caso de una variable dependiente ( una influye sobre
la otra) se puede expresar a través de :
Una recta y = a +bx
Parábola = 2
Potencial =
Exponencial =
REGRESIÓN LINEAL:
Es el análisis que más se usa por su simplicidad, en muchos casos de la vida real se ajustan
lo suficiente para ser aceptada.
Está dada la relación lineal por la ecuación de la forma:
y = a +bx
Y= variable a estimar x= variable independiente
b= es la pendiente de la recta, o inclinación
a= coeficiente de posición u origen en la ordenada. Intercepto de la línea con el eje y
4 Estadistica y muestreo , Ciro Martinez, Pag 561
-
8/19/2019 Copia de Cartilla de Aplicaciones estadisitcas( ASB).pdf
43/48
-
8/19/2019 Copia de Cartilla de Aplicaciones estadisitcas( ASB).pdf
44/48
CORRELACION:
Es el grado de relación existente entre dos variables.
Cuando existe correlación total entre dos variables se cumple que para cada valor
de una le corresponde un único valor de la otra variable.
El requisito esencial para utilizar esta técnica es que ambos conjuntos de datos por
relacionar se puedan cuantificar, por eso se habla de las dos variables una
dependiente y otra independiente, la dependiente se dibuja en el eje Y y la
independiente en el eje X.
-
8/19/2019 Copia de Cartilla de Aplicaciones estadisitcas( ASB).pdf
45/48
Coeficiente de correlación:
El coeficiente de correlación “R” mide el grado de relación entre las
dos variables. Este varía desde -1 a +1.
I nterpretación del Coeficiente de corr elación :
FUERTE CORRELACION POSITIVA: significa que si están correlacionadas la
causa con el efecto. Por tanto si usted controla la causa podrá predecir qué sucederá
con el efecto, ya que en la medida que la causa aumente o disminuya en magnitud
sucederá lo mismo con el efecto.
FUERTE CORRELACIÓN NEGATIVA: En esta también se puede predecir qué
sucederá con el efecto, pero esta vez si la magnitud de la causa aumenta entonces el
efecto disminuye y viceversa.
CORRELACIÓN DÉBIL POSITIVA O NEGATIVA: significa que el efecto estudiando
no se puede explicar solamente por la causa estudiada y existen otras variables que
determinan su comportamiento. En estos casos se requiere utilizar otras técnicas
más complejas como el Diseño de Experimentos o el análisis de variable múltiple.
NINGUNA CORRELACIÓN: es útil también determinar que no existe ningunarelación entre las dos variables analizadas, ya que lo que se creía podía ser la con
el efecto estudiado y por tanto se descarta como factor de análisis.
-
8/19/2019 Copia de Cartilla de Aplicaciones estadisitcas( ASB).pdf
46/48
Ejemplo:
-
8/19/2019 Copia de Cartilla de Aplicaciones estadisitcas( ASB).pdf
47/48
Fuerte correlación positiva
-
8/19/2019 Copia de Cartilla de Aplicaciones estadisitcas( ASB).pdf
48/48