asignatura: estadistica descriptiva. docente:ing. rafael...
TRANSCRIPT
Asignatura: Estadistica Descriptiva.
Docente:Ing. Rafael Sandino Salcedo Muñoz
Semestre: Tercero.
2 Ing. Rafael Sandino Salcedo Muñoz
GUIA DE ESTUDIO I. DATOS INFORMATIVOS
NOMBRE DE LA CARRERA: Técnico Superior en Gestión De Producción Y
Servicios
ESTADO DE LA CARRERA: Vigente _X_ No vigente solo para registro de títulos _
NIVEL: Técnico
TIPO DE CARRERA: Tradicional
NOMBRE DE LA SIGNATURA: Estadística Descriptiva
CÓD. ASIGNATURA:
PRE – REQUISITO: BM-S1-MABA
CO – REQUISITO:
TOTAL HORAS: 228
Componente docencia: 88
Componente de prácticas de aprendizaje: 65
Componente de aprendizaje autónomo: 75
SEMESTRE: Tercero PARALELO: “A”
PERIODO ACADÉMICO: noviembre 2019 – abril 2020 (IIPA 2019)
MODALIDAD: Presencial
DOCENTE RESPONSABLE: Ing. Rafael Sandino Salcedo Muñoz.
Copyright©2020 Instituto Superior Tecnológico Ismael Pérez Pazmiño. All rights reserved.
Estadística Descriptiva
3
Índice
GUIA DE ESTUDIO ................................................................................................... 2
PRESENTACION ....................................................................................................... 7
Sistema General de conocimientos ......................................................................... 7
SYLLABUS DE LA ASIGNATURA ............................................................................. 8
I. DATOS INFORMATIVOS .................................................................................... 8
II FUNDAMENTACIÓN ....................................................................................... 8
III. OBJETIVOS ESPECÍFICOS .............................................................................. 9
IV. CONTENIDOS .................................................................................................. 9
V. PLAN TEMÁTICO............................................................................................. 10
VI. SISTEMA DE CONTENIDOS POR UNIDADES DIDÁCTICAS ........................ 10
VII ORIENTACIONES METODOLÓGICAS Y DE ORGANIZACIÓN DE LA
ASIGNATURA. ..................................................................................................... 14
VIII. RECURSOS DIDÁCTICOS ........................................................................... 16
IX. SISTEMA DE EVALUACIÓN DE LA ASIGNATURA ........................................ 16
X. BIBLIOGRAFÍA BÁSICA Y COMPLEMENTARIA ............................................. 18
ORIENTACIONES PARA EL USO DE ESTA GUIA. ................................................ 19
DESARROLLO DE ACTIVIDADES. ......................................................................... 20
Unidad didáctica I. Introducción A La Estadística Descriptiva .................................. 20
INTRODUCCION. ................................................................................................. 20
Actividad De Aprendizaje I De La Unidad Didactica I ............................................ 21
Importancia ........................................................................................................... 21
Variables cualitativas ............................................................................................ 22
Variables Cuantitativas ......................................................................................... 23
Variable discreta ................................................................................................... 23
Variable continua: ................................................................................................. 23
Muestra................................................................................................................. 23
Población .............................................................................................................. 23
Niveles De Medición ............................................................................................. 24
Nivel Nominal........................................................................................................ 24
Nivel Ordinal ......................................................................................................... 25
Nivel de Intervalo .................................................................................................. 25
Nivel de Proporción o Razón ................................................................................ 25
Actividades de Auto - Evaluación De La Unidad I ................................................. 26
Actividad Final Unidad I ........................................................................................ 27
DESARROLLO DE ACTIVIDADES. ......................................................................... 29
4 Ing. Rafael Sandino Salcedo Muñoz
Unidad didáctica II. Presentación y Análisis de Datos ............................................. 29
INTRODUCCION. ................................................................................................ 29
Objetivo ................................................................................................................ 29
ACTIVIDADES DE APRENDIZAJE DE LA UNIDAD DIDACTICA II ..................... 29
Actividad De Aprendizaje I De La Unidad Didactica II .......................................... 29
Ejemplo 1. ............................................................................................................ 31
Foro: ............................................................................................................ 32
Ejemplo 3. ............................................................................................................ 32
Diagrama de Tallo y Hoja. .................................................................................... 34
Actividad De Aprendizaje II De La Unidad Didáctica II ......................................... 36
Representación Gráfica de una Distribución de Frecuencias. .............................. 36
Polígono de Frecuencia ....................................................................................... 36
Punto medio de clase ........................................................................................... 36
Histograma. .......................................................................................................... 37
Tarea- .................................................................................................................. 38
Polígono De Frecuencia Acumulada .................................................................... 38
Diagrama Circular ................................................................................................ 39
Diagrama de Barras ............................................................................................. 40
Actividades de Auto - Evaluación De La Unidad II................................................ 43
Actividad Final de la Unidad II .............................................................................. 43
1.-......................................................................................................................... 43
DESARROLLO DE ACTIVIDADES. ........................................................................ 46
Unidad didáctica III. Medidas De Tendencia Central ............................................... 46
INTRODUCCION. ................................................................................................ 46
ACTIVIDADES DE APRENDIZAJE DE LA UNIDAD DIDACTICA III .................... 47
Actividad De Aprendizaje I De La Unidad Didactica III ......................................... 47
Media Aritmética Datos No Agrupados ................................................................. 47
Media Muestral..................................................................................................... 47
Estadístico ........................................................................................................... 47
Media Poblacional ................................................................................................ 49
Parámetro ............................................................................................................ 49
Media Geométrica ................................................................................................ 50
Aumento Porcentual Promedio Para Un Periodo Determinado ............................ 50
Media Ponderada ................................................................................................. 51
La Mediana Para Datos No Agrupados ................................................................ 52
Estadística Descriptiva
5
La Moda ................................................................................................................ 52
Actividad De Aprendizaje II De La Unidad Didactica III ......................................... 55
Medidas De Tendencia Central Para Datos Agrupados. ....................................... 55
La Media Aritmética .............................................................................................. 55
La Mediana. .......................................................................................................... 56
La Moda ................................................................................................................ 57
Posiciones Relativas de la Media, Mediana y Moda. ............................................ 57
Sesgo Positivo ...................................................................................................... 59
Sesgo Negativo .................................................................................................... 60
Actividades de Auto - Evaluación De La Unidad III ............................................... 63
Actividad Final de la Unidad III .............................................................................. 63
DESARROLLO DE ACTIVIDADES. ......................................................................... 64
Unidad didáctica IV. Medidas de Dispersión ......................................................... 64
INTRODUCCION. ................................................................................................. 64
ACTIVIDADES DE APRENDIZAJE DE LA UNIDAD DIDACTICA IV ..................... 65
Actividad De Aprendizaje I De La Unidad Didactica IV ......................................... 65
Medidas De Dispersión Para Datos No Agrupados ............................................... 65
Amplitud de Variación ........................................................................................... 65
Desviación Media ................................................................................................. 65
Varianza Y Desviación Estándar. .......................................................................... 66
Varianza ............................................................................................................... 66
Desviación Estándar ............................................................................................. 66
Varianza Poblacional ............................................................................................ 66
Desviación Estándar Poblacional .......................................................................... 66
Varianza Muestral. ................................................................................................ 67
Formula De La Desviación .................................................................................... 68
Formula Directa .................................................................................................... 68
Desviación Estándar Muestral .............................................................................. 68
Desviación Estándar, Formula Directa .................................................................. 69
Actividad De Aprendizaje II De La Unidad Didactica IV......................................... 69
Medidas De Dispersión Para Datos Agrupados. ................................................... 69
Amplitud De Variación .......................................................................................... 69
Desviación Estándar ............................................................................................. 70
Desviación Estándar Directa Para Datos Agrupados ............................................ 70
Interpretación Y Usos De La Desviación Estándar ................................................ 71
6 Ing. Rafael Sandino Salcedo Muñoz
Teorema De Chebyshev. ..................................................................................... 71
La Regla Empírica ................................................................................................ 72
Dispersión Relativa .............................................................................................. 73
Coeficiente De Variación.- .................................................................................... 73
Asimetría .............................................................................................................. 74
Coeficiente De Asimetría de Pearson ................................................................... 75
Coeficiente De Asimetría De Software ................................................................. 75
Actividad De Aprendizaje III De La Unidad Didactica IV ....................................... 78
Otras Medidas de Dispersión ............................................................................... 78
Cuartiles, Deciles Y Centiles ................................................................................ 78
Diagramas De Caja .............................................................................................. 79
Actividades de Auto - Evaluación De La Unidad IV .............................................. 82
DESARROLLO DE ACTIVIDADES. ..................................................................... 84
Unidad didáctica V. Probabilidad. ............................................................................ 84
INTRODUCCION. ................................................................................................ 84
ACTIVIDADES DE APRENDIZAJE DE LA UNIDAD DIDACTICA V ..................... 85
Actividad De Aprendizaje I De La Unidad Didáctica V .......................................... 85
Probabilidad.- ....................................................................................................... 85
Regla Especial De La Adición .............................................................................. 87
Reglas de la multiplicación ................................................................................... 88
Diagramas De Árbol ............................................................................................. 91
Actividad De Aprendizaje II De La Unidad Didáctica V ......................................... 93
Teorema de Bayes ............................................................................................... 93
Foro. .................................................................................................................... 94
Diferencias entre Permutaciones y Combinaciones. ............................................ 94
Principios De Conteo.- ......................................................................................... 94
Fórmula De Las Combinaciones .......................................................................... 97
Actividades de Auto - Evaluación De La Unidad V ............................................... 99
Actividad Final Unidad V ...................................................................................... 99
Estadística Descriptiva
7
PRESENTACION Señores estudiantes, de parte del INSTIPP reciban nuestro saludo y deseándoles de
antemano se sientan a gusto en nuestra institución. El preparar este material, es para
poder contribuir en alguna manera a la mejora del proceso enseñanza aprendizaje,
consta de elementos básicos que lo orientaran en este proceso, como son principios
básicos de la Estadística Descriptiva, hacer la presentación y descripción de datos, el
estudio de las medidas de tendencia central para datos agrupados y no agrupados,
luego las medidas de dispersión y concluir con una introducción a las probabilidades.
La guía plantea lecturas, trabajos prácticos y el respaldo conceptual de los autores
que se citen.
Tratamos de hacer más fácil el proceso de enseñanza – aprendizaje, pero es
necesario interactuar. Para esto estamos Considerando cinco unidades didácticas:
Sistema General de conocimientos
Unidad I.- INTRODUCCION A LA ESTADISTICA DESCRIPTIVA. Unidad II.- PRESENTACION Y ANALISIS DE DATOS
Unidad III.- MEDIDAS DE TENDENCIA CENTRAL Unidad IV.- MEDIDAS DE DISPERSION Unidad V.- PROBABILIDAD.
8 Ing. Rafael Sandino Salcedo Muñoz
INSTITUTO SUPERIOR TECNOLÓGICO
“ISMAEL PÉREZ PAZMIÑO
SYLLABUS DE LA ASIGNATURA
I. DATOS INFORMATIVOS
NOMBRE DE LA CARRERA: Técnico Superior en Gestión De Producción Y
Servicios
ESTADO DE LA CARRERA: Vigente _X_ No vigente solo para registro de títulos _
NIVEL: Técnico
TIPO DE CARRERA: Tradicional
NOMBRE DE LA SIGNATURA: Estadística Descriptiva
CÓD. ASIGNATURA:
PRE – REQUISITO: BM-S1-MABA
CO – REQUISITO:
TOTAL HORAS: 228
Componente docencia: 88
Componente de prácticas de aprendizaje: 65
Componente de aprendizaje autónomo: 75
SEMESTRE: Tercero PARALELO: “A”
PERIODO ACADÉMICO: noviembre 2019 – abril 2020 (IIPA 2019)
MODALIDAD: Presencial
DOCENTE RESPONSABLE: Ing. Rafael Sandino Salcedo Muñoz.
II FUNDAMENTACIÓN
La Estadística Descriptiva es una asignatura Teórica- Práctica, que busca que el
estudiante use el razonamiento lógico y crítico en soluciones de problemas de Gestión
De Producción Y Servicios en la vida cotidiana.
En cuanto a la importancia de esta disciplina para el Técnico De Gestión De
Producción Y Servicios juega un papel muy significativo pues constituye una
herramienta fundamental para el análisis y toma de decisiones de las actividades que
realiza el futuro profesional en esta área.
Ya que el Técnico De Gestión De Producción Y Servicios trata de conceptos que son
esencialmente cuantitativos y cualitativos, en su gran mayoría la toma de decisiones
tiene una aplicación obligadamente Estadística, proporcionando ésta una estructura
sistemática y lógica dentro de la cual pueden estudiarse las relaciones cuantitativas y
cualitativas de esta área de estudio.
Con este acercamiento surge la necesidad de comprender la teoría estadística,
realizar problemas de distribución de frecuencias y representaciones gráficas, calcular
medidas de tendencia central, medidas de dispersión, comprendiendo y resolviendo
problemas de probabilidades, que permiten procesos del pensamiento creativo y
abstracto.
Estadística Descriptiva
9
Por lo que Estadística Descriptiva toma al razonamiento lógico matemático como
objeto de estudio para la modelización de situaciones que permitan dinamizar el
siguiente objetivo:
Resolver problemas estadísticos a nivel superior sobre distribución de frecuencias,
analizar y criticar gráficos estadísticos, realizar cálculos de medidas de tendencia
central y otras medidas descriptivas así como también problemas de probabilidades,
por medio del sustento teórico científico y formulación respectiva que empleen
procesos estadísticos, de demostración, principios, leyes y procedimientos, que nos
permitan la evaluación de resultados en problemas de la vida diaria, alcanzando
creatividad y criticidad en la manipulación de información estadística, presentadas a
través de gráficas y análisis de la información estudiada.
III. OBJETIVOS ESPECÍFICOS
Unidad I.- Aplicar los conocimientos básicos, con la ayuda de los constructos
teóricos para la solución a problemas de la actividad profesional con
responsabilidad.
Unidad II.- Organizar los datos obtenidos a través de un cuadro de distribución de
frecuencias para presentarlos a través de una gráfica e interpretar los
resultados con exactitud.
Unidad III.- Calcular las Medidas de Tendencia Central a través de los algoritmos de
resolución para una correcta toma de decisiones y con mucha
responsabilidad.
Unidad IV.- Calcular las Medidas de Dispersión, con el apoyo de las respectivas
formulaciones existentes para aplicarlos en el ámbito profesional con
mucha responsabilidad.
Unidad V.- Calcular las probabilidades, mediante las reglas de la adición y
multiplicación, para ubicar con exactitud los valores calculados.
IV. CONTENIDOS
Sistema General de conocimientos
Unidad I.- INTRODUCCION A LA ESTADISTICA DESCRIPTIVA.
Unidad II.- PRESENTACION Y ANALISIS DE DATOS
Unidad III.- MEDIDAS DE TENDENCIA CENTRAL
Unidad IV.- MEDIDAS DE DISPERSION
Unidad V.- PROBABILIDAD.
Sistema General de Habilidades
Unidad I.- Aplicar los conocimientos básicos.
Unidad II.- Organizar los datos obtenidos
Unidad III.- Calcular las Medidas de Tendencia Central
Unidad IV.- Calcular las Medidas de Dispersión
Unidad V.- Calcular las probabilidades
10 Ing. Rafael Sandino Salcedo Muñoz
Sistema General de Valores
Unidad I.- Responsabilidad al desarrollar el trabajo autónomo.
Unidad II.- Exactitud en el trabajo en equipo.
Unidad III.- Responsabilidad al compartir las ideas en el aula.
Unidad IV.- Responsabilidad al presentar los trabajos de investigación.
Unidad V.- Exactitud al resolver los ejercicios en el aula.
V. PLAN TEMÁTICO
DESARROLLO DEL PROCESO CON TIEMPO EN
HORAS
TEMAS DE LA ASIGNATURA C CP S CE T L E THP TI THA
Introducción A La Estadística
Descriptiva. 2 7 2 4 - 4 19 15 34
Presentación Y Análisis De
Datos 2 25 2 4 - 2 35 15 50
Medidas De Tendencia Central 3 25 2 4 3 37 15 52
Medidas De Dispersión 2 20 2 4 - 3 31 15 46
Probabilidad. 2 16 2 4 - 3 27 15 42
EXAMENES 4 4 4
Total, de horas 11 93 10 20 - 19 153 75 228
Nomenclatura:
C - Conferencias.
S - Seminarios.
CP - Clases prácticas.
CE - Clase encuentro.
T - Taller.
L - Laboratorio.
E - Evaluación.
THP - Total de horas presenciales.
TI - Trabajo independiente.
THA - Total de horas de la asignatura.
VI. SISTEMA DE CONTENIDOS POR UNIDADES DIDÁCTICAS
Unidad I: Conceptos Básicos
Objetivo: Aplicar los conocimientos básicos, con la ayuda de los constructos
teóricos para la solución a problemas de la actividad profesional con responsabilidad.
Sistema de conocimientos Sistema de habilidades Sistema de Valores
Introducción.
Que es estadística.
Por qué estudiar estadística.
Tipos de estadística.
Identificar palabras claves
sobre el tema.
Estudiar conceptos básicos
Aplicar en la solución de
problemas de la profesión.
Diferenciar los tipos de
estadísticas.
Responsabilidad al
desarrollar el trabajo
autónomo conceptual
de lo importante que
es estudiar
estadística.
Estadística Descriptiva
11
Sistema de conocimientos Sistema de habilidades Sistema de Valores
Tipos de variables.
Niveles Medición.
Evaluación de la unidad.
Reconocer los tipos de
variables.
Aplicar los niveles de
medición.
Desarrollar problemas
prácticos y conceptuales
Responsabilidad en
reconocer los tipos de
variables y los niveles
de medición.
Unidad II: Presentación y Análisis de Datos
Objetivo: Organizar los datos obtenidos a través de un cuadro de distribución de
frecuencias para presentarlos a través de una gráfica e interpretar los resultados con
exactitud.
Sistema de conocimientos Sistema de habilidades Sistema de Valores
Introducción.
Distribución de frecuencias.
Representación de tallo y hoja.
Representaciones gráficas.
Otras representaciones
gráficas.
Graficas engañosas.
Evaluación de la unidad.
Relacionar acertadamente la
introducción a la distribución
de frecuencias.
Resolver problemas de
distribución de frecuencias.
Representar información de
tallo y hoja.
Construir gráficos
estadísticos.
Construir otros gráficos de
frecuencias.
Interpretar graficas
engañosas.
Resolver problemas de la
unidad
Exactitud para
entender y elaborar los
cuadros de
distribución de
frecuencias.
Exactitud en el manejo
de información y al
compartir los
conocimientos
adquiridos en la forma
de realizar e
interpretar las
representaciones
graficas.
Unidad III: Medidas De Tendencia Central
Objetivo: Calcular las Medidas de Tendencia Central a través de los algoritmos de
resolución para una correcta toma de decisiones y con mucha responsabilidad el valor
medio más representativo adoptarlo.
Sistema de conocimientos Sistema de habilidades Sistema de Valores
Introducción.
Media poblacional.
Media muestral.
Propiedades de la media
aritmética.
Media ponderada.
Mediana.
Moda.
Conceptualizar las medidas
de tendencia central.
Calcular la media poblacional.
Calcular la media muestral
Aplicar las propiedades de la
media aritmética.
Calcular la media ponderada.
Calcular la mediana.
Calcular la moda.
Responsabilidad
durante el trabajo en
equipo, en el cálculo
de las medidas de
tendencia central.
12 Ing. Rafael Sandino Salcedo Muñoz
Sistema de conocimientos Sistema de habilidades Sistema de Valores
Media geométrica.
Media, mediana y moda para
datos agrupados.
Posiciones relativas de la
media, mediana y moda
Evaluación de la unidad
Calcular la media geométrica.
Calcular la media, mediana y
moda para datos agrupados.
Determinar las posiciones
relativas de la media,
mediana y moda.
Resolver problemas de la
unidad
Responsabilidad para
analizar las posiciones
relativas de las
medidas de tendencia
central
Unidad IV: Medidas de Dispersión
Objetivo: Calcular las medidas de dispersión, con el apoyo de las respectivas
formulaciones existentes para aplicarlos en el ámbito profesional con mucha
responsabilidad.
Sistema de conocimientos Sistema de habilidades Sistema de Valores
Introducción.
Medidas de dispersión para
datos no agrupados: amplitud
de variación, desviación media,
varianza y desviación estándar.
Medidas de dispersión para
datos agrupados: amplitud de
variación, desviación estándar.
Interpretación y usos de la
desviación estándar: teorema
de chebyshev, regla empírica.
Dispersión relativa.
Asimetría.
Asimilar la teoría de otras
medidas descriptivas
Calcular las medidas de
dispersión para datos no
agrupados, amplitud de
variación, la desviación
media, y la desviación
estándar.
Determinar las medidas de
dispersión para datos
agrupados: amplitud de
variación y desviación
estándar.
Interpretar la desviación
estándar: teorema de
Chebyshev y la regla
empírica.
Estimar la dispersión relativa.
Determinar la asimetría.
Calcular otras medidas de
dispersión: deciles, centiles y
Responsabilidad en el
cumplimiento y
entrega de tareas.
Responsabilidad en el
cálculo de las otras
medidas descriptivas.
Estadística Descriptiva
13
Sistema de conocimientos Sistema de habilidades Sistema de Valores
Otras medidas de dispersión:
cuartiles, deciles, centiles,
diagramas de caja.
Evaluación de la unidad.
cuartiles y representarlos en
un diagrama de cajas.
Aplicar lo tratado en la unidad
Unidad V: Probabilidad.
Objetivo: Calcular las probabilidades de diferentes eventos, mediante las reglas
de la adición y multiplicación, y que se ubique con exactitud los valores calculados.
Sistema de conocimiento Sistema de habilidades Sistema de Valores
Introducción.
Concepto de probabilidad.
Enfoques de la probabilidad.
Algunas reglas de
probabilidad.
Diagramas de árbol.
Teorema de Bayes.
Principios de conteo.
Fórmulas de la permutación y
combinación.
Interpretar los principios
generales de la teoría de la
probabilidad.
Analizar los conceptos de
probabilidad.
Analizar los modelos de
distribuciones de probabilidad.
Interpretar las reglas de
probabilidad.
Construir correctamente el
diagrama de árbol.
Aplicar el teorema de Bayes en la
solución de las probabilidades.
Aplicar los principios de
Conteo en la solución de
probabilidades.
Analizar el comportamiento de
las variables con independencia,
en las permutaciones y
combinaciones
Exactitud al trabajar
valores y Compartir
los conocimientos
adquiridos en las
tareas de
investigación.
Exactitud al Valorar
los procesos
matemáticos y la
aplicación de las
diversas fórmulas de
permutación
14 Ing. Rafael Sandino Salcedo Muñoz
VII ORIENTACIONES METODOLÓGICAS Y DE ORGANIZACIÓN DE LA
ASIGNATURA.
Las clases se desarrollarán en cuatro unidades, tomando en cuenta el siguiente
proceso:
Controles de lectura: Se indica la temática a trabajarse al estudiante, el miso
que tiene que revisar el sustento teórico para compartir en la sala de clase.
Resúmenes de clase: El estudiante en cada clase tomará apuntes de las partes
esenciales, las mismas que serán validadas la clase siguiente mediante
preguntas simples por participación voluntaria.
Actividades extra clase: Consisten en resolución de sistemas de ejercicios o
problemas propuestos por cada temática.
Talleres o actividades intra clase: Se entregará un material de apoyo teórico el
mismo que se lo debe de resolver con el direccionamiento del docente,
respetando los niveles de asimilación: Familiarización, Reproducción,
Producción y Creación.
Participación activa en la pizarra: Esta se desarrollará de acuerdo a la temática,
por participación voluntaria o elección al azar, para la validación de procesos y
algoritmos de resolución.
Trabajos de investigación: Consiste en procesos de carácter investigativo en el
cual el estudiante pone de manifiesto su creatividad al proponer organizadores
gráficos, con ejemplos y caracterizaciones del sustento teórico de la temática
consultada.
GeoGebra: Aplicación de sistemas de ejercicios o problemas propuestos de las
temáticas inferidas en los que se tiene que evaluar usando el programa
GeoGebra.
Trabajos colaborativos: Se formarán grupos de trabajo para la solución de
problemas propuestos usando a mediación tecnológica para la consecución de
los informes.
Portafolio: Será revisado por evaluaciones tomadas a los estudiantes
(parciales, finales y supletorias) y servirá como material de apoyo teórico, en el
mismo se acumulará todos los trabajos desarrollados dentro y fuera de clase.
Actividades EVA: Se trabaja con el entorno virtual AMAUTA, en el que se
enviarán tareas y se contará con un espacio de ideologización entre
estudiantes con el direccionamiento de preguntas disparadoras o generadoras
de conflictos socio cognitivos, a través de foros de discusión permitiendo
reflexiones metacognitivas en cada aporte.
Para el desarrollo de la asignatura los estudiantes tienen el apoyo de links en el blog,
en los cuales se ha subido direcciones de libros de consulta o textos guías.
Al final de cada unidad se realizarán clases prácticas de vinculación en una institución
nocturna, para evidenciar lo asimilado en cada clase, es decir serán cuatro clases
prácticas por semestre.
Los métodos utilizados son:
Estadística Descriptiva
15
Método Reproductivo:
Método Explicativo y Método Ilustrativo: El alumno se apropia de conocimientos
elaborados y los reproduce mediante modos de actuación. El docente explica y dirige
la clase mientras el estudiante atiende y asimila los conocimientos. El estudiante
ilustra a través de ejemplos la temática inferida.
Método de Exposición Problemática: Es un método intermedio, pues supone la
asimilación de la información elaborada y de elementos de la actividad creadora. Se
establecen grupos de trabajo, facilita cierta información y permite al estudiante que
contribuya con su creatividad, ejemplifica los algoritmos de resolución de problema y
se colabora con el estandarte para la creación de su propio ejercicio.
Método Productivo:
Método Heurístico o de Búsqueda parcial de Método Investigativo. - Permite al
estudiante alcanzar conocimientos nuevos, como resultado de la actividad creadora.
El docente estimula a la investigación, y con dicha información realiza talleres de
producción textual y estimula al mismo a crear sus propios ejercicios.
Las Técnicas de Enseñanza se detallan a continuación:
Del interrogatorio: En el uso de preguntas y respuestas para obtener información y
puntos de vista de aplicación de lo aprendido, mediante esta técnica se pretende
despertar y conservar el interés, se exploran experiencias, capacidad, criterio de los
estudiantes y comunicación de ellos.
ÇDel redescubrimiento: Realizar un aprendizaje satisfactorio y efectivo en el cual el
estudiante observa, piensa y realiza.
De la discusión dirigida: Realizar un análisis, una confrontación, una clasificación de
hechos, situaciones, experiencias, problemas, con presencia de docente. Se centra
en la discusión, en el cual se obtienen conclusiones positivas o valederas.
Operatoria: Consiste en realizar actividades de operaciones que permitan el
razonamiento y la comprensión facilitando el aprendizaje
De la resolución de problemas: Permite solucionar problemas matemáticos mediante
un orden lógico, secuencial, práctico y de razonamiento.
Lluvia de ideas: El grupo actúa en un plano de confianza, libertad e informalidad y sea
capaz de pensar en alta voz, sobre un problema, tema determinado y en un tiempo
señalado.
Diálogos simultáneos: Lograr la participación de un gran grupo, dividido en parejas,
respecto a un tema de estudio, trabajo, tarea o actividad.
Del informe o trabajo escrito: En elaborar pasos para trabajos escritos con estilo
propio.
16 Ing. Rafael Sandino Salcedo Muñoz
Foros de discusión: Ingresar a AMAUTA para que dejen sus opiniones sobre temáticas
formuladas en la pantalla del foro y en el blog creado para reforzar la asignatura en
http://matematicaemiliojacomeinstituto.blogspot.com.
Habrá tres documentos pedagógicos básicos que permiten evidenciar los resultados
de las actividades del trabajo autónomo y de grupos, desarrollados a partir del sílabo
de la asignatura.
Carpeta con trabajos extractase e intraclase, grupales (hasta 3 a 5 alumnos).
Desarrollo de ejercicios aplicados a la teoría.
Carpeta de trabajos autónomos. En especial consultas sobre temas especiales
y que hayan sido sustentados demostrando su dominio.
Registro de avance académico. Revisión de trabajos extractase, trabajos
autónomos, lecciones orales en el aula, pruebas escritas y exámenes escritos.
Evidencia el cumplimiento y la calidad del trabajo.
VIII. RECURSOS DIDÁCTICOS
Básicos: marcadores, borrador, pizarra de tiza líquida.
Audiovisuales: Computador, proyector, celulares inteligentes, tabletas, laptops y
laboratorio de computación.
Técnicos: Materiales de apoyo complementarios, Sistemas de ejercicios de
aplicación práctica, Documentos de apoyo, Separatas, texto básico, guías de
observación, tesis que reposan en biblioteca.
IX. SISTEMA DE EVALUACIÓN DE LA ASIGNATURA
El sistema de evaluación será sistemático, participativo y permanente con el objetivo
de adquirir las habilidades y destrezas cognitivas e investigativas que garanticen la
calidad e integridad de la formación profesional y la valoración integral de los
aprendizajes.
Para la respectiva evaluación se valorará la gestión de aprendizaje propuestos por el
docente y con la interacción directa y colaborativa de los estudiantes, la gestión de la
práctica y experimentación de los estudiantes, y la gestión de aprendizaje que los
estudiantes propondrán mediante la investigación que se verá evidenciado en el
trabajo autónomo.
Se tomó como referencia el Reglamento del Sistema Interno de Evaluación Estudiantil
para proceder a evaluar la asignatura de Matemática Básica, de esta manera se toma
como criterio de evaluación la valoración de conocimientos adquiridos y destrezas
evidenciadas dentro del aula de clases en cada una de las evaluaciones aplicadas a
los estudiantes, demostrando por medio de éstas que está apto para el
desenvolvimiento profesional.
Por ello desde el primer día de clases, se presentará las unidades didácticas y los
criterios de evaluación del proyecto final, evidenciado en el silabo y plan calendario
Estadística Descriptiva
17
entregado a los estudiantes. Además, se determinará el objeto de estudio, que en este
caso son las teorías de la matemática básica y cada uno de los puntos que ésta
conlleva para su aprobación.
Se explica a los estudiantes que el semestre se compone de dos parciales con una
duración de diez semanas de clases cada una, en cada parcial se evaluará sobre
cinco puntos las actividades diarias de las clases: trabajos autónomos, trabajos de
investigación parcial que se tomará en la semana diez y semana veinte. De esta
manera cada parcial tendrá una nota total de siete puntos como máximo. El examen
final estará representado por un proyecto integrador de asignaturas que tiene una
valoración de tres puntos. Por consiguiente, el alumno podrá obtener una nota total
de diez puntos como máximo.
Una vez que el estudiante exponga su proyecto integrador y defienda las preguntas
propuestas por el tribunal, será notificado en ese momento la nota obtenida y se
procederá a la respectiva firma de constancia.
Dentro de las equivalencias de notas se clasifican de la siguiente manera:
10,00 a 9,50: excelente
9,49 a 8,50: muy bueno
8,49 a 8,00: bueno
7,99 a 7,00: aprobado
6,99 a menos: reprobado
Los estudiantes deberán alcanzar un puntaje mínimo de 7,00 puntos para aprobar la
asignatura, siendo de carácter obligatorio la presentación del proyecto integrador.
Si el estudiante no alcance los 7,00 puntos necesarios para aprobar la asignatura,
deberá presentarse a un examen supletorio mismo que será evaluado sobre diez
puntos y equivaldrá el 60% de su nota final, el 40% restante corresponde a la nota
obtenida en acta final ordinaria de calificaciones.
Aquellos estudiantes que no podrán presentarse al examen de recuperación son
quienes hubiesen reprobado por faltas con un 25% o más en la asignatura. Para
presentarse al supletorio deben obtener de la suma del primer parcial, segundo parcial
y sustentación del proyecto como promedio mínimo 2,50 que corresponde al 40% y la
evaluación tendrá una ponderación máxima de 6 puntos equivalente al 60%. Los
parámetros de evaluación del proyecto o actividad de vinculación de la asignatura son
los siguientes:
Parámetros Generales. 1,50
Dominio del Tema 0,50
Redacción, coherencia y desarrollo del proyecto integrador y artículo científico 1,00
18 Ing. Rafael Sandino Salcedo Muñoz
Parámetros Específicos. 1,50
Veracidad en la recolección de datos (encuestas, entrevistas) 0,40
Precisión en los cálculos estadísticos. 0,40
Correcta graficacion de la información estadística. 0,30
Análisis y coherencia en la determinación de factibilidad del proyecto. 0,40
La nota obtenida en la asignatura se sumará y promediará al resto de asignaturas y
esa será la nota que obtendrá cada estudiante por la presentación del proyecto
integrador.
El estudiante no conforme con la nota del proyecto integrador podrá solicitar mediante
oficio una recalificación y obtendrá respuesta del mismo en un plazo no mayor a tres
días hábiles.
El docente tendrá un plazo de 48 horas para socializar las calificaciones obtenidas
luego se asentará en las actas finales y se procederá a recoger la firma de los
estudiantes.
Los proyectos presentados serán sometidos a mejoras o corrección si el caso lo
amerita con la finalidad de ser presentadas en la feria de proyectos científicos que el
Instituto Superior Tecnológico Ismael Pérez Pazmiño lanzará cada año.
X. BIBLIOGRAFÍA BÁSICA Y COMPLEMENTARIA
Lind – Marchal – Mason, 11va edición (2006). Estadística para administración y
economía. Editorial Alfaomega.
LIND Douglas, MARCHAL William, MASON Robert (2004). Estadística para
Administración y economía. Editorial Alfaomega.
Martínez Ciro. (2008). Estadística y muestro. Editorial Ecoe.
Richard I Kevin& David S. Rubin, 6ta edición (1996). Estadística para Administración.
Editorial Prantice hall – Hispanoamericana, S.A.
William J Srevenson. Estadística para administración y economía. Editorial Harla.
William Menderhall, 2da edición (1990). Estadística para administración. Grupo
editorial Iberoamérica.
Machala, 31 de octubre de 2019
Elaborado por: Revisado por: Aprobado por:
Ing. Rafael S. Salcedo Muñoz.
Docente
Ing. Carolina Quevedo
Coordinadora de carrera
Dra. María Isabel Jaramillo
Vicerrectora Académica
Fecha:31 de octubre de 2019 Fecha: Fecha:
Estadística Descriptiva
19
ORIENTACIONES PARA EL USO DE ESTA GUIA.
Teniendo en cuenta que el material que se presenta es de apoyo tanto para el docente
como para el señor estudiante, se debe considerar como una herramienta muy útil, en
esta se ofrecen orientaciones metodológicas y didácticas, formulaciones que deben
ser utilizadas de acuerdo al tema presentado, y con el apoyo de los textos compartidos
vía online de parte del docente, no constituye el contenido total de cada tema, pero si
la parte más interesante y útil dentro de cada temática. Se plantean situaciones reales,
así como también como situaciones propuestas.
La presente guía se la debe manejar con ética y respeto, ya que esta apegada al
programa de la asignatura para el nivel que se propone.
De ante mano les deseo éxitos y la disponibilidad para cualquier consulta sobre
cualquier tema que falte aún más refuerzo.
Recuerda que la Seguridad Ocupacional tiene un sistema de aprendizaje en la
mayoría de los casos por experiencias propias, pero con la guía que estamos
proponiendo debemos prevenir antes que lamentar
Usted puede, revísela constantemente y si es necesario solicite ayuda adicional.
A continuación, inserto los iconos que se usaran en esta guía en las diferentes
actividades.
SUGERENCIA
APUNTE CLAVE
TALLERES
FORO
REFLEXIÓN
RESUMEN
TAREAS
EVALUACIÓN
Ing. Rafael Salcedo Muñoz.
20 Ing. Rafael Sandino Salcedo Muñoz
DESARROLLO DE ACTIVIDADES.
Unidad didáctica I. Introducción A La Estadística Descriptiva
INTRODUCCION.
En el transcurso de la carrera y de su vida profesional, el estudiante de Gestion de
Produccion y Servicios, necesitará trabajar cotidianamente con la Estadistica.
Que accion o actividad no esta vinculada a la Estadistica, en muchas ocasiones ni
siquiera nos damos cuenta que estamos aplicando la estadistica en nuestro diario
vivir. Comunmente salimos de nuestro hogar y en el trayecto al trabajo, al Instituto,
vamos observando, analizando y hasta cuantificando lo que vemos y nos sentimos
asombrados cuando algo que rutinariamente observamos en tiempo y espacio, no
esta, y empieza nuestro analisis ¿Qué paso? Y una serie de conclusiones que
sacamos.
Entonces la Estadistica es una herramienta que es muy util, en este capitulo nos
introducimos a este interesante mundo, del analisis, clasificacion, graficacion, toma de
decisiones.
Objetivo. Aplicar los conocimientos básicos, con la ayuda de los constructos teóricos
para la solución a problemas de la actividad profesional con responsabilidad.
ACTIVIDADES DE APRENDIZAJE DE LA UNIDAD DIDACTICA I
Introducción A La Estadística Descriptiva.
Conceptos Basicos
Niveles De Medicion
Estadística Descriptiva
21
Actividad De Aprendizaje I De La Unidad Didactica I
Como observamos la estadística se encarga de recopilar información importante,
organizarla, clasificarla, analizarla e interpretarla y de presentarla en una gráfica.
Importancia
La estadística es muy importante en casi cualquier área
profesional, esto incluye las áreas de Informática, matemáticas y
economía.
Esta te permite:
1) Determinar los futuros problemas antes que ocurran, al establecer límites tolerables
en los procesos productivos.
2) Determinar si un lote de producción cumples los requisitos mínimos de calidad con
solo tomar una muestra significativa.
3) Conocer el estado actual de la producción al hacer cambios comparándolo con los
procesos sin cambios.
4) Evaluar probables nuevos procedimientos, y su impacto en la producción
y muchas otras cosas más dependiendo de tu imaginación y en lo que lo vas a aplicar.
Estadistica
Recopila Datos
Organiza
PresentaAnaliza
Interpreta
Clasificacion de la Estadistica
Descriptiva Métodos para organizar, resumiry presentar datos de manerainformativa.
Inferencial
Métodos que se emplean paradeterminar una propiedad deuna población con base en lainformación de una muestra deella
22 Ing. Rafael Sandino Salcedo Muñoz
La estadística descriptiva comprende las técnicas que se emplean
para resumir y describir datos numéricos. Son sencillas desde el
punto de vista matemático y su análisis se limita a los datos
coleccionados sin inferir en un grupo mayor. El estudio de los
datos se realiza con representaciones gráficas, tablas, medidas
de posición y dispersión.
El problema crucial de la estadística inferencial es llegar a proposiciones acerca de la
población a partir de la observación efectuada en muestras bajo condiciones de
incertidumbre. Ésta comprende las técnicas que, aplicadas en una muestra sometida
a observación, permiten la toman de decisiones sobre una población o proceso
estadístico. En otras palabras, es el proceso de hacer predicciones acerca de un todo
basado en la información de una muestra.
La inferencia se preocupa de la precisión de los estadígrafos descriptivos ya que estos
se vinculan inductivamente con el valor poblacional.
Entre los usos más frecuentes, les planteo algunos ejemplos:
Conocer el porcentaje de la población que necesita agua.
Conocer el porcentaje de población que tiene diabetes
Conocer el porcentaje de personas que utilizan tomate para preparar sus comidas
Conocer el porcentaje de personas que consumen tortilla.
Conocer el porcentaje de protección social que se asigna en áfrica.
Conocer e interpretar el porcentaje de personas que tienen microempresas en el
Ecuador.
Conocer el porcentaje de niños desnutridos en el país.
Variables cualitativas
Son las variables que expresan distintas cualidades,
características o modalidad. Cada modalidad que se presenta se
denomina atributo o categoría y la medición consiste en una
clasificación de dichos atributos. Las variables cualitativas pueden
ser dicotómicas cuando sólo pueden tomar dos valores posibles
Tipos De Variables
Cuantitativas
Discreta
Continua
Cualitativas
Dicotómicas
Politómicas
Estadística Descriptiva
23
como sí y no, hombre y mujer o son politómicas cuando pueden
adquirir tres o más valores. Dentro de ellas podemos distinguir:
Variable Cualitativa Ordinal o variable cuasi cuantitativa: La variable puede tomar
distintos valores ordenados siguiendo una escala establecida, aunque no es necesario
que el intervalo entre mediciones sea uniforme, por ejemplo: leve, moderado, grave.
Variable cualitativa nominal: En esta variable los valores no pueden ser sometidos
a un criterio de orden como por ejemplo los colores.
Foro.
Importancia de la estadística en la carrera de gestión de la
producción y servicios
Variables Cuantitativas
Son las variables que se expresan mediante cantidades numéricas. Las variables
cuantitativas además pueden ser:
Variable discreta : Es la variable que presenta separaciones o interrupciones en la
escala de valores que puede tomar. Estas separaciones o interrupciones indican la
ausencia de valores entre los distintos valores específicos que la variable pueda
asumir. Ejemplo: El número de hijos (1, 2, 3, 4, 5).
Variable continua: Es la variable que puede adquirir cualquier valor dentro de un
intervalo especificado de valores. Por ejemplo, la masa (2,3 kg, 2,4 kg, 2,5 kg,) o la
altura (1,64 m, 1,65 m, 1,66 m,), o el salario. Solamente se está limitado por la
precisión del aparato medidor, en teoría permiten que siempre exista un valor entre
dos variables.
Muestra
La mayoría de los estudios estadísticos, se
realizan no sobre la población, sino sobre un
subconjunto o una parte de ella, llamado
muestra, partiendo del supuesto de que
este subconjunto presenta el mismo
comportamiento y características que la
población. En general el tamaño de la
muestra es mucho menor al tamaño de la
población. Los valores o índices que se
concluyen de una muestra se llaman
estadígrafos y estos mediante métodos
inferenciales o probabilísticos, se aproximan a los parámetros poblacionales.
Población
Es el conjunto de todos los elementos que presentan una característica común
determinada, observable y medible. Por ejemplo, si el elemento es una persona, se
puede estudiar las características edad, peso, nacionalidad, sexo, etc. Los elementos
que integran una población pueden corresponder a personas, objetos o grupos (por
ejemplo, familias, fábricas, empresas, etc.). Las características de la población se
resumen en valores llamados parámetros.
Población.
Muestra
24 Ing. Rafael Sandino Salcedo Muñoz
Niveles De Medición
El primer paso en el análisis de datos es simplemente entender lo que estos significan.
Esto se facilita clasificando cada variable según su nivel de medición. El nivel de
medición se refiere a la relación entre los valores que se asignan a los atributos de
una variable.
Una variable es cualquier cantidad que puede ser medida y cuyo valor varía a través
de la población. Por ejemplo, si consideramos una población de estudiantes, la
nacionalidad del estudiante, género, calificaciones, etc. son todas las variables
definidas, y su valor correspondiente diferirá para cada estudiante.
Si queremos calcular el salario promedio de los ciudadanos de un país, podemos salir
y registrar el salario de todas y cada una de las personas para calcular el promedio o
elegir un muestreo aleatorio de toda la población y calcular el salario promedio para
esa muestra, y luego usar las pruebas estadísticas para obtener conclusiones para
una población más amplia.
El tipo de prueba estadística que puede utilizarse para llegar a una conclusión sobre
la población en general depende del nivel de medición de la variable considerada. El
nivel de medición de una variable no es otra cosa que la naturaleza matemática de
una variable o cómo se mide una variable.
Tarea.
Plantee tres situaciones de la vida real que usted las pueda
describir como un asunto estadístico
Nivel Nominal: Es el nivel más bajo de medición en cuanto a suministro de
ecuaciones, las observaciones solo se pueden contar o clasificar (no hay un orden
lógico de las categorías). Las categorías son mutuamente excluyentes y exhaustivas.
Por ejemplo: preferencia de comida: desayuno, comida, cena
Estadística Descriptiva
25
preferencia religiosa: 1= budista, 2= musulmana, 3= cristiana, 4= judía, 5= otra
orientación política: izquierda, derecha, independiente
otros valores nominales son números de seguro social, códigos postales y números
de teléfono.
Nivel Ordinal: Las observaciones mantienen un orden, las categorías de datos están
ordenadas de acuerdo a las características. Por ejemplo:
clasificación: 1er lugar, 2do lugar… último lugar
nivel de acuerdo: no, tal vez, si
orientación política: izquierda, independiente, derecha
Nivel de Intervalo.
Tiene todas las características del nivel ordinal, pero además la diferencia entre dos
valores tiene un tamaño constante, el cero es solo un numero en escala, es decir, no
representa la ausencia de la condición.
Un ejemplo de una escala de intervalo es la temperatura, medida en una escala
Fahrenheit o Celsius, un grado representa la misma cantidad subyacente de calor,
independientemente de dónde ocurra en la escala.
Sí lo medimos en unidades Fahrenheit, la diferencia entre una temperatura de 46 y 42
es la misma que la diferencia entre 72 y 68. las escalas de medición de intervalos
iguales pueden ser utilizadas para medir opiniones y actitudes.
Construir bajo estos niveles de medición requiere de una comprensión más profunda
de principios matemáticos y estadísticos. sin embargo, es importante comprender los
diferentes niveles de medición al utilizar e interpretar escalas: hora del día en un reloj
de 12 horas intervalo de tiempo de día – intervalos iguales; reloj analógico (12 horas),
la diferencia entre la 1 y 2 pm es la misma que la diferencia entre las 11 y 12 am.
Nivel de Proporción o Razón: Es el nivel más alto, tiene todas las características del
nivel de intervalo, pero además el cero tiene significado y la relación entre dos
números tiene sentido.
regla: pulgadas o centímetros
ingresos: dinero ganado el año pasado
años de experiencia laboral
de razón- el tiempo de 24 horas tiene un 0 absoluto (medianoche); 14 en punto está
dos veces más lejos de la medianoche que las 7 en punto.
Taller.
Plantear y resolver 1 ejercicio de cada nivel de medición.
Observamos la importancia de la Estadística en nuestra vida
diaria y profesional, el tipo de información que recolectamos y que
procesamos, es importante identificar si la variable es cualitativa
o cuantitativa.
26 Ing. Rafael Sandino Salcedo Muñoz
Los niveles de medición también nos ubican al tipo de información que vamos a
procesar y la importancia de usar uno de ellos. Por lo que resumimos:
I. La estadística es la ciencia que recoge, organiza, presenta, analiza e interpreta
datos con el fin de facilitar la toma de decisiones más eficaces.
II. Existen dos clases de estadística.
A. La estadística descriptiva que consiste en un conjunto de procedimientos
para organizar y resumir datos.
B. La estadística inferencial implica tomar una muestra de una población y
llevar a cabo cálculos relativos a ésta sobre la base de los resultados de la
muestra.
Una población es un conjunto de individuos u objetos de interés o las medidas que
se obtienen de todos los individuos u objetos de interés.
Una muestra es una parte de la población.
III. Existen dos tipos de variables.
A. Una variable cualitativa es de naturaleza no numérica.
1. Por lo común, lo que interesa es el número o porcentaje de
observaciones en cada categoría.
2. Los datos cualitativos se reúnen en gráficas y diagramas de barras.
B. Existen dos tipos de variables cuantitativas, que se presentan de forma
numérica.
1. Las variables discretas toman ciertos valores, y existen vacíos entre
éstos.
2. Una variable continua adopta cualquier valor dentro de un intervalo
específico.
IV. Existen cuatro niveles de medición.
A. En el caso del nivel nominal, los datos se distribuyen en categorías sin
un orden particular.
B. El nivel ordinal de medición supone que una clasificación se encuentra
en un nivel superior a otra.
C. El nivel de medición de intervalo posee la característica de clasificación
correspondiente al nivel ordinal de medición, además de que la distancia
entre valores es constante.
D. El nivel de medición de razón cuenta con todas las características del
nivel de intervalo, además de que existe un punto 0 y que la razón entre
dos valores resulta significativa.
Actividades de Auto - Evaluación De La Unidad I.
1. Ubique las variables en las siguientes tablas de clasificación.
Resuma en cada tabla sus observaciones y evalúe si los resultados
son verdaderos. Por ejemplo, el salario se presenta como una
Estadística Descriptiva
27
variable cuantitativa continua. También es una variable de escala de
razón.
a) Salario
b) Género
c) Volumen de ventas de reproductores MP3
d) Preferencia por los refrescos
e) Temperatura
f) Lugar que ocupa un estudiante en clase
g) Calificaciones de un profesor de finanzas
h) Cantidad de computadoras domésticas
2. Explique la diferencia entre variables cualitativas y cuantitativas.
Proporcione un ejemplo de variable cuantitativa y otro de variable
cualitativa.
3. Explique la diferencia entre muestra y población.
Actividad Final Unidad I
1. La siguiente gráfica representa las utilidades en millones de dólares de ExxonMobil
en el periodo que va de 2003 a 2009. ¿Fueron más altas en un año que en los
otros? ¿Las ganancias aumentaron, se redujeron o permanecieron sin cambios
durante el periodo
28 Ing. Rafael Sandino Salcedo Muñoz
2. En los siguientes problemas indique si recogería información utilizando una
muestra o una población y por qué lo haría.
a) Estadística 201 es un curso que se imparte en la universidad. El profesor A.
Verage ha enseñado a alrededor de 1 500 estudiantes los pasados cinco años.
Usted quiere conocer el grado promedio de los estudiantes que toman el curso.
b) Como parte del proyecto de investigación, usted necesita dar a conocer la
rentabilidad de la compañía líder en Fortune 500 durante los pasados diez años.
c) Usted espera graduarse y conseguir su primer empleo como vendedor en una
de las cinco principales compañías farmacéuticas. Al hacer planes para sus
entrevistas, necesitará conocer la misión de la empresa, rentabilidad, productos
y mercados.
d) Usted se encuentra comprando un nuevo reproductor de música MP3, como el
iPod de Apple. El fabricante anuncia la cantidad de pistas que almacena la
memoria. Considere que los anunciantes toman en cuenta piezas de música
popular cortas para calcular la cantidad de pistas que pueden almacenarse. Sin
embargo, usted prefiere las melodías de Broadway, que son más largas. Usted
desea calcular cuántas melodías de Broadway podrá guardar en su reproductor
MP3.
3. Explique la diferencia entre variable discreta y continua. Proporcione un
ejemplo de cada una.
Estadística Descriptiva
29
DESARROLLO DE ACTIVIDADES.
Unidad didáctica II. Presentación y Análisis de Datos
INTRODUCCION.
Para la presentación de datos podemos utilizar tablas o cuadros, gráficos y figuras. El
uso de uno u otro vendrá determinado por el tipo de comunicado. Pero todos ellos,
deben seguir unas reglas para su elaboración. Un gráfico ayuda al análisis de datos
de manera que se puedan encontrar tendencias importantes que ayudarán en la toma
de decisiones.
El cálculo o la consideración de las frecuencias ayuda a poder identificar las
tendencias de la información recogida y que estamos analizando, ya que muestras los
valore altos, bajos, medios y aun los menos importantes o que deben ser motivo de
análisis o de volverlos a tomar o revisarlos.
En esta unidad, podremos elaborar las tablas de frecuencias, calcular las frecuencias,
tanto absolutas o relativas y luego presentarlos en diversas graficas estadísticas.
Objetivo.- Organizar los datos obtenidos a través de un cuadro de distribución de
frecuencias para presentarlos a través de una gráfica y la interpretación de resultados
con ética.
ACTIVIDADES DE APRENDIZAJE DE LA UNIDAD DIDACTICA II
Actividad De Aprendizaje I De La Unidad Didactica II
Tabla de Frecuencias.- Es la agrupacion de datos sean estos
cualitativos o cuantitativos, mas que nada cuando se tiene
demasiada informacion. Claro que en algunos casos hay
informacion que no es que se pierda pero al establecer intervalos
no brilla con luz propia. Consiste en una tabla.
Presentacion y Analisis de Datos
Distribucion de Frecuencias
Frecuencia Absoluta
Simple Acumulada
Frecuencia Relativa
Decimal Porcentual
Representaciones Graficas
poligono de frecuencia
ojiva histogramadiagrama de barras
circular
Frecuencia Absoluta
Simple
es la cantidad de veces que se
repite un valor en un intervalo de
clase
𝐟𝟏 + 𝐟𝟐 + 𝐟𝟑 +⋯……𝐟𝐧= 𝐍
se lo representa con: f
30 Ing. Rafael Sandino Salcedo Muñoz
La sumatoria de las frecuencias absolutas nos da como resultado el numero total de
datos “N”. ∑𝑓 = 𝑁
𝒇𝒓 =𝒇
𝑵 ; esta fórmula se la aplica para cuando se trata de una población.
𝒇𝒓 =𝒇
𝒏; cuando se trata de una muestra.
Generalmente esta frecuencia se la utiliza en forma porcentual. Por lo que la formulas
quedan de la siguiente manera:
𝒇𝒓 =𝒇
𝑵∗ 𝟏𝟎𝟎% o 𝒇𝒓 =
𝒇
𝒏∗ 𝟏𝟎𝟎%
La sumatoria de las frecuencias relativas decimales debe ser igual a 1. Y en forma
porcentual debe ser igual al 100%.
Frecuencia Absoluta
Acumulada
es la suma de las frecuencias del intervalo
mas la frecuencia del intervalo anterior
Se lo representa
como F.
Frecuencia Relativa
es el cociente entre la frecuencia absoluta de
un intervalos y el numero total de datos
se la representa como: fr
Numero de Intervalos.
Es la cantidad de intervalos de clase quetendra nuestro cuadro de distribucion defrecuencias
𝟐𝐤 ≥ 𝐍
Amplitud de Intervalo
Nos permite tener el rango de cada intervalo. oseamarca la distancia entre el limite inferior (li) y ellimite superior (ls).
H Mayor valor de la serie de datos.
𝐢 ≥𝐇−𝐋
𝐤L menor valor de la serie de datos.
k es el numero de intervalos.
Estadística Descriptiva
31
Ejemplo 1.
Las estaturas en centímetros de los alumnos de tercer semestre de Gestión de la
Producción y Servicios, paralelo “A”, del INSTIPP, son las siguientes:
170; 158;166; 174; 176;178; 180; 169; 175; 177; 175; 178; 176; 177; 176 y 162.
Al considerar todo el paralelo estamos frente a una población, por lo tanto: N = 16.
Primero se ordenan los datos en forma creciente:
158; 162; 166; 169; 170; 174; 175; 175; 176; 176; 176; 177; 177; 178; 178; 180.
Luego calculamos el número de intervalos (k):
2𝑘 ≥ 𝑁 24 = 16, 𝑃𝑜𝑟 𝑙𝑜 𝑡𝑎𝑛𝑡𝑜: 𝑘 = 4.
Finalmente calculamos la amplitud del intervalo que nos permite elaborar nuestro
cuadro de distribución de frecuencias.
𝑖 ≥𝐻 − 𝐿
𝑘≥
180 − 158
4≥
22
4≥ 5,50
Podemos quedarnos con la calculada: 𝑖𝑐𝑎𝑙𝑐𝑢𝑙𝑎𝑑𝑎 = 5,50.
O podemos asumir un valor superior, igual debemos declarar cual asumimos, en este
ejemplo yo voy a asumir el valor calculado:
𝑖𝑎𝑠𝑢𝑚𝑖𝑑𝑜 = 5,50
estatura f F 𝒇𝒓 𝒇𝒓% 𝑭𝒓 𝑭𝒓%
158,00 163,50 2 2 0,1250 12,50 0,1250 12,50
163,50 169,00 1 3 0,0625 6,25 0,1875 18,75
169,00 174,50 3 6 0,1875 18,75 0,3750 37,50
174,50 180,00 10 16 0,6250 62,50 1,0000 100,00
1,0000 100,00
𝒇𝒓 =𝒇
𝑵=
𝟐
𝟏𝟔= 𝟎, 𝟏𝟐𝟓𝟎
Por lo general se trabaja con dos decimales, pero en el caso que la sumatoria de la
frecuencia relativa no sea igual a uno, hay que analizar a que intervalo le quitamos o
le aumentamos decimales para que la suma de 1. Repito el cuadro con dos decimales:
estatura f F 𝒇𝒓 𝒇𝒓% 𝑭𝒓 𝑭𝒓%
158,00 163,50 2 2 0,13 13,00 0,13 13,00
163,50 169,00 1 3 0,06 6,00 0,19 19,00
169,00 174,50 3 6 0,19 19,00 0,38 38,00
174,50 180,00 10 16 0,63 63,00 1,01 101,00
1,01 100,00
Como podemos observar al redondear a dos decimales en la columna de frecuencia
relativa se obtiene más de uno (1).
Entonces debemos decidir a qué frecuencia le quitamos o le aumentamos lo que falte
o sobre, el hecho es que debe ser igual a uno exactamente.
Entonces podríamos quitar el 0,01 a la frecuencia 0,13 o a 0,63, por ahora le
quitaremos al 0,13 y queda la tabla así:
estatura f F 𝒇𝒓 𝒇𝒓% 𝑭𝒓 𝑭𝒓%
32 Ing. Rafael Sandino Salcedo Muñoz
158,00 163,50 2 2 0,12 12,00 0,12 12,00
163,50 169,00 1 3 0,06 6,00 0,18 18,00
169,00 174,50 3 6 0,19 19,00 0,37 37,00
174,50 180,00 10 16 0,63 63,00 1,00 100,00
1,00 100,00
Ejemplo 2
Se tiene el siguiente reporte de casos
de coronavirus al 31 de mayo de 2020 en
24 provincias del Ecuador, como se
observa en el siguiente cuadro:
elaborar un cuadro de distribución de
frecuencias con la cantidad de
contaminados por Provincia.
Iniciamos ordenando la información:
76, 105, 110, 152, 186, 201, 203, 228,
237, 312, 331, 357, 395, 398, 477, 771,
852, 869, 1043, 1094, 1509, 2235, 3940,
14061.
Calculamos el número de intervalos:
2𝑘 ≥ 24
25 ≥ 24 𝑝𝑜𝑟 𝑙𝑜 𝑡𝑎𝑛𝑡𝑜: 𝑘 = 5
𝑖 ≥𝐻 − 𝐿
𝑘≥
14061 − 76
5
𝑖 ≥13985
5: por lo tanto: 𝑖𝑐𝑎𝑙𝑐𝑢𝑙𝑎𝑑𝑜 ≥ 2797 𝑖𝑎𝑠𝑢𝑚𝑖𝑑𝑜 = 2800
contagiados f F 𝒇𝒓 𝒇𝒓% 𝑭𝒓 𝑭𝒓%
76 2876 22 22 0,92 92,00 0,92 92,00
2876 5676 1 23 0,04 4,00 0,96 96,00
5676 8476 0 23 0,00 0,00 0,96 96,00
8476 11276 0 23 0,00 0,00 0,96 96,00
11276 14076 1 24 0,04 4,00 1,00 100,00
1,00 100,00
Foro:
Utilidad de los cuadros de distribución de frecuencias
Ejemplo 3.
De datos cualitativos:
La empresa Oro auto de la ciudad de Machala, registro las siguientes ventas de autos
en el mes de enero de 2020.
Nissan 26; Mazda 31; kia 42; Hunday 28; Chevrolet 50.
Elaborar un cuadro de frecuencias.
marca f F 𝒇𝒓 𝒇𝒓% 𝑭𝒓 𝑭𝒓%
Estadística Descriptiva
33
Nissan 26 26 0,15 15,00 0,15 15,00
Hunday 28 54 0,16 16,00 0,31 31,00
Mazda 31 85 0,17 17,00 0,48 48,00
Kia 42 127 0,24 24,00 0,72 72,00
Chevrolet 50 177 0,28 28,00 1,00 100,00
177 1,00 100,00
Tarea.
Al observar el cuadro nos damos cuenta que se elaboró el cuadro
en base a la frecuencia absoluta simple, ósea a la cantidad de
vehículos vendidos en forma creciente sin importar la marca.
La ventaja principal de organizar los datos en la distribución de
frecuencias estriba en que nos permite visualizar de manera
rápida la forma de la distribución sin necesidad de llevar a cabo
ningún cálculo. En otras palabras, podemos ver dónde se
concentran los datos y, asimismo, determinar si hay valores
extremadamente grandes o pequeños.
Sin embargo, hay dos desventajas que se presentan al organizar los datos en la
distribución de frecuencias:
1) se pierde la identidad exacta de cada valor;
34 Ing. Rafael Sandino Salcedo Muñoz
2) no es clara la forma en que los valores de cada clase se distribuyen. Para mayor
precisión.
Diagrama de Tallo y Hoja.
La ventaja de usar esta representación es que considera todos los
valores observados, pudiendo identificar quien tiene mayor o
menor repetición o frecuencia, no se pierden o se esconden los
valores como ocurre en el cuadro de distribución de frecuencias.
Si recordamos el ejemplo de contagiados por Covid 19 en las 24 Provincias de el
Ecuador, en el cuadro de distribución de frecuencias observamos que la amplitud es
de 2800, pero que ocurre con los valores intermedios, simplemente se pierden por que
utilizamos un intervalo.
Para explicar el Diagrama de Tallo y Hoja nos valdremos del siguiente ejercicio.
Supóngase que tenemos el siguiente cuadro de distribución de frecuencias:
Edad de personas
que asisten al cine
frecuencia
10 25 3
25 40 7
40 55 4
55 70 9
70 85 11
85 90 8
Y si analizamos cada intervalo nos damos cuenta que hay una distancia en cada
intervalo de 15, y no podemos visualizar que valores hay en la parte intermedia.
Por ejemplo, en el cuadro de frecuencias del ultimo intervalo nos da la siguiente
información:
85 90 8
Pero en realidad no sabemos que valores hay entre 85 y 90, solo se ve que hay 8
valores.
Y si la serie de datos del cuadro anterior de manera ordenada es la siguiente:
10,18,19,25,28,28,29,30,36,39,40,48,52,54,54,55,59,59,63,68,68,68,69,69,72,73,74,
78,80,80,80,83,83,84,84,86,87,87,88,88,89,90.
Ahora si se identifica que valores van de 85 a 90, entonces la representación de tallo
y hoja lo que hace es considerar cada valor.
Estadística Descriptiva
35
Es importante siempre ordenar la serie de datos y el diagrama de tallo y hoja queda
así:
TALLO HOJA
1 0,8,9
2 5,8,8,9
3 0,6,9
4 0,8
5 2,4,4,5,9,9
6 3,8,8,8,9,9
7 2,3,4,8
8 0,0,0,3,3,4,4,6,7,7,8,8,9
9 0
Analizando la información observamos que por ejemplo 3 personas van al cine, una
de 10 años otra de dieciocho y otra de 19, también podemos observar que los que
más asisten al cine están entre los 80 y 89 años de edad, podría ser que se trate de
alguna obra de sus tiempos, y así se puede identificar cada valor.
Este diagrama si bien es cierto nos refleja la información real, cuando se trata de
información abundante se vuelve poco manejable y se recurre a otros diagramas o al
cuadro de frecuencias.
Diagrama De Tallo Y Hoja
Tallo
Es el digito o digitos principales
Hojas
Son los digitos secundarios
36 Ing. Rafael Sandino Salcedo Muñoz
Taller.
Actividad De Aprendizaje II De La Unidad Didáctica II
Representación Gráfica de una Distribución de Frecuencias.
Estas representaciones graficas son preferidas en las empresas
y en forma general, ya que nos muestran la información, de
manera más clara, se puede identificar las tendencias, o lo que
ocurre con cierta información que se ha procesado.
Polígono de Frecuencia.- Consiste en segmentos de recta que
conectan los puntos que forman las intersecciones de los puntos
medios de clase y las frecuencias de clase. Por lo que en nuestro
cuadro de distribución de frecuencias debemos agregar el punto
medio de clase. En este tipo de graficas generalmente se
representa la frecuencia absoluta simple.
Vamos a realizar el polígono de frecuencias del ejemplo 1, para lo cual copiaremos el
cuadro de frecuencias, únicamente hasta la frecuencia absoluta, y le agregaremos el
punto medio.
Punto medio de clase
𝐱𝐦 =𝐋𝐬 + 𝐋𝐢
𝟐
Estadística Descriptiva
37
𝐱𝐦 =𝐋𝐬 − 𝐋𝐢
𝟐=
𝟏𝟔𝟑, 𝟓𝟎 + 𝟏𝟓𝟖
𝟐=
𝟑𝟐𝟏, 𝟓𝟎
𝟐
𝐱𝐦 = 𝟏𝟔𝟎, 𝟕𝟓
Histograma. - Es una representación gráfica de una variable en forma de barras,
donde la superficie de cada barra es proporcional a la frecuencia de los valores
representados. En el eje vertical se representan las frecuencias, y en el eje horizontal
los valores de las variables, normalmente señalando las marcas de clase, es decir, la
mitad del intervalo en el que están agrupados los datos.
Se utiliza cuando se estudia una variable continua, como franjas
de edades o altura de la muestra, y, por comodidad, sus valores
se agrupan en clases, es decir, valores continuos. En los casos
en los que los datos son cualitativos (no-numéricos), como sexto
grado de acuerdo o nivel de estudios, es preferible un diagrama
de sectores.
Los histogramas son más frecuentes en ciencias sociales,
humanas y económicas que en ciencias naturales y exactas. Y
permite la comparación de los resultados de un proceso.
Foro.
Representaciones Graficas Estadísticas
Tomaremos la información del ejemplo 1, en lo que respecta a intervalos de clase y
frecuencia absoluta simple:
estatura 𝐱𝐦 f
158,00 163,50 160,75 2
163,50 169,00 166,25 1
169,00 174,50 171,75 3
174,50 180,00 177,25 10
38 Ing. Rafael Sandino Salcedo Muñoz
estatura f
158,00 163,50 2
163,50 169,00 1
169,00 174,50 3
174,50 180,00 10
Tarea-
Polígono De Frecuencia Acumulada.- Se conoce como polígonos de frecuencia
para datos agrupados a aquellos que se desarrollan mediante la marca de clase que
tiene coincidencia con el punto medio de los distintos intervalos. En el momento de la
representación de todas las frecuencias acumuladas que forman parte de una tabla
de datos agrupados.
Seguiremos trabajando con la información del ejemplo 1.
estatura Xm f F
158,00 163,50 160,75 2 2
163,50 169,00 166,25 1 3
169,00 174,50 171,75 3 6
174,50 180,00 177,25 10 16
Estadística Descriptiva
39
Diagrama Circular.- Los gráficos circulares, también llamados gráficos de pastel o
gráficas de 360 grados, son recursos estadísticos que se utilizan para representar
porcentajes y proporciones. El número de elementos comparados dentro de un gráfico
circular puede ser de más de 5, y los segmentos se ordenan de mayor a menor,
iniciando con el más amplio a partir de las 12, como en un reloj.
Una manera fácil de identificar los segmentos es sombreando de claro a oscuro, donde
el de mayor tamaño por lo general es el más claro y el de menor tamaño, el más
oscuro.
En este tipo de grafico generalmente se trabaja con la frecuencia relativa, más que
nada porcentual, pero mientras más información se introduzca mejor, para la
interpretación gráfica.
El cuadro del ejemplo 3 lo tomamos para este gráfico, ya que por lo general se lo
utiliza para datos cualitativos.
marca f 𝒇𝒓 𝒇𝒓%
Nissan 26 0,15 15,00
Hunday 28 0,16 16,00
Mazda 31 0,17 17,00
Kia 42 0,24 24,00
0
2
4
6
8
10
12
14
16
18
155,25 160,75 166,25 171,75 177,25 182,75
FREC
UEN
CIA
AC
UM
ULA
DA
Poligono de Frecuencias Acumuladas ventas de Autos e n Oroauto Machala
40 Ing. Rafael Sandino Salcedo Muñoz
Chevrolet 50 0,28 28,00
177 1,00 100,00
Diagrama de Barras.- Un diagrama de barras, también conocido como diagrama de
columnas, es una forma de representar gráficamente un conjunto de datos o valores
y está conformado por barras rectangulares de longitudes proporcionales a los valores
representados. Los gráficos de barras son usados para comparar dos o más valores.
Las barras pueden orientarse vertical u horizontalmente.
Este tipo de graficas también se lo utiliza mucho para representar información
cualitativa.
marca f
Nissan 26
Hunday 28
Mazda 31
Kia 42
Chevrolet 50
177
Chevrolet28%50
Kia24%42
Mazda17%31
Hunday16%28
Nissan15%26
AUTOS VENDIDOS ENERO EN OROAUTO
Chevrolet Kia Mazda Hunday Nissan
Estadística Descriptiva
41
Taller.
26 2831
42
50
0
10
20
30
40
50
60
Nissan Hunday Mazda Kia Chevrolet
MARCAS DE VEHICULOS
Vehiculos vendidos en enero en oroauto
Nissan Hunday Mazda Kia Chevrolet
42 Ing. Rafael Sandino Salcedo Muñoz
I. Una tabla de frecuencias es una agrupación de datos
cualitativos en clases mutuamente excluyentes, que
muestra el número de observaciones que hay en cada
clase.
II. Una tabla de frecuencias relativas muestra la fracción del número de
frecuencias en cada clase.
III. Una gráfica de barras es una representación de una tabla de frecuencias.
IV. Una gráfica de pastel muestra la parte que cada clase representa del número
total de frecuencias.
V. Una distribución de frecuencias es una agrupación de datos en clases
mutuamente excluyentes que muestra el número de observaciones que hay en
cada clase.
A. Los pasos para construir una distribución de frecuencias son los siguientes:
1. Decidir el número de clases.
2. Determinar el intervalo de clase.
3. Establecer los límites de cada clase.
4. Anotar los datos en bruto de las clases.
5. Enumerar los elementos en cada clase.
B. La frecuencia de clase es el número de observaciones que hay en cada
clase.
C. El intervalo de clase es la diferencia entre los límites de dos clases
consecutivas.
D. El punto medio de clase representa la mitad entre los límites de clases
consecutivas.
VI. Una distribución de frecuencias relativas muestra el porcentaje de
observaciones de cada clase.
Estadística Descriptiva
43
VII. Existen tres métodos para hacer una representación gráfica de una distribución
de frecuencias.
A. Un histograma representa el número de frecuencias en cada clase en forma
de rectángulo.
B. Un polígono de frecuencias consiste en segmentos de recta que unen los
puntos formados por la intersección del punto medio de clase con la frecuencia
de clase.
C. Una distribución de frecuencias acumulativas muestra el número o
porcentaje de observaciones por debajo de valores dados.
Actividades de Auto - Evaluación De La Unidad II.
1. un conjunto de datos incluye 85 observaciones. ¿Cuántas clases
recomendaria para elaborar una distribucion de frecuencias.
2. Un conjunto de datos consta de 184 observaciones que van de 62
a 530.
a. ¿Qué intervalo de clase recomendaria?
b. ¿Qué amplitud de intervalos usaria ud?
3. A continuacion se muestra el numero de minutos que emplea un grupo de ejecutivos
para viajar en automovil de su casa al trabajo.
a) ¿Cuántas clases recomendaría?
b) ¿Cuántos intervalos de clase sugeriría?
c) ¿Qué intervalo de clase sugeriría como límite inferior de la primera clase?
d) Organice los datos en una distribución de frecuencias.
e) Comente la forma de la distribución de frecuencias.
f) Elabore un polígono de frecuencias
4. Los siguientes datos proporcionan las cantidades semanales que gasta en
abarrotes una muestra de hogares.
a) ¿Cuántas clases recomendaría?
b) ¿Qué intervalo de clase sugeriría?
c) ¿Cuál recomendaría como límite inferior de la primera clase?
d) Organice los datos en una distribución de frecuencias.
e) construya un histograma.
Actividad Final de la Unidad II
1.- Un científico social investiga el uso de iPods entre los estudiantes universitarios.
Una muestra de 45 estudiantes reveló que escucharon ayer el siguiente número de
canciones.
44 Ing. Rafael Sandino Salcedo Muñoz
Organice esa información en una distribución de frecuencias.
a) ¿Cuántas clases sugiere?
b) ¿Cuál es el intervalo de clase más apropiado?
c) ¿Cuál es el límite inferior de la clase inicial?
d) Elabore la distribución de frecuencias.
e) Describa el perfil de la distribución.
f) Construya una ojiva o polígono de frecuencias acumuladas.
2.- El siguiente histograma muestra los resultados en el primer examen de una clase
de estadística.
a) ¿Cuántos estudiantes presentaron el examen?
b) ¿Cuál es el intervalo de clase?
c) ¿Cuál es el punto medio de la primera clase?
d) ¿Cuántos estudiantes obtuvieron un resultado inferior a 70?
3. En 2006, Canadá exportó productos a Estados Unidos por un valor de 303.4 mil
millones de dólares. Los cinco productos principales fueron:
a) Realice una gráfica de barras.
b) ¿Qué porcentaje de las exportaciones totales de Canadá a Estados Unidos
representan las categorías “Derivados del petróleo” y “Autos de pasajeros”?
Estadística Descriptiva
45
c) De los cinco principales productos de exportación, ¿qué porcentaje del total
representan “Derivados del petróleo” y “Autos de pasajeros”?
4. Merrill Lynch concluyó un estudio relacionado con el tamaño de las carteras de
inversión en línea (acciones, bonos, fondos mutuos y certificados de depósito) en una
muestra de clientes del grupo de 40 a 50 años de edad. A continuación, aparece el
valor de las inversiones en miles de dólares de los 70 participantes.
a) Organice los datos en una distribución de frecuencias.
b) ¿Cuántas clases sugeriría? ¿Qué valor propondría para un intervalo de clase?
c) Diseñe un histograma. Interprete el resultado que obtuvo.
46 Ing. Rafael Sandino Salcedo Muñoz
DESARROLLO DE ACTIVIDADES.
Unidad didáctica III. Medidas De Tendencia Central
INTRODUCCION.
Después de haber aprendido en unidad II a construir tablas de frecuencias y haber
realizado alguna representación gráfica, el siguiente paso para llevar a cabo un
estudio preliminar de los datos recogidos es el cálculo de diferentes magnitudes
características de la distribución. Se definen entonces diversas medidas que serán
capaces de resumir toda la información recogida a un pequeño número de valores.
Estas medidas resumidas van a permitir comparar nuestra muestra con otras y dar
una idea rápida de cómo se distribuyen los datos. Es evidente que todas estas
medidas solo pueden definirse para variables cuantitativas.
A las medidas de ubicación a menudo se les llama promedios. El propósito de una
medida de ubicación consiste en señalar el centro de un conjunto de valores.
La mayor parte de las serie de datos muestran una clara tendencia a agruparse
alrededor de un cierto punto central. Así pues, dada cualquier serie de datos particular,
por lo general es posible seleccionar algún valor o promedio típico para describir toda
la serie de datos. Este valor descriptivo típico es una medición de tendencia central o
de ubicación.
Objetivo: Calcular las Medidas de Tendencia Central a través de los algoritmos de
resolución para una correcta toma de decisiones y con mucha responsabilidad.
Medidas de Tendencia Central
datos no agrupados
Media Aritmetica
muestral poblacional Geometrica Ponderada
Mediana Moda
Datos Agrupados
Media Aritmetica
Muestral poblacional geometrica Ponderada
Mediana Moda
Estadística Descriptiva
47
ACTIVIDADES DE APRENDIZAJE DE LA UNIDAD DIDACTICA III
Actividad De Aprendizaje I De La Unidad Didactica III
Media Aritmética Datos No Agrupados.
Media Muestral.- Cuando se tiene una serie de datos no
agrupados y que corresponden a una parte de una población,
estamos frente a la media muestral, que es la suma de todas las
observaciones y dividida para el numero de términos. Se la calcula
así: �̅� =∑𝒙
𝒏
La media de una muestra o cualquier otra medición basada en
una muestra de datos recibe el nombre de estadístico
Estadístico.- Es la característica de una muestra.
Ejemplo:
Un grupo de empleados de un Supermercado, tienen los siguientes descuentos en
dólares en el mes de mayo 2020.
15. 23, 25, 18, 32, 24, 27, 21, 34, 33, 26, 22, 28.
Se ordena la información: 15, 18, 21, 22, 23, 24, 25, 26, 27, 28, 32, 33, 34.
Aplicamos la fórmula:
�̅� =∑ 𝑥
𝑛=
15 + 18 + 21 + 22 + 23 + 24 + 25 + 26 + 27 + 28 + 32 + 33 + 34
13
�̅� =328
13= 25,23
Media Muestral
Valores De La
Muestra
x
Sumatoria.
∑
simbolo de la media
�̅�
numero de
terminos
n
48 Ing. Rafael Sandino Salcedo Muñoz
Por lo que se concluye que el valor medio de descuentos que tuvieron los empleados
del supermercado es de $25,23.
Tarea.
1. Los ingresos anuales de una muestra de empleados de
administración media en Indurama son: $42 900, $49 100, $48
300 y $56 800.
a) Proporcione la fórmula de la media muestral.
b) Determine la media muestral.
c) ¿Es la media que calculó en el inciso b) un estadístico o un parámetro? ¿Por qué
razón?
2. Calcule la media de los siguientes valores muestrales: 16.25, 12.91, 14.58.
3. El director de relaciones humanas de Ford inició un estudio de las horas de trabajo
extra en el Departamento de Inspección. Una muestra de 15 trabajadores reveló que
éstos laboraron la siguiente cantidad de horas extras el mes pasado.
Si al ejercicio que resolvimos le aplicamos:
∑(𝑥 − �̅�) = (15 − 25,23) + (18 − 25,23) + (21 − 25,23) + (22 − 25,23) + (23 − 25,23) +
(24 − 25,23) + (25 − 25,23) + (26 − 25,23) + (27 − 25,23) + (28 − 25,23) + (32 − 25,23) +
(33 − 25,23) + (34 − 25,23)
∑(𝑥 − �̅�) = = −10,23 − 7,23 − 4,23 − 3,23 − 2,23 − 1,23 − 0,23 + 0,77 + 1,77 + 2,77 + 6,77
+ 7,77 + 8,77 = 0
Como se observa se cumple la propiedad.
La media es única. Sólo existe una media en un conjunto de
datos.
Todo conjunto de datos de intervalo o denivel de razón posee una media.Recuerde que los datos del nivel de razónincluyen datos como edades, ingresos ypesos, y que la distancia entre losnúmeros es constante.
La suma de las desviaciones de cada valor de la media es cero.
Expresado simbólicamente,
∑⬚ 𝒙− �̅� = 𝟎
Todos los valores se encuentran incluidos en el cálculo de la media.
Propiedades De La Media
Aritmetica
Estadística Descriptiva
49
La media tiene un punto débil. Recuerde que el valor de cada elemento de una
muestra, o población, se utiliza cuando se calcula la media. Si uno o dos de estos
valores son extremadamente grandes o pequeños comparados con la mayoría de los
datos, la media podría no ser un promedio adecuado para representar los datos.
Media Poblacional. El cálculo es igual al caso anterior, pero cambia su simbología,
ya que se trata de una población.
𝜇 =∑𝑥
𝑁
Cualquier característica medible de una población recibe el
nombre de parámetro. La media de una población es un
parámetro.
Parámetro.- característica de una Población.
Foro.
Medidas de Tendencia Central para datos no agrupados.
Ejemplo:
Los trabajadores de la empresa Macondoc, reciben los siguientes sueldos mensuales:
580, 610, 650, 480, 530, 630, 600, 670, 540 y 640, calcular el sueldo mensual medio
de casa trabajador.
Se lo considera que es una población ya que toma en cuenta a todos los trabajadores.
Primero se ordena la información:
480, 530, 540, 580, 600, 610, 630, 640, 650, 670
𝜇 =∑𝑥
𝑁=
480 + 530 + 540 + 580 + 600 + 610 + 630 + 640 + 650 + 670
10
Media Poblacional
Valores De La Muestra
x
Sumatoria.
∑
simbolo de la media
Poblacional
μ
numero de
terminos
N
50 Ing. Rafael Sandino Salcedo Muñoz
𝜇 =5930
10= 593.
Entonces el sueldo mensual promedio de cada trabajador de Macondoc es de 593
dólares mensuales.
Tarea.
1. Todos los estudiantes de una determinada clase constituyen
una población. Sus calificaciones en el curso son de 92, 96,
61, 86, 79 y 84.
a) Proporcione la fórmula de la media poblacional.
b) Calcule la calificación media del curso.
c) ¿Es la media que calculó en el inciso b) un estadístico o un parámetro? ¿Por qué
razón?
2. Calcule la media de la siguiente población de valores: 7, 5, 7, 3, 7, 4.
3. Plantee usted un ejercicio, que tenga que ver con los gastos diarios de su hogar,
considere que la información se trata de una población, analice el resultado.
Media Geométrica.- La media geométrica resulta útil para determinar el cambio
promedio de porcentajes, razones, índices o tasas de crecimiento. Posee amplias
aplicaciones en la administración y la economía, ya que con frecuencia hay interés en
determinar los cambios porcentuales de ventas, salarios o cifras económicas, como el
producto interno bruto, los cuales se combinan o se basan unos en otros. La media
geométrica de un conjunto de n números positivos se define como la raíz enésima de
un producto de n variables. La fórmula de la media geométrica se escribe de la
siguiente manera:
𝐌𝐆 = √𝒙𝟏. 𝒙𝟐 …… . . 𝒙𝒏𝒏 .
La Media Geométrica, siempre es menor a la media aritmética, y si se trata de una
serie de datos, con demasiados valores o valores muy altos resulta un poco dificultoso
su cálculo, por lo que la media geométrica más bien se la utiliza para otros fines.
Ejemplo. La siguiente información corresponde a la cantidad de vehículos que han
cometido una infracción de tránsito durante cinco días: 3, 5, 4, 2, 6. Calcular la media
geométrica.
Igual primeramente ordenamos los datos: 2, 3, 4, 5, 6.
𝑀𝐺 = √𝑥1. 𝑥2. 𝑥3. 𝑥4. 𝑥5𝑛 = √2.3.4.5.6
5= √720
5= 3,73
Que sería el valor medio de infracciones de tránsito diarias
Si calculáramos la media aritmética tendríamos:
�̅� =∑𝑥
𝑛=
2 + 3 + 4 + 5 + 6
5=
20
5= 4
Como observamos se cumple que: 𝑀𝐺 < �̅�
Aumento Porcentual Promedio Para Un Periodo Determinado
determinar, el aumento promedio porcentual de una población.
Por ejemplo, calcular el aumento porcentual promedio de los casos de covid 19 en
Ecuador si el 29 de marzo de 2020 eran 1924 y el 27 de abril son 23240.
Estadística Descriptiva
51
Este aumento se lo calcula por medio de la siguiente formula:
𝐌𝐆 = √𝑽𝒂𝒍𝒐𝒓 𝒂𝒍 𝒇𝒊𝒏𝒂𝒍 𝒅𝒆𝒍 𝒑𝒆𝒓𝒊𝒐𝒅𝒐
𝒗𝒂𝒍𝒐𝒓 𝒂𝒍 𝒊𝒏𝒊𝒄𝒊𝒐 𝒅𝒆𝒍 𝒑𝒆𝒓𝒊𝒐𝒅𝒐
𝒏
− 𝟏
Del 29 de marzo al 27 de abril son 30 días, por lo tanto: n = 30
𝐌𝐆 = √𝟐𝟑𝟐𝟒𝟎
𝟏𝟗𝟐𝟒
𝟑𝟎
− 𝟏 = √𝟏𝟐,𝟎𝟕𝟗𝟑𝟎
− 𝟏 = 𝟏, 𝟎𝟖𝟔𝟔 − 𝟏 = 𝟎, 𝟎𝟖𝟔𝟔
Para expresarlo en porcentaje lo multiplicamos por 100: lo que nos daría un 8,66% de
incremento diario de casos de Covid 19 en Ecuador.
Media Ponderada. Es un caso particular de la media aritmética, y se presenta cuando
existen valores que son repetitivos en una serie de datos.
La expresión que nos ayuda en el cálculo es:
Donde:
Por ejemplo, la empresa Macondoc, tiene 3 choferes con un sueldo de $ 680,
mensuales, 5 oficiales de albañilería que tienen un sueldo de $ 400, 4 maestros con
un sueldo de $ 720 y 6 pintores con un sueldo de $ 640. En este ejemplo si
desglosáramos cada sueldo, tendríamos datos, pero como hay valores comunes
aplicamos la fórmula de media ponderada.
�̅�𝑤 =𝑤1𝑥1 + 𝑤2𝑥2 + 𝑤3𝑥3 + 𝑤4𝑥4
𝑤1 + 𝑤2 + 𝑤3 + 𝑤4=
3(680) + 5(400) + 4(720) + 6(640)
3 + 5 + 4 + 6
�̅�𝑤 =2040 + 2000 + 2880 + 3840
18=
10760
18= 597,78
Entonces el sueldo promedio mensual de Macondoc es de: $ 597,78.
La fórmula en forma resumida queda:
frecuencia:
w
Valor Observado:
x
𝐌𝐞𝐝𝐢𝐚
𝐏𝐨𝐧𝐝𝐞𝐫𝐚𝐝𝐚
𝐱𝐰
52 Ing. Rafael Sandino Salcedo Muñoz
La Mediana Para Datos No Agrupados. En un conjunto de datos, la mediana es el
valor central, o sea que la mitad de datos están por debajo de la mediana y la otra
mitad están por encima de ella.
Se dice que la mediana es más representativa que la media aritmética.
La representaremos como: 𝑀𝑒.
En el caso que la serie de datos sea impar la ubicación de la mediana será:
𝑛 + 1
2
Cuando la serie de datos es par podríamos ubicar los dos valores centrales y sacamos
el promedio de los dos valores.
Ejemplo.
Calcular la mediana de los sueldos mensuales de los trabajadores de la empresa
Macondoc.
580, 610, 650, 480, 530, 630, 600, 670, 540 y 640,
Primero se ordena la información:
480, 530, 540, 580, 600, 610, 630, 640, 650, 670; observamos que la serie de datos
es par, por lo que la mediana será el promedio de los dos valores que se ubican en el
centro, así:
𝑀𝑒 =600+610
2=
1210
2= 605
De acuerdo a la Mediana el sueldo medio mensual sería de $ 605.
Si lo comparamos con el valor de la media observamos que existe una diferencia de
$ 12, que en todo caso es aceptable.
Ejemplo. Calcular la Mediana de un grupo de empleados de un Supermercado de la
ciudad de Machala y que tienen los siguientes descuentos en dólares en el mes de
mayo 2020.
15. 23, 25, 18, 32, 24, 27, 21, 34, 33, 26, 22, 28.
Se ordena la información: 15, 18, 21, 22, 23, 24, 25, 26, 27, 28, 32, 33, 34.
Como es una serie impar aplicamos: 𝑛 + 1
2=
13 + 1
2=
14
2= 7
Lo que nos indica que la mediana es el dato que está en la posición 7. Que
correspondería al dato: $ 25. Que sería el descuento medio.
La Moda.- simplemente es el valor que más se repite, necesariamente no representa
un valor medio o de posición central.
Cuando existen dos valores que tienen igual número de datos se dice que es una serie
de datos bimodal.
Si hubieran más de dos valores con igual número de repeticiones se dice que la serie
es polimodal.
Si no existen números que se repitan se dice que no existe moda.
En realidad, la moda no se utiliza mucho con los datos numéricos. Sin embargo, entre
las diferentes medidas de tendencia central que consideramos, la moda es la única
Estadística Descriptiva
53
que puede usarse con datos de nivel de medición nominal. (Recuerde que el nivel de
medición nominal se refiere a datos que consisten únicamente en nombres, etiquetas
o categorías).
La representaremos como: Mo.
La siguiente información corresponde al promedio de calificaciones en Estadística
Descriptiva de los alumnos de Tercer Semestre de Gestión de Producción y Servicios
2019. Encontrar la moda.
7,97; 7,61; 7,97; 7,56; 8,05; 8,32; 7,61; 7,83; 7,98; 7,00; 8,03; 8,27; 8,75; 7,48; 7,80.
Ordenando las notas se tendría:
7,00; 7,48; 7,56; 7,61; 7,61; 7,80; 7,83; 7,97; 7,97; 7,98; 8,03; 8,05; 8,27; 8,32; 8,75
Por lo que la moda seria: 7,61 y 7,97 ; por lo tanto, esta serie de datos es bimodal.
Ejemplo.
La empresa Oro auto de la ciudad de Machala, registro las siguientes ventas de autos
en el mes de enero de 2020.
Nissan 26; Mazda 31; kia 42; Hunday 28; Chevrolet 50.
Tarea.
1. En junio, una inversionista compró 300 acciones de Oracle
(una compañía de tecnología de la información) a $20 cada
una. En agosto compró 400 acciones más a $25. En
noviembre compró otras 400 acciones, pero el precio bajó a
$23 cada título. ¿Cuál es el precio promedio ponderado de
cada acción?
2. ¿Qué informaría usted como valor modal de un conjunto de observaciones si
hubiera un total de:
a) 10 observaciones y no hubiera dos valores iguales;
b) 6 observaciones, todas iguales;
c) 6 observaciones con valores de 1, 2, 3, 4 y 4?
3. La empresa de contabilidad de Aguilar & Aguilar de la ciudad de Machala se
especializa en la elaboración de declaraciones del impuesto sobre la renta de
profesionales independientes, como médicos, dentistas, arquitectos y abogados.
La firma emplea a 11 contadores que preparan declaraciones. El año pasado, el
número de declaraciones que elaboró cada contador fue la siguiente:
58 75 31 58 46 65 60 71 45 58 80
Determine la media, la mediana y la moda de los números de declaraciones que
elaboró cada contador. Si usted elaborara una, ¿qué medida de ubicación
recomendaría?
54 Ing. Rafael Sandino Salcedo Muñoz
En este ejemplo la moda seria la marca Chevrolet por ser el más vendido en el mes
de enero
Ejemplo.
La siguiente información corresponde a computadoras vendidas en un almacén de la
localidad, encontrar la moda.
9, 2, 5, 7, 5, 3, 8, 9, 4, 2, 6, 8, 5, 6, 10, 12, 5, 7, 11, 8, 4, 5, 6, 13, 10, 5, 7, 11, 8, 8, 6.
Ordenamos los datos:
2, 2, 3, 4, 4, 5, 5, 5, 5, 5, 5, 6, 6, 6, 6, 7, 7, 7, 8, 8, 8, 8, 8, 9, 9, 10, 10, 11, 11, 12, 13.
Por lo que en este ejemplo la moda seria 5. Y es única.
Taller. La tasa de desempleo en el estado de Alaska durante los
12 meses de 2004 aparece en la siguiente tabla:
a) ¿Cuál es la media aritmética de la tasa de desempleo en Alaska?
b) Encuentre la media y la moda de la tasa de desempleo.
c) Calcule la media aritmética y la mediana sólo de los meses de invierno (de
diciembre a marzo). ¿Es muy diferente?
2. Estime la media geométrica de los siguientes incrementos porcentuales: 2, 8,
6, 4, 10, 6, 8 y 4.
3. El U.S. Bureau of Labor Statistics publica mensualmente el índice de precios al
consumidor. Informa el cambio de precios de una canasta de artículos en el
mercado de un periodo a otro. El índice de 2000 fue de 172.2. En 2019 se
incrementó a 614.5. ¿Cuál es el aumento porcentual anual promedio del
periodo?
28% 24% 17% 16% 15%
50
42
3128
26
Chevrolet Kia Mazda Hunday Nissan
frec
uen
cia
Autos vendidos Enero en Oroauto
Estadística Descriptiva
55
Actividad De Aprendizaje II De La Unidad Didactica III
Medidas De Tendencia Central Para Datos Agrupados.
Para proceder al cálculo de las medidas de tendencia central para
datos agrupados debemos recurrir a las tablas de distribución de
frecuencias, para considerar los intervalos de clase y más que
nada los puntos medios de clase o marca de clase como se la
conoce, las frecuencias absolutas simples, las frecuencias
absolutas acumuladas y el número de datos.
La Media Aritmética. Para el cálculo de la media aritmética de
datos agrupados usamos la siguiente formula:
�̅� =∑ 𝑓. 𝑥𝑚
𝑛 𝑠𝑖 𝑠𝑒 𝑡𝑟𝑎𝑡𝑎 𝑑𝑒 𝑢𝑛𝑎 𝑚𝑢𝑒𝑠𝑡𝑟𝑎.
�̅� =∑𝑓. 𝑥𝑚
𝑁 𝑠𝑖 𝑠𝑒 𝑡𝑟𝑎𝑡𝑎 𝑑𝑒 𝑢𝑛𝑎 𝑝𝑜𝑏𝑙𝑎𝑐𝑖𝑜𝑛.
Ejemplo.
Las estaturas en centímetros de los alumnos de tercer semestre de Gestión de la
Producción y Servicios, paralelo “A”, del INSTIPP, son las siguientes:
170; 158;166; 174; 176;178; 180; 169; 175; 177; 175; 178; 176; 177; 176 y 162.
Calcule la media aritmética para datos agrupados.
Para ello copiamos el cuadro de distribución de frecuencias realizado anteriormente.
Eliminamos ciertas columnas y aumentamos otras, recordando que siempre debemos
hacer el proceso para la construcción de cuadros de frecuencia.
estatura 𝑥𝑚 f f. xm
158,00 163,50 160,75 2 321,50
163,50 169,00 166,25 1 166,25
169,00 174,50 171,75 3 515,25
174,50 180,00 177,25 10 1772,50
total 16 2775,50
�̅� =∑𝑓. 𝑥𝑚
𝑁=
2775,50
16= 173,47 𝑐𝑚𝑠.
Tarea.
La siguiente información recogida del INEC sobre el precio de la
canasta básica en el mes de mayo del 2019 (color oscuro) y
mayo del 2020 (color claro)
56 Ing. Rafael Sandino Salcedo Muñoz
Calcular la media aritmética para datos agrupados, de los dos periodos, analizarlos
de manera general y comparar entre el precio de la canasta básica de la costa y el
de la sierra.
La Mediana.
Para el caso de datos agrupados, se debe aplicar una fórmula:
𝑀𝑒 = 𝐿𝑖 +
𝑛2 − 𝐹
𝑓𝑖
Donde:
Me Mediana.
𝐿𝑖 Límite inferior del intervalo donde se ubica la Mediana.
n numero de términos.
F Frecuencia absoluta acumulada del intervalo anterior a donde se presume esta
la mediana.
i Amplitud del intervalo.
f frecuencia absoluta simple donde se encuentra ubicada la mediana.
Para ubicar la mediana en un cuadro de distribución de frecuencias, se divide el
número de datos para 2 y se compara con la frecuencia acumulada que sea igual o
superior y ahí en ese intervalo se ubica la mediana.
En este caso: 𝑛
2=
16
2= 8, ubicamos 8 o el inmediatamente superior a 8 en la
columna de la frecuencia acumulada y ese valor seria 16, por lo que nuestra mediana
va a estar ubicada en el último intervalo.
n = 16. 𝐿𝑖 = 174,50
F = 6 i = 5,50
f = 10 Ubicación de la mediana
estatura f F
158,00 163,50 2 2
163,50 169,00 1 3
169,00 174,50 3 6
174,50 180,00 10 16
total 16
Estadística Descriptiva
57
𝑀𝑒 = 𝐿𝑖 +
𝑛2 − 𝐹
𝑓𝑖 = 174,50 +
8 − 6
10. 5,50 = 174,50 +
2
10. 5,50 = 174,50 + 1,10
𝑀𝑒 = 175,60
Si el valor de la mediana esta entre los valores del intervalo escogido, quiere decir que
está bien calculada y ese sería el valor de la mediana.
En el caso que escogiéramos un intervalo equivocado, por ejemplo, el anterior:
𝑀𝑒 = 𝐿𝑖 +𝑛
2−𝐹
𝑓𝑖 = 169 +
8−3
3. 5,50 = 169 +
27,50
3= 169 + 9,17 = 178,17.
Como se aprecia este valor de la mediana no está en el intervalo anterior nos envía al
siguiente intervalo.
Tarea.
Calcular la mediana para datos agrupados, del ejercicio de la
tarea anterior, de los dos periodos, analizarlos de manera general
y comparar entre el precio de la canasta básica de la costa y el de
la sierra.
Foro.
Aplicaciones de las medidas de tendencia central para datos
agrupados
La Moda.- Para datos agrupados se considera el intervalo de mayor frecuencia y se
considera el valor medio como moda.
Para el caso del ejemplo anterior la moda estaría en el último intervalo porque tiene
frecuencia 16, y seria.
𝑀𝑜 =174,50 + 180,00
2=
354,50
2= 177,25.
Que vendría a ser la moda.
Tarea.
Calcular la moda del ejercicio de la tarea anterior
Posiciones Relativas de la Media, Mediana y Moda.
Cuando las medidas de Tendencia Central
son iguales, se tiene una distribución
simétrica en forma de campana.
En el caso de este grafico se aprecia que las
tres medidas de tendencia central son
iguales, la línea entre cortada del histograma
nos indica que está en el centro y hacia la
izquierda y hacia la derecha se observa que
tiene la misma forma ósea es simétrica.
58 Ing. Rafael Sandino Salcedo Muñoz
Ejemplo.
La siguiente información, corresponde a los pacientes atendidos diariamente en un
subcentro de salud de la ciudad de Machala por asuntos de gripe. Calcular las
medidas de tendencia central para datos no agrupados y para datos agrupados y
comentar y comparar los resultados, además ubique las medidas de tendencia central
en la gráfica.
31, 36,15, 24, 28, 38, 22, 21, 37, 22, 33, 26, 34, 19,23, 33, 18, 27, 32, 29, 26, 28.
Ordenamos la información:
15, 18, 19, 21, 22, 22, 23, 24, 26, 26, 27, 28, 28, 29, 31, 32, 33, 33, 34, 36, 37, 38.
La media aritmética es:
�̅� =∑𝑥
𝑛
=15 + 18 + 19 + 21 + 22 + 22 + 23 + 24 + 26 + 26 + 27 + 28 + 28 + 29 + 31 + 32 + 33 + 33 + 34 + 36 + 37 + 38
22
�̅� = 27,36
La mediana esta entre: 27 y 28. 𝑀𝑒 =27+28
2=
55
2= 27,50.
La serie es polimodal ya que existen 4 valores con igual número de repetición, en
estos casos también no se considera ninguno de estos valores como moda.
Para datos agrupados tendríamos:
2𝑘 ≥ 𝑛 25 > 22 32 > 22 𝑝𝑜𝑟 𝑙𝑜 𝑡𝑎𝑛𝑡𝑜: 𝑘 = 5
𝑖 ≥𝐻 − 𝐿
𝑘≥
38 − 15
5≥
23
5≥ 4,60
𝑖𝑐𝑎𝑙𝑐𝑢𝑙𝑎𝑑𝑜 = 4,60. 𝑖𝑎𝑠𝑢𝑚𝑖𝑑𝑜 = 5
pacientes 𝑥𝑚 f F 𝑓. 𝑥𝑚
15 20 17,50 3 3 52,50
20 25 22,50 5 8 112,50
25 30 27,50 6 14 165,00
30 35 32,50 5 19 162,50
35 40 37,50 3 22 112,50
22 605,00
La media Aritmética para datos agrupados es: �̅� =∑𝑓.𝑥𝑚
𝑛=
605,00
22= 27,50
La mediana se tendría en el tercer intervalo:
𝑀𝑒 = 𝐿𝑖 +
𝑛2 − 𝐹
𝑓𝑖 = 25 +
11 − 8
6. 5 = 25 +
3
6. 5 = 25 + 2,50 = 27,50
Y la moda estaría en el mismo intervalo y seria: 𝑀𝑜 = 27,50
Las tres medidas de tendencia central son las mismas por lo tanto se trata de una
distribución simétrica.
Estadística Descriptiva
59
Cuando la distribución no es simétrica, se dice que la información es sesgada, por lo
que la relación entre las tres medidas es diferente.
Sesgo Positivo.- Se produce cuando la media aritmética es la mayor de las tres
medidas. Le sigue la mediana y luego la moda. Si la distribución tiene un sesgo muy
pronunciado, la media aritmética no es representativa y toman un papel más
preponderante la mediana o la moda.
En el siguiente ejemplo tenemos la cantidad de estudiantes que se matricularon en el
INSTIPP en el periodo 2019, y se trata de un caso de sesgo positivo.
15 15 11 13 23 14 15 22 13 11 13 15 13
12 13 28 12 12 13 20 14 32 10 11 12 20
13 14 12 14 13 20 14 11 11 11.
Ordenando la información:
10 11 11 11 11 11 11 12 12 12 12 12 13
13 13 13 13 13 13 13 14 14 14 14 14 15
15 15 15 20 20 20 22 23 28 32.
2𝑘 ≥ 𝑛 2𝑘 ≥ 36 26 = 64 64 > 36 𝑝𝑜𝑟 𝑙𝑜 𝑡𝑎𝑛𝑡𝑜: 𝑘 = 6
𝑖 ≥𝐻 − 𝐿
𝑘≥
32 − 10
6≥
22
6≥ 3,67
𝑖𝑐𝑎𝑙𝑐𝑢𝑙𝑎𝑑𝑜 = 3,67 𝑖𝑎𝑠𝑢𝑚𝑖𝑑𝑜 = 4,00
ubicación de la Me,Mo
matriculados 𝑥𝑚 f F 𝑓. 𝑥𝑚
10 14 12 20 20 240
14 18 16 9 29 144
18 22 20 3 32 60
22 26 24 2 34 48
26 30 28 1 35 28
30 34 32 1 36 32
36 552
�̅� = 𝑀𝑒 = 𝑀𝑜 = 27,50
�̅� =∑𝑓. 𝑥𝑚
𝑛=
552
36
�̅� = 15,33
60 Ing. Rafael Sandino Salcedo Muñoz
𝑀𝑒 = 𝐿𝑖 +
𝑛2 − 𝐹
𝑓𝑖 = 10 +
18 − 0
20. 4 = 10 +
18
5= 10 + 3,60 = 13,60
La moda: Mo = 12
Mo Me �̅�
Sesgo Negativo.- en este caso la media es la menor de las medidas de tendencia
central, la mediana es mayor que la media y la moda es la mayor de las tres.
El mismo ejemplo, pero con datos diferentes.
15 25 31 28 23 20 33 22 27 32 33 15 30
33 29 28 33 28 34 20 33 32 32 29 25 20
28 22 29 14 13 20 27 31 32 33.
Ordenando la información:
13 14 15 15 20 20 20 20 22 22 23 25 25
27 27 28 28 28 28 29 29 29 30 31 31 32
32 32 32 33 33 33 33 33 33 34
2𝑘 ≥ 𝑛 2𝑘 ≥ 36 26 = 64 64 > 36 𝑝𝑜𝑟 𝑙𝑜 𝑡𝑎𝑛𝑡𝑜: 𝑘 = 6
𝑖 ≥𝐻 − 𝐿
𝑘≥
34 − 13
6≥
21
6≥ 3,50
𝑖𝑐𝑎𝑙𝑐𝑢𝑙𝑎𝑑𝑜 = 3,50 𝑖𝑎𝑠𝑢𝑚𝑖𝑑𝑜 = 4,00
Mo = 31
matriculados 𝑥𝑚 f F 𝑓. 𝑥𝑚
13 17 15 4 4 60
17 21 19 4 8 76
21 25 23 3 11 69
25 29 27 8 19 216
29 33 31 10 29 310
33 37 35 7 36 245
36 976
ubicacion de la Me, �̅�
Estadística Descriptiva
61
𝑀𝑒 = 𝐿𝑖 +
𝑛2 − 𝐹
𝑓𝑖 = 25 +
18 − 11
8. 4 = 25 +
7
8. 4
𝑀𝑒 = 25 + 3,50 = 28,50
�̅� Me Mo
Taller.
Del cuadro que se presenta, tomar la información de las ocho
columnas de la derecha y calcule las medidas de tendencia
central para datos agrupados y no agrupados.
Y realice un histograma con el polígono de frecuencia, y ubique la media, mediana y
moda, analizando si es una distribución uniforme o asimétrica
�̅� =∑𝑓. 𝑥𝑚
𝑛=
976
36
�̅� = 27,11
62 Ing. Rafael Sandino Salcedo Muñoz
Una medida de ubicación es un valor que sirve para describir el
centro de un conjunto de datos. La media aritmética es la medida
de ubicación que más se informa. Se calcula mediante la suma de
los valores de las observaciones, que luego se divide entre el
número total de observaciones.
Las características principales de la media aritmética son las siguientes:
a) Por lo menos se requiere la escala de medición de intervalo.
b) Todos los valores de los datos se incluyen en el cálculo.
c) Un conjunto de datos sólo posee una media. Es decir, que es única.
d) La suma de las desviaciones de la media es igual a 0.
La media ponderada se encuentra multiplicando cada observación por su
correspondiente ponderación. Ésta es un caso especial de la media aritmética.
La mediana es el valor que se encuentra en medio de un conjunto de datos ordenados.
1. Para determinar la mediana, se ordenan las observaciones de menor a mayor y se
identifica el valor intermedio.
2. Las principales características de la mediana son las siguientes:
a) Se requiere por lo menos la escala ordinal de medición.
b) No influyen sobre ésta valores extremos.
c) Cincuenta por ciento de las observaciones son más grandes que la mediana.
d) Ésta es única de un conjunto de datos.
La moda es el valor que se presenta con mayor frecuencia en un conjunto de datos.
1. La moda se determina en el caso de datos de nivel nominal.
2. Un conjunto de datos puede tener más de una moda.
La media geométrica es la enésima raíz del producto de n valores positivos.
La media geométrica también se emplea para determinar la razón de cambio de un
periodo a otro.
Estadística Descriptiva
63
La media geométrica siempre es igual o menor que la media aritmética
Actividades de Auto - Evaluación De La Unidad III.
1. Considere en una población los siguientes cinco valores: 8, 3, 7,
3 y 4.
Calcular las medidas de tendencia central para datos no
agrupados.
2. Determine Las medidas de tendencia central, realice en la misma
grafica un histograma y un polígono de frecuencias y marque la
posición de estas medidas centrales
Actividad Final de la Unidad III
1. Considere a los siguientes seis valores como una población: 13, 3, 8, 10, 8 y 6.
Calcular las medidas de tendencia central para datos no agrupados.
2. Determine Las medidas de tendencia central, realice en la misma grafica un
histograma y un polígono de frecuencias y marque la posición de estas medidas
centrales
64 Ing. Rafael Sandino Salcedo Muñoz
DESARROLLO DE ACTIVIDADES.
Unidad didáctica IV. Medidas de Dispersión
INTRODUCCION.
Una medida de ubicación, como la media o la mediana, solamente describe el centro
de los datos. Desde este punto de vista resulta valiosa, pero no dice nada sobre la
dispersión de los datos.
Un valor pequeño en una medida de dispersión indica que los datos se acumulan con
proximidad alrededor de la media aritmética. Por consiguiente, la media se considera
representativa de los datos. Por lo contrario, una medida grande de dispersión indica
que la media no es confiable.
Una segunda razón para estudiar la dispersión en un conjunto de datos consiste en
comparar la propagación en dos o más distribuciones.
Ahora se consideran varias medidas de dispersión. La amplitud de variación o
intervalos tiene como objetivo identificar o localizar los valores máximos y mínimos
de una serie de datos, y la desviación media, la varianza y la desviación estándar se
basan en las desviaciones respecto a la media
Objetivo: Calcular las Medidas de Dispersión, con el apoyo de las respectivas formulaciones existentes para aplicarlos en el ámbito profesional con mucha responsabilidad.
Medidas de
Dispersion
Datos No Agrupados
Amplitud
De
Variacion
Desviacion Media
Varianza Desviacion Estandar
Datos
Agrupados
Amplitud De
Variacion
Desviacion Estandar
Interpretacion
Y Usos De La Desviacion Estandar
Teorema De
Chebyshev
Regla Empirica
Dispersion Relativa
Coeficiente De
Variacion
Asimetria
Coeficiente De
Asimetria
De
Pearson
Coeficiente De
Asimetria
De
Software
Otras Medidas De Dispersion
Cuartiles Deciles Centiles
Diagrama
De
Caja
Estadística Descriptiva
65
ACTIVIDADES DE APRENDIZAJE DE LA UNIDAD DIDACTICA IV
Actividad De Aprendizaje I De La Unidad Didactica IV
Medidas De Dispersión Para Datos No Agrupados
Amplitud de Variación.- también conocida como amplitud de intervalo, es la medida
de dispersión más sencilla, simplemente es la diferencia entre el valor mayor y el
menor de un conjunto de datos debidamente ordenados. Se lo calcula mediante la
expresión:
𝐴𝑚𝑝𝑙𝑖𝑡𝑢𝑑 𝑑𝑒 𝑣𝑎𝑟𝑖𝑎𝑐𝑖𝑜𝑛 = 𝑣𝑎𝑙𝑜𝑟 𝑚𝑎𝑦𝑜𝑟 − 𝑣𝑎𝑙𝑜𝑟 𝑚𝑒𝑛𝑜𝑟.
𝐴𝑉 = 𝑉𝑀 − 𝑉𝑚
Ejemplo:
La producción diaria de cajas de banano en una bananera de la Provincia de El Oro
es: 354, 487, 524, 610, 355, 480, 560. Mientras que en otra de las mismas
características es: 580, 388, 447, 425, , 520, 540, 395, Calcule la amplitud de
variación de ambas bananeras e indique en cual existe más dispersión.
Primeramente, se ordena la información de menor a mayor.
354, 355, 480, 487, 524, 560, 610. 𝐴𝑉 = 𝑉𝑀 − 𝑉𝑚 = 610 − 354 = 256
388, 395, 425, 447, 520, 540, 580. 𝐴𝑉 = 𝑉𝑀 − 𝑉𝑚 = 580 − 388 = 192
Calculamos las medias aritméticas:
�̅� =∑ 𝑥
𝑛=
354 + 355 + 480 + 487 + 524 + 560 + 610
7=
3370
7= 481,43
�̅� =∑𝑥
𝑛=
388+395+425+447+520+540+580
7=
3295
7= 470,71.
Por lo que se concluye que en la segunda bananera hay menor dispersión ya que la
distancia entre la media y la amplitud de la variación es menor.
Desviación Media.- Se la considera como el promedio aritmético
de los valores absolutos de las desviaciones con respecto a la
media aritmética. Tiene una ventaja respecto a la amplitud de
variación, ya que la desviación media considera todos los valores.
La expresión que nos permite calcular la desviación media es:
𝐷𝑀 =∑|𝑥 − �̅�|
𝑛
Donde:
n numero de valores observados
x cada valor observado.
�̅� media aritmética
| | valor absoluto.
En el ejercicio anterior calcular la desviación media. Para esto, aunque no se trata de
datos agrupados podríamos hacer una tabla para abreviar procesos:
66 Ing. Rafael Sandino Salcedo Muñoz
𝐷𝑀 =∑|𝑥 − �̅�|
𝑛=
510,57
7= 72,94
Aquí tenemos que el número de cajas
varia en 72,94 cajas por día con
respecto a la media
𝐷𝑀 =∑|𝑥 − �̅�|
𝑛=
455,71
7= 65,10
Aquí tenemos que el número de cajas
varia en 65,10 cajas por día con
respecto a la media
se confirma que en la primera bananera hay más dispersión.
Varianza Y Desviación Estándar.
La varianza y la desviación estándar también se fundamentan en
las desviaciones de la media. Sin embargo, en lugar de trabajar
con el valor absoluto de las desviaciones, la varianza y la
desviación estándar lo hacen con el cuadrado de las
desviaciones.
Varianza.- es la media aritmética de las desviaciones cuadráticas con respecto a la
media. Se debe resaltar que la varianza siempre es positiva y puede llegar a valer
hasta cero solo cuando todas las observaciones son iguales.
Desviación Estándar.- simplemente es la raíz cuadrada de la varianza, pero se
considera únicamente el valor positivo.
Varianza Poblacional.- para el caso de una población se la calcula con la siguiente
formula: 𝜎2 =∑(𝑥−𝜇)2
𝑁
Donde:
𝜎2 Es la varianza de la población (𝜎 . es la letra minúscula del alfabeto griego se
llama sigma) se lee sigma al cuadrado.
X Es cada valor observado.
N numero de datos de la población.
𝜇 media aritmética poblacional.
Desviación Estándar Poblacional.- es la raíz cuadrada de la
varianza, pero solo se considera el valor positivo.
Numero cajas
�̅� (x – �̅�) |𝑥 − �̅�|
354 481,43 -127,43 127,43
355 481,43 -126,43 126,43
480 481,43 -1,43 1,43
487 481,43 5,57 5,57
524 481,43 42,57 42,57
560 481,43 78,57 78,57
610 481,43 128,57 128,57
510,57
Numero cajas
�̅� (x – �̅�) |𝑥 − �̅�|
388 470,71 -82,71 82,71
395 470,71 -75,71 75,71
425 470,71 -45,71 45,71
447 470,71 -23,71 23,71
520 470,71 49,29 49,29
540 470,71 69,29 69,29
580 470,71 109,29 109,29
455,71
Estadística Descriptiva
67
Ejemplo. La producción diaria de cajas de banano durante una
semana en una bananera de la Provincia de El Oro es:
354, 487, 524, 610, 355, 480, 560.
Calcular la varianza poblacional y la desviación estándar
poblacional.
Inicialmente calculamos la media que en este caso la calculamos como poblacional
ya que estamos considerando el total diario durante una semana.
𝜇 =∑𝑥
𝑁=
3370
7= 481,43
𝜎2 =∑(𝑥 − 𝜇)2
𝑁=
56771,68
7= 8110,24
𝜎 = √∑(𝑥−𝜇)2
𝑁= √8110,24 =90,06
Las medidas de dispersión siempre se comparan
con otra del mismo tipo generalmente, por lo
tanto, calcularemos la varianza y la desviación
estándar de la otra bananera.
𝜇 =∑𝑥
𝑁=
3295
7= 470,71.
𝜎2 =∑(𝑥 − 𝜇)2
𝑁=
34399,40
7= 4914,20
𝜎 = √∑(𝑥 − 𝜇)2
𝑁= √4914,20 = 70,10
Por lo que se concluye que hay menos dispersión en la segunda bananera, tanto por
los valores de la varianza que son menores y lo mismo ocurre con la desviación
estándar poblacional.
Tarea.
La siguiente serie de datos corresponde al sueldo de un grupo
de empleadas domésticas, considere que se trata de una
población.
324,358, 420, 354, 487, 424, 410, 325, 440, 500.
Calcular la varianza poblacional y la desviación estándar
poblacional.
Varianza Muestral. Para calcular esta varianza se puede usar dos fórmulas: la una
es la fórmula de las desviaciones y la otra es por la formula directa.
Numero cajas
(x - 𝜇) (𝑥 − 𝜇)2
354 -127,43 16238,40
355 -126,43 15984,54
480 -1.43 2,04
487 5,57 31,02
524 42,57 1812,20
560 78,57 6173,24
610 128,57 16530,24
3370 0,00 56771,68
Numero cajas
(x - 𝜇) (𝑥 − 𝜇)2
388 -82,71 6840,94
395 -75,71 5732,00
425 -45,71 2089,40
447 -23,71 562,16
520 49,29 2429,50
540 69,29 4801.10
580 109,29 11944,30
3295 0,00 34399,40
68 Ing. Rafael Sandino Salcedo Muñoz
Formula De La Desviación.- toma el nombre de muestral, porque se considera una
muestra y varia con respecto a la poblacional en el denominador ya que en la muestral
se divide para (n – 1), y según estudios se dice que es un ajuste o corrección
estadística al usar este denominador, se lo representa como: 𝒔𝟐. Y la fórmula para
calcular es: 𝑠2 =∑(𝑥−�̅�)2
𝑛−1
Donde:
𝑠2 varianza muestral.
x Valor de cada observación.
�̅� Media aritmética.
n es el número de datos.
Formula Directa.- tiene el mismo significado, pero algunos lo consideran como más
fácil el uso de esta fórmula. 𝑠2 =∑𝑥2−
(∑𝑥)2
𝑛
𝑛−1
La siguiente serie de datos corresponde a visitas por mes realizadas por un
fiscalizador a una obra, desde el mes de enero del 2020 hasta la fecha.
3, 7, 5, 8, 4, 9.
Calcular la varianza muestral, por las dos fórmulas:
Inicialmente ordenamos los datos, luego calculamos la media aritmética de la muestra.
3, 4, 5, 7, 8, 9.
�̅� =∑𝑥
𝑛=
3+4+5+7+8+9
6=
36
6= 6.
Calculamos la varianza muestral
𝑠2 =∑(𝑥−�̅�)2
𝑛−1=
28
5= 5,60 𝑠2 =
∑𝑥2− (∑𝑥)2
𝑛
𝑛−1=
244− (36)2
6
6−1=
244− 1296
6
5=
244−216
5
𝑠2 =28
5= 5,60
Como se aprecia por los dos métodos sale el mismo valor.
Foro.
Medidas de Dispersión de datos no agrupados, ¿para qué
sirven?
Desviación Estándar Muestral.- es un estimador de la desviación estándar
poblacional. Como lo indicamos anteriormente en la poblacional es igual a la raíz
Visitas (x) 𝑥 − �̅� (𝑥 − �̅�)2
3 -3 9
4 -2 4
5 -1 1
7 1 1
8 2 4
9 3 9
36 6 28
Visitas (x) 𝑥2
3 9
4 16
5 25
7 49
8 64
9 81
36 244
Estadística Descriptiva
69
cuadrada de la varianza poblacional, en el caso de una muestra igual es la raíz
cuadrada de la varianza muestral, solo el valor positivo.
Desviación Estándar Muestral Método De La Desviación.
𝑠 = √∑(𝑥 − �̅�)2
𝑛 − 1
Desviación Estándar, Formula Directa.-
𝑠 =√∑𝑥2 −
(∑𝑥)2
𝑛𝑛 − 1
Para el ejemplo anterior calcular la desviación estándar por las dos fórmulas.
𝑠 = √∑(𝑥−�̅�)2
𝑛−1= √5,60 = 2,37 𝑠 = √∑𝑥2−
(∑𝑥)2
𝑛
𝑛−1= √5,60 = 2,37
Taller.
A. Los pesos de unos contenedores enviados a Colombia son
95000 103000 105000 110000
104000 105000 112000 90000.
Igual cantidad de contenedores envía otra empresa a Perú, con los siguientes
pesos:
87000 128000 89000 93500
104000 110000 160000 98000
Calcule:
1. La amplitud de la varianza.
2. La desviación media.
3. La varianza y desviación estándar muestral por los dos métodos.
4. Compare y comente los dos resultados.
B. El informe anual de la Cemento Nacional incluyó las siguientes ganancias
primarias por acción común durante los pasados 5 años:
$2.68, $1.03, $2.26, $4.30 y $3.58.
Si supone que éstos son los valores poblacionales:
a) ¿Cuál es la varianza?
Actividad De Aprendizaje II De La Unidad Didactica IV
Medidas De Dispersión Para Datos Agrupados.
Amplitud De Variación.- para el caso de datos agrupados se la
calcula mediante la diferencia entre el límite superior del ultimo
intervalo y el límite inferior del primer intervalo.
𝐴𝑚𝑝𝑙𝑖𝑡𝑢𝑑 𝑑𝑒 𝑣𝑎𝑟𝑖𝑎𝑐𝑖𝑜𝑛 = 𝐿𝑖𝑚𝑖𝑡𝑒 𝑠𝑢𝑝𝑒𝑟𝑖𝑜𝑟 𝑢𝑙𝑡 𝑖𝑛𝑡𝑒𝑟 − 𝑙𝑖𝑚𝑖𝑡𝑒 𝑖𝑛𝑓𝑒𝑟𝑖𝑜𝑟 1𝑒𝑟 𝑖𝑛𝑡𝑒𝑟
𝐴𝑉 = 𝐿𝑠 − 𝐿𝑖
70 Ing. Rafael Sandino Salcedo Muñoz
Ejemplo: La siguiente información, corresponde
a los pacientes atendidos diariamente en
un subcentro de salud de la ciudad de
Machala por asuntos de gripe. Calcular
la amplitud de variación.
𝐴𝑉 = 𝐿𝑠 − 𝐿𝑖 = 40 − 15 = 25
Desviación Estándar.- Para calcular la desviación estándar de
datos agrupados en una distribución de frecuencias, se necesita
ajustar ligeramente la fórmula utilizada para datos no agrupados.
Pondere cada una de las diferencias cuadradas por el número de
frecuencias en cada clase. La fórmula es:
𝑠 = √∑𝑓(𝑥𝑚−�̅�)2
𝑛−1.
En el ejercicio anterior adecuamos la tabla de frecuencias para poder calcular la
desviación estándar
Pacientes(x) 𝑥𝑚 f 𝑓. 𝑥𝑚 𝑥𝑚 − �̅� (𝑥𝑚 − �̅�)2 𝑓(𝑥𝑚 − �̅�)2
15 20 17,50 3 52,50 -10 100 300
20 25 22,50 5 112,50 -5 25 125
25 30 27,50 6 165,00 0 0 0
30 35 32,50 5 162,50 5 25 125
35 40 37,50 3 112,50 10 100 300
22 850
�̅� =∑𝑓. 𝑥𝑚
𝑛=
605,00
22= 27,50
𝑠 = √∑𝑓(𝑥𝑚 − �̅�)2
𝑛 − 1= √
850
22 − 1= √40,48 = 6,36
Desviación Estándar Directa Para Datos Agrupados
𝑠 =√∑𝑓(𝑥𝑚)2 −
(∑𝑓𝑥𝑚)2
𝑛𝑛 − 1
Para comparar con el cálculo anterior utilizamos parte de la información de la tabla
anterior.
Pacientes(x) 𝑥𝑚 (𝑥𝑚)2 f 𝑓. 𝑥𝑚 𝑓(𝑥𝑚)2
15 20 17,50 306,25 3 52,50 918,75
20 25 22,50 506,25 5 112,50 2531,25
25 30 27,50 756,25 6 165 4537,50
30 35 32,50 1056,25 5 162,50 5281,25
pacientes f
15 20 3
20 25 5
25 30 6
30 35 5
35 40 3
22
Estadística Descriptiva
71
35 40 37,50 1406,25 3 112,50 4218,75
22 605 17487,50
𝑠 =√∑𝑓(𝑥𝑚)2 −
(∑ 𝑓𝑥𝑚)2
𝑛𝑛 − 1
=√17487,50 −
(605)2
2222 − 1
=√17487,50 −
36602522
21
𝑠 = √17487,50 − 16637,50
21= √
850
21= √40,48 = 6,36
Se puede observar que por las dos fórmulas sale el mismo valor
Interpretación Y Usos De La Desviación Estándar
La desviación estándar normalmente se utiliza como medida para comparar la
dispersión de dos o más conjuntos de observaciones.
La desviación estándar es un promedio de las desviaciones individuales de cada
observación con respecto a la media de una distribución. Así, la desviación
estándar mide el grado de dispersión o variabilidad. En primer lugar, midiendo la
diferencia entre cada valor del conjunto de datos y la media del conjunto de datos.
La desviación típica como medida absoluta de dispersión, es la que mejor nos
proporciona la variación de los datos con respecto a la media aritmética, su valor se
encuentra en relación directa con la dispersión de los datos, a mayor dispersión de
ellos, mayor desviación típica, y a menor dispersión, menor desviación típica.
Teorema De Chebyshev.
Ya se ha insistido en el hecho de que una desviación estándar
pequeña de un conjunto de valores indica que éstos se localizan
cerca de la media. Por lo contrario, una desviación grande revela
que las observaciones se encuentran muy dispersas con respecto
a la media. El matemático ruso P. L. Chebyshev (1821-1894)
estableció un teorema que nos permite determinar la mínima
porción de valores que se encuentran a cierta cantidad de
desviaciones estándares de la media.
Por ejemplo, de acuerdo con el teorema de Chebyshev.
Por lo menos tres de cuatro valores, o 75%, deben encontrarse entre la media más
dos desviaciones estándares y la media menos dos desviaciones estándares. Esta
relación se cumple con independencia de la forma de la distribución.
�̅� ± 2𝑠
Además, por lo menos ocho de los nueve valores, 88.9%, se encontrarán más de tres
desviaciones estándares y menos tres desviaciones estándares de la media, y.
�̅� ± 2𝑠
72 Ing. Rafael Sandino Salcedo Muñoz
Por lo menos 24 de 25 valores, o 96%, se encontrará entre más y menos cinco
desviaciones estándares de la media. El teorema de Chebyshev establece lo
siguiente:
�̅� ± 5𝑠
Teorema De Chebyshev En cualquier conjunto de observaciones (muestra o
población), la proporción de valores que se encuentran a k desviaciones estándares
de la media es de por lo menos:1 −1
𝑘2 , siendo k cualquier constante mayor que 1.
La media aritmética del ejercicio anterior es: 27,50 y la desviación estándar: 6,36. ¿Por
lo menos qué porcentaje de las aportaciones se encuentra en más 3?5 desviaciones
estándares y menos 3.5 desviaciones de la media?
k = 3,5 1 −1
𝑘2 = 1 −1
(3,5)2= 1 −
1
12,25= 1 − 0.08 = 0,92 ∗ 100 = 92%
lo que nos indica que el 92% esta alrededor de más o menos 3,5 desviaciones
estándar.
La Regla Empírica
El teorema de Chebyshev se relaciona con cualquier conjunto de valores; es decir,
que la distribución de valores puede tener cierta forma. Sin embargo, en cualquier
distribución simétrica con forma de campana, es posible ser más precisos en la
explicación de la dispersión en torno a la media. Estas relaciones que implican la
desviación estándar y la media se encuentran descritas en la regla empírica, a veces
denominada regla normal.
Por lo tanto, la regla empírica establece que, en cualquier distribución de frecuencias
simétrica con forma de campana, aproximadamente 68% de las observaciones se
encontrarán entre más y menos una desviación estándar de la media; cerca de 95%
de las observaciones se encontrarán entre más y menos dos desviaciones estándares
de la media y, de hecho, todas (99.7%), estarán entre más y menos tres desviaciones
estándares de la media.
Estas relaciones se representan en la gráfica, en el caso de una distribución con forma
de campana con una media de 100 y una desviación estándar de 10.
68% �̅� ± 1𝑠
95% �̅� ± 2𝑠
99,7% �̅� ± 3𝑠
Estadística Descriptiva
73
Ejemplo.
Se tiene una muestra de tarifas electricas y tiene una distribucion simetrica, la media
es de $145 y la desviacion estandar es $18. Encontrar.
1. Entre que cantidades se encuentra aproximadamente el 68% de las tarifas
electricas.
2. Entre que cantidades aproximadamente se encuentra el 95% de las tarifas
electricas.
3. Y entre que cantidades estarian el 99,7% de las tarifas electricas
El 68% estaría: �̅� ± 1𝑠 = 145 + 18 = 163 ; 145 − 18 = 127. Por lo tanto, el
68% de las tarifas eléctricas estarían entre $127 y $163.
EL 95% estaría: �̅� ± 2𝑠 = 145 + 2(18) = 145 + 36 = 181 ; 145 − 36 = 109
Entonces el 95% se encuentra entre: $109 y $181.
El 99,7% esta: �̅� ± 3𝑠 = 145 + 3(18) = 145 + 54 = 199 ; 145 − 54 = 91
Por lo tanto, el 99,7% de las tarifas eléctricas estaría entre: $91 y $199.
Foro.
Medidas de dispersión datos agrupados, diferencia con los datos
no agrupados
Dispersión Relativa.- con la finalidad de poder comparar dos variables diferentes Karl
Pearson desarrollo una medida relativa que toma el nombre de coeficiente de
variación.
Coeficiente De Variación.- Es la razón de la desviación estándar y la media
aritmética, como es un coeficiente se lo expresa en porcentaje. Es muy utilizado
cuando:
1. Los datos están en unidades diferentes. Por ejemplo, estatura, sueldos.
2. Los datos están en las mismas unidades, pero los valores medios están muy
distantes.
Se lo calcula con la siguiente formula: 𝐶𝑉 =𝑆
𝑋 (100).
Ejemplo.- Los empleados de Macondoc recibieron la siguiente bonificación media por
el día del padre $ 300,00 con una desviación de $ 60,00. La media de los años de
trabajo es de 12 años con una desviación de 3 años. Compare las dispersiones
relativas de las dos distribuciones empleando el coeficiente de variación.
𝐶𝑉 =𝑆
𝑋 (100) =
60
300(100) = 20%. 𝐶𝑉 =
𝑆
𝑋 (100) =
3
12(100) = 25%.
Donde se observa que hay más dispersión relativa con respecto a los años de
trabajo que a los bonos entregados, ya que: 25% > 20%.
74 Ing. Rafael Sandino Salcedo Muñoz
Tarea.
El sueldo medio de un grupo de trabajadores eléctricos es de
$ 728 y la desviación estándar es de $ 54. Determinar:
1. Entre que cantidades se encuentra aproximadamente el 68% de
las tarifas electricas.
2. Entre que cantidades aproximadamente se encuentra el 95% de las tarifas
electricas.
3. Y entre que cantidades estarian el 99,7% de las tarifas electricas.
4. Si se sabe que estos trabajadores tienen una media de 20 años de trabajo y
una desviacion estandar de 7 años. Calcule los coeficientes de variacion y
compare y analice los resultados.
Asimetría
En la unidad anterior pudimos revisar la asimetría y simetría de los datos con
respecto a las medidas de posición como la media, mediana y moda. Y se pudo
analizar los tipos de simetría sin embargo los recordaremos brevemente.
Cuando se tiene una serie de datos simétrica, la media y la mediana tienen el
mismo valor y los datos se encuentran uniformemente distribuidos.
Una serie de datos es asimétrica o sesgada hacia la derecha o positivamente
asimétrico, cuando los valores se encuentran extendidos más hacia la
derecha del pico que hacia la izquierda y existen un solo pico. Aquí la media
es mayor que la mediana.
En una serie de datos se tiene una distribución sesgada hacia la izquierda o
es negativamente asimétrica cuando existe un solo pico y las observaciones
se encuentran más hacia la izquierda en la dirección negativa que hacia la
derecha.
Estadística Descriptiva
75
Coeficiente De Asimetría de Pearson.- El valor que nos da al calcularlo esta entre
(- 3 y – 3). Un valor cercano a (- 3), nos indica que existe una asimetría negativa. Un
valor positivo cercano a (1,50) nos indica una asimetría moderada. Si el valor del
coeficiente de asimetría es cero, quiere decir que es una distribución simétrica, ósea
que la media, mediana y moda son iguales. La fórmula que permite su cálculo es:
𝐶𝐴 =3(�̅� − 𝑀𝑒)
𝑠
Coeficiente De Asimetría De Software.- Esta fórmula nos permite entender mejor la
asimetría, ya que el segundo miembro de la formula contiene la diferencia de cada
valor con respecto a la media, dividida entre la desviación estándar. Al estar elevada
al cubo mantiene el sentido de la diferencia.
𝐶𝐴 =𝑛
(𝑛 − 1)(𝑛 − 2)[∑(
𝑥 − �̅�
𝑠)3
]
76 Ing. Rafael Sandino Salcedo Muñoz
Ejemplo.
Calcular el coeficiente de asimetría por Pearson y Software de la ganancia por
acción en el año 2019 de una muestra de 15 empresas productoras de software,
estas ganancias se muestran en la siguiente serie de datos de forma ordenada y su
unidad es el dólar.
0,09 0,13 0,41 0,51 1,12
1,20 1,49 3,18 3,50 6,36
7,83 8,92 10,13 12,99 16,40.
Calculamos la desviación estándar.
�̅� =74,26
15= 4,95.
Me = 3,18.
𝑠 =√∑𝑥2 −
(∑𝑥)2
𝑛𝑛 − 1
𝑠 =√749,3720 −
(74,26)2
1515 − 1
𝑠 =√749,3720 −
5514,547615
15 − 1
𝑠 = √749,3720 − 367,6365
14
𝑠 = √381,7355
14= √27,27
𝑠 = 5,22
Ahora calculamos el coeficiente de asimetría por la fórmula de Pearson.
𝐶𝐴 =3(�̅� − 𝑀𝑒)
𝑠=
3(4,95 − 3,18)
5,22=
3(1,77)
5,22=
5,31
5,22= 1,017
Ahora calcularemos el coeficiente de asimetría por la fórmula de Software.
𝐶𝐴 =𝑛
(𝑛 − 1)(𝑛 − 2)[∑(
𝑥 − �̅�
𝑠)3
] =15
(15 − 1)(15 − 2)[11,8274] =
177,411
14(13)
𝐶𝐴 =177,411
182= 0,9748
Por lo que se observa que la información tiene una pequeña asimetría positiva.
Ayudándonos de GeoGebra el grafico queda así:
Ganancia(x) 𝑥2 𝑥 − �̅�
𝑠 (
𝑥 − �̅�
𝑠)3
0,09 0,0081 -0,9310 -0,8070
0,13 0,0169 -0,9234 -0,7873
0,41 0,1681 -0,8697 -0,6579
0,51 0,2601 -0,8506 -0,6154
1,12 1,2544 -0,7337 -0,3950
1,20 1,4400 -0,7184 -0,3708
1,49 2,2201 -0,6628 -0,2912
3,18 10,1124 -0,3391 -0,0390
3,50 12,2500 -0,2778 -0,0214
6,36 40,4496 0,2701 0,0197
7,83 61,3089 0,5517 0,1679
8,92 79,5664 0,7605 0,4399
10,13 102,6169 0,9923 0,9772
12,99 168,7401 1,5402 3,6539
16,40 268,9600 2,1935 10,5537
74,26 749,3720 11,8274
Estadística Descriptiva
77
Taller.
1. El ingreso medio de un grupo de observaciones de una
muestra es de $500; la desviación estándar es de $40. De
acuerdo con el teorema de Chebyshev, ¿por lo menos qué
porcentaje de ingresos se encontrará entre $400 y $600?
2. Una muestra de tarifas de renta de los departamentos de Ciudad del Sol de
Machala se asemeja a una distribución simétrica con forma de campana. La
media de la muestra es de $500; la desviación estándar de $20. De acuerdo con
la regla empírica conteste las siguientes preguntas:
a. ¿Entre qué dos cantidades se encuentra aproximadamente 68% de los
gastos mensuales en alimentos?
b. ¿Entre qué dos cantidades se encuentra alrededor de 95% de los gastos
mensuales en alimentos?
c. ¿Entre qué dos cantidades se encuentran casi todos los gastos mensuales
en alimentos?
3. Calcular el coeficiente de asimetría por Pearson y Software de la ganancia por
cada metro de publicidad de una muestra de 15 empresas dedicadas a esta
actividad, estas ganancias se muestran en la siguiente serie de datos de forma
ordenada y su unidad es el dólar.
3,00 3.45 4,36 3,87 5.01
4,44 3,98 4,28 5,20 5,05
4,67 4,93 5,09 4,81 5,24
MEDIA
MEDIANA
78 Ing. Rafael Sandino Salcedo Muñoz
Actividad De Aprendizaje III De La Unidad Didactica IV
Otras Medidas de Dispersión. La desviación estándar es la
medida de dispersión que más se utiliza. No obstante, existen
otras formas de describir la variación o dispersión de un conjunto
de datos. Un método consiste en determinar la ubicación de los
valores que dividen un conjunto de observaciones en partes
iguales.
Estas medidas incluyen los cuartiles, deciles y percentiles. Los cuartiles dividen a un
conjunto de observaciones en cuatro partes iguales. Para explicarlo mejor, piense en
un conjunto de valores ordenados de menor a mayor. La mediana es el valor
intermedio de un conjunto de datos ordenados de menor a mayor. Es decir que 50%
de las observaciones son mayores que la mediana y 50% son menores. La mediana
constituye una medida de ubicación, ya que señala el centro de los datos. De igual
manera, los cuartiles dividen a un conjunto de observaciones en cuatro partes iguales.
El primer cuartil, que se representa mediante Q1, es el valor debajo del cual se
presenta 25% de las observaciones, y el tercer cuartil, que simboliza Q3, es el valor
debajo del cual se presenta 75% de las observaciones. Lógicamente, Q2 es la
mediana. Q1 puede considerarse como la mediana de la mitad inferior de los datos y
Q3 como la mediana de la parte superior de los datos. Asimismo, los deciles dividen
un conjunto de observaciones en 10 partes iguales y los percentiles en 100 partes.
Cuartiles, Deciles Y Centiles. Para formalizar el proceso de
cálculo, sea: 𝑳𝒄, la Ubicación Del Centil Deseado. Por tanto, si se
quiere obtener el centil 33 se utilizará el símbolo 𝑳𝟑𝟑, y si se
deseara la mediana, el centil 50 corresponde a la mediana 𝑳𝟓𝟎, el
numero de observaciones es (n). para ubicar la observación
central se usa la expresión: 𝒏+𝟏
𝟐.
Por lo tanto, para ubicar el centil usamos la fórmula: (𝑛 + 1)𝐶
100; Donde (C) es el
centil buscado.
Ejemplo.
Las comisiones que ganaron 15 empleados de una aseguradora ecuatoriana son:
2038 1758 1721 1637 2097
1940 2311 2054 2406 1471
2047 1460 2205 1787 2287
Localizar la mediana, el primer y tercer cuartil de las comisiones ganadas.
Como en toda serie de datos, lo primero que debemos hacer es ordenar la
información de menor a mayor:
1460 1471 1637 1721 1758
1787 1940 2038 2047 2054
2097 2205 2287 2311 2406
Según lo establecido la mediana es: 𝑳𝟓𝟎, por lo tanto:
Estadística Descriptiva
79
𝑳𝟓𝟎 = (𝑛 + 1)𝐶
100= (15 + 1)
50
100= 16
1
2= 8
Entonces la comisión ubicada en la posición 8, ósea: $ 2038, corresponde a la
mediana.
El primer cuartil es el que se encuentra en: 𝑳𝟐𝟓, aplicando la formula se tiene:
𝑳𝟐𝟓 = (𝑛 + 1)𝐶
100= (15 + 1)
25
100= 16
1
4= 4.
Por lo tanto, el primer cuartil corresponde a la comisión ubicada en la posición 4, que
es: $ 1721.
Y para calcular la comisión que se encuentra ubicada en el tercer cuartil, es: 𝑳𝟕𝟓:
𝑳𝟕𝟓 = (𝑛 + 1)𝐶
100= (15 + 1)
75
100= 16
3
4= 12
Entonces la comisión ubicada en el tercer cuartil, es la que está en la posición 12 de
la serie de datos y es: $ 2205.
El ejemplo anterior tiene un número impar de datos, veamos lo que sucede cuando la
serie es par.
Ejemplo. Los siguientes valores corresponden a los sueldos de 8 trabajadores de la
empresa de construcción y mantenimiento Macondoc:
650 820 480 730 590 600 720 550, ordenándolos se tiene:
480 550 590 600 650 720 730 820.
Encontrar el valor del primer cuartil.
𝑳𝟐𝟓 = (𝑛 + 1)𝐶
100= (8 + 1)
25
100= 9
1
4= 2,25
Según el cálculo se encuentra en la posición 2,25 no es un numero entero, entonces
para cualquier valor de cuartiles que se pida y no salga un valor entero procedemos
de la siguiente manera:
2,25 se encuentra entre: 2 y 3, que corresponde a los sueldos: $ 550 y $ 590, y
calculamos la diferencia entre estos dos valores y seria: $40.
El 2,25 me dice posición 2 +0,25, entonces posición 2 es igual a $ 550
Y a la diferencia $ 40 le multiplicamos por 0,25 que da: 10. Este valor le sumamos a $
550 y obtenemos que al primer cuartil le corresponde un sueldo de $ 560 ubicado en
𝑳𝟐𝟓
Diagramas De Caja. Un diagrama de caja es una representación gráfica, basada en
cuartiles, que ayuda a presentar un conjunto de datos. Para construir un diagrama de
caja, sólo necesita cinco estadísticos: el valor mínimo, Q1 (primer cuartil), la mediana,
Q3 (tercer cuartil) y el valor máximo.
Ejemplo.
La empresa de moto express Feroz, en una muestra de 20 entregas a registrado los
siguientes tiempos en minutos:
13 18 19 23 27 19 16
13 13 18 19 28 13 18
19 29 30 18 16 18
80 Ing. Rafael Sandino Salcedo Muñoz
Determinar el valor mínimo, el primer cuartil, la mediana, el tercer cuartil y el valor
máximo y representarlos en un diagrama de caja.
Ordenamos los tiempos y tenemos:
13 13 13 13 16 16 18
18 18 18 18 19 19 19
19 23 27 28 29 30.
El valor mínimo es: 13 minutos.
El primer cuartil lo calculamos con la fórmula:
𝑳𝟐𝟓 = (𝑛 + 1)𝐶
100= (20 + 1)
25
100= 21
1
4= 5,25
Por lo tanto, el primer cuartil se encuentra entre la posición 5 y 6.
Posición 5 corresponde a: 16 minutos.
La diferencia entre la posición 5 y 6 es: 16 – 16 = 0(0,25)= 0 minuto.
Entonces el primer cuartil: 𝑄1 = 16 + 0 = 16 𝑚𝑖𝑛𝑢𝑡𝑜𝑠.
𝑳𝟓𝟎 = (𝑛 + 1)𝐶
100= (20 + 1)
50
100= 21
1
2= 10,50
Entonces la mediana esta entre la posición 10 y 11.
Posición 10, corresponde a 18.
Posición 11, corresponde a 18.
La diferencia es cero (0), por lo tanto: 0,50(0) = 0, por lo que concluimos que la media
es: 18.
Cálculo del tercer cuartil.
𝑳𝟕𝟓 = (𝑛 + 1)𝐶
100= (20 + 1)
75
100= 21
3
4= 15,75.
Por lo tanto, el tercer cuartil se encuentra entre la posición 15 y 16.
Posición 15, corresponde a: 19.
Posición 16, corresponde a: 23
La diferencia es 4(0,75) = 3,00
Sumados al 19 nos queda: 𝑄3 = 22,00 minutos
Para realizar la gráfica es importante escoger una escala adecuada, como se nota en
la figura siguiente.
𝑄1 Valor
mínimo Me Valor
máximo 𝑄3
Estadística Descriptiva
81
Se construye un rectángulo que inicia en el primer cuartil (𝑄1)y termina en el tercer
cuartil (𝑄3), luego marcamos la mediana con una línea vertical (𝑄2), luego trazamos
dos líneas horizontales (salientes de la caja), que salen desde la caja hasta el valor
mínimo y desde la caja hasta el valor máximo
Amplitud Cuartilica.- es el valor que resulta de restar: (𝑄3) - (𝑄1)= 22 – 16 = 6.
Taller.
La fábrica de bloques Orobloques de la ciudad de Machala a
registrado las siguientes ventas del 1 al 6 de junio del 2020.
450 470 530 520 480 650 580 450 700 640
580 670 710 620 680 590 610 670 580 520
460 620 700 560 400 410 550 720 640 430
Determinar el valor mínimo, el primer cuartil, la mediana, el tercer cuartil y el valor
máximo y representarlos en un diagrama de caja.
La suma de las desviaciones de la media es igual a 0.
La dispersión es la variación o propagación en un conjunto de
datos.
La amplitud de variación o rango es la diferencia entre el valor
máximo y el mínimo en un conjunto de datos.
Las principales características de la amplitud de variación son:
a) Sólo dos valores se emplean en su cálculo.
b) Recibe la influencia de los valores extremos.
c) Es fácil de calcular y definir.
La desviación absoluta media es la suma de los valores absolutos de las desviaciones
de la media, dividida entre el número de observaciones.
Las principales características de la desviación absoluta media son las siguientes:
a) No influyen excesivamente sobre ella valores grandes o pequeños.
b) Todas las observaciones se emplean para realizar el cálculo.
c) Los valores absolutos son de alguna forma difíciles de manejar.
La varianza es la media de las desviaciones al cuadrado de la media aritmética.
Las principales características de la varianza son:
a) Todas las observaciones se utilizan para realizar el cálculo.
b) No influyen excesivamente sobre ella observaciones extremas.
c) Resulta de alguna manera difícil trabajar con las unidades, pues son las unidades
originales elevadas al cuadrado.
La desviación estándar es la raíz cuadrada de la varianza.
82 Ing. Rafael Sandino Salcedo Muñoz
1. Las principales características de la desviación estándar son:
a) Se expresa en las mismas unidades de los datos originales.
b) Es la raíz cuadrada de la distancia promedio al cuadrado de la media.
c) No puede ser negativa.
d) Es la medida de dispersión que se informa con más frecuencia
Se interpretó la desviación estándar empleando dos medidas.
A. El teorema de Chebyshev establece que independientemente de la forma de la
distribución, por lo menos: 1 −1
𝑘2 de las observaciones se encontrarán a k
desviaciones estándares de la media, siendo k mayor que 1.
B. La regla empírica afirma que, en el caso de una distribución en forma de campana,
alrededor de 68% de los valores se encontrarán a una desviación estándar de la
media; 95%, a dos y casi todas, a tres.
Actividades de Auto - Evaluación De La Unidad IV.
1. Las edades de una muestra que se tomó de turistas extranjeros
que vuelan de Miami a Galápagos fueron las siguientes:
52, 21, 60, 47, 54, 37, 72, 55, 43 y 41.
a) Calcule la amplitud de variación.
b) Estime la desviación media.
c) Calcule la desviación estándar.
2. El gerente de la tienda Sivisapa de la localidad estudia la cantidad de artículos
que compran los consumidores en el horario de la tarde. A continuación,
aparece la cantidad de artículos de una muestra de 30 consumidores:
15 8 6 9 9 4 18 10 10 12 12 4
7 8 12 10 10 11 9 13 5 6 11 14
5 6 6 5 13 5
a) Estime la amplitud de variación y la desviación estándar de la cantidad
de artículos.
b) Calcule desviación estándar de los datos agrupados.
c) Determinar el valor mínimo, el primer cuartil, la mediana, el tercer cuartil
y el valor máximo y representarlos en un diagrama de caja.
d) Calcular el coeficiente de asimetría por Pearson y Software
e) Entre que cantidades se encuentra aproximadamente el 68% de los
productos entregados
f) Entre que cantidades aproximadamente se encuentra el 95% de los
productos entregados
g) Y entre que cantidades estarian el 99,7% de los articulos entregados
Estadística Descriptiva
83
Actividad Final Unidad IV
1. Las estaturas en metros de un grupo de jugadores que se tomó son los
siguientes:
1,40 1,52 1,21 1,60 1,47 1,54 1,37 1,72 1,55 1,43 y 1,41.
a) Calcule la amplitud de variación.
b) Estime la desviación media.
c) Calcule la desviación estándar.
2. La fábrica de lámparas LED Sylvania de Ecuador evalúa la cantidad de artículos
que se han distribuido en el mes de febrero de 2020. A continuación, aparece
la cantidad de lámparas entregadas de una muestra de 30 consumidores:
150 180 160 190 290 140 185 210 110 120 172 124
117 138 172 180 150 191 179 173 145 216 171 164
155 126 156 145 193 185 160 142 135 200 210 220
a) Estime la amplitud de variación y la desviación estándar de la cantidad
de artículos.
b) Calcule desviación estándar de los datos agrupados.
c) Determinar el valor mínimo, el primer cuartil, la mediana, el tercer cuartil
y el valor máximo y representarlos en un diagrama de caja.
d) Calcular el coeficiente de asimetría por Pearson y Software
e) Entre que cantidades se encuentra aproximadamente el 68% de los
productos entregados
f) Entre que cantidades aproximadamente se encuentra el 95% de los
productos entregados
g) Y entre que cantidades estarian el 99,7% de los productos entregados
84 Ing. Rafael Sandino Salcedo Muñoz
DESARROLLO DE ACTIVIDADES.
Unidad didáctica V. Probabilidad.
INTRODUCCION.
El cálculo de la probabilidad de que algo ocurra en el futuro. Esta faceta de la
estadística recibe el nombre de inferencia estadística o estadística inferencial. Quien
toma decisiones, pocas veces cuenta con la información completa para hacerlo.
La inferencia estadística se relaciona con las conclusiones relacionadas con una
población sobre la base de una muestra que se toma de ella.
Dada la incertidumbre existente en la toma de decisiones, es importante que se
evalúen científicamente todos los riesgos implicados. La teoría de la probabilidad, a
menudo conocida como la ciencia de la incertidumbre, resulta útil para hacer esta
evaluación. Su aplicación permite a quien toma decisiones y posee información
limitada analizar los riesgos y reducir al mínimo el riesgo que existe, por ejemplo, al
lanzar al mercado un nuevo producto o aceptar un envío que quizá contenga partes
defectuosas. Puesto que los conceptos de la probabilidad son importantes en el
campo de la inferencia estadística.
en esta unidad se introduce el lenguaje básico de la probabilidad, que incluye términos
como experimento, evento, probabilidad subjetiva y reglas de la adición y de la
multiplicación.
Objetivo: Calcular las probabilidades, mediante las reglas de la adición y
multiplicación, para la interpretación de los valores calculados con ética.
probabilidad
conceptos basicos
enfoques reglasdiagrama de
arbol
teorema de Bayes
Principio de conteo
Fórmulas de la permutación y combinación.
Estadística Descriptiva
85
ACTIVIDADES DE APRENDIZAJE DE LA UNIDAD DIDACTICA V
Actividad De Aprendizaje I De La Unidad Didáctica V
Probabilidad.- Valor entre cero y uno, inclusive, que describe la
posibilidad relativa (oportunidad o casualidad) de que ocurra un
evento.
En el estudio de la probabilidad se utilizan tres palabras clave:
experimento, resultado y evento. Dichos términos son empleados
en el lenguaje de la vida cotidiana, pero en estadística adquieren
significados específicos.
Foro.
Las Probabilidades.
ResultadoResultadoparticular de unexperimento.
Evento Conjunto de unoo más resultados de unexperimento.
ExperimentoProceso QueInduce A QueOcurra Una YSólo Una DeVarias PosiblesObservaciones
86 Ing. Rafael Sandino Salcedo Muñoz
Enfoques Para Asignar Probabilidades
Probabilidad clásica.- La probabilidad clásica parte del supuesto deque los resultados de un experimento son
igualmente posibles. De acuerdo con el punto de vista clásico, laprobabilidad de un evento
que se está llevando a cabo se calcula dividiendo el número deresultados favorables entre el
número de posibles resultados:
𝑃𝑟𝑜𝑏𝑎𝑏𝑖𝑙𝑖𝑑𝑎𝑑 𝑑𝑒 𝑢𝑛 𝑒𝑣𝑒𝑛𝑡𝑜 =𝑛𝑢𝑚𝑒𝑟𝑜 𝑑𝑒 𝑟𝑒𝑠𝑢𝑙𝑡𝑎𝑑𝑜𝑠 𝑓𝑎𝑣𝑜𝑟𝑎𝑏𝑙𝑒𝑠
𝑛𝑢𝑚𝑒𝑟𝑜 𝑡𝑜𝑡𝑎𝑙 𝑑𝑒 𝑝𝑜𝑠𝑖𝑏𝑙𝑒𝑠 𝑟𝑒𝑠𝑢𝑙𝑡𝑎𝑑𝑜𝑠
Probabilidad Empírica .- La probabilidad de que un evento ocurrarepresenta una fracción. de los eventos similares que ocurrieron en elpasado.
𝑃𝑟𝑜𝑏𝑎𝑏𝑖𝑙𝑖𝑑𝑎𝑑 𝑑𝑒 𝑢𝑛 𝑒𝑣𝑒𝑛𝑡𝑜 =𝑛𝑢𝑚𝑒𝑟𝑜 𝑑𝑒 𝑣𝑒𝑐𝑒𝑠 𝑞𝑢𝑒 𝑒𝑙 𝑒𝑣𝑒𝑛𝑡𝑜 𝑜𝑐𝑢𝑟𝑟𝑒
𝑛𝑢𝑚𝑒𝑟𝑜 𝑡𝑜𝑡𝑎𝑙 𝑑𝑒 𝑜𝑏𝑠𝑒𝑟𝑣𝑎𝑐𝑖𝑜𝑛𝑒𝑠
Estadística Descriptiva
87
Ejemplo.
Cuál es la probabilidad que al lanzar el dado salga un número impar.
Los probables resultados serían: 1,2,3,4,5,6.
Y los posibles impares serian: 1,3,5
• Probabilidad de que sea impar =numero de resultados favorables
numero total de posibles resultados=
3
6= 0,50
Una empresa de transporte de pasajeros reporta que, en el mes de enero del 2020,
realizaron 640 viajes a Guayaquil, habiéndoles ocurridos 4 accidentes, que
probabilidad existe de que el próximo viaje sea con éxito.
𝑝𝑟𝑜𝑏𝑎𝑏𝑖𝑙𝑖𝑑𝑎𝑑 𝑣𝑖𝑎𝑗𝑒 𝑒𝑥𝑖𝑡𝑜𝑠𝑜 =𝑛𝑢𝑚𝑒𝑟𝑜 𝑑𝑒 𝑣𝑖𝑎𝑗𝑒𝑠 𝑒𝑥𝑖𝑡𝑜𝑠𝑜𝑠
𝑛𝑢𝑚𝑒𝑟𝑜 𝑡𝑜𝑡𝑎𝑙 𝑑𝑒 𝑣𝑖𝑎𝑗𝑒𝑠=
636
640= 0,99
Por lo que se concluye que hay un 0,99 de posibilidades que el viaje sea un éxito.
Reglas de la adición.- Existen dos reglas de la adición:
La regla especial de la adición y .
La regla general de la adición.
Regla Especial De La Adición.- Para aplicar la regla especial de
la adición, los eventos deben ser mutuamente excluyentes.
Recuerde que mutuamente excluyentes significa que cuando un
evento ocurre, ninguno de los demás eventos puede ocurrir al
mismo tiempo.
Un ejemplo de eventos mutuamente excluyentes en el experimento del lanzamiento
del dado son los eventos “un número 4 o mayor” y “un número 2 o menor”. Si el
resultado se encuentra en el primer grupo {4, 5 y 6}, entonces no puede estar en el
segundo grupo {1 y 2}. Otro ejemplo consiste en que un producto proveniente de la
línea de montaje no puede estar defectuoso y en buen estado al mismo tiempo. Si dos
eventos A y B son mutuamente excluyentes, la regla especial de la adición establece
que la probabilidad de que ocurra uno u otro es igual a la suma de sus probabilidades.
Adicion
Multiplicacion
Reglas de la
Probalidad
88 Ing. Rafael Sandino Salcedo Muñoz
Esta regla se expresa mediante la siguiente fórmula:
𝑃(𝐴 𝑜 𝐵) = 𝑃(𝐴) + 𝑃(𝐵)
Si hubiera más eventos se adecua la formula, por ejemplo, si hubiera tres eventos:
𝑃(𝐴 𝑜 𝐵 𝑜 𝐶) = 𝑃(𝐴) + 𝑃(𝐵) + 𝑃(𝐶)
Una máquina automática llena bolsas de plástico con una combinación de frijoles,
brócoli y otras verduras. La mayoría de las bolsas contiene el peso correcto, aunque,
como consecuencia de la variación del tamaño del frijol y de otras verduras, un
paquete podría pesar menos o más. Una revisión de 4 000 paquetes que se llenaron
el mes pasado arrojó los siguientes datos:
Peso Evento N° de paquetes Probabilidad que
ocurra el evento
Menos peso A 250 0,062
Peso completo B 3450 0,863
Mas peso C 300 0,075
4000 1,000
¿Cuál es la probabilidad de que un paquete en particular tenga mas o menos peso?
Aplicando la regla de la adicion se tiene:
𝑃(𝐴 𝑜 𝐶) = 𝑃(𝐴) + 𝑃(𝐶) = 0,062 + 0,075 = 0,137
Reglas de la multiplicación
Para determinar la probabilidad de dos eventos que se presentan
simultáneamente emplee la regla de la multiplicación. Hay dos
reglas de la multiplicación, la regla especial y la regla general.
Regla especial de la multiplicación La regla especial de la
multiplicación requiere que dos eventos, A y B, sean
independientes, y lo son si el hecho de que uno ocurra no altera
la probabilidad de que el otro suceda.
Regla Especial de la Multiplicación.
P(A y B) = P(A)P(B)
En el caso de tres eventos independientes, A, B y C, la regla especial de la
multiplicación que se utiliza para determinar la probabilidad de que los tres eventos
ocurran es: P(A y B y C) = P(A)P(B)P(C)
Ejemplo.
Una encuesta que llevó a cabo la American Automobile Association (AAA) reveló que
el año pasado 60% de sus miembros hicieron reservaciones en líneas aéreas. Dos de
ellos fueron seleccionados al azar. ¿Cuál es la probabilidad de que ambos hicieran
reservaciones el año pasado?
Solución La probabilidad de que el primero haya hecho una reservación el año
pasado es de 0.60, que se expresa como P(R1) =0.60, en la que R1 representa el
hecho de que el primer miembro hizo una reservación.
La probabilidad de que el segundo miembro elegido haya hecho una reservación es
también de 0.60, así que P(R2) = 0.60. Como el número de miembros de la AAA es
muy grande, se supone que R1 y R2 son independientes. En consecuencia, de
Estadística Descriptiva
89
acuerdo con la fórmula P(A y B) = P(A)P(B), la probabilidad de que ambos hayan
hecho una reservación es de 0.36, que se calcula de la siguiente manera:
P(R1 y R2) = P(R1)P(R2) = (0.60)(0.60)= 0.36
Todos los posibles resultados pueden representarse como se muestra a continuación.
Aquí, R significa que se hizo la reservación y NR, que no se hizo. Con las
probabilidades y la regla del complemento se calcula la probabilidad conjunta de cada
resultado. Por ejemplo, la probabilidad de que ningún miembro haga una reservación
es de 0.16. Además, la probabilidad de que el primero y el segundo miembros (regla
especial de la adición) hagan una reservación es de 0.48 (0.24 + 0.24). También se
puede observar que los resultados son mutuamente excluyentes y colectivamente
exhaustivos. Por lo tanto, las probabilidades suman 1.00.
Resultados Probabilidad conjunta
𝑅1 𝑅2 (0,60)(0,60) = 0,36
𝑅1 𝑁𝑅2 (0,60)(0,40) = 0,24
𝑁𝑅1 𝑅2 (0,40)(0,60) = 0,24
𝑁𝑅1 𝑁𝑅2 (0,40)(0,40) = 0,16
1,00
Tarea.
Una encuesta a un grupo de estudiantes de posgrado reveló que
el año pasado 70% de sus miembros hicieron la prueba. Dos de
ellos fueron seleccionados al azar. ¿Cuál es la probabilidad de
que ambos hicieran la prueba?
Regla General De La Multiplicación.- Si dos eventos no son independientes, se dice
que son dependientes.
Por ejemplo, supongamos que hay 10 latas de refresco en un refrigerador, 7 de los
cuales son normales y 3 dietéticos. Se saca una lata del refrigerador. La probabilidad
de que sea una lata de refresco dietético es de 3/10, y la probabilidad de que sea una
lata de refresco normal es de 7/10. Luego, se elige una segunda lata del refrigerador
sin devolver la primera. La probabilidad de que la segunda lata sea de refresco
dietético depende de que la primera lo haya sido o no. La probabilidad de que la
segunda lata sea de refresco dietético es: 2/9, si la primera bebida es dietética (sólo
dos latas de refresco dietético quedan en el refrigerador). 3/9, si la primera lata elegida
es normal (los tres refrescos aún están en el refrigerador). La denominación adecuada
de la fracción 2/9 (o 3/9) es probabilidad condicional, ya que su valor se encuentra
condicionado (o depende) del hecho de que un refresco regular o dietético haya sido
el primero en ser seleccionado del refrigerador.
Probabilidad Condicional.- Probabilidad de que un evento en particular ocurra, dado
que otro evento haya acontecido.
90 Ing. Rafael Sandino Salcedo Muñoz
La regla general de la multiplicación sirve para determinar la probabilidad conjunta de
dos eventos cuando éstos no son independientes.
Por ejemplo, cuando el evento B ocurre después del evento A, y A influye en la
probabilidad de que el evento B suceda, entonces A y B no son independientes. La
regla general de la multiplicación establece que, en caso de dos eventos, A y B, la
probabilidad conjunta de que ambos eventos ocurran se determina multiplicando la
probabilidad de que ocurra el evento A por la probabilidad condicional de que ocurra
el evento B, dado que A ha ocurrido. Simbólicamente, la probabilidad conjunta,
P(A y B), se calcula de la siguiente manera:
Regla General De La Multiplicación
P(A y B) = P(A)P(B|A)
Ejemplo. Un golfista tiene 12 camisas en su clóset. Suponga que 9 son blancas y los
demás azules. Como se viste de noche, simplemente toma una camisa y se la pone.
Juega golf dos veces seguidas y no las lava. ¿Cuál es la probabilidad de que las dos
camisas elegidas sean blancas?
El evento que se relaciona con el hecho de que la primera camisa seleccionada sea
blanca es W1. La probabilidad es P(W1) = 9/12, porque 9 de cada 12 camisas son
blancas. El evento de que la segunda camisa seleccionada sea blanca también se
identifica con W2. La probabilidad condicional relacionada con el hecho de que la
segunda camisa seleccionada sea blanca, dado que la primera camisa seleccionada
es blanca también, es P(W2|W1) =8/11. ¿A qué se debe esto? A que después de que
se selecciona la primera camisa, quedan 11 camisas en el clóset y 8 de éstas son
blancas.
Para determinar la probabilidad de que se elijan 2 camisas blancas aplicamos la
fórmula: P(A y B) = P(A)P(B|A)
𝑃(𝑊1𝑦𝑊2) = 𝑃(𝑊1)𝑃(𝑊2|𝑊1) = (9
12) (
8
11) = 0,55
Por consiguiente, la probabilidad de seleccionar dos camisas, y que ambas sean de
color blanco, es de 0.55.
A propósito, se supone que este experimento se llevó a cabo sin reemplazo. Es decir,
que la primera camisa no se lavó y se colocó en el clóset antes de hacer la selección
de la segunda. Así, el resultado del segundo evento es condicional o depende del
resultado del primer evento. Es posible ampliar la regla general de la multiplicación
para que incluya más de dos eventos. En el caso de los tres eventos, A, B y C, la
fórmula es:
P(A y B y C) = P(A)P(B|A)P(C|A y B)
Estadística Descriptiva
91
En el caso del ejemplo de la camisa de golf, la probabilidad de elegir tres camisas
blancas sin reemplazo es:
𝑃(𝑊1 𝑦 𝑊2 𝑦 𝑊3) = 𝑃(𝑊1)𝑃(𝑊2|𝑊1)𝑃(𝑊3|𝑊1𝑦𝑊2) = (9
12)(
8
11)(
7
10) = 0,38
De esta manera, la probabilidad de seleccionar tres camisas sin reemplazo, todas las
cuales sean blancas, es de 0.38.
Diagramas De Árbol.- El diagrama de árbol es una gráfica útil para organizar cálculos
que implican varias etapas. Cada segmento del árbol constituye una etapa del
problema. Las ramas del árbol se ponderan por medio de probabilidades.
Ejemplo.
Con la información de la siguiente tabla procederemos a explicar el diagrama de árbol.
Para mostrar la construcción de un diagrama de árbol.
1. Para construir un diagrama de árbol, comenzamos dibujando un punto grueso a la
izquierda para representar la raíz del árbol.
2. En este problema, dos ramas principales salen de la raíz: la rama superior
representa el evento “permanecería” y la rama inferior el evento “no permanecería”.
Sus probabilidades se anotan sobre las ramas, en este caso, 120/200 y 80/200. Estas
probabilidades también se denotan P(A1) y P(A2).
3. De cada una de las ramas principales salen cuatro ramas, las cuales representan
el tiempo de servicio: menos de 1 año, 1 a 5 años, 6 a 10 años y más de 10 años. Las
probabilidades condicionales de la rama superior del árbol, 10/120, 30/120, 5/120,
etc., se anotan en las ramas adecuadas, que son P(B1|A1), P(B2|A1), P(B3|A1) y
P(B4|A1), en las cuales B1 se refiere a menos de 1 año de servicio; B2, a 1 a 5 años
de servicio, B3, a 6 a 10 años de servicio y B4, a más de 10 años. En seguida,
anotamos las probabilidades condicionales en la rama inferior.
4. Por último, las probabilidades conjuntas relativas al hecho de que los eventos A1 y
Bi o los eventos A2 y Bi ocurrirán al mismo tiempo aparecen al lado derecho. Por
ejemplo, de acuerdo con la fórmula:
P(A y B) = P(A)P(B|A)
la probabilidad conjunta de seleccionar al azar a un ejecutivo que permanecería en la
compañía y que tenga más de 1 año de servicio es: Como las probabilidades conjuntas
representan todos los posibles resultados (permanecería, 6 a 10 años de servicio, no
permanecería, más de 10 años de servicio, etc.), deben sumar 1.00, Tal como lo
muestra la gráfica.
92 Ing. Rafael Sandino Salcedo Muñoz
Taller.
Considere una encuesta a algunos consumidores relacionada con
la cantidad relativa de visitas que hacen a una tienda Sears (con
frecuencia, en ocasiones o nunca) y con el hecho de que la tienda
se ubique en un lugar conveniente (sí y no). Cuando las variables
son de escala nominal, tal como estos datos, por lo general los
resultados se resumen en una tabla de contingencias.
a) El número de visitas y la ubicación en un lugar conveniente, ¿son variables
independientes? ¿Por qué razón? Interprete su conclusión.
b) Dibuje un diagrama de árbol y determine las probabilidades conjuntas.
Estadística Descriptiva
93
Actividad De Aprendizaje II De La Unidad Didáctica V
Teorema de Bayes.- En el siglo XVIII, el reverendo Thomas
Bayes, un ministro presbiteriano inglés, planteó esta pregunta:
¿Dios realmente existe? Dado su interés en las matemáticas,
intentó crear una fórmula para llegar a la probabilidad de que Dios
existiera sobre la base de la evidencia de que disponía en la
Tierra. Más tarde, Pierre-Simón Laplace perfeccionó el trabajo de
Bayes y le dio el nombre de teorema de Bayes. De una forma
entendible, el teorema de Bayes es el siguiente:
𝑃(𝐴𝑖|𝐵) =𝑃(𝐴𝑖)𝑃(𝐵|𝐴𝑖)
𝑃(𝐴1)𝑃(𝐵|𝐴1) + 𝑃(𝐴2)𝑃(𝐵|𝐴2)
En la fórmula anterior los eventos A1 y A2 son mutuamente excluyentes y
colectivamente exhaustivos, y Ai se refiere al evento A1 o a A2. De ahí que en este
caso A1 y A2 sean complementos. El significado de los símbolos utilizados se ilustra
en el siguiente ejemplo.
Suponga que 5% de la población de Umen, un país ficticio del Tercer mundo, tiene
una enfermedad propia del país. Sea A1 el evento “padece la enfermedad” y A2 el
evento “no padece la enfermedad”. Por lo tanto, si se selecciona al azar a una persona
de Umen, la probabilidad de que el individuo elegido padezca la enfermedad es de
0.05 o P(A1) = 0.05. Esta probabilidad, P (A1) = P(padece la enfermedad) = 0.05,
recibe el nombre de probabilidad a priori. Se le da este nombre, porque la probabilidad
se asigna antes de obtener los datos empíricos.
Probabilidad A Priori.- Probabilidad basada en el nivel de información actual.
Por ende, la probabilidad a priori de que una persona no padezca la enfermedad es
de 0.95, o P(A2) = 0.95, que se calcula restando 1 - 0.05. Existe una técnica de
diagnóstico para detectar la enfermedad, pero no es muy precisa. Sea B el evento “la
prueba revela la presencia de la enfermedad”. Suponga que la evidencia histórica
muestra que, si una persona padece realmente la enfermedad, la probabilidad de que
la prueba indique su presencia es de 0.90.
De acuerdo con las definiciones de probabilidad condicional que se establecieron en
el capítulo, dicho enunciado se expresa de la siguiente manera:
𝑃(𝐵|𝐴1) = 0.90
Suponga la probabilidad de que la prueba indique la presencia de la enfermedad en
una persona que en realidad no la padece es de 0.15.
𝑃(𝐵|𝐴2) = 0.15
Elija al azar a una persona de Umen y aplique la prueba. Los resultados indican que
la enfermedad está presente. ¿Cuál es la probabilidad de que la persona en realidad
padezca la enfermedad? Lo que desea saber, en forma simbólica, es P(A1|B), que se
interpreta de la siguiente manera:
P(padece la enfermedad | la prueba resulta positiva).
La probabilidad P(A1|B) recibe el nombre de probabilidad a posteriori.
94 Ing. Rafael Sandino Salcedo Muñoz
Probabilidad A Posteriori.- Probabilidad revisada a partir de información adicional.
Con la ayuda del teorema de Bayes, cuya formula es:
𝑃(𝐴𝑖|𝐵) =𝑃(𝐴𝑖)𝑃(𝐵|𝐴𝑖)
𝑃(𝐴1)𝑃(𝐵|𝐴1) + 𝑃(𝐴2)𝑃(𝐵|𝐴2)=
(0,05)(0,90)
(0,05)(0,90) + (0,95)(0,15)
𝑃(𝐴𝑖|𝐵) =0,0450
0,1875= 0,24
De esta forma, la probabilidad de que una persona padezca la enfermedad, dado que
la prueba fue positiva, es de 0.24.
¿Cómo interpreta el resultado? Si selecciona al azar a una persona de la población,
la probabilidad de que se encuentre enferma es de 0.05. Si se le somete a la prueba
y resulta positiva, la probabilidad de que la persona padezca realmente la enfermedad
se incrementa cinco veces, de 0.05 a 0.24. En el problema anterior sólo había dos
eventos mutuamente excluyentes y colectivamente exhaustivos A1 y A2. Si hay n
eventos A1, A2, …, An, el teorema de Bayes, cuya fórmula es:
𝑃(𝐴𝑖|𝐵) =𝑃(𝐴𝑖)𝑃(𝐵|𝐴𝑖)
𝑃(𝐴1)𝑃(𝐵|𝐴1) + 𝑃(𝐴2)𝑃(𝐵|𝐴2)
se transforma en:
Con la notación anterior, los cálculos del problema de Umen se resumen en la
siguiente tabla:
Evento 𝐴𝑖 Probabilidad a
priori 𝑃(𝐴𝑖)
Probabilidad
Condicional
𝑃(𝐵|𝐴𝑖)
Probabilidad
conjunta.
𝑃(𝐴𝑖 𝑦 𝐵)
Probabilidad a
posteriori.
𝑃(𝐴𝑖|𝐵)
Padece la
enfermedad
𝐴1
0,05 0,90 0,0450 0,0450
0,1875= 0,24
No Padece la
enfermedad
𝐴2
0,95 0,15 0,1425 0,1425
0,1875= 0,76
𝑃(𝐵) = 0,1875 1,00
Foro.
Diferencias entre Permutaciones y Combinaciones.
Principios De Conteo.- Si la cantidad de posibles resultados de
un experimento es pequeña, resulta relativamente fácil contarlas.
Por ejemplo, existen seis posibles resultados del lanzamiento de
un dado, a saber:
Estadística Descriptiva
95
Sin embargo, si hay un número muy grande
de resultados, tal como el número de caras y
cruces en un experimento con 10
lanzamientos de una moneda, sería tedioso
contar todas las posibilidades. Todos podrían
ser caras, una cruz y nueve caras, dos caras
y ocho cruces, y así sucesivamente. Para
facilitar la cuenta, se analizarán tres fórmulas
para contar: la fórmula de la multiplicación la
fórmula de las permutaciones y la fórmula de
las combinaciones.
Fórmula De La Multiplicación.- Si hay m formas de hacer una cosa y n formas de
hacer otra cosa, hay m x n formas de hacer ambas cosas.
Número total de disposiciones = (m)(n).
Si hubiera más eventos la formula se amplía.
Ejemplo.
Un distribuidor de automóviles quiere anunciar que por $29.999 usted puede
comprar un convertible, un sedán de dos puertas o un modelo de cuatro puertas y
elegir entre rines de rayos o planos. ¿Cuántas disposiciones de modelos y rines
puede ofrecer el distribuidor?
Solución Por supuesto, el distribuidor podría determinar el número total de
disposiciones haciendo un diagrama y contando. Hay seis.
Mediante la fórmula de la multiplicación se verifica el resultado (en cuyo caso m es el
número de modelos y n el tipo de rin). De acuerdo con la fórmula:
Número total de disposiciones = (m)(n).
Número total de posibles disposiciones = (m)(n) = (3)(2) = 6
No resultó difícil contar todas las posibles combinaciones de modelos y rines en este
ejemplo. Sin embargo, supongamos que el distribuidor decidió ofrecer nueve modelos
y siete tipos de rines. Resultaría tedioso representar y contar todas las posibles
96 Ing. Rafael Sandino Salcedo Muñoz
alternativas. Más bien, se puede aplicar la fórmula de la multiplicación. En este caso,
hay (m)(n) = (9)(7) = 63 posibles disposiciones. Observe en el ejemplo que, en la
fórmula de la multiplicación, había dos o más agrupamientos de los cuales usted hizo
selecciones. El distribuidor, por ejemplo, ofreció una variedad de modelos y de rines
para elegir. Si un constructor de casas le ofrece cuatro diferentes estilos de exteriores
y tres modelos de interiores, se aplicaría la fórmula de la multiplicación para determinar
cuántas combinaciones son posibles. Hay 12 posibilidades.
La aplicación de este método es fácil de aplicar y obtener una respuesta satisfactoria.
Fórmula de las permutaciones.- Como se ve, la fórmula de la multiplicación se aplica
para determinar el número de posibles disposiciones de dos o más grupos. La fórmula
de las permutaciones se aplica para determinar el número posible de disposiciones
cuando sólo hay un grupo de objetos.
Presentamos unos ejemplos de esta clase de problemas.
Ejemplo.
• Tres piezas electrónicas se van a montar en una unidad conectable a un aparato de
televisión. Las piezas se pueden montar en cualquier orden. La pregunta es: ¿de
cuántas formas pueden montarse tres partes?
Solución. Un orden sería: primero el transistor, en seguida las LED y en tercer lugar
el sintetizador. A esta distribución se le conoce como permutación.
• Un operador de máquinas debe llevar a cabo cuatro verificaciones de seguridad
antes de hacer arrancar su máquina. No importa el orden en que realice las
verificaciones. ¿De cuántas formas puede hacerlas?
Permutación.- Cualquier distribución de ( r ) objetos
seleccionados de un solo grupo de (n) posibles objetos
𝑛𝑃𝑟 =𝑛!
(𝑛 − 𝑟)!
Donde:
r es el número total de objetos seleccionados
n es el número total de objetos
Ejemplo.
Respecto del grupo de tres piezas electrónicas que se van a montar en cualquier
orden, ¿de cuántas formas se pueden montar? Solución Hay tres piezas electrónicas
que van a montarse, así que n = 3. Como las tres se van a insertar en la unidad
conectable, r = 3.
𝑛𝑃𝑟 =𝑛!
(𝑛 − 𝑟)!=
3!
(3 − 3)!=
3(2)(1)
0!=
6
1= 6
Existen seis formas en que las tres piezas electrónicas, representadas con las letras
A, B, C, se pueden ordenar, quedándonos de la siguiente manera:
ABC ACB BAC BCA CAB CBA.
Estadística Descriptiva
97
Ejemplo.
Tornería El Oro cuenta con ocho tornos, aunque sólo hay tres espacios disponibles
en el área de producción para las máquinas. ¿De cuántas maneras se pueden
distribuir las ocho máquinas en los tres espacios disponibles?
Como podemos observar en este ejemplo (𝑛 ≠ 𝑟).
n = 8; r = 3. Aplicando la formula tendremos:
𝑛𝑃𝑟 =𝑛!
(𝑛 − 𝑟)!=
8!
(8 − 3)!=
(8)(7)(6)(5)(4)(3)(2)(1)
(5)(4)(3)(2)(1)=
(8)(7)(6)
1= 336
Taller.
1. Se diseñan 6 modelos de camisetas para un equipo de
básquet, pero en el área de costura solo pueden elaborar 3
modelos.
De cuantas formas se pueden confeccionar las camisetas.
2. Suponga que: P(A) = 0,40 y P(B|A) = 0,30. ¿Cuál es la
probabilidad conjunta de A y B.
Fórmula De Las Combinaciones.- Si el orden de los objetos seleccionados no es
importante, cualquier selección se denomina combinación. La fórmula para contar el
número de ( r ) combinaciones de objetos de un conjunto de ( n ) objetos es:
𝑛𝐶𝑟 =𝑛!
𝑟! (𝑛 − 𝑟)!
Ejemplo.
Se van a delegar a 3 estudiantes para una exposición de un proyecto, sólo existe
una posible combinación con estos tres estudiantes; el grupo formado por: Kleber,
José y Paul es el mismo grupo que forman: José, Paul y Kleber. Aplicando la fórmula
de las combinaciones tenemos:
𝑛𝐶𝑟 =𝑛!
𝑟! (𝑛 − 𝑟)!=
3!
3! (3 − 3)!=
(3)(2)(1)
(3)(2)(1)(0!)=
6
6(1)= 1
Tarea.
Un músico piensa escribir una escala basada sólo en cinco
cuerdas: B bemol, C, D, E y G. Sin embargo, sólo tres de las cinco
cuerdas se van a utilizar en sucesión,
por ejemplo:
C, B bemol y E. No se permiten repeticiones como B bemol, B bemol y E.
a) ¿Cuántas permutaciones de las cinco cuerdas, tomadas de tres en tres, son
posibles?
98 Ing. Rafael Sandino Salcedo Muñoz
b) De acuerdo con la fórmula:
𝑛𝐶𝑟 =𝑛!
𝑟! (𝑛 − 𝑟)!
¿Cuántas permutaciones son posibles?
1. Una probabilidad es un valor entre 0 y 1, inclusive, que
representa las posibilidades de que cierto evento ocurra.
A. Un experimento es la observación de alguna actividad o
el acto de tomar una medida.
B. Un resultado es una consecuencia particular de un
experimento.
C. Un evento es la colección de uno o más resultados de
un experimento.
2. Existen tres definiciones de probabilidad.
A. La definición clásica se aplica cuando un experimento generará n resultados
igualmente posibles.
B. La definición empírica se emplea cuando el número de veces que ocurre un
evento se divide entre el número de observaciones.
C. Una probabilidad subjetiva se basa en cualquier información disponible. III.
Dos eventos son mutuamente excluyentes si como consecuencia de que uno
de los dos sucede, el otro no puede ocurrir.
4. Los eventos son independientes si el hecho de que un evento suceda no influye
en que el otro ocurra.
5. Las reglas de la adición se refieren a la unión de eventos.
Una probabilidad conjunta es la posibilidad de que dos o más eventos sucedan al
mismo tiempo.
Una probabilidad condicional es la posibilidad de que un evento suceda, dado que otro
evento ha sucedido.
El teorema de Bayes es un método que consiste en revisar una probabilidad, dado
que se ha logrado información adicional. En el caso de dos eventos mutuamente
excluyentes y colectivamente exhaustivos.
Existen tres reglas de conteo útiles para determinar el número de resultados de un
experimento.
La regla de la multiplicación establece que si hay m formas de que un evento suceda
y n formas de que otro pueda suceder, entonces hay mn formas en que los dos
eventos pueden suceder.
Una permutación es un arreglo en el que el orden de los objetos seleccionados de un
conjunto específico es importante.
Una combinación es un arreglo en el que el orden de los objetos seleccionados de un
conjunto específico no es importante.
Estadística Descriptiva
99
Actividades de Auto - Evaluación De La Unidad V.
1. Berdine’s Chicken Factory posee varias tiendas en el área del
Hilton Head, Carolina del Sur. Al entrevistar a los candidatos para
el puesto de mesero, al propietario le gustaría incluir información
referente a la propina que un mesero espera ganar por cuenta (o
nota). Un estudio de 500 cuentas recientes indicó que el mesero
ganaba las siguientes propinas por turno de 8 horas
a) ¿Cuál es la probabilidad de que una propina sea de $200 o más?
b) Las categorías $0 a $20, $20 a $50, etc., ¿se consideran mutuamente
excluyentes?
c) Si las probabilidades relacionadas con cada resultado se sumaran, ¿cuál
sería el total?
d) ¿Cuál es la probabilidad de que una propina sea de $50?
e) ¿De que una propina sea inferior a $200?
2. En un programa de empleados que realizan prácticas de gerencia en Claremont
Enterprises, 80% de ellos son mujeres y 20% hombres. Noventa por ciento de
las mujeres fue a la universidad, así como 78% de los hombres.
a) Al azar se elige a un empleado que realiza prácticas de gerencia. ¿Cuál es
la probabilidad de que la persona seleccionada sea una mujer que no asistió a
la universidad?
b) ¿El género y la asistencia a la universidad son independientes? ¿Por qué?
c) Construya un diagrama de árbol que muestre las probabilidades
condicionales y probabilidades conjuntas.
d) ¿Las probabilidades conjuntas suman 1?00? ¿Por qué?
3. En el estado de Maryland, las placas tienen tres números seguidos de tres
letras. ¿Cuántas diferentes placas son posibles?
Actividad Final Unidad V
1. Macondoc empresa de Mantenimiento y Construcción de Obras Civiles está de
acuerdo en no construir casas iguales en una nueva ciudadela. Se ofrecen
cinco diseños de exterior a los posibles compradores. La constructora ha
uniformado tres planos de interior que pueden incorporarse a cualquiera de los
cinco modelos de exteriores. ¿Cuántos planos de exterior e interior se pueden
ofrecer a los posibles compradores?
100 Ing. Rafael Sandino Salcedo Muñoz
2. . Un proveedor minorista de computadoras compró un lote de 1 000 discos CD-
R e intentó formatearlos para una aplicación particular. Había 857 discos
compactos en perfectas condiciones, 112 se podían utilizar, aunque tenían
sectores en malas condiciones y el resto no se podía emplear para nada. a)
¿Cuál es la probabilidad de que un CD seleccionado no se encuentre en
perfecto estado? b) Si el disco no se encuentra en perfectas condiciones, ¿cuál
es la probabilidad de que no se le pueda utilizar?
3. Una compañía de entregas rápidas debe incluir cinco ciudades en su ruta.
¿Cuántas diferentes rutas se pueden formar suponiendo que no importa el
orden en que se incluyen las ciudades en la ruta?