cuaderno digital - gustavo castro
DESCRIPTION
EstadisticaTRANSCRIPT
2015
UNIVERSIDAD DE GUAYAQUIL
Realizado por:
Mateo Espinoza Alarcon
Catedrático:
Ing. Lorenzo Cevallos
Curso:
N3A
Carrera:
Ing. Networking &
telecomunicaciones
Trabajo de Probabilidad y Estadística
Guayaquil-Ecuador
1
Unidad 1: Estadística descriptiva
1.1 Introducción a la estadística
1.2 Tipos de datos y escalas de producción
1.3 Diferencia entre población, muestra, parámetro y estimador
1.4 Medidas de tendencia central y dispersión (datos no agrupados)
1.5 Datos agrupados y tablas de frecuencia
1.6 Medidas de tendencia central y dispersión (datos agrupados)
1.7 Medidas de forma y posicionamiento
1.8 Gráficas estadísticas (histograma, ojiva, pastel, diagrama de cajas)
1.9 Tipos de muestreo y elaboración de cuestionarios
1.10 Recopilación, tabulación, procesamiento de datos y elaboración de
informes
Unidad 2: Introducción a la probabilidad
2.1 Probabilidad clásica, empírica y subjetiva
2.2 Experimento, evento, espacio muestral y punto muestral
2.3 Eventos exhaustivos, independientes y mutuamente excluyentes
2.4 Reglas de probabilidad (complementaria, aditiva, multiplicativa,
condicional)
2.5 Técnicas de conteo y probabilidad
2.6 Teorema de probabilidad total y teorema de Bayes
2.7 Variables aleatorias discretas, análisis univariado
2.8 Función de probabilidad, distribución acumulada, esperanza
matemática, varianza y función generadora de momentos de una
variable aleatoria discreta
2.9 Variables aleatorias discretas (Análisis bivariado)
2.10 Función de probabilidad conjunta, valor esperado conjunto o
esperanza matemática conjunta covarianza, correlación
2.11 Distribución discretas de probabilidades: Distribución uniforme,
distribución hipergeométrica, distribución de Poisson
2.12 Variables aleatorias continuas, análisis univariado
2.13 Función de densidad, función acumulada, esperanza matemática,
varianza de una variable aleatoria continua
2.14 Variables aleatorias continuas, análisis bivariado
2.15 Función de densidad, valor esperado conjunto o esperanza
matemática conjunta, covarianza, correlación
2
2.16 Distribución uniforme, distribución normal, distribución gamma,
distribución exponencial, distribución beta
Unidad 3: Distribución muéstrales
3.1 Teorema limite central
3.2 Aproximación de la distribución normal a la binomial
3.3 Distribución t de student y Ji – cuadrado
3.4 Estimación puntual para la media y proporciones
3.5 Intervalos de confianza para la media, varianza y proporciones
Unidad 4: Estadística inferencial
4.1 Pruebas de hipótesis
4.2 Potencia de prueba y curva OC
4.3 Error tipo I y error tipo II
4.4 Prueba de hipótesis para media, varianza y proporciones
4.5 Modelo de regresión lineal simple
4.6 Modelo de regresión lineal múltiple
4.7 Tabla de ANOVA de regresión
3
¿Para qué sirve la estadística?
- Analizar
- Pronosticar Información
- Medir
Información
Encuesta
Base de datos
Variable cualitativa
Análisis
Variable cuantitativa
Análisis
Base de datos
Variables cuantitativas
Estadísticas
Media
Moda
Varianza
Datos estadisticos
Gráficos estadisticos
4
La Estadística
Es una parte de las matemáticas que nos ayuda a observar hechos, fenómenos leyes,
siempre y cuando estén dentro de la lógica para eso es necesario realizar
experimentos con las muestras u objetos a investigar. La estadística es de gran
ayuda en la actualidad ya que con ella podemos determinar qué porcentaje de un
suceso o experimento es factible o no.
Mendehall, W – Beaver, R – Beaver, B (2006): “La estadística es una rama de las
matemáticas que tiene aplicaciones en cada toda faceta de nuestra vida. Es un
lenguaje nuevo y poco conocido para casi todas las personas, pero, al igual que
cualquier idioma nuevo, la estadística puede parecer agobiante a primera vista.”
David Ruiz Muñoz. (2002 y 2004) “La Estadística es la ciencia cuyo objetivo es
reunir una a información cuantitativa concerniente a individuos, grupos, series de
hechos, etc. y deducir de ello gracias al análisis de estos datos unos significados
precisos o unas previsiones para el futuro además se trata de la recopilación,
organización presentación, análisis e interpretación de datos numéricos con el fin
de realizar una toma de decisión más efectiva".
Murria R. Spiegel, (1991) "La estadística estudia los métodos científicos para
recoger, organizar, resumir y analizar datos, así como para sacar conclusiones
válidas y tomar decisiones razonables basadas en tal análisis.”
Estadística Inferencial
Al obtener y formular inferencias (predicciones) acerca de una población, esta se la
hace en base a la información obtenida en una muestra.
Calmaestra, L. (2005). “Estadística inferencial realiza el estudio descriptivo sobre
un subconjunto de la población llamado muestra y, posteriormente, extiende los
resultados obtenidos a toda la población”
Barreto. A, (2012) “Estadística inferencial se define como aquellos métodos que
implican hacer estimación de una característica de la población o de toma de
decisiones respecto a una población con base solo en resultados obtenidos de una
muestra”.
Humberto Llinás Solano, Carlos Rojas Álvarez. (2005), "La estadística
inferencial abarca aquellos métodos y conjuntos de técnicas que se utilizan para
5
obtener conclusiones sobre las leyes de comportamiento de una población
basándose en los datos de muestras tomadas de esa población".
Estadística Descriptiva
Es cuando la información se la obtiene utilizando todos los datos de la población.
Córdova Enrique S. (2006): “La estadística descriptiva está formada por
procedimientos empleados para resumir y describir las características importantes
de un conjunto de ediciones.”
Castro, G (1998): “La estadística descriptiva es la encargada de estudiar a toda una
población mediante censos.”
Humberto Llinás Solano (2003), "La estadística descriptiva se compone de
aquellos métodos que incluyen técnicas para recolectar, presentar, analizar e
interpretar datos"
Media poblacional
Media muestral
Muestra
Variable Aleatoria (Al Azar)
𝑋𝑖 → Datos tomados al azar
𝑋(𝑖) →Datos ordenados
Población
6
Datos Tomados Al Azar # Edad Talla Sexo
X1 22 162 M
X2 22 149 F
X3 23 162 M
X4 21 164 M
X5 19 163 F
X6 20 180 M
X7 19 169 M
X8 22 160 F
X9 27 168 M
X10 22 169 M
X11 18 185 M
X12 19 163 M
X13 20 157 F
X14 19 152 F
X15 23 150 F
X16 19 164 F
X17 19 164 M
X18 19 168 M
X19 20 175 M
X20 19 149 F
X21 20 152 F
X22 22 154 F
X23 19 164 M
X24 19 150 F
X25 22 169 M
X26 20 169 M
X27 18 162 F
X28 19 166 M
X29 20 170 M
X30 20 146 F
X31 19 156 F
X32 19 175 M
X33 20 159 F
X34 20 160 M
X35 19 155 F
X36 20 154 F
X37 20 163 F
X38 20 155 F
X39 19 168 M
X40 20 165 M
Variables cuantitativas
Estadísticas
Centralización
Dispersión
Posición
Forma
1
Datos ordenados
# Edad Talla Sexo
X(1) 18 162 F
X(2) 18 185 M
X(3) 19 149 F
X(4) 19 150 F
X(5) 19 152 F
X(6) 19 155 F
X(7) 19 156 F
X(8) 19 163 F
X(9) 19 163 M
X(10) 19 164 F
X(11) 19 164 M
X(12) 19 164 M
X(13) 19 166 M
X(14) 19 168 M
X(15) 19 168 M
X(16) 19 169 M
X(17) 19 175 M
X(18) 20 146 F
X(19) 20 152 F
X(20) 20 154 F
X(21) 20 155 F
X(22) 20 157 F
X(23) 20 159 F
X(24) 20 160 M
X(25) 20 163 F
X(26) 20 165 M
X(27) 20 169 M
X(28) 20 170 M
X(29) 20 175 M
X(30) 20 180 M
X(31) 21 164 M
X(32) 22 149 F
X(33) 22 154 F
X(34) 22 160 F
X(35) 22 162 M
X(36) 22 169 M
X(37) 22 169 M
X(38) 23 150 F
X(39) 23 162 M
X(40) 27 168 M
2
Población Objetiva
Es un conjunto bien definidos de elementos que son sujetos a alguna medición.
Mendehall, W – Beaver, R – Beaver, B (2006): Una población es el conjunto de
mediciones de interés para el investigador.
Ordoñez. M, (2014) “La población objetiva se refiere a todo el grupo de personas u
objetos que les interesan a los investigadores para la generalización de las
conclusiones. La población objetiva por lo general tiene diversas características y
también es conocida como la población teórica”.
Gutiérrez González (2005), " Se llama población al conjunto de todos los
elementos de un tipo particular cuyo conocimiento es de interés".
Unidades de Investigación
Es un elemento o elementos de la población objetiva a las que se les efectúa alguna
medición.
La unidad de investigación más fácil es la edad.
𝑀𝑒𝑑𝑖𝑎 =∑ 𝑋𝑖
𝑛
Claudio Navarro (2006) “Una unidad experimental es el individuo u objeto en el
que se mide una variable. Resulta una sola medición o datos cuando una variable se
mide en realidad en una unidad experimental.”
Quintana. C, (1996) “La unidad estadística es la unidad de interés en los estudios
estadístico y es el objeto de nuestra observación de la cual se deriva la información
básica para el análisis”.
Olga Vladimirovna Panteleeva. (2005), " Se llama muestra a cualquier
subconjunto de la población".
Muestra
Es un subconjunto de n unidades de investigación tomados de la población objetiva.
Argibay. J, (2009) “Nos referimos a varios temas, uno tiene que ver con las técnicas
de muestreo empleados, y de manera estas no se asegura la calidad de la muestra”.
3
Ángel Serrano (2006): “Una muestra es un subconjunto de mediciones
seleccionado de la población de interés.”
Gloria Zavala (2015): “Una muestra es una X cantidad de personas que se toman
de nuestra población objetiva para investigar.”
Observación
Son cada uno de los valores incluidos en la muestra. (Datos recomendados)
Quevedo, F (2010): Llamaremos unidad de observación a la unidad física que nos
interesa estudiar u observar con fines de investigación.
Ronald Escalada (1995): Son todos los valores que serán sometidos a estudios
para nuestra investigación.
Santiago Fernández (2002). " La observación es la primera fase estadística, el cual
cumple con los procedimientos del funcionamiento establecidos, debido a la
responsabilidad que implica el hecho de que estos datos son la base de todos los
estudios posteriores".
Parámetros y Estimadores
Parámetro
Es una cantidad de números calculada a partir de los elementos de la población.
Rafael Rodríguez (2004): “Las mediciones descriptivas numéricas asociadas con
una población de mediciones se llaman parámetros; las calculadas a partir de
mediciones muéstrales reciben el nombre de estadísticas.”
Argote. C, (2009) “Un buen habito de realizar el ejercicio de comparación de dos
medidas es conocer claramente las características de la muestra como el tipo de
diseño utilizado para la obtención de datos”.
Antonio Vargas Sabadías. (1995), "Se llama parámetro al valor correspondiente
a una estadística inferencial en la población".
Estimador o estadístico
Es una cantidad de números calculada a partir de los elementos de una muestra.
La altura media de los alumnos de probabilidad y estadística del paralelo N3A.
4
Esto implica que son una muestra representativa de la población.
Si un estadístico se usa para aproximar un parámetro a este se le denomina como
estimador.
Jaime, (2011); "Un estimador es un valor que puede calcularse a partir de los datos
muéstrales y que proporciona información sobre el valor del parámetro que en el
cual se obtienen a partir de las observaciones de la variable y sus probabilidades
que determinan perfectamente la distribución de esta, así como las características
de la población".
Arnau. J, (1996) “A continuación, utilizando el sobreindice MCG para simbolizar,
mínimos cuadrados generalizados vamos a desarrollar de una forma muy breve las
propiedades que se deben reunir los estadísticos MCG es el mejor estimador lineal
insesgado del verdadero vector de parámetros”.
Antonio Elizalde (2001): Se denominan estadísticas cuando se calculan a partir de
mediciones muéstrales.
Variables
Cuantitativas
ContinuasHistogramas
∫
DiscretasGráfico de barras
∑ Xi
Cualitativas
Ordinales Escala Likert
Nominales Grafico de barras
5
Variables cualitativas
Si sus valores (modalidades) no se pueden asociar naturalmente a un número, no se
pueden hacer operaciones algebraicas con ellas y se clasifican en:
Rosario Delgado de la Torre. (2004),"La Variable Cualitativa es una variable que
corresponde a una característica (o carácter) cualitativa y toma dos o más valores
(categorías); pero estos valores están predeterminados y son una asignación
numérica a las modalidades de la variable, que no son medibles en sí mismas".
Marcos Sandoval (2006): “Las variables cualitativas miden una cualidad o
característica en cada unidad experimental.”
Jaime Flores (1991): Las variables cualitativas son las que almacenan información
no numérica, generalmente son cualidades, características u opiniones.
Nominales
Son aquellas en las que sus valores no se pueden ordenar.
Ej: La religión, el grupo sanguíneo y la nacionalidad.
Jiménez, F. (2006) “Son variables expresadas en unidades monetarias corrientes
en función de soles corrientes o a precios de mercado actuales. Por ejemplo, si un
cuaderno cuesta cinco soles en 1995, el valor nominal o corriente de diez cuadernos
será de 50 soles”.
Quevedo, F (2010): “Asumen nombres, por ejemplo, la variable “estado civil”
asumirá los valores: “casado”, “soltero”, “viudo”, “divorciado”. Nótese que los valores
asumidos son nombres o palabras que bien podrían estar dispuestos en distinto
orden.”
Arturo Cabezas (2005): Son las variables que almacenan información sin orden
específico.
Ordinales
Es cuando sus valores se pueden ordenar.
Ej: El grado de satisfacción, la mejoría de un tratamiento.
6
Pablo Jiménez (2010): Asumen nombres o palabras con un cierto orden implícito.
Por ejemplo, la variable “grado de intensidad de un síntoma” asumirá los valores:
“alto”, “mediano”, “bajo”. Los valores asumidos por esta variable guardan entre sí
una relación de orden.
Mayra Ortega (1998): Son las variables que almacenan información que llevan un
orden específico.
Guaragna, B. Fridman, A. (2011) “Permiten determinar un orden jerárquico
entre las unidades perteneciente a las diferentes categorías. Podemos mencionar
variables ordinales tales como nivel de educación, clase social, cargo de empresa”.
Variables Cuantitativas o Numéricas
Este tipo de variables son aquellas en las que sus valores son numéricos, es decir
tiene sentido hacer operaciones algebraicas con letras:
Camacho. J, (2008) “En la investigación clínica frecuentemente se miden
numerosas variables en los individuos incluidos en el estudio. Muchas veces interesa
determinar si existe relación entre algunas de esas variables”.
Francisco Orellana (2006): “Las variables cuantitativas miden una cantidad
numérica en cada unidad experimental.”
Flora Gutierrez (2010): “Las variables cuantitativas son las que almacenan valores
numéricos, ya sean enteros o decimales.”
Discretas
Si toman valores puntuales.
Ej: El número de hijo, número de máquinas con problemas.
Fausto Sanchez (2010): Asumen valores numéricos enteros que generalmente
son resultado de recuentos.
Rey, C. Ramil, M. (2007) “las discretas son aquellas que puede tomar un numero
finito (o infinito numerable) de valores”.
Katherine Salazar (2009): Este tipo de variable cuantitativa se manejan valores
específicos y concretos.
7
Continuas
Si entre 2 valores son posibles infinitos valores intermedios.
Ej: Edad, tiempo de vida de un equipo electrónico.
Quevedo, F (2010): “Pueden asumir cualquier valor numérico, que generalmente
es resultado de una medición. Dada la naturaleza de su escala de valor, siempre es
posible encontrar, entre dos valores, un tercero.”
Arturo Hernández (1994): “Este tipo de variable cuantitativa se manejan valores
que pueden ser enteros o decimales, y se los almacena mediante intervalos que van
de X a Y.”
Sarria, A. Guardia, J. Freixa, l. (1999) “Si las variables, por lo menos
teóricamente, pueden tomar los infinitos valores posibles en un intervalo fijado,
recibe el nombre de “variables continuas”.
Tabla de frecuencia (Análisis de variables cuantitativas)
Análisis univariado
Para variables cuantitativas discretas se requiere conocer los siguientes términos:
Clase, marca de clase (continuas), frecuencia absoluta, frecuencia relativa,
frecuencia acumulada, frecuencia relativa acumulada.
Jaime Rivadeneira (2006): Resultan datos univariado cuando se mide una sola
variable en una sola unidad experimental.
Jorge, O (2009) “Las tablas de frecuencia o histograma están formados por un
conjunto de rectángulo que representa la frecuencia de cada categoría, siendo estos
las frecuencias de valores observados”.
Sergio Castro (1997): “Se da este tipo de análisis cuando se realiza un estudio
exhaustivo de las variables individualmente.”
Clase
Son intervalos de igual longitud que son exhaustivos y mutuamente excluyentes.
Rodríguez. L (2007). “son los valores agrupados en intervalos con la misma
amplitud”.
8
José María Cordero, Santiago Fernández, Alejandro Córdova. (2002), " Una
clase es cada uno de los diferentes grupos que se forman al reunir los valores
correlativos o próximos de la variable o las modalidades parecidas o similares del
atributo".
Pedro Sánchez Méndez (1997): “Son los valores que o intervalos que se
encuentran en una muestra.”
Marca clase
Es el punto medio de cada una de las clases (V. Cuantitativas continuas).
Rodríguez, L (2007): “Es el valor central del intervalo de la clase i.”
Arellano Ulloa Víctor M. , Verónica Quijada Monroy. (2006), " Una marca de
clase es el punto medio de cada intervalo de clase".
Fernández, S. Cordero, J. Córdoba, J. (2002) “Para poder operar
matemáticamente con estas distribuciones es preciso considerar un valor concreto
de la variable en cada clase que sea representativo, este valor se conoce como marca
de clase. Normalmente se tomó el valor que se calcula hallando la media aritmética
de los límites del intervalo.”
Frecuencia absoluta
Número de observaciones que se pueden clasificar en cada clase.
Leopoldo Salavarria (2015): Es la cantidad de veces que se repite un intervalo o
valor.
Gutiérrez González, Eduardo y Olga Vladimirovna Panteleeva. (2005), " La
construcción de los intervalos de clase de emplea para estudiar de una forma
simplificada la distribución de datos, por lo tanto, después de construir los
intervalos de clase se procede a contar la cantidad de datos que caen en cada una de
ella, a dicha cantidad se le llama frecuencia de clase o frecuencia de clase o
frecuencia absoluta y se simboliza por ni, en donde i representa el número de la
clase".
CBES. (2008) “Es el número de veces que se repite ese dato, también se presenta
la frecuencia absoluta de un intervalo que se refiere al número de datos que
pertenecen a ese intervalo.”
9
Frecuencia relativa
Se la obtiene dividiendo la frecuencia absoluta de clase i para el total de
observaciones.
Moreno. H, Hilario. N, (2013) “La frecuencia relativa se presenta en porcentaje y
se conforma con los datos de la frecuencia absoluta. Su símbolo es Fr.”
DR. Anahí Alvarado(2015): “Es la cantidad porcentual de cada uno de los
intervalos.”
Elsevier Inc. (2007), " La frecuencia relativa es una frecuencia de un valor dividida
entre el número total de datos del conjunto de éstos".
Frecuencia acumulada
Resulta de sumar la frecuencia acumulada de la clase i-1 con la frecuencia de la clase
i.
A. R, (2008) “Es la suma de las frecuencias absolutas de todos los datos anteriores,
incluyendo también la del dato mismo del cual se desea su frecuencia acumulada.”
Pablo Noriega (2012): “Es la cantidad de cada una de los datos que
progresivamente aumenta hasta completar el total de la muestra.”
Eduardo Gutiérrez González (2005), " Se llama frecuencia acumulada a la función
que representa la suma de la frecuencia por clase, y se simboliza por F".
Frecuencia relativa acumulada
Se lo obtiene dividiendo la frecuencia acumulada de la clase i para el total de
observaciones.
Alejandro Córdova. (2002), "La frecuencia relativa acumulada de un dato es igual
a la suma de las frecuencias relativas de todos los datos menores o iguales que dicho
valor"
Jorge Alarcon (2010): “Es la cantidad porcentual que aumenta progresivamente
hasta completar el total de la muestra.”
Vargas, A (1995) “Llamamos frecuencia absoluta acumulada en el valor x, a la suma
de las frecuencias absolutas de los valores menores o iguales a x; y la
representaremos por N”.
10
Para las variables cualitativas se necesita:
1. Tabla de frecuencia
2. Gráfico de barras
3. Explicación
Edad Frecuencia absoluta
Frecuencia relativa
Frecuencia acumulada
Frecuencia relativa
acumulada
18 2 0,05 2 0,05
19 15 0,375 17 0,425 20 13 0,325 30 0,75
21 1 0,025 31 0,775 22 6 0,15 37 0,925
23 2 0,05 39 0,975 27 1 0,025 40 1
Sexo Frecuencia absoluta Frecuencia relativa
M (1) 21 21/40 = 53% F (2) 19 19/40 = 47%
“De una muestra tomada al azar de 40 alumnos del paralelo N3A de la carrera de
ingeniería en Networking, el 53% de los encuestados pertenece al sexo
masculino y el 47% al sexo femenino.”
0,44
0,46
0,48
0,5
0,52
0,54
M F
Gráfica de tabla de frecuencia de sexo de una muestra tomada al
azar
11
Para variables cuantitativas continuas
Tiempo de meses de vida de un electrodoméstico
Tiempo de vida
Marca de clase
Frecuencia absoluta
Frecuencia relativa
Frecuencia acumulada
Frecuencia relativa
acumulada
[0-6] (0+6)/2=3 2 0,04 2 0,04
[6-12] (6+12)/2=9 6 0,12 8 0,16
[12-18] (12+18)/2=15 8 0,16 16 0,32
[18-24] (18+24)/2=21 16 0,32 32 0,64
[24-30] (24+30)/2=27 10 0,20 42 0,84
[30-36] (30+36)/2=33 7 0,14 49 0,98
[36-42] (36+42)/2=39 1 0,02 50 1
Histograma de frecuencias relativas
Histograma de frecuencia relativa
Es un gráfico bidimensional en cuyo eje de las x se encuentran las clases y en el eje
de las y las frecuencias relativas.
Sheldon M. Ross. (2007), " Histograma en el que se muestran gráficamente las
frecuencias relativas de cada dato del conjunto".
Mario Benavides (2002): “Un histograma de frecuencia relativa, para un conjunto
de datos cuantitativo es una gráfica de barras en la que la altura de la barra muestra
“con qué frecuencia” (medida como proporción o frecuencia relativa) las mediciones
caen en una clase o subintervalo particular. Las clases o subintervalos se grafican a
lo largo del eje horizontal.”
0,04
0,12
0,16
0,32
0,20
0,14
0,02
0,00
0,05
0,10
0,15
0,20
0,25
0,30
0,35
0-6 06-12 12-18 18-24 24-30 30-36 36-42
Histograma de tiempo de meses de vida de un electrodoméstico
12
Andrés Sarmiento (1996): “Un histograma de frecuencia relativa es la manera de
representar la incidencia de cierto dato en una variable, se asigna las frecuencias
relativas a la distribución vertical y los intervalos a la distribución horizontal.”
Polígono de frecuencia relativa (Solo variables cuantitativas).- Es un gráfico
bidimensional en cuyo eje de las x se encuentra la marca de clase y y frecuencia
relativa.
Rodríguez, L (2007): “Es una manera de representar el perfil de la distribución de
los datos. Se obtiene uniendo mediante segmentos de recta los puntos (marca de
clase, frecuencia), para cerrar el polígono se puede agregar un punto a cada lado con
frecuencia 0.”
Elsevier Inc. (2007)," El polígono de frecuencia es el gráfico de los valores distintos
y sus frecuencias, en el que se conectan los puntos del gráfico mediante rectas".
Richard I. Levin, David S. Rubin (2004) “Los polígonos de frecuencias son otra
forma de representar gráficamente distribuciones tanto de frecuencias como de
frecuencias relativas”.
Ojiva
Es un gráfico que presenta en el eje horizontal la característica cuantitativa que se
está investigando y en el eje vertical la frecuencia relativa acumulada.
Llinás, H. Cabrera, J. Flórez, K. (2012) “La ojiva, llamada también polígono de
frecuencias acumuladas (o polígono de frecuencias relativas acumuladas), se
0,04
0,12
0,16
0,32
0,20
0,14
0,020,00
0,05
0,10
0,15
0,20
0,25
0,30
0,35
3 9 15 21 27 33 39
Polígono de frecuencia relativa
13
construye a partir de tablas de frecuencias (acumuladas o relativas acumuladas).
Las ojivas ofrecen un medio grafico para interpolar o aproximar el número o
porcentaje de observaciones menores o iguales que un valor específico”.
Rodríguez, L (2007): “Este gráfico se usa para representar la frecuencia
acumulada, absoluta o relativa. Se lo obtiene uniendo segmentos de recta que se
extienden entre los extremos de las clases y usando los valores de la frecuencia
acumulada.”
Vladimiro Panteleeva. (2005), " Los polígonos de frecuencia que se elaboran con
las frecuencias acumuladas o las frecuencias relativas acumuladas se llaman ojivas".
Edad Frecuencia absoluta
Frecuencia relativa
Frecuencia acumulada
Frecuencia relativa
acumulada
18 2 0,05 2 0,05
19 15 0,375 17 0,425 20 13 0,325 30 0,75
21 1 0,025 31 0,775 22 6 0,15 37 0,925
23 2 0,05 39 0,975 27 1 0,025 40 1
40 1
0,04
0,16
0,32
0,64
0,84
0,98 1
0
0,2
0,4
0,6
0,8
1
1,2
0-6 06-12 12-18 18-24 24-30 30-36 36-42
Ojiva
14
Talla Frecuencia absoluta
Frecuencia relativa
Frecuencia acumulada
Frecuencia relativa
acumulada
146 1 0,025 1 0,025 149 2 0,05 3 0,075
150 2 0,05 5 0,125
152 2 0,05 7 0,175 154 2 0,05 9 0,225
155 2 0,05 11 0,275 156 1 0,025 12 0,3
157 1 0,025 13 0,325 159 1 0,025 14 0,35
160 2 0,05 16 0,4
162 3 0,075 19 0,475 163 3 0,075 22 0,55
164 4 0,1 26 0,65 165 1 0,025 27 0,675
166 1 0,025 28 0,7
168 3 0,075 31 0,775 169 4 0,1 35 0,875
170 1 0,025 36 0,9 175 2 0,05 38 0,95
180 1 0,025 39 0,975 185 1 0,025 40 1
40 1
0,05
0,375
0,325
0,025
0,15
0,05 0,0250
0,05
0,1
0,15
0,2
0,25
0,3
0,35
0,4
18 19 20 21 22 23 27
Gráfica de tabla de frecuencia de edad
15
0,025
0,05 0,05 0,05 0,05 0,05
0,0250,0250,025
0,05
0,0750,075
0,1
0,0250,025
0,075
0,1
0,025
0,05
0,0250,025
0
0,02
0,04
0,06
0,08
0,1
0,12
146 149 150 152 154 155 156 157 159 160 162 163 164 165 166 168 169 170 175 180 185
Tabla de frecuencia de la talla
16
Preguntas
1. ¿Qué porcentaje de componentes tiene un tiempo de vida menor a 14
meses?
De una muestra tomada al azar de 50 electrodomésticos, el 16% de los
artefactos estudiados tuvo un tiempo de vida menor a 14 meses.
2. ¿Qué porcentaje de componentes tiene un tiempo de vida superior a 21
meses?
De una muestra tomada al azar de 50 electrodomésticos, el 36% de los
artefactos estudiados tiene un tiempo de vida superior a los 21 meses.
3. ¿Qué porcentaje de componentes tiene un tiempo de vida entre 21
meses y 32 meses?
De una muestra tomada al azar de 50 electrodomésticos, el 20% de los
artefactos estudiados tiene un tiempo de vida entre los 21 y 32 meses.
4. ¿Cuál es el tiempo de vida de los componentes de tal forma que la mitad
dure menos de ese valor?
5. ¿Cuál es el tiempo de vida de los componentes de tal forma que un 25%
dure menos de ese valor?
Reglas generales para formar intervalos en variables cuantitativas
continuas.
1. - Rango: X(max) − X(min)
2.- Número de intervalos 𝐧𝐢:
Formula de Esturgues.
ni = 1 + 3.32 log(n)
N= es el tamaño de la muestra u observaciones.
3.- Ancho del intervalo:
i =R
ni
17
4.- Cálculo del nuevo rango o 𝐑∗:
R∗ = ni ∗ i
Si hay diferencia, se resta la diferencia del nuevo rango.
Si hay una diferencia de 3 se le resta 1 al menor y se suma 2 al mayor.
Ejercicio
A 40 estudiantes se les pidió que estimen el número de horas que habrían
dedicado a estudiar la semana pasada, tanto en clase como fuera de ella,
obteniéndose los siguientes resultados.
36 30 47 60 32 35 40 50
54 35 45 52 48 58 60 38
32 35 56 48 30 55 49 39 58 50 65 35 56 47 37 56
58 50 47 58 55 39 58 43
𝑅 = 𝑋(𝑚𝑎𝑥) − 𝑋(𝑚𝑖𝑛) 𝑅 = 65 − 30 = 𝟑𝟓
𝑛𝑖 = 1 + 3.32 𝑙𝑜𝑔 (40) = 6.32 = 𝟔
𝑖 =𝑅
𝑛𝑖=
35
6= 5.83 = 𝟔
𝑅∗ = 𝑛𝑖 ∗ 𝑖 = 6 ∗ 6 = 𝟑𝟔
1.- Se determina cual es la variable a analizar y que tipo de variable es:
De una muestra de 40 estudiantes que fueron encuestados al azar, se necesita
conocer el rango de la cantidad de horas que estudian tanto dentro como fuera de
clases, por lo cual determinamos que nuestra variable a estudiar será “Horas de
estudio”.
La variable “Horas de estudio” almacena la cantidad de hora que estudian la muestra
de 40 estudiantes encuestados al azar, por lo que se determina que el tipo de
variable será cuantitativa, como se necesita conocer el rango de la cantidad de
horas, el tipo de variable será cuantitativa continua.
18
2.- Se toman los datos de la muestra y se los ordena
# Horas de estudio # Horas de estudio X1 36 X(1) 30 X2 54 X(2) 30 X3 32 X(3) 32 X4 58 X(4) 32 X5 58 X(5) 35 X6 30 X(6) 35 X7 35 X(7) 35 X8 35 X(8) 35 X9 50 X(9) 36
X10 50 X(10) 37 X11 47 X(11) 38 X12 45 X(12) 39 X13 56 X(13) 39 X14 65 X(14) 40 X15 47 X(15) 43 X16 60 X(16) 45 X17 52 X(17) 47 X18 48 X(18) 47 X19 35 X(19) 47 X20 58 X(20) 48 X21 32 X(21) 48 X22 48 X(22) 49 X23 30 X(23) 50 X24 56 X(24) 50 X25 55 X(25) 50 X26 35 X(26) 52 X27 58 X(27) 54 X28 55 X(28) 55 X29 47 X(29) 55 X30 39 X(30) 56 X31 40 X(31) 56 X32 60 X(32) 56 X33 49 X(33) 58 X34 37 X(34) 58 X35 58 X(35) 58 X36 50 X(36) 58 X37 38 X(37) 58 X38 39 X(38) 60 X39 56 X(39) 60 X40 43 X(40) 65
19
3.- Con los cálculos anteriormente realizados se realiza la tabla de
frecuencia de la variable cuantitativa continua.
Horas estudio
Marca de clase
Frecuencia absoluta
Frecuencia relativa
Frecuencia acumulada
Frecuencia relativa
acumulada
[29-35) 32 4 0,1 4 0,1
[35-41) 38 10 0,25 14 0,35 [41-47) 44 2 0,05 16 0,4
[47-53) 50 10 0,25 26 0,65 [53-59) 56 11 0,275 37 0,925
[59-65] 62 3 0,075 40 1 40 1
4.- Realizada la tabla de frecuencia, se realizan las gráficas (Histograma,
Polígono y Ojiva).
Histograma
0,1
0,25
0,05
0,25
0,275
0,075
0
0,05
0,1
0,15
0,2
0,25
0,3
[29-35) [35-41) [41-47) [47-53) [53-59) [59-65]
Horas de estudio
20
Polígono
Ojiva
5.- Se interpretan los resultados obtenidos de nuestro estudio:
De la muestra tomada al azar de 40 estudiantes, a los cuales se les ha consultado la
cantidad de horas que estudian, tanto dentro como fuera de clases, se obtuvieron los
siguientes resultados, el 10% de los estudiantes dedicaron entre 29 a 35 horas a
estudiar la semana anterior, el 25% de los estudiantes dedicaron entre 35 a 41 horas
a estudiar la semana anterior, el 5% de los estudiantes dedicaron entre 41 a 47 horas
a estudiar la semana anterior, el 25% de los estudiantes dedicaron entre 47 a 53
horas a estudiar la semana anterior, el 27,5% de los estudiantes dedicaron entre 53
a 59 horas a estudiar la semana anterior y el 7,5% de los estudiantes dedicaron entre
59 a 65 horas a estudiar la semana anterior.
Por lo que llegamos a la conclusión que el 65% de la muestra dedicó entre 47 a 65
horas a estudiar la semana anterior, y un 35% le dedicó de 29 a 47 horas a estudiar
la semana pasada, lo que demuestra que en la muestra de 40 estudiantes tomada al
azar, hay 24 estudiantes que se esfuerzan más en sus estudios para un mejor
aprendizaje.
0,1
0,25
0,05
0,250,275
0,075
0
0,05
0,1
0,15
0,2
0,25
0,3
32 38 44 50 56 62
Horas de estudio
0,1
0,35 0,4
0,65
0,9251
0
0,2
0,4
0,6
0,8
1
1,2
[29-35) [35-41) [41-47) [47-53) [53-59) [59-65]
Horas de estudio
21
Estimadores
Media
La media depende de la muestra ya que es una variable aleatoria es la suma de los
datos dividido para el número total de datos menos uno.
= ∑𝑿𝒊
𝒏
𝒏
𝒊=𝟏
𝑋𝑖 = 20,20,19,18,21,19,22,23,19,20,20
𝑋(𝑖) = 18,19,19,19,20,20,20,20,21,22,23
=20 + 20 + 19 + 18 + 21 + ⋯ + 20
11= 20,09
Centralización
• Media
• Mediana 𝒙
• Moda 𝑴
Dispersión
• Varianza 𝑺𝟐
• Desviación estandar
𝑺𝟐 = 𝑺
• Coeficiente de variación
𝑪𝑽 =𝑺
= %
Forma
• Coeficiente deasimetría
• Curtosis
Posición
• Cuantiles
• Deciles
• Percentiles
• Cuartiles
• Q1= Primer cuartil
• Q2= Segundo cuartil
• Q3= Tercer cuartil
22
Rigoberto Perez. (2010), "Llamamos media aritmética de la variable
estadística que denotamos por x, al valor de la expresión".
Pérez. (1995) “Descubrió cuatro técnicos existentes para calcular el tamaño de
la muestra requerida en la estimación de la media aritmética de una distribución log
normal con base en la amplitud del intervalo de confianza.”
Álvarez, R. (2007) “La media aritmética poblacional es uno de los parámetros
que más veces se estima en estudios estadísticos”.
Mediana
Si la mediana es par:
𝒙 = 𝒙(𝒊+𝟏) = 𝟐𝟎
Si la mediana es impar:
𝒙 = 𝒙(𝒊) = 𝟐𝟎
𝑋(𝑖) = 18,19,19,19,20,20,20,20,21,22
𝑥(𝑖) =𝑥(𝑖−1) + 𝑥(𝑖+1)
2=
20 + 20
2= 𝟐𝟎
Xavier García (2004): “La mediana m de un conjunto de n mediciones es el
valor de x que cae en la posición media cuando las mediciones son ordenadas de
menor a mayor.”
Daniela Acevedo (2003): “La mediana es el valor que se encuentra en la mitad
de nuestros datos, existen dos formas de hallarla, una para datos pares y otra para
impares.”
Rigoberto Perez. (2010), "Llamamos media aritmética de la variable
estadística que denotamos por x, al valor de la expresión".
23
Moda
𝑀 = 𝑉𝑎𝑙𝑜𝑟 𝑜 𝑣𝑎𝑙𝑜𝑟𝑒𝑠 𝑞𝑢𝑒 𝑚á𝑠 𝑠𝑒 𝑟𝑒𝑝𝑖𝑡𝑒𝑛
𝑀 = 20
Mendehall, W – Beaver, R – Beaver, B (2006): “La moda es la categoría
que se presenta con más frecuencia o el valor de x que se presenta con más
frecuencia.”
Rigoberto Perez. (2010), "Llamamos moda o valor modal de una distribución,
que denotamos por Mo, al valor de la variable que más veces se repite".
Andrade, A. (2003) “La moda es la medida de posición que indica la magnitud
del valor que se presenta con más frecuencia en una serie de datos; es pues, el valor
de la variable que más se repite en un conjunto de datos. De las medias de posición
la moda es la que se determina con mayor facilidad, ya que se puede obtener por
una simple observación de los datos en estudio, puesto que la moda es el dato que
se observa con mayor frecuencia. La moda se designa con las letras Mo.”
Los estimadores solo se aplican en variables cuantitativas
Distribución normal representada por campana de Gauss
24
Dispersión
Varianza
Varianza es una medida de dispersión la sumatoria del dato menor la media
dividida para la cantidad de datos menor a uno.
1
n − 1∑(𝑥𝑖 − )2
Klever Morales (2006): “La varianza de una muestra de n mediciones es la
suma de las desviaciones cuadradas de las mediciones alrededor la media dividida
entre (n - 1).”
José María Cordero (2002), "La varianza se puede definir como la media
aritmética de las desviaciones de los valores obtenidos de la variable con respecto a
su media aritmética elevadas al cuadrado".
Pérez, R. Covadonga Caso, Río, M. Lopez, A. (2012) “Llamamos varianza,
que denotamos por S^2 x, a la derivación cuadrática media respecto a la media
aritmética de los valores de la variable”.
Desviación estándar
Se considera desviación estándar al resultado de la varianza sacándole la raíz
cuadrada.
𝑆 = √𝑆2
Salking, Nell J. (1999) “La desviación estándar es la medida de variabilidad de
uso más común. La desviación estándar es la cantidad promedio en que cada uno de
los personajes, individuales varia respecto a la medida del conjunto de puntajes.
Cuanto mayor es la desviación estándar, más variable es el conjunto de puntajes”.
Santiago Alarcón (2015): “La desviación estándar se obtiene sacando la raíz
cuadrada de la varianza, el valor que se obtiene es una medida que indica la
variación de todos los datos en referencia a la media.”
Mario F. Triola. (2004), "La desviación estándar es una medida de variación
de todos los valores con respecto a la media".
25
Coeficiente de variación
Es la desviación estándar dividida para la media de la muestra y su resultado es
convertido a porcentaje.
𝑐. 𝑣 =𝑠
Rodríguez, L (2007): “Es un número que se usa para comparar la variabilidad
de los datos de diferentes grupos. Es una medida adimensional.”
Hernández, E. (2006) “Coeficiente de variación: La variación real o dispersión
determinada a partir de la desviación estándar u otra medida de dispersión, es
llamada la dispersión absoluta”.
Michael J. Evans, Jeffrey S. Rosenthal. (2005), "El coeficiente de variación
de una medida poblacional con media no nula se define como σ/µ, donde µ es la
media poblacional y σ la desviación estándar de la población".
Ejercicios
Media
= ∑𝑥𝑖
𝑛
𝑛
𝑖=1
=22 + 37 + 28 … + 33 + 35 + 28
75
= 35.69
Mediana
(𝑖) =𝑖𝑚𝑝𝑎𝑟
𝑝𝑎𝑟
(𝑖) =𝑥(𝑖−1) + 𝑥(𝑖+1)
2=
29 + 35
2= 𝟑𝟐
Moda
𝑀 = 35 𝑦 29
Varianza
26
𝑠2 =1
74[(21 − 35,69)2 + (22 − 35,69)2 + ⋯ + (74 − 35,69)2 + (80 − 35,69)2]
= 124.05
Derivación estándar
𝑠 = √𝑠2 = 11.137
Coeficiente de variación
𝑐. 𝑣 =𝑠
=
11.137
35.69= 0.3120
𝒙𝒊 𝒇𝒊 𝒙𝒊𝒇𝒊 𝒙𝒊𝟐 𝒇𝒊𝒙𝒊
𝟐 0 12 0 0 0 1 9 9 1 9
2 7 14 4 28 3 6 18 9 54
4 3 12 16 48
5 3 15 25 75 40 68 214
Media
= ∑𝑓𝑖𝑥𝑖
𝑓𝑖
𝑛
𝑖=1
=68
40= 1.7
Varianza
𝑠2 = ∑𝑓𝑖𝑥𝑖
2
𝑓𝑖− ()2
𝑛
𝑖=1
𝑠2 =214
40− (1,7)2 = 5,35 − 2,89 = 2,46
Desviación estándar
𝑠 = √𝑠2
𝑠 = √2,46 = 1,57
27
Coeficiente de variación
𝐶𝑣 =𝑠
𝐶𝑣 =1,57
1,7= 0,92261 = 92%
Tabla
Clase 𝒇𝒊 𝒙𝒊 𝒙𝒊𝒇𝒊 𝒙𝒊𝟐 𝒇𝒊𝒙𝒊
𝟐 [1,65-2,05) 4 1,85 7,40 3,4225 13,69
[2,05-2,45) 5 2,25 11,25 5,0625 25,3125
[2,45-2,85) 13 2,65 34,45 7,0225 91,2925
[2,85-3,25) 17 3,05 51,85 9,3025 158,1425
[3,25-3,65) 8 3,45 27,60 11,9025 95,22
[3,65-4,05) 3 3,85 11,55 14,8225 44,4673
50 144,1 428,25
=144,1
50= 2,882
𝑠2 =428,125
50− (2,882)2 = 0,256576
𝑠 = √0,256 = 0,506
𝐶𝑣 =0,50653315
2,882= 17,578% = 18%
Clase 𝒇𝒊 𝒙𝒊𝒇𝒊 𝒙𝒊𝟐 𝒇𝒊𝒙𝒊
𝟐 21 1 21 441 441
22 1 22 484 484
24 2 48 576 1152
25 1 25 625 625
26 4 104 676 2704
27 4 108 729 2916
28 4 112 784 3136
29 6 174 841 5046
30 3 90 900 2700
31 3 93 961 2883
32 3 96 1024 3072
33 5 165 1089 5445
28
34 3 102 1156 3468
35 6 210 1225 7350
36 1 36 1296 1296
37 3 111 1369 4107
38 4 152 1444 5776
39 2 78 1521 3042
40 1 40 1600 1600
41 5 205 1681 8405
42 2 84 1764 3528
43 1 43 1849 1849
45 1 45 2025 2025
46 1 46 2116 2116
49 1 49 2401 2401
50 1 50 2500 2500
54 1 54 2916 2916
60 1 60 3600 3600
61 1 61 3721 3721
63 1 63 3969 3969
74 1 74 5476 5476
80 1 80 6400 6400
75 2677 106149
=2677
75= 35,693
𝑠2 =106149
75− (35,69)2 = 141,543
𝑠 = √141,543 = 11,897
𝐶𝑣 =11,897
35,69= 0,33 = 33%
Clase 𝒙𝒊 𝒇𝒊 𝒙𝒊𝒇𝒊 𝒙𝒊𝟐 𝒇𝒊𝒙𝒊
𝟐 [19-28) 23,5 16 376 552,25 8836
[28-37) 32,5 32 1040 1056,25 33800
[37-46) 41,5 18 747 1722,25 31000,5 [46-55) 50,5 4 202 2550,25 10201
[55-64) 59,5 3 178,5 3540,25 10620,75 [64-73) 68,5 0 0 4692,25 0
[73-82) 77,5 2 155 6006,25 12012,5 75 2698,5 106470,75
29
=2698,5
75= 35,98
𝑠2 =106470,76
75− (35,98)2 = 125,0496
Estimadores de posición
𝑥𝑖 = 𝐶𝑙𝑎𝑠𝑒 𝑒𝑛 𝑑𝑖𝑠𝑐𝑟𝑒𝑡𝑎𝑠 − 𝑀𝑎𝑟𝑐𝑎 𝑑𝑒 𝑐𝑙𝑎𝑠𝑒 𝑒𝑛 𝑐𝑜𝑛𝑡𝑖𝑛𝑢𝑎𝑠
𝑓𝑖 = 𝐹𝑟𝑒𝑐𝑢𝑒𝑛𝑐𝑖𝑎 𝑎𝑏𝑠𝑜𝑙𝑢𝑡𝑎 − 𝑃𝑎𝑟𝑎 𝑑𝑖𝑠𝑐𝑟𝑒𝑡𝑎𝑠 𝑦 𝑐𝑜𝑛𝑡𝑖𝑛𝑢𝑎𝑠
Percentiles del orden i
Es aquel que divide a los datos en 100 partes igual.
𝑖 = 1 … 99
Miguel silva (2004) “Un percentil es otra medida de posición relativa y se usa
con más frecuencia para conjuntos grandes de datos.”
Cástor Guisande González. (2006), “Los percentiles son los 99 puntos que
dividen la distribución en 100 partes, tales que dentro de cada una está incluido el
1% de los valores de la distribución.”
Carlos Méndez (1995): “Un percentil permite mostrar un conjunto de datos
extenso con más precisión.”
Deciles
Es aquel que divide los elementos de la muestra en 10 grupos con frecuencias
similares.
Rodríguez, L (2007): “Son números que dividen a los datos de la muestra en
grupos de tamaño aproximado a 10%.”
Cástor Guisande González. (2006), "Los deciles son 9 puntos que dividen la
distribución en 10 partes, tales que dentro de cada una está incluido el 10% de los
valores de la distribución".
Barreto. A, (2012) “En el ámbito del análisis de la distribución del ingreso de
las familias, es común que la curva de Lorenzo se construya a partir de datos
agrupados en subconjuntos de tamaño o por ciento, denominamos deciles de
hogares.”
30
Cuartiles
Es aquel que divide los elementos de la muestra en 4 grupos con frecuencia
similares.
Maximiliano Escobedo (2006): Un conjunto de n mediciones en la variable x
se ha acomodado en orden de magnitud. El cuartil inferior (primer cuartil), Q1, es el
valor de x que es mayor a un cuarto de las mediciones y es menor que los restantes
tres cuartos. El segundo cuartil es la mediana. El cuartil superior (tercer cuartil), Q3,
es el valor de x que es mayor a tres cuartos de las mediciones y es menor que el
restante un cuarto.
Cáceres, R (2007) “Los cuartiles dividen al conjunto de datos en cuarto partes
iguales en cuanto al número de datos, en cada una de ellas hay un 25% de datos. En
caso de que el número de datos no sea divisible por cuatro, los grupos no podrán
tener todos exactamente el mismo número de datos”.
Cástor Guisande González. (2006), "Los cuartiles son los tres valores de la
variable que dividen la distribución en partes iguales, es decir, en 4 intervalos,
dentro de cada cual está incluido el 25% de los valores de la distribución".
Cuantil
Se define el cuantil del orden α como un valor de la variable por debajo de la cual se
encuentra una frecuencia acumulada α. Entre los casos particulares tenemos los
percentiles, deciles, cuartiles. Para encontrar percentiles, deciles y cuartiles se aplica
una formula.
Nettleton, D. (2003) “La técnica de cuantiles genera tantas categorías como
deseamos, en función del rango de valor de valores de la variable para definir los
cuantiles, tenemos que especificar a la técnica cuantos queremos, y para cad uno el
porcentaje de los casos que deseamos incluir”
Cástor Guisande (2006), "Los cuantiles se definen al orden k como los valores
de la variable, supuesta ésta ordenada de menor a mayor, que la deividen en k partes
con la misma frecuencia de observaciones. Por lo tanto existirán k-1 cuantiles de
orden k".
31
Rodríguez, L (2007): Son números que distribuyen los datos ordenados de la
muestra en grupos de aproximadamente tamaño con el propósito de resaltar su
ubicación relativa. Estos números se denominan cuantiles en forma genérica.
𝑥(𝑖,𝑎) = 𝑥(𝑖) + 0, 𝑎(𝑥(𝑖+1) − 𝑥(𝑖)) → 𝐶𝑢𝑎𝑟𝑡𝑖𝑙𝑒𝑠
𝑖 𝑒𝑠 𝑝𝑎𝑟𝑎 𝑙𝑎 𝑝𝑎𝑟𝑡𝑒 𝑒𝑛𝑡𝑒𝑟𝑎
𝑎 𝑒𝑠 𝑝𝑎𝑟𝑎 𝑙𝑎 𝑝𝑎𝑟𝑡𝑒 𝑑𝑒𝑐𝑖𝑚𝑎𝑙
𝑝(𝑖) = 𝑥 ((𝑛 + 1)𝑖
100) → 𝑃𝑒𝑟𝑐𝑒𝑛𝑡𝑖𝑙𝑒𝑠 → 𝑖 = 1 … 99
𝒙𝒊 Talla 𝒙(𝒊) Talla
𝒙𝟏 1,65 𝑥(1) 1,60
𝒙𝟐 1,60 𝑥(2) 1,60
𝒙𝟑 1,64 𝑥(3) 1,64
𝒙𝟒 1,69 𝑥(4) 1,65
𝒙𝟓 1,81 𝑥(5) 1,68
𝒙𝟔 1,68 𝑥(6) 1,69
𝒙𝟕 1,60 𝑥(7) 1,70
𝒙𝟖 1,70 𝑥(8) 1,70
𝒙𝟗 1,70 𝑥(9) 1,76
𝒙𝟏𝟎 1,76 𝑥(10) 1,81 Hallar los percentiles 25, 50 y 75
1) P(25) = x (11∗25
100) = 2,75
x(2,75) = 1,60 + 0,75(1,64 − 1,60) = 1,63
P(25) = 1,63
2) Q2 = 50% = P(50) = (11∗50
100) = 5,5
X(5,5) = (1,68 + 0,5)(1,69 − 1,68) = 1,685
P(50) = 1,69
3) Q3 = 75% = P(75) = (11∗75
100) = 8,25
X(8,25) = (1,70 + 0,25)(1,76 − 1,70) = 1,715
P(75) = 1,72
32
Diagrama de Cajas y Bigotes
Es una medida de dispersión asociado a la mediana, es la diferencia entre el primer
y tercer cuartil.
𝑅𝑖 = 𝑟𝑎𝑛𝑔𝑜 𝑖𝑛𝑡𝑒𝑟𝑐𝑢𝑎𝑟𝑡𝑖𝑙
𝑅𝑖 = 𝑄3 − 𝑄1
Correa. A, Burgos. C,(2012) “Este diagrama muestra que la
distribución de la finura es simétrica con respecto al valor central
promedio debido a que la longitud de ambos rectángulos alrededor de
cada mediana es igual en la mayoría de la operarios .”
Rodríguez, L (2007): “Es un dispositivo gráfico que se usa para
expresar en forma resumida, algunas medidas estadísticas de posición.”
Antoni Uchupelli (1994): Es un gráfico que permite analizar la
posición de los datos y también donde existe una mayor incidencia de
los mismos, observando el tamaño de los cuartiles y de los bigotes.
Rango Intercuartil
Es una medida de dispersión asociado a la mediana, es la diferencia entre el
primero y tercer cuartil.
𝑅𝐼 = 𝑄3 − 𝑄1
𝑅𝐼 = 1.715 − 1.63
𝑅𝐼 = 0.085
33
𝑅𝐼 = 𝑄3 − 𝑄1
David M. Levine, Mark L. Berenson, Timothy C. Krehbiel. (2006), "El
rango intercuartil (tambien llamado dispersión media) es la diferencia entre el
tercer y primer cuartil de un conjunto de datos, mide la dispersión en la mitad (parte
central) de los datos, así que no se ve influido por los valores extremos".
Pérez. F, (2012) “Por su parte el rango intercuartil se obtiene de la diferencia
entre el primer y tercer cuartil y, sirve para indicar la duración o tiempo que le toma
a un cohete completar una transición dada.”
Tigre, M. (2008) “En estadística descriptiva, se le llama rango intercuartílico o
rango intercuartil, a la diferencia entre el tercer y el primer cuartil de una
distribución. Es una medida de la dispersión estadística, a diferencia del rango, se
trata de un estadístico robusto.”
Valores alejados
Son valores observados que se apartan del resto de la muestra, para ello utilizamos
2 reglas:
1.- Si el valor de x, tomado de la muestra, es menor que 𝑄1 − 1,5(𝑄3 − 𝑄1) o lo mismo
que 𝑄1 − 1,5 ∗ 𝑅𝑖, entonces 𝑥𝑖 es alejado por defecto.
2.- Si el valor de x, tomado de la muestra, es menor que 𝑄3 + 1,5(𝑄3 − 𝑄1) o lo mismo
que 𝑄3 + 1,5 ∗ 𝑅𝑖, entonces 𝑥𝑖 es alejado por exceso.
Martín, Miguel, Horna, Olivia, Nedel, Fúlvio, Navarro, Albert.
(2010), "Podríamos hablar de un efecto revelador de valores alejados de la media
haciendo "invisibles" los que están a pocas desviaciones estándar".
Ximenez, P. (2004) “Son valores observados que se apartan demasiado del
resto de la muestra, dando como resultado una muestra alejada de la realidad.”
Gutiérrez. A, (2010) “Es una dispersión grande es una propiedad indeseada
del estimador, pues en generalmente en la práctica, tenemos solo una muestra”
34
Estimadores de forma
1) Asimetría
AS = 0 Simetría
AS > 0 Simetría hacia la derecha
AS < 0 Simetría hacia la izquierda
Distribución en forma simétrica
Se encuentran mayormente agrupados hacia la izquierda de la distribución normal,
o agrupados hacia la derecha de la distribución normal.
2) Curtosis
2 = 𝑆2 =1
𝑛 − 1∑(𝑋𝐼 − )
2
→ 𝑀𝑎𝑡𝑒𝑚á𝑡𝑖𝑐𝑎𝑚𝑒𝑛𝑡𝑒
3 = 𝐴𝑆 =∑(𝑋𝐼 − )
𝑛. 𝑆3𝑥
3
→ 𝐴𝑠𝑖𝑚𝑒𝑡𝑟í𝑎
4 = 𝐶𝑟 = [∑(𝑋𝐼 − )
4
𝑛. 𝑆4𝑥 ] − 3 → 𝐶𝑢𝑟𝑡𝑜𝑠𝑖𝑠
𝒙𝒊 𝑿𝒊 (𝑿𝒊)𝟐 (𝑿𝒊)
𝟑 (𝑿𝒊)𝟒
2 -2 4 -8 16
4 0 0 0 0
8 4 16 64 256
2 -2 4 -8 16
24 48 288
35
=2 + 4 + 8 + 2
4= 4
𝑆2 =1
3[(2 − 4)2 + (4 − 4)2 + (8 − 4)2 + (2 − 4)2] = 8
𝑆 = √𝑆2 = √8 = 2,83
2 = 𝑆2 = 8
3 = 𝐴𝑆 = (48
4(2,83)3) = 0,53
4 = (288
4(2,83)4) − 3 = −1,88
Antonio Rial Boubeta, Varela Mallou Jesus. (2014), " La Asimetría
informa del grado en que las observaciones se reparten proporcional y
equitativamente por encima y por debajo del punto central (más alto) de la
distribución".
Corea. L, Morales. A, (2000) “La convergencia a la distribución normal de los
promedios de variables aleatorias poisson, igual e independiente distribuidas, está
en función de su parámetro a mayor valor del mismo, más rápida es la
convergencia.”
Santander, K. (2005) “La simetría (también denominada sesgo) de una
distribución de frecuencias hace referencia al grado en que valores de la variable,
equidistantes a un valor que se considere centro de la distribución, poseen
frecuencias similares.”
36
La curtosis
Es el apuntamiento de la distribución normal
Antonio Rial Boubeta, Varela Mallou Jesus. (2014), "La Curtosis es una
medida que se relaciona con la frecuencia de aparición de valores centrales en una
distribución".
Peña, F. (2008) “La Curtosis es una medida de la forma. Así, las medidas de
Curtosis tratan de estudiar la proporción de la varianza que se explica por la
combinación de datos extremos respecto a la media en contraposición con datos
poco alejados de la misma. Una mayor Curtosis implica una mayor concentración de
datos muy cerca de la media de la distribución coexistiendo al mismo tiempo con
una relativamente elevada frecuencia de datos muy alejados de la misma”.
Ramírez. L, (2008) “Este se puede tomar como un indicador de la magnitud de
la variabilidad. Esta aproximación a la distribución normal, expresada
principalmente por la asimetría”.
37
POSICIÓN
Cuantiles Deciles Q1 primer cuartil Percentiles Q2 segundo cuartil Cuartiles Q3 tercer cuartil
Media
X = ∑𝑋𝑖
𝑛
𝑛𝑖=1
X= 20+20+19+18+21………+20
11
X=20.09
Medida
Impar 𝑋(𝑖)=20
𝑋 (𝑖)
Par 𝑋(𝑖)= 𝑋𝑖−1+𝑋𝑖∓1
2 = 𝑋(𝑖+2)=20
Moda
M = Valor 8 valores que más se repite
M =20
Campana de Gauss
16 25
18 24
17 18 19 25
20 20 30
La campana de gauss nos da a conocer la distribución de nuestros datos tomados de
una muestra estos sean hacia la derecha o hacia la izquierda. Donde se encuentre
acumulado los datos.
38
Guárdia, J. Freixa, M. Peró, M. Turbany, J. (2008) “La distribución normal es
un modelo teórico de probabilidad que se puede utilizar cuando trabajamos con
variables aleatorias continuas, aunque también lo utilizamos en variables aleatorias
discretas que tienen un rango de valores suficientemente amplio. Recibe el nombre
de campana de Gauss”.
González, K. (2007) “Campana de Gauss, es una representación gráfica de la
distribución normal de un grupo de datos. Éstos se reparten en valores bajos,
medios y altos, creando un gráfico de forma acampanada y simétrica con respecto a
un determinado parámetro. Se conoce como curva o campana de Gauss o
distribución Normal”.
Catmull, E. (2014) “Un concepto ligeramente menos obvio es el de la distribución
normal o campana de gauss, aunque muchos comprendemos intuitivamente su
significado. En el colegio nos suelen calificar de acuerdo con una campana de gauss:
unas pocas personas sacan, malas notas, otras pocas sacan notas excelentes y el
resto queda amontonado en el centro”.
Ejercicio
Edad
18 20 19
20 23 21
20 19
19 20
Media ∑𝑋𝑖
𝑛
𝑛𝑖=1 =20.09 =20
Mediana =20
Moda =20
Dispersión
Varianza = 1
𝑛−1 ∑ (𝑋𝑖 − 𝑋)𝑛
𝑖=
𝑠2 =1
10 =((18 − 20.09)2 + (19 − 20.09)2……………(23 − 20.09)2)
𝑠2 = 2.09
39
Desviación estándar S=√𝑠2
S=√2.09
S=1.44
Coeficiente de varianza CV = 𝑠
𝑥 dec, %
CV= 1.44
20.05 =0.072=7.2%
Estimación de edades, mejores actrices
Media = 21+22+⋯…….+80
75 = 35.69
Mediana = 33
Moda = 35.29
Varianza =1
14 [(21 − 35.69)2] =11.13
Desviación estándar S= √(11.13) = 3.33
Coeficiente varianza = CV = 𝑆
𝑋 dec % CV =
11.13
35.69 = 0.311 = 3.1%
Estimación tabla de frecuencia o datos cuantitativas discretas
clase Fi Xi Fi
Fi Xi^2
0 12 0 0 0
1 9 9 1 9
2 7 14 4 28
3 6 18 9 54
4 3 12 16 48
5 3 15 25 75
40 68 214
X=∑ 𝑓𝑖 𝑋𝑖
𝑛𝑖=1
∑
X=68
40 = 1.7
𝑆2 =∑ 𝑓𝑖𝑋𝑖
2𝑛𝑖=1
∑ 𝑓𝑖 -𝑋2
𝑆2 = 214
40− 1.72 = 2.46
S =√𝑆2 =√2.46 = 1.37
C.V = 𝑆
𝑋=
1.57
1.7 =92%
𝑋𝑖2
40
Continuas
Clase Xi Fi Xi Fi
Fi Xi^2
[1,65-2,05] 1,85 4 7,4 3,4225 13,69
[2,05-2,45] 2,25 5 11,25 5,0625 25,3125
[2,45-2,85] 2,65 13 34,45 7,0225 91,2925
[2,85-3,25] 3,05 17 51,85 9,3025 158,1425
[3,25-3,65] 3,45 8 27,6 11,9025 95,22
[3,65-4,05] 3,85 3 11,55 14,8225 44,4675
50 144,1 428,125
X= 144.1
50= 2.88
𝑆2 = 428.125
50− 2.882 = 0.26
S =√𝑆2 =√0.26 = 0.51
C.V = 𝑆
𝑋=
0.51
2.88 =0.177 = 17.7%
𝑋𝑖2
41
Estimadores De Posición
Clase
𝑋𝐼
Marca de clase
Continuas
𝑓𝑖 Frecuencia absoluta
Discretas
Percentiles de orden i
Es el porcentaje dado por las observaciones de datos ordenadas de menor a mayor.
1 2 3 4 5 6 7 8 9
1 2 3 4 5 6 7 8 9 10 11
Vivo. M, Soria. E, (2001) ”En forma intuitiva podemos decir que es un valor tal
que supera un determinado porcentaje de los miembros de la población esta sirve
para comprar las variables”.
Vilar J (2005) “Sea 𝒙𝟏,𝒙𝟐, 𝒙𝟑,…,𝒙𝒏 un conjunto de n valores ordenados de menor a
mayor, se denomina percentil o al valor perteneciente al conjunto de datos que
cumple el p% de los datos sin menores que él”.
Jara, L. (2006) ”El percentil es una medida de tendencia central usada en
estadística que indica, una vez ordenados los datos de menor a mayor, el valor de la
variable por debajo del cual se encuentra un porcentaje dado de observaciones en
un grupo de observaciones”.
25% 50% 75%
42
DECILES
Se refiere en dividir los datos en diez partes iguales con alguna relación de orden.
Barreto. A, (2012) ”En el ámbito del análisis de la distribución del ingreso de
las familias, es común que la curva de Lorenzo se construya a partir de datos
agrupados en subconjuntos de tamaño o por ciento, denominamos deciles de
hogares”.
Richard I. Levin, David S. Rubin (2004) ” Los deciles tienen nombres
especiales, dependiendo del número de partes iguales en que dividen a los datos.
Los fractiles que los dividen en 10 partes iguales se llaman deciles”.
Hernández, (2003) “Decil se refiere a cada uno de los 9 valores que dividen un
grupo de datos (clasificados con una relación de orden) en diez partes iguales, y de
manera que cada parte representa un décimo de la población. En resumen, los
deciles son cada uno de los nueve valores que dividen un conjunto de datos en diez
grupos con iguales efectivos”.
CUARTILES
Los cuartiles son tres valores Q1, Q2, Q3 que dividen a un conjunto de datos
ordenados.
Moore. D, (2005) ” Estas ordenan los datos de menor a mayor y busca el lugar
que ocupa cada cuartil mediante 𝐾.𝑁
4 K = 1, 2,3”.
Cáceres, R (2007)”Los cuartiles dividen al conjunto de datos en cuarto partes
iguales en cuanto al número de datos, en cada una de ellas hay un 25% de datos. En
caso de que el número de datos no sea divisible por cuatro, los grupos no podrán
tener todos exactamente el mismo número de datos”.
Mendoza, B. (2002) “Los cuartiles son los tres valores que dividen al conjunto
de datos ordenados en cuatro partes porcentualmente iguales. La diferencia entre
el tercer cuartil y el primero se conoce como rango intercuartílico. Se representa
gráficamente como la anchura de las cajas en los llamados diagramas de cajas”.
43
Cuantiles
Son puntos tomados a intervalos regulares de una variable aleatoria.
Canaviri. D, (2012) ” Intenta modelar el efecto X sobre toda la distribución de
Y Z-fz continuas, monótona. El i-esimo cuartil de Z en un número Qzi que satisface
F (Q Z T) =T”.
Nettleton, D. (2003) “La técnica de cuantiles genera tantas categorías como
deseamos, en función del rango de valor de valores de la variable para definir los
cuantiles, tenemos que especificar a la técnica cuantos queremos, y para cada uno el
porcentaje de los casos que deseamos incluir”.
Suarez, A. (2000) “Se define el cuantil de orden alfa como un valor de la variable
por debajo de la cual se encuentra una frecuencia acumulada alfa”.
Entre los casos particulares tenemos los percentiles, deciles y cuartiles.
Q1 (primer cuartil)= 25% 25
Percentiles Q2 (segundo cuartil)=50%
Q3 (tercer cuartil)=75% 75
Edades
20, 20, 20, 21, 22, 23,25
Q2=50%=21
Q1=25%=20 P50 = 𝑋(8)∗5
100 =𝑋4 = 21
Q3=75%=23
Fórmula para hallar cuartil, percentil, deciles
𝑋𝑖,𝑎 = 𝑋𝐼 + 0. 𝑎(𝑋𝐼+1 − 𝑋𝐼)
44
Fórmulas para hallar posición
𝑃𝑖 = 𝑋(
(𝑛+1)𝑖
100) i=1…………….99
X1 1,65
X2 1,6
X3 1,64
X4 1,69
X5 1,81
X6 1,68
X7 1,6
X8 1,7
X9 1,7
X10 1,76
Datos ordenadas
X(1) 1,6
X(2) 1,6
X(3) 1,64
X(4) 1,65
X(5) 1,68
X(6) 1,69
X(7) 1,7
X(8) 1,7
X(9) 1,76
X(10) 1,81
𝑃𝑖 = 𝑋(
11∗25
100)
= 𝑋(2) + 0.75(𝑋(3) − 𝑋(2))
= 1.60+0.75 (1.64-1.60)
=1.63
Dz= 𝑃(70) = 𝑋(
11∗70
100) =𝑋(7.7)
= 𝑋(7) + 0.7(𝑋(8) − 𝑋(7))
= 1.70+0.7 (1.70-1.70)
=1.70
𝑃(70) = 𝑋(
11∗75
100) =𝑋(8.25)
= 𝑋(8) + 0.25(𝑋(9) − 𝑋(8))
= 1.70+0.25 (1.76-1.70)
=1.715
45
DIAGRAMA DE CAJA Y BIGOTE
Correa. A, Burgos. C,(2012) ”Este diagrama muestra que la distribución de la
finura es simétrica con respecto al valor central promedio debido a que la longitud
de ambos rectángulos alrededor de cada mediana es igual en la mayoría de la
operarios”.
Otamendi, F. Díaz, A. (2011) ”El diagrama de caja muestra los tres cuartiles,
que son los valores que cubren el 25%, el 50% y el 75% de los datos. La caja incluye
el 50% central de los datos. También se incluye como un punto la media y como
asterisco los valores o excesivamente altos o excesivamente bajos en relación con la
media y la variabilidad normal de los datos, marcada por los bigotes de las cajas”.
Espinoza, C. (2004) “Los diagramas de Caja-Bigotes son una presentación visual
que describe varias características importantes, al mismo tiempo, tales como la
dispersión y simetría”.
16
Q1 Q2 Q3
24 28 40
46
1.60 1.81
Rango Intercuartil
RI=Q3-Q1
RI=1.725-1.63
RI=0.085
Es la resta del tercer cuartil menos el primer cuartil de una distribución.
Pérez. F, (2012) “Por su parte el rango intercuartil se obtiene de la diferencia
entre el primer y tercer cuartil y, sirve para indicar la duración o tiempo que le toma
a un cohorte completar una transición dada”.
David M. Levine, Mark L. Berenson, Timothy C. Krehbiel (2004)”El
rango intercuartil (también llamado dispersión media) es la diferencia entre el
tercer y primer cuartil de un conjunto de datos.
El rango intercuartil mide la dispersión en la mitad (parte central) de los datos, así
que no se ve influido por los valores extremos”.
Tigre, M. (2008) “En estadística descriptiva, se le llama rango intercuartílico o
rango intercuartil, a la diferencia entre el tercer y el primer cuartil de una
distribución. Es una medida de la dispersión estadística, a diferencia del rango, se
trata de un estadístico robusto”.
Valor Alejado
Gutiérrez. A, (2010) “Es una dispersión grande es una propiedad indeseada
del estimador, pues en generalmente en la práctica, tenemos solo una muestra”.
Pérez, V. Figueroa, E. Duran. J, (2006) “Los valores alejados originados por
pequeñas desviaciones experimentales, pueden introducir distorsiones
Q1-(1.5*RI) Q3+ (1.5*RI)
1.63
1.685 1.713
47
importantes en los valores medios y sobre todo en los criterios de precisión, por lo
que deben ser revisados y eliminados, si así correspondiesen, antes de ejecutar la
evaluación de los datos”.
Ximenez, P. (2004) “Son valores observados que se apartan demasiado del
resto de la muestra, dando como resultado una muestra alejada de la realidad”.
ESTIMACIÓN POR FORMA
Asimetría AS
Curtosis RC
Distribución en Forma Simetría
La distribución en forma simétrica no muestra con claridad y precisión donde se
encuentra nuestra muestra en la población si a la derecha, izquierda o en la media.
Corea. L, Morales. A, (2000) “La convergencia a la distribución normal de los
promedios de variables aleatorias poisson, igual e independiente distribuidas, está
en función de su parámetro a mayor valor del mismo, más rápida es la
convergencia”.
Alpízar, A. Magno, C. (2004) “El grado de agudeza de una distribución de puntos”.
Santander, K. (2005) “La simetría (también denominada sesgo) de una
distribución de frecuencias hace referencia al grado en que valores de la variable,
Asimétrica
48
equidistantes a un valor que se considere centro de la distribución, poseen
frecuencias similares”.
Datos
Matemática
𝑀2 = 𝑆2 1
𝑛−1∑(𝑋𝐼 − 𝑋)2
Asimetría
𝑀3 = 𝐴𝑠 = ∑(𝑋𝑖)3
𝑛𝑆4𝑥
Curtosis
𝑀4 = 𝐶𝑟 = [∑(𝑋𝑖−𝑋)4
𝑛𝑆4𝑥] − 3
X=2+4+8+2
4 = 4
𝑠2 =1
3 =((2 − 4)2 + (4 − 4)2 + (8 − 4)2 + (2 − 4)2)
𝑠2 = 8
S=√𝑠2
S=√8
S=2.83
𝐴𝑆=
48
4(2.83)3
= 0.53
𝐶𝑟 =288
4(2.83)4 − 3
= -1.88
Xi Xi-x (Xi-X)ᵔ2 (Xi-X)ᵔ3 (Xi-X)ᵔ4
2 -2 4 -8 16
4 0 0 0 0
8 4 16 64 256
2 -2 4 -8 16
24 48 288
49
Análisis Bivariado
Variable De Cuantitativo
Análisis de correlación de Pearson
Variable Cualitativo
Tablas de contingencia estadístico 𝑋2 cori cuadrada
r=𝑆𝑥𝑦
𝑆𝑥𝑆𝑦
Análisis bivariado es cuando se está hablando de dos variables tiene como fi
encontrar si es que existe un tipo de relación entre estas dos variables.
Ramírez. V, Hernández. O, García. M, (2007) “Los análisis bivariado
mostraron ventajas sobre los univariado en su habilidad de predicción
usando la metodología de validación cruzada al usar el análisis bivariado o
Correlación positiva lineal Correlación negativa
lineal
Correlación
No hay correlación
50
cualquiera involucrado estas dos variables comparando con sus respectivos análisis
univariado”.
Martín, Miguel, Horna, Olivia, Nedel, Fúlvio, Navarro, Albert (2010)
”El análisis bivariado: consiste este en la representación, cuantificación y
comparación de las variabilidades observadas en una propiedad en función de las
existencia de un factor externo que puede introducir una variabilidad atribuido al
factor y adicionarle a la propia de la variable bajo un concepto estrictamente
aleatorio”.
Irwin y Miller, M. (1992) “El Análisis Bivariado Implica el análisis comparativo
de dos variables una de las cuales modifica a la otra. Al considerar dos variables, la
construcción de las tablas de distribución de frecuencias Bivariadas”.
Altura Peso
1,55 45KG
1,5 60KG
1,51 60KG
1,85 70KG
1,55 70KG
1,62 68KG
𝑆𝑥𝑦 =1
𝑛−1∑((𝑥𝑖 − 𝑥)(𝑦𝑖 − 𝑦))
𝑆𝑥 = √𝑠2𝑥
𝑆𝑦 = √𝑠2𝑦
𝑋𝑥 = ∑𝑥𝑖
𝑛
𝑛𝑖=1
𝑌𝑌 = ∑𝑌𝑖
𝑛
𝑛𝑖=1
𝑆𝑥2 =1
𝑛−1∑ (𝑋𝑖 − 𝑋)2𝑛
𝑖=1
𝑆𝑦2 =1
𝑛−1∑ (𝑌𝑖 − 𝑌)2𝑛
𝑖=1
𝑆𝑥𝑦 → 𝑋 = 𝑌
𝑆𝑥𝑦 =1
𝑛−1∑((𝑥𝑖 − 𝑥)(𝑥𝑖 − 𝑥))
𝑆𝑥𝑦 =1
𝑛−1∑(𝑋𝑖 − 𝑥)2
Si tienes una muestra con la clasificación de los estudiantes de primer parcial y
segundo parcial
51
r=𝑆𝑥𝑦
𝑆𝑥𝑆𝑦
𝑛 = 10
𝑋 = 58.4
𝑌 = 69.5
𝑆𝑥2 = 166.48
𝑆𝑦2 = 121.83
𝑆𝑥 = √166.48 =12.90
𝑆𝑦 = √121.83 =110.4
𝑆𝑥𝑦 =1
𝑛−1∑((𝑥𝑖 − 𝑥)(𝑦𝑖 − 𝑦))
𝑆𝑥𝑦 = 134.11
r=134.11
12.90∗11.04 = 0.06
Signo de La Covariancia
El signo de la covarianza nos muestra directamente el tipo de correlación lineal es
positiva, negativa.
Rodríguez. L, (2007) “Es importante que se mida la correlación entre variables
cuyas asociaciones tenga algún significado de interés. Así mismo si las variables no
están correlacionadas linealmente, pudiera ser que tengan algún otro tipo de
correlación”.
Primer parcial Segundo parcial
60 72
74 82
66 75
34 46
60 73
66 74
57 70
71 82
39 60
57 61
52
Richard L. Scheaffer, Mendenhall, W. Lyman Ott (2007) “Manera que
cada muestra posible de tamaño n tenga la misma probabilidad de ser seleccionada,
el procedimiento de muestreo se denomina muestreo aleatorio simple”.
Benjumea, J.(2006) “La covarianza de una Variable Estadística Bidimensional,
también llamada varianza conjunta de las dos variables, es el parámetro estadístico
más representativo de una distribución bidimensional”.
Matriz de Varianza y Covarianza
En la matriz de podemos observar la covarianza de dos elementos.
Ato, M. (1990) “Aunque la matriz de correlación entre variables debe constituir
se con coeficientes de correlación de PEARSON ha habido muchos intentos de
aplicar el análisis Factorial a matrices constituidas con otros coeficientes de
correlación fundamentalmente el coeficiente phi y el coeficiente de correlación
tetracorico”.
Rodríguez. L, (2007) “Es una matriz simétrica con la que se pueden representar
ordenadamente las varianzas y las covarianzas entre las variables”.
Mendenhall, W. (2008) “En estadística y teoría de la probabilidad, la matriz de
covarianza es una matriz que contiene la covarianza entre los elementos de un
vector. Es la generalización natural a dimensiones superiores del concepto de
varianza de una variable aleatoria escalar”.
[𝑆𝑥𝑖𝑥𝑗] = [𝑆𝑥12 𝑆𝑥1 𝑥2
𝑆𝑥1 𝑥2 𝑆𝑥22 ]
𝑋1 = 𝑥 𝑆𝑋1 = 𝑆𝑋
𝑋2 = 𝑦 𝑆𝑋2 = 𝑆𝑦
[166.48 134.11134.11 121.83
]
53
MATRIZ DE CORRELACIÓN
Matriz de correlaciones nuestra r está conformada por filas y columnas.
Montgomery, Douglas, C. (2008) “El análisis factorial se puede utilizar para
estudiar series numéricas o de valores cuantitativos para un determinado número
de variables cuantitativas y mayor de dos. Por ejemplo, tres características o más
para series numéricas con igual número de datos”.
Aguirre, A. (1994) “la correlación en el modelo, como dijo, puede indicar la
presencia de parámetros superfluos. Estos parámetros redundantes y no están
necesariamente entre aquellos para los cuales aparece el coeficiente de variación”.
Cobo, P. (1997) “Los coeficientes de un filtro fijo pueden obtenerse del cociente
de la matriz de correlación cruzada entre la salida ideal y la entrada y la matriz de
autocorrelacion de la entrada”.
[𝑟𝑖𝑗] = [𝑟1,1 𝑟1,2
𝑟2,1 𝑟2,2]
[rij] =Sxi xj
SxiSxj
r1,2 =
Sx1 x2Sx1Sx2
=134.11
12.90∗11.04
r1,1 =
Sx1 x1Sx1Sx1
=Sx12
Sx12 =1
r2,2 =
Sx2 x2Sx2Sx2
=Sx22
Sx22 =1
r2.1 =
Sx1 x2Sx1Sx2
=134.11
12.90∗11.04
Existe una dependencia lineal positiva entre estas dos variables lo podemos
colaborar en la figura resuelta anterior lo que no da a conocer una pendiente lineal.
54
Tipos de Muestreo
1.- Muestreo aleatorio simple (MAS)
2.- Muestreo sistemático
3.- Muestreo estratificado
4.- Muestreo por conglomerado
Muestreo Aleatorio Simple (Mas)
MÁS tabla de números aleatorios
RAM # (0-1)
A B C
50 45 60
20 5 5
155 50%
El muestreo aleatorio simple es el más común y el más recomendado a utilizar este
consiste.
Nivel de Confianza
El nivel de confianza en una encuesta a realizarse, es la que nos permite determinar
un grado exacto de confiabilidad en nuestra investigación a realizar, es de gran
utilidad para determinar el nivel mínimo o máximo de perdida de información.
Freedman, D. (1993) “El nivel de confianza del 95% nos informa sobre el
proceso de muestreo. Lo primero que hay que darse cuenta es que el intervalo de
confianza depende de la muestra. Si la muestra hubiese sido diferente, el intervalo
de confianza también sería diferente”.
Walpole, R. (1999) “El nivel de confianza se indica por 1-α y habitualmente se
da en porcentaje (1-α) %. Hablamos de nivel de confianza y no de probabilidad (la
probabilidad implica eventos aleatorios) ya que una vez extraída la muestra, el
intervalo de confianza estará definido al igual que la media poblacional”.
Rial, A. Valera, J. (2014) “El nivel de confianza (1-∞) es la probabilidad de
que el intervalo que hemos creado incluye dentro de si el valor del parámetro
poblacional”.
55
Formula
𝑛 =𝑍2𝑎/2𝑃𝑄𝑁
𝐸2(𝑁−1)+𝑍2𝑃𝑄
n= tamaño necesario de la muestra
Z= margen de error
P= probabilidad de que el evento ocurra
Q= probabilidad de que el evento NO ocurra
E= error de estimacion
N= tamaño de la población
Ejemplo:
𝑛 =𝑍2𝑎/2𝑃𝑄𝑁
𝐸2(𝑁−1)+𝑍2𝑃𝑄
𝑛 =(1.96)2(0.25)43700
(0.05)2(4700−1)+(1.90)20.25 =
41969.48
110.15 = 380.82
𝑍2 = 𝑍20.05 − (1.96)2
𝐸2 = (0.05)2
𝑁 = 43700
𝑃𝑄 = 0.25
Martin. F, (2011) “El muestreo aleatorio simple en sentido estricto se denomina
muestra aleatoria simple a la obtenida mediante el procedimiento de muestreo
aleatorio con reemplazamiento, a la unidad de muestreo independencia y
probabilidades iguales de pertenecer a la muestra”.
Spiegel, Murray, R. (2009) “En esta técnica, cada miembro de la población
tiene la misma probabilidad de ser seleccionado como sujeto. Todo el proceso de
toma de muestras se realiza en un paso, en donde cada sujeto es seleccionado
independientemente de los otros miembros de la población”.
Tamayo, M. Tamayo. (2004) “El elemento más común para obtener una
muestra representativa es la selección al azar aleatoria, es decir, que cada uno de los
individuos de una población tiene una misma posibilidad de ser elegido. Si no se
cumple este requisito se dice que la muestra es viciada, por lo que si cada uno de los
56
elementos de la población no tiene la misma posibilidad de ser elegido se habla
entonces se habla de una muestra viciada”.
Muestreo Sistemático
El muestreo sistemático este lo utilizamos cuando nuestra población es de gran
tamaño en este se elige un numero al azar de 1 a k.
Vivanco. M, (2005) “El muestreo sistemático es una variante del muestreo
simple. El procedimiento de selección es sistemático a partir de un elemento elegido
al azar que opera como arranque aleatorio para la selección automática del conjunto
de elemento que compone la muestra. El primer elemento seleccionado condiciona
los siguientes, que son elegidos a partir del arranque aleatorio y según su salto de
amplitud constante”.
Robert F. Drury (1979) “Muestreo Sistemático: La cantidad de trabajo
necesario para extraer una muestra simple al azar puede ser bastante considerable
cuando el número de unidades que hay que seleccionar es grande. Este tipo de
muestreo se denomina muestreo sistemático. No es exactamente igual al muestreo
simple al azar, pero es un método aceptable de muestreo ya que se conoce la
probabilidad de selección de cualquier elemento y se pueden calcular los errores de
muestreo”.
Devore, Jay L. (2008) “Es una técnica dentro de la categoría de muestreos
probabilísticos – y que por lo tanto requiere tener un control preciso del marco
muestral de individuos seleccionables junto con la probabilidad de que sean
seleccionados – consistente en escoger un individuo inicial de forma aleatoria entre
la población y, a continuación, seleccionar para la muestra a cada enésimo individuo
disponible en el marco muestral”.
Muestreo Estratificado
El muestreo estratificado este se divide en partes previa la que se va a estudiar aquí
utilizamos técnicas del muestreo sistemático.
Buckley, R. Cample, J, (2005) “Este método de muestreo es normalmente el
más eficiente para obtener una muestra que represente al total de la población”.
57
Elena Abascal, E. Ildefonso Grande, E. (2005) “El muestreo estratificado
se ha diseñado para reducir los errores muéstrales. Es adecuado cuando en la
población que se desea estudiar se pueden definir varios grupos o estratos sin
solapamientos de manera que el comportamiento respecto a la variable objeto del
estudio sea semejante en los componentes de un estrato”.
Larson, Harold, (1995) “Esta técnica, perteneciente a la familia de muestreos
probabilísticos, consiste en dividir toda la población objeto de estudio en diferentes
subgrupos o estratos disjuntos, de manera que un individuo sólo puede pertenecer
a un estrato. Una vez definidos los estratos, para crear la muestra se seleccionan
individuos empleando una técnica de muestreo cualquiera a cada uno de los estratos
por separado. Si por ejemplo empleamos muestreo aleatorio simple en cada estrato,
hablaremos de muestreo aleatorio estratificado (M.A.E. en adelante) ”.
Muestreo por Conglomerado
El muestreo por conglomeración este se usa cuando la población a estudiar está
dividida natural mente.
Contreras, (1995) “En el muestreo por conglomerados las unidades muéstrales
no son elementos individuales de la población, sino grupos de elementos. En el
muestreo por conglomerados se selecciona aleatoriamente una colección de
conglomerados. Se muestrean entonces todos los elementos individuales de todos
los conglomerados elegidos. A veces, es necesario elegir conglomerados dentro de
los conglomerados. Se dice entonces que se trata de un muestreo en etapas
múltiples”.
Gabin. M, (2005) “El muestreo por conglomerados se divide a la población en
grupos y luego se selecciona una muestra aleatoria de estos grupos”.
Quintana, C. (1996) “El muestreo por conglomeración es opuesto al muestreo
estratificado en sentido de que primero se seleccionan al azar grupos o
conglomerados de elementos de la población y luego se toman todos los elementos
de cada conglomerado para constituir la muestra global”.
58
SEGUNDO PARCIAL
59
Técnicas de conteo
Cuando el número de posibles resultados de un experimento es finito, su espacio
muestral es finito y su cardinal es un número natural. Pero si el experimento es
combinado, el cardinal puede ser tan grande, que sería del todo absurdo pretender
enumerarlos todos, por ser un proceso lento y tedioso.
(Ximena Anadrade, 2008) “Sea un experimento que se tiene que realizar en K
diferentes etapas, cada una se puede hacer de 𝑛𝑖 formas distintas, entonces el
experimento completo se lo puede hacer sin ningún reparo”.
(Carlos Siguencia , 2004) “Suponga que se encuentra al final de una línea de
ensamble final de un producto y que un supervisor le ordena contar los elementos
de un lote que se ha manufacturado hace unas horas y del que se desconoce el
número de productos que lo constituyen, de inmediato usted empezará a contar un
producto tras otro y al final informará al supervisor que son, 48, 54 u otro número
cualquiera”.
(Gustavo Rocha Beltran, 2004) “cuando el número de posibles resultados de
un experimento es fi nito, su espacio muestral es fi nito y su cardinal es un número
natural. Si el experimento es simple, el espacio muestral es unidimensional,
constituido por puntos muéstrales con una sola componente, y el cardinal es
simplemente el número de posibles resultados del experimento, los que se pueden
enumerar fácilmente.”
Ejercicio
Se tiene un ánfora con 7 canicas negras, 2 rojas y 3 amarillas.
1- ¿De cuantas formas se pueden extraer las 3 canicas?
𝑪𝟑𝟏𝟐
𝟏𝟐!
𝟑!(𝟏𝟐−𝟑)! =
𝟏𝟐𝒙𝟏𝟏𝒙𝟏𝟎𝒙𝟗!
𝟑!𝟗!
𝑪𝟑𝟏𝟐 = 𝟐𝟐𝟎
2- ¿De cuantas formas se pueden sacar 3 canicas negras?
𝑪𝟑𝟕
𝟕!
𝟑! (𝟕 − 𝟑)!= 𝟑𝟓
60
3- ¿De cuantas formas se pueden sacar 2 canicas negras y 2 amarillas?
𝑪𝟐𝟕 + 𝑪𝟐
𝟑
(𝟕
𝟐) + (
𝟑
𝟐) =
𝟕!
𝟐! (𝟕 − 𝟐)!+
𝟑!
𝟐! (𝟑 − 𝟐)!= 𝟐𝟒
4- ¿De cuantas formas se pueden sacar 1 canica de cada color?
𝑪𝟏𝟕 + 𝑪𝟏
𝟐 + 𝑪𝟏𝟑
(𝟕
𝟏) + (
𝟐
𝟏) + (
𝟑
𝟏) =
𝟕!
𝟏! (𝟕 − 𝟏)!+
𝟐!
𝟏! (𝟐 − 𝟏)!+
𝟑!
𝟏! (𝟑 − 𝟏)!= 𝟏𝟐
Si un elemento consiste en lanzar 3 monedas y observar que lados salen, liste
los elementos del conjunto Ω.
𝟐𝟑 = 𝟖
Ω = (𝑪, 𝑪, 𝑪); (𝑪, 𝑪, 𝑺); (𝑪, 𝑺, 𝑪); (𝑺, 𝑺, 𝑪); (𝑪, 𝑺, 𝑺); (𝑺, 𝑪, 𝑺); (𝑺, 𝑪, 𝑪); (𝑺, 𝑺, 𝑺)
Un experimento consiste en lanzar de datos, identifique el conjunto Ω
𝟐𝟔 = 𝟑𝟔
1 2 3 4 5 6
1 (1,1) (1,2) (1,3) (1,4) (1,5) (1,6)
2 (2,1) (2,2) (2,3) (2,4) (2,5) (2,6)
Ω = 3 (3,1) (3,2) (3,3) (3,4) (3,5) (3,6)
4 (4,1) (4,2) (4,3) (4,4) (4,5) (4,6)
5 (5,1) (5,2) (5,3) (5,4) (5,4) (5,6)
6 (6,1) (6,2) (6,3) (6,4) (6,5) (6,6)
Regla Multiplicativa
Si en un experimento pueden ocurrir los eventos A y B, entonces
P(A ∩ B) = P(A)P(B|A), dado que P(A)>0.
Así la probabilidad de que ocurran A y B es igual a la probabilidad de que ocurra A
multiplicada por la probabilidad condicional de que ocurra B, dado que ocurre A.
61
Como los eventos A ∩ B y B ∩ a son equivalentes, del teorema anterior se sigue que
también podemos escribir.
Jorge Larrea (2009) “Si un conjunto A tiene m elementos y un
conjunto B posee n elementos y formamos parejas de elementos elegidos de los
conjuntos A y B en el orden indicado, tendremos (m) (n) parejas posibles”.
Pedro Giménez (2006) “Principio de multiplicación Si un procedimiento puede
efectuarse de n formas distintas y un segundo procedimiento puede realizarse de m
formas diferentes, entonces el total de formas en que puede efectuarse el primer
procedimiento seguido del segundo es el producto n · m”.
Carlos Torres (2012) “Regla de multiplicación. Si una operación se puede llevar
a cabo en n1 formas, y si para cada una de Éstas se puede realizar una segunda
operación en n2 formas, entonces las dos operaciones se pueden ejecutar juntas
n1n2 formas”.
Combinaciones
Una combinación es un arreglo donde el orden NO es importante. La notación para
las combinaciones es C(n,r) que es la cantidad de combinaciones de “n” elementos
seleccionados, “r” a la vez. Es igual a la cantidad de permutaciones de “n” elementos
tomados “r” a la vez dividido por “r” factorial. Esto sería P(n,r)/r! en notación
matemática.
M.C. Pérez, F. (2012) “Combinaciones. En ocasiones nos interesa el número de
formas de seleccionar r objetos de n sin importar el orden. Estas selecciones se
llaman combinaciones”.
Rincón, L. (2006) “Ahora que no nos interesa el orden, observamos que cada
uno de los arreglos de la formula anterior, ¡está siendo contado k! veces, las veces
en que los mismos k elementos pueden ser permutados unos con otros, siendo que
el conjunto de elementos es el mismo. Para obtener arreglos en donde el orden no
importa, debemos entonces dividir por k!. La fórmula a la que hemos llegado se
llama combinaciones de n en k”.
62
Suarez, M. (2012) “COMBINACIONES En muchas situaciones no interesa el
orden de los resultados, sino sólo el número de maneras en las que r objetos pueden
seleccionarse a partir de n cosas, sin consideración de orden. Si dos subconjuntos se
consideran iguales debido a que simplemente se han reordenado los mismos
elementos, entonces se trata de combinaciones”.
Permutaciones
Se llama permutaciones de m elementos (m = n) a las diferentes agrupaciones de
esos m elementos de forma que Sí entran todos los elementos. Sí importa el orden.
No se repiten los elementos.
M.C. Ramírez, F. (2012) “Permutaciones. Algunas ocasiones nos interesa
encontrar un espacio muestral que contiene como elementos a todas las posibles
ordenaciones o arreglos de un grupo de objetos. Por ejemplo, podemos querer saber
cuántos arreglos diferentes son posibles para sentar a 5 personas alrededor de una
mesa los diferentes arreglos se llaman permutaciones”.
Sandoval, L. (2006) “La pregunta básica acerca del total de formas en que
podemos poner en orden lineal (uno detrás de otro y por lo tanto no hay repetición)
n objetos distintos tiene como respuesta la factorial de n, ¡denotado por n! y definido
como sigue: n! = n(n − 1)(n − 2)· · · 3 · 2 · 1. A este número también se le conoce como
las permutaciones de n objetos y se usa la notación P(n) = n!. ¡Adicionalmente y por
conveniencia se define 0! = 1”.
Patiño, R. (2002) “Es todo arreglo de elementos en donde nos interesa el lugar
o posición que ocupa uno de los elementos que construye dicho arreglo.
Si se seleccionan r objetos de un conjunto de n objetos distintos, cualquier arreglo
(orden) de estos objetos se conoce como permutación”.
Experimento Estadístico y Espacio Muestral
Experimento
Se puede considerar un experimento a toda forma de evento de laboratorio o que no
está ligada al mismo siempre y cuando se base ciertas condiciones específicas, para
poder obtener un resultado de icho experimento el cual pude ser variado.
63
Chipa, J. (2015) “Al hablar de experimentos se hace de la manera más amplia
posible, es decir, no sólo incluyen hechos asociados a situaciones experimentales en
un laboratorio, sino también se contemplan cualesquiera otras situaciones que den
origen a sucesos de interés”.
Luceño, A. González, J. (2006) “Decimos que un experimento es aleatorio
cuando al realizarse bajo condiciones específicas existe más de un posible resultado
del experimento, se conoce de antemano cuales son todos los posibles resultados,
en cada realización del experimento, se conoce el resultado concreto que ocurrirá
entre todos los posibles”.
Ministerio de educación, cultura y deporte (2003) “Experimento
designa todo acto que proporciona datos. El adjetivo aleatorio conduce a aquellos
actos cuyos resultados son imprescindibles, frente a los deterministas cuyos
resultados siempre serán los mismos”.
Espacio Muestral del Experimento
Se considera todo espacio de donde todos los resultados posibles de una muestra de
nuestro experimento se pueden dar, de manera independiente de las otras.
Chipia. J, (2005) “De un experimento aleatorio, es el conjunto de todos los
posibles resultados al realizar el experimento”.
Pinilla. V. (2009) “Espacio Muestral. Es el conjunto de todos los posibles
resultados de un experimento; constituye el conjunto universal de todas las
observaciones. Se suele denotar por la letra S”.
Juarez. A, Inzunsa. S, (2009) “El espacio muestral es el conjunto de todos los
posibles resultados de un experimento aleatorio. El número de elementos del
espacio muestral, constituye el total de resultados posibles que tiene el
experimento”.
64
Eventos
Son sucesos que conlleva el experimento tratado el cual se puede dar en un
experimento aleatorio, quiere decir que no se puede predecir lo que realmente
puede suceder con os elementos de nuestro conjunto.
Carlos Andrade, (2008) “Un Evento es un resultado particular de un
experimento aleatorio. En términos de conjuntos, un evento es un subconjunto del
espacio muestral. Por lo general se le representa por las primeras letras del
alfabeto”.
Rafael Díaz, (2004) “En la [teoría de la probabilidad], un evento o suceso es un
subconjunto de un espacio muestral, es decir, un conjunto de posibles resultados
que se pueden dar en un experimento aleatorio. Son aquellos hechos en los que no
se sabe con certeza lo que va a suceder, dependen del azar y no se puede determinar
sus resultados aun repitiéndolo en varias ocasiones “.
Rodolfo Vaqurizo, (2013) “Un evento es un subconjunto del espacio muestral
de un experimento aleatorio. Los eventos normalmente se denotan con las letras
mayúsculas A, B, C; y tienen la característica de ser subconjuntos de S ((A, B, C) Ì S)“.
Muestro con Reposición y Muestreo sin Reposición
Se pude considerar al igual que el muestreo simple donde nos indica que cada
elemento tiene la misma posibilidad de elegid, dando así una independencia ala cada
objeto escogido entre nuestros conjuntos experimentales.
Kai Lai Chung (1983) ” El muestreo con reposición se extraen sucesivamente
y es denominado muestreo aleatorio simple, que se caracteriza porque: cada
elemento del universo tiene la misma probabilidad de ser elegido, y las
observaciones se realizan con reemplazamiento. De este modo, cada observación es
realizada sobre el mismo universo (no disminuye con las extracciones sucesivas).y
se garantiza la independencia entre las unidades seleccionadas que representa cada
extracción.”
65
Ernesto Camaño, (2001) “Este muestreo nos indica que siempre que se
extraiga un elemento de nuestro conjunto el mismo no será devuelto o no se lo
repondrá a diferencias del muestreo con reposición donde sí se devuelve el
elemento tomado, dando por conclusión que cada elemento de nuestro conjunto
tiene la posibilidad de ser escogido sola una vez.
El muestreo sin reposición. Es cada vez que se hace una extracción, es decir que la
unidad seleccionada no se devuelve al universo. Por lo tanto, no se permite que una
misma unidad sea seleccionada más de una vez. Esto hace variar la probabilidad de
obtener una determinada muestra: La regla fundamental no es directamente
aplicable, pero el razonamiento de descomposición funciona como el caso anterior
dando el resultado”.
Michael J. (2004) “La distribución hipergeometrica se aplica en todo contexto
que implique un muestreo sin reposición de un conjunto finito de N, y cuando cada
elemento del conjunto tenga o no una determinada característica. Si se remplaza la
bola seleccionada antes de procesar la extracción de la siguiente bola, realizando un
muestreo con reposición, resulta evidente que el número de bolas obtenidas en n,
extracciones seguidas de una distribución binomial”.
Ejercicios
Si un experimento consiste en lanzar un dado y observar en número que
queda en la cara superior del mismo.
Ω = 1,2,3,4,5,6
E1 = Que salga el número 1 P(E1) =1
6
E2 = Que salga el número 2 P(E2) =1
6
E3 = Que salga un número par P(E3) =3
6=
1
2
Si un experimento consiste en lanzar tres monedas y observar que lados salen
23 = 8
Ω = (𝐶, 𝐶, 𝐶); (𝐶, 𝐶, 𝑆); (𝐶, 𝑆, 𝐶); (𝑆, 𝑆, 𝐶); (𝐶, 𝑆, 𝑆); (𝑆, 𝐶, 𝑆); (𝑆, 𝐶, 𝐶); (𝑆, 𝑆, 𝑆)
66
𝐸1 = 𝑄𝑢𝑒 𝑡𝑟𝑒𝑠 𝑚𝑜𝑛𝑒𝑑𝑎𝑠 𝑠𝑎𝑙𝑔𝑎𝑛 𝑐𝑎𝑟𝑎 𝑃(𝐸1) =1
8
𝐸2 = 𝑄𝑢𝑒 𝑠𝑎𝑙𝑔𝑎 𝑐𝑎𝑟𝑎 𝑝𝑜𝑟 𝑙𝑜 𝑚𝑒𝑛𝑜𝑠 𝑢𝑛𝑎 𝑚𝑜𝑛𝑒𝑑𝑎 𝑃(𝐸2) =7
8
𝐸3 = 𝑄𝑢𝑒 𝑠𝑎𝑙𝑔𝑎 𝑐𝑢𝑎𝑛𝑑𝑜 𝑚á𝑠 𝑒𝑛 𝑢𝑛𝑎 𝑚𝑜𝑛𝑒𝑑𝑎 𝑐𝑎𝑟𝑎 𝑃(𝐸3) =4
8=
1
2
Si un experimento consiste sacar 5 cartas de un mazo de 52 cartas.
𝐸1 = 𝑄𝑢𝑒 𝑠𝑎𝑙𝑔𝑎𝑛 4 𝑎𝑠𝑒𝑠
𝑃(𝐸1) =(
44) (
481 )
(525
) =
(4!
4! 0!) (48!
1! 47!)
(52!
5! 47!)
= 0,0000185
𝐸2 = 𝑄𝑢𝑒 𝑠𝑎𝑙𝑔𝑎𝑛 3 𝑎𝑠𝑒𝑠 𝑦 2 𝑗𝑜𝑡𝑎𝑠
𝑃(𝐸2) =(
43) (
42) (
440 )
(525
) =
(4!
3! 1!) (4!
2! 2!) (44!
0! 44!)
(52!
5! 47!)
= 0,00000923
𝐸3 = 𝑆𝑎𝑙𝑔𝑎𝑛 5 𝑐𝑎𝑟𝑡𝑎𝑠 𝑑𝑒 𝑐𝑜𝑟𝑎𝑧𝑜𝑛 𝑛𝑒𝑔𝑟𝑜
𝑃(𝐸3) =(
135
) (390 )
(525
) =
(13!
5! 8!) (
39!0! 39!)
(52!
5! 47!)
= 0,000495
Se tiene un grupo de 12 estudiantes de los cuales 5 son de la Espol, 4 de la
católica, y dos restantes de la UG. Se eligen al azar 4 estudiantes de este grupo.
𝐸1 = 𝑄𝑢𝑒 4 𝑠𝑒𝑎𝑛 𝑑𝑒 𝑙𝑎 𝐸𝑠𝑝𝑜𝑙
𝑃(𝐸1) =(
54) (
70)
(124 )
= (
5!4! 1!) (
7!0! 7!)
(12!
4! 8!) = 0,010
𝐸2 = 𝑄𝑢𝑒 4 𝑠𝑒𝑎𝑛 𝑈𝐺.
𝑃(𝐸2) = Ø
67
𝐸3 = 𝑄𝑢𝑒 𝑐𝑢𝑎𝑛𝑑𝑜 𝑚á𝑠 𝑠𝑒𝑎 3 𝑑𝑒 𝑙𝑎 𝐸𝑠𝑝𝑜𝑙
𝑃(𝐸3) = 1 − 𝑃(𝐸𝐶)
𝑃(𝐸𝐶) =(
54) (
70)
(124 )
= (
5!4! 1!) (
7!0! 7!)
(12!
4! 8!) = 0,01
𝑃(𝐸3) = 1-0.01 = 0,99
En un grupo de 15 personas: 7 leen la revista A; 5 leen la revista B y 6 ninguna
revista. Encuentre la probabilidad que al elegir al azar una persona, esta lea al
menos 1 revista.
Representación Gráfica
15 Personas
A 𝑨𝑪 TOTAL B 0.2 0.13 0.33
𝑩𝑪 0.27 0.4 0.67 TOTAL 0.47 0.53 1
Lean A 4 Lean B 2 Lean A y B 3 9 = P(E) = 0.6
68
Si la Probabilidad que Juan valla al estadio, al cine o a estudiar son
respectivamente, 0.3, 0.2, 0.4. ¿Cuál es la probabilidad de que no haya algunas
de estas 3 actividades?
P (AuBuC)𝐶 = (0.3 + 0.2 +0.4) =0.9
1-0.9 = 0.1
P(E)= 0.1
Ley De Complemento
Esta ley nos indica que parada conjunto sean estos A y B el complemento entre ellos
será lo que esta fuera de estos conjuntos es decir lo que esta fuera de nuestro espacio
muestral.
Vilma Morales, (2010) “Dado un evento A, el complemento de A se define como
el evento formado por todos los puntos muéstrales que no están en A. El
complemento de A se representa con AC, conocido con Diagrama de Venn que ilustra
el concepto de un complemento“.
Leonardo Mendoza , (2012) “Sea A un evento definido sobre el espacio
muestral (Ω, δ) y AC su complemento entonces la probabilidad de AC=1-P(A). “
Ramon Macias , (2008) “Otra propiedad que se deriva de las anteriores es
cuando se busca la probabilidad del complemento de un evento E, que denotaremos
como ~E: Si E es un evento y ~E su complemento, entonces P(~E) = 1 − P(E)“.
Ley Aditivo De Probabilidad
Cuando hablamos de adictivo nos referimos que un evento se adhiere a otro, pero
esto no quiere decir que los dos eventos pueden ser elegidos al mismo tiempo, aquí
podemos aplicar la suma de los eventos considerados en nuestro experimento.
Scientia & Technica (2009) “La ley aditiva de la probabilidad simplifican el
cálculo de probabilidades, la primera, denominada regla aditiva, se aplica a uniones
de 2 ó más eventos. La ley aditiva o regla de la suma para eventos mutuamente
excluyentes o desarticulados, es decir, que no pueden suceder al mismo tiempo y
69
que no tienen puntos en común, se aplica sumando las probabilidades de los eventos
considerados”.
Kolobar aritmetičnih, (2002)“Sean A y B dos eventos no excluyentes, X E
, para cualesquiera dos elementos x e y en el dominio. Así, por ejemplo, cualquier
transformación lineal es aditiva. Cuando el dominio son los números reales, esta
función corresponde a la ecuación funcional de Cauchy “.
Guillermo Mendoza, (2004) “Para dos eventos E y F, la suma E+F representa
la unión de E y F, y EF representa su intersección. Los eventos E y F son mutuamente
excluyentes si no se intersecan, es decir, si la ocurrencia de un evento prohíbe la
ocurrencia del otro”.
Probabilidad Condicional
Las variables de nuestro conjunto se encuentran condicionadas, porque nos hace
referir que para que suceda un evento en el segundo conjunto debemos saber que
paso en el conjunto anterior, no puede suceder nada en el segundo conjunto si es
que no ha pasado algo en el primero ya que están sujetos a condiciones de
anticipación de los eventos.
Montes. F, (2007) “La probabilidad condicional se refiere a que un evento B
ocurra, cuando ya se sabe que ha ocurrido un evento A, este se llama probabilidad
condicional y se denota por P(B/A). el símbolo que se denota por lo general y se lee
la probabilidad de que ocurra B dado que ocurrió A o simplemente la probabilidad
de B, dado A.”
Roberto Rodriguez, (2007) “No tiene por qué haber una relación causal o
temporal entre A y B. A puede preceder en el tiempo a B, sucederlo o pueden ocurrir
simultáneamente. A puede causar B, viceversa o pueden no tener relación causal.”
Gloria Rocío Bautista Mendoza, (2002) “La probabilidad de que un
evento B ocurra cuando se sabe que ya ocurrió un evento A se llama probabilidad
condicional y se denota por P(B/A) que por lo general se lee como probabilidad de
que "ocurra B dado que ocurrió A".
70
Ejercicio
Tenemos una encuesta de 120 personas las cuales se necesitan saber con
respeto a los hábitos de lectura
LE GUSTA LEER NO LE GUSTA LEER TOTAL
HOMBRE 40 20 60
MUJER 50 10 60
TOTAL 90 30 120
Se pide:
a) ¿Cuál es la probabilidad que sea mujer?
b) ¿Cuál es la probabilidad de que una persona elegida al azar le guste leer y
sea mujer?
c) ¿Cuál es la probabilidad que una persona elegida que le guste leer al azar
dado que es una mujer?
P (M) = 60
120= 0.5
P (L, M) = 50
120= 42
P (𝐿𝑀⁄ ) =
𝑃(𝐿∩𝑀)
𝑃(𝑀)=
0.42
0.5 = 0.84
En una empresa hay 200 empleados, de los cuales 150 son graduados. 60
empleados realizan trabajo de administración. De estos últimos, 40 son
graduados. Si se toma al azar un empleado, encuentre la probabilidad que:
a) Sea graduado y no realiza trabajo de administración.
b) Sea graduado dado que no realiza trabajo de administración.
c) No sea graduado dado que realiza trabajo de administración.
SON DE ADMINISTRACIÓN
NO SON DE ADMINISTRACIÓN
TOTAL
GRADUADO 40 110 150
NO GRADUADO 20 30 50
TOTAL 60 140 200
71
P (G∩NA) = 𝟏𝟏𝟎
𝟐𝟎𝟎= 𝟎. 𝟓𝟓
P (𝑮𝑵𝑨⁄ ) =
𝟎.𝟓𝟓
𝟎.𝟕𝟎= 𝟎. 𝟕𝟗 ; 𝐏 (𝐍𝐀) =
𝟏𝟒𝟎
𝟐𝟎𝟎= 𝟎. 𝟕
P (𝑵𝑮𝑨⁄ ) =
𝟎.𝟏
𝟎.𝟑= 𝟎. 𝟑𝟑 ; 𝐏 (𝐍𝐀 ∩ 𝐀) =
𝟐𝟎
𝟐𝟎𝟎= 𝟎. 𝟏 ; 𝐏 (𝐀) =
𝟔𝟎
𝟐𝟎𝟎= 𝟎. 𝟑
Eventos Independientes
Un evento es independiente de otro, ya que en cada experimento no se dependerá
de que suceda del otro así que se puede realizar un número indeterminado de
experimentos y cada uno de ellos sus valores o sucesos dependerán de ellos mismos.
Clara Merchan, (2009) “Los eventos independientes pueden incluir la
repetición de una acción como lanzar un dado más de una vez, o usar dos
elementos aleatorios diferentes, como lanzar una moneda y girar una ruleta.
Muchas otras situaciones también pueden incluir eventos independientes. Para
calcular correctamente las probabilidades, necesitamos saber si un evento influye
en el resultado de otros eventos”.
Alexis Requena, (2007) “Dos o más eventos son independientes cuando la
ocurrencia o no-ocurrencia de un evento no tiene efecto sobre la probabilidad de
ocurrencia del otro evento (o eventos). Un caso típico de eventos independiente es
el muestreo con reposición, es decir, una vez tomada la muestra se regresa de nuevo
a la población donde se obtuvo”.
Alejandro Neira, (2009)“Dos eventos son independientes si el resultado del
segundo evento no es afectado por el resultado del primer evento. Si A y B son
eventos independientes, la probabilidad de que ambos eventos ocurran es el
producto de las probabilidades de los eventos individuales”.
Sistemas Exhaustos Y Excluyentes
Se considera a estos eventos la unión de varios eventos anteriormente planteados,
a los cuales la unión de todos ellos nos dará como resultado el espacio muestral, que
se necesitaran para realizar un experimento más detallado y con mayor
profundidad.
72
M.C. Guardado France, (2014)“Los teoremas que restan nos dicen como calcular las
probabilidades de sucesos cuando tenemos que el suceso seguro está descompuesto
en una serie de sucesos incompatibles de los que conocemos su probabilidad. Para
ello necesitamos introducir un nuevo concepto”.
Santiago Montesdeoca, (2001)“Se trata de una colección de sucesos A1, A2, A3, A4 ….
Tales que la unión de todos ellos forman el espacio muestral, y sus intersecciones
son disjuntas. Todo suceso B, puede ser descompuesto en componentes de dicho
sistema”.
Eduardo Véliz, (2004)“Eventos independientes son aquellos que no afectan en el
resultado del otro. Cumplen la propiedad: P(AB) = P(A)P(B)”.
Ejercicios
En una fábrica se tiene 4 líneas de producción, la línea 1 produce el 40% de los
artículos, la line 2 el 25% y la línea 3 el 15%. Se sabe que la probabilidad de
que un artículo producido en la línea 1 presenta defecto es de 0.02; las
probabilidades de que los artículos presentan defectos cuando fueron
producidos en las líneas 2,3 o 4 son 0.04; 0.08; 0.05 respectivamente.
¿Cuál es la probabilidad de que un artículo elegido al azar presente defectos?
𝐸1 = 0.4
𝐸2 = 0.25
𝐸3 = 0.15
L1
40%
L2
25%
L3 25%
L4 20%
73
𝐸4 = 0.2
A= Artículos Aprobados
P(𝐴𝐸1
⁄ ) = 0.02
P(𝐴𝐸2
⁄ ) = 0.04
P(𝐴𝐸3
⁄ ) = 0.08
P(𝐴𝐸4
⁄ ) = 0.05
P (A) = P(𝐸1 ) 𝑥 P (𝐴𝐸1
⁄ ) + P(𝐸2 ) 𝑥 P (𝐴𝐸2
⁄ ) + P(𝐸3 ) 𝑥 P (𝐴𝐸3
⁄ ) +
P(𝐸4 ) 𝑥 P (𝐴𝐸4
⁄ )
P (A) = 0.4 x 0.02 + 0.25 x 0.04 + 0.15 x 0.08 + 0.2 x 0.05
P (A) = 0.04
Si el artículo elegido presenta efectos ¿Cuál es la probabilidad que se haya
producido en la línea 3?
P(𝐸3
𝐴⁄ ) =𝑃(𝐴∩𝐸3)
𝑃 (𝐴)
P(𝐴 ∩ 𝐸3) = (0.15 𝑥 0.08)
P(𝐸3
𝐴⁄ ) =0.012
0.04= 0.3
En una fábrica se tiene 4 líneas de producción, la línea 1 produce el 40% de los
artículos, la line 2 el 25% y la línea 3 el 15%. Se sabe que la probabilidad de
que un artículo producido en la línea 1 presenta defecto es de 0.02; las
probabilidades de que los artículos presentan defectos cuando fueron
producidos en las líneas 2,3 o 4 son 0.04; 0.08; 0.05 respectivamente.
¿Cuál es la probabilidad de que un artículo elegido al azar presente defectos?
74
𝐸1 = 0.4
𝐸2 = 0.25
𝐸3 = 0.15
𝐸4 = 0.2
A= Artículos Aprobados
P(𝐴𝐸1
⁄ ) = 0.02
P(𝐴𝐸2
⁄ ) = 0.04
P(𝐴𝐸3
⁄ ) = 0.08
P(𝐴𝐸4
⁄ ) = 0.05
P (A) = P(𝐸1 ) 𝑥 P (𝐴𝐸1
⁄ ) + P(𝐸2 ) 𝑥 P (𝐴𝐸2
⁄ ) + P(𝐸3 ) 𝑥 P (𝐴𝐸3
⁄ ) +
P(𝐸4 ) 𝑥 P (𝐴𝐸4
⁄ )
P (A) = 0.4 x 0.02 + 0.25 x 0.04 + 0.15 x 0.08 + 0.2 x 0.05
P (A) = 0.04
Si el artículo elegido presenta efectos ¿Cuál es la probabilidad que se haya
producido en la línea 3?
P(𝐸3
𝐴⁄ ) =𝑃(𝐴∩𝐸3)
𝑃 (𝐴)
75
P(𝐴 ∩ 𝐸3) = (0.15 𝑥 0.08)
P(𝐸3
𝐴⁄ ) =0.012
0.04= 0.3
En un a aula el 70 % de los alumnos son mujeres. De ellas el 10 % son
fumadoras. De los varones, son fumadores el 20 %. ¿Qué porcentaje de
fumadores hay en total?
Mujeres = 0.7
Hombres = 0.3
P(𝐹𝑀⁄ ) = 0.1
P(𝐹𝐻⁄ ) = 0.2
P (F) = P(𝑀 ) 𝑥 P(𝐹𝑀⁄ ) + P(𝐻 ) 𝑥 P(𝐹
𝐻⁄ )
P (F) = 0.7 x 0.1 + 0,3 x 0.2
P (F) = 0.13
76
Sucesos
Sucesos son considerados como las posibles relaciones que podemos establecer
entre las mismas, estos sucesos pueden contener una infinidad de sucesos ligados a
un suceso principal como también no se puede encontrar ningún suceso en el miso.
Alejandro Sanchez , (2002) “Al definir los sucesos hablamos de las diferentes
relaciones que pueden guardar dos sucesos entre sí, así como de las posibles
relaciones que se pueden establecer entre los mismos. Vamos a ver ahora cómo se
refleja esto en el cálculo de probabilidades”.
Juan Miguel Marín Diazaraque, (2014) “Por supuesto los sucesos son más
generales que los elementales, ya que son conjuntos que pueden contener no a uno
sólo, sino a una infinidad de sucesos elementales (y también no contener ninguno)”.
Jorge Rendon Aviles , (1999) “Suceso de un fenómeno o experimento
aleatorio es cada uno de los subconjuntos del espacio muestral E. Todos estos
subconjuntos del espacio muestral E los llamamos sucesos”.
Eventos Mutuamente Excluyentes
Para este tipo de eventos son podemos referir que son excluyentes, porque al
realizar un experimento tenemos las posibilidades de que una opción salga y la otra
no, ya que no se puede representar las dos opciones al mismo tiempo es la una o es
la otra, pero no las dos.
Obagi. J, (2003) “La unión de eventos cualquiera puede expresar como la unión
de varios eventos mutuamente excluyentes, basándose en su repaso de la teoría de
conjuntos que compruebe la anterior afirmación”.
Richard I. Levin, David S. Rubin (2004) ”Se dice que los eventos son
mutuamente excluyente si uno de ellos puede tener lugar a un tiempo, que de una
manera parecida, usted puede pasar o reprobar una materia antes de que termine
el curso o desertar y no obtener calificaciones".
77
David M. Mark, L. Berenson, C .(2004) ”Son eventos excluyente al tirar una
moneda al aire, y pedir cara o cruz, el resultado no puede ser al mismo tiempo los
dos solo uno”.
Teorema De Bayes
Con bayes podemos deducir la probabilidad de que un suceso ocurra, porque
utilizamos probabilidades que anteriormente fueron analizadas con un suceso
inicial, solo cuando intervienen sucesos adicionales se deberá volver a realizar
cálculos en dicha probabilidad.
MC. Rita Luna Gandara, (2003)“A partir de que ha ocurrido el suceso B (ha
ocurrido un accidente) deducimos las probabilidades del suceso A (¿estaba
lloviendo o hacía buen tiempo?). El teorema de Bayes parte de una situación en la
que es posible conocer las probabilidades de que ocurran una serie de sucesos Ai”.
Mario Orlando Suárez Ibujes, (2005)“El teorema de Bayes se utiliza para
revisar probabilidades previamente calculadas cuando se posee nueva información.
Desarrollado por el reverendo Thomas Bayes en el siglo XVII, el teorema de Bayes
es una extensión de lo que ha aprendido hasta ahora acerca de la probabilidad
condicional.
Comúnmente se inicia un análisis de probabilidades con una asignación inicial,
probabilidad a priori. Cuando se tiene alguna información adicional se procede a
calcular las probabilidades revisadas o a posteriori”.
Eliseo Martínez H, (2003) “Supongamos que para un todo el posible resultado
de un fenómeno aleatorio, existen dos escenarios que son antagónicos y
complementarios. Es decir que puede ocurrir el escenario A, o el escenario
complementario Å, donde la unión de ambos cubre todos los posibles resultados.
Para ambos escenarios, tenemos definida una probabilidad, a saber, P(A) y P(Å)”.
78
Variables Aleatorias
Este tipo de variables toman valores ya sean reales como no reales y sirven para
medir algún experimento de forma aleatoria es decir sin importar el orden de la
muestra.
Peña Sánchez de Rivera, (2008) “Las variables aleatorias suelen tomar
valores reales, pero se pueden considerar valores aleatorios como valores lógicos,
funciones... El término elemento aleatorio se utiliza para englobar todo ese tipo de
conceptos relacionados. Un concepto relacionado es el de proceso estocástico, un
conjunto de variables aleatorias ordenadas (habitualmente por orden o tiempo)”.
Eduardo Manrique, (2011) “En probabilidad y estadística, una variable
aleatoria o variable estocástica es una variable estadística cuyos valores se obtienen
de mediciones en algún tipo de experimento aleatorio. Formalmente, una variable
aleatoria es una función, que asigna eventos a números reales”.
Estadística y Variables Aleatorias, (2006) “Una variable aleatoria es una
variable que toma valores numéricos determinados por el resultado de un
experimento aleatorio. No hay que confundir la variable aleatoria con sus posibles
valores”.
Distribución de una Variable Discreta
Este tipo de variables pueden medir sucesos concretos en los cuales el número de
veces que se repite dicho suceso tiene un valor significativo a la hora de hacer
nuestra representación experimental.
Héctor Chávez Velarde, (2001) “Diremos que una variable aleatoria es
discreta si su recorrido es finito o infinito numerable. Generalmente, este tipo de
variables van asociadas a experimentos en los cuales se cuenta el número de veces
que se ha presentado un suceso o donde el resultado es una puntuación concreta”.
Martínez Gómez, Mónica, (2004) “Se dice que hemos definido una variable
aleatoria para un experimento aleatoria cuando hemos asociado un valor numérico
a cada resultado del experimento. Existen varios tipos de variables aleatorias, una
variable aleatoria es discreta cuando solo puede tomar unos ciertos valores enteros
en un numero finito de valores o infinito numerable”.
79
Montero Alonso, (2004) “Es un modelo teórico que describe la forma en que
varían los resultados de un experimento aleatorio, es decir, nos da todas las
probabilidades de todos los posibles resultados que podrían obtenerse cuando se
realiza un experimento aleatorio. Se clasifican como discretas o continuas”.
Ejercicio
En un lote de 5 artículos, 3 son defectuosos y 2 son aceptables. Se toma una
muestra aleatoria sin remplazo de dos artículos. Encuentre la distribución de
la variable aleatoria, calidad de productos defectuosos que se obtiene en la
muestra.
Ω = a, b, c, d, e
a, b, c = artículos defectuosos.
d, e = artículo no defectuoso.
Ω = (a,b);(a,c);(a,d);(a,e);(b,c);(b,d);(b,e);(c,d);(c,e);(d,e)
ℓ (Valor Ω) x (Valor X) (a, b) (a, c) (a, d) (a, e) (a, c) (b, d) (b, e) (c, d) (c, e) (d, e)
2 2 1 1 2 1 1 1 1 0
X = Cantidad de artículos defectuosos.
P (X=0) + P(X=1) + P(X=2)
F(x) = Σ P(X=x) = 1
10+
6
10+
3
10= 1
P (X = 0) = 1
10
P (X = 1) = 6
10
P (X = 2) = 3
10
80
Regla De Correspondencia
Mide el proceso de vinculación que tiene el conjunto A con respecto al conjunto B,
esto quiere decir que para cada valor del elemento A existe un único valor en el
conjunto B no puede existir repetición en dichos sucesos.
Josseline Cardenas M, (2004) “Es el proceso que vincula a cada elemento de
un conjunto determinado con otro elemento único de otro conjunto determinado…
Donde dichos conjuntos pueden ser el de una función”.
Carloss Idrovo Alvarez, (2000)“Una regla de correspondencia consiste
en asignar un elemento único de un cierto conjunto a cada elemento único de
otro conjunto. Este concepto es de uso frecuente cuando se trabaja con funciones
matemáticas”.
Nayelli Manzanarez Gómez, (2009) “El Análisis de Correspondencias es una
técnica estadística que se utiliza para analizar, desde un punto de vista gráfico, las
relaciones de dependencia e independencia de un conjunto de variables categóricas
a partir de los datos de una tabla de contingencia”.
Función Acumulada
Esta distribución mide el grado de distribución que tiene un variable aleatoria
cualquiera, dando como resultado que solo puede tomar valores entre 0 y 1, estos
valores son fijos no puede tomar más de dicho valor.
Cecilia Rosas, (2009) “La función de distribución acumulada Fx de una V.A. X es
definida para cada número real x, La función de distribución acumulada únicamente
puede tomar valores entre cero y uno”.
Gutiérrez Martínez, (2004) “La función de distribución acumulada describe
el comportamiento probabilístico de una variable aleatoria X asociada a un
experimento aleatorio y se representan, Para estudiar la función de distribución
distinguiremos entre el caso discreto y el caso continuo”.
Gonzales Chávez, (2007) “Una función que ofrece la probabilidad total de
obtener un resultado de una variable aleatoria que varía desde el valor más bajo
posible para la variable aleatoria hasta cualquier valor específico de interés”.
81
Valores Esperados
Es valor que nos proporciona la realización de un experimento el cual será el
deseado y en el cual muchos profesionales se basan para tomar decisiones a la hora
de implementar un nuevo experimento.
Ángel Merizalde, (2012) “El valor esperado es un concepto fundamental en el
estudio de las distribuciones de probabilidad. Desde hace muchos años este
concepto ha sido Aplicado ampliamente en el negocio de seguros y en los últimos
veinte años ha Sido aplicado por otros profesionales que casi siempre toman
decisiones en Condiciones de incertidumbre”.
Blatt Frank J, (1992) “El valor que se espera obtener de un experimento
estadístico se llama el valor esperado. También llamado "esperanza matemática".
También lo llamamos "media" y esta es la palabra que vamos a seguir usando”.
Young Hugh D., (1968) “Cuando la variable aleatoria es discreta, la esperanza
es igual a la suma de la probabilidad de cada posible suceso aleatorio multiplicado
por el valor de dicho suceso. Por lo tanto, representa la cantidad media que se
"espera" como resultado de un experimento aleatorio cuando la probabilidad de
cada suceso se mantiene constante y el experimento se repite un elevado número de
veces.”
Varianza
Es una medida de dispersión con la cual se puede determinar el grado de cambio
que tendrá la muestra o el estudio estadístico y su valor se expresa elevado al
cuadrado.
Fisher R. A., (1919) “Está medida en unidades distintas de las de la variable. Por
ejemplo, si la variable mide una distancia en metros, la varianza se expresa en
metros al cuadrado. La desviación estándar es la raíz cuadrada de la varianza, es una
medida de dispersión alternativa expresada en las mismas unidades de los datos de
la variable objeto de estudio.
Ricard Boqué, Alicia Maroto, (1998) “Es una potente herramienta
estadística, de gran utilidad tanto en la industria, para el control de procesos, como
en el laboratorio de análisis, para el control de métodos analíticos.”
82
Milena Delgado, (1999) “La varianza puede interpretarse como un momento
de la distribución de probabilidad. La varianza de una variable aleatoria discreta”-
Experimento Binomial
Es la que se puede expresar matemáticamente que se utiliza en conjunto con la
variable aleatoria discreta cuando el número de resultados positivos de la muestra
es factible.
Moreno, Francis, (1993) “Cuando se dispone de una expresión matemática, es
factible calcular la probabilidad de ocurrencia exacta correspondiente a cualquier
resultado específico para la variable aleatoria. La distribución de probabilidad
binomial es uno de los modelos matemáticos (expresión matemática para
representar una variable) que se utiliza cuando la variable aleatoria discreta es el
número de éxitos en una muestra compuesta por n observaciones”.
Pablo Antonio Martín Álvarez, (2001) “Llamamos experiencia aleatoria
dicotómica a aquella que sólo puede tener dos posibles resultados A y A'.
Usualmente A recibe el nombre de éxito, además representaremos como p = p(A) y
q = 1-p=p(A')”.
Hamza K., (1995) “La distribución binomial es una distribución de
probabilidad discreta que cuenta el número de éxitos en una secuencia de n ensayos
de Bernoulli independientes entre sí, con una probabilidad fija p de ocurrencia del
éxito entre los ensayos. Un experimento de Bernoulli se caracteriza por ser
dicotómico, esto es, sólo son posibles dos resultados. A uno de estos se denomina
éxito y tiene una probabilidad de ocurrencia p y al otro, fracaso, con una
probabilidad q = 1 - p”.
Se sabe que la probabilidad de un artículo producido no cumple las
especificaciones es de 0.04, se observa 15 artes elegidos al azar.
¿Cuál es la probabilidad de que 3 de ellos, no cumplan las
especificaciones?
La probabilidad de que por lo menos 2 nos cumplen las especificaciones.
n= 15
83
q = 1-0.04 = 0.96
p=0.04
X= Tres nos cumplen con las especificaciones
P(X=3) = (𝟏𝟓𝟑
) 𝒑𝟑 𝒒𝟏𝟐
𝟏𝟓!
𝟑! (𝟏𝟓 − 𝟑)! (𝟎. 𝟎𝟒)𝟑 (𝟎. 𝟗𝟔)𝟏𝟐 = 𝟎. 𝟎𝟐
P (X ≥ 2) = 1-P (X<2)
1-P (X =0) + P(X<1)
P(X=0) = (𝟏𝟓𝟎
) (𝟎. 𝟎𝟒)𝟎 (𝟎. 𝟗𝟔)𝟏𝟓 = 𝟎. 𝟓𝟒𝟐𝟏
P(X=1) = (𝟏𝟓𝟏
) (𝟎. 𝟎𝟒)𝟏 (𝟎. 𝟗𝟔)𝟏𝟒 = 𝟎. 𝟑𝟑𝟖𝟖
Distribución Binomial Negativa
Es considera también distribución geométrica de la distribución binominal negativa,
donde se realizan repetidamente procesos experimentales en los cuales hemos
tenido un resultado desfavorable al requerido, también se dice que se realiza
independientemente cada experimento porque el uno no tiene nada que ver con el
otro.
White Harvey E, (1972) “Esta distribución puede considerarse como una
extensión o ampliación de la distribución geométrica. La distribución binomial
negativa es un modelo adecuado para tratar aquellos procesos en los que se repite
un determinado ensayo o prueba hasta conseguir un número determinado de
resultados favorables.”
Young Hugh D, (1968) “La distribución binomial negativa o distribución de
Pascal es una generalización de la distribución geométrica donde la variable
aleatoria X es el número de ensayos Bernoulli efectuados hasta que se tienen r
éxitos, con una probabilidad constante de éxito p”.
Weinberg Steven, (1977) “Se determina la definición de distribución binomial
negativa como extensión de la distribución geométrica, en donde se analizan varios
eventos antes de lograr un número determinado de éxitos”.
84
Ejercicios
La probabilidad de que un equipo funcione correctamente es de 0.97, se
prueban equipos hasta encontrar 3 que funcionen correctamente. ¿Cuál es la
probabilidad de que se necesiten 8 pruebas para lograr el objetivo?
P (X=8) = (8−33−1
) (0.97)3 (0.03)5
(7
2) (0.97)3 (0.03)5
7!
2! 5! (0.97)3 (0.03)5 = 0.0000004657
Distribución Geométrica
Podremos considerar que con esta distribución podemos realizar un experimento a
la vez, esto quiere decir que cada vez que realicemos un experimento y obtengamos
un resultado, al querer realizar otra vez el mismo proceso esta distribución no
guardara el resultado quiere decir que cada proceso será como uno nuevo con
respecto al primero también se la conoce como la distribución sin memoria.
Alonso. J, (2008) “la distribución geométrica es “sin memoria”. Esto significa que
si intentamos repetir el experimento hasta el primer éxito, entonces dado el primer
éxito todavía no ha ocurrido, la distribución de probabilidad condicional del número
de ensayo adicionales no dependen de cuantos fallos se hallan observado”.
ADS Quality, (2003) “también llamada distribución de pascal. Distribución de
probabilidad de una variable aleatoria definida, en el marco del proceso de
Bernouilli, como el número de unidades de un tipo que aparecen en un muestreo
antes de que aparezca la primera del otro tipo”.
Sánchez. P, (2006) “Supongamos u experimento aleatorio y consideremos en
relación con el suceso A de probabilidad p y sea Á el suceso contrario, cuya
probabilidad será q=1-p. se dice que obtener el suceso A se considera como un éxito,
y caso contrario, un fracaso”.
85
Ejercicio
Se sabe que la probabilidad de un artículo que falle durante un año de uso es
de 0.1, determine:
a) La probabilidad de que el séptimo articulo observado sea el segundo
que falle durante el primer año.
p= 0.1
q= (1- 0.1) = 0.9
r=2
x=7
X=que es séptimo articulo observado sea el segundo que falle durante el año.
P(X=7) = (7−12−1
) (0.1)2 (0.9)5 = 0.0354
b) Si se observa 10 de estos artículos elegido al azar ¿Cuál es la
probabilidad de que 4 fallan durante el primer año de uso?
n= 10
p=0.1
q=1-0.1=0.9
X= La probabilidad de que 4 fallen en el primer año de uso
X=4
P (X=4) = (104
) (0.1)4 (0.9)6 = 0.0112
Distribución Hipergeometrica
Este tipo de distribuciones se utilizan cuando el tamaño de experimento a realizar
supera en gran cantidad a cualquier otra, es primordial utilizarla solo en grandes
extensiones de información.
86
Griful. E, Canela, M. (2010) ”A la vista de los cálculos. El procedimiento
correcto en estos casos se utiliza la distribución hipergeometrica puesto que el
tamaño de lote es suficientemente grande”.
Prat, A (2005) ”La distribución de probabilidad de un modelo probabilístico
conocido como modelo hipergeometrica ya que muestra como las situaciones se
adapta conceptualmente es decir, que sería correcto basarnos en dicho modelo para
hacer las inferencias necesarias en los tres casos descritos”.
Mode, E. (1990) ”Supongamos que tenemos un universo finito de N objetos, cada
uno de los cuales pertenece a una de dos categorías mutuamente excluyentes,
llamadas “éxitos” y “fracasos”, y simbolizadas por 1 y 0, respectivamente
Supongamos que tenemos Np unos y Nq ceros con p+q=1”.
Ejercicio
Se tiene un grupo de 20 estudiante, 8 de los cuales son de la Universidad de
Guayaquil ¿Cuál es la probabilidad de que al dividir 4 estudiantes al azar sean
de la universidad de Guayaquil?
N= 20
a=8
n=4
X= 3 sean de la universidad de Guayaquil
X=3
P (X=3) = (8
3) (20−84−3 )
(204 )
= (8
3)(121 )
(204 )
(8!
3! 5!)(
12!
1! 19!)
(20!
4! 16!)
= 0.14
Función De Densidad Para Continuas
Este tipo de funciones pueden tomar valores infinitos, motivo por el cual pueden ser
representadas como curva por su grado de dificultad que puede tomar su cálculo al
tomar valores tan extensos.
87
Meza, J. (2010)”A diferencia de las variables aleatorias discretas, las variables
aleatorias continuas pueden adoptar infinitos valores en un intervalo. Esto complica
algo la matemática necesaria, pero por que no necesitaremos utilizar esta
matemática. La función de densidad de probabilidad de una variable aleatoria
continua puede representarse gráficamente mediante una curva”.
Delgado, R. (2007) “La función F recibe el nombre de función de densidad de la v.a.
X y juega un papel análogo para el caso continuo, al de la función de probabilidad del
caso discreto”.
Población, F. Serna, G. (2015) “A pesar de que las distribuciones discretas tienen la
función de probabilidad y las distribuciones continuas tienen la función de densidad
de probabilidad, ambas tienen características común a través de la función de
distribución (F)”.
Ejercicio realizado en clase
Supongamos que el tiempo de en años de vida de cierto equipo puede ser
modelado como una variable aleatoria simple:
a) Determine el valor de K para que la función sea de densidad
F(x)𝑲𝒙𝟐 ; 𝟎 ≤ 𝒙 ≤ 𝟐
𝟎 ; 𝒔𝒊 𝒏𝒐
∫ 𝑭 (𝒙)𝒅𝒙 = 𝟏+∞
−∞
∫ 𝑲𝒙𝟐 𝒅𝒙 = 𝟏𝟐
𝟎
𝑲𝒙𝟑
𝟑 |
𝟐𝟎
= 𝟏
𝑲𝟖
𝟑 = 𝟏
𝑲 =𝟑
𝟖
b) ¿Cuál es la probabilidad de que el equipo funcione por menos de un
año?
88
P (𝟎 ≤ 𝒙 ≤ 𝟏) = ∫ 𝑭 (𝒙)𝒅𝒙𝟏
𝟎
∫ 𝟑
𝟖 𝒙𝟐 𝒅𝒙
𝟏
𝟎
= 𝟑
𝟖 𝒙𝟑
𝟑 |
𝟏𝟎
= 𝟏
𝟖
c) Determine la probabilidad de que un equipo funcione entre año y
medio año
P (𝟏
𝟐≤ 𝒙 ≤
𝟑
𝟐) = ∫
𝟑
𝟖 𝒙𝟐 𝒅𝒙
𝟑
𝟐𝟏
𝟐
= 𝟑
𝟖 𝒙𝟑
𝟑 |
𝟑𝟐⁄
𝟏𝟐⁄
= 𝟎. 𝟒𝟏
d) ¿Cuál es la probabilidad de que un equipo funcione por lo menos
año y medio?
P (𝟑
𝟐≤ 𝒙 ≤ 𝟐) = ∫
𝟑
𝟖 𝒙𝟐 𝒅𝒙
𝟐𝟑
𝟐
= 𝟑
𝟖 𝒙𝟑
𝟑 |
𝟐𝟑
𝟐⁄ = 𝟎. 𝟓𝟕
e) Determine la distribución acumulada del trabajo de vida del equipo
𝑭(𝒙) = ∫ 𝟑
𝟖
𝒙
𝟎
𝒕 𝟐 𝒅𝒕
𝑭(𝒙) =𝟑
𝟖 𝒕𝟑
𝟑 |
𝒙𝟎
= 𝟏
𝟖[𝒙𝟑]
𝑭(𝒙) = 𝟏
𝟖𝒙𝟑
f) Determine el promedio del tiempo que forman los componentes y la
varianza
E(x) = ∫ 𝒙 (𝟑
𝟖𝒙 𝟐)
𝟐
𝟎 𝒅𝒙
∫ 𝒙 (𝟑
𝟖𝒙 𝟑)
𝟐
𝟎 𝒅𝒙 =
𝟑
𝟖 𝒙𝟒
𝟒 |
𝟐𝟎
= 𝟑
𝟐 = 𝒖
𝛅𝟐 = 𝑬[𝒙 𝟐] − (𝟑
𝟐)
𝟐
𝑬(𝒙 𝟐) = ∫ 𝒙 𝟐 (𝟑
𝟖𝒙 𝟐)
𝟐
𝟎
𝒅𝒙
𝟑
𝟖 𝒙𝟓
𝟓 |
𝟐𝟎
= 𝟑
𝟒𝟎[𝟑𝟐] =
𝟏𝟐
𝟓
89
𝛅𝟐 = 𝟏𝟐
𝟓− (
𝟑
𝟐)
𝟐
𝛅𝟐 = 𝟎. 𝟏𝟓
Distribución Uniforme Continuas
Esta distribución puede tratar tanto con variables discretas y continuas, no existe
ningún inconveniente que le impida hacerlo esto quiere decir que las
representaciones de los sucesos serán constantes.
Mateo Santiago Encalada, (2004) “La distribución o modelo uniforme puede
considerarse como proveniente de un proceso de extracción aleatoria. El
planteamiento radica en el hecho de que la probabilidad se distribuye
uniformemente a lo largo de un intervalo”.
Redondo, A. Francisco, L. (2002) ”Lo que caracteriza a las distribuciones
uniformes, tanto si trata de variables discretas o continuas, es la constancia en la
probabilidad de presentación de los sucesos. En el caso de un dado, la probabilidad
de obtener cualquier resultado es, constamente 1/6”.
Rius, F. Warnberg, J. (2014) ”Se dice que v.a. X posee una distribución
uniforme en el intervalo [a, b] X- U (a, b) la probabilidad de que al hacer un
experimento aleatorio, el valor X este comprendido en cierto subintervalo de [a,b]
depende únicamente de la longitud del mismo, no de su posición”.
90
Bibliografía
William Mendehall, Robert Beaver, Barbara Beaver (2006). La estadística en Introducción a la
probabilidad y estadística. (Pág. 3). Mexico DF, Mexico: Cengage Learning.
William Mendehall, Robert Beaver, Barbara Beaver (2006). Estadística inferencial en
Introducción a la probabilidad y estadística. (Pág. 4). México DF, México: Cengage Learning.
William Mendehall, Robert Beaver, Barbara Beaver (2006). Estadística descriptiva en
Introducción a la probabilidad y estadística. (Pág. 4). México DF, México: Cengage Learning.
William Mendehall, Robert Beaver, Barbara Beaver (2006). Población objetiva en Introducción a
la probabilidad y estadística. (Pág. 8). México DF, México: Cengage Learning.
William Mendehall, Robert Beaver, Barbara Beaver (2006). Unidades de investigación en
Introducción a la probabilidad y estadística. (Pág. 8). Mexico DF, Mexico: Cengage Learning.
William Mendehall, Robert Beaver, Barbara Beaver (2006). Muestra en Introducción a la
probabilidad y estadística. (Pág. 8). Mexico DF, Mexico: Cengage Learning.
William Mendehall, Robert Beaver, Barbara Beaver (2006). Parámetro en Introducción a la
probabilidad y estadística. (Pág. 53). Mexico DF, Mexico: Cengage Learning.
William Mendehall, Robert Beaver, Bárbara Beaver (2006). Estadísticas en Introducción a la
probabilidad y estadística. (Pág. 53). México DF, México: Cengage Learning.
William Mendehall, Robert Beaver, Bárbara Beaver (2006). Variables cualitativas en
Introducción a la probabilidad y estadística. (Pág. 10). México DF, México: Cengage Learning.
William Mendehall, Robert Beaver, Barbara Beaver (2006). Variables cuantitativas en
Introducción a la probabilidad y estadística. (Pág. 10). México DF, México: Cengage Learning.
William Mendehall, Robert Beaver, Barbara Beaver (2006). Análisis univariado en Introducción
a la probabilidad y estadística. (Pág. 9). Mexico DF, Mexico: Cengage Learning.
William Mendehall, Robert Beaver, Barbara Beaver (2006). Histograma de frecuencia relativa en
Introducción a la probabilidad y estadística. (Pág. 25). Mexico DF, Mexico: Cengage Learning.
William Mendehall, Robert Beaver, Barbara Beaver (2006). Media en Introducción a la
probabilidad y estadística. (Pág. 54). Mexico DF, Mexico: Cengage Learning.
William Mendehall, Robert Beaver, Barbara Beaver (2006). Moda en Introducción a la
probabilidad y estadística. (Pág. 55). Mexico DF, Mexico: Cengage Learning.
William Mendehall, Robert Beaver, Barbara Beaver (2006). Mediana en Introducción a la
probabilidad y estadística. (Pág. 55). Mexico DF, Mexico: Cengage Learning.
William Mendehall, Robert Beaver, Barbara Beaver (2006). Varianza en Introducción a la
probabilidad y estadística. (Pág. 62). Mexico DF, Mexico: Cengage Learning.
William Mendehall, Robert Beaver, Barbara Beaver (2006). Percentiles en Introducción a la
probabilidad y estadística. (Pág. 77). Mexico DF, Mexico: Cengage Learning.
91
William Mendehall, Robert Beaver, Barbara Beaver (2006). Cuartiles en Introducción a la
probabilidad y estadística. (Pág. 78). Mexico DF, Mexico: Cengage Learning.
William Mendehall, Robert Beaver, Barbara Beaver (2006). Variables cuantitativas en
Introducción a la probabilidad y estadística. (Pág. 10). México DF, México: Cengage Learning.
Luis Rodríguez Ojeda, Msc (2007). Marca de clase en Probabilidad y estadística básica para
ingenieros. (Pág. 13). Guayaquil, Ecuador: ESPOL – ICM.
Luis Rodríguez Ojeda, Msc (2007). Polígono en Probabilidad y estadística básica para ingenieros.
(Pág. 18). Guayaquil, Ecuador: ESPOL – ICM.
Luis Rodríguez Ojeda, Msc (2007). Ojiva en Probabilidad y estadística básica para ingenieros.
(Pág. 18). Guayaquil, Ecuador: ESPOL – ICM.
Luis Rodríguez Ojeda, Msc (2007). Coeficiente de variación en Probabilidad y estadística básica
para ingenieros. (Pág. 25). Guayaquil, Ecuador: ESPOL – ICM.
Luis Rodríguez Ojeda, Msc (2007). Decires en Probabilidad y estadística básica para ingenieros.
(Pág. 25). Guayaquil, Ecuador: ESPOL – ICM.
Luis Rodríguez Ojeda, Msc (2007). Cantiles en Probabilidad y estadística básica para ingenieros.
(Pág. 24). Guayaquil, Ecuador: ESPOL – ICM.
Luis Rodríguez Ojeda, Msc (2007). Diagrama de caja en Probabilidad y estadística básica para
ingenieros. (Pág. 31). Guayaquil, Ecuador: ESPOL – ICM.
Fernando Quevedo Ricardi (2010). Observación en Estadística aplicada a la investigación en
salud. (Pág. 1). Chile: Medwave
Fernando Quevedo Ricardi (2010). Variables cualitativas nominales en Estadística aplicada a la
investigación en salud. (Pág. 2). Chile: Medwave
Fernando Quevedo Ricardi (2010). Variables cualitativas ordinales en Estadística aplicada a la
investigación en salud. (Pág. 2). Chile: Medwave
Fernando Quevedo Ricardi (2010). Variables cuantitativas discretas en Estadística aplicada a la
investigación en salud. (Pág. 2). Chile: Medwave
Fernando Quevedo Ricardi (2010). Variables cuantitativas continúas en Estadística aplicada a la
investigación en salud. (Pág. 2). Chile: Medwave
(s.f.). Alejandro Neira . (2009). Probabilidades Para Universitarios. Bogota: NORIEGA.
Alejandro Sanchez . (2002). Probabilidad Total . Mexico: Pearson Educacion.
Alexis Requena. (2007). Probabilidaes. Mexico: Pearson.
Alonso Zambrano . (2008). Probabilidades. Revista de la ESPOL, 29.
Angel Merizalde. (2012). Valores Espeados y Varianza . Caracas: MASLIBROS.
Antonio Vargas Sabadías. (1995). Estadística descriptiva e inferencial. Cuenca: Universidad de
Castilla - La Mancha.
92
Blatt Frank J. (1992). Modern Physics. New York: McGraw-Hill.
Carlos Andrade . (2008). PROBABILIDADES. Mexico: Noriega.
Carlos Siguencia . (25 de Abril de 2004). Tecnologico de Monterrey. Obtenido de
http://www.mty.itesm.mx/dmti/materias/ma2006-1/recursos/ma2006-03.pdf
Carloss Idrovo Alvarez. (2000). Definiciones Probabilisticas. Bucaramanga: MASLIBROS.
David M. Levine, Mark L. Berenson, Timothy C. Krehbiel. (2006). Estadística para
administración. Pearson Educación.
Dr. Christiam Gonzales Chávez. (2007). Probabilidad de Distribucion. Guadalajaraa:
MASLIBROS.
Dr. Mauro Gutierrez Martinez . (2004). Funcionees de la Probabilidad. Puerto Rico: NORIEGA.
Dra. Luz M. Rivera. (9 de Marzo de 2001). UNIVESIDAD INTERAMERANA DE PUERTO RICO.
Obtenido de http://ponce.inter.edu/cremc/estadistica.htm
Eduardo Manrique . (2011). Diseño Probabilistico. Bogota: MASLIBROS.
Eduardo Véliz. (2004). Introducción a Probabilidad. Mexico: NORIEGA.
Eliseo Martínez H. (2003). Estadistica para Igenieria. Antofagasta: NORIEGA.
Espinoza M. (20 de 05 de 2015). Espinoza M. Espinoza M. Guayaquil, Guayas, Ecuador: Mateo.
Estadistica y Variables Aleatorias . (2006). Guadalajara: NORIEGA.
Fisher R. A. (1919). The Correlation Between Relatives on the Supposition of Mendelian
Inheritance. Inglaterra: Pearson Education.
Gloria Rocío Bautista Mendoza. (2002). Ciencias Estadisticas. Colombia: Universidad de
Colombia.
Guillermo Trujano Mendoza . (2004). Investigacion de Operaciones. Mexico : Pearson
Educacion.
Gustavo Rocha Beltran. (2004). Probabilidad y Estadisticas. Guadalajara: UNAM.
Hamza K. (1995). The smallest uniform upper bound on the distance between the mean and the
median of the binomial and Poisson distributions. Alemania: Pearson Education.
HECTOR EUGENIO CHAVEZ VELARDE. (2001). Distribuciones de probabilidad discreta. Panama:
MASLIBROS.
Jefferson Sanchez. (2008). Introduccion a las Probabilidaes . Mexico: Alianza Editorial.
Jorge Rendon Aviles . (1999). Probabilidad Total. Cali: NORIEGA.
Josseline Cardenas M. (2004). Probabilidad y su Regla de Correspondencia. Caracas:
MASLIBROS.
Juan Miguel Marín Diazaraque. (4 de Agosto de 2014). Universidad Carlos III de Madrid.
Obtenido de
http://portal.uc3m.es/portal/page/portal/dpto_estadistica/personal/juan_miguel_ma
rin_diazaraque
93
Kolobar aritmetičnih funkcij. (2002). Ring of arithmetical functions. Rusia.
Leonardo Hernández Mendoza . (2012). Folleto de Estadísticas. Guayaquil: ESPOL.
M.C. Rigoberto Guardado France . (2014). Metodos y Aplicaciones. California: Universidad de
Baja California.
Manuel Vivanco. (2005). Muestreo Estadistico. Diseño Y Aplicaciones. Santiago, Chile:
Universitaria, S.A.
Mario Orlando Suárez Ibujes. (2005). Probabilidad Total y Teorema de Bayes. Mexico:
NORIEGA.
Martín, Miguel, Horna, Olivia, Nedel, Fúlvio, Navarro, Albert. (2010). Fundamentos de
estadística en ciencias de la salud. Servei de Publicacions de la Universitat Autònoma
de Barcelona.
Martínez Gómez, Mónica. (2004). Distribuciones de Probabilidad para Variables Aleatorias
Discretas. Valencia: Universidad Politécnica de Valencia.
Mateo Santiago Encalada. (6 de Julio de 2004). UNIVERSIDAD DE VALENCIA. Obtenido de
http://www.uv.es/ceaces/base/modelos%20de%20probabilidad/uniforme.htm
MC. Rita Luna Gandara. (15 de Julio de 2003). Probabilidad y Estadistica. Obtenido de
http://www.itch.edu.mx/academic/industrial/sabaticorita/
Mendehall, W. -B.-B. (2006). Introducción a la probabilidad y estadística. Cengage Learning™.
Mg. Cecilia Rosas Meneses. (2009). Funcion de Distribucion Acumulada . Mexico: MASLIBROS.
Milena Delgado. (1999). Analisis Biodimencional. Francia : Pearson Education.
MONTEREY INSTITUTO. (2009). Folleto de Estadistica. Chicago: Pearson Educacion.
Montero Alonso. (2004). Sistemas Aleatorios . Granada : UNIVERSIDAD DE GRANADA .
MORENO, Francis. (1993). Estadística Inferencial. Loja: Universidad Particular de Loja.
Nayelli Manzanarez Gómez. (22 de Mayo de 2009). UNIVERSIDAD NACIONAL AUTONOMA DE
MEXICO. Obtenido de
http://www.dcb.unam.mx/users/angellbs/htm/GRUPO1/ARCHIVOS_VARIOS_G1/PyE_
T3.pdf
Pablo Antonio Martín Álvarez. (2001). La Distribución Binomial. Madrid: Ministerio de
Educación, Cultura y Deporte.
Peña Sánchez de Rivera. (2008). Fundamentos de Estadística . Guadalajara: Alianza Editorial.
Rafael Díaz. (2004). Introducción a la Probabilidad. Venezuela: NORIEGA.
Ramon Macias . (2008). Analisis Probabilistico. Bogota: NORIEGA.
Ricard Boqué, Alicia Maroto. (1998). EL ANÁLISIS DE LA VARIANZA. Tarragona: Smeyers-
Verbeke.
Roberto Rodriguez. (2007). Estadistica Para Todos . Lima : Pearson Educacion.
Rodolfo Vaqurizo. (2013). Estadistica General. Cali: NORIEGA.
94
Santiago Montesdeoca. (2001). Probabilidad Condicional Total . Bogota: NORIEGA.
Vilma Morales. (2010). Evento y sus Probabilidades. Chile: MAS LIBROS.
Walter L. Martínez Vaca. (2003). Estadistica Descriptiva con enfasis en Salud Publica. La
Holguera.
Weinberg Steven. (1977). The First Three Minutes, Bantam Book. Australia: Chapman and Hal.
White Harvey E. (1972). Modern College Physics. Nostrand Reinhold: Pearson Education.
Wilfredo Caballero A. (1975). Introduccion a la Estadisticas. San Jose, Costa Rica: IICA. Matilde
de la Cruz.
Ximena Anadrade. (9 de Marzo de 2008). UNIVERSIDAD NACIONAL DE COLOMBIA . Obtenido
de
http://www.unalmed.edu.co/~estadist/esta_inv/APENDICE.%20TECNICAS%20DE%20C
ONTEO).pdf
Young Hugh D. (1968). Optics and Modern Physics. Alemania: McGraw-Hill.
Young Hugh D. (1968). Optics and Modern Physics. New York: McGraw-Hill.
Tabla de contenido ¿Para qué sirve la estadística? ............................................................................................ 3
La Estadística ............................................................................................................................ 4
Estadística Inferencial ............................................................................................................. 4
Estadística Descriptiva ........................................................................................................... 5
Datos Tomados Al Azar .......................................................................................................... 6
Población Objetiva ................................................................................................................... 2
Unidades de Investigación .................................................................................................... 2
Muestra ................................................................................................................................... 2
Observación ........................................................................................................................... 3
Parámetros y Estimadores .................................................................................................... 3
Parámetro ............................................................................................................................... 3
Estimador o estadístico ...................................................................................................... 3
Variables cualitativas .............................................................................................................. 5
Nominales............................................................................................................................... 5
Ordinales ................................................................................................................................ 5
Variables Cuantitativas o Numéricas .................................................................................. 6
Discretas ................................................................................................................................. 6
Continuas ............................................................................................................................... 7
Tabla de frecuencia (Análisis de variables cuantitativas) ............................................. 7
Análisis univariado .............................................................................................................. 7
Clase ........................................................................................................................................ 7
Marca clase ............................................................................................................................ 8
Frecuencia absoluta ............................................................................................................ 8
Frecuencia relativa ............................................................................................................... 9
Frecuencia acumulada ........................................................................................................ 9
Frecuencia relativa acumulada ......................................................................................... 9
Histograma de frecuencias relativas ................................................................................ 11
Histograma de frecuencia relativa ................................................................................. 11
Ojiva ........................................................................................................................................... 12
Preguntas ................................................................................................................................. 16
Ejercicio ................................................................................................................................ 17
Estimadores ............................................................................................................................. 21
Media ..................................................................................................................................... 21
Moda ...................................................................................................................................... 23
Los estimadores solo se aplican en variables cuantitativas ...................................... 23
Distribución normal representada por campana de Gauss ........................................ 23
Dispersión ................................................................................................................................ 24
Varianza ................................................................................................................................ 24
Desviación estándar .......................................................................................................... 24
Coeficiente de variación ................................................................................................... 25
Ejercicios .............................................................................................................................. 25
Estimadores de posición.................................................................................................. 29
Percentiles del orden i ...................................................................................................... 29
Deciles ................................................................................................................................... 29
Cuantil ................................................................................................................................... 30
Diagrama de Cajas y Bigotes ...................................................................................................... 32
Rango Intercuartil ................................................................................................................... 32
Valores alejados ................................................................................................................. 33
Distribución en forma simétrica ......................................................................................... 34
La curtosis ........................................................................................................................... 36
POSICIÓN ................................................................................................................................. 37
Campana de Gauss ............................................................................................................ 37
Ejercicio ................................................................................................................................ 38
Estimadores De Posición ..................................................................................................... 41
Percentiles de orden i ....................................................................................................... 41
DECILES ............................................................................................................................... 42
CUARTILES .......................................................................................................................... 42
Cuantiles ............................................................................................................................... 43
DIAGRAMA DE CAJA Y BIGOTE ........................................................................................ 45
Rango Intercuartil ................................................................................................................... 46
Valor Alejado ........................................................................................................................... 46
ESTIMACIÓN POR FORMA .................................................................................................. 47
Distribución en Forma Simetría ...................................................................................... 47
Análisis Bivariado .................................................................................................................. 49
Signo de La Covariancia ...................................................................................................... 51
Matriz de Varianza y Covarianza ........................................................................................ 52
MATRIZ DE CORRELACIÓN ................................................................................................ 53
Tipos de Muestreo ................................................................................................................. 54
Muestreo Aleatorio Simple (Mas) ................................................................................... 54
Nivel de Confianza ............................................................................................................. 54
Muestreo Sistemático ....................................................................................................... 56
Muestreo Estratificado ...................................................................................................... 56
Muestreo por Conglomerado .......................................................................................... 57
Ejercicio ................................................................................................................................ 59
Regla Multiplicativa ................................................................................................................ 60
Combinaciones ....................................................................................................................... 61
Permutaciones ........................................................................................................................ 62
Experimento Estadístico y Espacio Muestral ................................................................. 62
Experimento ......................................................................................................................... 62
Espacio Muestral del Experimento ................................................................................ 63
Eventos ..................................................................................................................................... 64
Muestro con Reposición y Muestreo sin Reposición ................................................... 64
Ejercicios .............................................................................................................................. 65
Ley De Complemento ............................................................................................................ 68
Ley Aditivo De Probabilidad ................................................................................................ 68
Probabilidad Condicional ..................................................................................................... 69
Ejercicio ................................................................................................................................. 70
Eventos Independientes ....................................................................................................... 71
Sistemas Exhaustos Y Excluyentes .................................................................................. 71
Ejercicios .............................................................................................................................. 72
Sucesos .................................................................................................................................... 76
Eventos Mutuamente Excluyentes .................................................................................... 76
Teorema De Bayes ................................................................................................................. 77
Variables Aleatorias ........................................................................................................... 78
Distribución de una Variable Discreta .......................................................................... 78
Ejercicio ................................................................................................................................ 79
Regla De Correspondencia .................................................................................................. 80
Función Acumulada ............................................................................................................... 80
Valores Esperados ................................................................................................................. 81
Varianza ................................................................................................................................ 81
Experimento Binomial ........................................................................................................... 82
Distribución Binomial Negativa ...................................................................................... 83
Ejercicios .............................................................................................................................. 84
Distribución Geométrica ...................................................................................................... 84
Ejercicio ................................................................................................................................ 85
Distribución Hipergeometrica ............................................................................................. 85
Ejercicio ................................................................................................................................... 86
Función De Densidad Para Continuas .............................................................................. 86
Distribución Uniforme Continuas ...................................................................................... 89