estadística descriptiva - unid · 2014-05-12 · introducción de la sesión 11 las medidas de...
TRANSCRIPT
Estadística Descriptiva SESIÓN 11
Medidas de dispersión
Contextualización de la sesión 11
En la sesión anterior se explicaron los temas relacionados con la dispersión, una de las medidas de dispersión, además de los diversos temas relacionados con ella. Esta es una cuantificación del grado de alejamiento de los datos respecto a su media aritmética. Ahora es necesario conocer otra de las medidas de dispersión conocida como desviación típica o estándar y los temas relacionados con esta medida.
Al terminar esta sesión habrás comprendido el concepto de desviación estándar relacionado con los estudios estadísticos.
Introducción de la sesión 11
Las medidas de dispersión se asocian a la precisión
estadística de las observaciones o datos muestrales. Cuando
la dispersión de un conjunto de datos es muy alta, las
estimaciones que se realizan en función de éstas conllevan un
notable grado de imprecisión. Y en sentido inverso, cuando un
conjunto de datos presenta una dispersión baja, el nivel de
incertidumbre disminuye notablemente.
La desviación típica o estándar, denotada por la literal s, es una
medida de dispersión que se emplea para variables de razón
(también conocidas como ratio o cociente) y para variables de
intervalo. La desviación estándar se considera una medida
cuadrática que representa el promedio de las desviaciones
(distancias) de los datos muestrales respecto de su media
aritmética, expresada en las mismas unidades que la variable.
Explicación: Desviación típica o
estándar
La fórmula para calcular la desviación estándar para
datos no agrupados está dada por la siguiente
expresión:
Explicación: Desviación típica o
estándar
Dónde:
Explicación: Desviación típica o
estándar
n = Número de datos o elementos de la muestra.
i = Índice de la suma que toma los valores 1, 2, 3...n.
xi = Valor del i-ésimo dato de la muestra.
= Media aritmética de la muestra.
Es importante señalar que la siguiente fórmula se
considera más apropiada para una mejor estimación de
la desviación estándar de la población a partir de la
muestra:
Explicación: Desviación típica o
estándar
Cualquiera de las fórmulas puede usarse indistintamente, pero
en la práctica es común el uso de la segunda. En ésta, al
cociente n – 1 se le denomina corrección de Bessel.
Calculemos la desviación estándar para el siguiente conjunto de
datos no agrupados:
A = {2, 4, 6, 8, 10}
De este conjunto se desprende que:
Explicación: Desviación típica o
estándar
n = 5 x1 = 2 x2 = 4 x3 = 6 x4 = 8 x5 = 10
Con estos datos, procedemos a calcular la media aritmética
del conjunto:
Y a continuación se sustituyen los valores anteriores en la
fórmula:
Explicación: Desviación típica o
estándar
Tal como se muestra a continuación:
Explicación: Desviación típica o
estándar
Por su parte, la fórmula para calcular la desviación estándar de
datos agrupados está dada por la siguiente expresión:
Dónde:
Explicación: Desviación típica o
estándar
k = Número de intervalos de clase en la distribución de frecuencias.
n = Número de datos o elementos de la muestra.
i = Índice de la suma que toma los valores 1,2,3...k.
fi = Frecuencia del i-ésimo intervalo de clase.
xi = Marca de clase del i-ésimo intervalo de la muestra.
Media aritmética de la muestra.
Para calcular la desviación estándar en un conjunto de datos
agrupados, también empleamos la versión que incorpora la
corrección de Bessel. Como puede observarse, cada elemento
de la fórmula se toma directamente de la tabla de datos
agrupados. Considerando el caso práctico de una bebida, se
toma de la tabla de datos agrupados las columnas referentes a
las frecuencias de clase (fi) y a las marcas de clase (xi).
Explicación: Desviación típica o
estándar
De esta tabla se obtienen los siguientes valores para las frecuencias de clase:
Y para las marcas de clase:
Asimismo, dado que hay cinco intervalos de clase y la muestra tiene 100 elementos, los valores de k y n respectivamente son:
Y como ya se determinó en ejercicios anteriores:
= 20
Explicación: Desviación típica o
estándar
f1 = 5 f2 = 10 f3 = 30 f4 = 40 f5 = 15
x1 = 7.5 x2 = 12.5 x3 = 17.5 x4 = 22.5 x5 = 27.5
k = 5 n = 100
Ahora, sustituyendo estos valores en la respectiva
fórmula se tiene que:
Explicación: Desviación típica o
estándar
La desviación estándar es una medida de dispersión que
nos permite evaluar la incertidumbre de los datos
obtenidos por la muestra; es decir, analiza todos aquellos
datos que se alejan de nuestro promedio para determinar
si nuestra predicción o teoría está alejada del modelo
que se construyó con la muestra.
Explicación: Desviación típica o
estándar
En esta sesión se han explicado la desviación estándar como
una medida de dispersión, que sirve para evaluar la
incertidumbre de los datos de una muestra, además, se
explicó el procedimiento para el correcto cálculo de esta
desviación en un conjunto de datos no agrupados y
agrupados.
Conclusión
En la siguiente sesión conocerás los temas correspondientes a
la varianza como la última de las medidas de dispersión, así
como el procedimiento para su cálculo en conjuntos de datos
agrupados y no agrupados.
Conclusión