medidas de dispercion estadictica

14
UNIVERSIDAD CATOLICA DE SANTA MARIA ESTADISTICA INFORME: MEDIDAS DE DISPERCION SECCION: “B” NUMERO: 08 ESTUDIANTE: ESPEJO MAZUELOS ANDRE FRANCESCO 2015 1

Upload: andrefrancescoespejo

Post on 03-Dec-2015

219 views

Category:

Documents


0 download

DESCRIPTION

ll

TRANSCRIPT

UNIVERSIDAD CATOLICA DE SANTA MARIA

ESTADISTICA

INFORME: MEDIDAS DE DISPERCION

SECCION: “B”

NUMERO: 08

ESTUDIANTE: ESPEJO MAZUELOS ANDRE FRANCESCO

2015

1

Medidas de dispersión

El conocimiento de la forma de la distribución y del respectivo promedio de una colección de valores de una variable, puede servir para tener una idea bastante clara de la conformación, pero no de de la homogeneidad de cada una de los valores con respecto a la medida de tendencia central aplicada.En el caso de las variables con valores que pueden definirse en términos de alguna escala de medida de igual intervalo, puede usarse un tipo de indicador que permite apreciar el grado de dispersión o variabilidad existente en el grupo de variantes en estudio.A estos indicadores les llamamos medidas de dispersión, por cuanto que están referidos a la variabilidad que exhiben los valores de las observaciones, ya que si no hubiere variabilidad o dispersión en los datos interés, entonces no habría necesidad de la gran mayoría de las medidas de la estadística descriptiva.Las medidas de tendencia central tienen como objetivo el sintetizar los datos en un valor representativo, las medidas de dispersión nos dicen hasta que punto estas medidas de tendencia central son representativas como síntesis de la información. Las medidas de dispersión cuantifican la separación, la dispersión, la variabilidad de los valores de la distribución respecto al valor central. Distinguimos entre medidas de dispersión absolutas, que no son comparables entre diferentes muestras y las relativas que nos permitirán comparar varias muestras.

LA DISPERSIÓN.

Al igual que sucede con cualquier conjunto de datos, la media, la mediana y la moda sólo nos revelan una parte de la información que necesitamos acerca de las características de los datos. Para aumentar nuestro entendimiento del patrón de los datos, debemos medir también su dispersión, extensión o variabilidad.La dispersión es importante porque:

2

Proporciona información adicional que permite juzgar la confiabilidad de la medida de tendencia central. Si los datos se encuentran ampliamente dispersos, la posición central es menos representativa de los datos.

Ya que existen problemas característicos para datos ampliamente dispersos, debemos ser capaces de distinguir que presentan esa dispersión antes de abordar esos problemas.

Quizá se desee comparar las dispersiones de diferentes muestras. Si no se desea tener una amplia dispersión de valores con respecto al centro de distribución o esto presenta riesgos inaceptables, necesitamos tener habilidad de reconocerlo y evitar escoger distribuciones que tengan las dispersiones más grandes.

Pero si hay dispersión en la mayoría de los datos, y debemos estar en capacidad de describirla. Ya que la dispersión ocurre frecuentemente y su grado de variabilidad es importante, ¿cómo medimos la variabilidad de una distribución empírica?. Vamos a considerar sólo algunas medidas de dispersión absolutas: el rango, la varianza, la desviación estándar y el coeficiente de variación.

Rango

Es la que mide la amplitud de los valores de la muestra y se calcula por diferencia entre el valor más elevado y el valor más bajo.Ventajas:

Es la más fácil de calcular entre las de medidas de dispersión

Desventajas:

Es la medida de dispersión menos significativa

3

Ejercicio de aplicación

R= Vmax-Vmin

R=1,30-1,20

R=0,10

Desviación media

En estadística la desviación absoluta promedio o, sencillamente desviación media o promedio de un conjunto de datos es la media de las desviaciones absolutas y es un resumen de la dispersión estadística. Se expresa, de acuerdo a esta fórmula:

Ventajas

Toma en cuenta todos los datos

Es una medida de dispersión que es muy sencilla de hallar y nos brinda la información muy útil.

Desventajas

La desviación media de una muestra no es un buen estimador de la desviación media de la población, que es lo que en última instancia nos interesa conocer. 

4

Varianza

Mide la distancia existente entre los valores de la serie y la media. Se calcula como sumatorio de las diferencias al cuadrado entre cada valor y la media, multiplicadas por el número de veces que se ha repetido cada valor. El sumatorio obtenido se divide por el tamaño de la muestra.

Ventajas

Es útil cuando se compara la variabilidad de dos o más conjuntos de datos, utiliza toda la información disponible

Desventajas

No proporciona ayuda inmediata cuando se estudia la dispersión de un solo conjunto de datos

Difícil de interpretar por tener sus unidades elevadas al cuadrado

5

Ejercicio de aplicación

Desviación típica o estándar

La desviación típica o desviación estándar (denotada con el símbolo σ o s, dependiendo de la procedencia del conjunto de datos) es una medida de dispersión para variables de razón (variables cuantitativas o cantidades racionales) y de intervalo. Se define como la raíz cuadrada de la varianza de la variable.

Para conocer con detalle un conjunto de datos, no basta con conocer las medidas de tendencia central, sino que necesitamos conocer también la desviación que presentan los datos en su distribución respecto de la media aritmética de dicha distribución, con objeto de tener una visión de los mismos más acorde con la realidad al momento de describirlos e interpretarlos para la toma de decisiones.

Ventajas

Esta expresada en las mismas unidades que la variable en estudio

Utiliza todas las observaciones en su calculó

Fácil de interpretar

Desventajas

No tiene

6

Ejercicio de aplicación

Del problema anterior halle la desviación típica o estándar

Coeficiente de variación

Es una medida que se emplea fundamentalmente para:

Comparar la variabilidad entre dos grupos de datos referidos a distintos sistemas de unidades de medida. Por ejemplo, kilogramos y centímetros.Comparar la variabilidad entre dos grupos de datos obtenidos por dos o más personas distintas.Comparar dos grupos de datos que tienen distinta media.Determinar si cierta media es consistente con cierta varianza. end(enumerate)

El Coeficiente de Variación muestral se denota y se define como:

Ventajas

Sirve para comparar la variabilidad de dos poblaciones con distintas magnitudes.

Desventajas

Es necesaria realizar los otros cálculos previos para hallar está siendo una medida que toma más tiempo en hallarse

No es una medida de dispersión con respecto al centro de la distribución de los datos

Ejercicio de aplicación

7

CORRELACION Y REGRESION

Correlación

En probabilidad y estadística, la correlación indica la fuerza y la dirección de una relación lineal y proporcionalidad entre dos variables estadísticas. Se considera que dos variables cuantitativas están correlacionadas cuando los valores de una de ellas varían sistemáticamente con respecto a los valores homónimos de la otra: si tenemos dos variables (A y B) existe correlación si al aumentar los valores de A lo hacen también los de B y viceversa. La correlación entre dos variables no implica, por sí misma, ninguna relación de causalidad 

Coeficiente de correlación

En estadística, el coeficiente de correlación de Pearson es una medida de la relación lineal entre dos variables aleatorias cuantitativas. A diferencia de lacovarianza, la correlación de Pearson es independiente de la escala de medida de las variables.

De manera menos formal, podemos definir el coeficiente de correlación de Pearson como un índice que puede utilizarse para medir el grado de relación de dos variables siempre y cuando ambas sean cuantitativas

Formula

Coeficiente de determinación

En estadística, el coeficiente de determinación, denominado R² y pronunciado R cuadrado, es un estadístico usado en el contexto de un modelo estadístico cuyo principal propósito es predecir futuros resultados o probar una hipótesis. El coeficiente determina la calidad del modelo para replicar los resultados, y la proporción de variación de los resultados que puede explicarse por el modelo

R”2 =RxR

Coeficiente de no determinación

El coeficiente de no determinación, indica la proporción , de la variación total de la variable "Y" que no es explicada por la variable "X".O sea , la variación que no es explicada por el modelo de regresión.

=1-RxR

8

Coeficiente de correlación de Spearman

En estadística, el coeficiente de correlación de Spearman, ρ (rho) es una medida de la correlación (la asociación o interdependencia) entre dos variables aleatorias continuas. Para calcular ρ, los datos son ordenados y reemplazados por su respectivo orden.

El estadístico ρ viene dado por la expresión:

Regresión

En estadística la regresión lineal o ajuste lineal es un método matemáticoque modela la relación entre una variable dependiente Y, las variables independientes Xi y un término aleatorio ε. Este modelo puede ser expresado como:

: variable dependiente, explicada o regresando.

: variables explicativas, independientes o regresores.

: parámetros, miden la influencia que las variables explicativas tienen sobre el regresando.

donde   es la intersección o término "constante", las   son los parámetros respectivos a cada variable independiente, y   es el número de parámetros independientes a tener en cuenta en la regresión. La regresión lineal puede ser contrastada con la regresión no lineal.

Diagrama de dispersión

Un diagrama de dispersión o gráfica de dispersión o gráfico de dispersión es un tipo de diagrama matemático que utiliza las coordenadas cartesianas para mostrar los valores de dos variables para un conjunto de datos. Los datos se muestran como un conjunto de puntos, cada uno con el valor de una variable que determina la posición en el eje horizontal (x) y el valor de la otra variable determinado por la posición en el eje vertical (y).

9

Ecuación de regresión

En el estudio de la relación funcional entre dos variables poblacionales, una variable X, llamada independiente, explicativa o de predicción y una variable Y, llamada dependiente o variable respuesta, presenta la siguiente notación:

Y = a + b X + eDonde:a es el valor de la ordenada donde la línea de regresión se intercepta con el eje Y.b es el coeficiente de regresión poblacional (pendiente de la línea recta)e es el error

Trazar recta de regresión

La recta de regresión  es la que mejor se ajusta a la  nube de

puntos .La recta de regresión  pasa por el punto   llamado centro de gravedad .

10

Bibliografía

https://www.uam.es/personal_pdi/ciencias/abaillo/AlimEst/EstAlimTema4.pdf http://www.vitutor.com/estadistica/bi/ejercicios_regresion.html http://halweb.uc3m.es/esp/Personal/personas/aarribas/esp/docs/estII/

tema4esp(2).pdf http://thales.cica.es/rd/Recursos/rd97/UnidadesDidacticas/53-1-u-punt152.html http://www.monografias.com/trabajos43/medidas-dispersion/medidas-

dispersion.shtml http://www.aulafacil.com/cursos/l11218/ciencia/estadisticas/estadisticas/

medidas-de-dispersion-rango-varianza-desviacion-tipica-y-coeficiente-de-variacion

http://colposfesz.galeon.com/est501/distfrec/meddisp/meddisp.htm https://es.wikipedia.org/wiki/Medidas_de_dispersi%C3%B3n http://thales.cica.es/rd/Recursos/rd97/UnidadesDidacticas/53-1-u-punt152.html

11