medidas de variabilidad y distribución normal

22
Objetivo s : María Isabel Bautista [email protected] m Medidas de variabilidad y Distribución Normal Comprender el significado de las Medidas de variabilidad Comprender el significado de la Distribución Normal

Upload: maria-isabel-bautista

Post on 12-Jun-2015

42.053 views

Category:

Education


0 download

DESCRIPTION

Medidas de variabilidad, Distribución Normal,Validez,confiabilidad, Rango, Varianza Desviación estándar, Coeficiente de Variación

TRANSCRIPT

Page 1: Medidas de variabilidad y Distribución Normal

Objetivos :

María Isabel [email protected]

Medidas de variabilidad y Distribución Normal

Comprender el significado de las Medidas de variabilidad

Comprender el significado de la Distribución Normal

Comprender el significado de las Medidas de variabilidad

Comprender el significado de la Distribución Normal

Page 2: Medidas de variabilidad y Distribución Normal

María Isabel [email protected]

Medidas de variabilidad y Distribución Normal2

Validez y confiabilidad

Un procedimiento de medición será confiable en la medida en que proporciona datos con poca variación.

Si el proceso es válido mide lo que se desea medir, por tanto disponer de un procedimiento de medición válido y confiable será muy deseable.

Por ejemplo, una prueba con elevada confiabilidad y validez medirá el conocimiento que se pretende evaluar de manera repetible cuando se aplique una y otra vez.

Un procedimiento de medición será confiable en la medida en que proporciona datos con poca variación.

Si el proceso es válido mide lo que se desea medir, por tanto disponer de un procedimiento de medición válido y confiable será muy deseable.

Por ejemplo, una prueba con elevada confiabilidad y validez medirá el conocimiento que se pretende evaluar de manera repetible cuando se aplique una y otra vez.

Un procedimiento de medición que sea confiable proporciona datos con poca variación

Page 3: Medidas de variabilidad y Distribución Normal

María Isabel [email protected]

Dispersión

¿Cuánto se alejan los datos de la Media que es igual a 6?

Calificaciones obtenidas en el examen de Inglés, escala del 0 al 10

Page 4: Medidas de variabilidad y Distribución Normal

María Isabel [email protected]

Dispersión

Si la media µx = 6La dispersión es la media de la diferencia entre cada valor y la media

La suma de las desviaciones respecto a la media siempre es igual a cero

Page 5: Medidas de variabilidad y Distribución Normal

María Isabel [email protected]

Medidas de variabilidad y Distribución Normal5

Media

Dispersión

Las medidas de dispersión cuantifican la separación, la dispersión, la variabilidad de los valores de la distribución respecto al valor central denominado Media

Distinguimos entre medidas de dispersión absolutas, que no son comparables entre diferentes muestras y las relativas que nos permitirán comparar varias muestras.

Las medidas de dispersión cuantifican la separación, la dispersión, la variabilidad de los valores de la distribución respecto al valor central denominado Media

Distinguimos entre medidas de dispersión absolutas, que no son comparables entre diferentes muestras y las relativas que nos permitirán comparar varias muestras.

Page 6: Medidas de variabilidad y Distribución Normal

María Isabel [email protected]

Si se mide cierta propiedad de dos objetos o sucesos, los resultados pueden ser diferentes. Tal variación ocurre de modo natural y por eso se denominan “variables”

La problemática de la variación se complica al reconocer que ella también ocurre en quienes miden y en los instrumentos: encuestas, exámenes, etc. que se usan para medir.

En esta sesión estudiaremos las medidas de variación que indican cuan alejados pueden estar los valores de la media.

Si se mide cierta propiedad de dos objetos o sucesos, los resultados pueden ser diferentes. Tal variación ocurre de modo natural y por eso se denominan “variables”

La problemática de la variación se complica al reconocer que ella también ocurre en quienes miden y en los instrumentos: encuestas, exámenes, etc. que se usan para medir.

En esta sesión estudiaremos las medidas de variación que indican cuan alejados pueden estar los valores de la media.

Media

Esto nos ayuda a:

1. Calibrar el análisis de mas medidas de tendencia central

2. Cuestionar el valor de la muestra

3. Juzgar la confiabilidad de las medidas de tendencia central. Si los datos están muy dispersos las medidas de TC no son representativas de los datos de la muestra como un todo

Variación

6 Medidas de variabilidad y Distribución Normal

Page 7: Medidas de variabilidad y Distribución Normal

María Isabel [email protected]

Medidas de variabilidad y Distribución Normal7

Variación

En el caso estudiado de sesiones anteriores, Nota final promedio obtenida en Física 9º de una muestra de 25 instituciones privadas del Distrito Capital

¿Qué factores pueden afectar la media obtenida?

En el caso estudiado de sesiones anteriores, Nota final promedio obtenida en Física 9º de una muestra de 25 instituciones privadas del Distrito Capital

¿Qué factores pueden afectar la media obtenida?

1. Calidad y experiencia de los docentes de cada centro.

2. El número de horas de estudio

3. El número de estudiantes por aula de clase.

4. Recursos Tecnológicos del centro de estudio

5. Estrategias de enseñanza

Page 8: Medidas de variabilidad y Distribución Normal

María Isabel [email protected]

Medidas de variabilidad y Distribución Normal8

Una vez localizado el centro de la distribución de frecuencias (Me) de un conjunto de datos,

el siguiente paso es buscar una medida de la variabilidad o dispersión de los datos,

ya que es importante conocer si los valores en general están cerca o alejados de los valores centrales.

Las medidas de variación o dispersión son:

RangoVarianzaDesviación estándarCoeficiente de Variación

Medidas de variación o dispersión

µ

Page 9: Medidas de variabilidad y Distribución Normal

María Isabel [email protected]

Medidas de variabilidad y Distribución Normal9

Rango

Es la diferencia entre el valor máximo y el mínimo de los datos observados

Es la más simple de las medidas de dispersión

Sólo es válida para datos numéricos

No cuenta absolutamente nada sobre la distribución de los datos dentro del mismo

Es la diferencia entre el valor máximo y el mínimo de los datos observados

Es la más simple de las medidas de dispersión

Sólo es válida para datos numéricos

No cuenta absolutamente nada sobre la distribución de los datos dentro del mismo

En este ejemplo vemos 2 distribuciones de datos totalmente diferentes, con igual Rango

Page 10: Medidas de variabilidad y Distribución Normal

María Isabel [email protected]

Medidas de variabilidad y Distribución Normal10

La Varianza S2

La Varianza (S2) de los datos es la medida de dispersión más utilizada.

¿Cómo calcularla?

Es la media de los cuadrados de las diferencias entre cada valor de la variable (xi) y la media aritmética (X) de la distribución.

La Varianza (S2) de los datos es la medida de dispersión más utilizada.

¿Cómo calcularla?

Es la media de los cuadrados de las diferencias entre cada valor de la variable (xi) y la media aritmética (X) de la distribución.

Interpretación:

La varianza mide la mayor o menor dispersión de los valores de la variable respecto a la media aritmética.

Cuanto mayor sea la varianza mayor dispersión existirá y por tanto menor representatividad tendrá la media aritmética.

La varianza se expresa en las mismas unidades que la variable analizada, pero elevadas al cuadrado.

La varianza siempre es mayor o igual que cero y menor que infinito

S2

Nomenclatura: S2 o

Page 11: Medidas de variabilidad y Distribución Normal

María Isabel [email protected]

Medidas de variabilidad y Distribución Normal11

Desviación Estándar (S)

Es la medida de variabilidad utilizada con más frecuencia en la investigación por ser la más estable de todas y se basa en los desvíos de los datos originales con respecto a la media x.

Se define como la raíz cuadrada con signo positivo de la varianza.

Corrige la posible distorsión del valor obtenido en la Varianza (S2), producto de la sumatoria de las diferencias al cuadrado del valor de las observaciones menos la Media Aritmética

Nomenclatura: S o

Page 12: Medidas de variabilidad y Distribución Normal

María Isabel [email protected]

Medidas de variabilidad y Distribución Normal12

Comportamiento de la Desviación Estándar

Datos concentrados en la media

Datos cercanos a la media

Datos dispersos con respecto a la media

Page 13: Medidas de variabilidad y Distribución Normal

María Isabel [email protected]

Medidas de variabilidad y Distribución Normal13

Comportamiento de la Desviación Estándar

Page 14: Medidas de variabilidad y Distribución Normal

María Isabel [email protected]

Medidas de variabilidad y Distribución Normal14

Análisis de la Varianza y la Desviación estándar

Para Calcular la Varianza y la Desviación estándar revisa eltutorial de excel y observa en el paso 1

Interpreta sabiendo que:

Cuando los valores de un conjunto de observaciones están muy próximos a su Media (11.916), la dispersión es menor que cuando están distribuidos sobre un amplio recorrido.

Una Varianza pequeña nos indica que la variable no se desvía "demasiado" de su media , que es "poco" probable que haya valores alejados de la media, o dicho de otra manera que es "muy" probable que los valores se encuentren alrededor de la media.

Para Calcular la Varianza y la Desviación estándar revisa eltutorial de excel y observa en el paso 1

Interpreta sabiendo que:

Cuando los valores de un conjunto de observaciones están muy próximos a su Media (11.916), la dispersión es menor que cuando están distribuidos sobre un amplio recorrido.

Una Varianza pequeña nos indica que la variable no se desvía "demasiado" de su media , que es "poco" probable que haya valores alejados de la media, o dicho de otra manera que es "muy" probable que los valores se encuentren alrededor de la media.

Para saber cómo utilizar Excel y construir esta tabla, revisa el material de apoyo respectivo a esta sesión.

Page 15: Medidas de variabilidad y Distribución Normal

María Isabel [email protected]

Para julio de 2004 la media de inasistencia de los alumnos de un colegio A era de 0,221 mientras que para el colegio B alcanzaba 0,276.

El cálculo de la desviación estándar en cada grupo SA= 0,048 y SB = 0,077 nos permite apreciar la consistencia en el promedio de asistencia de los estudiantes del colegio A

El mayor valor de la desviación estándar indica que hay mayor variabilidad en torno a la media en el colegio B y podemos concluir que el colegio A ha sido más exitoso en motivar una mayor asistencia a clases de los estudiantes.

Esto lo podemos apreciar en la siguiente representación gráfica.

Colegio A

Colegio B

Interpretación de la Desviación Estándar

Page 16: Medidas de variabilidad y Distribución Normal

María Isabel [email protected]

Medidas de variabilidad y Distribución Normal16

Distribución Normal

Así como la media es muy sensible a la presencia de valores atípicos también lo son S y S2, porque en esencia también son medias. Cuando hay valores atípicos puede resultar una mejor idea recurrir al uso de la Distribución Normal

Se presenta ahora una regla que describe adecuadamente la variabilidad de una distribución acampanada y razonablemente bien la variabilidad de otras distribuciones que se acercan a esta forma.

Así como la media es muy sensible a la presencia de valores atípicos también lo son S y S2, porque en esencia también son medias. Cuando hay valores atípicos puede resultar una mejor idea recurrir al uso de la Distribución Normal

Se presenta ahora una regla que describe adecuadamente la variabilidad de una distribución acampanada y razonablemente bien la variabilidad de otras distribuciones que se acercan a esta forma.

Page 17: Medidas de variabilidad y Distribución Normal

María Isabel [email protected]

Medidas de variabilidad y Distribución Normal17

Importancia de la Distribución Normal

Nos hemos centrado en la distribución normal, cuya relevancia en estadística se debe a que muchos fenómenos físicos, biológicos, psicológicos o sociológicos, pueden ser adecuadamente modelizados mediante ella.

La distribución normal es también una buena aproximación de otras distribuciones, como la binomial, Poisson o T de Student, para ciertos valores de sus parámetros.

Una buena cantidad de mediciones de características de seres vivos y otras variables que se observan en la naturaleza siguen una distribución en forma de campana u otra forma similar a ésta.

Nos hemos centrado en la distribución normal, cuya relevancia en estadística se debe a que muchos fenómenos físicos, biológicos, psicológicos o sociológicos, pueden ser adecuadamente modelizados mediante ella.

La distribución normal es también una buena aproximación de otras distribuciones, como la binomial, Poisson o T de Student, para ciertos valores de sus parámetros.

Una buena cantidad de mediciones de características de seres vivos y otras variables que se observan en la naturaleza siguen una distribución en forma de campana u otra forma similar a ésta.

Page 18: Medidas de variabilidad y Distribución Normal

María Isabel [email protected]

Curva de Gauss

Medidas de variabilidad y Distribución Normal18

Para representar distribuciones de frecuencias se utiliza la llamada “Curva de Gauss”. Para visualizarla, en el Museo de Ciencia de París se dispone de la “Plancha de Galton” presente en la fotografía.

Si se dejan caer metras de la parte superior de la plancha, ellas se dirigen al azar, a la izquierda o a la derecha cada vez que tropiezan con un obstáculo.

Con el uso de la curva de Gauss, es predecible la distribución en la parte baja de la plancha, de una gran cantidad de metras que hayan sido dejadas caer.

La curva que está dibujada con color verde representa la distribución de 256 metras.

Para representar distribuciones de frecuencias se utiliza la llamada “Curva de Gauss”. Para visualizarla, en el Museo de Ciencia de París se dispone de la “Plancha de Galton” presente en la fotografía.

Si se dejan caer metras de la parte superior de la plancha, ellas se dirigen al azar, a la izquierda o a la derecha cada vez que tropiezan con un obstáculo.

Con el uso de la curva de Gauss, es predecible la distribución en la parte baja de la plancha, de una gran cantidad de metras que hayan sido dejadas caer.

La curva que está dibujada con color verde representa la distribución de 256 metras.

Fuente: Museo de Ciencia y Tecnología La Villete, París, Francia.

Page 19: Medidas de variabilidad y Distribución Normal

María Isabel [email protected]

Medidas de variabilidad y Distribución Normal19

Distribución Normal, la regla empírica

Dada una distribución de las observaciones con forma aproximadamente acampanada, entonces, el intervalo:

• (Media ± S) contiene aproximadamente al 68% de las observaciones

• (Media ± 2S) contiene aproximadamente al 95% de las observaciones

• (Media ± 3S) contiene casi todas las observaciones

La distribución acampanada se conoce como la distribución normal.

La importancia de la regla empírica consiste en su utilidad para describir adecuadamente la variación de un gran número de tipos de datos.

Dada una distribución de las observaciones con forma aproximadamente acampanada, entonces, el intervalo:

• (Media ± S) contiene aproximadamente al 68% de las observaciones

• (Media ± 2S) contiene aproximadamente al 95% de las observaciones

• (Media ± 3S) contiene casi todas las observaciones

La distribución acampanada se conoce como la distribución normal.

La importancia de la regla empírica consiste en su utilidad para describir adecuadamente la variación de un gran número de tipos de datos.

Page 20: Medidas de variabilidad y Distribución Normal

María Isabel [email protected]

Medidas de variabilidad y Distribución Normal20

Distribución Normal, la regla empírica

Problema

Se realiza un estudio del tiempo necesario para realizar una prueba de admisión de la Universidad José María Vargas.

Se mide el tiempo necesario para realizar la prueba para n = 40 bachilleres.

Se calculan la media y la desviación estándar obteniéndose 12.8 y 1.7 respectivamente.

Cómo describiría la Regla Empírica los datos en esta muestra.

Problema

Se realiza un estudio del tiempo necesario para realizar una prueba de admisión de la Universidad José María Vargas.

Se mide el tiempo necesario para realizar la prueba para n = 40 bachilleres.

Se calculan la media y la desviación estándar obteniéndose 12.8 y 1.7 respectivamente.

Cómo describiría la Regla Empírica los datos en esta muestra.

– Para describir los datos se calculan los intervalos

– De acuerdo con la regla empírica se espera que:

• aproximadamente el 68% de las observaciones estarán en el intervalo de 11. 1 a 14.5,

• 95% de las observaciones estarán en el intervalo de 9.4 a 16.2,

• y casi todas ellas en la intervalo de 7.7 a 17.9.

Page 21: Medidas de variabilidad y Distribución Normal

María Isabel [email protected]

Construir Gráfico de Distribución Normal

Medidas de variabilidad y Distribución Normal21

¿Cómo construir un gráfico que compara la Nota final promedio obtenida en Física de noveno de una muestra de 25 instituciones privadas del Distrito Capital con una curva de Distribución Normal?

Siga los 6 pasos que aparecen explicados en el la Hoja de Calculo Excel que aparece publicada como material de apoyo a esta sesión.

Interpreta lo que expresa el gráfico

¿Cómo construir un gráfico que compara la Nota final promedio obtenida en Física de noveno de una muestra de 25 instituciones privadas del Distrito Capital con una curva de Distribución Normal?

Siga los 6 pasos que aparecen explicados en el la Hoja de Calculo Excel que aparece publicada como material de apoyo a esta sesión.

Interpreta lo que expresa el gráfico

-100

0

100

200

300

400

500

600

700

800

- 5,00 10,00 15,00 20,00 25,00

Serie Original

Serie Aleatoria

Page 22: Medidas de variabilidad y Distribución Normal

María Isabel [email protected]

Medidas de variabilidad y Distribución Normal22

Mendenhall, Willian. (1978), Estadística para Administradores y Economía. Universidad Nacional Autónoma de México. Grupo Editorial Iberoamérica. México.

Navarro, A. (2000), Estadística Aplicada al área económica y empresarial. Ediciones de la Universidad Ezequiel Zamora. Colección Docencia Universitaria. Barinas, Venezuela

Fundación Polar • Últimas Noticias • El mundo de la matemática • Estadística • 20 http://www.fundacionempresaspolar.org/matematica2/fasciculo20.pdf

Lista de Referencias