1 - carrera corporativa | unitec web view73. sección 1. 4. medidas de dispersión y de...

24
SECCIÓN 1.4 Medidas de dispersión y de posición Medidas de dispersión y de posición En la presente sección usted: Conoce el concepto de dispersión en la descripción de un conjunto de datos. Calcula la desviación estándar, la varianza y comprende sus significados. Calcula el coeficiente de variación y comprende su significado. Calcula las medidas de posición y comprende su significado. Presente una (o más) situaciones en las que el uso de un promedio no sea suficiente para describir o tomar una decisión. Diferentes muestras pueden tener promedios iguales, pero diferir sustancialmente en otros aspectos. La figura 1.12 presenta tres muestras con la misma media aritmética y con la misma mediana; pero la distribución de los datos respecto al centro es muy diferente. Los datos de la primera de las muestras posee mayor dispersión (respecto a los promedios), la tercera muestra tiene la mínima dispersión y en la segunda muestra dispersión intermedia. Figura 1.12 Muestras con igual: media aritmética, Mediana pero distinta variabilidad. El ejemplo 1.29 presenta una situación en la que las muestras son distintas pero la media aritmética y la mediana coinciden. Ejemplo 1.19 Se ha decidido contratar un nuevo empleado, de entre dos posibles aspirantes, para ello se les aplicaron tres exámenes sobre ciertas A 1 A 2 Examen 1 10 8 Examen 2 6 9 57

Upload: vuongdieu

Post on 31-Jan-2018

215 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: 1 - Carrera Corporativa | UNITEC Web view73. SECCIÓN 1. 4. Medidas de dispersión y de posición. 72. UNIDAD. 1. Estadística descriptiva. Author: pantaleon Created Date: 01/07/2012

SECCIÓN 1.4 Medidas de dispersión y de posición

Medidas de dispersión y de posición

En la presente sección usted:

Conoce el concepto de dispersión en la descripción de un conjunto de datos. Calcula la desviación estándar, la varianza y comprende sus significados. Calcula el coeficiente de variación y comprende su significado. Calcula las medidas de posición y comprende su significado.

Presente una (o más) situaciones en las que el uso de un promedio no sea suficiente para describir o tomar una decisión.

Diferentes muestras pueden tener promedios iguales, pero diferir sustancialmente en otros aspectos. La figura 1.12 presenta tres muestras con la misma media aritmética y con la misma mediana; pero la distribución de los datos respecto al centro es muy diferente. Los datos de la primera de las muestras posee mayor dispersión (respecto a los promedios), la tercera muestra tiene la mínima dispersión y en la segunda muestra dispersión intermedia.

Figura 1.12 Muestras con igual: media aritmética, Mediana pero distinta variabilidad.

El ejemplo 1.29 presenta una situación en la que las muestras son distintas pero la media aritmética y la mediana coinciden.

Ejemplo 1.19Se ha decidido contratar un nuevo empleado, de entre dos posibles aspirantes, para ello se les aplicaron tres exámenes sobre ciertas habilidades; las calificaciones obtenidas por los aspirantes se muestran en la siguiente tabla, ¿a quién debe seleccionar si toma como referencia un promedio? Explique.

A1 A2

Examen 1 10 8Examen 2 6 9Examen 3 8 7

SoluciónLas calificaciones son distintas, pero ambos aspirantes tienen la misma mediana

~x=8 y la misma

media aritmética: A1 , x=10+6+8

3=8

, A2 : x=8+9+7

3=8

y no tienen moda, luego los promedios anteriores no son útiles para decidir cuál de los dos aspirantes contratará.

Existen situaciones en las que basándose en un promedio, no siempre es posible tomar una decisión; en consecuencia conviene contar con otros criterios para tal efecto. Una medida de dispersión suele interpretarse como un valor que indica “que tan alejados se encuentran los datos

57

Page 2: 1 - Carrera Corporativa | UNITEC Web view73. SECCIÓN 1. 4. Medidas de dispersión y de posición. 72. UNIDAD. 1. Estadística descriptiva. Author: pantaleon Created Date: 01/07/2012

UNIDAD 1 Estadística descriptiva

respecto a un valor específico, la mayoría de las veces de un promedio”. Las medidas de dispersión miden el grado de uniformidad de los datos de la muestra o en su defecto de los valores que asume la variable estadística.

Definición 1.9 Recorrido o amplitudEl recorrido o amplitud de variación de la muestra x1 , x2 , x3 , .. . , xn , es la diferencia entre el dato mayor y el dato menor:

R=xMáx−xMín .

La figura 1.13 muestra el concepto anterior.

Figura 1.13 Representación del recorrido o amplitud de variación.

Ejemplo 1.20Determine la amplitud de variación o recorrido de los dos aspirantes a ser contratados del problema anterior.

A1 A2

Examen 1 10 8Examen 2 6 9Examen 3 8 7

SoluciónPara A1 , R=10−6=4 , para A2 , R=9−7=2 , luego, el segundo de los aspirantes parece ser más “consistente” es decir menos disperso en cuanto a sus calificaciones.

El recorrido o amplitud de variación sólo depende de las observaciones extremas y no toma en cuenta a los datos restantes.

Las medidas de dispersión, de mayor utilidad en estadística, de la muestra x1 , x2 , x3 , .. . , xn se

definen en relación a la media aritmética x , implican desviaciones o dispersiones respecto a ella, y

se definen por la diferencia x i−x ; luego la desviación o dispersión d i del dato xi , respecto a la

media aritmética es d i=x i−x . Así, una dispersión d i=x i−x será positiva si el dato x i es mayor

que x y negativa en caso contrario. Si las dispersiones d i=x i−x son “pequeñas” entonces los

datos x i están cerca de x , sucede lo contrario si los datos están alejados de x , lo que indica una

mayor variabilidad de la muestra x1 , x2 , x3 , .. . , xn .

Figura 1.14 Dispersión de xi respecto a un promedio P .

58

Page 3: 1 - Carrera Corporativa | UNITEC Web view73. SECCIÓN 1. 4. Medidas de dispersión y de posición. 72. UNIDAD. 1. Estadística descriptiva. Author: pantaleon Created Date: 01/07/2012

SECCIÓN 1.4 Medidas de dispersión y de posición

Para calcular la dispersión de una muestra (evitando las dispersiones negativa) se utilizan

las dispersiones cuadráticas: d i2=( xi−x )2 ,

luego la media aritmética,

∑i=1

n

( x i−x )2

n , de las dispersiones cuadráticas es una “buena” medida de la dispersión existente en una muestra por lo que recibe un nombre especial.

Figura 1.15 Varianza de la muestra x1 , x2 , x3 , .. . , xn .

La varianza presenta la desventaja, en cuanto a su interpretación, de tener unidades cuadráticas, para evitar esto se define la desviación estándar.

Definición 1.10 Varianza y desviación estándar a. La varianza de x1 , x2 , x3 , .. . , xn , es la media aritmética de las de las dispersiones cuadráticas:

s2=∑i=1

n

( x i− x )2

n=

( x1−x )2+. . .+ ( xn−x )2

n .

b. La desviación estándar (o desviación típica) de la muestra x1 , x2 , x3 , .. . , xn es la raíz cuadrada positiva de la varianza:

s=+√s2 =+√∑i=1

n

( x i−x )2

n=+√ ( x1−x )2+ .. .+( xn−x )2

n

Ejemplo 1.21Determine la varianza y la desviación estándar de los dos aspirantes a ser contratados señalados en el problema 1.19.

Examen A1 A2

1 10 82 6 93 8 7

Ambos aspirantes tienen la misma media aritmética: x=8 .

Para A1 la varianza es s1

2=( 10−8 )2+( 6−8 )2+( 8−8 )2

3=8

3 con desviación estándars1=√ 8

3≈1. 633

.

Para A2 la varianza es s2

2=( 8−8 )2+ ( 9−8 )2+( 7−8 )2

3=2

3 con desviación estándar

s2=√ 23≈0 .816

,

luego el aspirante A2 presenta mayor uniformidad (menos dispersión) en sus calificaciones y si se requiere de esta característica es a quién debe contratarse.

59

Page 4: 1 - Carrera Corporativa | UNITEC Web view73. SECCIÓN 1. 4. Medidas de dispersión y de posición. 72. UNIDAD. 1. Estadística descriptiva. Author: pantaleon Created Date: 01/07/2012

UNIDAD 1 Estadística descriptiva

Para una tabla de frecuencias las expresiones para calcular la varianza y la desviación estándar son:

s2=∑i=1

n

f i ( x i−x )2

n y s=+√ ∑

i=1

n

f i ( x i−x )2

n , respectivamente.

Ejemplo 1.22Una encuesta efectuada a los integrantes del Grupo 362 de Estadística I arrojó los siguientes resultados, relativos al número de materias que al momento adeudan.

3 , 4 , 2 , 3 , 3 , 2 , 1 , 0 , 0 , 1 , 3 , 2 , 1 , 0 , 0 , 1 , 3 , 0 , 0 , 2 .a. Construya la tabla de frecuencias asociada. b. Determine la media aritmética, la varianza y la desviación estándar.Solucióna. La frecuencia de x i=3 es f i=5 ,

la frecuencia de x i=2 es f i=4 , etcétera. La tabla de la derecha resume los datos anteriores.

Dato x i

Frecuencia f i

0 61 42 43 54 1

b. La media aritmética es x=6 ( 0 )+4 ( 1 )+4 ( 2 )+5 ( 3 )+1 ( 4 )

20=1 .55

, luego

s2=6 ( 0−1 . 55 )2+4 ( 1−1. 55 )2+4 ( 2−1. 55 )2+5 ( 3−1 .55 )2+1 ( 4−1 .55 )2

20≈1 . 648

y s≈√1 . 648=1 .283 .

En una distribución de frecuencias las relaciones de la varianza y desviación estándar son

s2≈∑i=1

n

( f i ) ( mi−x )2

n y s≈√∑i=1

n

( f i ) ( mi−x )2

n , respectivamente

respectivamente, recuerde que mi (la marca de la clase) es el dato representativo de la clase i .

Ejemplo 1.23Determine la varianza y la desviación estándar de la distribución de frecuencias.

Clase ocategoría

Límites deClase

Li Ls

Frecuencia de clase

f i

Marca de clasemi

A 151 157 3 154B 158 164 15 161C 165 171 14 168D 172 178 7 175

60

Page 5: 1 - Carrera Corporativa | UNITEC Web view73. SECCIÓN 1. 4. Medidas de dispersión y de posición. 72. UNIDAD. 1. Estadística descriptiva. Author: pantaleon Created Date: 01/07/2012

SECCIÓN 1.4 Medidas de dispersión y de posición

E 179 185 9 182F 186 192 11 189G 193 199 0 196H 200 206 1 203

SoluciónLa distribución de frecuencias tiene n=60datos (sume las frecuencias).La media aritmética es

x≈ ( 3 )154+ ( 15 ) 161+ ( 14 )168+( 7 ) 175+( 9 )182+( 11 )189+( 0 ) 196+( 1 ) 2033+15+14+7+9+11+0+1

=172 .9, por tanto

la varianza es:

s2≈( 3 ) ( 154−172. 9 )2+. ..+( 1 ) ( 203−172. 9 )2

3+15+14+7+9+11+0+1=134 .44

,y la desviación estándar

s≈√134 . 44=11.59 .

Resalte la necesidad e importancia de comparar muestras.

Para comparar la variabilidad relativa entre dos muestras se utiliza el coeficiente de variación,

el coeficiente de variación mide el grado de variación o dispersión de la muestra x1 , x2 , x3 , . . . , xn respecto su media aritmética x ; se utiliza para comparar la variación de dos o más muestras.

Definición 1.11 Coeficiente de variación

El coeficiente de variación de x1 , x2 , x3 , . . . , xn se define como CV= s

x ó en forma porcentual como

CV %= s

x100 %

.

El coeficiente de variación presenta gran utilidad al comparar la variabilidad de dos o más muestras que:

Están en unidades diferentes. Están en las mismas unidades pero sus medias aritméticas se encuentran bastante

alejadas.

Ejemplo 1.24Varias medidas de los diámetros de los balines tomados con un aparato de alta precisión A1

tuvieron una media aritmética de 2 .49 milímetros y una desviación estándar muestral de 0 . 012

milímetros y varias medidas de la longitud de un resorte sin estirar tomadas con otro aparato A2

tuvieron una media aritmética de 0 .75 centímetros y una desviación estándar muestral de 0 . 02 centímetros. ¿Cuál de los dos aparatos de medición es más preciso?SoluciónLos coeficientes de variación respectivos son

61

Page 6: 1 - Carrera Corporativa | UNITEC Web view73. SECCIÓN 1. 4. Medidas de dispersión y de posición. 72. UNIDAD. 1. Estadística descriptiva. Author: pantaleon Created Date: 01/07/2012

UNIDAD 1 Estadística descriptiva

para A1 CV%=0 .012

2.49( 100 % )=0 .48 %

,

para A2 CV %= 0 .02

0 .75( 100 % )=0 .27 %

,

por consiguiente, el aparato de medición A2 es más preciso (posee menos variabilidad).

Resalte la utilidad e importancia de la posición de un dato en una muestra.

Para caracteriza la posición que ocupa el dato x i respecto a los restantes datos que componen

la muestra ordenada x1 , x2 , x3 , .. . , xn y responderemos la pregunta ¿qué número es mayor que una proporción específica de los datos de la muestra? Antes de establecer de manera formal la definición de “cuantil” veamos su significado en las siguientes situaciones.

Ejemplo 1.25a. La siguiente muestra ordenada consta de n=30 datos:

el 50 % de los 30 datos es 15 (que equivale a n2 ), por tanto, la mediana ~x se encuentra entre los

datos x15=45 y x16=46 , la diferencia entre ellos es x16−x15=1 , por tanto “el 50% de la diferencia

es 0 . 50 ( x16−x15 )=0 .5 ” que agregada a x15=45 da XC 50=~x=45 .5 el valor de la mediana.

b. Para obtener medidas de localización de mayor finura que la mediana, es preciso dividir la muestra en más de dos partes. Por ejemplo, si la muestra (previamente ordenada) se divide en cuatro partes iguales, cada dato de división se denomina cuartil, el número de datos mayores que

el dato correspondiente al tercer cuartil (que suele representarse por XC 75 ) son la cuarta parte

superior del conjunto de datos, el segundo cuartil (que suele representarse por XC 50 ) coincide con

la mediana y el primer cuartil (que se representa por XC 25 ) es el valor que separa la cuarta parte inferior de los datos de las tres cuartas partes superiores.Sea la muestra ordenada:

en ella, el 25 % de los 30 datos corresponde a 7 .5 de ellos (que equivale a n4 ), por tanto el primer

cuartil se encuentra entre los datos x7=37 y x8=38 , la diferencia entre ellos es x8−x7=1 , por

tanto “el 25% de la diferencia es 0 . 25 ( x8−x7 )=0 . 25 ” que agregada al dato menor de ellos da XC 25=37 .25 .

62

Page 7: 1 - Carrera Corporativa | UNITEC Web view73. SECCIÓN 1. 4. Medidas de dispersión y de posición. 72. UNIDAD. 1. Estadística descriptiva. Author: pantaleon Created Date: 01/07/2012

SECCIÓN 1.4 Medidas de dispersión y de posición

El tercer cuartil (que se representa por XC 75 ) se calcula de manera similar y es XC 75=52 . 25 , así

En general, el valor XCi de la variable X que separa el Ci por ciento de los datos menores de la

muestra x1 , x2 , x3 , . .. , xn de los restantes datos de la muestra se conoce i - ésimo cuantil.

Definición 1.12 CuantilSea x1 , x2 , x3 , . .. , xn una muestra ordenada ascendentemente, el cuantil

XCi es el valor x i de X

tal que i por ciento de los datos son menores a x i y el otro ( 100−i ) % son mayores a x i .

El método presentado en las líneas anteriores lo generaliza la siguiente proposición.

Proposición 1.1 Ubicación de un cuantilSea x1 , x2 , x3 , . .. , xn una muestra ordenada en forma ascendente, el cuantil

XCi se localiza en la

posición LXCi

=( n+1 ) i100 y está dado por

XC i=x [ LCI ]−1+XCi

100 ( x [ LCI ]−x [ LCI ]−1 )

Ejemplo 1.26Los siguientes datos representan el número de tacos que comieron 20 personas el mes pasado.165 , 135 , 151 , 153 , 155 , 182 , 142 , 158 , 146 , 149 , 124 , 162 , 173 , 204 , 159 , 130 , 177 , 162 , 141 , 156 .

Determine: a. El cuantil 13 . b. El cuantil 48 . c. El cuantil 87 .SoluciónLos datos ordenados son:124 , 130 , 135 , 141 , 142 , 146 , 149 ,151 , 153 , 155 ,156 , 158 , 159 , 162 , 162 , 165 , 173 , 177 , 182 , 204 .

a. Puesto que LXC13=( 20+1 ) ( 0 .13 )=2 .73 , con parte decimal 0 .73 , el cuantil XC 13 se localiza entre x2=130 y x3=135 , la diferencia entre ellos es x3−x2=5 , por tanto 0 . 73 ( x3−x2 )=0. 73 ( 5 )=3 .65 y si

agregamos esta cantidad a x2=130 obtenemos XC 13=130+3.65=133. 65 ;

ello significa que el 13% de los datos de la muestra son menores a XC 13=133 .65 .

b. LXC48=( 20+1 ) ( 0 .48 )=10. 08 , con parte decimal 0 .08 , el cuantil XC 48 se localiza entre x10=155 y x11=156 , así x11−x10=1 , luego 0 .08 ( x11−x10 )=0 .08 ( 156−155 )=0 .08 y XC 48=155+0 .08=155 .08 ; el 48 %

de los datos son menores a XC 48=155.08 .

c. LXC87= ( 20+1 ) ( 0 .87 )=18 . 27 , con parte decimal 0 .27 , el cuantil XC 87 se localiza entre x18=177 y x19=182 , puesto que x19−x18=5 , entonces 0 . 27 ( x19−x18 )=0.27 ( 182−177 )=1 .35 y XC 87=177+1. 35=178. 35 ; el 87 % de los datos de la muestra son menores a XC 87=178. 35 .

63

Page 8: 1 - Carrera Corporativa | UNITEC Web view73. SECCIÓN 1. 4. Medidas de dispersión y de posición. 72. UNIDAD. 1. Estadística descriptiva. Author: pantaleon Created Date: 01/07/2012

UNIDAD 1 Estadística descriptiva

Para calcular el cuantil XCi de una muestra presentada en forma de tabla de frecuencias conviene calcular las

frecuencias acumuladas (f ai ), el tamaño de la muestra

(recuerde que n=f 1+f 2+⋯+f n−1+ f n ), la posición del

centil LXCi=( n+1 ) i

100 misma que debe localizarse en la columna correspondiente a las frecuencias acumuladas.

Dato x i

Frecuencia f i

x1 f 1x2 f 2⋮ ⋮

xn−1 f n−1xn f n

Ejemplo 1.27La tabla de la derecha corresponde a los peso

en gramos de 150 ratas atrapadas en los alrededores del expendio de tortas “El Dragón”.Determine: a. El cuantil 27 .

b. El cuantil 60 .

SoluciónDato x i

Frecuencia f i

Frecuencia acumuladaf ai

Desde Hasta

125 23 23 x1 x23

137 67 90 x23 x90

143 25 115 x91 x115

162 25 140 x116 x140

170 10 150 x141 x150

a. La posición del cuantil 27 es LXC 27= ( 150+1 ) ( 0 .27 )=40.77 , con parte decimal 0 .77 , así el cuantil XC 27 se localiza entre los datos x40=137 y x41=137 , la diferencia entre ellos es x41−x40=0 , por

tanto 0 . 77 ( x41−x40 )=0 y si agregamos esta cantidad al menor de estos datos obtenemos XC 27=137+0=137 ,

ello significa que el 27 % de las ratas tienen pesos menores que 137 gramos.

b. La posición del cuantil 60 es LXC60=( 150+1 ) ( 0 .60 )=90 . 6 , es decir, el cuantil XC 60 se localiza

entre x90=137 y x91=143 , la diferencia entre ellos es x91−x90=143−137=6 , por tanto 0 . 60 ( 6 )=3. 60

y si agregamos esta cantidad al menor de estos datos obtenemos XC 60=137+3 .6=140 .6 , el 60 % de

las ratas tienen pesos menores a 140 .6 gramos.

El cálculo de cuantiles de la distribución de frecuencias Clase o categoría Límites de Clase Frecuencia

Dato x i

Frecuencia f i

125 23137 67143 25162 25170 10

64

Page 9: 1 - Carrera Corporativa | UNITEC Web view73. SECCIÓN 1. 4. Medidas de dispersión y de posición. 72. UNIDAD. 1. Estadística descriptiva. Author: pantaleon Created Date: 01/07/2012

SECCIÓN 1.4 Medidas de dispersión y de posición

Li Ls f iA LiA LsA f AB LiB LsB f B⋮ ⋮ ⋮

se efectúa por medio de la relación XCi=LM+C

f i (i

100( n )−G)

, en donde:

La clase del cuantil i : es aquella clase que contiene al dato con índice entero ( i ) ( n ) previamente redondeado “hacia arriba”.

LM es el límite real inferior de la clase del cuantil.

C es la medida o ancho de la clase del cuantil.

f i es la frecuencia de la clase del cuantil.

G es la frecuencia acumulada de clase anterior a la clase del cuantil.El ejemplo 1.28 ilustra el uso de la fórmula anterior.

Ejemplo 1.28Para la distribución de frecuencias

Clase

Límitesde claseLi Ls

Límites realesde claseLri Lrs

Frecuenciaf i

Frecuencia acumulada

f aiDesde Hasta

A 279 284 278 .5 284 . 5 7 7 x1 x7B 285 290 284 .5 290 .5 3 10 x8 x10C 291 296 290 .5 296 . 5 7 17 x11 x17D 297 302 296 . 5 302 .5 12 29 x18 x29E 303 308 302 .5 308 .5 8 37 x30 x37F 309 314 308 .5 314 . 5 9 46 x38 x46G 315 320 314 .5 320 .5 13 59 x47 x59H 321 326 320 .5 326 . 5 1 60 x60 x60

determine:

a. El cuantil 20 . b. El cuantil 56 . c. El cuantil 60 . d. El cuantil 75 . e. El cuantil 92 .Solucióna. n=60 entonces ( 0 .20 ) ( 60 )=12 , luego la clase de XC 20 es la que contiene a x12 es decir la C ,

así XC 20=290. 5+ 6

7 ( ( 0 .20 ) ( 60 )−10 )=292 .21, luego el 20 % de los datos es menor a 292 .21 .

b. Puesto que n=60 entonces ( 0 . 56 ) ( 60 )=33 .6 , luego la clase de XC 56 es la que contiene a x37 ,

la clase E , así XC 56=302. 5+6

8 ( ( 0.56 ) ( 60 )−29 )=305 .95, en consecuencia el 56 % de los datos es

menor a 305 . 95 .

c. ( 0 . 60 ) ( 60 )=36 , de XC 60 es la E , así XC 60=302 .5+6

8 ( ( 0. 60 ) ( 60 )−29 )=307 .75, el 60 % de los

datos es menor a 307 . 75 .

65

Page 10: 1 - Carrera Corporativa | UNITEC Web view73. SECCIÓN 1. 4. Medidas de dispersión y de posición. 72. UNIDAD. 1. Estadística descriptiva. Author: pantaleon Created Date: 01/07/2012

UNIDAD 1 Estadística descriptiva

d. ( 0 . 75 ) ( 60 )=45 , la clase del cuantil XC 75 es la F y XC 75=308 .5+ 6

9 ( ( 0 .75 ) ( 60 )−37 )=313 .83, así

el 75 % de los datos son menores a 313 . 83 .

e. Puesto que ( 0 . 92 ) ( 60 )=55 .2 , la clase que contiene a XC 92 es la G , así

XC 92=314 .5+ 613 ( ( 0 . 92 ) ( 60 )−46 )=318 .75

.

Resalte la necesidad e importancia de describir el comportamiento de una muestra mediante un diagrama de caja.

DIAGRAMAS DE CAJA Los diagramas de caja y bigote son gráficos utilizados en la descripción del comportamiento de

la muestra x1 , x2 , x3 , . .. , xn representada en cualquiera de sus formas (tabla o distribución de frecuencias); estos diagramas describen simultáneamente: la tendencia central, la dispersión y simetría de la muestra; asimismo permiten identificar con claridad y de forma individual, observaciones que se alejan de manera poco usual del resto de los datos. Un diagrama de caja y bigote consiste en un rectángulo (caja) de cuyos lados, superior e inferior, se derivan respectivamente, dos segmentos: uno hacia arriba y uno hacia abajo (bigotes). La caja y los bigotes son paralelos a un eje rotulado, que contiene el recorrido de la variable de interés. Uno de los diagramas de caja más comunes se construye tomando como base:

xmín , xmáx y los cuantiles 25 % , 50 % , 75 % y con el siguiente algoritmo:

Identifique xmín , xmáx y calcule los cuantiles 25 % , 50 % , 75 % . Trace el eje X y marque segmentos perpendiculares (punteados) al eje X sobre los

puntos: xmín , xmáx y los cuantiles XC 25 , XC 50 y XC 75 . Trace un rectángulo, justo arriba del eje X , de manera que dos de sus lados coincidan con

los segmentos de los cuantiles XC 25 y XC 75 . Trace segmentos de recta, horizontales, con extremos en los puntos medios de la caja y

las vertical correspondiente a xmín , xmáx .

Calcule el rango intercuartílico RIQ=XC 75−XC 25 . Trace los límites de detección de valores extremos:

límite inferior=X C25−1. 5 ( RIQ ) y límite superior=XC 75+1 .5 ( RIQ ) .

Figura 1.16 Diagrama de caja.

Ejemplo 1.29Los siguientes datos representan el número de tacos que comieron 20 personas el mes pasado.124 , 130 , 135 , 141 , 142 , 146 , 149 ,151 , 153 , 155 ,156 , 158 , 159 , 162 , 162 , 165 , 173 , 177 , 182 , 204 .

66

Page 11: 1 - Carrera Corporativa | UNITEC Web view73. SECCIÓN 1. 4. Medidas de dispersión y de posición. 72. UNIDAD. 1. Estadística descriptiva. Author: pantaleon Created Date: 01/07/2012

SECCIÓN 1.4 Medidas de dispersión y de posición

Las posiciones de XC 25 , XC 50 y XC 75 son respectivamente:LXC 25=0. 25 ( 20+1 )=5.25 , LXC50=0 .50 ( 20+1 )=10.5 y LXC75=0 . 75 ( 20+1 )=15. 75 , luego

XC 25=142+0. 25 ( x6−x5 )=142+0 .25 ( 146−142 )=143XC 50=155+0.25 ( x11−x10 )=155+0 . 25 ( 156−155 )=155 .25XC 75=162+0 . 75 ( x16−x15 )=162+0. 75 ( 165−162 )=164 . 25 .

En consecuencia, el rango intercuartílico es XC 75−XC 25=164 .25−143=21. 25 , y los límites superior e inferior:

límite inferior=143−1. 5 ( 21.25 )=111. 125 y límite superior=164 . 25+1 .5 ( 21 .25 )=196 . 125 .

La figura 1.17 muestra el diagrama de caja correspondiente.

Figura 1.17 Diagrama de caja del ejemplo1.29.

Observe que el dato 204 es atípico.

En un diagrama de caja, la “caja” contiene el cincuenta por ciento central de los datos y que las otras dos cuartas partes restantes quedan una de cada lado de la misma. Las observaciones que quedan fuera de las barreras exteriores son datos atípicos extremos.

Para construir el diagrama de caja de la muestra presentada en forma de tabla de frecuencias conviene

calcular las frecuencias acumuladas (f ai ), el procedimiento a seguir es el mismo que en el caso de datos sin tratar.

Dato x i

Frecuencia f i

x1 f 1x2 f 2⋮ ⋮

xn−1 f n−1xn f n

Ejemplo 1.30Si

Dato Frecuencia Desde Hasta

67

Page 12: 1 - Carrera Corporativa | UNITEC Web view73. SECCIÓN 1. 4. Medidas de dispersión y de posición. 72. UNIDAD. 1. Estadística descriptiva. Author: pantaleon Created Date: 01/07/2012

UNIDAD 1 Estadística descriptiva

x i f i125 23 x1 x23137 67 x24 x90143 25 x91 x115162 25 x116 x140170 10 x141 x150

entonces n=23+67+25+25+10=150 , así LXC 25=0.25 ( 150+1 )=37 .75 , LXC50=0 . 50 ( 150+1 )=75 . 50 y LXC 75=0 .75 ( 150+1 )=113 .25 ,

luegoXC 25=137+0 .75 ( x38−x37 )=137+0 .75 ( 137−137 )=137XC 50=137+0 .50 ( x76−x75 )=137+0 .50 ( 137−137 )=137XC 75=143+0. 25 ( x114−x113 )=143+0 . 25 ( 143−143 )=143 .

En consecuencia, el rango intercuartílico esRIQ=XC 75−XC 25=162 .75−137=25. 75

y límite inferior=137−1.5 ( 25 .75 )=99 . 375 y límite superior=162 .75+1 .5 ( 25. 75 )=201. 375 .

La figura 1.18 muestra el diagrama de caja correspondiente.

Figura 1.18 Diagrama de caja del problema 1.30.

Ejemplo 1.31Si

Clase

Límites realesde claseLri Lrs

Frecuenciaf i

Desde Hasta

A 278 .5 284 . 5 7 x1 x7B 284 . 5 290 .5 3 x8 x10C 290 .5 296 .5 7 x11 x17D 296 . 5 302 .5 12 x18 x29E 302 .5 308 .5 8 x30 x37F 308 .5 314 . 5 9 x38 x46G 314 . 5 320 .5 13 x47 x59H 320 .5 326 .5 1 x60 x60

68

Page 13: 1 - Carrera Corporativa | UNITEC Web view73. SECCIÓN 1. 4. Medidas de dispersión y de posición. 72. UNIDAD. 1. Estadística descriptiva. Author: pantaleon Created Date: 01/07/2012

SECCIÓN 1.4 Medidas de dispersión y de posición

Puesto que n=60 , entonces:LXC25=0. 25 ( 60+1 )=15. 25 , LXC50=0 . 50 ( 60+1 )=30. 5 , LXC75=0 . 75 ( 60+1 )=45 .75 ,

luego: XC 25=290. 5+ 67 ( ( 0 .25 ) ( 60 )−10 )=294 . 78

XC 50=302 .5+ 68 ( ( 0.50 ) ( 60 )−29 )=303 .25

XC 75=308 . 5+ 69 ( ( 0 .75 ) ( 60 )−37 )=313 . 83

.

En consecuencia, el rango intercuartílico es XC 75−XC 25=313 .83−294 . 78=19 . 05 .Así

límite inferior=294 .78−1.5 ( 19.05 )=266 .205y límite superior=313 .83+1.5 ( 19 .05 )=342 . 405 .El diagrama de caja correspondiente se muestra en la figura 1.19.

Figura 1.19 Diagrama de caja del problema 1.31.

Los ejercicios de apoyo 1.4 pueden serle útiles en el desarrollo de su curso y en consecuencia en la concreción de los propósitos y aprendizajes señalados en los planes y programas de estudio.

EJERCICIOS DE APOYO 1.4

1. Los periodos de tiempo, en horas, que 10 víctimas esperaron en una delegación de policía antes de ser atendidos fueron:

5 , 11 , 9 , 5 , 10 , 15 , 6 , 10 , 5 , 6 .Determine la amplitud de variación, la varianza y la desviación estándar.

2. Los tiempos, en segundos, de reacción de una

muestra aleatoria de 9 individuos sujetos a un estimulante fueron:

2 .5 , 3 .6 , 3 .1 , 4 .3 , 2 .9 , 2 .3 , 2 .6 , 4 .1 , 3 .4 .Determine la amplitud de variación, la varianza y la desviación estándar.

3. Los empleados de una escuela local realizaron las siguientes donaciones, en cientos de pesos, a un compañero victima de robo:

10 , 40 , 25 , 5 , 20 , 10 , 25 ,30 , 10 , 5 , 15 ,

25 , 50 , 10 , 5 , 25 , 45 , 15 , 50 , 30 , 55 .

Determine la amplitud de variación, la varianza y la desviación estándar.

4. Los pesos, en kilogramos, de 15 marranitos al nacer fueron:

1 .5 , 1 .6 , 1 .1 ,1 .4 , 1 .2 , 1 .2 , 1 .3 ,1 .4 ,

1 .3 , 1 .6 , 1 .1 ,1 .9 , 1 .1 , 1 .3 , 1 .1 .

Determine la amplitud de variación, la varianza y la desviación estándar.

5. Un artículo elaborado por la sección de medicina deportiva de la UNAM, reportó los siguientes datos sobre el esfuerzo realizado por un solo brazo en el levantamiento de una pesa:

244 , 191 , 160 , 187 ,180 , 176 , 174 ,

6. La propagación de grietas por desgaste en piezas de los autobuses ha sido objeto de estudio en años recientes. Los siguientes datos muestran el tiempo en que su propagación (horas de

recorrido/104) hasta volverse peligrosas:

69

Page 14: 1 - Carrera Corporativa | UNITEC Web view73. SECCIÓN 1. 4. Medidas de dispersión y de posición. 72. UNIDAD. 1. Estadística descriptiva. Author: pantaleon Created Date: 01/07/2012

UNIDAD 1 Estadística descriptiva

205 ,211 , 183 , 211 , 180 ,194 , 200 .a. Determine la amplitud de variación, la varianza y la desviación estándar.

b. Cambie el primer dato por 204 . ¿Cómo cambian las medidas anteriores? c. ¿Cuál es el correspondiente porcentaje de ajuste?

0 .736 , 0 .863 , 0 .865 , 0 .913 , 0 .915 ,1 .394 ,0 .937 , 0 .983 , 1 .007 , 1 .011 , 1 .064 ,1 .090 ,

1 .132 ,1 .140 , 1 .153 , 1 .253 .a. Determine la amplitud de variación, la varianza y la desviación estándar.b. Determine el coeficiente de variación.c. Interprete los resultados anteriores.

7. En un reporte científico sobre el estudio del grueso de la capa de nieve en los distintos continentes, se incluyeron las siguientes diez

observaciones de la capa de nieve en octubre: 6 .5,12 .0 , 14 . 9 , 10 . 0 , 10 .7 , 7 .9 , 21 .9 , 12 .5 ,14 . 5 , 9 .2 ,centímetros cuadrados.a. Determine la amplitud de variación, la varianza y la desviación estándar.b. Determine el coeficiente de variación.c. Interprete los resultados anteriores.

8. Los siguientes datos corresponden a los tiempos (en segundos) utilizados, en una

competencia por 10 personas de edad madura en

recorrer 100 metros:104 , 104 .8 , 101 .6 , 108 . 0 , 103 . 8 ,100 . 8 , 104 . 2 , 10 .2 , 102 .4 , 101 . 4 .

a. Determine la amplitud de variación, la varianza y la desviación estándar.b. Determine el coeficiente de variación.c. Interprete los resultados anteriores.

9. En un estudio sobre la relación entre la edad y varias funciones visuales, por ejemplo, agudeza y percepción de profundidad, se reportaron las siguientes observaciones sobre el área de la lámina esclerótica

(en mm2) de cabezas de nervios ópticos humanos:

4 .33 , 3 . 46 , 4 .52 , 2 .75 , 2 .62 , 2 .74 ,3 .56 , 2 .34 , 2 .74 , 3 .93 , 4 .21 , 3 .88 ,2 .78 , 3 . 85 , 2 .433 .01 , 3 .65 .a. Determine la amplitud de variación, la varianza y la desviación estándar.

b. A cada dato agregue 5 y calcule la varianza al grupo de datos así obtenido, compare sus resultados.

c. Multiplique por 4 cada dato y calcule la varianza, compare sus resultados con los del inciso anterior.

10. Los tiempos de reacción de una muestra aleatoria de 9 individuos sujetos a un estimulante fueron 2 .5 , 3 .6 , 3 .1 , 4 .3 , 2 .9 , 2 .3 , 2 .6 , 4 .1 y 3 . 4 segundos. Calcule: la amplitud de variación, la varianza y la desviación estándar y el coeficiente de variación.

11. Para la tabla de frecuencias:

x i 115 116 117 118 120 121 122 123 124

f i 4 6 9 8 5 10 6 8 4

calcule la amplitud de variación, la varianza, la desviación estándar y el coeficiente de variación.

12. Para la tabla de frecuencias:

x i −3 −2 −1 0 1 2 3 4

f i 18 18 20 24 10 10 8 2

Calcule: la amplitud de variación, la varianza, la desviación estándar y el coeficiente de variación.

13. Con la tabla de frecuencias: 14. Considere la siguiente tabla de frecuencias:

x i f i100 16200 24

300 12

400 10500 8600 5700 2

x i f i10 412 614 215 4

20 4

70

Page 15: 1 - Carrera Corporativa | UNITEC Web view73. SECCIÓN 1. 4. Medidas de dispersión y de posición. 72. UNIDAD. 1. Estadística descriptiva. Author: pantaleon Created Date: 01/07/2012

SECCIÓN 1.4 Medidas de dispersión y de posición

calcule la amplitud de variación, la varianza, la desviación estándar y el coeficiente de variación.

calcule la amplitud de variación, la varianza, la desviación estándar y el coeficiente de variación.

15. Para la tabla de frecuencias:

x i f i10 612 614 218 820 4

calcule la amplitud de variación, la varianza, la desviación estándar y el coeficiente de variación.

16. Para la distribución de frecuencias:Límites reales Frecuencia

60 65 4

65 70 4

70 75 575 80 12

80 85 12

85 90 4

90 95 4calcule la amplitud de variación, la varianza, la desviación estándar y el coeficiente de variación.

17. A continuación se muestra la distribución de los tiempos necesarios para transcribir un conjunto de notas taquigrafiadas.

Límites reales Frecuencia4 .5 9 .5 39 .5 14 . 5 814 . 5 19 .5 12

19 .5 24 . 5 1524 . 5 29 .5 1029 .5 34 . 5 2

Calcule la amplitud de variación, la varianza, la desviación estándar y el coeficiente de variación e interprételos.

18. La siguiente distribución muestra los pesos de

los alumnos del grupo 652 de Estadística.

Límites Frecuencia46 52

4

53 59 660 66 14

67 73 874 80 581 87 3

Calcule la amplitud de variación, la varianza, la desviación estándar y el coeficiente de variación e interprételos.

19. Para la distribución de frecuencias de la 20. Las velocidades de 50 ciclistas que participaron en una carrera se midieron mediante un dispositivo de radar en una de las vías rápidas de de la ciudad de Monterrey. La distribución de frecuencias se muestra a continuación.

Límites reales Frecuencia47 . 5 52 .5 852 .5 57 .5 11

57 .5 62 .5 1362 .5 67 .5 1067 . 5 72 .5 5

71

Page 16: 1 - Carrera Corporativa | UNITEC Web view73. SECCIÓN 1. 4. Medidas de dispersión y de posición. 72. UNIDAD. 1. Estadística descriptiva. Author: pantaleon Created Date: 01/07/2012

UNIDAD 1 Estadística descriptiva

19. Para la distribución de frecuencias de la variable “Estás mejor aquí que allá enfrente”:

Calcule la amplitud de variación, la varianza, la desviación estándar y el coeficiente de variación e interprételos.

72 .5 77 .5 1

77 . 5 82 .5 2Calcule la amplitud de variación, la varianza, la desviación estándar y el coeficiente de variación e interprételos.

21. Para los datos del problema 3 calcule:

a. El cuantil 16 .

b. El cuantil 58 .

c. ¿Qué número es mayor al 43 % de los datos?

22. Para 736 , 863 , 865 , 913 , 915 , 937 , 983 ,1007 , 1011 , 1064 , 1090 , 1132 , 1140 , 1153 , 1253 ,1394 , calcule:

a. El cuantil 8 . b. El cuantil 42 .

23. Para la tabla del problema 11 calcule e interprete:

a. El cuantil 8 . b. El cuantil 32 .

c. El cuantil 43 . d. El cuantil 72 .

e. ¿Bajo qué valor se encuentran el 39 % de los datos?

24. Para la tabla del problema 12 calcule e interprete:

a. El cuantil 13 . b. El cuantil 25 .

c. El cuantil 75 . d. El cuantil 95 .

f. ¿Bajo qué valor se encuentran el 39 % de los datos?

25. En el problema 13 calcule e interprete:

a. El cuantil 10 . b. El cuantil 30 .

c. El cuantil 70 . d. El cuantil 81 .

e. ¿Bajo qué valor se encuentran él 62 % de los datos?

26. En el problema 14 calcule e interprete:

a. El cuantil 15 . b. cuantil 35 .

c. El cuantil 50 . d. El cuantil 75 .

e. ¿Bajo qué valor se encuentran él 25 % de los datos?

27. Para la distribución de frecuencias del problema 16 calcule:

a. El cuantil 25 . b. El cuantil 50 .

c. El cuantil 75 . d. El cuantil 91 .

e. ¿Bajo qué valor se encuentran él 41 % de los datos?

28. Para la distribución de frecuencias del problema 17 calcule:

a. El cuantil 20 . b. El cuantil 60 .

c. El cuantil 80 . d. El cuantil 94 .

e. ¿Bajo qué valor se encuentran él 39 % de los datos?

29. Para la distribución de frecuencias del problema 18 calcule:

30. Para la distribución de frecuencias del problema 20 calcule:

Clase

Límites realesLri Lrs

Frecuenciaf i

A 278 .5 284 . 5 7B 284 . 5 290 .5 3C 290 .5 296 . 5 7D 296 . 5 302 .5 12

E 302 .5 308 .5 8F 308 .5 314 . 5 9G 314 . 5 320 .5 13H 320 .5 326 . 5 1

72

Page 17: 1 - Carrera Corporativa | UNITEC Web view73. SECCIÓN 1. 4. Medidas de dispersión y de posición. 72. UNIDAD. 1. Estadística descriptiva. Author: pantaleon Created Date: 01/07/2012

SECCIÓN 1.4 Medidas de dispersión y de posición

a. El cuantil 13 . b. El cuantil 29 .

c. El cuantil 45 . d. El cuantil 91 .

e. ¿Bajo qué valor está el 61 % de los datos?

a. El cuantil 12 .5 . b. El cuantil 36 . 8 .

c. El cuantil 48 .5 . d. El cuantil 55 .4 .

e. ¿Bajo qué valor está el 13 .18 % de los datos?31. Construya e interprete el diagrama de caja de los datos del:a. Problema 1. b. Problema 2.c. Problema 3. d. Problema 4.

32. Construya e interprete el diagrama de caja de los datos del:a. Problema 5. b. Problema 6.c. Problema 7. d. Problema 8.

33. Construya e interprete el diagrama de caja de los datos:a. Problema 11. b. Problema 12.c. Problema 13.

34. Construya e interprete el diagrama de caja de los datos del:a. Problema 14. b. Problema 15.

35. Construya e interprete el diagrama de caja de los datos:a. Problema 16. b. Problema 17.c. Problema 18.

36. Construya e interprete el diagrama de caja de los datos del:a. Problema 19. b. Problema 20.

Puede implementar algunas de las actividades 1.4 en el desarrollo para la concreción de los propósitos y aprendizajes señalados en los planes y programas de estudio.

ACTIVIDADES DE APOYO 1.4

ACTIVIDAD G1Investigación de campo (cuarta parte)Pregunte a por lo menos sesenta de sus compañeros el número de direcciones que se encuentran en su celular y con la información obtenida construya la distribución de frecuencias. Luego trace los gráficos correspondientes. Calcule los promedios. Calcule las medidas de dispersión antes estudiadas.

ACTIVIDAD G2Investigación de campo (cuarta parte)Pregunte a sus compañeros la altura de sus padres, anótelas y con la información obtenida construya la distribución de frecuencias correspondiente. Luego trace los gráficos correspondientes. Calcule los promedios. Calcule las medidas de dispersión antes estudiadas.

ACTIVIDAD G3Investigación de campo (cuarta parte)Consiga un “flexómetro”, mida la envergadura de sus compañeros de grupo (en centímetros), anótelas y con la información obtenida construya la distribución de frecuencias correspondiente. Trace los gráficos correspondientes. Calcule los promedios. Calcule las medidas de dispersión antes estudiadas.

ACTIVIDAD G4Investigación de campo (cuarta parte)Anote las placas de los siguientes 80 automóviles que observe, con la información obtenida construya la distribución de frecuencias correspondiente, luego trace los gráficos vistos en la presente sección. Calcule los promedios. Calcule las medidas de dispersión antes estudiadas.

ACTIVIDAD Determine la varianza y la desviación estándar de los siguientes conjuntos de datos:

73

Page 18: 1 - Carrera Corporativa | UNITEC Web view73. SECCIÓN 1. 4. Medidas de dispersión y de posición. 72. UNIDAD. 1. Estadística descriptiva. Author: pantaleon Created Date: 01/07/2012

UNIDAD 1 Estadística descriptiva

a. { 10 , 10 , 10 , 10 , 10 , 10 , 10 } . b. { 1 , 1 , 1 , 1 , 1 , 1 , 1 , 1 , 1 , 1 , 1, 1 , 1 , 1 } .c. Establezca una conclusión respecto al valor de la varianza muestral de una muestra en la que todos los datos son iguales.

ACTIVIDAD

A cada dato del conjunto { 2 , 1 , 1, 1 , 2 , 1 , 2, 2 , 1 , 1 , 1 , 2, 1 , 2 } , agregue 5 unidades y calcule la varianza muestral, ¿cómo cambia esta? ¿Puede establecer una regla?

Reste ahora 1 unidad a cada dato y calcule los promedios, ¿cómo cambian éstos? ¿Puede establecer una regla?

ACTIVIDAD

Multiplique los datos del conjunto { 2 , 1 , 1, 1 , 2 , 1 , 2, 2 , 1 , 1 , 1 , 2, 1 , 2 } por 5 y calcule la varianza, ¿cómo cambia ésta? ¿Puede establecer una regla general?

ACTIVIDAD

Pregunte la estatura a 10 de sus compañeros y a 10 de sus compañeras de clase.Calcule los coeficientes de variación e indique quienes presentan mayor variación relativa.

74