soluciones unidad i 1.2 definición de población, muestra

33
166 SOLUCIONES UNIDAD I EJERCICIOS PROPUESTOS 1.1 Definición de estadística. Tipos de estadística (descriptiva e inferencial) 1.- a. Descriptiva b. Inferencial c. Descriptiva d. Inferencial 2.- a. Descriptiva b. Probabilidad c. Descriptiva d. Probabilidad e. Descriptiva f. Descriptiva g. Probabilidad h. Descriptiva 3.- a. Falsa. Porque también estudia características cuantitativas. b. Falsa. Porque también le interesan fenómenos cualitativos. c. Falsa. Porque también organiza, tabula, obtiene conclusiones a partir de ellos. d. Verdadera. e. Verdadera. f. Verdadera. g. Verdadera. h. Verdadera. i. Falsa. Lo planteado corresponde a la definición de población. 1.2 Definición de población, muestra, parámetro, estadístico, variable y datos. 1.- a. Personas con hipertensión. b. 5000 personas con hipertensión. c. La proporción de personas cuya hipertensión puede ser controlada con un nuevo medicamento. d. Personas con hipertensión. e. Proporción de hipertensos que pudieron controlar su hipertensión utilizando el nuevo medicamento. f. Proporción de 5000 individuos hipertensos que pudieron controlar su hipertensión utilizando el nuevo medicamento. Su valor es 4/5 g. No se conoce, pero se estima a partir de la muestra obtenida. 2.- a. Estudiantes de cierta universidad. b. El costo de todos sus libros comprados en un semestre. 3.- a. Población: Total de hinchas chilenos que asistieron al estadio El Centenario. Muestra: 51 de los hinchas que asistieron al estadio El Centenario. b. Población: Alumnos que rindieron PSU. Muestra: 517 futuros estudiantes de universidad

Upload: others

Post on 15-Nov-2021

7 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: SOLUCIONES UNIDAD I 1.2 Definición de población, muestra

166

SOLUCIONES

UNIDAD I

EJERCICIOS PROPUESTOS

1.1 Definición de estadística. Tipos de

estadística (descriptiva e inferencial)

1.-

a. Descriptiva

b. Inferencial

c. Descriptiva

d. Inferencial

2.-

a. Descriptiva

b. Probabilidad

c. Descriptiva

d. Probabilidad

e. Descriptiva

f. Descriptiva

g. Probabilidad

h. Descriptiva

3.-

a. Falsa. Porque también estudia

características cuantitativas.

b. Falsa. Porque también le interesan

fenómenos cualitativos.

c. Falsa. Porque también organiza,

tabula, obtiene conclusiones a partir

de ellos.

d. Verdadera.

e. Verdadera.

f. Verdadera.

g. Verdadera.

h. Verdadera.

i. Falsa. Lo planteado corresponde a la

definición de población.

1.2 Definición de población, muestra,

parámetro, estadístico, variable y

datos.

1.-

a. Personas con hipertensión.

b. 5000 personas con hipertensión.

c. La proporción de personas cuya

hipertensión puede ser controlada con

un nuevo medicamento.

d. Personas con hipertensión.

e. Proporción de hipertensos que

pudieron controlar su hipertensión

utilizando el nuevo medicamento.

f. Proporción de 5000 individuos

hipertensos que pudieron controlar su

hipertensión utilizando el nuevo

medicamento. Su valor es 4/5

g. No se conoce, pero se estima a partir

de la muestra obtenida.

2.-

a. Estudiantes de cierta universidad.

b. El costo de todos sus libros

comprados en un semestre.

3.-

a. Población: Total de hinchas chilenos

que asistieron al estadio El

Centenario.

Muestra: 51 de los hinchas que

asistieron al estadio El Centenario.

b. Población: Alumnos que rindieron

PSU.

Muestra: 517 futuros estudiantes de

universidad

Page 2: SOLUCIONES UNIDAD I 1.2 Definición de población, muestra

167

4.-

a. Costo medio de los libros escolares

por semestre.

b. Costo de los libros escolares.

c. Gasto promedio en libros de texto de

50 estudiantes admitidos.

d. Se utilizarían para predecir los gastos

promedios de libros de texto que hace

la población.

5.-

a. Un población es aquel conjunto de

personas o cosas que se desea

estudia, por ejemplo, se quiere saber

cuántos niños del 5to básico tienen

celular, en este caso el curso

completo es la población y una

muestra seria una parte del curso, no

su totalidad.

b. Se debe tomar en cuenta una muestra

ya que para un estudio muchas veces

la población es demasiado grande y

poco accesible.

6.-

a. Proporción de personas que votaran

por cierto candidato.

b. 1/6 de las personas votará por cierto

candidato.

c. No se puede asegurar si es falsa o

correcta por que se encuesto a una

muestra muy pequeña.

1.3 Clasificación de variables. Escalas

de medición.

1.-

a. Cuantitativa continua.

b. Cuantitativa discreta.

c. Cualitativa ordinal.

d. Cualitativa nominal.

e. Cuantitativa discreta.

f. Cualitativa nominal.

g. Cualitativa nominal.

h. Cuantitativa continua.

i. Cuantitativa discreta.

j. Cuantitativa continua.

k. Cualitativa ordinal.

l. Cualitativa discreta.

m. Cuantitativa discreta.

n. Cualitativa nominal.

o. Cuantitativa continua.

p. Cuantitativa continua.

q. Cuantitativa discreta.

r. Cualitativa nominal.

2.-

a. No es variable.

b. Cuantitativa continua.

c. Cualitativa nominal.

d. Cualitativa nominal

3.-

a. Cualitativa nominal.

b. Cuantitativa discreta.

c. Cuantitativa discreta.

d. Cuantitativa continua.

e. Cuantitativa discreta.

4.1.-

a. Los resultados obtenidos por los

colegios en el SIMCE 2014

corresponde a la variable y la escala

de medición es cuantitativa discreta.

b. El enunciado se refiere a una

muestra.

4.2.-

a. Clubes chilenos.

b. Ingresos de los clubes chilenos

c. Representa el porcentaje de ingresos

de los clubes chilenos por derechos

de trasmisión en CDF.

Page 3: SOLUCIONES UNIDAD I 1.2 Definición de población, muestra

168

CONTROL DE UNIDAD

a. Descriptiva.

b. Inferencial.

c. Verdadera.

d. Verdadera.

e. Población.

f. Cualitativa.

g. Dato.

h. Cuantitativa.

i. Verdadera.

j. Verdadera.

EJERCICIOS TIPO PRUEBA

1.-

a. Inferencial.

b. Descriptiva.

c. Descriptiva.

d. Inferencial.

e. Descriptiva.

f. Inferencial.

2.-

a. Un dato.

b. ¿Qué es lo que comúnmente compra

en el mercado?

c. ¿Compra artículos que están en su

lista o termina comprando cosas que

no necesita?

3.-

a. Un dato.

b. Número de veces que expresan los

padres afecto a sus hijos en un día.

c. Solución al lector.

4.-

a. ¿Los esquiadores prefieren esquí o

Snowboard?

b. Nivel de profesionalismo de los

esquiadores.

c. Número de esquiadores que se alojan

en el hotel por día.

d. Tiempo de subida a los centros de

esquí.

UNIDAD II

EJERCICIOS PROPUESTOS

2.1 presentación de la información en

tablas de distribución de frecuencias.

1.-

a. 𝑅 = 176 − 119 = 57

𝑁 = 40

𝐾 = 1 + 3,3 log(40) = 6,28 ≈ 6

𝑎 =57

6= 9,5 ≈ 10

Sueldo 𝒙𝒊 𝒏𝒊 𝒇𝒊 𝑵𝒊 𝒇𝒊% 𝑭𝒊% [119-129[ 124 4 0,1 4 10% 10% [129-139[ 134 7 0,175 11 17,5% 27,5% [139-149[ 144 13 0,325 24 32,5% 60% [149-159[ 154 9 0,225 33 22,5% 82,5% [159-169[ 164 5 0,125 38 12,5% 95% [169-179[ 174 2 0,05 40 5% 100%

Total 1,00 100%

b. En la tercera clase se encuentra la

mayor cantidad de trabajadores.

c. Un 67,5% de los trabajadores gana

entre $139.000 y $169.000.

d. 7 trabajadores ganan a lo menos

$159.000

e. 24 trabajadores ganan a lo más

$149.000

Page 4: SOLUCIONES UNIDAD I 1.2 Definición de población, muestra

169

2.-

a. 𝑅 = 58 − 36 = 22

𝑁 = 30

𝐾 = 1 + 3,3 log(30) = 5,87 ≈ 6

𝑎 =22

6= 3,666 ≈ 4

Peso 𝒙𝒊 𝒏𝒊 𝒇𝒊 𝑵𝒊 𝒇𝒊% 𝑭𝒊% [36-40[ 38 4 0,133 4 13,3% 13,3% [40-44[ 42 7 0,233 11 23,3% 36,6% [44-48[ 46 7 0,233 18 23,3% 59,9% [48-52[ 50 5 0,166 23 16,6% 76,5% [52-56[ 54 6 0,2 29 20% 96,5% [56-60] 58 1 0,033 30 3,3% 99,8%

Total 30 0,99 99,8%

b. 12 corderos pesan entre 44 y 52 Kg.

c. 59,9% representa a aquellos corderos

cuyo peso es inferior a 48 Kg.

d. Su frecuencia relativa para dicho

intervalo de clase es 0,233 corderos.

e. Un 23,3% de corderos pesan más de

52 Kg.

f. 𝑓3: 7 de 30 corderos pesan entre 44 y

48 Kg.

𝐹3%: Un 59,9% de los corderos

pesan a lo más 48 kilogramos.

3.-

a. Duración en horas de discos de

engranaje, Cuantitativa Continua.

b.

c. 13 discos duraron entre 290 y 300

horas.

d. 22 discos no alcanzaron a durar 300

horas.

e. El 6% de los discos duraron entre

310 y 315 horas.

f. El 58% de los discos duraron menos

de 305 horas.

g. 16 discos duraron más de 310 horas.

h. 29 discos duraron menos de 305

horas.

i. El 34% de los discos duraron entre

285 y 295 horas.

j. El primer intervalo es aquel con

mayor frecuencia absoluta.

4.-

a.

N° de

personas 𝒙𝒊 𝒏𝒊 𝒇𝒊 𝑵𝒊 𝒇𝒊% 𝑭𝒊%

[60-70[ 65 5 0,10 5 10% 10% [70-80[ 75 4 0,08 9 8% 18% [80-90[ 85 5 0,10 14 10% 28% [90-100[ 95 8 0,16 22 16% 44% [100-110[ 105 6 0,12 28 12% 56% [110-120[ 115 4 0,08 32 8% 64% [120-130[ 125 8 0,16 40 16% 80% [130-140[ 135 10 0,20 50 20% 100%

Total 50 1,00 100

b. 18 personas consumen entre 100 y

130 productos enlatados.

c. El 28% de las personas consumen

menos de 90 productos enlatados.

d. 41 personas consumen más de 80

productos enlatados.

Duración 𝒙𝒊 𝒏𝒊 𝒇𝒊 𝑵𝒊 𝒇𝒊% 𝑭𝒊% [285-290[ 287,5 9 0,18 9 18% 18% [290-295[ 292,5 8 0,16 17 16% 34% [295-300[ 297,5 5 0,1 22 10% 44% [300-305[ 302,5 7 0,14 29 14% 58% [305-310[ 307,5 5 0,1 34 10% 68% [310-315[ 312,5 3 0,06 37 6% 74% [315-320[ 317,5 3 0,06 40 6% 80% [320-325[ 322,5 6 0,12 46 12% 92% [325-330] 327,5 4 0,08 50 8% 100%

Total 50 1,00 100

Page 5: SOLUCIONES UNIDAD I 1.2 Definición de población, muestra

170

5.-

a. Compañías de la industria de la

construcción.

b. 𝑅 = 9,6 − 0,1 = 9,5

𝑁 = 40

𝐾 = 1 + 3,3 log(40) = 6,28 ≈ 6

𝑎 =9,5

6= 1,58 ≈ 2

Ganancia 𝒙𝒊 𝒏𝒊 𝒇𝒊 𝑵𝒊 𝒇𝒊% 𝑭𝒊%

[0,1 – 2,1[ 1,1 17 0,425 17 42,5% 42,5%

[2,1 – 4,1[ 3,1 13 0,325 30 32,5% 75%

[4,1 – 6,1[ 5,1 7 0,175 37 17,5% 92,5%

[6,1 – 8,1[ 7,1 2 0,05 39 5% 97,5%

[8,1 – 10,1] 9,1 1 0,025 40 2,5% 100%

Total 40 1,00 100%

c. La frecuencia absoluta del tercer

intervalo es 7, es decir, existen 7

compañías cuyas ganancias están

entre 4,1 y 6,1 miles de millones por

acción.

d. El 92,5% de las compañías tienen a

lo más una ganancia de 6,1 miles de

millones por acción.

e. 10 compañías tienen a lo menos una

ganancia de 4,1 miles de millones por

acción.

f. 30 compañías tienen una ganancia

menor a 4,1 miles de millones por

acción.

g. El 97,5% de las compañías tienen

una ganancia por acción de a lo más

8,1 miles de millones.

6.-

X: Tiempo

(minutos)

𝒏𝒊 𝑵𝒊 𝑭𝒊 𝑭𝒊%

[300 – 400[ 14 14 0,035 3,5%

[400 – 500[ 46 60 0,15 15%

[500 – 600[ 58 118 0,295 29,5%

[600 – 700[ 76 194 0,485 48,5%

[700 – 800[ 68 262 0,655 65,5%

[800 – 900[ 62 324 0,81 81%

[900 – 1000[ 48 372 0,93 93%

[1000 – 1100[ 22 394 0,985 98,5%

[1100 – 1200[ 6 400 1,00 100%

Total 400

a. La frecuencia acumulada porcentual

de la cuarta clase es 48,5%, es decir,

48,5% de estudiantes ven hasta 700

minutos de televisión a la semana.

b. 𝐹5% = 65,5%

𝐹5 =262

400= 0,655

Por tanto 65,5% es lo mismo que

decir 262 de 400 estudiantes ven

televisión a lo más 800 minutos por

semana.

c. Un 19% de los estudiantes ven

televisión más de 900 minutos por

semana.

d. 118 estudiantes no ven televisión más

de 600 minutos por semana.

e. El porcentaje de estudiantes que ven

televisión por lo menos 500 minutos

por semana, pero menos de 1000

minutos por semana es de:

𝐹7% − 𝐹3% = 93% − 15% = 78%

f. Una proporción de 0,445 de

estudiantes ven televisión entre 700 y

1000 minutos por semana.

Page 6: SOLUCIONES UNIDAD I 1.2 Definición de población, muestra

171

7.-

a. Edad de los habitantes de chile.

b. Un 38,5% de la población chilena se

encuentra entre los 25 y 50 años de

edad.

c. Un 59,2% de la población chilena se

encuentra en a lo menos los 40 años

de edad.

d. 𝑛5 = 826.874,4 ℎ𝑎𝑏𝑖𝑡𝑎𝑛𝑡𝑒𝑠

Interpretación: 826.875 habitantes de

Chile se encuentran en un rango de

edad entre 20 y 25 años.

e. Un 49,3% de la población tiene 35 o

más años. Un 87,3% de la población

tiene menos de 65 años.

f. Un 54,9% de la población tiene entre

menos de 20 o más de 50 años de

edad.

g. Un 5,7% de la población tiene más de

75 años de edad.

8.-

a.

Zona urbana Zona rural

X: Edad 𝒏𝒊 𝒇𝒊 𝒏𝒊 𝒇𝒊

[10-14[ 2.574 0,12 3.515 0,19

[14-18] 19.761 0,88 15.094 0,81

Total 22.335 1 18.609 1

Interpretación: Se observa que en la zona

rural existe un mayor número de hombres

que tienen relaciones sexuales en el rango

de edad más temprana.

9.-

a.

Volumen 𝒙𝒊 𝒏𝒊 𝒇𝒊 𝑵𝒊 𝑭𝒊

[5 – 10[ 7,5 1 0,037 1 0,037

[10 – 15[ 12,5 2 0,074 3 0,111

[15 – 20[ 17,5 6 0,222 9 0,333

[20 – 25[ 22,5 9 0,333 18 0,666

[25 – 30] 27,5 9 0,333 27 0,999

Total 27 0,999

𝑁4: 18 fueron las compras de materia

prima que tienen un volumen de a lo más

25 metros cúbicos.

𝐹3: 9 de 27 de las compras de materia

prima tienen un volumen menor a 20

metros cúbicos.

𝑓2: 2 de 27 de las compras de materia

prima tienen un volumen de entre 10 y

15 metros cúbicos.

b. 𝐹4 − 𝐹2 = 55,5%

Un 55,5% de la materia prima

comprada se encuentra entre 15 y 25

metros cúbicos.

𝑁5 − 𝑁3 = 18

18 fueron las compras de materia

prima que se encuentran en un

volumen entre 20 y 30 metros

cúbicos.

c. Individuo: materia prima.

Variable: volumen de materia prima

comprada.

d. 9 de 27 compras de materia prima

tienen un volumen menor a 20

metros cúbicos.

10.-

Solución al lector.

Page 7: SOLUCIONES UNIDAD I 1.2 Definición de población, muestra

172

2.2 Presentación de la información en

gráficos estadísticos

1.-

a.

Volumen 𝒙𝒊 𝒏𝒊 𝒇𝒊 𝑵𝒊 𝑭𝒊

[5 – 10[ 7,5 1 0,037 1 0,037

[10 – 15[ 12,5 2 0,074 3 0,111

[15 – 20[ 17,5 6 0,222 9 0,333

[20 – 25[ 22,5 9 0,333 18 0,666

[25 – 30] 27,5 9 0,333 27 0,999

Total 27 0,999

b. Histograma y polígono de frecuencia.

Se observa que para ambos muestran

la misma información, ambos

muestran la marca de clase. Se

observa que la muestra es bimodal ya

que los dos últimos intervalos son lo

que tienen una mayor frecuencia.

c. Ojiva.

Interpretación: El 66,6% de las compras

de materia prima alcanzaron un volumen

máximo de 25 metros cúbicos.

d. El volumen máximo que alcanzaron

fue de 20 metros cúbicos.

e. Se realizaron 24 compras entre 15 y

30 metros cúbicos de materia prima.

f. Se realizaron 9 compras de a lo más

20 metros cúbicos.

g. Interpretación: 18 de 27 compras de

materia prima fueron de a lo más 25

metros cúbicos.

h. Se realizaron 27 compras en total.

2.-

a.

Tiempo 𝑥𝑖´ 𝑛𝑖 𝑓𝑖 𝑁𝑖 𝐹𝑖

[450 – 500[ 475 4 0,08 4 0,08

[500 – 550[ 525 5 0,1 9 0,18

[550 – 600[ 575 12 0,24 21 0,42

[600 – 650[ 625 10 0,2 31 0,62

[650 – 700[ 675 15 0,3 46 0,92

[700 – 750[ 725 3 0,06 49 0,98

[750 – 800[ 775 1 0,02 50 1,00

Total 50

b. Ojiva

Interpretación: El 42% de las válvulas

tienen a lo más una duración de 600

horas.

Page 8: SOLUCIONES UNIDAD I 1.2 Definición de población, muestra

173

c. Un 36% de las válvulas duraron entre

650 y 750 horas.

d. 9 válvulas duraron menos de 550

horas.

e. Un 38% de las válvulas duraron más

de 650 horas.

3.-

a. Histograma experimento A

b. Ojiva porcentual experimento B

c. Polígonos de frecuencia juntos.

Comparación: En los intervalos centrales

podemos observar que en el experimento

B presenta una mayor frecuencia que en

el experimento A.

d. Ojivas juntas.

Comparación: el experimento B es aquel

que tiene un crecimiento más constante

que el experimento A.

4.-

a. Los límites del cuarto intervalo son

60,5-70,5

b. 6 alumnos tienen un peso que va

desde 60,5 kilos hasta 70,5 kilos.

c. 36% de los alumnos pesan más de

70,5 kilos y menos de 80,5 kilos.

d. El 12% de los pesos de los alumnos

es igual o menor que 60,5 kilos.

e. 24 alumnos pesan más de 50,5 kilos.

5.- a.

Puntaje 𝒙𝒊´ 𝒏𝒊 𝒇𝒊 𝒇𝒊% 𝑵𝒊 𝑭𝒊 𝑭𝒊%

[55-63[ 59 3 0,093 9,3% 3 0,093 9,3

[63-71[ 67 6 0,187 18,5% 9 0,28 28

[71-79[ 75 3 0,093 9,3% 12 0,373 37,3

[79-87[ 83 13 0,406 40,6% 25 0,779 77,9

[87-95[ 91 3 0,093 9,3% 28 0,872 87,2

[95-103] 99 4 0,125 12,% 32 0,997 99,7

Total 32 0,997 1000%

b. El mejor gráfico para representar los

datos es el histograma.

Page 9: SOLUCIONES UNIDAD I 1.2 Definición de población, muestra

174

6.-

a. La variable es cualitativa nominal.

b.

c. Hay un 40,2% de basura entre

plástico, papel y aluminio.

d. El mayor porcentaje de basura se

concentra en la materia orgánica.

e. El menor porcentaje de basura se

encuentra en los desperdicios

peligrosos.

7.-

a. Familias que residen en un pequeño

pueblo del sur de Chile.

b.

Tiempo 𝒙𝒊´ 𝒏𝒊 𝒇𝒊 𝒇𝒊%

[4-6[ 5 2 0,066 6,6%

[6-8[ 7 8 0,266 26,6%

[8-10[ 9 8 0,266 26,6%

[10-12[ 11 7 0,233 23,3%

[12-14[ 13 4 0,133 13,3%

[14-16 [ 15 1 0,033 3,3%

Total 30 0,987 100%

c. Polígono

Interpretación: La mayor frecuencia del

tamaño del grupo familiar se encuentra en

el segundo y tercer intervalo.

d. No porque el histograma se construye

cuando la variable de estudio es una

variable cuantitativa continua.

8.-

a.

0,1 | 7 9

0,2 | 0 2 4 6 6 6 8 8 9

0,3 | 0 0 1 1 2 3 3 3 5 5 7 7 8

0,4 | 2 4 5 8

0,5 | 0 1

0,6 | 3

Interpretación: La mayoría de las

compañías tienen una volatilidad de 0,3

hasta 0,38.

b. El último tallo fue donde hubo mayor

tendencia al cambio del precio por

acción.

Page 10: SOLUCIONES UNIDAD I 1.2 Definición de población, muestra

175

c. El primer tallo fue donde hubo menor

tendencia al cambio del precio por

acción.

d. El valor del dato que más se repite es

el 0,26 en conjunto con el 0,33.

9.1.-

a. Las bolsas de valores de diferentes

países.

b. El grafico muestra las caídas de las

bolsas de valores internacionales y la

mayor caída fue en Hong Kong,

mientras que la menor caída fue en el

país de Chile

c. Chile tiene una caída de su bolsa con

la situación de China.

d. El país de Reino Unido cayó un

0,91%, Brasil un 1,07% y Japón un

3,14%

e. La construcción del grafico no es la

más adecuada ya que muestra

demasiada información y todo está

demasiado junto. Además se mesclan

diferentes gráficos.

9.2.-

a. Población en riesgo de pobreza en

española.

b. Un 1,2% ha aumentado la pobreza

entre los años 2010 y 2013 en

España.

c. Tabla de frecuencias

Pobreza por año en

millones

𝒏𝒊 𝒇𝒊

2008 11,458 0,245

2009 11,552 0,247

2010 11,684 0,261

2011 12,487 0,267

2012 12,721 0,272

2013 12,768 0,273

2014 13,656 0,292

d. Solución al lector.

CONTROL UNIDAD

a. V

b. F, Nos indica el porcentaje de

elementos menores o iguales que el

límite superior de la clase i.

c. F, El utiliza preferentemente el

gráfico de barras.

d. V

e. V

f. V

g. V

h. F, Sí importa la interpretación que se

le puede dar.

i. V

j. V

k. F, No debe incluir muchos intervalos.

l. V

m. F, El eje vertical no se debe cortar.

n. V

Page 11: SOLUCIONES UNIDAD I 1.2 Definición de población, muestra

176

EJERCICIOS TIPO PRUEBA

1.-

a.

Interpretación: existen muy pocos

pacientes con tumores de alta duración

(mayor a 22 meses), que aquellos con

poca duración (menor a 10 meses)

b. El dato que tiene mayor frecuencia es

3 meses, con una frecuencia de 10

pacientes. El dato con mayor

frecuencia si pertenece al intervalo

con mayor frecuencia.

2.-

a. Histograma

Interpretación: e observa que muy pocos

estudiantes obtienen un coeficiente

intelectual alto (mayor a 130, es decir,

súper dotados.

b. En el primero, segundo y tercer

intervalo de clase.

c. Sí, en los tres primeros intervalos.

d. No.

3.- Histograma con 5 intervalos

Interpretación: La mayor renta por

contribuyentes se concentra en una renta

de 26.

Histograma con 10 intervalos

Interpretación: la menor renta considerada

por contribuyentes es de 97,5 de renta.

c. El segundo muestra más información,

pues éste muestra en dos intervalos lo que

el primero muestra en un solo intervalo.

Page 12: SOLUCIONES UNIDAD I 1.2 Definición de población, muestra

177

4.-

a.

X: puntajes obtenido

en la prueba

𝒏𝒊

𝒇𝒊

[6 – 9[ 10 0,05

[9 – 12[ 14 0,07

[12 – 15[ 18 0,09

[15 – 18[ 38 0,19

[18 – 21[ 67 0,335

[21 – 24[ 42 0,21

[24 – 27] 11 0,055

total 200 1

b. Histograma de frecuencias

relativas

c. La amplitud es adecuada, sin

embargo la cantidad de intervalos

puede variar para la misma amplitud.

Pero lo ideal es realizar 9 intervalos

según la fórmula enseñada en el

curso de Estadística.

5.-

a.

Tiempo de reacción a un estimulo

0 | 4 5 6 6 7 7 7 9 9

1 | 1 1 2 2 3 3 3 5 5 5 6 6 7 8 8 8 8

2 | 0 1 1 2 3 4 4 5 5 6 6 6 8 8 8 9 9

3 | 0 1 2 2 3

Interpretación: se observa que la mayoría

de los tiempos de reacción se encuentran

entre 1,1 y 2,9 segundos.

b. No es posible ya que disminuiría

demasiado las frecuencias de cada

tallo, es decir no tendría hojas el

grafico.

c. Si se puede construir un nuevo

grafico, pues consideraríamos el

número entero y a decima como tallo

y la centésima como hoja,

obteniéndose más tallos en el grafico.

El segundo grafico seria más

informativo.

d. El tiempo de reacción es 1,8.

6.-

a.

Ingreso diario de los

estacionamientos públicos

3 | 2

5 | 2 7 8 9

6 | 5 8 8

7 | 1 4 5 5 8 9

8 | 0 1 3 3 3 4 8 8

9 | 0 3 4 7

10 | 0 4 8

Interpretación: En el tallo 8 se encuentra

la mayor frecuencia, mientras que el tallo

3 es donde se encuentra la menor

frecuencia.

b. Sí, el valor $32.000, pues es muy

bajo en comparación con los demás

precios.

c. El valor diario más frecuente es

$83.000.

Page 13: SOLUCIONES UNIDAD I 1.2 Definición de población, muestra

178

7.-

a.

Estatura 𝑛𝑖 fi 𝑓𝑖% 𝑁𝑖 𝐹𝑖 𝐹𝑖%

[1,00-1,17[ 4 0,133 13,3 4 0,133 13,3

[1,17-1,34[ 3 0,1 10 7 0,233 23,3

[1,34-1,51[ 8 0,266 26,6 15 0,499 49,9

[1,51-1,68[ 7 0,233 23,3 22 0,732 73,2

[1,68-1,85[ 4 0,133 13,3 24 0,865 86,5

[1,85-2,02] 4 0,133 13,3 30 0,998 99,8

Total 30 0,998 100

b. 𝐹3%: La estatura del 49,9% de los

trabajadores es de a lo más 1,51

metros.

𝑓4: 7 de 30 trabajadores mide entre

1,51 y 1,68 metros.

𝑛2: La estatura de 3 de los

trabajadores está entre 1,17 y 1,34

metros.

𝐹5%-𝐹2% = 86,5% − 23,3% =

63,2%: El 63,2% de los trabajadores

mide entre 1,34 y 1,85 metros.

c. El 73,2% de los trabajadores mide

hasta 1,68 cm.

d.

Interpretación: se observa que la estatura

más frecuente en de 1,425 metros.

UNIDAD III

EJERCICIOS PROPUESTOS

3.1 Medidas de tendencia central

y posición.

1.-

a. 26,66 años.

Interpretación: Si todos los

trabajadores tuvieran la misma edad,

ésta sería de 26,66 años,

2.-

a. 164,5 cm.

Interpretación: Si todos los

estudiantes tuvieran la misma

estatura, ésta sería de 157,7 cm.

3.- Sin agrupar

𝜇 = 52,94 𝑝𝑢𝑛𝑡𝑜𝑠

Agrupados en intervalos

𝜇 = 55,5 𝑝𝑢𝑛𝑡𝑜𝑠

Al calcular la media de los datos sin

agrupar se obtiene el valor exacto, en

cambio al calcularla con los datos

agrupados se obtiene una aproximación

de la misma, de modo que el valor se ve

afectado dependiendo de la cantidad de

intervalos y la naturaleza y tamaño de la

población.

Si la población es muy grande el cálculo

de la media se vuelve complicado y puede

inducir errores al manejar un gran número

de datos, en esos casos es recomendable

agrupar los datos, ya que la media de los

datos agrupados es una buena

aproximación de la media de los datos sin

agrupar.

4.-

La venta faltante es de $690.

Page 14: SOLUCIONES UNIDAD I 1.2 Definición de población, muestra

179

5.-

a. �̅� = 7,90

Interpretación: Si todos tuvieran la misma

distribución de frecuencias en la variable

X, esta sería de 7,9.

𝑀𝑒(𝑥) = 8

Interpretación: 8 es el dato central de la

distribución de la muestra.

Interpretación: La muestras es bimodal,

estas son 8 y 12.

b. Solución al lector.

c. La media aritmética, mediana y moda

se comportan de forma lineal

respecto de un cambio de origen y de

escala, por tanto los resultados serán.

�̅� = 28,7

𝑀𝑒 = 29

La muestres es bimodal, estas son 29 y

41.

6.- 𝑛3 = 7

7.-

a.

𝜇 = 7.590 𝑝𝑒𝑠𝑜𝑠

𝑀𝑒(𝑥) = 7.525 𝑝𝑒𝑠𝑜𝑠

𝑀𝑜(𝑥) = 7.435,714 𝑝𝑒𝑠𝑜𝑠

𝑃30 = 7.212,5 𝑝𝑒𝑠𝑜𝑠

𝐷8 = 8.233,33 𝑝𝑒𝑠𝑜𝑠

b. Un 74% de los trabajadores recibe al

menos $7.150 pesos en incentivos

mensuales.

8.-

a. La mediana de muestra es de 127,4

mm Hg. El 50% de la muestra tiene a

lo más una presión sanguínea de

127,4 mm Hg.

b. El valor de la mediana cambia a

127,6. La mediana en este caso

cambia en su valor, no obstante el

dato del paciente sigue ocupando la

misma posición.

9.-

a. 𝑄1 = 4

𝑄3 = 6

b. 𝑃30 = 4

𝑃70 = 6

c. El primer cuartil corresponde al

percentil 25, valores relativamente

cercanos, por otro lado el tercer

cuartil corresponde al percentil 75,

también valores relativamente

cercanos, en este caso coinciden

respectivamente.

d. La media corresponde al segundo

cuartil, son el mismo valor, a su vez

equivalen al percentil 50.

10.-

a. 𝑄1 = 52,8

El 25% de los datos tiene a lo más un

valor de 52,8.

Page 15: SOLUCIONES UNIDAD I 1.2 Definición de población, muestra

180

𝑄3 = 65,666

El 75% de los datos tiene a lo más un

valor de 65,7.

b.

La diferencia entre el primer y tercer

cuartil corresponde al recorrido

intercuartílico, que abarca el 50% central

de los datos, es decir, el 50% central de

los datos tiene a lo menos un valor de

52,8 y a los más un valor de 65,7.

c. 𝑃40 = 57,248

El 40% de los datos tiene a lo más un

valor de 57,25.

𝑃90 = 72,133

El 90% de los datos tiene a lo más un

valor de 72,13.

d. Solución al lector.

11.-

222 corresponde al percentil 54,666.

230 corresponde al percentil 93,333.

12.-

a.

𝒙𝒊 𝒏𝒊 𝒏𝒊 ∙ 𝒙𝒊 𝒙𝒊 − �̅� |𝒙𝒊 − �̅�| 𝒏𝒊 ∙ |𝒙𝒊 − �̅�| 41 1 41 41-46=-5 5 5

42 2 84 42-46=-4 4 8

44 4 176 44-46=-2 2 8

46 6 276 46-46=0 0 0

48 4 192 48-46=2 2 8

50 2 100 50-46=4 4 8

51 1 51 51-46=5 5 5

∑ 𝟐𝟎 ∑=920 ∑ = 0 ∑ = 22 ∑ = 42

b.

�̅� = 46 𝑎𝑣𝑖𝑜𝑛𝑒𝑠.

c. Solución al lector.

13.-

a. 𝜇 = 27.500 𝑝𝑒𝑠𝑜𝑠

Interpretación: si todos los trabajadores

tuvieran el mismo sueldo, este sería de

27.500 pesos.

b. 𝑀𝑒(𝑥) = 23.333,333 𝑝𝑒𝑠𝑜𝑠

Interpretación: el 50% de los trabajadores

cobran a lo más 23.333,333 pesos.

𝑀𝑜(𝑥) = 18.000 𝑝𝑒𝑠𝑜𝑠

Interpretación: el sueldo cobrado con

mayor frecuencia es de 18.000 pesos.

Dado que la moda está por debajo de la

mediana la muestra está sesgada hacia la

derecha.

c. Un 70% de los trabajadores cobrarán

a lo más $30.000 semanas.

d. Un 50% de los trabajadores no

cobran entre $20.000 y $50.000.

3.2 Medidas de dispersión o

variabilidad.

1.-

a. Resultado obtenido en cada

lanzamiento, que es una variable

cuantitativa discreta.

b. 𝜇 = 3,8 ≈ 4 𝑣𝑒𝑐𝑒𝑠

Interpretación: si en todos los

lanzamientos hubiesen obtenido el mismo

resultado, este sería de 4

Page 16: SOLUCIONES UNIDAD I 1.2 Definición de población, muestra

181

𝜎 = 1,749 ≈ 2 𝑣𝑒𝑐𝑒𝑠

Interpretación: la variabilidad de los

resultados de los lanzamientos con

respecto a la media es de 2.

c. Entre 𝜇 − 𝜎 y 𝜇 + 𝜎 queda un 88%

de los resultados.

d. En un 43% de los lanzamientos se ha

obtenido una puntuación mayor que

la media.

2.-

a. �̅� = 3,1 ≈ 4 𝑝𝑒𝑟𝑠𝑜𝑛𝑎𝑠

𝑠 = 1,11 ≈ 2 𝑝𝑒𝑟𝑠𝑜𝑛𝑎𝑠

b. La desviación típica mantiene su

valor, es una de las propiedades de

ésta.

c. Entre �̅� − 𝑠 y �̅� + 𝑠 queda un 70% de

las familias.

d. Un 72% de las familias tiene un

número de integrantes menor que la

media.

3.-

a. 𝜇 = 3,74

𝜎 = 1,556

b. 𝜇 = 0,37

𝜎 = 0,155

Propiedad de la media y la desviación

típica es que si los datos son

multiplicados por un número el valor de

cada una será el original multiplicado por

dicho número.

c. El 53,2% de los alumnos obtienen

notas mayores que la media.

4.-

a. 𝐶. 𝑉𝐴 = 0,26̅ → 26,66%

𝐶. 𝑉𝐵 = 0,313̅ → 31,33%

b. Hay levemente una mayor variación

relativa de la media respecto de la

desviación estándar en la empresa B,

por tanto en la empresa A el

promedio es levemente más

representativo que en la empresa B.

c. Solución al lector.

5.-

a. 𝐶. 𝑉𝐴 = 0,234 → 23,4%

𝐶. 𝑉𝐵 = 0,19 → 19%

Existe una mayor variación relativa para

el producto A.

b. Si la desviación estándar tiende a

cero y la media aritmética se

mantiene constante el coeficiente de

variación tenderá a cero, ya que el

coeficiente de variación compara

dichos valores mediante un cociente.

c. Si la media aritmética tiende a cero y

la desviación estándar se mantiene

constante el coeficiente de variación

tenderá a infinito, ya que el

coeficiente de variación compara

dichos valores mediante un cociente.

Page 17: SOLUCIONES UNIDAD I 1.2 Definición de población, muestra

182

6.-

a. 𝐶. 𝑉𝑉 = 0,071 → 7,1%

𝐶. 𝑉𝑀 = 0,045 → 4,5%

Las interpretaciones quedan al lector.

Debido a que la diferencia entre los

coeficiente de variación es ínfima no

podemos asegurar que hay una mayor o

menor variación relativa entre las

estaturas de varones y mujeres.

b. Solución al lector.

7.-

a. 𝑠 = 1,316

b. 𝑠𝐷 = 0,3948

c. 𝐶. 𝑉𝐵 = 0,16 → 16%

𝐶. 𝑉𝐷 = 0,7311 → 73,11%

Hay una mayor variación relativa de la

media respecto de la desviación estándar

en las baterías deterioradas, por tanto en

las baterías deterioradas el promedio es

menos representativo que en las baterías

en buen estado.

3.3 Construcción e interpretación del

diagrama de cajón con bigotes (box

plot).

1.-

a. 𝑅𝑎𝑛𝑔𝑜 = 9

b. Un 25% de los estudiantes se queda

dormido antes de los 14 minutos con

el profesor A, ya que es el extremo

inferior del cajón.

c.

El primero no es simétrico como el

segundo.

2.-

a. El 50% de las determinaciones de

emisión diaria son a los más de 19,05

toneladas.

El 75% de las determinaciones de

emisión diaria son a los más de 22,95

toneladas.

Page 18: SOLUCIONES UNIDAD I 1.2 Definición de población, muestra

183

b.

c. En la muestra hay presencia de datos

anómalos revelados por la extensión

de los bigotes del cajón.

3.-

a. El 50% central de las vacas posee

entre un 3,756% y un 4,027% de

grasa en la leche.

En la muestra hay presencia de datos

anómalos revelados por la extensión de

los bigotes del cajón.

4.-

a. 𝑀𝑒(𝑥) = 41

Interpretación: el 50% de los clientes

tienen a lo más 41 como talla.

b. 𝜇 = 40,866

Interpretación: si todos los clientes

tuvieran la misma talla de zapatos, esta

sería de 40,866.

c. 𝑄1 = 40

Interpretación: el 25% de los clientes

tienen a lo más 40 como talla.

𝑄3 = 42

Interpretación: el 75% de los clientes

tienen a lo más 42 como talla.

d.

Page 19: SOLUCIONES UNIDAD I 1.2 Definición de población, muestra

184

3.4 Medidas de asimetría y curtosis.

a. Grupo 1

𝐴𝑠 = 0,8164

Puesto que el índice de asimetría es

mayor que cero, estamos frente a una

asimetría positiva.

𝐶𝑟 = −1

Ya que el índice de curtosis es menor que

cero el apuntamiento de la distribución es

platicúrtico.

Grupo 2

𝐴𝑠 = −0,426

Puesto que el índice de asimetría es

menor que cero, estamos frente a una

asimetría negativa.

𝐶𝑟 = −2,322

Ya que el índice de curtosis es menor que

cero el apuntamiento de la distribución es

platicúrtico.

2.-

a. Antofagasta:

𝐴𝑠 = −0,561

Puesto que el índice de asimetría es

menor que cero, estamos frente a una

asimetría negativa.

𝐶𝑟 = −1,327

Ya que el índice de curtosis es menor que

cero el apuntamiento de la distribución es

platicúrtico.

Santiago

𝐴𝑠 = −0,510

Puesto que el índice de asimetría es

menor que cero, estamos frente a una

asimetría negativa.

𝐶𝑟 = 1,396

Ya que el índice de curtosis es mayor que

cero el apuntamiento de la distribución es

leptocúrtica.

Punta Arenas

𝐴𝑠 = 0,800

Puesto que el índice de asimetría es

mayor que cero, estamos frente a una

asimetría positiva.

𝐶𝑟 = −1,414

Ya que el índice de curtosis es menor que

cero el apuntamiento de la distribución es

platicúrtico.

b. Las temperaturas de la ciudad de

Santiago son más simétricas en

comparación con las demás ciudades.

c. Solución al lector.

3.- 𝐴𝑠 = −0,263

Puesto que el índice de asimetría es

menor que cero, estamos frente a una

asimetría negativa.

𝐶𝑟 = −0,958

Ya que el índice de curtosis es menor que

cero el apuntamiento de la distribución es

platicúrtico.

Page 20: SOLUCIONES UNIDAD I 1.2 Definición de población, muestra

185

4.-

a. 𝐴𝑠 = 0,656

Puesto que el índice de asimetría es

mayor que cero, estamos frente a una

asimetría positiva.

𝐶𝑟 = −1,211

Ya que el índice de curtosis es menor que

cero el apuntamiento de la distribución es

platicúrtico.

5.1.- Solución al lector

5.2.- Solución al lector

CONTROL UNIDAD

a.

�̅� =∑ 𝑎𝑖

𝑛𝑖=1

𝑛

=1

𝑛∑ 𝑎𝑖

𝑛

𝑖=1

=1

𝑛(𝑎1 + 𝑎2 + ⋯ + 𝑎𝑖 + ⋯ + 𝑎𝑛)

=1

𝑛(𝑛 ∙ 𝑎)

=𝑛

𝑛∙ 𝑎

= 𝑎

Por lo tanto �̅� = 𝑎

b.

𝜇𝑥+𝑦 =1

𝑁∑(𝑥𝑖 + 𝑦𝑖)

𝑁

𝑖=1

=1

𝑁(∑ 𝑥𝑖

𝑁

𝑖=1

+ ∑ 𝑦𝑖

𝑁

𝑖=1

)

=1

𝑁∑ 𝑥𝑖

𝑁

𝑖=1

+1

𝑁∑ 𝑦𝑖

𝑁

𝑖=1

= 𝜇𝑥 + 𝜇𝑦

c. Sea 𝑥1 … 𝑥𝑛, un conjunto de datos.

𝜇𝑦 =1

𝑁∑ 𝑦𝑖

𝑁

𝑖=1

=1

𝑁∑(𝑎 ∙ 𝑥𝑖 + 𝑏)

𝑁

𝑖=1

=1

𝑁(∑ 𝑎 ∙ 𝑥𝑖

𝑁

𝑖=1

+ ∑ 𝑏

𝑁

𝑖=1

)

1

𝑁∑ 𝑎 ∙ 𝑥𝑖

𝑁

𝑖=1

+1

𝑁∑ 𝑏

𝑁

𝑖=1

= 𝑎 ∙1

𝑁∑ 𝑥𝑖

𝑁

𝑖=1

+𝑁 ∙ 𝑏

𝑁

= 𝑎 ∙ 𝜇𝑖 + 𝑏

d. Solución al lector.

e. Solución al lector.

Page 21: SOLUCIONES UNIDAD I 1.2 Definición de población, muestra

186

EJERCICIOS TIPO PRUEBA

1.- Solución al lector.

2.- Solución al lector.

3.-

a. �̅� = 94,24 ; 𝑀𝑜(𝑥) = 96,333

b. Un 43% de los alumnos que tienen

un coeficiente intelectual entre 93 y

109.

c. El C.I. 90 corresponde al percentil

36,5.

d. Un 69% de los alumnos tienen a lo

más un 101 de coeficiente intelectual.

4.-

a. La estación 1 y 3 tienen mismo rango

de lluvia caída en doce meses.

b. Rango intercuartílico, rango.

c. Rango = 6

Rango intercuartílico = 4

d. Aproximadamente 3 meses llovió

menos de 8 milímetros de agua.

e. Solución al lector.

f. 𝜇 = 9,666 𝑚𝑚

𝑀𝑒(𝑥) = 10,5 𝑚𝑚

𝑀𝑜(𝑥) = 11 𝑚𝑚

𝜎 = 3,009 𝑚𝑚

𝑅 = 12 𝑚𝑚

g. Diagrama de cajas

5.-

a. 𝜇 = 8,8 ℎ𝑜𝑟𝑎𝑠

𝑀𝑒(𝑥) = 9 ℎ𝑜𝑟𝑎𝑠

𝑀𝑜(𝑥) = 9 ℎ𝑜𝑟𝑎𝑠

𝜎 = 1,239 ℎ𝑜𝑟𝑎𝑠

𝑅 = 5 ℎ𝑜𝑟𝑎𝑠

b. Diagrama de cajas

Page 22: SOLUCIONES UNIDAD I 1.2 Definición de población, muestra

187

c. Diagrama de tallos y hojas

6.-

a. Variable: número de errores por

pagina de un texto.

Tipo de variable: cuantitativa

discreta.

b.

errores 𝒙𝒊

´ 𝒏𝒊 𝑵𝒊 𝒇𝒊 𝒇𝒊% 𝑭𝒊%

[0 – 2[ 1 16 16 0,32 32 32

[2 – 4[ 3 20 36 0,4 40 72

[4 – 6[ 5 9 45 0,18 18 90

[6 – 8[ 7 3 48 0,06 6 96

[8 – 10[ 9 2 50 0,04 4 100

Total 50 1 100

c. Diagrama de barras

d. Un 32% de las páginas tienen dos

errores.

e. Un 90% de las páginas tienen a los

más 6 errores.

Un 10% de las páginas tiene 6 o más

errores.

f. Un 19% de las páginas tienen como

mínimo 5 errores por página.

g. Solución al lector.

h. Solución al lector.

i. Diagrama de cajas

7.-

a.

X 𝒙𝒊´ 𝒏𝒊 𝑵𝒊 𝒇𝒊 𝒇𝒊% 𝑭𝒊%

[60-70[ 65 2 2 0,016 1,6 1,6

[70-80[ 75 3 5 0,025 2,5 4,1

[80-90[ 85 25 30 0,208 20,8 24,9

[90-100[ 95 46 76 0,383 38,3 63,2

[100-110[ 105 35 111 0,291 29,1 92,3

[110-120[ 115 5 116 0,041 4,1 96,4

[120-130[ 125 3 119 0,025 2,5 98,9

[130-140[ 135 1 120 0,008 0,8 99,7

Total 120 0,997 99,7

b. �̅� = 96,75

Interpretación: si todos los alumnos

tuvieran el mismo coeficiente intelectual,

este sería de 96,75.

𝑀𝑜(𝑥) = 96,562

Interpretación: el coeficiente intelectual

más frecuente es de 96,562.

Page 23: SOLUCIONES UNIDAD I 1.2 Definición de población, muestra

188

𝑀𝑒(𝑥) = 96,521

Interpretación: el 50% de los alumnos

tienen a los más un coeficiente

intelectual de 96,521.

𝑆𝑥 = 11.201

Interpretación: la variabilidad con

respecto al promedio del coeficiente

intelectual es de 11,201.

𝑅𝐼 = 𝑄3 − 𝑄1 = 104 − 90 = 14

Interpretación: el 50% central de los

puntajes del coeficiente intelectual varían

en 14 puntos.

c. Diagrama de cajas

d. El coeficiente intelectual mínimo que

se requiere para ser bien dotado es de

116.

e. Un alumno que tiene un coeficiente

intelectual de 109, se encuentra en el

percentil 89,58.

f. 114 de 120 alumnos tienen un C.I.

entre 70 y 120 puntos.

UNIDAD IV

EJERCICIOS PROPUESTOS

4.1 Distribución de frecuencias

conjunta, marginales y condicionales.

1.-

a. 20

39 estudiantes son fumadores.

b. 6

39 mujeres que no fuman.

c. 12

39 son hombres fumadores. El resto

de los alumnos no fuma o es mujer.

d.

Sexo 𝑓𝑖⦁

Hombre 0,641

Mujer 0,358

Total 0,999

e.

Sexo 𝑛𝑖⦁

Hombre 25

Mujer 14

Total 39

f.

Sexo/fumadores 𝑓𝑖.

Hombre 0,6

Mujer 0,4

Total 1

Page 24: SOLUCIONES UNIDAD I 1.2 Definición de población, muestra

189

2.-

a. Distribución marginal de X

X 𝑛𝑖⦁

12 14

15 28

19 42

Distribución marginal de Y

Y 𝑛⦁𝑗

15 18

24 24

27 12

30 30

Veamos si las variables son

independientes

¿𝑛11 = 𝑛⦁1 ∙ 𝑛1⦁?

3 ≠ 14 ∙ 18 = 252 Luego las variables

son dependientes pues siendo una

distribución conjunta diferente de la

multiplicación de las marginales ya no

son independientes estas variables.

b. Solución al lector.

3.-

a.

X/Y 0 1 2 3 4

1 24 39 27 18 9

2 9 24 24 27 21

3 3 9 18 24 24

b.

Y 𝑛⦁𝑗

0 36

1 72

2 69

3 69

4 54

�̅� = 2,11 𝑆𝑦 = 1,287

El número medio de compras semanales

es de 2,11 con una variación de 1,287

compras pagadas con tarjeta de crédito.

c.

X 𝑛𝑖⦁

1 117

2 105

3 78

El número más frecuente de tarjetas de

créditos es 1 por persona.

d.

𝑌/𝑋3 𝑛3𝑗

0 3

1 9

2 18

3 24

4 24

�̅�/𝑋3 = 2,730

El número medio de compras semanales

pagadas por personas que poseen tres

tarjetas de créditos es de 2,730 compras.

4.-

a. �̅� = 1,56 hombres

𝑆𝑋2 = 1,541 hombres2

𝑆𝑋 = 1,241 hombres

�̅� = 1,46 mujeres

𝑆𝑌2 = 1,301 mujeres2

𝑆𝑌 = 1,140 mujeres

b. (�̅�/𝑋 = 2) = 1,291 ≈ 2

c. (�̅�/𝑌 = 0) = 1,826 ≈ 2

d. (�̅�/𝑌 ≤ 2) = 1,592 ≈ 2

Page 25: SOLUCIONES UNIDAD I 1.2 Definición de población, muestra

190

5.-

a.

X/Y<22 𝑛⦁<22

[3 – 5[ 0,01

[5 – 7[ 0,14

[7 – 9] 0,32

X/Y>26 𝑛⦁>26

[3 – 5[ 0,40

[5 – 7[ 0,01

[7 – 9] 0,00

La homogeneidad en este caso no se

puede calcular, pues en este ejercicio no

se dice cual es el total de la muestra.

b. El 21% de los pacientes tienen entre

18 y 26 años de edad.

c. (�̅�/5 < 𝑋 < 7) = 19,333

d. Dependencia:

¿𝑛11 ≠ 𝑛⦁1 ∙ 𝑛1⦁? → 0,00 ≠ 0,5 ∙

0,38 = 0,19

0,00 ≠ 0,19

Luego las variables son dependientes.

e. Solución al lector.

6.-

a.

X 𝑛𝑖⦁

[0 – 30[ 20

[30 – 90[ 50

[90 – 180] 30

�̅� = 73,5 𝑚𝑖𝑙𝑒𝑠

𝑀𝑒 = 66

b.

Y 𝑛⦁𝑗

[0 – 15[ 20

[15 – 30[ 10

[30 – 60 [ 30

[60 – 100] 40

�̅� = 49,25 𝑎ñ𝑜𝑠

𝑆𝑌 = 28,494 𝑎ñ𝑜𝑠

c.

Y/60<X<90 𝑛⦁30<𝑥<90

[0 – 15[ 12

[15 – 30[ 2

[30 – 60[ 15

[60 – 100] 21

d.

X/60<Y<90 𝑛60<𝑦<100⦁

[0 – 30[ 3

[30 – 90[ 21

[90 – 180] 16

4.2 medidas de asociación para

variables cuantitativas.

1.-

a. 𝑟 = 0,640

La asociación lineal entre los años y el

nivel de satisfacción es positiva y alta.

b. �̂� = 4,481 + 0,342𝑥

�̂� = 4,481 + 0,342⦁11 = 8,252

Cuando se lleva 11 años en el sindicato,

el índice de satisfacción es de 8,252.

6 = 4,481 + 0,342𝑥 ⇒ 𝑥 =4,429 años

Page 26: SOLUCIONES UNIDAD I 1.2 Definición de población, muestra

191

2.-

a.

Q/B 2 3 4 5 6 7

2 0 0 0 1 0 1

3 0 0 1 0 0 0

4 0 0 1 2 0 2

5 1 0 0 2 0 1

6 1 0 0 1 1 1

7 0 1 0 2 3 3

b. 8 de 25 alumnos obtuvieron notas

mayores de un 5 en ambas

asignaturas.

12 de 25 alumnos obtienen más de un

5 como nota en la asignatura de

biología.

13 de 25 alumnos obtienen más de un

5 como nota en la asignatura de

química.

c.

B/Q=6 2 3 4 5 6 7

n 1 0 0 1 1 1

1 de 4 alumnos obtuvo la mejor nota en

biología dado que tenga un 6 en química.

d. 𝑟 = 0,056

A los alumnos que les va bien en

biología, no necesariamente les va ir bien

en química, pues las variables tienen una

asociación lineal casi nula.

3.-

a. En el país A nos dice que las

variables están asociadas

positivamente pero su fuerza de

asociación es baja.

En el país B nos dice que las

variables están asociadas

positivamente y su fuerza de

asociación es fuerte.

4.-

𝑟 = 1 Podemos afirmar que las variables

precio y consumo están asociadas fuerte y

positivamente.

5.-

a. �̅� = 20,5 ; 𝑆𝑥 = 8,255

�̅� = 6,6 ; 𝑆𝑦 = 3,500

b. 𝑆𝑋𝑌 = 19,7

Las variables están asociadas

positivamente.

c. Si se aumenta en un millón de de

pesos la covarianza no se ve afectada.

Si se aumenta la renta en un 6%,

entonces la covarianza incrementara

en un 6%.

4.3 análisis de regresión lineal simple.

1.-

a. 𝑟 = 0,638 Si existe una correlación

lineal, estas están asociadas fuerte y

positivamente.

b. �̂� = 1,875 + 0,59375𝑥

�̂� = 1,613 + 0,6855𝑦

Page 27: SOLUCIONES UNIDAD I 1.2 Definición de población, muestra

192

2.-

a. 0,4793

Interpretación: la distribución del

número de días de licencia de los

trabajadores es asimétrica hacia la

derecha.

b. La edad más frecuente de personas

que piden licencia es de 34,285 años.

c. �̂� = 0,8931𝑥 − 11,013

3.-

a. 𝑟 = −0,996. Hay una relación muy

fuerte y negativa entre las dos

variables. A medida que pasa el

tiempo la altura va bajando (se va

consumiendo el agua)

b. Cuando hayan transcurrido 40 horas,

la altura del agua habrá descendido a

8,841 metros.

c. Tienen que pasar 65,991 horas para

que suene la alarma.

4.-

a.

b. �̂� = −9,813 + 0,1714𝑥

A medida que aumenta la presión sonora

en un decibel, la presión sanguínea

disminuirá en 0,1714.

5.-

a. �̂� = 0,5𝑦 + 75

b. 𝑟 = 0,461 𝑟2 = 0,2127

El modelo no es el más apropiado, ya

que solo está asociado un 0,461 y

además solo está explicando un

21,27% los datos.

c. Para una renta de 241.000 se

consume un total de 332 en miles.

4.4 gráficos que muestran asociación

entre variables.

1.-

a.

b. Solución al lector.

2.-

a. 𝐿𝑃𝑠̅̅ ̅̅ ̅ = 9

El número medio de LPs vendidas es

de 9 ventas.

b. �̂� = 1,420𝑥 + 28,217 c. Se prevén 30,773 conciertos para este

verano si se venden 1800 LPs

Page 28: SOLUCIONES UNIDAD I 1.2 Definición de población, muestra

193

3.-

a. El consumo es dependiente.

La renta es independiente.

b.

4.-

a. �̂� = 39,941 + 0,447𝑋

b.

5.-

a. �̂� = 3,798𝑥 + 27,823

b.

c. Al cabo de 6 horas habrán 50,614

gérmenes. Es una buena predicción

pues el modelo de regresión explica

un 95,157%

6.-

a. �̂� = 0,6515𝑥 + 166,798

�̂� = 0,3106𝑥 + 206,63

b.

c. 𝑟 = 0,449, luego las variables

puntaje de matemática y puntaje

lectura existe una asociación lineal

positiva y baja.

Page 29: SOLUCIONES UNIDAD I 1.2 Definición de población, muestra

194

CONTROL UNIDAD

1.-

a. Solución al lector.

b. Demostración

∑ ∑ 𝑛𝑖𝑗

𝑓

𝑖=1

𝑐

𝑗=1

= 𝑥1𝑦1 + 𝑥2𝑦2 + ⋯ + 𝑥𝑖𝑦𝑗 + ⋯ + 𝑥𝑓𝑦𝑐

= 𝑛11 + 𝑛22 + ⋯ + 𝑛𝑖𝑗 + ⋯ + 𝑛𝑓𝑐

= 𝑛

Luego,

∑ ∑ 𝑛𝑖𝑗

𝑓

𝑖=1

𝑐

𝑗=1

= 𝑛

c. Demostración

∑ ∑ 𝑓𝑖𝑗

𝑓

𝑖=1

𝑐

𝑗=1

=𝑥1𝑦1 + 𝑥2𝑦2 + ⋯ + 𝑥𝑖𝑦𝑗 + ⋯ + 𝑥𝑓𝑦𝑐

𝑛

=𝑛11 + 𝑛22 + ⋯ + 𝑛𝑖𝑗 + ⋯ + 𝑛𝑓𝑐

𝑛

= 1

Luego,

∑ ∑ 𝑓𝑖𝑗

𝑓

𝑖=1

𝑐

𝑗=1

= 1

d. Demostración

∑ 𝑛𝑖⋅

𝑓

𝑖=1

= 𝑥1 + 𝑥2 + ⋯ + 𝑥𝑖 + ⋯ + 𝑥𝑓

= 𝑛1⦁ + 𝑛2⦁ + ⋯ + 𝑛𝑖⦁ + ⋯ + 𝑛𝑓⦁

= 𝑛

Luego,

∑ 𝑛𝑖⋅

𝑓

𝑖=1

= 𝑛

e. Ídem al anterior.

2.- Solución al lector.

EJERCICIOS TIPO PRUEBA

1.-

a.

b.

Hábito de fumar 𝑛𝑖⦁

Muy fumador 0,133

Fumador 0,266

Fumador esporádico 0,399

No fumador 0,199

Page 30: SOLUCIONES UNIDAD I 1.2 Definición de población, muestra

195

Tipo de accidente 𝑛⦁𝑗

Muy grave 0,123

Grave 0,247

Lesiones medias 0,266

Leves 0,361

c.

Tipo accidente

M G G L M L 𝑛𝑖⦁

Háb

ito

de

fum

ar

M F 3,8% 1,9% 1,9% 5,7% 13.3%

F 5,7% 7,6% 3,8% 9,5% 26,6%

F E 1,9% 11,4% 15,2% 11,4% 39,9%

N F 0,9% 3,8% 5,7% 9,5% 19,9%

𝑛⦁𝑗 12,3% 24,7% 26,6% 36,1% 99,7%

Interpretación: un 11,4% de los

trabajadores son fumadores esporádicos

que sufrieron accidentes lesiones leves.

Un 7,6% de los trabajadores son

fumadores y sufrieron accidentes graves.

2.-

a. Por lo que podemos notar en la

tablas, las variables estarían

relacionadas linealmente la una con

la otra, lo que podemos confirmar

con el valor de 𝑟.

𝑟 = 0,978.

b. �̂� = 0,362𝑥 + 3,604

c. Con 60 millones en gastos de

publicidad se espera que hayan

25,369 en volumen en ventas de la

empresa. Y para un volumen de

ventas de 20 mil millones se espera

tener gastos en publicidad de 45,198

millones.

d. 𝑟 = 0,978, es decir, la asociación

lineal entre las variables es fuerte y

positiva.

3.-

a.

Page 31: SOLUCIONES UNIDAD I 1.2 Definición de población, muestra

196

b.

Page 32: SOLUCIONES UNIDAD I 1.2 Definición de población, muestra

197

c. Los coeficientes de correlación lineal

son:

𝑟 = 0,936

𝑟 = 0,522

𝑟 = 0,616

𝑟 = 0,358

𝑟 = 0,478

𝑟 = 0,936

d. Solución al lector

4.-

Solución al lector

5.-

a. Los corredores que les va bien en los

100 metros también les irá bien en

los 400 metros, pues el coeficiente de

correlación nos indica que las

variables están asociadas fuerte y

positivamente.

b. �̂� = 1,8𝑥 + 39,39

c. Con una marca de 11 segundos en

100 metros se espera que el atleta

marque 59,19 segundos en 400

metros.

6.-

Si sustituimos el valor de 𝑦 de la recta de

regresión de 𝑌 sobre 𝑋,

𝑦 = �̅� +𝑆𝑥𝑦

𝑆𝑥2

⋅ 𝑥 −𝑆𝑥𝑦

𝑆𝑥2

⋅ �̅�

en la recta de regresión de 𝑋 sobre 𝑌,

𝑥 − �̅� =𝑆𝑥𝑦

𝑆𝑦2

⋅ (𝑦 − �̅�)

De ambas expresiones obtenemos:

𝑥 − �̅� =𝑆𝑥𝑦

𝑆𝑦2

⋅ (�̅� +𝑆𝑥𝑦

𝑆𝑥2

⋅ 𝑥 −𝑆𝑥𝑦

𝑆𝑥2

⋅ �̅� − �̅�)

Simplificando y operando, resulta que

𝑥 − �̅� = 𝑥 ⋅𝑆𝑥𝑦

2

𝑆𝑥2 ⋅ 𝑆𝑦

2− �̅� ⋅

𝑆𝑥𝑦2

𝑆𝑥2 ⋅ 𝑆𝑦

2

Page 33: SOLUCIONES UNIDAD I 1.2 Definición de población, muestra

198

Por último, agrupando términos

semejantes,

𝑥 (1 −𝑆𝑥𝑦

2

𝑆𝑥2 ⋅ 𝑆𝑦

2) = �̅� (1 −

𝑆𝑥𝑦2

𝑆𝑥2 ⋅ 𝑆𝑦

2)

Es decir,

𝑥(1 − 𝑟2) = �̅�(1 − 𝑟2)

Si suponemos que

1 − 𝑟2 = 0

Esto es, si 𝑟2 = 1, entonces, el ajuste es

perfecto y, como sabemos, las dos rectas

de regresión coinciden.

Si, por lo contrario

1 − 𝑟2 ≠ 0

Entonces, dividiendo por esa los dos

miembros de la igualdad se obtiene que 𝑥

es �̅� y, sustituyendo, por ejemplo, en la

recta de regresión de 𝑌 sobre 𝑋 resulta un

valor de 𝑦 igual a �̅�; en definitiva, las

rectas de regresión tienen como punto de

corte (�̅� , �̅�), punto denominado centro de

gravedad.