apuntes de estadística curso 2017/2018 esther … · apuntes de estadística curso 2017/2018...

13
Apuntes de Estadística Curso 2017/2018 Esther Madera Lastra 1

Upload: ngophuc

Post on 01-Oct-2018

227 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: Apuntes de Estadística Curso 2017/2018 Esther … · Apuntes de Estadística Curso 2017/2018 Esther Madera Lastra 2 1. MEDIA Y DESVIACIÓN TÍPICA DE DISTRIBUCIONES

Apuntes de Estadística Curso 2017/2018 Esther Madera Lastra

1

Page 2: Apuntes de Estadística Curso 2017/2018 Esther … · Apuntes de Estadística Curso 2017/2018 Esther Madera Lastra 2 1. MEDIA Y DESVIACIÓN TÍPICA DE DISTRIBUCIONES

Apuntes de Estadística Curso 2017/2018 Esther Madera Lastra

2

1. MEDIA Y DESVIACIÓN TÍPICA DE DISTRIBUCIONES La media de un conjunto de datos se calcula sumando todos los datos y dividiendo entre el número de datos.

La varianza de un conjunto de datos se calcula utilizando la siguiente fórmula:

La desviación típica de un conjunto de datos es la raíz cuadrada positiva de la varianza. Mide la dispersión de los datos. Ejercicio 1: Calcula la media, varianza y desviación típica en los siguientes conjuntos de datos. ¿Qué significa la diferencia que encuentras entre las varianzas y desviaciones típicas?

3, 5, 6, 7, 3, 6, 8, 2, 9, 1 4, 5, 6, 7, 3, 4, 6, 5, 7, 3

2. LA CURVA DE LA DISTRIBUCIÓN NORMAL

Una variable aleatoria continua sigue una distribución normal N(µ,σ) donde µ y σ coinciden respectivamente con la media y la desviación típica de la variable aleatoria. Estos parámetros son los que determinan esta distribución.

La gráfica de esta función tiene forma de campana y se conoce con el nombre de campana de Gauss. Observa que la forma de la campana y la situación respecto a los ejes dependen de los parámetros µ y σ

3. CÁLCULO DE PROBABILIDADES

Para una variable aleatoria continua X, la probabilidad de que X tome un valor menor o igual que x está determinada por el área comprendida entre la curva y el eje de abscisas. Para facilitar el trabajo, existen tablas que dan directamente el valor de estas áreas para el caso µ=0, σ=1. La tabla de la distribución normal es la que aparece en la página anterior.

3.1. Utilización de la tabla N(0,1)

En la tabla N(0,1) aparece directamente la p(z≤b) para valores de b entre 0 y 4. Observa que para valores mayores que 4 la probabilidad ya es prácticamente 1.

Ejercicio 2: Busca en la tabla: P(z ≤ 0,38) P(z ≤ 1,50) P(z ≤ 1,96) P(z ≤ 2,345)

Ejercicio 3: Calcula en la tabla: a) P(z >1,05) b) P(z ≤ -0,87) c) P(z ≥-0,25) d) P(-0,25 ≤ z ≤ 1,05) e) P(1,05 < z ≤ 1,96)

3.2. Tipificación de variables

La tabla de la distribución normal N(0,1) también nos permite calcular probabilidades relativas a cualquier otra distribución N(µ,σ). Para ello basta tipificar la variable es decir calcular el valor z correspondiente a los valores x indicados mediante la operación:

La variable tipificada, z, tiene una distribución N(0,1). Observa que llamaremos x a la variable de una distribución N(µ,σ) cualquiera y z a la variable de la distribución N(0,1)

Page 3: Apuntes de Estadística Curso 2017/2018 Esther … · Apuntes de Estadística Curso 2017/2018 Esther Madera Lastra 2 1. MEDIA Y DESVIACIÓN TÍPICA DE DISTRIBUCIONES

Apuntes de Estadística Curso 2017/2018 Esther Madera Lastra

3

Ejercicio 4: Las estaturas de cierta población se distribuyen según una normal de media 168 y desviación típica 8. Calcula la probabilidad de que elegida una persona al azar su altura sea como máximo 170 cm.

Ejercicio 5: Calcula: � en N(10,5); P(X ≤ 12) � en N(10;3,5); P(11 ≤ X ≤ 15) � en N(12,3); P(10 ≤ X ≤ 13)

Ejercicio 6:

• Las notas de cierto examen se distribuyen según una normal de media 5,4 y desviación típica 1,2. ¿Qué porcentaje de estudiantes se puede esperar que saquen entre 5 y 7?

• Al nacer, los niños de cierta población tienen un peso medio de 3450 gramos, con una desviación típica de 400 gramos. Al elegir un niño al azar, ¿cuál es la probabilidad de que pese entre 3 y 4 kilogramos?

Ejercicio 7: El tiempo que tardan los alumnos de un instituto en llegar a su casa tras la jornada escolar se distribuye según una normal de media 10 minutos y desviación típica 3 minutos. Contesta a las siguientes cuestiones:

a) ¿Cuál es la probabilidad de que un alumno, elegido al azar, tarde menos de dos minutos? b) ¿Y de que tarde entre 5 y 13 minutos? c) ¿Y de que tarde más de 15 minutos? 4. MUESTREO E INFERENCIA ESTADÍSTICA

4.1 Muestra y población

Población: es el conjunto de todos los elementos que poseen una determinada característica. En general, supondremos que la población es muy grande. Cada elemento de la población se llama individuo. El tamaño de la población es el número de elementos. Muestra: es un subconjunto de la población. El tamaño de la muestra es el número de elementos de ese subconjunto. Muestreo: es un proceso mediante el que se escoge una muestra de la población.

4.2 Tipos de muestreo

Muestreo aleatorio simple: todos los elementos de la población tienen la misma posibilidad de ser elegidos para formar parte de la muestra. Siempre es con reemplazamiento, salvo que nos digan lo contrario, y tenemos que considerar todos los órdenes posibles. Ejemplo: para realizar una encuesta sobre intención de voto en una ciudad, se elige, al azar, una muestra formada por 1000 personas. Muestreo aleatorio estratificado: la población se divide en grupos homogéneos que llamamos estratos y posteriormente, se extrae una muestra aleatoria simple de cada estrato. Ejercicio 8: Se tiene una población de 60% de mujeres y 40% hombres. Para escoger una muestra de 2000 personas, se divide la población en dos estratos: mujeres y hombres, ¿cuántos hombres y cuántas mujeres se elegirán?

4.3 Media y varianza poblacional y muestral (en poblaciones pequeñas). Distribución de las

medias muestrales. En poblaciones pequeñas (de hasta 5 elementos) se puede comprobar sin más que realizar los cálculos que la media muestral coincide con la media poblacional, y que la varianza y desviación típica muestrales son siempre menores que la varianza y desviación típica poblacional.

La variable aleatoria de las medias muestrales la representamos por y tiene las siguientes características:

a) La media es µ

b) La desviación típica es Ejercicio 9: Dada la población formada por 7, 9 y 11, calcula, al elegir muestras de tamaño 2 mediante m.a.s.

a) Media, varianza y desviación típica poblacional b) Media, varianza y desviación típica muestral c) Comprueba que las medias son iguales y que la varianza y desviación típica disminuyen.

OBSERVACIÓN: (SELECTIVIDAD)

Page 4: Apuntes de Estadística Curso 2017/2018 Esther … · Apuntes de Estadística Curso 2017/2018 Esther Madera Lastra 2 1. MEDIA Y DESVIACIÓN TÍPICA DE DISTRIBUCIONES

Apuntes de Estadística Curso 2017/2018 Esther Madera Lastra

4

Ejercicio 10:

• La distribución de las calificaciones del alumnado de 2º de Bachillerato tiene una media de 5'5 y una desviación típica de 3. Si elegimos una muestra de 40 estudiantes, ¿cuál es la probabilidad de que la media sea menor de 5 puntos?

• El peso medio de los bebés nacidos en un determinado hospital arroja una media de 2950 gramos con una desviación típica de 300 gramos. Si pesamos a los 35 bebés nacidos en la última semana, ¿cuál es la probabilidad de que su peso medio sea superior a 3 kilogramos?

• La altura media de los deportistas que participaron en una competición fue de 178 centímetros, con una desviación típica de 11 centímetros. Si elegimos al azar 50 de estos participantes, ¿cuál es la probabilidad de que su altura media esté comprendida entre 175 y 180 centímetros?

4.4 Distribución para proporciones

La variable aleatoria de las proporciones muestrales (distribución binomial) la representamos por p y tiene las siguientes características:

a) La media es p

b) La desviación típica es (siendo q=1-p)

OBSERVACIÓN: (SELECTIVIDAD) Ejercicio 11:

• La vacuna contra la meningitis meningocócica de tipo C inmuniza al 90% de las personas inoculadas. Si elegimos una muestra de 50 personas, ¿cuál es la probabilidad de que la proporción de la muestra inmunizada sea mayor o igual al 85%?

• El 95% del profesorado quiere introducir una nueva medida de cara a Selectividad. Si preguntamos a una muestra aleatoria de 70 profesores, ¿cuál es la probabilidad de que al menos el 90% estén de acuerdo con dicha medida?

4.5 Intervalos de confianza para la media

A. Intervalo de confianza para la media muestral

Un intervalo de confianza para la media muestral es un intervalo simétrico respecto de la media µ de la población:

Y se calcula así:

Error en el intervalo de confianza:

Amplitud del intervalo de confianza:

La relación entre ambos es: A=2ε El valor 1-α es el nivel de confianza que tenemos de que la media muestral pertenezca al intervalo dado. El valor α es el nivel de significación y significa el riesgo de que la media muestral no esté en dicho intervalo. IMPORTANTE: Cuando nos pidan el intervalo de confianza, hay que hacer este dibujo. Ejercicio 12: Halla el intervalo de confianza con un nivel del 95% para la talla media de una muestra de 150 personas, si la talla de la población sigue una distribución normal de media 175 cm y desviación típica 16 cm.

Page 5: Apuntes de Estadística Curso 2017/2018 Esther … · Apuntes de Estadística Curso 2017/2018 Esther Madera Lastra 2 1. MEDIA Y DESVIACIÓN TÍPICA DE DISTRIBUCIONES

Apuntes de Estadística Curso 2017/2018 Esther Madera Lastra

5

B. Intervalo de confianza para la media poblacional

Tomando el intervalo de anterior y despejando de las desigualdades el valor de la variable X en la función de la media, µ, de la población, tenemos que: El intervalo de confianza para la media µ, de la población, es

IMPORTANTE: Es exactamente igual que el anterior, cambiando Ejercicio 13: En una muestra de 500 alumnos de 2º de Bachillerato, hemos medido el cociente intelectual obteniendo una media de 100. Sabiendo que la desviación típica de la población es 15, halla el intervalo de confianza con un nivel de confianza del 99% para la media de la población. Ejercicio 14: Calcula el tamaño mínimo que debería tener esta muestra si quisiéramos que el error cometido fuera como mucho de 3, con el mismo nivel de confianza.

4.6 Intervalos de confianza para la proporción

A. Intervalo de confianza para la proporción muestral

La distribución de las proporciones muestrales de muestras de tamaño n≥30, la estudiaremos como una siendo p la proporción de la población. La proporción es siempre un porcentaje expresado como un número decimal, y

muy importante, El intervalo de probabilidad para la proporción de la muestra es:

Error en el intervalo de confianza:

Amplitud del intervalo de confianza:

La relación entre ambos es: A=2ε El valor 1-α es el nivel de confianza que tenemos de que la proporción muestral pertenezca al intervalo dado. El valor α es el nivel de significación y significa el riesgo de que la proporción muestral no esté en dicho intervalo. Ejercicio 15: En un municipio sabemos que la proporción de las familias que tienen ordenador en casa es 0'7. Si elegimos una muestra de 120 familias, ¿cuál es el intervalo de confianza a un nivel del 95% para la proporción de la muestra?

B. Intervalo de confianza para la proporción poblacional El intervalo de confianza para la proporción p de la población es.

IMPORTANTE: Es exactamente igual que el anterior, cambiando Ejercicio 16: Hemos estudiado la reacción de un medicamento en 100 personas obteniendo resultados positivos en 75 de ellos. Halla el intervalo de confianza para la proporción de resultados positivos de la población con un nivel de confianza del 99%. Ejercicio 17: Deseamos hacer una encuesta para determinar el grado de satisfacción de los pacientes de una clínica. Admitimos un error máximo de 0'01 con un nivel de confianza del 95%. Hemos realizado una encuesta piloto y se ha determinado que el 84% están satisfechos. ¿Qué tamaño de la muestra debemos tomar?

Page 6: Apuntes de Estadística Curso 2017/2018 Esther … · Apuntes de Estadística Curso 2017/2018 Esther Madera Lastra 2 1. MEDIA Y DESVIACIÓN TÍPICA DE DISTRIBUCIONES

Apuntes de Estadística Curso 2017/2018 Esther Madera Lastra

6

EJERCICIOS DE SELECTIVIDAD 2012 Ejercicio 1 La variable “tiempo de reacción de un conductor ante un obstáculo imprevisto” sigue una distribución Normal con desviación típica 0.05 segundos. Al medir dicho tiempo en 50 conductores se ha obtenido un tiempo medio de 0.85 segundos. a) (1.25 puntos) Halle el intervalo de confianza para el tiempo medio de reacción, con un nivel de confianza del 99%. b) (1.25 puntos) ¿De qué tamaño mínimo ha de tomarse una muestra para que el error de estimación no supere 0.01 segundos, con un nivel de confianza del 95%? Ejercicio 2 Una característica de una determinada población se distribuye según una variable aleatoria Normal X de media desconocida y desviación típica 0.9. Extraída al azar una muestra de tamaño 9 de esa población y observada X, dio como resultados:

10.5 10 8.5 10.5 11.5 13.5 9.5 13 12 a) (1.25 puntos) Halle un intervalo de confianza, al 99%, para la media de la variable X. b) (1.25 puntos) Determine el tamaño mínimo que debe tener una muestra de esa población, para que el error máximo que se cometa en la determinación de un intervalo de confianza para la media de X sea, a lo sumo, 0.3, con un nivel de confianza del 90%. Ejercicio 3 Se acepta que los rendimientos anuales, medidos en porcentajes, que producen los depósitos bancarios a plazo, se distribuyen según una ley Normal con desviación típica 1.8 y se pretende realizar una estimación del rendimiento medio de los mismos. Para ello, se tiene una muestra de 36 entidades bancarias en las que se observa que el rendimiento medio de los depósitos es del 2.5. a) (1.5 puntos) Calcule un intervalo de confianza, al 96%, para el rendimiento medio de los depósitos a plazo. ¿Cuál es el error máximo cometido en la estimación? b) (1 punto) Manteniendo el mismo nivel de confianza, ¿cuál debe ser el tamaño mínimo de la muestra para estimar el rendimiento medio de los depósitos con un error máximo de 0.5? Ejercicio 4 a) (1 punto) En una ciudad viven 400 hombres y 320 mujeres y se quiere seleccionar una muestra de tamaño 54 utilizando muestreo estratificado por sexos, con afijación proporcional, ¿cuál sería la composición de la muestra? b) (1.5 puntos) A partir de una población de elementos 1, 2, 3, 4 se seleccionan, mediante muestreo aleatorio simple, todas las muestras de tamaño 2. Escriba dichas muestras y calcule la varianza de las medias muestrales. Ejercicio 5 De una muestra aleatoria de 120 alumnos presentados a las Pruebas de Acceso, sólo 15 han resultado no aptos. a) (1.5 puntos) Calcule un intervalo de confianza, al 99%, para estimar la proporción de alumnos que han resultado aptos en dicha prueba. b) (1 punto) Manteniendo la misma confianza, ¿cuál debe ser el tamaño mínimo de la muestra para estimar la proporción de alumnos aptos, cometiendo un error inferior al 5%? Ejercicio 6 El peso de las calabazas de una determinada plantación sigue una ley Normal con desviación típica 1200 g. a) (2 puntos) Halle el tamaño mínimo de la muestra que se ha de elegir para, con un nivel de confianza del 95%, estimar el peso medio con un error menor de 450 g. b) (0.5 puntos) Para el mismo nivel de confianza, indique, razonando la respuesta, si el error aumenta o disminuye al aumentar el tamaño de la muestra. Ejercicio 7 La velocidad a la que circulan los conductores por una autopista sigue una distribución )20,(µN . En un control

efectuado a 100 conductores elegidos al azar ha resultado una velocidad media de 110 km/h. a) (2 puntos) Determine el intervalo de confianza paraµ , con un nivel del 99%.

b) (0.5 puntos) ¿Cuál es el máximo error cometido en esta estimación?

Page 7: Apuntes de Estadística Curso 2017/2018 Esther … · Apuntes de Estadística Curso 2017/2018 Esther Madera Lastra 2 1. MEDIA Y DESVIACIÓN TÍPICA DE DISTRIBUCIONES

Apuntes de Estadística Curso 2017/2018 Esther Madera Lastra

7

2011 Ejercicio 8

Ejercicio 9

Ejercicio 10

Ejercicio 11

Ejercicio 12

Ejercicio 13

Ejercicio 14

Page 8: Apuntes de Estadística Curso 2017/2018 Esther … · Apuntes de Estadística Curso 2017/2018 Esther Madera Lastra 2 1. MEDIA Y DESVIACIÓN TÍPICA DE DISTRIBUCIONES

Apuntes de Estadística Curso 2017/2018 Esther Madera Lastra

8

2014 Ejercicio 15

Ejercicio 16

. Ejercicio 17

Ejercicio 18

Ejercicio 19

Page 9: Apuntes de Estadística Curso 2017/2018 Esther … · Apuntes de Estadística Curso 2017/2018 Esther Madera Lastra 2 1. MEDIA Y DESVIACIÓN TÍPICA DE DISTRIBUCIONES

Apuntes de Estadística Curso 2017/2018 Esther Madera Lastra

9

Ejercicio 20

Ejercicio 21

Ejercicio 22

2013 Ejercicio 23

Ejercicio 24

Page 10: Apuntes de Estadística Curso 2017/2018 Esther … · Apuntes de Estadística Curso 2017/2018 Esther Madera Lastra 2 1. MEDIA Y DESVIACIÓN TÍPICA DE DISTRIBUCIONES

Apuntes de Estadística Curso 2017/2018 Esther Madera Lastra

10

Ejercicio 25

Ejercicio 26

Ejercicio 27

Ejercicio 28

Ejercicio 29

Ejercicio 30

Page 11: Apuntes de Estadística Curso 2017/2018 Esther … · Apuntes de Estadística Curso 2017/2018 Esther Madera Lastra 2 1. MEDIA Y DESVIACIÓN TÍPICA DE DISTRIBUCIONES

Apuntes de Estadística Curso 2017/2018 Esther Madera Lastra

11

Ejercicio 31

2017 Ejercicio 32

Ejercicio 33

Ejercicio 34

Ejercicio 35

Page 12: Apuntes de Estadística Curso 2017/2018 Esther … · Apuntes de Estadística Curso 2017/2018 Esther Madera Lastra 2 1. MEDIA Y DESVIACIÓN TÍPICA DE DISTRIBUCIONES

Apuntes de Estadística Curso 2017/2018 Esther Madera Lastra

12

Ejercicio 36

Ejercicio 37

Ejercicio 38

Ejercicio 39

Ejercicio 40

Ejercicio 41

Page 13: Apuntes de Estadística Curso 2017/2018 Esther … · Apuntes de Estadística Curso 2017/2018 Esther Madera Lastra 2 1. MEDIA Y DESVIACIÓN TÍPICA DE DISTRIBUCIONES

Apuntes de Estadística Curso 2017/2018 Esther Madera Lastra

13

Ejercicio 42

Ejercicio 43