introducción estadística
DESCRIPTION
Introducción estadísticaTRANSCRIPT
Estadística… Ciencia que se encarga de la recolección, análisis e
interpretación de los datos.
La estadística permite hacer inferencias y sacar
conclusiones a partir de los datos imperfectos.
La estadística apoya los procesos de toma de decisiones,
permitiéndole al empresario analizar las diferentes
alternativas a la luz de los hechos recurrentes en la
población analizada
Ejemplo: Analizar el precio del paquete de un destino
turístico, considerando las preferencias de los
consumidores (temporada, gustos, etc)
Conceptos básicos
• Diseño estadístico: Planteamiento y desarrollo
de investigaciones
• Estadística descriptiva: Conjunto de
procedimientos usados para resumir y describir
las características importantes de un conjunto de
mediciones
• Estadística inferencial: Procedimientos usados
para hacer inferencia acerca de las características
de la población, a partir de la información
contenida en una muestra extraída de la
población
• Población: Conjunto de todas las mediciones
de interés para el investigador
• Muestra: Subconjunto de mediciones
seleccionadas de la población de interés
• Parámetro: Medida de resumen calculada
sobre la población
• Estadístico: Medida de resumen calculada
sobre la muestra
• Variable: característica que cambia o se
modifica con el tiempo y/o para diferentes
individuos o unidades de observación
• Unidad de observación: Individuo u objeto
en el que se mide una variable. Puede ser
una empresa, una persona, etc
• Dato: Valor que describe la característica de
interés de la unidad de observación
• Caso: Conjunto de mediciones realizadas
sobre una unidad de observación
Tipos de variables
• Cualitativas: Miden una cualidad o
característica en cada unidad de
observación.
– Dicotómica
– Nominal
– Ordinal
• Cuantitativas: Miden una cantidad
numérica en cada unidad de observación
– Discreta
– Continua
Tipos de datos
• De corte transversal: recopila información
para varias unidades en un momento del
tiempo.
• Series de tiempo: representan observaciones
para una sola unidad en varios momentos del
tiempo, la frecuencia de los datos puede ser
diaria, semanal, trimestral, anual, etc
• Datos panel o de corte longitudinal:
corresponden a observaciones de varias
unidades en distintos momentos del tiempo
Antes del análisis de datos…
1. Cargue datos: Es recomendable usar un
formato estandarizado para registrar la
información.
– Las variables numéricas deberían ser
registradas con la misma exactitud con que
fueron obtenidas, no redondear. No
categorizar variables numéricas para
registrarlas.
- Asignar un nombre no muy extenso a cada
variable. El nombre completo de la variable
puede asignarse a través de una etiqueta
(label). Algunos paquetes aceptan nombres de
variables de a lo sumo 8 letras truncando las
letras finales. Algunos caracteres no son
permitidos en los nombres de variables, por
ejemplo el punto. No deben dejarse espacios
en blanco en el nombre de las variables.
2. Revisar la consistencia: Se busca
minimizar los errores producidos al
momento de registrar los datos originales
- Datos categóricos Tabla de
frecuencias
- Datos numéricos Rangos esperados
o posibles
- Chequeo lógico Embarazos (F/M)
- Datos faltantes (data missing) .
• La estadística descriptiva o análisis exploratorio
de datos ofrece modos de presentar y evaluar
las características principales de los datos a
través de tablas, gráficos y medidas resúmenes
• El objetivo de construir gráficos es poder
apreciar los datos como un todo e identificar
sus características sobresalientes. El tipo de
gráfico a seleccionar depende del tipo de
variable que nos interese representar
1. Tabla de frecuencias
Es un resumen tabular de los datos que muestra la
frecuencia de las unidades de observación en
cada una de las diferentes clases de la variable
- Frecuencia: número de mediciones en cada
categoría o clase
- Frecuencia relativa: Parte o proporción de los
elementos que pertenecen a cada clase
- Frecuencia porcentual: Corresponde a la
frecuencia relativa multiplicada por 100
2. Gráfica de barras
Este gráfico es útil para representar datos
categóricos nominales u ordinales. A cada categoría
o clase de la variable se le asocia una barra cuya
altura representa la frecuencia o la frecuencia
relativa de esa clase. Las arras difieren sólo en
altura, no en ancho