estadistica descriptiva primera unidad base conceptual …...estadística descriptiva: prof....
TRANSCRIPT
Estadística Descriptiva: Prof. Francisco Herrera Catalino. Santo Domingo. República Dominica. Mayo 2020
1
ESTADISTICA DESCRIPTIVA
Primera unidad
Base conceptual de la estadística descriptiva
Prof. Francisco Herrera Catalino
Santo Domingo, República Dominicana.
1 de mayo 2020
Estadística Descriptiva: Prof. Francisco Herrera Catalino. Santo Domingo. República Dominica. Mayo 2020
2
“El pensamiento estadístico será algún día tan
necesario para el ciudadano competente como la
habilidad de leer y escribir”
1903
(Herbert George Wells (H.G. Wells 1866-1946),
escritor, historiador y filósofo británico)
Estadística Descriptiva: Prof. Francisco Herrera Catalino. Santo Domingo. República Dominica. Mayo 2020
3
INDICE
1. Introducción
2. ¿Qué es la estadística y qué son las estadísticas?
3. ¿En cuáles áreas del conocimiento se aplica la
estadística?
4. Ejemplos de aplicación de la estadística son:
5. Etapas del proceso de investigación estadística
6. Funciones de la estadística
7. Ejemplos de la necesidad de informaciones
estadísticas
8. Estadística y estadísticas. Población y muestra Censo
y muestreo. Parámetros y estadísticos
9. Observaciones y frecuencias. Fuentes e
instrumentos. Datos cuantitativos y datos
cualitativos
10. Variables y constantes y nivel de medición de la
variable
11. Series y distribución. Informaciones. Coeficientes e
indicadores
Estadística Descriptiva: Prof. Francisco Herrera Catalino. Santo Domingo. República Dominica. Mayo 2020
4
1. Introducción
1. La estadística permanece desde que surgió, por los años 1600,
como una actividad que sus enemigos no han podido evitar, y
mucho menos, desaparecer.
2. La razón de la presencia por más de 400 años de la estadística
está en que la fortaleza de sus métodos se confirma
permanentemente.
3. Los métodos estadísticos deben su rigor a la base conceptual que
sustenta los modelos matemáticos y empíricos. Solo la mala
intención puede hacer que los métodos estadísticos no
proporcionen resultados, de acuerdo con su misión y función, de
representar a la realidad.
4. La estadística tiene cinco motivos para su existencia, el primero
recolección de datos según necesidades, segundo resumir y
organizar datos para convertirlos en informaciones, tercero
permitir las comunicación de informaciones y cuarto apoyar la
toma de decisiones oportunas.
5. La estadística, para llegar a comprenderla, requiere un buen
dominio de base conceptual que incluye alrededor de 30 conceptos
y la observación correcta de sus propiedades.
Estadística Descriptiva: Prof. Francisco Herrera Catalino. Santo Domingo. República Dominica. Mayo 2020
5
2. ¿Qué es la estadística y que son las estadísticas?
5. Es un conjunto de procedimientos que se aplican para obtener
datos y producir informaciones, sobre la base de las que se
describen, interpretan y explican las variables de interés, una etapa
necesaria para obtener conocimientos que sirven para apoyar la
toma de decisiones. Un ejemplo de estadística son los métodos y
técnicas que se emplean para planear, ejecutar y obtener
resultados de los censos y las encuestas por muestreo.
6. En cambio, las estadísticas se refieren a los resultados del
proceso estadístico. Estas son las tablas, las gráficas y los
comentarios descriptivos, interpretativos o explicativos.
7. La estadística se clasifica en descriptiva (referida a la
presentación de resultados en tablas graficas y textos con un nivel
simple de análisis) y la estadística inferencia o analítica (vinculada a
la producción de resultados producto de la relación, la
comparación, el análisis, la inducción, la deducción, las pruebas, los
pronósticos, entre otros procedimientos)
8. La estadística se nos presenta de tres manera con respecto a su
área de especialización: General (aplicada a cualquier área del
conocimiento) y especializada (se aplica procedimientos específicos
relativos las características y los contenidos del área)
Estadística Descriptiva: Prof. Francisco Herrera Catalino. Santo Domingo. República Dominica. Mayo 2020
6
3. Areas del conocimiento en las que se aplica la estadística
9. No es observable un área del conocimiento en la que no se
aplique la estadística. En las siguientes disciplina, la estadística o
tiene relaciones estrechas o la determina. Por ejemplo en:
1.Sociología, 2. Demografía, 3. Epidemiología, 4. Medicina, 5.
Administración, 6.Educación, 7. Psicología, 8. Economía, entre
otras.
10 Ejemplos de su aplicación son:
1) A la Sociología: la estadística le aporta de manera sistemáticas
las informaciones socio-demográficas que son partes integrantes de
las bases para realizar los análisis de la realidad social.
2) La demografía se apoya en los métodos estadísticos que tienen
que ver con las relaciones como cociente entre dos números y los
indicadores, las tasas, las razones, los índices
3) En la epidemiología es inevitable la presencia de la estadística.
Morbilidad y mortalidad, incidencia y prevalencia sólo son posibles
por la presencia de relaciones estadísticas en tasas y razones.
4) En la Medicina la estadística desarrolló un área especializada
llamada bioestadística. Consiste en la aplicación de los
procedimientos estadísticos a la biología, incluye la anatomía.
5) La Administración general o de Empresas existe para tomar
decisiones, la que con la ausencia de informaciones estadísticas no
es posible. La teoría de decisión es una aplicación especializada de
la estadística a la administración
Estadística Descriptiva: Prof. Francisco Herrera Catalino. Santo Domingo. República Dominica. Mayo 2020
7
6) La educación como actividad destinada al desarrollo de las
personas, debe planificar, investigar y administrar el desarrollo de
procesos educativos. Estas actividades requieren en su desarrollo
de la estadística y las estadísticas. Las relaciones entre la educación
y la estadística han llegado a ser tan importante que existe la
estadística aplicada a la educación como una disciplina
especializada
7) La Psicología, principalmente en su ámbito social, tiene vínculos
especiales con la estadística. Por eso, se desarrolló la disciplina
sicológica y estadística denominada: sicometría.
8) La Economía tiene un vínculo tan claro con la estadística que de
su relación surgió una disciplina denominada econometría.
Estadística Descriptiva: Prof. Francisco Herrera Catalino. Santo Domingo. República Dominica. Mayo 2020
8
4. Etapas del proceso de investigación estadística
11. Etapas del proceso
1) Planteamiento del problema: Se realiza para establecer las
necesidades de información del objeto de investigación.
precisar el universo o población.
2) Elaboración de objetivos de la investigación: Se especifica las
informaciones que se deben construir para conocer el objeto
de estudio.
3) Elaboración y aplicación de instrumento de medición:
diseño, sobre la base de los objetivos, de un documento con
preguntas para satisfacer las necesidades de información.
Llenado de los instrumentos en respuesta a las preguntas que
contiene, registrando los datos de los miembros de la
población objetivo.
4) Producción de informaciones: Procesamiento, organización,
resumen y sistematización de los datos. Comunicación
mediante tablas, gráficas, textos, valores indicativos,
relaciones, pruebas de hipótesis, pronostico, entre otros y
definición del nivel de confiabilidad de los resultados
5) Presentación de las informaciones: Elaboración de informe
estadístico con las características cuantitativas del objeto de
estudio.
6) Conclusiones: Lista de los principales resultados encontrados
relacionados con los objetivos de la investigación.
Estadística Descriptiva: Prof. Francisco Herrera Catalino. Santo Domingo. República Dominica. Mayo 2020
9
6. Funciones de la estadística
12. Por su origen, su evolución y características de las necesidades
que satisface en la estadística hay funciones de:
1. Satisfacer las necesidades de los que requieren
informaciones
2. Obtener los datos de calidad. Es decir, materias primas representativas de las características de la población
3. Obtener los datos de calidad. Es decir, materias primas
representativas de las características de la población
4. Resumir el conjunto de datos dispersos en estructuras
compactas: tablas o gráficas
5. Organizar los datos dispersos en estructuras compactas:
tablas o gráficas
6. Aplicar el rigor lógico y matemático producir y calcular
indicadores representativos de las características de las
variables cuantitativas
7. Hacer comunicable los resultados del proceso estadístico
Estadística Descriptiva: Prof. Francisco Herrera Catalino. Santo Domingo. República Dominica. Mayo 2020
10
7. Ejemplos de necesidades de informaciones
13. Las necesidades de informaciones son el principio y fin de la
estadística. La misión principal de la estadística es la satisfacción de
necesidades en proceso de emprendimiento, en medio de una
epidemia u otros, así como:
1. Una persona que vaya a abrir un restaurante en una en una
comunidad tiene la necesidad de tener informaciones del número
de habitantes, sus edades y sus ingresos, entre otras.
2. El profesor quiere conocer el estilo de aprendizaje preferidos por
los estudiantes, por eso aplica un cuestionario para definir el estilo
de aprendizaje predominante.
3. Los farmacéuticos necesitan probar y verificar los efectos de un
medicamento que se aplica a personas afectadas por un peligroso
virus.
4. Un candidato le interesa conocer su situación electoral para los
que desea tener informaciones de las personas que quieren y que
no quieren votar por él y las razones por las que quieren y no
quieren
5. El ministerio de trabajo necesita saber a qué actividad se
dedicaran los dos millones que se esperan regresen de estados
unidos
6. El ministerio de cultura quiere conocer en qué y hasta cuanto le
satisface a los visitantes a una versión de la feria internacional del
libro.
Estadística Descriptiva: Prof. Francisco Herrera Catalino. Santo Domingo. República Dominica. Mayo 2020
11
8. Estadística y estadísticas. Población, censo, parámetros
14. La estadística constituye un conjunto de procedimientos que
aplican a los fenómenos colectivos con el fin de obtener datos y
producir informaciones. Es método y datos. Ejemplos: diseño,
ejecución y procesamiento de los datos de un censo o encuesta.
8.2 En cambio, las estadísticas son todos los resultados del
proceso estadístico. Es resultados e informaciones. Ejemplos:
tablas, gráficas, frecuencias, medidas descriptivas, medidas de
dispersión,…
8.2 La población ( N ), como parte de un universo, es el conjunto
de elementos con características comunes que pertenecen a un
objeto que nos interesa estudiar. Ejemplos: 1.Población finita, las
personas contagiadas de coronavirus en los meses de marzo y abril
en la República Dominicana. Sabemos quienes son, de donde son y
cuantos son 2.Población Infinita, la población de personas que
pueden ser contagiados de coronavirus en el mes de junio en los
países del Caribe. No sabemos cuantos serán, ni donde serán, ni
cuando serán infectados.
Cuando se estudian todos los elementos que forman la población,
el tipo de investigación estadística que se emplea se denomina
censo. Ejemplos: 1. Los censos nacionales de cada 10 años. 2. Los
exámenes a una sección de estadística.
Los resultados por el procesamiento estadístico a variables
poblacionales o por censo se llaman parámetros. Estos pueden ser:
numérico, proceden de una variable cuantitativa. Ejemplo: La edad
media de infectados de coronavirus en los meses de marzo y abril
Estadística Descriptiva: Prof. Francisco Herrera Catalino. Santo Domingo. República Dominica. Mayo 2020
12
en República Dominicana. Y parámetro cualitativo proceden de
una variable cualitativa. Ejemplo: la proporción de mujeres
infectadas de coronavirus en los meses de marzo y abril en
República Dominicana.
8. Estadística y estadísticas. Muestra, muestreo, estadísticos
8.4 Por otra parte, la muestra ( n ), la constituye el conjunto de
elementos de la población, los que seleccionado al azar, la
representan. Ejemplos: n =1,200 personas de una población de N
=7,200,000 en registro electoral para un estudio de preferencia. Y,
n = 57 infectados de coronavirus para verificar los efectos de un
medicamento.
Existen dos tipos de muestra: con reemplazo (elementos tienen
más de una posibilidad de ser seleccionados en la población) y sin
reemplazo (elementos tienen una sola posibilidad de selección en
la población) Ejemplos: El profesor rifa 10 puntos en una sección de
20 estudiantes, en lista numerada de 1 a 20. En dos tiradas: primera
5 puntos y segunda 5 puntos. Sale el 8 en la primera, se excluye y
sale el 13 en la segunda, sin reemplazo. Sale el 14 en la primera y
sale el 14 en la segunda, con reemplazo. El muestreo es la otra
forma de investigación estadística, que a diferencia del censo,
estudia la población, considerando una parte representativa de
ella ( N ) denominada muestra ( n ). Ejemplo: todo el proceso de
definición del número de muestra, selección de muestra y
administración de los resultados muestrales es el muestreo. El
muestreo puede ser 1. No probabilístico, los elementos tienen más
de una oportunidad de selección. Tipo: de conveniencia: según la
circunstancia y opinático: a partir de la experiencia. y 2.
Estadística Descriptiva: Prof. Francisco Herrera Catalino. Santo Domingo. República Dominica. Mayo 2020
13
Probabilístico de los elementos de la población tienen una sola
oportunidad de ser parte de la muestra. Tipo: aleatorio simple,
aleatorio sistemático, aleatorio estratificado, aleatorio de
conglomerados.
Los resultados de una investigación muestral se denominan
estadísticos. Existen los estadísticos numéricos. Ejemplo: La edad
media de votantes por el candidato A, en la muestra de 1200, es 24
años. Y estadísticos cualitativos. Ejemplo: La proporción de
personas con efecto positivos por un medicamento en la muestra
de 57 infectados de coronavirus es del 80%.
Estadística Descriptiva: Prof. Francisco Herrera Catalino. Santo Domingo. República Dominica. Mayo 2020
14
9. Datos. Observaciones y frecuencia. Fuentes e instrumentos.
9.1 Los datos son unidades de informaciones generados por la
ocurrencia de eventos o sucesos, que se registran, cuantitativos:
número de asignaturas aprobadas: 8, o cualitativos: color
preferido: el negro
9.2 Las observaciones las constituyen el registro sistemático de los
datos que producen los eventos. Los eventos. Tipos de
observaciones: cualitativas y cuantitativas.
La frecuencia se refiere a las veces que ocurre un dato cualitativo o
cuantitativo. Ejemplos: El color negro lo prefieren 18 estudiantes y
8 asignaturas aprobadas 6 estudiantes. Las frecuencia pueden ser
absoluta fi ( fi =18 estudiantes prefieren el color negro) y relativa
fiR ( de 100 estudiantes, los 18 que prefieren el color negro, es el
fiR = 0.18 )
9.3 Para que se produzcan las observaciones es necesarias la
existencia y aplicación de instrumento de medición estadística. Los
instrumentos son medios en los que se registran datos
Las fuentes son los lugares o situaciones en las que se obtienen los
datos y las informaciones. Las fuentes pueden ser 1. Primaria o
directa, en estas los datos se observan y registran de manera
directa en instrumento de medición, se le preguntó a la persona
acerca de la edad__ color preferido __ Estatura ___ estas son
fuentes directas. Y 2. Secundaria y documental, los datos y las
informaciones se obtienen en documentos después de ser
elaborado por otra persona. El estado civil de los dominicanos
según la Oficina Nacional de Estadística ONE.
Estadística Descriptiva: Prof. Francisco Herrera Catalino. Santo Domingo. República Dominica. Mayo 2020
15
10. Variables y constantes: y nivel de medición de la variable
10.1 Las variables y las constantes son dos elementos de la
estadística. En las variables se ha sustenta la existencia de la
estadística. Porque si los eventos de la vida fueran constante la
estadística no tendría razón para existir. La constante son variable
que toman un solo valor o cualidad. Por ejemplos: en la República
Dominicana el Sol se levanta todos los días por el este y El número
de pulmones en las personas recién nacida normales es 2. La
variable son objeto o elementos importantes del sistema
estadístico que se caracterizan porque toman más de un valor o
más de una cualidad. Si preguntamos por el número de asignaturas
aprobadas a los estudiantes de una sección, estos tendrán 5, 6,7,…
, si le preguntamos por su índice académico estos tendrán 2.59,
3.13, 3.59, … y si le preguntamos por su asignatura favorita en la
secundaria estos dirán : ma, le, so, na, otra.
Las variables pueden ser: 1. Cuantitativas, contienen
cantidades, valores, puntajes. Pueden discretas toman valores
enteros, se cuentan, son generalmente finitos y entre dos valores
discretos no es posible otro. Por ejemplo: el número de asignaturas
aprobadas. Y continuas toman valores reales, se obtienen por
medición, pueden ser continuos y entre dos valores continuos
siempre es posible otro. Por ejemplo el índice académico de los
estudiantes. También, las variables estadísticas pueden ser
cualitativas con datos de modalidades, nombre, atributos,
cualidades. Como ejemplos: El lugar de residencia (cualitativa
geográfica), año de nacimiento (cualitativa cronológica), sexo o
color preferido (cualitativa personal) y universidad en la que
estudia (cualitativa institucional u organizacional)
Estadística Descriptiva: Prof. Francisco Herrera Catalino. Santo Domingo. República Dominica. Mayo 2020
16
10. Variables y constantes: y nivel de medición de la variable
10.2 La medición es un proceso en el que, según criterios definidos,
se le asigna valores o cualidades a los eventos que caracterizan a las
variables estadísticas. Serán datos cuantitativos si cuando se
observa el evento el resultado es un número (¿Cuántos hermanos
tienes?, ¿En cuántos grados centígrados está la temperatura ?) o
datos cualitativos si cuando se registra el evento el resultado es un
nombre (¿Cuál es tu genero de película favorito?, ¿En qué grado de
educación primaria se encuentra tu primer hijo? ).
Los niveles o escala de medición son las formas en que los eventos
de la realidad clasifican caracterizan a los elementos de la variables.
Se trata de una taxonomía inventada por Stevens (1951), donde
este agrupa a las variables estadísticas en nominales, ordinales, de
intervalo o de razón. Se refiere a las diferentes facetas que tiene
una variable estadística en función de la equivalencia, el orden, la
igualdad de los intervalos, la posición y función del cero. Estas
características definen tipos de modelos estadísticos y criterios en
los procesos de investigación.
Las variables tienen diferentes niveles de medición: 1. Nominal
(igual nivel o posición en las categorías), 2. Ordinal (posición entre
lo inferior y lo superior), 3. Intervalo (valores cuantitativos con cero
relativo que tiene en valor en la serie), 4. Razón (valores, donde
cero es absoluto es ausencia de cantidad). 1. Número de trimestres
cursados tiene un nivel de medición _________________, 2. La
temperatura tiene un nivel de medición ______________ 3. El
rango de los miembros de las fuerzas armadas ________________
4. El color preferido por las personas ________________
Estadística Descriptiva: Prof. Francisco Herrera Catalino. Santo Domingo. República Dominica. Mayo 2020
17
11. Series y distribución. Informaciones. Coeficientes e indicadores
11.1 Son las formas de organización de datos estadísticos. Por
ejemplos: en tipo de felinos (gato, trigre, león, …, pantera), El
número preferido del 0 al 10 (0,1,2,3,…10), en número de libras (
100-120, 121-140, 141-160, …). Las series pueden ser cualitativas
(contienen nombres, modalidades, atributos, ) o cuantitativas
(contienen numero, valores). Las series cualitativas pueden ser:
nominales y ordinales y la cuantitativas se clasifican en valores
simples y valores agrupados.
11.2 Las informaciones son los resultados del proceso estadístico.
Se presentan en resumen, orden o valores indicativos mediante
tablas, gráficas, un número y comentarios descriptivos,
interpretativos o explicativos.
11.3 Los coeficientes son valores productos de relaciones de
cociente entre dos números. Ejemplos: la frecuencia relativa, la
media aritmética, la varianza, el coeficiente de variación, la
asimetría, la curtosis, la puntuación estándar…
11.4 Los indicadores son valores que expresan las características
del contenido de una variable en termino de frecuencia, posición,
representación, dispersión, puntuación estándar,
Estadística Descriptiva: Prof. Francisco Herrera Catalino. Santo Domingo. República Dominica. Mayo 2020
18
EJERCICIO DE LA PRIMERA UNIDAD: BASE CONCEPTUAL DE LA ESTADISTICA Nombre ______________________________ ID_______________ Sección___
1. Si una población tiene menos de 100 elementos, a los que se puede acceder con facilidad y el instrumento de medición tiene menos de 50 preguntas o ítems. Lo más recomendable es aplicar estudio: censal o muestral. ¿Por qué? ______ _____________________________________ __________________________________________________________________________ 2. Los resultados de la aplicación de una investigación muestral de n = 1250 estudiantes universitarios en una plaza comercial, permitió establecer que la edad media es, x = 25 años; el sexo femenino representa el 63.7%. De la universidad Intec son el 33.4%. Y el 45% tiene más de cuatro semestres cursados. Estos resultados se denominan: parámetros o estadísticos. ¿Por qué? _____________ ____________________________________________________________ __________________________________________________________________________ 3. Si las respuestas a las preguntas de los instrumentos de medición es un número real, la variable se denomina _________________ 4. Tanto el censo, como el muestreo, se aplican a grupo cuyas poblaciones pueden ser finitas o infinitas. El número de vendedores ambulantes en la capital es una población _____________ y el número de personas que se esperan sean apresados y condenados por actos delictivos en los últimos meses del 2021 es una población _________________ y los vehículos que pagaron el impuesto de placa en el 2019 es una población ____________________ 5. Los datos de una población se pueden obtener como fuente directa o primaria, o como documental o secundaria. La entrevista a lo que salen de un colegio de votación es una fuente ___________ y la nómina de peloteros de la grande liga del año 2019 es una fuente ___________ 6. La estadística (sistema de métodos y procedimientos) y las estadísticas (informaciones resultantes de la aplicación de procedimientos). Cuando se elabora un informe estadístico su contenido es: Estadística o estadísticas. Por qué? _______________ _____________________ __________________________________________________________________________ 7. Las variables estadísticas cualitativas se clasifican en: personal (persona), institucional (organizaciones), geográfica (lugar) y cronológica (tiempo). 1. Mes de nacimiento es una variable ___________, 2. Plaza comercial preferida es una variable ____________________ 3. Asignatura preferida es una variable _____________________ 4. Centro educativo donde hizo el bachillerato ________________ 5. Países del continente americano. _________________________________ 6. Años del periodo trujillista. ___________________________ 8. Las variables cuantitativas pueden ser discreta (valores enteros que se cuentan, finitos y entre dos discretos consecutivos enteros no hay otro) y continua (valores reales que se miden, infinitos, siempre es posible un valor entre dos reales). 1. El variable índice académico es ______________ 2. Número de personas que ingresan diariamente a un establecimiento comercial ____________ 9. Las variables tienen diferentes niveles de medición: 1. Nominal (igual nivel o posición en las categorías), 2. Ordinal (posición entre lo inferior y lo superior), 3. Intervalo (valores cuantitativos con cero relativo que tiene en valor en la serie), 4. Razón (valores donde cero absoluto o ausencia de cantidad). 1. Número de trimestres cursados tiene un nivel de medición _________________,
Estadística Descriptiva: Prof. Francisco Herrera Catalino. Santo Domingo. República Dominica. Mayo 2020
19
2. La temperatura tiene un nivel de medición ______________ 3. El rango de los miembros de las fuerzas armadas ________________ 4. El color preferido por las personas ________________ 10. Los datos, que se registran en base a objetivos, en instrumento en papel o digital con preguntas o ítems denominados y que se le aplican a personas e instituciones, cosas de la naturaleza y la sociedad: __________________