estadÍstica general. · ... además de las empresas de ... spss for windows 10 / for macintosh 10...
TRANSCRIPT
ESTADÍSTICA
GENERAL.
UNIVERSIDAD NORORIENTAL PRIVADA
“GRAN MARISCAL DE AYACUCHO”.
FACULTAD DE CIENCIAS ECONÓMICAS Y SOCIALES.
ESCUELA DE ADMINISTRACIÓN.
INTEGRANTE:
ROXANA LÓPEZ.
C.I:26.896.088
PROF:
HAMLET MATA MATA.
1
ÍNDICE
INTRODUCCIÓN..……………………………………………….……………………….2
PROGRAMA
SPSS…………………………………………………………………………………….…...3
HISTORIA ....................................................................................................................... 4
VERSIONES DEL
SPSS…………………………………………………………………………………………4
SPSS Opciones………………………………………………………………………………9
PASW es SPSS ................................................................................................................ 12
PROCEDIMIENTO GENERAL DE RESOLUCIÓN DE UN PROBLEMA CON
SPSS………………………………………………………………………………………..11
UTILIZACION DEL SPSS………………………………………………………………...12
CAPTURA DE DATOS E INTRODUCCIÓN DIRECTA EN SPSS
OPERACIONES HABITUALES CON VARIABLES EN SPSS
RECODIFICAR VARIABLES
CALCULAR NUEVAS VARIABLES A PARTIR DE OTRAS EXISTENTES
FILTRAR CASOS
FUNDIR ARCHIVOS
OTRAS OPERACIONES FRECUENTES
ANÁLISIS PRIMARIO DE INFORMACIÓN
LECTURA DE DATOS
TRANSFORMACIÓN DE VARIABLES.
Definición de las variables………………………………………………………………21
Nombres de las variables
Tipos de las variables
Etiquetas de las variables
Propiedades de variables………………………………………………………………..24
Definición de propiedades de variables………………………………………………..25
El formato de columna de las variables……………………………………………….29
ESTRUCTURA DEL SPSS……………………………………………………………34
2
SISTEMA DE VENTANAS DE SPSS
VENTANAS
BOTONES
MENÚ PRINCIPAL
ICONOS
Iconos de la Ventana Principal ......................................................................................... 39
Iconos del Visor ............................................................................................................... 41
Iconos de la Ventana de Gráficos ..................................................................................... 42
BARRA DE ESTADO ................................................................................................. 44
ESTADISTICA DESCRIPTIVA CON SPSS…………………………………………..44
GRÁFICOS CON SPSS………………………………………………………………….48
VENTAJAS DE SPSS……………………………………………………………………53
DESVENTAJAS DE SPSS………………………………………………………………53
CONCLUSIÓN…………………………………………………………………………..54
ANEXOS…………………………………………………………………….…………...55
3
INTRODUCCIÓN
El SPSS es una potente aplicación de análisis estadísticos de datos, dotada de una intuitiva
interfaz gráfica que resulta muy fácil de manejar.
El paquete estadístico SPSS, responde al funcionamiento de todo programa que lleva a cabo
análisis estadísticos: pasados los datos a analizar a un fichero con las características del
programa, éste es analizado con una serie de órdenes, dando lugar a unos resultados de tipo
estadístico que el investigador debe interpretar.
SPSS implementa menús que permiten realizar análisis complejos de manera rápida y
sencilla. Previo a todo ello se debe tener clara la metodología de actuación.
SPSS lleva a cabo las tres etapas claves para la realización del estudio estadístico:
Implementa de forma organizada y ordenada la base de datos.
Nos ayuda en la manipulación de los datos.
Implementa técnicas estadísticas para el análisis de los datos.
Al igual que muchos paquetes de software, el SPSS es guiado por menús. Esto significa que
los usuarios pueden ejecutar análisis estadísticos, simples o complejos, haciendo clic en una
serie de menús desplegables y seleccionando los comandos deseados pre-programados. Sin
embargo, muchos investigadores y analistas pueden utilizar ciertos procedimientos
estadísticos que no son pre-programados en el programa SPSS. Como resultado, permite a
los usuarios crear programas personalizados, o para unir múltiples operaciones de pre-
programados para ser aplicados en secuencia.
4
PROGRAMA SPSS
Es un programa estadístico informático muy usado en las ciencias exactas, sociales y
aplicadas, además de las empresas de investigación de mercado. Originalmente SPSS fue
creado como el acrónimo de Statistical Package for the Social Sciences aunque también se
ha referido como "Statistical Product and Service Solutions" (Pardo, A., & Ruiz, M.A.,
2002, p. 3). Sin embargo, en la actualidad la parte SPSS del nombre completo del software
(IBM SPSS) no es acrónimo de nada.
Es un sistema amplio y flexible de análisis estadístico y gestión de información que capaz
de trabajar con datos procedentes de distintos formatos generando, desde sencillos gráficos
de distribuciones y estadísticos descriptivos hasta análisis estadísticos complejos que nos
permitirán descubrir relaciones de dependencia e interdependencia, establecer
clasificaciones de sujetos y variables, predecir comportamientos, etc...
Su aplicación fundamental está orientada al análisis multivariante de datos experimentales.
HISTORIA
Fue creado en 1968 por Norman H. Nie, C. Hadlai (Tex) Hull y Dale H. Bent.
Entre 1969 y 1975 la Universidad de Chicagopor medio de su National Opinion Research
Center estuvo a cargo del desarrollo, distribución y venta del programa. A partir de 1975
corresponde a SPSS Inc.
Originalmente el programa fue creado para grandes computadores. En 1970 se publica el
primer manual de usuario del SPSS por Nie y Hall. Este manual populariza el programa
entre las instituciones de educación superior en EE. UU. En 1984 sale la primera versión
para computadores personales.
Desde la versión 14, pero más específicamente desde la versión 15 se ha implantado la
posibilidad de hacer uso de las librerías de objetos del SPSS desde diversos lenguajes de
programación. Aunque principalmente se ha implementado para Python, también existe la
posibilidad de trabajar desde Visual Basic, C++ y otros lenguajes.
El 28 de junio de 2009 se anuncia que IBM, meses después de ver frustrado su intento de
compra de Sun Microsystems, adquiere SPSS, por 1.200 millones de dólares.
Con la era del PC y Windows evolucionó muy rápidamente y hoy, en su versión 12,
constituye un programa que ofrece un conjunto de herramientas de análisis gráfico y
cuantitativo, estructurado en partes independientes e integrables que reciben el nombre de
módulos. Así, partiendo desde un módulo base que contiene, como su propio nombre
indica, el conjunto básico de utilidades, es posible añadir diferentes partes para realizar una
amplia gama de análisis.
Su éxito en el mercado español como herramienta de análisis fue rápido debido a su
versatilidad, facilidad de uso, buen precio, y los algoritmos robustos y continuamente
5
mejorados que lo integran. Como muestra de ello la práctica totalidad de las Universidades
españolas son usuarios de este producto.
Pero SPSS Inc, la compañía, no es sólo "el SPSS" y sus módulos dependientes.
En efecto, SPSS Inc , que toma su nombre del anagrama del producto que la originó,
comercializa una amplia gama de programas y aplicaciones, que dan cobertura a las
distintas etapas del análisis de datos en función de la perspectiva del usuario: tanto para
analistas expertos que realizan sus investigaciones en continua interacción y supervisión de
la metodología empleada, como para usuarios de negocio, quienes suelen primar la
estructura de caja negra: problema-aplicación-solución, sin necesidad de interactuar con el
método de resolución.
VERSIONES DEL SPSS
SPSS Inc. desarrolla un módulo básico del paquete estadístico SPSS, del que han aparecido
las siguientes versiones:
SPSS-X (para grandes servidores tipo UNIX)
SPSS/PC (1984, en DOS. Primera versión para computador portátil)
SPSS/PC+ (1986 (en DOS)
SPSS for Windows 6 (1992) / 6.1 para Macintosh
SPSS for Windows 7
SPSS for Windows 8
SPSS for Windows 9
SPSS for Windows 10 / for Macintosh 10 (2000)
SPSS for Windows 11 (2001) / for Mac OS X 11(2002)
SPSS for Windows 11.5 (2002)
SPSS for Windows 12 (2003): La versión número 12 del SPSS ha traído consigo
una serie de novedades, con la incorporación de funciones nuevas respecto de las
versiones anteriores.
Las nuevas características que se han incorporado a SPSS 12.0 para Windows son:
6
- Nuevas características en los gráficos.
- Mejoras en la gestión y tratamiento de los datos
- Mejoras en los estadísticos
- Nuevo módulo para realizar muestreo: SPSS Muestras Complejas 12.0
Veamos brevemente algunas de las nuevas características en cada uno de los aspectos
anteriores.
Gráficos
Una de las características más novedosas en la nueva versión del SPSS 12.0 son las mejoras
que se incorporan en los gráficos de presentación de resultados, existiendo un mayor
control sobre la edición final del gráfico por parte del usuario.
El nuevo sistema de gráficos contiene los mismos tipos de gráficos que ya se disponían en
versiones anteriores, aunque se han añadido funcionalidades nuevas que facilitan que el
usuario pueda poner su propio estilo personal en el gráfico.
En relación con las mejoras se puede resaltar que en la presentación de los gráficos existe la
posibilidad de mostrar el nombre de la variable o de las etiquetas con más caracteres, así
como el texto de las variables o de las etiquetas es más cuidado, una mejor asignación de
los valores para la escala de los ejes y un mayor control sobre las plantillas (como la
posibilidad de guardar los rangos de las escalas, efectos de 3D para los gráficos de tarta y
de barras, etc.), lo que se traduce en un ahorro de tiempo. En cuanto a la edición de los
gráficos existe un mayor control por parte del usuario en este proceso de edición, de formar
que puede editar el texto directamente en el gráfico, control de la ubicación de los objetos
del gráfico (como leyendas, títulos,. . .), posibilidad de incorporar el color, el relleno, la
línea, etc. También se permite una mayor visualización, alineación y edición de las
etiquetas de los ejes, así como el gráfico puede incluir varias líneas de ajuste e
interpolación.
Tratamiento y gestión de los datos
En relación con las mejoras introducidas en la gestión y tratamiento de los datos podemos
reseñar diversas nuevas funcionalidades.
Ahora se permite que los nombres de las variables sean más largos, ampliándose el límite
de bytes de 8 a 64, con lo cual el nombre de la variable puede incrementar su extensión
hasta un máximo de 64 caracteres, lo cual se traduce en que el usuario no necesita reducir
tanto los nombres de las variables.
Se ha incorporado lo que se llama un Categorizador Visual, que permite la creación de
variables nuevas, basado en la agrupación de los valores de las variables existentes, creando
rangos o bandas para los datos. Es decir, nos permite "categorizar" datos de escala en
7
rangos categóricos como por ejemplo la edad en la cual se pueden fijar intervalos de 5, 10 o
lo que el usuario necesite.
También se ha incluido una funcionalidad realmente interesante: Identificación de casos
duplicados. Esta funcionalidad permite la identificación de los casos que se han repetido
por cualquier circunstancia y su posterior tratamiento.
Finalmente, podemos resaltar el sistema de gestión de resultados que nos permite convertir
los resultados en datos de entrada, si bien sólo está disponible mediante comandos de
sintaxis.
Mejoras en los estadísticos
En relación con los estadísticos en el SPSS 12.0 se ha incorporado una nueva función en el
análisis de regresión logística multinomial, que permite la selección de un modelo por
pasos, eligiendo uno de los cuatro modelos de regresión posibles: entrada hacia delante,
eliminación hacia atrás, pasos sucesivos hacia delante y pasos sucesivos hacia atrás.
También se ha incorporado opciones nuevas para la gestión de datos ponderados en el
procedimiento de Tablas de contingencia.
Módulo SPSS 12.0 Muestras Complejas
Con este nuevo módulo adicional obtendremos las herramientas de planificación y los
estadísticos especializados necesarios para trabajar con los datos de una encuesta.
Mediante este módulo, podemos conseguir realizar inferencias estadísticamente más válidas
a partir de muestras complejas ya que incorporan el diseño muestral al análisis de
encuestas.
A partir de este nuevo módulo podemos: computar estadísticos y los errores estándar de los
diseños muéstrales complejos, publicar los datos, incluyendo los muestreos realizados y la
planificación de sus análisis.
Para ello el nuevo módulo SPSS Muestras complejas incluye nuevos procedimientos como:
Plan de muestras complejas, procedimiento de selección de muestras complejas,
descriptivos de Muestras complejas y tabulación de muestras complejas.
Además de estas características, podemos reseñar que en la versión 12.0 la importación de
datos es más sencilla, ya que la capacidad de conexión con ODBD permite conectar sus
datos a una gran variedad de plataformas y a una amplia variedad de bases de datos.
8
Finalmente, resaltar nuevas características en SPSS Server que permiten nuevas
posibilidades que harán atractivo el trabajo con este módulo.
SPSS for Windows 13 (2004): Permite por primera vez trabajar con múltiples bases
de datos al mismo tiempo.
SPSS for Windows 14 (2005):SPSS 14.0 es un sistema global para el análisis de
datos. SPSS puede adquirir datos de casi cualquier tipo de archivo y utilizarlos para
generar informes tabulares, gráficos y diagramas de distribuciones y tendencias,
estadísticos descriptivos y análisis estadísticos complejos. SPSS consigue que el
análisis estadístico sea accesible para el principiante y muy práctico para el usuario
experto. Las selecciones de menú y los cuadros de diálogo permiten realizar análisis
complejos sin necesidad de teclear ni una sola línea de sintaxis de comandos. El
Editor de datos le ofrece una herramienta simple y eficaz con un diseño del tipo de
hoja de cálculo, que le permitirá introducir datos y examinar el archivo de datos de
trabajo.
SPSS for Macintosh 13 (2006)
SPSS for Windows 15 (2006)
SPSS for Windows 16 (Octubre de 2007): En la lista de usuarios de SPSS "SPSSX
(r) Discussion [SPSSX-L@LISTSERV. UGA. EDU]" varios funcionarios de la
empresa anunciaron previamente la salida de la versión 16 de este software. En ella
se incorporó una interfaz basada en Java que permite realizar algunas mejoras en las
facilidades de uso del sistema.
SPSS for Macintosh 16
SPSS for Linux 16
SPSS for Windows 17 (2008): Incorpora aportes importantes como el ser
multilenguaje, pudiendo cambiar de idioma en las opciones siempre que queramos.
También incluye modificaciones en el editor de sintaxis de forma tal que resalta las
palabras claves y comandos, haciendo sugerencias mientras se escribe. En este
sentido se aproxima a los sistemas IDE que se utilizan en programación.
SPSS for Windows 18 (2009): Cambia su denominación de SPSS por PASW 18.
9
IBM SPSS Statistics 19.0 (2010): IBM® SPSS® Statistics 19 versión para
estudiantes es una versión limitada aunque potente de SPSS Statistics.
Funcionalidad
La versión para estudiantes contiene la mayoría de herramientas de análisis de datos
importantes incluidas en el sistema IBM® SPSS® Statistics completo, incluyendo: „
- Editor de datos del tipo hoja de cálculo para introducir, modificar y ver archivos de
datos. „
- Procedimientos estadísticos, incluyendo pruebas t, análisis de varianza y tablas de
contingencia. „
- Los gráficos interactivos permiten cambiar o añadir elementos del gráfico y
variables dinámicamente; los cambios aparecen tan pronto como se especifican. „
- Gráficos de alta resolución habituales para un abanico amplio de gráficos y tablas
analíticas y de presentación.
Limitaciones
- Creada para la enseñanza en clase, la versión para estudiantes se limita
exclusivamente al uso de los estudiantes y a los fines educativos del profesorado.
Las siguientes limitaciones se aplican a IBM® SPSS® Statistics 19 versión para
estudiantes: „
- Los archivos de datos no pueden contener más de 50 variables. „
- Los archivos de datos no pueden contener más de 1.500 casos.
- Las opciones adicionales de SPSS Statistics (como Modelos de regresión o Modelos
avanzados) no se pueden utilizar con la versión para estudiantes. „
- La sintaxis de comandos de SPSS Statistics no está disponible para los usuarios.
Esto significa que no es posible repetir un análisis al guardar una serie de comandos
en un archivo de sintaxis o “trabajo”, como en la versión completa de IBM®
SPSS® Statistics. „
- El procesamiento y la automatización no están disponibles para el usuario. Esto
significa que no es posible crear procesos que automaticen tareas que se repitan con
frecuencia, como en el caso de la versión completa de SPSS Statistics.
IBM SPSS Statistics 20.0 (2011)
La edición IBM SPSS Statistics Standard incluye las funciones clave siguientes:
10
Los modelos lineales ofrecen varios procedimientos de regresión y estadísticas
avanzados diseñados para que se adapten a las características inherentes de los datos
que describen relaciones complejas.
Los modelos no lineales otorgan la capacidad de aplicar más modelos sofisticados a
los datos.
Las técnicas de analítica geoespacial permiten a los usuarios integrar, explorar y
modelar datos de hora y ubicación.
Las funciones de simulación permiten a los analistas modelar automáticamente
muchos resultados posibles cuando hay incertidumbre sobre los datos de entrada, lo
cual mejora el análisis de riesgos y la toma de decisiones.
Las tablas personalizadas permiten a los usuarios comprender fácilmente sus datos y
a resumir los resultados de forma rápida en diferentes estilos y para diferentes
públicos.
SPSS Opciones
Las siguientes opciones están disponibles como mejoras adicionales de la versión completa
(no la versión para estudiantes) SPSS Base del sistema:
SPSS Modelos de regresión™ proporciona técnicas para analizar los datos que no se
ajusten a los tradicionales modelos estadísticos. Incluye procedimientos para el análisis
probit, la regresión logística, la estimación ponderada, la regresión de mínimos cuadrados
en dos fases y la regresión no lineal general.
SPSS Modelos avanzados™ se centra en las técnicas utilizadas con más frecuencia en la
investigación experimental y biomédica sofisticada. Incluye procedimientos para los
modelos lineales generales (MLG), los modelos lineales mixtos, el análisis de componentes
de la varianza, el análisis loglineal, la regresión ordinal, las tablas de mortalidad actuariales,
el análisis de supervivencia de Kaplan-Meier y las regresiones de Cox básica y extendida.
SPSS Tablas™ crea una amplia variedad de informes tabulares de gran calidad, como por
ejemplo tablas sofisticadas y presenta datos de respuestas múltiples.
SPSS Tendencias™ realiza análisis de predicción y de series temporales muy completos,
con diversos modelos de ajuste de curvas, modelos de suavizado y métodos para la
estimación de funciones autorregresivas.
SPSS Categorías® ejecuta procedimientos de escalamiento óptimo, incluidos los análisis de
correspondencias.
11
SPSS Análisis conjunto™ ofrece una manera realista de medir el modo en que los
diferentes atributos del producto afectan a las preferencias de los consumidores y los ciuda
danos. Con SPSS Análisis conjunto se puede medir con facilidad el efecto sobre el
equilibrio de cada uno de los atributos de un producto dentro del contexto del conjunto de
atributos del producto, tal como hacen los consumidores cuando deciden lo que van a
comprar.
SPSS Pruebas exactas™ calcula los valores p exactos (valores de significación) para las
pruebas estadísticas en aquellos casos en los que las muestras son pequeñas o se distribuyen
de forma poco uniforme y puedan hacer que las pruebas habituales resulten poco precisas.
SPSS Análisis de valores perdidos™ describe los patrones de los datos perdidos, realiza
una estimación de las medias y otros estadísticos y permite imputar los valores a las
observaciones perdidas.
SPSS Mapas™ transforma los datos distribuidos geográficamente en mapas de alta calidad,
con símbolos, colores, gráficos de barras, gráficos de sectores y combinaciones de temas,
para representar no sólo lo que está ocurriendo sino también dónde tiene lugar.
SPSS Muestras complejas™ permite a los analistas de encuestas, mercado, salud y opinión
pública, así como a los sociólogos que utilizan una metodología de encuesta de ejemplo,
incorporar los diseños de muestras complejas al análisis de datos.
SPSS Classification Tree™ crea un modelo de clasificación basado en árboles, y clasifica
casos en grupos o pronostica valores de una variable (criterio) dependiente basada en
valores de variables independientes (predictores). El procedimiento proporciona
herramientas de validación para análisis de clasificación exploratorios y confirmatorios.
SPSS Data Validation™ ofrece una rápida instantánea visual de los datos. Ofrece la
posibilidad de aplicar reglas de validación que identifiquen valores de los datos no válidos.
Puede crear reglas que marquen los valores fuera de rango, valores perdidos o valores en
blanco. También puede guardar variables que registren cada una de las violaciones de las
reglas y el número total de violaciones de reglas por cada caso. También se incluye un
conjunto limitado de reglas predefinidas que puede copiar o modificar.
Amos™ (del inglés analysis of moment structures, análisis de estructuras de momento)
utiliza el modelado de ecuaciones estructurales para confirmar y explicar los modelos
conceptuales que tratan las actitudes, percepciones y otros factores que determinan el
comportamiento.
12
La familia de productos de SPSS también incluye aplicaciones para la introducción de
datos, análisis de textos, clasificación, redes neuronales y servicios predictivos para
empresas.
PASW es SPSS
El famoso programa estadístico SPSS fue adquirido por la IBM en el mes de julio del 2009,
hasta ese entonces se había llegado a la versión 17. La versión 18 de este famoso aplicativo
ya no lleva el nombre famoso y reconocido de las cuatro letras que le dieron fama SPSS,
ahora su nombre es PASW.
¿A qué obedece este cambio de nombre?, como sabemos en informática las siglas, que
muchas veces se convierten en marcas o símbolos, ocultan más información de la que a
simple vista parece.
Los productos de IBM, se agrupan en cuatro familias (Statistics, Modeling, Collection y
Deployements), el SPSS pasará a integrar la familia de statistics y su nombre PASW
obedece a esta razón, ya que significa Predictive Analytics Soft(w)are, o software de
análisis predictivo.
La nueva versión PASW v.18 cuenta con:
Funciones innovadoras que automatizan las operaciones manuales que requieren
mucho tiempo.
Nuevas funciones de análisis y elaboración de informes que ayudan a mejorar los
resultados y solucionar problemas empresariales.
Mejoras en la arquitectura y tecnología de la familia de productos que ofrecen un
rendimiento más rápido y una mayor capacidad de ampliación.
Se puede integrar aplicaciones desarrolladas en R y Python.
PROCEDIMIENTO GENERAL DE RESOLUCIÓN DE UN PROBLEMA CON
SPSS.
Los pasos a seguir para llevar a cabo un análisis de tipo estadístico son los siguientes:
Recoger la información del problema que se desee investigar y tenerla organizada
generalmente en papel.
Grabar esa información en un archivo de datos correspondiente al programa que se
va a usar, en el caso de SPSS en un archivo que tiene el nombre que deseemos, pero
que posee forzosamente la extensión .sav
Sobre tal archivo de datos se llevará a cabo el análisis con SPSS, usando diferentes
procedimientos que como veremos se seleccionan de distintos menús
13
Los resultados de tales análisis son volcados a un visor de resultados en el que su
visualización y edición es más cómoda, y desde el que se pueden guardar en un
fichero de nombre el que se desee, pero de extensión .spo.
El investigador interpreta los resultados y extrae las conclusiones que le parecen
relevantes de los mismos, y con eso se cierra el ciclo sobre el que estamos
trabajando.
El procedimiento que acabamos de especificar es el que se sigue siempre en este tipo de
análisis, y es el que subyace a toda la presentación que aquí se hace, por tanto empezaremos
a entrar en detalle de los pasos para llevarlo a cabo.
USO DE LOS BOTONES DEL RATÓN PARA EL MANEJO DE SPSS.
Como en todo programa de Windows el ratón o puntero es un accesorio fundamental en el
manejo de SPSS. La selección de cualquier acción se puede hacer con el ratón
desplazándolo a lo largo de la ventana y pulsando el botón izquierdo del mismo sobre el
símbolo o el texto que representa la acción. El botón derecho del ratón también tiene un uso
importante aquí. Más allá de usos, pulsar el botón derecho sobre cualquier icono o texto
desplegará una leyenda de ayuda contextual sobre la acción seleccionada; la leyenda
aparecerá sobre la ventana en un recuadro, generalmente amarillo. Se podrá hacer
desaparecer dicha leyenda sin más que pulsar el ratón en otra opción o moverlo
convenientemente. Pulsar el botón derecho dentro de la matriz de datos (por ejemplo sobre
el nombre de una variable) despliega un menú contextual que contiene acciones ligadas a
los objetos señalados.
UTILIZACION DEL SPSS.
CAPTURA DE DATOS E INTRODUCCIÓN DIRECTA EN SPSS
El SPSS se inicia siempre ofreciendo la imagen, similar a una hoja de cálculo, del
Editor de Datos. Este Editor dispondrá las variables en columnas y los casos en
filas. Nuestro primer objetivo será definir el fichero de datos y almacenar esos datos
en el editor.
El archivo de datos puede crearse directamente en SPSS o importarse ya creado de
otro programa, normalmente de una hoja de cálculo. La definición de las variables
será, sin embargo, una tarea a realizar obligatoriamente en el SPSS.
Comenzando por la captura externa, para importar un archivo de hoja de cálculo
debe seleccionarse el tipo xls en el cuadro “Abrir” del menú “Archivo”. Una vez
elegido el archivo de datos debe indicarse al SPSS si la primera fila del archivo de
14
excel contiene cabeceras de columnas (es decir, nombre de las variables) y el rango
a leer en la misma si los datos que desea leer de la hoja de cálculo no comienzan en
la primera fila ni en la primera columna.
Para introducir directamente los datos en SPSS deberán completarse, para cada
variable los siguientes pasos:
1. Asignar un nombre y una etiqueta a la variable.
2. Identificar el tipo de variable.
3. Definir sus posibles valores y las etiquetas de los mismos.
4. Definir el o los valores perdidos.
Para crear y dar nombre a una nueva variable marcamos la columna correspondiente
y con un doble clic accedemos a la pantalla de definición de variable.
En el cuadro “Nombre de la Variable” deberemos escribir el nombre que queramos
asignar a esa variable.
En el cuadro Tipo se ofrecen una serie de formatos básicos ("Numérico”, “Cadena”
“Fecha”...) con los que debemos identificar nuestra variable. También debe
especificarse, el ancho de caracteres de la misma y los decimales en su caso.
En el cuadro Etiquetas deberemos definir la etiqueta descriptiva que acompañará al
nombre de la variable en las tablas, informes y gráficos estadísticos de resultados.
También deben definirse las etiquetas de los códigos en cada variable, lo que
también simplificará la interpretación de resultados.
En el cuadro Valores perdidos debemos especificar al SPSS los códigos que vamos
emplear en aquellos casos en que se ha perdido la información de esa variable para
un caso determinado o bien se ha cometido un error en la respuesta por parte del 8
encuestado. Esto permitirá al SPSS ignorar los casos incorrectos en los análisis
sucesivos.
En el cuadro de Formato de la columna especificaremos el ancho de columna y la
alineación del contenido en la misma.
Una vez definida la variable pueden teclearse los datos directamente sobre la hoja
del editor hasta completar el archivo total. La operación de guardado es similar a la
de cualquier otro programa de entorno Windows. Los archivos de datos de
versiones actuales de SPSS tienen extensión .SAV.
15
OPERACIONES HABITUALES CON VARIABLES EN SPSS
RECODIFICAR VARIABLES
Recodificar una variable significa cambiar total o parcialmente el conjunto de
códigos con que representamos sus valores. La recodificación no es sólo un
capricho estético sino, en muchas ocasiones, una necesidad de transformación
adecuada para la mejora de un análisis técnico.
En el menú “Transformar” elegimos “Recodificar”, y dentro de este la opción “en
distintas variables” para no perder la variable original. La pantalla inicial que
aparece permite llevar a cabo la siguiente secuencia de operaciones:
1. Elegir la variable a recodificar de la ventana de la parte izquierda
2. Elegir un nuevo nombre para la variable recodificada y una nueva etiqueta en la
ventana "Variable de resultado"
3. Establecer, si se desea, una condición para la recodificación en el botón "Si"
Una vez pulsado el botón “Valores antiguos y nuevos” podremos establecer en esta nueva
pantalla la correspondencia entre los códigos antiguos y los nuevos.
CALCULAR NUEVAS VARIABLES A PARTIR DE OTRAS EXISTENTES
Puede que nos interese generar nuevas variables a partir de datos ya almacenados en
el archivo. ¸ Para calcular nuevas variables, elegimos en el Menú "Transformar" la
opción "Calcular", accediendo a una pantalla que nos aparece permite llevar a cabo
la siguiente secuencia de operaciones:
1. Dar un nombre a la nueva variable en la ventana "Variable de destino"
2. Especificar su "Tipo y Etiqueta"
3. Generar una "expresión numérica" para la nueva variable que contendrá tres
elementos: variables almacenadas - operadores simples y funciones predeterminadas
por el SPSS.
4. Establecer una condición para el cálculo (botón "SI")
FILTRAR CASOS
En ocasiones nos puede interesar seleccionar sólo un subconjunto de encuestas para
realizar un análisis específico para lo cual, el SPSS permite filtrar temporalmente el
conjunto de datos.
Para emplear un filtro seleccionamos la opción la alternativa "Seleccionar casos" en
el menú "Datos". La pantalla ofrecida por el SPSS permite cinco tipos de filtro
16
aunque el más habitual es el personalizado, accesible mediante el botón "Si se
satisface la condición"...
La ventana que aparece si se selecciona este modo personalizado de filtro permite
generar una expresión de filtro compleja incluyendo una o varias condiciones. Cada
condición puede construirse a partir del contenido de variables ya existentes y el
empleo de operadores y funciones de SPSS.
Cuando filtramos un fichero una nueva variable dicotómica llamada "filter_$"
contendrá el valor "0" cuando la variable no ha sido seleccionada y "1" cuando sí ha
sido seleccionada (25 años o mayores). Además, en el editor de datos, los casos NO
seleccionados aparecen señalados en la columna izquierda gris con una línea
transversal.
FUNDIR ARCHIVOS
Fundir archivos significa unir archivos distintos referidos a una misma encuesta, ya
sea conteniendo distintos casos, o nuevas variables. Fundir archivos resulta muy
habitual ya es frecuente que el trabajo de tabulación se reparta entre varias personas,
tabulando cada una de ellas un subconjunto de datos.
Fundir archivos para añadir casos: En el menú “Datos”, opción “Fundir Archivos” –
“Añadir casos” seleccionaremos el archivo que queramos unir al archivo activo
Una vez abierto el nuevo fichero, una nueva pantalla que mostrará, en la parte
izquierda el conjunto de variables que no son comunes a los dos ficheros, y en la
parte derecha las variables comunes a los dos. El nuevo fichero solo incluirá las
variables comunes a los dos ficheros.
Fundir archivos para añadir variables: Esta opción funde el archivo de datos activo
con otro archivo externo que contenga los mismos casos pero referidos a variables
adicionales. El procedimiento en SPSS es el mismo, la única diferencia es que la
opción a seleccionar en el menú "Fundir Archivos" será “Añadir variables”. En este
caso los dos archivos deben tener el mismo número de casos.
OTRAS OPERACIONES FRECUENTES
Eliminar e insertar variables y casos. Para eliminar una variable basta con
seleccionar la columna correspondiente y pulsar “Edición” – “Borrar”. Del mismo
modo, para eliminar un caso (una fila) seleccionaremos la fila correspondiente y
pulsaremos “Edición” – “Borrar”. Cuando deseemos insertar una nueva variable
seleccionaremos una columna y en el menú “Datos” la opción “Insertar variable”.
17
SPSS insertará una nueva variable a la izquierda de la variable que habíamos
seleccionado previamente. Para insertar un caso (una fila) seleccionaremos una fila
y en el menú “Datos” elegiremos “Insertar Caso”. SPSS introducirá una nueva fila
justo encima de la que habíamos seleccionado.
Ordenar y trasponer datos. SPSS nos permite ordenar los casos del fichero de datos
en función de una determinada variable, ya sea en orden ascendente o descendente.
Para ello en el menú “Datos” seleccionaremos la opción “Ordenar” y elegiremos la
variable en función de la cual queramos que se realice la ordenación
ANÁLISIS PRIMARIO DE INFORMACIÓN
Habitualmente, el primer tipo de análisis que se realiza sobre las variables objeto de
estudio, es el cálculo de estadísticos descriptivos (media, mediana, moda,
desviación típica, varianza, etc...) y cálculo de frecuencias. Calcularemos
estadísticos básicos para las variables cuantitativas, y frecuencias para las variables
cualitativas.
Este análisis preliminar permitirá tomar contacto con los datos y localizar posibles
errores de codificación y tabulación.
Para iniciar el cálculo de los estadísticos descriptivos básicos de las variables
cuantitativas, puede utilizarse la opción “Estadísticos” ® “Resumir” ®
“Frecuencias” o bien la alternativa “Estadísticos” ® “Resumir” ® “Descriptivos”.
La mejor opción es la primera porque permite calcular un mayor número de
estadísticos. En la primera de las pantallas debe seleccionarse el conjunto de
variables para las que se desea elaborar estadísticos descriptivos y si se desea
elaborar la tabla de frecuencias o no.
El menú de cálculos disponibles aparece en la siguiente pantalla divido en cuatro
tipos básicos. En esta pantalla seleccionaremos todos aquellos estadísticos que
deseemos calcular, tanto de posición como de dispersión.
Pulsando el botón de “Gráficos” en la pantalla inicial podremos crear distintos tipos
de gráficos que nos ayudarán a la hora de la interpretación de resultados. El
Histograma nos permite observar gráficamente las características de la distribución
de la variable analizada de cara a detectar, por ejemplo, su Normalidad.
Los gráficos y los resultados estadísticos se muestran en la conocida como ventana
Navegador o Visor de resultados de SPSS, que permitirá organizar y editar los
18
resultados de análisis sucesivos. Los archivos del navegador pueden guardarse
independientemente con extensión .SPO.
La sección izquierda del Visor permite observar y modificar la ordenación de los
distintos análisis y de los elementos mostrados en cada uno de ellos. En el lado
derecho aparecen las tablas y gráficos de resultados.
Todos los elementos del visor de resultados son susceptibles de modificación en
cuanto a su formato de presentación. El menú contextual del ratón nos abrirá en
cada uno de ellos un buen número de opciones de modificación.
Para aquellas variables puramente cualitativas en las que no tiene especial sentido
analizar medidas descriptivas, calcularemos sus frecuencias, tanto absolutas como
relativas utilizando el mismo menú “Estadísticos” - “Resumir” - “Frecuencias” que
habíamos abierto en el caso de los estadísticos descriptivos. En la primera pantalla
marcaremos ahora la opción “Mostrar tabla de frecuencias”.
Las tablas de frecuencias pueden "pivotarse" alterando filas por columnas o
estableciendo capas tridimensionales. Para acceder al menú de pivotaje basta usar el
menú contextual del ratón sobre cada tabla.
LECTURA DE DATOS
Una sesión típica de SPSS consta de cuatro pasos elementales:
Cargar los datos que se desean analizar en el editor de datos.
Solicitar los análisis estadísticos convenientes.
Examinar los resultados de los análisis en el visor de resultados.
Salvar los resultados.
Existen varias formas de leer datos con el sistema SPSS, las más habituales son:
- Introducir los datos a mano.
- Datos en formato SPSS.
- Desde una hoja de cálculo Excel.
- Desde un fichero ASCII.
Introducir los datos a mano.
Es posible (aunque no recomendable) la introducción de datos directamente al editor de
datos. Los pasos a seguir son muy sencillos, primero definimos las características de las
variables y posteriormente introducimos los datos.
19
Las características de las variables se definen en el editor de datos en su vista de variables y
son los siguientes:
Columna Nombre: Escribir un nombre de variable válido.
Columna Tipo: Definir el tipo al que van a pertenecer, en general bastara con
indicar si son numéricas, que es la opción por omisión o bien si son de tipo
alfanumérico indicar que son de cadena.
Columna Etiqueta: Indicar la etiqueta de la variable, aunque este paso es opcional,
suele ser conveniente definir etiquetas para facilitar la interpretación de resultados.
Columna Valores: Si la variable es nominal o categórica deberemos asignar
etiquetas a los valores.
Columna Medida: Definir el nivel de medida, en la práctica bastara con indicar
cuales son nominales.
Datos en formato SPSS
Si los datos están ya en un fichero del sistema SPSS bastara con realizar doble clic en el
fichero y automáticamente se abrirá la aplicación y cargando el fichero en el editor de
datos, o bien desde el editor de datos mediante la siguiente secuencia desde la barra de
opciones:
Archivo/Abrir/datos
Datos almacenados en una hoja de cálculo MS Excel.
Para poder leer los datos almacenados en una hoja MS Excel, estos deben de reunir
determinadas condiciones:
Cada renglón debe de representar un caso y cada columna debe de representar una variable.
No debe de haber espacios en blanco, ni deberán de aparecer más tablas de datos en la hoja
que vamos a leer.
Además la hoja de cálculo deberá de estar cerrada.
Seleccionamos el tipo de fichero que deseamos leer.
Al seleccionar el fichero que vamos a leer, el SPSS realiza una exploración preliminar de la
hoja de cálculo, para detectar donde empieza y termina la matriz de datos, el resultado de
esa exploración lo muestra en pantalla indicando la celda superior izquierda y la celda
inferior derecha de la matriz de datos. En el caso de que los nombres de las variables estén
incluidos deberemos de indicárselo en la opción correspondiente.
20
Al pulsar la tecla Aceptar, automáticamente cargara dicha matriz de datos en el editor de
datos.
Lectura de datos en formato ASCII.
Los archivos de texto son aquellos que están compuestos únicamente por texto sin formato,
sólo caracteres. Se les conoce también como archivos de texto plano por carecer de
información destinada a generar formatos y tipos de letra (por ejemplo, tipo de letra: Arial,
Times, Courier; formato: negritas, subrayado, cursivas; tamaño, etc.). Estos archivos suelen
tener extensión TXT.
El SPSS admite distintas formas de leer ficheros en formato ASCII, y además posee un
asistente que nos puede ayudar en esta tarea.
El caso que vamos a mostrar es el más sencillo de todos, vamos a suponer que los datos
están en un fichero con formato ASCII con la siguiente estructura:
Cada renglón representa una observación.
Los datos están separados por espacios en blanco.
No falta ningún dato.
Las variables alfanuméricas no tienen blancos.
Las variables no tienen un ancho fijo.
El separador decimal es la coma.
TRANSFORMACIÓN DE VARIABLES.
Una vez cargado el archivo de datos (que recibe el nombre de fichero activo) y previamente
al análisis estadístico del mismo es posible modificar dichos datos, estas modificaciones
pueden referirse a recodificar los valores de una variable ya existente o a la creación de
nuevas variables en función a las ya existentes.
SPSS permite generar nuevas variables mediante transformaciones numéricas efectuadas
sobre las ya existentes. Estas transformaciones se realizan a través de un cuadro de dialogo
de forma muy intuitiva, así que vamos a mostrar cómo se transforman variables siguiendo
un sencillo ejemplo.
Ejemplo:
Supongamos que tenemos un fichero con medidas biométricas tales como el peso y la altura
y deseamos calcular el índice de masa corporal.
Nota: el Índice de Masa Corporal es un índice del peso de una persona en relación con su
altura. A pesar de que no hace distinción entre los componentes grasos y no grasos de la
21
masa corporal total, éste es el método más práctico para evaluar el grado de riesgo asociado
con la obesidad.
El índice de masa corporal depende del peso y de la altura mediante la siguiente relación:
IMC = Peso (Kg.) / [Talla (m)]2
Definición de las variables.
Cuando se abre SPSS aparece la matriz de datos vacía indicando en ese caso que no hay
ningún fichero seleccionado para trabajar con él; es en esta situación en la que debemos
estar para proceder a crear la estructura (definir las variables) de un nuevo fichero de datos
de SPSS. A esa situación también se puede llegar después de haber trabajado con SPSS sin
más que desplegar el menú Archivo y elegir de él la opción Nuevo y dentro de ella datos
(ArchivoÆ NuevoÆ Datos), lo que hará que se elimine el fichero activo y se deje limpia la
matriz de datos. Ahora cada columna será una nueva variable en potencia hasta que sea
definida, en cuyo caso pasará a ser una variable en la nueva matriz de datos. Una variable
queda automáticamente definida si en alguna casilla de su columna se introduce algún dato:
SPSS define una variable adecuada al primer dato introducido. A estas variables, SPSS les
asigna por defecto un nombre constituido por las letras VAR seguidas de un código de
cinco dígitos (00001, para la primera; 00002 para la segunda;…). Siempre podremos
cambiar después el nombre y las características de la(s) variable(s) así definida(s). De todas
formas, la manera más natural de crear las variables de un fichero es definirlas antes de
introducir dato alguno. Para ello hemos de situarnos en la vista de variables de la ventana
principal de SPSS, pinchando en la pestaña correspondiente o haciendo doble clic en la
cabecera de la columna. En la vista de variables, cada fila corresponde a una variable, y las
columnas representan las características de la(s) variable(s). Para cada variable habrá que ir
especificando cada una de sus características, empezando por el nombre (primera columna).
El nombre de las variables.
Se pincha (o se hace doble clic) sobre la casilla correspondiente al nombre de la variable
que se está definiendo, y se escribe el nombre que deseemos que tenga, con un máximo de
64 caracteres, sin espacios en blanco, empezando siempre por una letra o con el carácter @
y no terminando con un punto. Los caracteres que formen el nombre deben ser: cualquier
letra o dígito, o los signos #.@$_(éste último no es recomendable como último carácter).
El tipo de las variables.
Una vez escrito el nombre de la variable, si se pincha en la casilla correspondiente al tipo
de variable (o en cualquier otro sitio), aparecerá, para dicha variable, “numérico” en la
columna Tipo, un 8 en la columna Anchura y un 2 en la columna Decimales. Esto es lo que
SPSS ofrece por defecto para esa variable.
22
Para cambiar el tipo de la variable se pincha en la casilla de tipo de variable y se pincha
sobre el pequeño recuadro gris situado en dicha casilla, aparece entonces una ventana, en
ella se puede definir el tipo de la variable de entre los que aparecen: numérico, cadena,
fecha, etc...
El formato de la ventana es muy simple, a la izquierda aparecen los diferentes tipos que
pueden tener las variables y a la derecha aparece el tamaño o características particulares de
cada tipo que también son definibles, el tipo es numérico y la variable tendrá una anchura
total de 8 caracteres, dos de los cuales son decimales: esto es lo que por defecto coloca
SPSS. Pero describamos los diferentes tipos.
El tipo Numérico es para una variable cuyos valores son números. Los valores se muestran
en el formato numérico estándar, utilizando como delimitador decimal el especificado en la
Configuración Regional del Panel de control de Windows.
El tipo Coma define una variable numérica cuyos valores se muestran con la coma de
separación de miles y con un punto como separador de la parte decimal.
El tipo Punto define una variable numérica cuyos valores se muestran con el punto de
separador de miles y con una coma como separador de la parte decimal.
El tipo Notación científica define una variable numérica cuyos valores se muestran con una
E intercalada y un exponente con signo que representa una potencia de base diez. El
exponente puede ir precedido de E o D con un signo opcional, o por el signo solamente. Por
ejemplo, 123, 1,23E2, 1,23D2, 1,23E+2, o incluso 1,23+2.
El tipo Fecha define una variable numérica cuyos valores se muestran en uno de los
diferentes formatos de fecha-calendario u hora-reloj. Para ello, habrá que seleccionar un
tipo de fecha de la lista desplegable que aparece a la derecha cuando se selecciona el tipo
fecha. Se pueden introducir las fechas utilizando como delimitadores: barras, guiones,
puntos, comas o espacios en blanco.
El tipo Dólar sirve para definir una variable numérica (con diferentes formatos) cuyos
valores contienen un signo de dólar y una coma para la separación de los miles. Moneda
personalizada sirve para definir una variable numérica cuyos valores se muestran en uno de
los formatos de moneda personalizados que se hayan definido previamente en la pestaña
Moneda del cuadro de diálogo Opciones dentro del menú Edición. Los caracteres definidos
en la moneda personalizada no pueden emplearse para la introducción de datos, pero sí los
mostrará el Editor de Datos.
Por último el tipo Cadena define una variable cuyos valores no son numéricos y, por ello,
no se utilizan en los cálculos. Pueden contener cualesquiera caracteres hasta la longitud
definida. Estas variables son conocidas como variables alfanuméricas.
23
El tamaño y el formato de cada tipo se expresan en los campos que aparecen en la parte de
la derecha de la ventana. Habrá que especificar el tamaño total y el número de decimales en
los tipos Numérico, Coma, Punto y Notación Científica, colocándose sobre los huecos
oportunos y escribiendo ahí un número para el tamaño global y otro para el número de
decimales. La anchura máxima en todos ellos es de 40 posiciones, siendo 16 el número
máximo de cifras decimales. Para el tipo Cadena habrá que especificar la anchura total que
no podrá sobrepasar los 255 caracteres. Para los tipos de Fecha, Dólar y de Moneda
Personalizada habrá que elegir el formato de entre los que aparecen a la derecha en la
ventana de definición de tipos. Por último, la anchura y número de decimales se pueden
cambiar igualmente en las columnas Anchura y Decimales de la vista de variables.
Las etiquetas de las variables.
Generalmente el nombre de las variables suele tener pocos caracteres, lo que hace que
dicho nombre sea en muchos casos un acrónimo de difícil traducción para el que no lo ha
escrito (así, no es fácil de adivinar que con el nombre ACR124 estoy representando a la
variable aclaramiento de creatinina en el primer día de seguimiento en orina de 24h.); por
ello se suele poner una etiqueta de variable a la variable, que la identifique de una manera
más precisa y que nos permita reconocerla cuando se presentan los resultados. Esa etiqueta
puede ser como máximo de 256 caracteres. Pero no sólo se puede poner una etiqueta
general para la variable, sino que en las variables que sean cualitativas y cuyas categorías
suelen estar representadas por códigos numéricos, pueden establecerse etiquetas de valor
que permitan identificar a las categorías con ellas (haciéndolas más explicativas) en vez de
con los códigos numéricos. Estas etiquetas pueden ser de hasta 60 caracteres. Estas
etiquetas no son viables para variables de cadena de más de 8 caracteres de amplitud.
La etiqueta de la variable se escribe directamente en la casilla correspondiente de la
columna Etiqueta en la vista de variables.
Para las etiquetas de valor hay que pinchar sobre la casilla correspondiente de la columna
Valores (en la vista de variables) y luego pinchar sobre el pequeño recuadro gris que
aparece en dicha casilla, se despliega entonces una ventana. En esta ventana, la forma en
que se asignan etiquetas a los códigos de las variables, es escribir un código en la zona en la
que aparece “Valor” y la etiqueta correspondiente en la zona de “Etiqueta de valor” y
después pulsar el botón de Añadir; al código 1 se le ha asignado la etiqueta “no”, al código
2 se la ha asignado la etiqueta “moderado” y al código 3 se le añadirá la etiqueta “grave” en
cuanto pulsemos el botón Añadir.
El código al que no se le asigne etiqueta aparece como tal en todos los resultados de los
análisis. Como se ve, los códigos y sus etiquetas correspondientes son guardados para que
queden a la vista del usuario en una zona en la que son susceptibles de ser seleccionados.
Cuando se selecciona una de estas parejas “código = etiqueta” vuelve a ser colocada en la
24
zona de etiquetas de valor para que se pueda proceder a su modificación; si después de
hacer las modificaciones oportunas se desea guardar la información bastará pulsar en
Cambiar; si una vez seleccionada la pareja se desea borrar bastará pulsar el botón Borrar y
la pareja será eliminada; el programa permite seleccionar una pareja cada vez.
Cuando se hayan escrito todas las etiquetas bastará con pulsar el botón Aceptar y se volverá
a la vista de variables. Las etiquetas, tanto de las variables como de los códigos de las
variables, no son obligatorias pero si son muy útiles a la hora de entender y presentar los
resultados.
Propiedades de variables
Los datos introducidos en la Vista de datos del Editor de datos o leídos desde un formato de
archivos externo (como una hoja de cálculo de Excel o un archivo de datos de texto)
carecen de ciertas propiedades de variables que pueden resultar muy útiles, como:
- Definición de etiquetas de valor descriptivas para códigos numéricos (por ejemplo,
0 = Hombre y1= Mujer).
- Identificación de códigos de valores perdidos (por ejemplo, 99 = No procede).
- Asignación del nivel de medida (nominal, ordinal o de escala).
Todas estas propiedades de variables (y otras) se pueden asignar en la Vista de variables del
Editor de datos. También hay algunas utilidades que le pueden ofrecer asistencia en este
proceso:
Definir propiedades de variables puede ayudarle a definir etiquetas de valor
descriptivas y valores perdidos. Esto es especialmente útil para datos categóricos
con códigos numéricos utilizados para valores de categorías.
Definir nivel de medición para desconocido identifica las variables (campos) que no
tengan un nivel de medición definido y permite definir el nivel de medición de esas
variables. Es importante para los procedimientos en los que el nivel de medición
puede afectar a los resultados o determinar qué funciones estarán disponibles.
Copiar propiedades de datos ofrece la posibilidad de utilizar un archivo de datos con
IBM® SPSS® Statistics como plantilla para definir las propiedades de variables y
archivos en el archivo de datos actual. Esto es particularmente útil si utiliza
25
frecuentemente archivos de datos con un formato externo que tenga un contenido
similar, como puedan ser informes mensuales en formato Excel.
Definición de propiedades de variables
Definir propiedades de variables está diseñado para ayudarle en el proceso de asignar
atributos a variables, incluyendo la creación de etiquetas de valor descriptivas para
variables categóricas (nominales u ordinales).
Definir propiedades de variables:
Explora los datos reales y enumera todos valores de datos únicos para cada variable
seleccionada.
Identifica valores sin etiquetas y ofrece una función de “etiquetas automáticas”.
Permite copiar etiquetas de valor definidas y otros atributos de otra variable en la
variable seleccionada o de la variable seleccionada a varias variables adicionales.
Para definir propiedades de variables
Elija en los menús: Datos > Definir propiedades de variables...
Seleccione las variables numéricas o de cadena para las que desea crear etiquetas de
valor o definir o cambiar otras propiedades de las variables, como los valores
perdidos o las etiquetas de variable descriptivas.
Especificar el número de casos que se van a explorar para generar la lista de valores
únicos. Resulta especialmente útil para los archivos de datos con mayor número de
casos, para el cual una exploración del archivo de datos completo podría tardar una
gran cantidad de tiempo.
Especifique un límite superior para el número de valores únicos que se va a
visualizar. Esto es especialmente útil para evitar que se generen listas de cientos,
miles o incluso millones de valores para las variables de escala (intervalo continuo,
razón).
Pulse en Continuar para abrir el cuadro de diálogo Definir propiedades de variables
principal.
26
Seleccione una variable para la que desee crear etiquetas de valor o definir o
cambiar otras propiedades de las variables.
Introduzca el texto de etiqueta para los valores sin etiquetas que se visualicen en
Rejilla etiqueta valores.
Si hay valores para los que desea crear etiquetas de valor, pero no se visualizan
dichos valores, puede introducirlos en la columna Valores por debajo del último
valor explorado.
Repita este proceso para cada variable de la lista para la que desee crear etiquetas de
valor.
Pulse en Aceptar para aplicar las etiquetas de valor y otras propiedades de las
variables.
Atributos personalizados de variables
El botón Atributos del cuadro de diálogo Definir propiedades de variables abre el cuadro de
diálogo Atributos personalizados de variables. Además de los atributos de variable
estándar, como las etiquetas de valores, los valores perdidos y el nivel de medida, puede
crear sus propios atributos de variable personalizados. Al igual que los atributos de variable
estándar, estos atributos personalizados se guardan en los archivos de datos IBM® SPSS®
Statistics.
Nombre. Los nombres de atributo deben cumplir las mismas reglas que los nombres de
variable.
Valor. Valor asignado al atributo de la variable seleccionada.
Los nombres de atributo que comienzan con un signo de dólar son reservados y no
se pueden modificar. Puede ver el contenido de un atributo reservado pulsando el
botón de la casilla que desee.
Si aparece el texto Matriz..., en una casilla de valor, indica que se trata de una
matriz de atributos, un atributo que contiene varios valores. Pulse en el botón de la
casilla para mostrar la lista de valores.
Copia de propiedades de variables
El cuadro de diálogo Aplicar etiquetas y nivel aparece al pulsar en De otra variable o A
otras variables en el cuadro de diálogo principal Definir propiedades de variables. Muestra
todas las variables exploradas que coinciden con el tipo de variable actual (de cadena o
numérico). Para las variables de cadena, también debe coincidir la anchura definida.
27
Seleccione una única variable desde la que va a copiar las etiquetas de valor y otras
propiedades de las variables (excepto la etiqueta de la variable).
O
Seleccione una o más variables a las que va a copiar las etiquetas de valor y otras
propiedades de las variables.
Pulse en Copiar para copiar las etiquetas de valor y el nivel de medida.
o Las etiquetas de valor existentes y categorías de valores perdidos para las
variables de destino no se sustituyen.
o Las etiquetas de valor y las categorías de valores perdidos para los valores
que no se han definido aún para las variables de destino se añaden al
conjunto de etiquetas de valor y categorías de valores perdidos para las
variables de destino.
o El nivel de medida para las variables de destino siempre se sustituye.
o El papel de la variable de destino siempre se sustituye.
o Si la variable de origen o de destino tiene un rango definido de valores
perdidos, no se copian las definiciones de los valores perdidos.
Selección de las variables de origen y de destino
En este paso, puede especificar tanto las variables de origen que contienen las propiedades
de variable que desea copiar como las variables de destino en las que se copiarán estas
propiedades de variable.
Aplicar propiedades de variables del conjunto de datos de origen seleccionadas a variables
coincidentes del conjunto de datos activo.
Las propiedades de variable se copian desde una o más variables de origen seleccionadas en
las variables coincidentes del conjunto de datos activo.
Las variables “coinciden” si el nombre y el tipo de variable (de cadena o numérico) son los
mismos. En el caso de las variables de cadena, la longitud también debe ser la misma. Por
defecto, sólo se muestran en las dos listas de variables las variables coincidentes.
Crear variables coincidentes en el conjunto de datos activo si aún no existe.
Actualiza la lista de origen para que muestre todas las variables del archivo de datos de
origen. Si se seleccionan variables de origen que no existen en el conjunto de datos activo
(basándose en el nombre de variable), se crearán nuevas variables en el conjunto de datos
activo con los nombres y las propiedades de variable del archivo de datos de origen. Si el
conjunto de datos activo no contiene variables (un nuevo conjunto de datos en blanco), se
mostrarán todas las variables del archivo de datos de origen y se crearán automáticamente
28
en el conjunto de datos activo nuevas variables basadas en las variables de origen
seleccionadas.
Aplicar propiedades de una única variable de origen a las variables seleccionadas en el
conjunto de datos activo del mismo tipo. Las propiedades de variable de una única variable
seleccionada en la lista de origen se pueden aplicar a una o más variables seleccionadas de
la lista del conjunto de datos activo. En esta lista sólo se mostrarán las variables que sean
del mismo tipo (numérico o de cadena) que la variable seleccionada en la lista de origen. Si
se trata de variables de cadena, sólo se mostrarán las cadenas con la misma longitud
definida que la variable de origen. Esta opción no está disponible si el conjunto de datos
activo no contiene variables.
Aplicar sólo propiedades de conjunto de datos (sin selección de variables). Sólo se pueden
aplicar al conjunto de datos activo las propiedades de archivo (por ejemplo, documentos,
etiquetas de archivo, grosor). No se podrá aplicar ninguna propiedad de variable. Esta
opción no está disponible si el conjunto de datos activo es también el archivo de datos de
origen.
Para agrupar variables
Seleccione en los menús de la ventana Editor de datos: Transformar > Agrupación
visual...
Seleccione las variables numéricas de escala u ordinales para las que desee crear
nuevas variables categóricas (en agrupaciones).
Seleccione una variable de la Lista de variables exploradas.
Escriba el nombre de la nueva variable agrupada. Los nombres de variable no
pueden repetirse, y deben seguir las normas de denominación de variables.
Defina los criterios de agrupación para la nueva variable.
Pulse en Aceptar.
Cálculo de variables
Utilice el cuadro de diálogo Calcular para calcular los valores de una variable basándose en
transformaciones numéricas de otras variables.
Puede calcular valores para las variables numéricas o de cadena (alfanuméricas).
Puede crear nuevas variables o bien reemplazar los valores de las variables
existentes. Para las nuevas variables, también se puede especificar el tipo y la
etiqueta de variable.
29
Puede calcular valores de forma selectiva para subconjuntos de datos basándose en
condiciones lógicas.
Puede utilizar una gran variedad de funciones preincorporadas, incluyendo
funciones aritméticas, funciones estadísticas, funciones de distribución y funciones
de cadena.
Para calcular variables
Seleccione en los menús: Transformar > Calcular variable...
Escriba el nombre de una sola variable de destino. Puede ser una variable existente
o una nueva que se vaya a añadir al conjunto de datos activo.
Para crear una expresión, puede pegar los componentes en el campo Expresión o
escribir directamente en dicho campo.
o Puede pegar las funciones o las variables de sistema utilizadas
habitualmente seleccionando un grupo de la lista Grupo de funciones
y pulsando dos veces en la función o variable de las listas de
funciones y variables especiales (o seleccione la función o variable y
pulse en la flecha que se encuentra sobre la lista Grupo de
funciones). Rellene los parámetros indicados mediante
interrogaciones (aplicable sólo a las funciones). El grupo de
funciones con la etiqueta Todo contiene una lista de todas las
funciones y variables de sistema disponibles. En un área reservada
del cuadro de diálogo se muestra una breve descripción de la función
o variable actualmente seleccionada.
o Las constantes de cadena deben ir entre comillas o apóstrofos.
o Si los valores contienen decimales, debe utilizarse una coma (,) como
indicador decimal. Para las nuevas variables de cadena, también
deberán seleccionar Tipo y etiqueta para especificar el tipo de datos.
El formato de columna de las variables.
Ya hemos visto como se hace la definición del tipo y la anchura de la variable; ahora bien,
esas características son características internas que no tienen que corresponderse con las
características que manejan su presentación en la matriz de datos.
30
Para ello tenemos la opción de Formato de columna. Este formato de presentación de la
columna tiene dos características: la anchura total de la columna y la alineación que tendrá
la información dispuesta en esta columna.
El Ancho de la columna puede ser de hasta 256 caracteres, y sólo afecta a la presentación
del editor de datos, de manera que si el ancho asignado a una variable fuera inferior al
necesario para un dato concreto de dicha variable, éste será guardado internamente, pero no
será presentado correctamente en el editor de datos; si la variable es numérica, el dato
aparecerá redondeado, si se puede, o en notación científica, si se puede, o relleno de
asteriscos; si la variable es de cadena, el dato aparecerá truncado.
De oficio SPSS asigna un ancho de columna igual a 8 caracteres. La alineación del texto en
la columna puede ser a la izquierda, centrada o a la derecha, siendo esta última la asignada
por SPSS en el caso de variable numérica y a la izquierda en el caso de variable de cadena.
Tanto el ancho de la columna como la alineación pueden ser cambiadas fácilmente en la
vista de variables; para ello pulsar convenientemente sobre las flechitas que aparecen al
pinchar en las casillas correspondientes de las columnas: Columnas y Alineación.
El ancho de columna también se puede cambiar en la vista de datos, pinchando y
arrastrando los bordes de la columna. La definición de las características de las columnas
no es obligatoria, y en muchos casos nos bastaremos con las definiciones que SPSS hace de
oficio.
La definición de la Escala de Medida de una variable. La escala de medida de una variable
determina las operaciones que se pueden realizar con ella. Así, una variable como el peso
será susceptible de ser sometida a todas las operaciones, por lo que se podrán hacer muchos
análisis estadísticos con ella; sin embargo, una variable como el grupo sanguíneo ABO no
será susceptible de ser sometida a operaciones de cálculo de media, por ejemplo, ya que es
claramente un carácter cualitativo.
Para definir la escala de medida de una variable en SPSS se pincha en la casilla
correspondiente de la columna Medidas en la vista de variables, y se pulsa sobre la flechita
que aparece, eligiendo la opción que se desee. En general tendremos tres opciones
excluyentes: Escala, Ordinal y Nominal.
En Escala los valores de los datos son considerados como valores numéricos sobre una
escala de intervalo o de razón (por ejemplo, la edad, el peso, el número de hermanos);
cuando definimos una variable de tipo Numérico, Coma, Punto o Notación Científica,
SPSS asigna Escala a la escala de medida de la variable. En el caso de Ordinal, los valores
de los datos representan categorías con algún orden intrínseco (por ejemplo, bajo, medio,
alto; peor, igual, mejor); las variables ordinales pueden ser cadenas (alfanuméricas) o
valores numéricos que representen categorías diferentes (por ejemplo, 1=bajo, 2=medio,
3=alto); la escala ordinal corresponde a datos cualitativos ordinales.
31
En la escala Nominal, los valores de los datos representan categorías sin un orden
intrínseco (por ejemplo, el grupo sanguíneo ABO, el tipo de trabajo de una persona); las
variables nominales pueden ser cadenas (alfanuméricas) o valores numéricos que
representen categorías diferentes (por ejemplo, 1= varón, 2= mujer). De la definición de la
escala de medida depende, como hemos dicho previamente, los análisis que se pueden
hacer con los diferentes datos.
Estructura del fichero de datos.
Con todo lo visto hasta aquí podemos definir las variables en SPSS; la definición cuidadosa
y detallada de las variables ayudará mucho en los análisis y en la interpretación de los
resultados, por lo que recomendamos al usuario que gaste el tiempo necesario en tales
definiciones (pues no será tiempo perdido). Cada variable definida aparece en la vista de
datos con su nombre en la cabecera de la columna y se puede seleccionar pulsando el botón
izquierdo del ratón sobre ella una vez. El conjunto de variables definidas, junto con las
características que les hayamos asignado, forman lo que podemos llamar la estructura del
fichero de datos; esto sería una de las dos partes de un fichero de datos de SPSS.
Esta estructura se puede guardar en un fichero .sav que aparecerá sin los datos, pero donde
se han guardado las variables y sus características, y la podemos ver resumida en una
ventana mediante Utilidades→Variables… Sobre dicha estructura se puede añadir el otro
ingrediente, los datos propiamente dichos, y juntos conformarán el archivo de datos de
SPSS. Para guardar el trabajo actual, efectuar Archivo→Guardar (o usar el botón
“guardar”) asignando el nombre deseado, por ejemplo, prueba.sav.
Grabación de los datos.
Una vez que el usuario ha definido las variables de su fichero de datos, tendrá una rejilla en
la que por columnas aparecerán dichas variables con el nombre de cada una de ellas. Es
claro que tal rejilla estará vacía y que el siguiente paso será el rellenarla a base de grabar la
información de los diferentes casos (que aparecen en el Editor de Datos por filas). Por ello
lo primero que explicaremos es cómo se graban los datos. Desde luego que antes de la
grabación de casos se debería conocer cómo se mueve uno dentro de la rejilla de datos. El
movimiento más simple es desplazar el cursor mediante el ratón a la posición deseada y
pinchar en ella con el botón izquierdo. Otras formas más lentas es usando las teclas de
flechas en las cuatro direcciones que funcionan como ellas indican.
Introducción de los datos por casillas, por filas y por columnas.
La primera forma en que se puede grabar un dato es situarse en una casilla (cruce de una
variable, columna, con un caso, fila) pinchando en ella con el botón izquierdo del ratón y
escribir el valor deseado seguido de la tecla Intro. Tras ello, el cursor aparecerá en la casilla
inmediatamente debajo. Evidentemente esto nos permitirá la grabación de los datos por
32
columnas (o variables): cuando lleguemos al final de una columna pasamos al principio de
la siguiente. Sin embargo, esta forma de grabar los datos, no es la más común para proceder
a la grabación de un fichero de datos.
La forma más común es grabar los datos por filas, es decir, por casos. Para ello se coloca el
cursor en la casilla más a la izquierda de una fila (de un caso) y se introduce el dato
correspondiente a esa casilla, seguido de la pulsación de la tecla de flecha hacia la derecha,
o pulsando la tecla Tab. Obsérvese que si se pulsa la tecla Intro el cursor bajará una fila
abajo con lo que estará fuera del caso, habiendo que volver a él mediante la tecla hacia
arriba, lo que alarga claramente la grabación. Cuando uno haya grabado un caso, puede
saltar al siguiente pulsando la tecla Tab, y así aparecerá al inicio del nuevo caso.
SPSS identifica cada caso con un número que es interno y que no existe como variable del
fichero, por lo que si el usuario desea una identificación para cada caso debe crear, y
grabar, una variable a tal efecto, lo cual es conveniente. Desde luego que cuando uno está
grabando datos puede equivocarse, pudiendo, en cualquier momento, proceder a la
corrección de los errores colocándose sobre ellos (en la celda en la que esté el error),
eliminándolos (con la tecla Supr o con la tecla ÅBackSpace) y reescribiendo los datos
correctamente. Ni que decir tiene que el posicionamiento sobre el error se puede hacer de
las múltiples maneras que hemos explicado anteriormente. Siguiendo el procedimiento que
hemos explicado, y con un poco de paciencia, se conseguirá grabar todo el fichero de datos.
No obstante, hay algunos pequeños atajos que permiten hacer algo menos tedioso el
proceso o que permiten la corrección pronta de errores que se repiten; a ello dedicaremos la
siguiente sección.
Acciones de Cortar, Copiar y Pegar.
En la grabación de datos podemos utilizar las de acciones (familiarizadas por Windows) de
Cortar, Copiar y Pegar. Estas tres acciones se basan en la selección del objeto sobre el que
van a ser aplicadas. En el caso que nos ocupa el objeto puede ser una casilla, varias casillas,
una fila, varias filas, una columna o varias columnas; una casilla se selecciona sin más que
colocarse en ella (pulsando el botón izquierdo del ratón sobre ella o mediante una serie de
desplazamientos con las flechas); varias casillas se seleccionan sin más que pinchar con el
ratón en una de ellas y arrastrar el mismo (moverlo con el botón izquierdo pulsado) hasta la
última casilla que deseemos seleccionar, apareciendo estas remarcadas para indicar que
están seleccionadas; es claro que el arrastrado que hemos mencionado puede ser en
cualquier sentido por lo que el conjunto de casillas seleccionadas puede ser cualquiera
siempre que sea en forma rectangular. La forma de seleccionar una fila (caso) es pulsar con
el ratón sobre el número de caso que le ha asignado SPSS, mientras que si se desean
seleccionar varios casos consecutivos deberá arrastrarse el ratón sobre ellos. De manera
análoga, la selección de una variable se hará como en los casos pero pulsando sobre la fila
de nombres de las variables.
33
Resumiendo, supongamos que hemos seleccionado el objeto de nuestras acciones y
pasemos a describirlas. La acción de Cortar hace desaparecer el objeto seleccionado que es
guardado en el Portapapeles para estar disponible en una acción de Pegado. La acción de
Copiar mantiene el objeto seleccionado a nuestra vista pero es simultáneamente llevado al
Portapapeles para estar disponible en una acción de Pegado. La acción Pegar trae desde el
Portapapeles el objeto allí colocado y lo presenta a partir de la zona seleccionada. La forma
de invocar esas acciones, siempre a partir de un objeto seleccionado, es desplegar el menú
Editar y seleccionar de él la acción deseada.
Hay una manera alternativa que sería desplegando un llamado menú contextual, que
aparece cuando se pulsa el botón derecho del ratón sobre el objeto seleccionado. Cuando se
lleva a cabo dicha acción sobre un dato o conjunto de datos seleccionados, el menú
contextual. En este menú aparecen las acciones antes citadas además de la función Borrar
que permite borrar el objeto seleccionado (en este caso los datos) sin colocarlo en el
Portapapeles por lo que no estará disponible para ser pegado. La eliminación, también, se
puede llevar a cabo, a partir del objeto seleccionado, pulsando la tecla Supr. La
combinación de las acciones Cortar, Copiar, Pegar y Borrar permite llevar a cabo acciones
complejas con pocos toques de ratón. Así por ejemplo, para borrar un conjunto de datos
habrá que seleccionarlos y elegir Borrar, y para repetir el mismo dato a partir de una
posición determinada habrá que copiar el dato en el Portapapeles (acción Copiar),
seleccionar la zona en la que se debe repetir el dato y elegir la opción Pegar.
Edición de un fichero de datos.
Sobre un fichero de datos ya creado podemos efectuar los cambios que se deseen, tanto en
las variables como en los propios datos. Si deseamos cambiar las características de algunas
de las variables, lo hacemos directamente en la vista de variables del Editor de datos SPSS.
De la misma manera, cambios en los datos los haremos directamente en la vista de datos
del Editor de datos SPSS. A estos efectos sería aplicable todo lo dicho en el apartado
anterior 3.2.2. La realización de cambios sobre casos completos y variables completas las
vemos a continuación.
Edición de variables completas.
La selección de una variable se hace pulsando el botón izquierdo sobre el nombre de la
misma y así quedará seleccionada. Para seleccionar una serie de variables consecutivas
bastará con seleccionar la primera y arrastrar el ratón hasta la última, ese arrastre se puede
hacer con el botón izquierdo (en cuyo caso para llevar a cabo las acciones habrá que
desplegar el menú Editar o el menú Datos), o con el botón derecho (y en este caso, soltando
el botón derecho al final del arrastre, las acciones se podrán llevar a cabo mediante el menú
contextual que aparece).
34
Cortar, Copiar, Pegar y Eliminar; tales acciones han sido suficientemente explicadas
anteriormente por lo que lo único que diremos aquí es que se comportan de manera análoga
a lo visto y el lector ya sabe cómo funcionan. No obstante aparecen, debajo, una serie de
acciones que son propias de las variables. Explicaremos aquí la de Insertar variables.
Cuando se selecciona Insertar variables, aparece una variable nueva inmediatamente antes
de la variable seleccionada en la que toda la información estará en blanco esperando para
ser rellenada. El nombre de la variable habrá sido asignado por SPSS de oficio, según las
normas que vimos en la definición de variables, así como su tipo, su presentación y su
asignación de valores faltantes. Además, los datos correspondientes a los casos existentes
los rellenará automáticamente con datos faltantes del sistema, pudiendo introducirse los
datos en la variable posteriormente. Finalmente, cambiar la posición de una variable dentro
de la matriz de datos se lleva a cabo de forma completamente similar a como se ha visto
para los casos. Las acciones explicadas se pueden llevar a cabo en la vista de datos o en la
vista de variables.
ESTRUCTURA DEL SPSS
SISTEMA DE VENTANAS DE SPSS
El paquete SPSS desde la versión 6, es un paquete adaptado al entorno WINDOWS con lo
cual la forma de interaccionar con él, es a través de un sistema de ventanas y cuadros de
dialogo desplegables, de los que se pueden elegir distintas opciones. Aunque también está
disponible la opción de utilizarlo a través de comandos.
El paquete SPSS consta de dos ventanas básicas que se abren nada más inicializar la
aplicación, estas ventanas reciben el nombre de editor de datos y editor de resultados.
La ventana Editor de datos contiene los datos que van a ser analizados y la ventana Editor
de resultados va a ir almacenando los informes estadísticos solicitados.
VENTANAS
El SPSS dispone de una serie de ventanas destinadas a diferentes usos:
Ventana de Aplicación:
Esta ventana contiene la barra del menú principal con las distintas opciones del programa.
Editor de Datos:
Con él se puede crear un fichero de datos, o modificar uno ya existente. Se abre
automáticamente cuando se ejecuta el SPSS y los ficheros creados con el mismo se les
asignan generalmente la extensión .sav.
Visor:
35
Esta ventana muestra los resultados de la ejecución de cualquier procedimiento del SPSS,
esto es, las tablas, los gráficos, los análisis estadísticos etc. Se pueden generar los resultados
y guardarlos en un fichero (por defecto de extensión .spo) para utilizarlos posteriormente.
El visor se abre automáticamente cuando se ejecuta algún procedimiento.
Visor de Borrador:
Este visor da opción a mostrar los resultados pero como texto normal en lugar de como
tablas pivote interactivas. También permite añadir cualquier comentario o informe junto
con los resultados. Por otra parte, su contenido se puede almacenar en un fichero de texto
enriquecido, de extensión .rtf, y recuperarlo posteriormente con editores de texto como el
Microsoft Word.
Editor de Tablas Pivote:
Es posible modificar los resultados de las tablas pivote usando este editor, que nos permite,
editar el texto, intercambiar los datos de las filas y las columnas, añadir colores, crear tablas
multidimensionales, ocultar y mostrar los resultados de manera selectiva, etc. Para acceder
al mismo se pulsa dos veces con el ratón sobre la tabla que se haya generado.
Editor de gráficos:
Todos los esquemas y gráficos que se originan cuando se ejecuta un procedimiento se
almacenan en esta ventana, que se abre automáticamente la primera vez que se crea un
gráfico en una sesión del SPSS. Al pulsar entonces dos veces sobre el gráfico se abre este
editor, donde se puede modificar el gráfico mediante el cambio de colores, seleccionando
diferentes tipos de fuentes y tamaños, intercambiando los ejes horizontales y verticales,
rotando diagramas de dispersión 3D e incluso cambiando el tipo de gráfico. Su contenido se
puede guardar en una carpeta gráfica o fichero gráfico de extensión .sct.
Editor de resultados de texto:
Con este otro editor se pueden cambiar las características de las letras (tipo, estilo, color y
tamaño) que se usan en los títulos de los resultados.
Editor de Sintaxis:
Esta ventana se utiliza para crear los ficheros de sintaxis, cuya extensión es .sps. Para
ejecutar parte de los comandos almacenados en una ventana de sintaxis, se marca con el
ratón dichos comandos y se pulsa en el icono con un triángulo dirigido a la derecha.
También se pueden añadir a la ventana de sintaxis abierta, los comandos correspondientes a
un procedimiento, pulsando en el botón PEGAR del correspondiente cuadro de diálogo del
procedimiento en cuestión.
Editor de procesos:
36
El procesamiento y la automatización OLE permiten personalizar y automatizar muchas
tareas del SPSS. El editor de procesos se usa para crear y modificar los procesos básicos.
Se pueden tener abiertas varias ventanas del visor, pero sólo una es la designada, esto es, a
la que se añaden los resultados de cualquier análisis. De forma análoga, se pueden abrir
varias ventanas de sintaxis a la vez, pero la sintaxis de comandos sólo se pegará en la
ventana designada del editor de sintaxis. Las ventanas designadas se distinguen por un
signo de admiración en la barra de estado y se pueden cambiar en cualquier momento,
seleccionando la opción Designar ventanas dentro de la opción Utilidades del menú
principal, o pulsando el icono con un símbolo de admiración.
Normas de funcionamiento de las ventanas de SPSS
Para ejecutar cualquier acción con SPSS se empieza siempre escogiendo tal acción de un
menú (o de un submenú, en su caso) que nos lleva a la ventana correspondiente a la acción
o procedimiento elegido, en la que hay que elegir los componentes fundamentales de la
acción y en la que Introducción al manejo del SPSS 12.0 16 hay la posibilidad de elegir
otros componentes accesorios.
Esta ventana tiene una estructura como la que sigue: en la parte izquierda suele haber una
caja en la que aparecen todas las variables presentes en el fichero activo y que son
susceptibles de ser manejadas con el procedimiento elegido; a la derecha de esa caja suele
haber otra u otras cajas en las que pondremos las variables seleccionadas para la acción que
deseamos llevar a cabo; la forma de establecer tal selección es pinchar, en la caja de la
izquierda, la variable de interés (inmediatamente aparecerá remarcada) y presionar en un
botón con una flecha que señala hacia la derecha (►), lo que llevará la variable a la caja de
las variables seleccionadas para el análisis. También suele haber unos botones de
particularización, o en la parte baja de la ventana o en la parte derecha de la misma que
particularizan el conjunto de acciones que dentro del procedimiento elegido se pueden
llevar a cabo.
las acciones a llevar a cabo son: elegir los estadísticos que aparecerán junto con las tablas
de frecuencias, elegir los gráficos que acompañarán a las tablas de frecuencias y por último
elegir el formato en que aparecerán las tablas de frecuencias; todos estos botones dan lugar
a ventanas en las que se harán las elecciones que hemos señalado. También, en las ventanas
de SPSS aparecen cinco botones de acciones inmediatas, que suelen estar a la derecha de la
ventana en vertical.
BOTONES
37
Además de las ventanas anteriores, existen otras llamadas Cuadros de Diálogo que se abren
cuando se selecciona algún procedimiento. Estas ventanas contienen distintos campos que
solicitan información para realizar el procedimiento elegido. A estos campos se puede
acceder directamente con el ratón o pulsando simultáneamente la tecla ALT y la tecla de la
letra que figura subrayada. También disponen de una serie de botones, unos que están
activos y otros que se activan cuando se completan determinados campos de la ventana.
Dentro de los botones activos, existen unos que aparecen en todos los cuadros de diálogo y
cuya función es la siguiente:
ACEPTAR.
Ejecuta el procedimiento elegido y cierra el cuadro de diálogo.
PEGAR.
Crea una ventana de sintaxis que incluye los comandos del SPSS equivalentes a la acción o
procedimiento que se está realizando.
RESTABLECER.
Devuelve a la lista de variables que muestra cualquier variable previamente seleccionada y
restablece la ventana de diálogo con las opciones que tiene por defecto al entrar en el
procedimiento.
CANCELAR.
Cancela cualquier cambio hecho en el cuadro de diálogo y cierra la misma.
AYUDA.
Abre una ventana de ayuda que muestra información sobre el procedimiento elegido.
Algunos de los botones aparecen con un comando seguido con puntos suspensivos, lo que
quiere decir, que al pulsarlos se abren unos subcuadros de diálogo, que permiten especificar
y/o ampliar las opciones de los análisis del cuadro de diálogo principal. Todos los
subcuadros de diálogo contienen un botón etiquetado con CONTINUAR, que sirve para
almacenar los campos ya definidos y volver al cuadro de diálogo principal.
MENÚ PRINCIPAL
En esta sección se comentan los submenús que se abren bajo cada una de las opciones de la
barra del menú principal, presente en todas las ventanas del SPSS.
Archivo.
38
Se utiliza para abrir, grabar, imprimir ficheros, y leer datos creados con el SPSS o con otras
aplicaciones, entre otras funciones.
Edición.
Contiene las habituales opciones de Windows para cortar, copiar, buscar y recuperar datos
y texto.
Ver.
Sirve para mostrar u ocultar la barra de herramientas, cambiar la fuente de las letras,
mostrar la cuadrícula, mostrar las etiquetas de valor, etc.
Datos.
Se utiliza para realizar cambios en el fichero de datos, tales como combinar ficheros,
trasponer variables y casos, agrupar casos para un análisis, etc. Dichos cambios son
temporales, a no ser que se grabe el fichero una vez realizados.
Transformar.
Se utiliza para realizar cambios en determinadas variables del fichero de datos y también
para crear nuevas variables basadas en los valores de variables ya existentes. Cambios
temporales hasta que se guarden en el archivo.
Analizar.
Dentro de esta opción se encuentran todos los procedimientos estadísticos.
Gráficos.
Se utiliza para crear Gráficos de Barras, Histogramas, Diagramas de sectores, Gráficos de
Dispersión, etc.
Utilidades.
Sirve para visualizar la información sobre el contenido del fichero de datos, del fichero de
parámetros, o definir grupos de variables.
Ventana.
Se utiliza para activar o desactivar los iconos, para cambiar el diseño de la ventana de
salida o la de sintaxis, o para cambiar el entorno que tiene definido por defecto el SPSS.
Este menú abre una ventana de ayuda que contiene información sobre el uso de cualquiera
de las características o procedimientos del SPSS.
ICONOS
39
El SPSS como cualquier programa de Windows, dispone de una serie de iconos que
permiten realizar ciertas operaciones, al pulsar con el botón izquierdo del ratón sobre el
mismo sin necesidad de utilizar los menús. Algunos iconos aparecen en casi todas las
ventanas, pero por lo general cada ventana presenta los suyos de manera específica. En este
apartado comentaremos brevemente aquellos iconos de la ventana principal, ventana de
resultados o visor y ventana de gráficos.
Iconos de la Ventana Principal
Abrir archivo.
Muestra el cuadro de diálogo de la opción Abrir archivo para el tipo de documento
que esté en la ventana activa: de datos, de resultados, de sintaxis o de gráficos.
Guardar archivo.
Guarda el fichero de la ventana que esté activa (base de datos (.sav), análisis (.spo),
sintaxis (.sps) o un gráfico (.sct)). Puede guardar el documento completo o las líneas
de texto seleccionadas. Si el fichero que se va a guardar no tiene nombre muestra un
cuadro de diálogo donde solicita el nombre, la carpeta y la unidad donde se va a
almacenar.
Imprimir.
Muestra el cuadro de diálogo de Imprimir para el tipo de documento que esté en la
ventana activa. En el caso de ficheros de resultados, sintaxis o datos, se puede
imprimir todo el documento, o sólo una parte seleccionada.
Recuperar cuadros de diálogo.
Muestra un listado con las operaciones más recientes hechas con el SPSS, aunque
no se hayan llevado a cabo en la última sesión.
Deshacer.
Con dicho icono se deshace la última operación llevada a cabo.
Ir a gráficos.
Este icono se utiliza para pasar de la ventana de datos a la de gráficos.
Ir a caso.
Este icono sirve para desplazar el cursor a un caso concreto en el editor de datos.
Variables.
40
Muestra una ventana que contiene la lista de variables del fichero cargado en el
editor de datos y la información de la variable seleccionada. También permite
posicionar el cursor en dicha variable con sólo pulsar el botón IR A.
Buscar.
Este icono se utiliza para buscar una cadena de caracteres en el editor de datos o en
la ventana de sintaxis. Una vez se ha pulsado el mismo se abre un cuadro con el
campo Buscar donde se ha de introducir dicha cadena, además de elegir entre los
botones BUSCAR HACIA ADELANTE y BUSCAR HACIA DETRÁS para
comenzar la búsqueda.
Insertar caso.
En el editor de datos, al pulsar sobre este icono se inserta un caso por encima del
caso en que está posicionado el cursor.
Insertar variable.
En el editor de datos, al pulsar en este icono se inserta una variable a la izquierda de
la variable que contenga el cursor.
Segmentar archivo.
Sirve para dividir el archivo cargado en el editor de datos atendiendo a las
categorías de cierta variable, o mediante alguna condición, pero de manera que los
procedimientos estadísticos solicitados posteriormente a la segmentación, se
realicen por separado para cada grupo en que se ha dividido el fichero.
Ponderar casos.
Sirve para indicar que alguna variable representa las frecuencias absolutas de los
valores y como tal debe considerarse a la hora de realizar cualquier análisis
posterior.
Seleccionar casos.
Sirve para elegir una muestra de casos de todo el archivo, teniendo en cuenta alguna
condición, de forma aleatoria, o indicando un rango de valores.
Etiquetas de valor.
Conmuta entre los valores de las variables y las etiquetas de valores en el editor de
datos.
Usar conjuntos.
41
Abre un cuadro de diálogo donde se puede seleccionar los conjuntos de variables
que muestran los cuadros de diálogo y que se utilizan para realizar los análisis
estadísticos o transformaciones.
Los conjuntos que trae por defecto el SPSS son: ALLVARIABLES y
NEWVARIABLES, pero se pueden crear otros mediante la opción Definir
Conjuntos dentro del menú Utilidades. Tras pulsar este icono se abre un cuadro con
un campo llamado Conjuntos en uso: donde aparecen ALLVARIABLES y
NEWVARIABLES. Si se quiere usar otro conjunto distinto, se tendrán que extraer
éstos de dicho campo.
Iconos del Visor
Presentación preliminar.
Este icono permite ver cómo quedan los resultados dentro de una página atendiendo
al formato que tiene, por si quisiéramos corregirlos antes de imprimirlos.
Exportar.
Sirve para exportar el fichero de resultados de forma que se pueda leer o capturar
con otra base de datos diferente.
Ir a datos.
Este icono se utiliza para activar la ventana del editor de datos y si está minimizada
la devuelve a su tamaño original. Cuando está seleccionado un punto en un gráfico
vinculado a los datos, al pulsar en este icono se activa el editor de datos, y aparece
resaltado el caso asociado con el punto seleccionado.
Seleccionar los últimos resultados.
Como su mismo nombre indica selecciona los resultados del último procedimiento
que se ha ejecutado.
Designar ventana.
Sirve para indicar el visor que recogerá los resultados que se obtengan al ejecutar un
procedimiento en aquellos casos donde haya varios visores abiertos. La forma de
hacerlo es colocando un signo de admiración al comienzo del título de la ventana.
Ascender.
Sirve para subir los resultados a un nivel superior dentro de la tabulación o
numeración de los mismos.
Degradar.
42
Realiza el proceso inverso del icono anterior, es decir, baja los resultados señalados
un nivel dentro de la tabulación.
Expandir.
Muestra los resultados de un procedimiento recogidos bajo su título en el fichero de
resultados.
Contraer.
Este icono permite contraer los resultados asociados con un procedimiento bajo su
título. Se usa sobre todo, cuando el fichero de resultados es muy grande y se quiere
explorar para poder así reducir sus dimensiones.
Mostrar.
Con este icono se muestran los resultados de un procedimiento que estaban ocultos.
Ocultar.
Este otro oculta los resultados seleccionados correspondientes a un determinado
procedimiento.
Insertar encabezado.
Sirve para introducir un encabezado en el fichero de resultados.
Insertar título.
Te permite introducir un título en los resultados correspondientes a un
procedimiento.
Insertar texto.
Con este icono se puede introducir algún comentario en los resultados.
Iconos de la Ventana de Gráficos
Los iconos de la ventana de gráficos están destinados sobre todo a la modificación de
los gráficos.
Identificación de puntos.
Sirve para identificar cualquier punto del gráfico con el valor correspondiente.
Pulsando sobre éste el cursor se convierte en un cuadrado, y haciéndolo sobre el
punto aparece el valor con que se corresponde.
Trama de relleno.
43
Este icono abre una ventana para seleccionar el relleno a utilizar en el gráfico.
Color.
Con este icono se abre una ventana para seleccionar el color que deseamos utilizar
en el gráfico.
Marcador.
Con éste seleccionamos la forma de la marca con que se dibuja el gráfico.
Estilos de línea.
Este icono permite cambiar la forma de las líneas usadas en los gráficos.
Estilos de barra.
Este otro permite seleccionar el formato de la barra que se utiliza cuando se trata de
un diagrama de barras.
Estilos de etiquetas de barra.
Sirve para etiquetar las barras con los valores numéricos que representan.
Interpolación.
Permite unir los puntos de un gráfico de dispersión mediante líneas de diferente
forma.
Texto.
Con este icono se elige el tamaño y la fuente del texto que aparecen en el gráfico.
Rotación 3D.
Nos permite llevar a cabo una rotación de los ejes y por tanto, del gráfico en el caso
tridimensional.
Intercambiar ejes.
Este icono nos permite intercambiar la colocación de los ejes.
Desgajar sector.
Con esta opción podemos extraer algún sector circular de un diagrama de sectores.
Romper líneas en valores perdidos.
Permite cortar la línea del gráfico para indicar los valores perdidos, en el caso de
representaciones de variables que los tengan.
Opciones del gráfico.
44
Este icono abre una ventana para cambiar las opciones del gráfico.
Activar/Desactivar modo de giro.
Según se pulse o no activamos o desactivamos la posibilidad de girar el gráfico.
Barra de Estado
La barra de estado que aparece en la parte inferior de cada ventana, es la forma en que el
sistema se comunica con el usuario y nos proporciona la siguiente información:
Estado del comando. Nos indica el número de casos procesados hasta el momento
cuando se está ejecutando algún procedimiento, o en caso contrario, nos avisa de
que el sistema está preparado. En los procedimientos que requieren procesamientos
iterativos se muestra el número de iteraciones.
Estado del filtro. El mensaje filtrado indica que se ha seleccionado una muestra
aleatoria o un subconjunto de casos del fichero actual, por lo que en el análisis que
se vaya realizar, no se incluirán la totalidad de los casos del archivo.
Estado de ponderación. El mensaje ponderado indica que se está utilizando una
variable de frecuencias para ponderar los casos en el análisis que se vaya a realizar.
Estado de división del archivo. El mensaje segmentado indica que el fichero de
datos se ha dividido en varios grupos para su análisis.
ESTADISTICA DESCRIPTIVA CON SPSS.
En el paquete SPSS todos los procedimientos estadísticos se encuentran en la opción
Analizar de la barra de menú del editor de datos, así mismo para acceder a los
procedimientos gráficos deberemos de seleccionar el menú Gráficos. Como no es el
objetivo de este curso no vamos a enumerar todos los procedimientos de análisis estadístico
y gráfico disponible, sino que nos limitaremos a mostrar a título ilustrativo tres de los más
comunes.
TABLAS DE FRECUENCIAS.
El procedimiento Frecuencias proporciona estadísticos y representaciones gráficas que
resultan útiles para describir muchos tipos de variables.
En general sólo solicitaremos tablas de frecuencias para variables ordinales o nominales
(categóricas).
45
El botón Estadísticos permite solicitar estadísticos específicos como frecuencias,
porcentajes, porcentajes acumulados, media, mediana, moda, suma, desviación típica,
varianza, amplitud, valores mínimo y máximo, error típico de la media, asimetría y curtosis
(ambos con sus errores típicos), cuartiles y percentiles.
El botón Gráficos permite solicitar gráficos de barras, gráficos de sectores e histogramas.
En general cuando la variable tenga nivel de medida nominal no solicitaremos ningún
estadístico y tampoco solicitaremos el histograma, si solicitaremos en cambio la tabla de
frecuencias y el diagrama de barras.
Tablas de variables múltiples.
Variables multirespuesta:
Las variables vistas hasta este momento se caracterizan por asignar un único valor a cada
caso u observación.
Existen situaciones donde una variable puede ofrecer más de un único valor. Por ejemplo,
si preguntamos a un individuo su edad obtendremos un único valor numérico; sin embargo;
si preguntamos a una persona que deportes práctica, nos podrá dar un número
indeterminado de deportes.
Este tipo de variables recibe el nombre de variables multirespuesta o de respuesta múltiple.
Codificación de las variables multirespuesta:
Es evidente que si una persona puede dar más de una respuesta, tendremos que tener más
de una variable para almacenar dichas respuestas.
Existen dos formas o esquemas de codificación para almacenar estas respuestas:
- Codificación dicotómica.
- Codificación categórica.
Codificación dicotómica.
En el esquema de codificación dicotómica, creamos tantas variables como respuestas
posibles, por ejemplo si la pregunta es: “¿Que idiomas hablas?”, vamos a crear tantas
variables como idiomas. Todas estas variables se codifican de la siguiente forma:
- 0 - No habla.
- 1 - Si Habla.
Este esquema de codificación está indicado cuando el número de categorías no es muy
amplio.
46
Codificación categórica.
En el esquema de codificación categórica se hace una pequeña concesión que consiste en
estimar el número máximo de respuestas, y se crean tantas variables como el máximo de
respuestas posibles y todas estas variables con los mismos códigos para especificar cada
respuesta. Este esquema está indicado cuando el número de respuestas puede ser muy
amplio, pero sólo tendrán interés las primeras respuestas.
Ejemplo:
Supongamos que se pregunta a los encuestados que idiomas hablan, es evidente que
dependiendo de cada persona, variara el número de respuestas.
Esquema de codificación dicotómico
Variables que vamos a crear:
Francés.
Ingles.
Alemán.
Italiano.
Portugués.
Otros.
Estas variables al indicar la presencia o ausencia de una cualidad reciben el nombre de
variables dicotómicas. Etiquetas de los valores comunes a todas ellas.
- 0 - No habla.
- 1 - Si habla.
Hay que observar que tenemos que crear tantas variables como idiomas nos puedan
responder.
Esquema de codificación categórico.
En este esquema tenemos que estimar el número máximo de idiomas que puede hablar una
persona, vamos a suponer tres idiomas como máximo, por lo tanto creamos tres variables
que serán:
- Idioma1.
- Idioma2.
- Idioma3.
Las etiquetas de los valores de las variables serán:
47
- 1 Inglés
- 2 Francés
- 3 Alemán
- 4 Italiano
- 5 Portugués
- 6 Ruso
- 9 No habla
Para solicitar las frecuencias de los idiomas debemos de utilizar un módulo específico del
SPSS denominado respuesta múltiple.
Antes de solicitar cualquier estadístico, deberemos de definir la variable multirespuesta e
indicar su esquema de codificación.
Ya tenemos definida la variable multirespuesta con el nombre Idioma, para solicitar una
tabla de frecuencias utilizamos el módulo Frecuencias del procedimiento Respuestas
múltiples.
Análisis de Variables Categóricas
En las investigaciones de mercados y otros trabajos de investigación, en ocasiones, es
importante entregar resultados categorizados, es decir, agrupados por alguna categoría o
variable que sirva para separar los resultados y dar visiones separadas de estos, como por
ejemplo cuando se entregan resultados separados para mujeres y hombres.
Para realizar estas labores SPSS posee una herramienta de análisis que se llama “Tablas de
contingencia”, que consiste en una tabla que muestra información categorizada de acuerdo
a los parámetros que se haya definido previamente.
Para que este tipo de análisis tenga sentido, se necesita al menos de dos variables: una
variable que sirva para categorizar y una variable que se desee categorizar. Estas variables
deben poseer unidades de medida “Ordinal” o “Nominal”, por lo que utilizar variables con
medida de Escala no tiene mayor sentido y no ofrecería resultados de los que se pueda
extraer mucha información.
Tablas de doble entrada.
Las tablas de doble entrada también llamadas tablas de contingencias, son aquellas tablas
de datos referentes a dos variables nominales o categóricas, formada en las cabeceras de las
filas, por las categorías o valores de una variable y en las de las columnas por los de la otra,
y en las casillas de la tabla, por las frecuencias que reúnen a la vez las dos categorías o
valores de las dos variables que se cruzan en cada casilla.
GRÁFICOS CON SPSS.
48
Una parte importante a la hora de exponer los resultados estadísticos es presentar algunos
de ellos en forma de gráficos. A ello dedica SPSS todo un menú de la ventana principal,
que es el menú Gráficos, con las opciones que aparecen en la Figura 8.4. De ese menú no se
explicarán todas las opciones, sino sólo las más útiles para los objetivos del manual. Las
dos primeras opciones son: Galería e Interactivos. La primera ofrece de una manera gráfica
y guiada (mediante un tutor) cada uno de los gráficos que se pueden invocar por separado y
que se describen a continuación; esta opción puede ser seguida con facilidad por parte del
lector pues el tutor que emplea SPSS es bastante amigable y claro. Interactivos permite
construir los gráficos que veremos a continuación también de una manera interactiva y con
un tutor; es el procedimiento gráfico más moderno de SPSS y mejora sensiblemente el
manejo de los gráficos del mismo, así como su calidad de presentación (3D, colores,
sombreados, etc....); una vez más debido a la facilidad de uso no nos detendremos más en
él, por lo que el usuario puede intentarlo por su cuenta.
Todos los gráficos tienen una forma de invocarlos y una serie de opciones que matizan su
uso, por ello encontraremos que la exposición de los mismos es similar a la de otros
procedimientos estadísticos. En el primer gráfico que presentemos haremos mención al
editor de gráficos de SPSS que permite la manipulación de los mismos de manera muy
avanzada.
En numerosas ocasiones, el investigador se enfrenta con lectores que difícilmente podrán
comprender gran parte de los resultados obtenidos en el marco de una investigación. Sin
embargo, esto puede mejorar en la medida que el investigador busca nuevas formas de
presentar la información. Una de estas formas es la utilización de gráficos, los que resultan
un complemento visual importante para el desarrollo de una correcta investigación y
ofrecen herramientas que permiten al lector hacerse una mejor idea de lo que visualizarían
si solamente mirasen los resultados numéricos. Si bien es cierto que hay numerosos estilos
de gráficos que se pueden utilizar, en este apartado solamente se utilizarán los más
comunes: Gráficos de torta, Gráficos de Barra, Gráficos de dispersión (diagramas de
dispersión).
Gráficos de Torta.
Este tipo de gráficos es muy común para visualizar información de carácter cualitativo y
categórico, ya que ofrece una forma muy gráfica para visualizar el peso (o cuantía) de algún
aspecto de una variable en relación a otros.
Es importante mencionar que para que este tipo de gráficos tenga sentido, la unidad de
medida de los datos debe ser “Nominal” u “Ordinal”. Con variables medidas en Escala no
tiene mucho sentido realizar este tipo de gráficos, pues entregarán un dibujo muy complejo
de leer y sin lógica aparente.
49
1. Para generar un gráfico cualquiera, se debe ir al Menú “Gráficos” (Al lado del menú
“Analizar”) y se debe escoger alguna de las opciones. Se recomienda que se escoja la
opción “Cuadros de diálogo antiguos” (por asuntos de comodidad). Posteriormente se debe
escoger el tipo de gráfico que se desea, en este caso, un gráfico de “Sectores... ” (Que es
comúnmente llamado “Gráfico de Torta”).
2. Posteriormente ofrece la opción de cómo se desea obtener los datos desde la base de
datos. Como este es un manual de orden básico, se recomienda dejar tal cual lo ofrece el
software, es decir, se debe seleccionar la opción “Resúmenes para grupos de casos”. Con lo
anterior, el investigador se asegura que se utilizará todos los datos de la base de datos de
acuerdo a los grupos en los que se encuentren definidos.
3. Una vez abierto el cuadro de diálogo, se debe definir los sectores del gráfico. Para ello,
se debe seleccionar la variable que se desee graficar y se debe ubicar en el sector que dice:
“Definir sectores por:” Con esto, el investigador le está diciendo al software que defina los
sectores del gráfico de acuerdo a las etiquetas de la variable seleccionada. Posteriormente
se recomienda agregar títulos al gráfico. Para ello se debe hacer clic en el botón “Títulos...”.
4. En el cuadro de diálogo de títulos, se debe agregar el título principal (Línea 1 y Línea 2),
el Subtítulo y las notas al pie (Línea 1 y Línea 2 de la zona inferior). Sin embargo es
posible que el investigador decida solo colocar un título y dejar el resto en blanco, o
simplemente colocar nada. No es obligación llenar cada uno de los espacios disponibles en
esta ventana. Finalmente se debe hacer clic en el botón “Continuar” y posteriormente en el
botón “Aceptar”.
Una vez hecho clic en el botón aceptar, el software abrirá una ventana de resultados con un
gráfico. El gráfico aún se puede encontrar muy incompleto o falto de identificadores. Para
ello SPSS ofrece herramientas para editar gráficos. Solo basta con hacer doble clic sobre el
gráfico en el visor de resultados y abrirá una nueva ventana con el editor de gráficos, donde
el investigador podrá editar el gráfico a gusto.
Gráficos de Barras.
SPSS denomina Gráfico de barras a un gráfico de variables categóricas en el que sobre cada
modalidad se levanta una barra de altura proporcional a la frecuencia. La llamada del
Gráfico de Barras da lugar a una primera ventana en la que ha de seleccionarse el tipo de
gráfico de barras que se desea representar. La ventana es como la de la Figura 8.5. Lo
primero es elegir entre los gráficos: Simple, Agrupado y Apilado. En el Simple, sólo se
representa en el Gráfico una única variable (que es lo más común); en el Agrupado se hace
un gráfico simultáneo (compuesto) en el que se presenta la distribución de una variable
dentro de cada una de las categorías de otra variable. En el gráfico Apilado, se representan
las categorías de una variable apiladas en cada una de las barras en las que se representa la
otra variable. Elegido el tipo de Gráfico de Barras, se debe seleccionar ahora si el Gráfico
50
estará hecho con casos, a base de resúmenes de variables o a partir de valores individuales
de los casos; nosotros nos ceñiremos siempre a la primera opción dejando las otras para
situaciones más complejas. Una vez elegida la primera opción pasamos a lo que es la
definición del Gráfico de Barras pulsando el botón Definir.
Cuando se pulsa el botón Aceptar aparece el gráfico en el Visor de resultados, como si
fuera un resultado más.
Lo primero será decir que cuando se pincha sobre el gráfico en el Visor de resultados,
aparece el recuadro en el que está integrado el gráfico y en él una serie de puntos en su
contorno que permiten agrandarlo y achicarlo; para ello colocado el ratón sobre uno de los
puntos y pulsado el botón izquierdo basta con desplazarlo para conseguir un cambio de
tamaño proporcional al tamaño original.
Esta idea de los componentes del gráfico es básica para entender la edición del mismo; en
efecto, cuando decidamos editar el gráfico. SPSS nos permitirá la edición parcial de cada
uno de sus componentes siendo la modificación deseada la suma de las modificaciones
parciales. Pero, antes de entrar en la ventana de edición, decir que cuando se selecciona un
gráfico y seleccionamos el menú contextual para él (recuérdese con el botón de la derecha)
podremos realizar una copia del gráfico al Portapapeles de Windows y de ahí recuperarlo
en la aplicación que deseemos como ha ocurrido en el caso de este manual.
El Editor de gráficos es una ventana a todos los efectos, lo mismo que la ventana del Editor
de Datos o la ventana del Visor de resultados. Como toda ventana muestra unos menús y
una barra de herramientas análogos a los de los otros editores, salvo que ahora están
pensados para editar los gráficos. Debajo de los menús aparecen los iconos que nos sirven
para acceder de manera rápida a determinadas opciones, más usuales, de los menús. Si el
usuario pasa el ratón por ellos, se despliega una pequeña leyenda con el título de la opción.
Por último indiquemos que la forma más rápida de acceder a las opciones de modificación
es pulsar (sobre la componente que se desea modificar) dos veces con el ratón y
automáticamente se despliega la ventana de modificación oportuna.
Para editar un componente del gráfico (barras, ejes, títulos,…), en primer lugar hay que
seleccionarlo (quedará remarcado dicho componente) y luego hacer los cambios oportunos
utilizando los menús desplegables, la barra de herramientas, el menú contextual o la
ventana de propiedades (que se despliega haciendo doble clic sobre el componente, o con el
icono correspondiente de la barra de herramientas). Cuando se termine la edición del
gráfico, cerrar la ventana del editor y volvemos al Visor SPSS.
Gráficos de Líneas.
Los gráficos de líneas no son más que polígonos de frecuencias que se pueden representar
para una, dos o más variables. En la primera ventana del Gráfico de líneas se debe elegir
51
entre los gráficos Simple, Múltiple y de Líneas Verticales. El gráfico Simple permite un
polígono de frecuencias para una variable. En el Múltiple se pueden hacer varios polígonos
de frecuencias simultáneamente (gráfico compuesto). En el caso de gráficos de Líneas
verticales se lleva a cabo un gráfico más complejo que no describiremos aquí. El resto de la
ventana es como en los gráficos de barras. Pulsando el botón Definir aparece la ventana en
todo. Por ello todo lo dicho para el diagrama de barras es válido ahora. Lo dicho para el
editor de gráficos sigue siendo válido por lo que pasaremos a un nuevo gráfico.
Gráficos de Sectores.
Como su propio nombre indica, permite hacer un diagrama de sectores para la distribución
de una variable. La primera ventana del gráfico de sectores es muy simple, en ella aparecen
las opciones que conocemos de gráficos anteriores. Por ello, todo lo dicho para el diagrama
de barras es válido ahora. Lo dicho para el editor de gráficos sigue siendo válido, salvo que
aparecerá algún icono adicional, como el que permite desgajar cada porción del diagrama
de sectores.
Histograma.
Con este procedimiento obtendremos un histograma para un carácter cuantitativo continuo.
Cuando se selecciona el procedimiento se obtiene una ventana. Como siempre, aparece una
caja a la izquierda en la que figuran todas las variables del fichero activo, de entre las que
se seleccionará la variable para la que se va a hacer el histograma. Pinchando sobre Mostrar
curva normal se representará la curva Normal teórica que se ajustaría al histograma. Por
último, lo referente a Plantilla y al botón Títulos... ya se ha comentado en un gráfico
anterior. Elegidas todas las opciones, pulsando el botón Aceptar, se mostrará el histograma.
Correlación.
Con frecuencia el investigador necesita determinar si existe relación entre un conjunto de
variables, como por ejemplo, la existencia de una relación entre el salario y los años de
estudio de una persona, u otra.
La correlación lineal mide el grado de relación lineal entre dos variables o conjuntos de
variables. Los resultados entregan al investigador nociones sobre la dirección de esta
relación (positiva, negativa), la fuerza (correlación fuerte, correlación débil, sin
correlación).
La medida de correlación más utilizada en investigaciones de mercado es la denominada
“Correlación lineal de Pearson”, que indica el grado de relación lineal de las variables que
se desea medir. El valor de la correlación fluctúa entre -1 y 1, donde valores cercanos a -1
52
indican una fuerte correlación negativa, mientras que valores cercanos a 1 indican una
fuerte relación positiva.
Si el valor de la correlación es cercano a cero, se puede decir que el grado de relación lineal
entre las variables es cero o muy débil.
Ejemplo Práctico:
Comúnmente se cree que existe una fuerte relación entre los años de estudio de una persona
con el salario que recibe en su trabajo. Por lo mismo se le pide a usted que determine si es
efectiva esta afirmación y si realmente más años de estudio implican un mejor salario. Para
ello se utilizará una base de datos que contiene información sobre salario actual, salario
inicial, años de educación y años de experiencia previa de 30 trabajadores de distintas
empresas. La base de datos se encuentra en el archivo “BaseDatosC8.sav”
1. En el menú “Analizar”, se debe ubicar el mouse sobre el menú “Correlaciones” y
posteriormente se debe escoger el tipo “Bivariadas”, que corresponde a
correlaciones para dos variables. Una nota importante es que para que este tipo de
análisis tenga sentido se debe tratar de utilizar variables con unidad de medida de
Escala u Ordinales (aunque este último tipo podría generar problemas).
2. Una vez abierto el cuadro de diálogo, se debe escoger las variables entre las que se
desea determinar la correlación: en este caso se trata de las variables: “Años de
educación” y “Salario actual”. Una vez seleccionadas las variables, se deben
posicionar donde dice “Variables” (como muestra la figura) y se debe cerciorar que
se encuentra marcada la casilla “Pearson” dentro de “Coeficientes de correlación”.
Finalmente se debe hacer clic en el botón “Aceptar”.
Importar Datos de Microsoft Excel®
Una forma común de encontrar bases de datos es en formatos distintos a SPSS, como por
ejemplo Microsoft Excel (.xls), Para poder trabajar con bases de datos de otro software
primero se debe importar de manera de transformarla en datos comprensibles para SPSS.
La forma de hacer esto es la siguiente: Primero se debe ir al menú “Archivo \ Leer datos de
texto”. En la ventana que abre debemos seleccionar “Excel [.xls]” donde dice “Tipo” y
posteriormente buscar y seleccionar el archivo Excel que se desee importar.
Una vez seleccionado el archivo se debe hacer clic en el botón “Abrir” y se abrirá un nuevo
cuadro de diálogo.
Se recomienda dejar este diálogo tal cual aparece en el programa, pues generalmente
cambiar esto puede generar problemas al investigador cuando no comprende a cabalidad los
software que se están haciendo funcionar (SPSS y Excel). Hacer clic en el botón “Aceptar”
53
para continuar e importar los datos. Una vez seleccionado el archivo se debe hacer clic en
el botón “Abrir” y se abrirá un nuevo cuadro de diálogo. Una vez importados los datos
desde la planilla excel, se abrirá una ventana del “Editor de datos”.
Los usuarios pueden crear una amplia variedad de programas SPSS para satisfacer sus
necesidades de gestión de datos y análisis de necesidades. Se pueden guardar programas de
la sintaxis de SPSS para la exportación de datos de otra fuente, como una hoja de cálculo
Excel. Otros programas que se pueden guardar como sintaxis incluyen procedimientos para
las variables de la recodificación, fusión de archivos de datos o el cálculo de valores. Por
último, los usuarios pueden guardar los programas SPSS para los procedimientos
estadísticos de los cuales es capaz SPSS. Estos son desde simples estadísticas descriptivas
hasta regresiones multivariantes.
VENTAJAS DE SPSS
El programa utiliza una serie de cuadros de dialogo que permiten determinar las
acciones y seleccionar aquellos análisis útiles.
Potente herramienta para el cálculo estadístico.
Es un software rápido.
Permite un importantísimo ahorro de tiempo y esfuerzo, realizando en segundos un
trabajo que requeriría horas e incluso días.
Hace posible cálculos más exactos, evitando los redondeos y aproximaciones del
cálculo manual.
Permite trabajar con grandes cantidades de datos, utilizando muestras mayores e
incluyendo más variables.
Permite trasladar la atención desde las tareas mecánicas de cálculo a las tareas
conceptuales: decisiones sobre el proceso, interpretación de resultados, análisis
crítico.
DESVENTAJAS DE SPSS
Si el usuario no tiene experiencia previa utilizando SPSS o si sus conocimientos de estadísticas no están actualizados es difícil discernir que opciones seleccionar.
La mayoría de los reportes de resultados contiene un nivel excesivo de información
que muchas veces confunde al usuario.
Posee una gran cantidad de información en forma automática que distrae al usuario.
El aprendizaje del manejo de paquetes de programas estadísticos requiere un cierto
esfuerzo.
A veces, la capacidad de cálculo del evaluador supera la capacidad para comprender
el análisis realizado e interpretar los resultados.
Lleva a veces a una sofisticación innecesaria, al permitir el empleo de técnicas
complejas para responder a cuestiones simples.
54
CONCLUSIÓN
Statistical Package for the Social Sciences (SPSS) como programa
estadístico informático muy usado en las ciencias sociales y las empresas de investigación
de mercado, es de gran ayuda para muchas personas, además, es uno de los programas con
mayor uso en el continente americano, este permite manejar datos de gran magnitud y
efectuar análisis estadísticos muy complejos, en general hacer un mejor uso de la
información capturada en forma electrónica y rápida.
Un programa SPSS permite a un usuario llevar a cabo el mismo procedimiento en repetidas
ocasiones, sin tener que recordar los menús desplegables o los comandos que debe hacer
clic y elegir con el fin de establecer la serie de los procedimientos necesarios. Esto ahorra
tiempo al organizar y analizar los datos. Estos programas también pueden ser modificados
para funcionar con diferentes modelos estadísticos, analizar diferentes variables o acceder a
archivos de datos diferentes. Para ejecutar un programa, simplemente haz clic en la sintaxis
y arrastra para resaltarlo. Después de esto, haz clic en el comando "execute" (ejecutar), una
clave en forma de flecha en el menú de archivo de sintaxis.