Prctica 2. Instalacin del programa PSPP y obtencin de una distribucin de frecuencias.
Con esta prctica instalaremos el programa PSPP. El programa es un software especfico para el anlisis estadstico de encuestas sociolgicas y de opinin. Una vez instalado, comenzaremos por grabar los datos de edad de un grupo de 80 personas y finalizaremos obteniendo la distribucin de frecuencias de esta variable de intervalo. La realizacin de la prctica permitir poner en marcha las herramientas bsicas para el anlisis estadstico.
Existen distintos paquetes de anlisis estadstico. Dentro del campo especfico del anlisis de encuestas destacan por su mayor uso el ya clsico SPSS -Statistical Package for Social Sciencesque fue diseado por la Universidad de Chicago en los aos 50 del siglo pasado, y el STATA. Ambos programas permiten realizar con comodidad anlisis en los que intervienen gran cantidad de variables y de casos registros- recogidos mediante cuestionarios. Desde la filosofa del Software libre (GNU) se ha desarrollado el proyecto PSPP. Obsrvese que son las siglas del SPSS en forma invertida. El software libre se caracteriza por la distribucin gratuita y por la elaboracin colaborativa entre distintos programadores. Dado que el funcionamiento es idntico al SPSS y contiene las principales utilidades analticas en este curso se utilizar PSPP.
Primera parte: Instalacin de PSPP Para la instalacin del PSPP hay varios procedimientos:
En el caso de Windows, para mayor comodidad podemos seleccionar en uno de los siguientes enlaces, dependiendo de si su ordenador funciona con 32 bits (sistemas operativos ms antiguos) o con 64 bits (sistemas operativos ms modernos): El de 32 bits funciona en cualquier sistema Windows, el de 64 slo con los sistemas operativos basados en este formato.
[Link]
[Link]
Hay que guardar el archivo antes de ejecutarlo Si su sistema operativo es diferente (Mac, Linux...) o tiene conocimientos avanzados de informtica. Dirjase a la pgina del proyecto de PSPP segn se indica a continuacin. Descarga desde la pgina del proyecto PSPP
El proyecto PSPP cuenta con una pgina propia: [Link] La pgina anterior est en ingls, y para la descarga del programa debemos ir a la seccin GET PSPP. Desde all tenemos que seleccionar nuestro sistema operativo.
Instrucciones de instalacin para sistemas operativos Windows
Los diferentes sistemas operativos de Windows (XP, Vista, Windows 7) pueden presentar ventanas con distinto aspecto, pero bsicamente sern equivalentes. A partir de ahora comienza el proceso de instalacin. Se abre un pequeo cuadro de dilogo para que seleccionemos el idioma: probablemente vendr por defecto Spanish y pinchamos en OK.
El instalador vuelve a preguntar y aceptamos.
Se abre una nueva ventana:
Marcamos Acepto los trminos de la licencia y seguimos con el proceso de instalacin pulsando en Siguiente.
Se puede dejar la carpeta de destino que ofrece el instalador por defecto (depender de cada ordenador) y pinchamos en siguiente.
Volvemos a aceptar con Siguiente. Windows instalar los archivos y aparecer el mensaje:
En el escritorio encontraremos un nuevo icono, con el cual podremos acceder al programa:
Parte segunda: Introduccin a la grabacin manual de datos en PSPP Antes de comenzar a utilizar el programa conviene que tenga en cuenta que PSPP utiliza tres ventanas simultneamente (datos, resultados y sintaxis). -Una, con aspecto de hoja de clculo, para visualizar los datos. Son ficheros con extensin .sav -Otra segunda ventana en la que se registran los resultados. Son ficheros con extensin -Una tercera, denominada de sintaxis, en la que escribiremos comandos e instrucciones. Son ficheros con extensin .sps
Al ejecutar el programa PSPP desde el icono del escritorio se abre la ventana de los datos apareciendo una matriz en blanco.
En las pestaas de la parte inferior izquierda de la ventana del programa encontramos activada por defecto la vista de datos y debemos cambiar a la vista de variables, pinchando en la pestaa correspondiente.
Para comenzar a conocer la estructura y los mens del programa, comenzaremos por introducir los datos manualmente. La tabla siguiente contiene las edades de un grupo de 80 personas que queremos representar mediante una tabla de frecuencias.
56 66 21 63 60 60 60 42 38 35 45 44 57 51 57 45 38 49 50 49 47 35 30 53 32 53 42 47 41 28 47 61 35 33 48 40 38 54 63 21 20 27 53 55 41 54 28 39 45 34 39 21 42 39 27 48 48 53 35 33 27 27 54 52 38 29 30 53 53 58 23 41 63 28 43 56 59 60 40 24
Una vez en la Vista de variables, escribiremos en la primera casilla un nombre para la variable que vamos a introducir (Si se pulsa con el ratn accidentalmente en las casillas inferiores en blanco pueden crearse variables por defecto, es incmodo, pero pueden borrarse seleccionando con el botn derecho del ratn en el nmero de la variable de la columna de la izquierda y eliminarla).
Llamaremos a esta variable Edad y pulsamos intro.
Tngase en cuenta que el nombre de la variable debe contener como mximo ocho caracteres sin espacios ni signos. Podremos sin embargo escribir sin limitaciones la etiqueta de esa variable, por ejemplo Edad en aos cumplidos.
Por defecto el software asigna determinadas caractersticas a las variables que se crean, pero las podremos cambiar de forma sencilla. A la derecha del nombre aparece el tipo de variable, en este caso es numrica y lo dejamos como est por defecto, pero en la caracterstica decimales, podemos quitar los dos decimales que no necesitamos.
A continuacin regresamos a la pestaa de datos para introducir las edades en la primera columna:
56 66 21 63 60 60 60 42 38 35 45 44 57 51 57 45 38 49 50 49 47 35 30 53 32 53 42 47 41 28 47 61 35 33 48 40 38 54 63 21 20 27 53 55 41 54 28 39 45 34 39 21 42 39 27 48 48 53 35 33 27 27 54 52 38 29 30 53 53 58 23 41 63 28 43 56 59 60 40 24
Cuando se llena la pantalla (unos 14 casos dependiendo del ordenador) para seguir introduciendo casos debemos crear lneas pinchando en la opcin del men superior: insertar casos tantas veces como lneas queramos aadir.
Una vez grabados los 80 casos es imprescindible grabar el fichero. Deberemos ponerle un nombre, -por ejemplo PRACTICA-, nos pedir confirmacin de la carpeta en la que queremos guardar el fichero y nos dar la opcin para que el indiquemos, por defecto si el fichero es de sistema1. Le indicamos que el fichero es de sistema y nos lo grabar con el nombre [Link]
Finalizada la grabacin vamos a comenzar el estudio de los datos. Nos iremos a analizar, y desplegaremos, estadstica descriptiva, frecuencias
Una vez en frecuencias, seleccionamos la variable Edad en la caja de la izquierda y la enviamos a la caja de la derecha, pulsando en el icono correspondiente :
En la caja de estadsticas seleccionamos: Media Mnimo Mximo Intervalo
Despus de pulsar en aceptar nos aparece una nueva ventana con los resultados:
En primer lugar tenemos la tabla de frecuencias y en segundo lugar los resultados solicitados. Son 80 casos, no hay casos sin valores o perdidos. El valor mnimo son 20 aos, el mximo 66 y por tanto el recorrido intervalo- 46. Tambin hemos obtenido que la edad media es de 43,41 aos.
Parte Tercera: Elaboracin de una tabla de frecuencias con datos agrupados
La tabla de frecuencias anterior al no estar agrupados los datos no resulta de mucha utilidad analtica. Vamos a construir una nueva tabla con las edades agrupadas en intervalos decenales. En concreto en 5 categoras:
20 a 29 aos 30 a 39 aos 40 a49 aos 50 a 59 aos 60 a 66 aos
Para agrupar los datos vamos a recodificar, por ejemplo quienes tienen de 20 a 19 aos, les daremos el valor 25 que es su marca de clase-, quienes tienen de 30 a 39 aos les daremos el valor 35... Esta la operacin la haremos en una nueva variable que denominaremos Edad2- y conservaremos la variable original. En el men principal, seleccionaremos Transformar y en el desplegable que se abre seleccionamos Recodificar en variables diferentes. Se abrir una ventana en la que seleccionaremos la variable EDAD y pinchando en la flecha de la ventana la pasamos a la parte derecha
Pondremos nombre y etiqueta a la nueva variable Variables de salida. Usamos un nombre breve sin espacios y signos especiales, por ejemplo Edad2, para la variable, y el nombre que queramos, por ejemplo Edad Agrupada, para la etiqueta; en este caso si se permiten los espacios en blanco. Seleccionamos la variable (se pondr azul) y escribimos los nombres. Y pulsamos en el botn cambio
A continuacin en la misma pestaa pinchamos en Valores anteriores y nuevos; se abrir una nueva pestaa para introducir los valores concretos que tomar la nueva variable. Como sabemos los valores que tomar cada intervalo, seleccionamos intervalo:
Sabemos que el valor menor es 20 y el mximo 66. Haremos 4 intervalos iguales de 10 aos y un ltimo de 6. En la imagen de abajo se muestra cmo se introducen los lmites inferior y superior del primer intervalo, y como se asigna el nuevo valor, en este caso la marca de clase o punto central. El primer intervalo incluye las edades entre 20 y 30 aos, pero como se trata de aos cumplidos, escribiremos como lmite inferior 20 y superior 29, y como marca de clase el punto medio: 25. Pulsamos , para grabar la categora.
En el visor de la derecha se mostrarn los lmites del intervalo y la marca de clase. El programa asignar el valor 25 a todos los casos que presenten de 20 a 29 aos cumplidos.
Sin cerrar la ventana repetiremos la operacin para los otros intervalos y una vez introducidos todos los intervalos con sus marcas de clase como valores, pincharemos en Continuar.
Observe, que la marca de clase del ltimo intervalo es 63,5 el valor se introduce con punto en vez de con coma-. Como sabemos el intervalo va desde 60 aos hasta 66, como es edad cumplida, el lmite superior llega hasta 67.
Tras pulsar Continuar aparecer de nuevo la ventana anterior.
Y ahora simplemente pinchamos en para que se lleve a cabo la recodificacin de la variable EDAD en otra nueva variable que hemos llamado Edad2, con la etiqueta Edad Agrupada en 5 intervalos.
(No olvide que en cualquier momento puede guardar el archivo que est modificando para poder abrirlo ms tarde y continuar donde lo dej)
En la ventana principal de los datos, nos aparece una nueva variable con 80 casos, pero que slo toma 5 valores diferentes, los de las marcas de clase de cada categora. Debe tenerse en cuenta que esta variable creada menos variabilidad que la original y aunque es til para representar la tabla y resumir los datos, no ser muy til para calcular estadsticos como la media o la varianza, pues en lugar de los 80 datos individuales, la variable slo toma los 5 valores de las marcas de clase.
Si seleccionamos la pestaa de las variables, podemos cambiar los atributos de la nueva variable. En la cuarta columna se pueden establecer los decimales. Pinchemos en la casilla Decimales para la fila de Edad2 y cambiemos el nmero de decimales a 1.
A continuacin pondremos etiquetas para los valores de la variable, para que puedan verse luego en la tabla que pretendemos obtener en la ventana de resultados.
Pinchamos con el ratn la casilla correspondiente a la variable Edad2 y la columna de los valores (etiquetas de Valores):
Dentro de la casilla aparece un pequeo botn gris cuadrado, pinchamos en l y se abrir una nueva ventana:
En la casilla Valor introduciremos los valores de cada marca de clase o punto medio del intervalo y tambin la etiqueta del valor en la casilla correspondiente, y las aadimos una a una pinchando en Aadir. Para la primera categora, el valor es su marca de clase, 25 y su etiqueta De 20 a 29, y aceptamos con Aadir. Repetimos la operacin sin cerrar la ventana para cada intervalo
Cuando hemos introducido los datos de todos los intervalos aceptamos con
En la ventana principal se pueden entonces solicitar la confeccin de una tabla y nuevos anlisis para la variable creada: Solicitamos el clculo de la tabla de frecuencias, desde el men principal, pinchando en Analizar-> Descriptivas-> y seleccionamos el comando Frecuencias.
Se abrir la ventana del comando de Frecuencias y seleccionaremos la variable Edad2 pinchando en con . y marcamos nicamente el estadstico Media. A continuacin ejecutamos
En la ventana de resultados tendremos los siguientes resultados:
En la ventana de resultados podemos ver los intervalos de edad, las marcas de clase, las frecuencias absolutas, las frecuencias relativas y las frecuencias relativas acumuladas. Adems tenemos la media solicitada. Observamos que hay ligeras diferencias en el clculo de la media con datos agrupados y sin agrupar. Cuando se agrupan los datos se pierde precisin, debido a que se toman los mismos valores para cada individuo perteneciente al mismo intervalo, eliminando la variabilidad. Por este motivo, para conocer estos estadsticos ser siempre preferible utilizar la variable original,
y utilizaremos esta recodificacin slo en los casos en que nos interese representar la informacin en una tabla.