MANEJO DEL PROGRAMA
1.- ENTRAR EN SPSS
Para entrar en SPSS, si no se dispone de acceso directo en el escritorio, se seguir
la secuencia Inicio Programas SPSS - SPSS 10.0 para Windows. Una vez que se ha
entrado al programa, aparece la siguiente pantalla:
Desde esta pantalla se puede acceder
directamente a una base de datos utilizada
recientemente (Abrir una fuente de datos
existente), o crear una base de datos en
blanco
para
introducir
datos
(Introducir
Datos), etc.
Para salir de la pantalla, pulsar Cancelar.
En caso de no querer que aparezca esta
pantalla la prxima vez que se acceda al
programa, sealar la opcin
2.- CREACIN DEL FICHERO DE DATOS
Para empezar a trabajar con el programa SPSS lo primero que hay que hacer es
construir el fichero de datos. Para ello se seguirn una serie de pasos, antes o despus de
introducir los valores.
Este es el aspecto que
presenta
una
base
de
datos vaca.
Ntese la existencia de dos
pestaas
en
la
parte
inferior, una llamada "Vista
de datos" (activada) y la
otra "Vista de variables"
(desactivada)
En la "Vista de datos" aparecen las variables colocadas en columnas y los sujetos en
filas.
En la "Vista de variables" encontramos
que stas estn colocadas en filas,
mientras que en las columnas se sita
cada una de las caractersticas que las
define, y que veremos ms adelante.
2.1.- DEFINICIN DE VARIABLES
Las variables se definen desde la "Vista de variables", donde encontramos, como
hemos visto antes, una columna para cada caracterstica:
2.1.1.- Nombre Pinchando con el ratn sobre la celdilla correspondiente al nombre de la
variable que estamos definiendo, podemos escribir directamente el nombre de la misma
(mximo 8 caracteres).
2.1.2.- Tipo Al pinchar sobre la celdilla, aparece un cuadro gris
y al pinchar
sobre el, accedemos a la siguiente pantalla:
En esta opcin se le indica al programa
con
qu
tipo
de
datos
estamos
trabajando, as como el ancho de las
celdillas y si quieren incluirse decimales.
2.1.3.- Anchura A travs de esta opcin se puede modificar la anchura de las celdillas que
se haba seleccionado en la pantalla anterior
2.1.4.- Decimales Igualmente, a travs de esta opcin modificar el nmero de decimales
que tendrn los datos, ya seleccionado en el apartado [Link]
En ambos casos se puede escribir directamente el nmero de
decimales en la celdilla activada (seleccionada con el ratn) o
mover las flechas hasta encontrar el que se quiere.
2.1.5.- Etiqueta La etiqueta de la variable corresponde al nombre completo de la misma, que
aparecer en las salidas. Para asignarla etiqueta de la variable, se escribe directamente sobre
la celdilla activada (seleccionada con el ratn)
2.1.6.-Valores Son los diferentes valores que puede tomar la variable. Se van aadiendo a la
lista, mediante el botn Aadir. Se pueden introducir modificaciones con los botones Cambiar y
Borrar.
En Valor se escribe el valor de la categora y
el
Etiqueta
de
valor,
su
nombre
correspondiente. Para que sea aceptado hay
que pinchar Aadir y se sita en la ventana
de abajo.
Ejemplo En el caso de estar definiendo la variable sexo, los valores que puede tomar la variable son
dos: Mujer y Hombre, le asignamos a las mujeres un 1 y a los hombres un 2.
2.1.7.- Valores perdidos Accediendo a esta ventana, el programa pide que se le
especifiquen los valores que no tiene que incluir en el anlisis (errores del sistema, espacios
en blanco, etc.)
Se accede a esta ventana pinchando el
extremo derecho (sombreado en gris) de la
celdilla.
2.1.8.- Columnas Esta opcin permite rectificar, si fuera necesario, el ancho de la columna
(especificado ya en 2.1.2.- Tipo)
Tal como hicimos en las opciones 2.1.3. y 2.1.4, se puede escribir directamente el
ancho de la columna en la celdilla activada (seleccionada con el ratn) o mover las flechas
hasta encontrar el que se quiere.
2.1.9.- Alineacin En esta opcin se ajusta al gusto la alineacin de los caracteres, es
decir, se especifica como se quiere que aparezcan los datos en las columnas, alineados a la
derecha, en el centro, o alineados a la izquierda.
Al acceder a la celdilla (pinchando con el ratn en su extremo derecho, en
el que aparece una flecha), se despliega un cuadro en el que hay que
seleccionar la opcin deseada, pinchando sobre ella.
2.1.10. Medida Por ltimo, en esta opcin se determina el nivel de medicin de la variable,
pudiendo elegir entre Nominal, Ordinal o Intervalo.
Al acceder a la celdilla (pinchando con el ratn en su extremo derecho, en
el que aparece una flecha), se despliega un cuadro en el que hay que
seleccionar la opcin deseada, pinchando sobre ella.
Al ir definiendo cada una de las variables del fichero, puede ocurrir que queramos
utilizar la misma opcin para ms de una variable. En lugar de ir definiendo cada variable, se
puede copiar la informacin de una (con Ctrl + C o Edicin + Copiar) y pegarla en otra/s
(con Ctrl + V o Edicin + Pegar).
Por ejemplo, si queremos utilizar los mismos "Valores" para ms de una variable,
basta definirlos para una, a continuacin se selecciona la celdilla que corresponde la los
Valores de esa variable, se pincha Ctrl + C o Edicin + Copiar, y se selecciona el resto de
variables que van a llevar los mismos valores (seleccionado con el ratn las celdillas
correspondientes a los valores), y se pincha Ctrl + V o Edicin + Pegar. Esto puede hacerse
con todas las opciones menos con el Nombre de la variable.
Una vez que estn todas las variables definidas se meten los datos (la operacin
puede realizarse a la inversa, metiendo primero los datos y definiendo despus las
variables), el fichero de datos presentara un aspecto similar al de la figura siguiente:
Este es el aspecto que muestra la
Vista de Variables, una vez que se
han
definido
todas,
con
la
informacin correspondiente a cada
opcin.
Este es el aspecto que muestra la
Vista de Datos, una vez que se han
introducido todos ellos.
Puede resultar interesante que, en
lugar de los datos numricos de las
variables, aparezcan los Valores que
se les ha asignado. Para ello, hay que
activar el icono:
Con el icono activado se puede operar
igual que si no lo est
3.- MODIFICACIN DEL FICHERO DE DATOS
Una vez que se ha elaborado el fichero de datos, se pueden introducir en l todas las
modificaciones que sean necesarias.
En el caso de querer introducir casos o variables nuevas, basta seleccionar el men
Datos y acceder a Insertar variable o Insertar caso.
Insertar variable Inserta una variable delante de la que est seleccionada. (Si queremos
insertar una variable X entre las variables Z e Y, seleccionaremos la variable Y; la nueva
variable X se situar delante de ella). Esto puede hacerse tanto desde la Vista de Datos
como desde la Vista de Variables.
Insertar caso Del mismo modo, se pueden incluir nuevos casos (sujetos) en el fichero, para
ello se seleccionar el sujeto que quedar detrs del nuevo, y se insertar el caso. (Si
queremos un caso nuevo entre el 3 y el 4, seleccionamos el 4, y el nuevo aparecer delante,
el programa numera de nuevo los casos de forma automtica)
Eliminar variables o casos Para realizar esta operacin, se selecciona la variable o caso a
eliminar y se pincha el botn Suprimir
4.- VER RESUMEN DE VARIABLES
Una vez que hemos elaborado todo el fichero de datos, podemos ver un resumen de
las variables sin tener que ir a una a una viendo cmo se han definido. Para ello, se
acceder al men Utilidades Variables, donde se despliega una ventana en la que se
encuentra informacin detallada de cada una de las variables. En esta ventana aparece un
listado de variables as como la informacin de la que est seleccionada.
Pinchando Ir a se accede directamente al lugar
del fichero de datos donde se encuentra esa
variable, sin necesidad de buscarla, lo que
facilita el trabajo cuando trabajamos con un
fichero extenso.
La ventana no permite realizar ningn cambio,
para hacerlo hay que acudir a la variable y
realizarlos en ella.
Nota: Igualmente se puede ir a un sujeto determinado sin tener que
pasarlos uno por uno. Para ello, se accede a Datos Ir a caso, y se
escribe el caso al que se quiere ir, pulsando despus Aceptar.
5.- ORDENAR CASOS
En un momento determinado, puede resultar til tener los casos ordenados en una
de las variables, el programa lo permite a travs del men Datos Ordenar casos.
En la ventana desplegada, slo hay que
seleccionar la variable que queremos que
ordene, determinar el orden de clasificacin,
y Aceptar. En el fichero de los datos se
reordenarn los casos a partir de esta
variable
6.- ALMACENAMIENTO Y ACCESO A LOS DATOS
Estas son las funciones bsicas del editor de datos del programa SPSS, una vez que
tenemos el fichero de datos preparado, ya se puede empezar con el anlisis estadstico, sin
olvidar antes guardar el fichero.
6.1.- GUARDAR EL FICHERO DE DATOS
Seleccionar Archivo Guardar, y especificar el lugar donde se quiere guardar, as
como el nombre asignado
Como puede verse, el procedimiento es el mismo
que se sigue en cualquiera de los programas del
entorno Windows.
A esta opcin se accede igualmente pinchando en
el icono
6.2.- ACCESO A LOS DATOS
Se procede del mismo modo, especificando el nombre y ubicacin del archivo que
queremos abrir, desde Archivo Abrir - Datos
A esta opcin se accede igualmente
pinchando en el icono
Otra forma de acceder a un fichero de datos utilizado recientemente es a travs de
Archivo - Datos usados recientemente y seleccionando el que se quiere abrir
7.- EL VISOR DE RESULTADOS
El visor de resultados es la pantalla en la que el programa SPSS presenta los
resultados de los anlisis. Una vez que hemos hecho el primer anlisis, y si no se especifica
lo contrario, los sucesivos resultados se acumularn en el mismo visor.
La apariencia del visor es la siguiente:
El visor se divide en dos partes (de ancho
regulable por el usuario). A la izquierda aparece
el ndice de lo que contiene el visor, que nos
permite desplazarnos por los resultados que
INDICE
RESULTADOS
pinchemos sin necesidad de pasar por todos los
dems.
La parte de la derecha, es la que muestra los
resultados de los anlisis efectuados.
A travs de los botones de la barra de tareas, podemos movernos del editor de datos
al visor de resultados de manera rpida y sencilla
8.- GUARDAR LOS RESULTADOS
Los resultados de los anlisis pueden guardarse de diferentes formas:
8.1.- EN FORMATO SPSS
Se guardarn de esta forma cuando vayan a abrirse
posteriormente en este formato, es decir, en equipos que tengan instalado el SPSS. Para
ello basta con acceder a Archivo - Guardar y asignar el nombre y la ubicacin deseados
De nuevo encontramos una ventana de aspecto
idntico a la proporcionada por cualquier programa
del entorno Windows. De nuevo tambin, es
posible acceder a esta ventana a travs del icono:
8.2.- EN OTROS FORMATOS El programa SPSS tiene su propio editor de resultados,
editor que es incompatible con el procesador de textos que se utiliza habitualmente (Word,
o Word Perfect). Por esta razn, para poder visualizar los resultados en aquellos equipos
que no tengan instalado el programa SPSS, es necesario exportar el visor de resultados a
un documento HTML, que puede abrirse, y modificarse en Word. Para ello, en el men
Archivo (del visor de resultados), seleccionamos la opcin Exportar y aparece la siguiente
ventana
En esta ventana hay que especificar:
Qu queremos exportar
Dnde lo queremos exportar
Cmo lo queremos exportar
8.2.1.- Qu queremos exportar Podemos exportar el documento completo (tablas y
grficos, si los hubiera), solo los grfico, o slo las tablas.
En esta opcin seleccionaremos la opcin que ms
se ajuste a nuestra necesidad
8.2.2.- Dnde lo queremos exportar Hay que especificar dnde se quiere exportar el
visor de resultados, para lo que hay que ir a Exportar archivo.
Pulsando examinar, se accede a una pantalla en la que especificaremos dnde
queremos guardar el archivo y con qu nombre (si no se especifica nombre, el programa por
defecto lo llama [Link]).
8.2.3.- Cmo lo queremos exportar Especificaremos el Formato de exportacin, donde se
seleccionar la opcin Archivo HTML (*.htm), que suele estar marcada por defecto
9.- RECUPERAR LA SALIDA
9.1.- EN FORMATO SPSS Desde el Visor de Resultados, se accede a Archivo - Abrir y se
busca el archivo que se quiere abrir.
La apariencia de los resultados en el visor de
resultados del SPSS es tal como aparece en la
figura
9.2.- EN FORMATO HTML El archivo exportado puede ahora abrirse desde cualquier
ordenador que no tenga instalado el programa SPSS, ahora con formato HTML. Para ello
abriremos el procesadores de texto Word. Para abrirlo, accedemos a Archivo abrir en tipo
de archivo, seleccionamos Documento HTML o Todos los archivos, buscamos el que
queremos abrir y aparece un documento con el aspecto siguiente:
La ventaja que tiene exportar en
este
formato
es
que
permite
modificar las tablas, tal y como se
hace en Word, posibilidad que en
la salida de SPSS es mucho ms
limitada
ANALISIS ESTADSTICO DESCRIPTIVO Y DE FRECUENCIAS
1.- ANLISIS DESCRIPTIVO
Para realizar un anlisis descriptivo de datos, una vez recuperados los datos en
la pantalla, acceder al men Analizar Estadsticos descriptivos Descriptivos.
Aparece una pantalla en la que se da la opcin de escoger una, varias o todas las
variables de la base de datos para hacer el anlisis.
En este caso seleccionamos las variables: Rendimiento en Historia,
Rendimiento en Filosofa, Rendimiento en Idioma, Rendimiento en Matemticas y
Rendimiento en Dibujo. Para seleccionar las variables, se pinchan con el ratn y se
arrastran a la ventana Variables.
Esta opcin nos permite obtener estadsticos de resumen univariados para
varias variables en una nica tabla y calcula valores tipificados (puntuaciones z), que
pueden guardarse, si as se especifica, en el fichero de datos como una variable
Seleccionando esta opcin,
aparecern las puntuaciones
tipificadas en el fichero de datos.
nueva.
Accediendo a las OPCIONES encontramos una pantalla en la que podremos
especificar los estadsticos que nos interesen
En esta pantalla marcaremos con el ratn () los estadsticos
que queramos, as como el orden de visualizacin de las
variables en el visor de resultados.
Las variables se pueden ordenar por el tamao de sus medias
(en orden ascendente o descendente), alfabticamente o por
el orden en el que se seleccionen las variables (el valor por
defecto).
Una vez especificado lo que queremos, pinchamos Continuar
Volvemos a la pantalla presentada en la pgina anterior, y pinchamos Aceptar.
El visor de resultados de los estadsticos descriptivos es de muy fcil interpretacin,
presenta una tabla en la que muestra, para cada variable, los estadsticos que se han
pedido.
Estadsticos descriptivos
N
Rendimiento en historia
Rendimiento en filosofa
Rendimiento en idioma
Rendimiento en
matemticas
Rendimiento en dibujo
N vlido (segn lista)
100
100
100
Mnimo
0
0
0
Mximo
10
10
9
Media
5.73
5.50
5.32
Desv. tp.
2.27
2.34
2.08
100
10
5.70
1.96
100
100
10
5.50
2.19
Si se marc la opcin Guardar valores tipificados como variable, en el fichero
de datos se crearn unas variables nuevas, llamadas znombrevariable, con la
puntuacin tpica de cada sujeto en cada variable.
2.- ANLISIS DE FRECUENCIAS
Accedemos a esta opcin a travs del men Analizar Estadsticos
descriptivos Frecuencias. Esta opcin proporciona estadsticos y representaciones
grficas que resultan tiles para describir muchos tipos de variables. Es un
procedimiento til para realizar una inspeccin inicial de los datos.
Se da la opcin de mostrar / no
mostrar la tabla de frecuencias. Para
obtenerlas, debe estar marcado ()
En esta pantalla se seleccionarn los Grficos que
se desean (se seleccionan conjuntamente para
todas las variables seleccionadas) as como los
valores a partir de los que se generar el mismo.
La
opcin
ESTADSTICOS
permitira
seleccionar aquellos que se desee incluir
en los resultados (procedimiento similar al
presentado
descriptivo)
en
la
opcin
1.- Anlisis
Los resultados obtenidos aparecen en una tabla similar a la presentada en la
figura siguiente:
Estadsticos
Vlidos
Perdidos
Estudios
del padre
100
0
Profesin
del padre
100
0
Estudios de
la madre
100
0
Profesin
de la madre
100
0
En
una
primera
tabla
aparecen los estadsticos
seleccionados para cada una
de las variables incluidas en el
anlisis.
A continuacin se presentan las tablas de frecuencias, una para cada variable, en la que se
aparece la frecuencia directa, su porcentaje directo, as como el vlido (despus de eliminar
valores perdidos), y el acumulado.
Estudios del padre
Vlidos
Sin estudios
Primarios
Secundarios
Bachiller
Univ. Medios
Univ. Superiores
Otros
Total
Frecuencia
7
14
16
21
16
18
8
100
Porcentaje
7.0
14.0
16.0
21.0
16.0
18.0
8.0
100.0
Porcentaje
vlido
7.0
14.0
16.0
21.0
16.0
18.0
8.0
100.0
Porcentaje
acumulado
7.0
21.0
37.0
58.0
74.0
92.0
100.0
ESTADSTICA PARAMTRICA:
PRUEBA T DE STUDENT
Con la prueba t de Student se intenta probar la diferencia de medias para uno, dos
o ms grupos. Se trata de una prueba paramtrica, es decir, que entre otras cosas, la/s
variable/s dependiente/s deben estar medidas en nivel de intervalo o razn.
1.- PRUEBA T PARA MUESTRAS INDEPENDIENTES
El programa SPSS, dentro del men Analizar, tiene una opcin para comparar
medias y dentro de esta opcin accedemos a Prueba T para muestras independientes.
En el ejemplo que se desarrolla en este caso seleccionamos como variable de
agrupacin o variable independiente el Sexo que tiene dos categoras: MUJER (1) y
HOMBRE (2). Como variables dependientes seleccionamos Rendimiento en Historia,
Rendimiento en Filosofa, Rendimiento en Idioma, Rendimiento en Matemticas y
Rendimiento en Dibujo.
En esta pantalla seleccionamos las
variables dependientes, as como la
variable
independiente
(de
agrupacin) a partir de la que se
calcula la diferencia de medias.
En DEFINIR GRUPOS hay que introducir los valores
que puede tomar la variable de agrupacin, en nuestro
caso 1 (hombre) y 2 (mujer), hasta que no se hace
esto, no se puede continuar
En OPCIONES el programa nos sugiere un
intervalo de confianza de 95%, es decir, = 0,05.
Normalmente se utiliza este nivel de confianza
aunque puede modificarse al 98% o al 99%. Si
continuamos, aceptamos el 95% sugerido.
Las Ho quedan formuladas de la forma siguiente:
Ho (1): No existen diferencias estadsticamente significativas en el Rendimiento de los
alumnos en Historia en funcin de la variable Sexo.
Ho (2): No existen diferencias estadsticamente significativas en el Rendimiento de los
alumnos en Filosofa en funcin de la variable Sexo.
Ho (3): No existen diferencias estadsticamente significativas en el Rendimiento de los
alumnos en Idioma en funcin de la variable Sexo.
Ho (4): No existen diferencias estadsticamente significativas en el Rendimiento de los
alumnos en Matemticas en funcin de la variable Sexo.
Ho (5): No existen diferencias estadsticamente significativas en el Rendimiento de los
alumnos en Dibujo en funcin de la variable Sexo.
Interpretacin de resultados
En el visor de resultados encontramos dos tablas (aqu se presenta la segunda en
dos partes). En la primera tabla, el programa calcula los ESTADISTICOS DEL GRUPO,
concretamente la media, la desviacin tpica y el error tpico de medida de cada categora
de la variable independiente, sexo en este caso.
Estadsticos de grupo
Rendimiento en historia
Rendimiento en filosofa
Rendimiento en idioma
Rendimiento en
matemticas
Rendimiento en dibujo
Sexo
Mujer
Hombre
Mujer
Hombre
Mujer
Hombre
Mujer
Hombre
Mujer
Hombre
N
53
47
53
47
53
47
53
47
53
47
Media
5.58
5.89
5.58
5.40
5.40
5.23
5.57
5.85
5.47
5.53
Desviacin
tp.
2.20
2.36
2.28
2.42
1.96
2.22
1.95
1.98
2.34
2.02
Error tp. de
la media
.30
.34
.31
.35
.27
.32
.27
.29
.32
.29
A continuacin aparece una tabla que consta de dos partes, en la primera, el programa
realiza una prueba a priori, la F de Levene, para comprobar si existe o no homogeneidad de
varianzas (uno de los requisitos para aplicar pruebas paramtricas).
Por ltimo, en la segunda parte de la tabla, aparecen los resultados de la prueba, el
valor de la t, los grados de libertad y su probabilidad asociada. Por ejemplo, la
variable Rendimiento en Historia tiene un valor de t = -0,677y una probabilidad asociada de
0,500. Si la hiptesis nula planteada Ho (1) era que no existen diferencias estadsticamente
significativas en el Rendimiento de los alumnos en Historia en funcin de la variable Sexo,
con los resultados obtenidos, y trabajando a un = 0,05, podemos aceptarla (porque
0,500 > 0,05) y afirmar que no existen diferencias estadsticamente significativas entre
hombres y mujeres en el Rendimiento en Historia.
En las siguientes columnas, el programa nos ofrece los diferentes intervalos
confidenciales (nivel de confianza 95%) para cada una de las comparaciones.
Prueba de muestras independientes
Prueba T para la igualdad de medias
t
Rendimiento en historia
Rendimiento en filosofa
Rendimiento en idioma
Rendimiento en
matemticas
Rendimiento en dibujo
Se han asumido
varianzas iguales
No se han asumido
varianzas iguales
Se han asumido
varianzas iguales
No se han asumido
varianzas iguales
Se han asumido
varianzas iguales
No se han asumido
varianzas iguales
Se han asumido
varianzas iguales
No se han asumido
varianzas iguales
Se han asumido
varianzas iguales
No se han asumido
varianzas iguales
gl
Sig. (bilateral)
Diferencia
de medias
Error tp. de
la diferencia
95% Intervalo de
confianza para la
diferencia
Inferior
Superior
-.677
98
.500
-.31
.46
-1.21
.60
-.674
94.473
.502
-.31
.46
-1.22
.60
.384
98
.702
.18
.47
-.75
1.11
.383
94.940
.703
.18
.47
-.76
1.12
.388
98
.699
.16
.42
-.67
.99
.385
92.602
.701
.16
.42
-.67
1.00
-.725
98
.470
-.29
.39
-1.06
.49
-.725
96.184
.470
-.29
.39
-1.07
.50
-.137
98
.891
-6.02E-02
.44
-.93
.81
-.138
97.932
.890
-6.02E-02
.44
-.93
.81
Para el resto de las Hiptesis Nulas planteadas Ho (2), Ho (3), Ho (4), Ho (5), podemos
aceptarlas ya que las probabilidades asociadas al estadstico t (0,702 - 0,699 - 0,470 0,891 respectivamente) son mayores que (0,05), por lo que:
No existen diferencias estadsticamente significativas en el Rendimiento de los
alumnos en Filosofa en funcin de la variable Sexo . Ho (2)
No existen diferencias estadsticamente significativas en el Rendimiento de los
alumnos en Idioma en funcin de la variable Sexo. Ho (3)
No existen diferencias estadsticamente significativas en el Rendimiento de los
alumnos en Matemticas en funcin de la variable Sexo Ho (4)
No existen diferencias estadsticamente significativas en el Rendimiento de los
alumnos en Dibujo en funcin de la variable Sexo Ho (5)
Contrastes Posteriores
En caso de haber encontrado diferencias significativas, y para ver hacia que direccin de
dan, se consulta la tabla ESTADSTICOS DE GRUPO, y en la columna MEDIA, se puede ver
qu grupo obtiene una media superior.
2.- PRUEBA T PARA MUESTRAS RELACIONADAS
Dentro del men Analizar, entramos en la opcin comparar medias y dentro de esta
opcin accedemos a Prueba T para muestras relacionadas. En este caso se trata de
comprobar si existen diferencias estadsticamente significativas entre la Capacidad de
Concentracin antes (de recibir un programa de entrenamiento de la concentracin PEC),
y la Capacidad de Concentracin despus (del PEC). Seleccionamos estas variables
porque estn medidas en nivel de razn.
La H0 planteada es que no existen diferencias estadsticamente significativas entre
la Capacidad de Concentracin antes y la Capacidad de Concentracin despus.
En este caso, hay que seleccionar las dos
variables a la vez y llevarlas a la ventana
de la derecha
Interpretacin de resultados
Aparece en primer lugar una tabla que resumen la informacin de las variables incluidas en
el anlisis. Podramos haber metido ms de un par de variables, en los resultados se
identifican como Par 1, Par 2, etc.
Estadsticos de muestras relacionadas
Media
Par 1
Capacidad de
concentracin antes
Capacidad de
concetracin despues
Desviacin
tp.
Error tp. de
la media
61.29
100
20.25
2.03
71.61
100
18.35
1.83
A continuacin aparece una tabla que nos proporciona la correlacin entre las variables:
Correlaciones de muestras relacionadas
N
Par 1
Capacidad de
concentracin antes y
Capacidad de
concetracin despues
Correlacin
100
.744
Sig.
.000
Podemos ver que la correlacin es significativa (sig. = 0,000 < = 0,05) y muy alta (ver
prctica de correlacin)
Por ltimo aparece la tabla en la que se contrasta la hiptesis que ponamos en juego:
Prueba de muestras relacionadas
Media
Par 1
Capacidad de
concentracin
antes - Capacidad
de concetracin
despues
-10.32
Diferencias relacionadas
95% Intervalo de
confianza para la
Error tp.
diferencia
Desviaci
de la
n tp.
media
Inferior
Superior
13.92
1.39
-13.08
-7.56
gl
-7.415
99
Sig.
(bilateral)
.000
Podemos ver que la probabilidad asociada al estadstico t es menos que , por lo que
rechazamos la H0 planteada y afirmamos que existen diferencias estadsticamente
significativas entre la Capacidad de Concentracin antes y la Capacidad de
Concentracin despus.
Contrastes posteriores
Una vez que hemos visto que las diferencias entre la capacidad de concentracin antes y
la capacidad de concentracin despus son significativas, puede interesar en qu direccin
se dan estas diferencias. Para ello, volvemos a la tabla primera que proporciona el
programa, y vemos en que variable a media es ms alta.
Estadsticos de muestras relacionadas
Es superior la media en Capacidad
Media
Par 1
Capacidad de
concentracin antes
Capacidad de
concetracin despues
Desviacin
Error tp. de
tp. de concentracin
la media despus de recibir
61.29
100
20.25
el PEC, por 2.03
lo que puede decirse
71.61
100
18.35
que es un programa eficaz.
1.83
ESTADSTICA NO PARAMTRICA
Las pruebas no paramtricas se utilizan para contrastar la existencia de
diferencias significativas cuando la/s variable/s dependiente/s estn medidas en nivel
nominal u ordinal. El programa SPSS, dentro del men Analizar, tiene una opcin para
Pruebas no Paramtricas. Dentro de esta opcin podemos encontrar varios casos
entre los que cabe destacar: para 2 muestras independientes, para ms de dos
muestras independientes, para 2 muestras relacionadas, para ms de dos muestras
relacionadas, Chi cuadrado. Vamos a entrar nicamente en tres de estos casos, para
el resto, se procede de la misma forma, seleccionando la opcin correspondiente.
1.- PRUEBA NO PARAMTRICA PARA DOS MUESTRAS INDEPENDIENTES
Accedemos al men Analizar Pruebas no paramtricas 2 muestras
independientes. Seleccionamos como variable dependiente el Inters Profesional de
los alumnos, y como independiente o variable de agrupacin, el sexo. Queremos
comprobar si existen diferencias estadsticamente significativas entre los intereses
profesionales de hombres y mujeres. Para adaptarnos al programa del curso,
utilizaremos la prueba U de Mann-Whitney, aunque como se puede comprobar, el
programa da otras opciones (Z de Kolmogorov-Smirnov, Reacciones extremas de
Como variable de agrupacin (o variable
independiente) seleccionamos la variable
Sexo y definimos los grupos como 1
(MUJER) y 2 (HOMBRE).
Moses)
En OPCIONES se da la opcin de pedir descriptivos o cuartiles. En el caso que nos
ocupa no pediremos estadsticos ya que con anterioridad se ha presentado cmo se
calculan e interpretan los estadsticos descriptivos y frecuencias. Una vez completo el
men, aceptamos y pasamos al visor de resultados.
Como siempre, enunciamos la Hiptesis nula a contrastar:
19
H0:
No
existen
diferencias
estadsticamente
significativas
en
los
intereses
profesionales de los alumnos en funcin del sexo.
Interpretacin de resultados
En los resultados aparece una tabla en la que se muestra el nmero de sujetos que
hay en cada categora de la variable independiente, el rango promedio y la suma de
Rangos
Interes profesional
del alumno
Sexo
Mujer
Hombre
Total
N
53
47
100
Rango
promedio
52.39
48.37
Suma de
rangos
2776.50
2273.50
rangos.
A continuacin encontramos la tabla en la que aparecen los estadsticos de contraste.
Aunque aparecen por defecto la U de Mann Whitney, W de Wilcoxon y la Z,
interpretaremos solo la primera de ellas, aunque como puede verse, la significatividad
asociada a los tres estadsticos es la misma.
As pues, en funcin de la probabilidad asociada al valor del estadstico U de Mann
Whitney,
podemos
concluir
que
no
existen
diferencias
estadsticamente
significativas en los intereses profesionales de los alumnos en funcin del sexo,
ya que este valor (0,479) es mayor que (0,05)
Estadsticos de contrastea
U de Mann-Whitney
W de Wilcoxon
Z
Sig. asintt. (bilateral)
Interes
profesional
del alumno
1145.500
2273.500
-.707
.479
a. Variable de agrupacin: Sexo
20
2.- PRUEBA NO PARAMTRICA PARA K MUESTRAS INDEPENDIENTES
Para el caso de ms de dos muestras independientes vamos a utilizar la
Prueba H de Kruskal-Wallis. Accedemos al men Analizar Pruebas no paramtricas
K muestras independientes Del mismo modo que el anterior contraste no pediremos
estadsticos descriptivos en el men opciones y seleccionaremos las variables
dependientes. En este caso vamos a utilizar como variables dependientes el nivel de
estudios y profesional de los padres, y como variable independiente, el nivel social de
Para definir el rango, se introducen
los valores mximo y mnimo que
puede
tomar
la
variable
independiente o de agrupacin
la familia.
Vamos a contrastar las siguientes hiptesis:
H0 (1): No existen diferencias estadsticamente significativas entre el nivel de estudios
del padre en funcin del nivel social de la familia.
H0 (2): No existen diferencias estadsticamente significativas entre el nivel profesional
del padre en funcin del nivel social de la familia.
H0 (3): No existen diferencias estadsticamente significativas entre el nivel de estudios
de la madre en funcin del nivel social de la familia.
H0 (4): No existen diferencias estadsticamente significativas entre el nivel profesional
de la madre en funcin del nivel social de la familia.
Interpretacin de resultados
En los resultados aparecen las siguientes tablas:
Para
Rangos
Profesin del padre
Estudios del padre
Estudios de la madre
Nivel social familiar
Bajo
Medio-Bajo
Medio
Medio-Alto
Alto
Total
Bajo
Medio-Bajo
Medio
Medio-Alto
Alto
Total
Bajo
N
14
33
26
17
10
100
14
33
26
17
10
100
14
Rango
promedio
76.00
66.15
47.52
29.68
6.30
29.07
42.36
50.40
64.91
83.10
40.75
cada
variable
dependiente introducida en
el
anlisis,
aparece
el
nmero de casos que hay en
cada categora
(N) y el
Rango Promedio para cada
una de ellas.
Estadsticos de contrastea,b
Chi-cuadrado
gl
Sig. asintt.
Profesin
del padre
54.291
4
.000
Estudios
del padre
27.800
4
.000
Estudios de
la madre
4.099
4
.393
Profesin
de la madre
7.825
4
.098
a. Prueba de Kruskal-Wallis
b. Variable de agrupacin: Nivel social familiar
A continuacin aparece una tabla en la que aparece el estadstico correspondiente a
cada una de los contrastes de hiptesis realizados (Chi-cuadrado), as como los
grados de libertad (gl) y la significatividad asociada al estadstico de contraste
([Link].).
Podemos comprobar que existen diferencias significativas entre el nivel
educativo y el nivel profesional del padre en funcin de la clase social a la que
pertenece el familia, ya que las probabilidades asociadas al estadstico en ambos
casos son 0,000, valor inferior a =0,05. (Rechazamos H0 (1) y H0 (2))
Por el contrario, comprobamos que no existen diferencias significativas
entre el nivel educativo y el nivel profesional de la madre en funcin de la clase
social a la que pertenece el familia, ya que las probabilidades asociadas al
estadstico en ambos casos, 0,393 y 0,098, son superiores a =0,05. (Aceptamos H0
(3) y H0 (4))
3.- PRUEBA CHI CUADRADO
Dentro de las pruebas no paramtricas, es decir las que se realizan con
variables medidas en escala ordinal o nominal, se encuentra el CHI CUADRADO. Con
esta prueba podemos comprobar si existen o no diferencias estadsticamente
significativas entre frecuencias observadas (datos extrados de la realidad) y
frecuencias tericas (o esperadas). Hablamos en trminos de frecuencias ya que con
variables nominales o categricas slo podemos utilizar estadsticos de este tipo.
Podemos encontrar la Prueba Chi Cuadrado en el men Analizar-Pruebas no
parametricas- Chi cuadrado.
Las
variables
que
vamos
seleccionar para realizar el anlisis
son Sexo, Grupo de clase y Nivel
Social Familiar. Se trata de tres
variables
medidas
en
escala
nominal y aptas por tanto para
incluir en el anlisis.
En OPCIONES podramos pedir descriptivos, como en el resto de las pruebas no
paramtricas anteriormente presentadas, pero no vamos a hacerlo en esta prctica por
la misma razn que no lo hicimos anteriormente.
Las H0 a contrastar son:
H0 (1): No existen diferencias estadsticamente significativas entre la distribucin real
de los sujetos en la variable Sexo y la distribucin que cabra esperar al azar
H0 (2): No existen diferencias estadsticamente significativas entre la distribucin real
de los sujetos en la variable Grupo de clase y la distribucin que cabra esperar al azar
H0 (3): No existen diferencias estadsticamente significativas entre la distribucin real
de los sujetos en la variable Nivel Social Familiar y la distribucin que cabra esperar al
azar
Interpretacin de resultados
Aparecen en primer lugar las tablas con las frecuencias encontradas en cada
categora de cada una de las variables, as como lo que cabra esperar al azar (N / n
de categoras) y el residual.
Sexo
Mujer
Hombre
Total
N observado
53
47
100
N esperado
50.0
50.0
Residual
3.0
-3.0
Grupo A
Grupo B
Grupo C
Grupo D
Total
empricas (N observado), que es cmo
se distribuyen realmente los sujetos en
las diferentes categoras.
Grupo
N observado
25
25
25
25
100
En estas tablas aparecen las frecuencias
N esperado
25.0
25.0
25.0
25.0
Residual
.0
.0
.0
.0
A continuacin aparecen las frecuencias
tericas (N esperado), que es cmo se
distribuiran al azar, igual nmero de
sujetos en cada categora.
Aparecern tantas tablas como variables
se incluyan en el anlisis.
Nivel social familiar
Bajo
Medio-Bajo
Medio
Medio-Alto
Alto
Total
N observado
14
33
26
17
10
100
N esperado
20.0
20.0
20.0
20.0
20.0
Residual
-6.0
13.0
6.0
-3.0
-10.0
A continuacin aparece la tabla con los valores del estadstico Chi cuadrado, los
grados de libertad y la probabilidad asociada al estadstico.
Las probabilidades asociadas a los valores de chi cuadrado son 0,549 - 1,000 y 0,002,
en el caso de Sexo y del Grupo mayores que el valor de = 0,05, y en el caso de
Nivel Social Familiar, inferior a este valor, por lo que afirmamos que no existen
diferencias (mayores que las esperadas por azar) entre las diferentes categoras de
las variables Sexo y Grupo de Clase, y si que las hay en la variable Nivel Social
A partir de esta tabla se realiza el
Estadsticos de contraste
Chi-cuadrado
gl
Sig. asintt.
Familiar
Sexo
.360
1
.549
Grupo
.000
3
1.000
Nivel social
familiar
17.500
4
.002
contraste de hiptesis, comparando la
probabilidad
asociada
Chi-
Cuadrado con el al que estemos
trabajando.
ANALISIS DE VARIANZA
1.- ANLISIS DE VARIANZA SIMPLE.
El Anlisis de Varianza simple (ANOVA) es una tcnica estadstica utilizada
para contrastar la existencia de diferencias estadsticamente significativas entre las
medias de las muestras sometidas a diferentes tratamientos.
La hiptesis nula (H0) general que se pretende contrastar es la siguiente: No
existen diferencias estadsticamente significativas en la Variable Dependiente
(Rendimiento, por ejemplo) provocadas por la Variable Independiente (Sexo, por
ejemplo)
Esta prueba, en SPSS, la encontramos en el men Analizar Comparar
Medias ANOVA de un factor.
En este men se da la opcin de
seleccionar
ms
de
una
variable
dependiente, aunque los contrastes son
de ANOVA simple, es decir, de cada
variable
dependiente
con
independiente, por separado.
En esta prctica, y al ser el ANOVA una prueba paramtrica. Seleccionamos las
variables Rendimiento en Historia, Rendimiento en Filosofa, Rendimiento en Idioma,
Rendimiento en Matemticas, y Rendimiento en Dibujo ya que se trata de variables
medidas en nivel de intervalo. Como variable independiente seleccionamos la variable
Grupo. Las H0 a contrastar queda pues formulada en los siguientes trminos:
H0 (1): No existen diferencias estadsticamente significativas en Rendimiento en
Historia en funcin del grupo al que pertenecen los alumnos.
H0 (2): No existen diferencias estadsticamente significativas en Rendimiento en
Filosofa en funcin del grupo al que pertenecen los alumnos.
H0 (3): No existen diferencias estadsticamente significativas en Rendimiento en Idioma
en funcin del grupo al que pertenecen los alumnos.
H0 (4): No existen diferencias estadsticamente significativas en Rendimiento en
Matemticas en funcin del grupo al que pertenecen los alumnos.
la
H0 (5): No existen diferencias estadsticamente significativas en Rendimiento en Dibujo
en funcin del grupo al que pertenecen los alumnos.
En OPCIONES podramos pedir estadsticos o que haga
la prueba de Homogeneidad de Varianzas (uno de los
requisitos para poder aplicar una prueba paramtrica).
En este caso no vamos a solicitarlo.
En el caso de querer tambin los contrastes posteriores, es decir, que adems de
saber si hay diferencias, saber hacia qu direccin se dan estas diferencias, hay
que especificarlo en este momento. Para ello, desde la ventana principal,
entramos a la opcin Post Hoc...
De los diferentes estadsticos que
nos
ofrece
el
programa,
seleccionamos el de Scheffe
Aqu podramos cambiar el nivel de significacin.
Interpretacin de resultados
En la primera tabla que aparece podemos contrastar las hiptesis nulas, siempre
comparando con la probabilidad asociada al estadstico F
ANOVA
Suma de
cuadrados
Rendimiento en historia
Rendimiento en filosofa
Rendimiento en idioma
Rendimiento en
matemticas
Rendimiento en dibujo
Inter-grupos
Intra-grupos
Total
Inter-grupos
Intra-grupos
Total
Inter-grupos
Intra-grupos
Total
Inter-grupos
Intra-grupos
Total
Inter-grupos
Intra-grupos
Total
Media
cuadrtica
gl
246.350
82.117
263.360
96
2.743
509.710
99
298.440
99.480
242.560
96
2.527
541.000
99
22.320
7.440
405.440
96
4.223
427.760
99
122.440
40.813
256.560
96
2.673
379.000
99
221.640
73.880
251.360
96
2.618
473.000
99
Sig.
29.933
.000
39.372
.000
1.762
.160
15.272
.000
28.216
.000
A la vista de los resultados presentados en la tabla, rechazamos las Ho 1 - 2- 4 y 5, y
afirmamos que:
Existen diferencias estadsticamente significativas en Rendimiento en Historia en
funcin del grupo al que pertenecen los alumnos. H0 (1)
Existen diferencias estadsticamente significativas en Rendimiento en Filosofa en
funcin del grupo al que pertenecen los alumnos. H0 (2)
Existen diferencias estadsticamente significativas en Rendimiento en Matemticas
en funcin del grupo al que pertenecen los alumnos. H0 (4)
Existen diferencias estadsticamente significativas en Rendimiento en Dibujo en
funcin del grupo al que pertenecen los alumnos H0 (5)
En todos los casos, la probabilidad asociada a F es menor que (0,000 en los 4
casos)
Por el contrario, en el caso de la H0 (3), si que aceptamos y afirmamos que No
existen diferencias estadsticamente significativas en Rendimiento en Idioma en
funcin del grupo al que pertenecen los alumnos, ya que la probabilidad asociada a F
es menor que (0,160)
Contrastes posteriores
Para comprobar hacia qu lado se dan las diferencias encontradas, vamos a la
siguiente tabla. A continuacin se presenta el extracto de dicha tabla correspondiente a
Comparaciones
mltiples
la variable dependientes Rendimiento
en Historia.
Scheff
Diferencia de
Diferencia
(J) Grupo
medias (I-J)
Error tpico
Sig.
significativa
Grupo B
-2.64*
.47
.000
Grupo C
.28
.47
.949
Grupo D
-3.28*
.47
.000
Grupo B
Grupo A
2.64*
.47
.000
Grupo C
2.92*
.47
.000
Diferencia no
Grupo D
-.64
.47
.602
significativa
Grupo C
Grupo A
-.28
.47
.949
Grupo B
-2.92*
.47
.000
Grupo D
-3.56*
.47
.000
Grupo D
Grupo A
3.28*
.47
.000
Grupo B
.64
.47
.602
Grupo C
3.56*
.47
.000
Rendimiento en idioma
Grupo A
Grupo B
-.68
.58
.714
Grupo C
-1.16
.58
.270
En la primera columna aparece
de medias .58
de cada categora
de la
Grupo Dla diferencia
-8.00E-02
.999
Grupo B
Grupo A
.68
.58
.714
variable independiente con el resto, adjudicando al minuendo de la sustraccin el
Grupo C
-.48
.58
.877
nombre (I), y al sustrayendo el Grupo
nombre
segunda columna
(Diferencia
de
D (J), en la.60
.58
.785
Grupo
C resultados
Grupo A de dicha1.16
.58 el caso
.270
medias (I-J), se presentan
los
diferencia. En
de aparecer
Grupo B
.48
.58
.877
Grupo D
1.08
.58
.333
Grupo D
Grupo A
8.00E-02
.58
.999
Grupo B
-.60
.58
.785
Grupo C
-1.08
.58
.333
Variable dependiente
Rendimiento en historia
(I) Grupo
Grupo A
*. La diferencia entre las medias es significativa al nivel .05.
un asterisco (*) al lado del resultado, y segn consta a pie de tabla, la diferencia ser
significativa. La significatividad de la diferencia se ve igualmente en la columna Sig. en
la que aparece la probabilidad asociada a la diferencia. Como puede verse, para las
probabilidades que no son significativas (es decir, que son mayores que = 0,05), no
aparece asterisco (*) en el valor de la diferencia, y cuando no aparece el asterisco (*)
en este valor, la probabilidad no es significativa (su valor es mayor que = 0,05).
2.- ANLISIS DE VARIANZA FACTORIAL
Cuando se quiere comprobar si existen o no diferencias entre ms de dos
variables independientes y una dependiente, utilizamos el Anlisis de Varianza
Factorial, al que accedemos a travs de la secuencia
Analizar Modelo Lineal
General Univariante.
En la opcin MODELO, escogemos el
factorial completo.
Seleccionamos
como
variable
dependiente el Rendimiento global del
alumno, y como factores fijos o variables
independientes el Grupo y el Nivel Social
Familiar
Como en el caso del Anlisis de Varianza Simple, este es el momento de pedir (si se
quieren) los contrastes posteriores, para lo que accedemos de nuevo a Post Hoc...
En esta ventana hay que especificar
para
cual/es
de
las
variables
independientes o factores se quieren los
contrastes posteriores.
La hiptesis nula (Ho) que vamos a contrastar queda pues formulada en los
trminos siguientes: No existen diferencias estadsticamente significativas en el
Rendimiento Global obtenido por los alumnos en funcin del efecto conjunto de las
variables Grupo de clase al que pertenecen y Nivel Social de la Familia.
Interpretacin de resultados
La primera tabla que aparece en la salida nos muestra un resumen de los
casos incluidos en el estudio
Factores inter-sujetos
Grupo
Nivel
social
familiar
1
2
3
4
1
2
3
4
Etiqueta
del valor
Grupo A
Grupo B
Grupo C
Grupo D
Bajo
Medio-Baj
o
Medio
Medio-Alt
o
N
25
25
25
25
14
33
26
17
5
Alto
10
A continuacin aparece la tabla del anlisis de varianza factorial. Como puede
verse, ha resultado ser no significativo, es decir que la interaccin entre el Grupo y el
Nivel Social Familiar no influyen sobre el Rendimiento Global de los alumnos. La
probabilidad asociada al estadstico F para la interaccin de las dos variables es de
0,465, valor mayor que , por lo que acepto H0
Pruebas de los efectos inter-sujetos
Variable dependiente: Rendimiento global
Fuente
Modelo corregido
Interseccin
GRUPO
NIVSOC
GRUPO * NIVSOC
Error
Total
Total corregida
Suma de
cuadrados
tipo III
90.610a
2352.540
47.545
1.497
10.452
70.300
3240.050
160.910
gl
19
1
3
4
12
80
100
99
Media
cuadrtica
4.769
2352.540
15.848
.374
.871
.879
F
5.427
2677.144
18.035
.426
.991
Significacin
.000
.000
.000
.789
.465
a. R cuadrado = .563 (R cuadrado corregida = .459)
La tabla proporciona tambin un ANOVA simple para cada una de las variables
independientes por separado. El estadstico F para el factor Grupo tiene una
probabilidad asociada de 0,000, a un nivel de significacin de 0,05, resulta
significativo.
Por el contrario, el valor de la probabilidad asociada a F para la variable Nivel social es
de 0,789 resultando no significativa para un valor de de 0,05.
Contrastes Posteriores
En las tablas siguientes pueden hacerse los contrastes posteriores, del mismo modo
que se hacan en el caso de ANOVA simple
Comparaciones mltiples
Variable dependiente: Rendimiento global
Scheffe
(I) Grupo
Grupo A
Grupo B
Grupo C
Grupo D
(J) Grupo
Grupo B
Grupo C
Grupo D
Grupo A
Grupo C
Grupo D
Grupo A
Grupo B
Grupo D
Grupo A
Grupo B
Grupo C
Diferencia
entre
medias (I-J)
-.3200
1.1080*
-1.3840*
.3200
1.4280*
-1.0640*
-1.1080*
-1.4280*
-2.4920*
1.3840*
1.0640*
2.4920*
Error tp.
.2651
.2651
.2651
.2651
.2651
.2651
.2651
.2651
.2651
.2651
.2651
.2651
Significacin
.693
.001
.000
.693
.000
.002
.001
.000
.000
.000
.002
.000
Basado en las medias observadas.
*. La diferencia de medias es significativa al nivel .05.
Intervalo de confianza al
95%.
Lmite
Lmite inferior
superior
-1.0772
.4372
.3508
1.8652
-2.1412
-.6268
-.4372
1.0772
.6708
2.1852
-1.8212
-.3068
-1.8652
-.3508
-2.1852
-.6708
-3.2492
-1.7348
.6268
2.1412
.3068
1.8212
1.7348
3.2492
Comparaciones mltiples
Variable dependiente: Rendimiento global
Scheffe
(I) Nivel social familiar
Bajo
Medio-Bajo
Medio
Medio-Alto
Alto
(J) Nivel social familiar
Medio-Bajo
Medio
Medio-Alto
Alto
Bajo
Medio
Medio-Alto
Alto
Bajo
Medio-Bajo
Medio-Alto
Alto
Bajo
Medio-Bajo
Medio
Alto
Bajo
Medio-Bajo
Medio
Medio-Alto
Basado en las medias observadas.
Diferencia
entre
medias (I-J)
-.1058
-.1863
-.1433
-.1986
.1058
-8.0420E-02
-3.7433E-02
-9.2727E-02
.1863
8.042E-02
4.299E-02
-1.2308E-02
.1433
3.743E-02
-4.2986E-02
-5.5294E-02
.1986
9.273E-02
1.231E-02
5.529E-02
Error tp.
.2990
.3108
.3383
.3881
.2990
.2458
.2799
.3384
.3108
.2458
.2924
.3488
.3383
.2799
.2924
.3736
.3881
.3384
.3488
.3736
Significacin
.998
.985
.996
.992
.998
.999
1.000
.999
.985
.999
1.000
1.000
.996
1.000
1.000
1.000
.992
.999
1.000
1.000
Intervalo de confianza al
95%.
Lmite
Lmite inferior
superior
-1.0487
.8370
-1.1662
.7936
-1.2101
.9236
-1.4225
1.0253
-.8370
1.0487
-.8556
.6947
-.9199
.8451
-1.1598
.9743
-.7936
1.1662
-.6947
.8556
-.8790
.9650
-1.1122
1.0876
-.9236
1.2101
-.8451
.9199
-.9650
.8790
-1.2333
1.1227
-1.0253
1.4225
-.9743
1.1598
-1.0876
1.1122
-1.1227
1.2333
3.- ANLISIS DE COVARIANZA
El anlisis de covarianza (ANCOVA) es una combinacin de las tcnicas de
regresin y anlisis de varianza, que se utiliza para comprobar la existencia de
diferencias estadsticamente significativas entre una variable independiente (ms de dos
grupos o categoras) y otra dependiente (nivel de medicin intervalo o razn), eliminando
la interaccin de una variable extraa que controlamos a travs de ste mtodo,
introducindola en el anlisis como COVARIABLE.
La suposicin especfica del ANCOVA es que la variable concomitante (covariable)
no debe ser afectada por los tratamientos, es decir, que los tratamientos aplicados a las
unidades experimentales para poder observar sus efectos en la variable Y no deberan
influir en los valores esperados de X.
Accedemos al anlisis de covarianza a travs del men Analizar Modelo Lineal
General Univariante.
Por lo tanto, la H0 queda formulada de la forma siguiente: No existen diferencias
estadsticamente significativas en el Rendimiento Global de los alumnos en funcin del
Grupo de clase al que pertenezcan, controlando la influencia del Nivel Social de la familia.
En este caso vamos a coger como
variable dependiente el Rendimiento
Global, como independiente o factor fijo
el Grupo de clase, y se va a controlar el
efecto de la variable Nivel Social de la
familia.
Interpretacin de resultados
De la tabla podemos deducir una serie de conclusiones (tantas como pruebas de
significatividad realizadas) que se presentan a continuacin:
1. Modelo corregido Se pone a prueba la existencia de diferencias estadsticamente
significativas en el Rendimiento Global obtenido por los alumnos en funcin del Grupo
al que pertenecen, controlando el efecto que pueda ejercer el Nivel Social Familiar. La
probabilidad asociada al estadstico F calculado es de 0,000 al ser un valor menor
que (0,05), rechazamos H0 y afirmamos que existen diferencias en el
Rendimiento Global obtenido por los alumnos en funcin del Grupo al que
pertenecen, controlando el efecto que pueda ejercer el Nivel Social Familiar
2. Interseccin En este caso se pretende comprobar la existencia de diferencias
estadsticamente significativas en el Rendimiento Global de los alumnos, provocadas
por la accin conjunta de las variables Grupo de Clase y Nivel Social Familiar. En este
caso, la probabilidad asociada a F es tambin de 0,000, y al ser menor que (0,05),
se rechaza H0, por lo que se confirma la existencia de diferencias
estadsticamente significativas en el Rendimiento Global de los alumnos,
provocadas por la accin conjunta de las variables Grupo de Clase y Nivel
Social Familiar
Pruebas de los efectos inter-sujetos
Variable dependiente: Rendimiento global
Fuente
Modelo corregido
Interseccin
NIVSOC
GRUPO
Error
Total
Total corregida
Suma de
cuadrados
tipo III
79,255a
445,926
,337
79,000
81,655
3240,050
160,910
gl
4
1
1
3
95
100
99
Media
cuadrtica
19,814
445,926
,337
26,333
,860
F
23,052
518,803
,392
30,637
Significacin
,000
,000
,533
,000
123
4
a. R cuadrado = ,493 (R cuadrado corregida = ,471)
3. Por ltimo se hace un ANOVA con cada una de las variables independientes
utilizadas. En el primer caso (para la Variable Nivel Social Familiar) se acepta la H0 al
ser la probabilidad asociada a F mayor que (0,05) (para Nivel Social Familiar la
probabilidad asociada a F es de 0,533), por lo que no hay diferencias
estadsticamente significativas en el Rendimiento Global de los alumnos en
funcin del Nivel Social Familiar.
4. En el segundo caso se rechaza la H0 al ser la probabilidad asociada a F menor que
(0,05) (para Grupo de Clase la probabilidad asociada a F es de 0,000), por lo que
hay diferencias estadsticamente significativas en el Rendimiento Global de los
alumnos en funcin del Grupo de clase al que pertenecen.
CORRELACIN
La correlacin es una medida de la relacin entre dos variables. Su valor oscila
entre 1 y +1 pasando por 0. Los coeficientes de correlacin indican dos cosas; primero
indican la cuanta de la relacin, para lo que se tiene en cuenta el valor absoluto del
coeficiente, y que se interpreta segn la siguiente tabla:
Menor de |0,30|
Correlacin baja
Entre |0,30| y |0,50| Correlacin moderada
Entre |0,50| y |0,70| Correlacin alta
Mayor de |0,70|
Correlacin muy alta
En segundo lugar, el signo del coeficiente de correlacin indica el sentido de la
relacin. Si el signo es positivo (+), al aumentar una variable tambin lo hace la otra, y si
es negativo (-) las variables se relacionan inversamente, al aumentar una de ellas
disminuye la otra.
COEFICIENTES DE CORRELACIN
-
Pearson El coeficiente de correlacin de Pearson se utiliza cuando las variables
del anlisis estn medidas en nivel de intervalo o razn. En ambos casos la
interpretacin se hace igual.
Spearman Utilizaremos el coeficiente de correlacin de Spearman cuando las
variables a relacionar estn medidas en nivel nominal u ordinal.
LAS CORRELACIONES EN SPSS
El programa SPSS, a travs del MenAnalizar, nos ofrece la opcin
Correlaciones, elegimos la opcin Bivariadas (porque queremos correlacionar dos
variables).
Una vez dentro de la pantalla, el programa nos pide las variables que queremos
correlacionar, el coeficiente de correlacin que queremos calcular, y la prueba de
significacin (bilateral o unilateral) con la queremos trabajar.
1.- CORRELACIN ENTRE VARIABLES MEDIDAS EN NIVEL NOMINAL U ORDINAL. COEFICIENTE DE
SPEARMAN
Vamos a calcular si existe correlacin entre las variables Nivel Educativo y Nivel
Profesional del Padre, y Nivel Educativo y Nivel Profesional de la Madre y su cuanta en
caso de haberla.
Una opcin muy til es la que
nos pregunta si queremos que
en los resultados aparezcan
marcadas las correlaciones
significativas
(tanto
al
1%
como al 5%). (Se recomienda
marcar la opcin () para
facilitar la interpretacin de
Interpretacin de resultados
Una vez que tenemos las variables que queremos correlacionar, aceptamos y en
el visor de resultados aparecer una matriz en la que aparecen de nuevo los siguientes
datos:
-
Coeficiente de correlacin Valor del coeficiente, que se interpreta segn la
tabla que aparece al principio de la prctica.
Significatividad (Sig.) Es lo primero que hay que mirar, indica si la correlacin
es significativa, si el valor es menor que nuestro , entonces la correlacin es
significativa (no se debe al azar). Mediante la opcin Marcar las
correlaciones significativas, el programa seala con un asterisco (*) o dos
(**) las correlaciones que son significativas al 0,05 o al 0,01, indicando a pie de
tabla la clave de interpretacin.
N Nmero de sujetos que intervienen en el anlisis
Correlaciones
Estudios
del padre
Rho de Spearman
Estudios del padre
Profesin del padre
Estudios de la madre
Profesin de la madre
Coeficiente de
correlacin
Sig. (bilateral)
N
Coeficiente de
correlacin
Sig. (bilateral)
N
Coeficiente de
correlacin
Sig. (bilateral)
N
Coeficiente de
correlacin
Sig. (bilateral)
N
**. La correlacin es significativa al nivel 0,01 (bilateral).
Estudios de
la madre
Profesin
de la madre
-.570**
.039
-.060
.
100
.000
100
.700
100
.550
100
-.570**
1.000
Profesin
del padre
1.000
.025
-.043
.000
100
.
100
.803
100
.672
100
.039
.025
1.000
-.292**
.700
100
.803
100
.
100
.003
100
-.060
-.043
-.292**
1.000
.550
100
.672
100
.003
100
.
100
Vemos en este caso que existe correlacin significativa entre los Estudios del Padre y su
profesin, as como entre los estudios que ha realizado la madre y su profesin. Las
correlaciones son moderada en el primer caso y baja en el segundo.
En ambos casos la correlacin es negativa, es decir, que la relacin entre las variables es
inversa. Esto quiere decir que a medida que aumenta el valor de una variable disminuye
el de la otra. Para interpretar esto, slo hay que tener en cuenta cmo se han
categorizado las variables, vemos que se ha hecho de la siguiente forma:
NIVEL DE ESTUDIOS DEL PADRE/MADRE
NIVEL PROFESIONAL
DEL
PADRE/MADRE
1 Sin estudios
1 Directivo de empresa
2 Primarios
2 Profesiones liberales
3 Secundarios
3 Profesional ligado a la enseanza
4 Bachiller
4 Tcnicos medios
5 Univ. Medios
5 Auxiliares
6 Univ. Superiores
6 De servicio
7 Otros
7 Tareas domsticas
8 En paro
9 Otros
Como puede verse, en el caso de Nivel de estudios, la categora 1 es lo ms bajo y la
categora 6 lo ms alto. En el caso del Nivel profesional es al contrario, la categora 1 es
el nivel superior y la 8 el inferior, con lo que tiene sentido decir que a medida que
aumenta el valor de la variable Nivel de estudios, disminuye el valor de la variable Nivel
profesional
2.- CORRELACIN ENTRE VARIABLES MEDIDAS EN NIVEL DE INTERVALO
RAZN.
COEFICIENTE DE PEARSON
En este caso vamos a comprobar si existe correlacin entre los Rendimientos de los
alumnos en todas las materias incluidas en el fichero de los datos entre si y con el
Rendimiento global
La ventana es la misma que en el
caso anterior, nicamente hay que
seleccionar la opcin del coeficiente
de Pearson y eliminar la marca del
coeficiente de Spearman
Interpretacin de resultados
Una vez que tenemos las variables que queremos correlacionar, aceptamos y en
el visor de resultados aparecer de nuevo una matriz en la que aparecen de nuevo los
siguientes datos:
-
Coeficiente de correlacin Valor del coeficiente, que se interpreta segn la
tabla que aparece al principio de la prctica.
Significatividad (Sig.) Es lo primero que hay que mirar, indica si la correlacin
es significativa, si el valor es menor que nuestro , entonces la correlacin es
significativa (no se debe al azar). Mediante la opcin Marcar las
correlaciones significativas, el programa seala con un asterisco (*) o dos
(**) las correlaciones que son significativas al 0,05 o al 0,01, indicando a pie de
tabla la clave de interpretacin.
N Nmero de sujetos que intervienen en el anlisis
En la matriz se presentan las correlaciones entre las variables, vemos que se
trata de una matriz simtrica, en la que las diagonales son 1, el valor de la
Correlaciones
Rendimiento
en historia
Rendimiento
en historia
Rendimiento
en filosofa
Rendimiento
en idioma
Rendimiento en
matemticas
Rendimiento
en dibujo
Rendimiento
global
Correlacin
de Pearson
Sig. (bilateral)
N
Correlacin
de Pearson
Sig. (bilateral)
N
Correlacin
de Pearson
Sig. (bilateral)
N
Correlacin
de Pearson
Sig. (bilateral)
N
Correlacin
de Pearson
Sig. (bilateral)
N
Correlacin
de Pearson
Sig. (bilateral)
N
Rendimiento
en filosofa
1.000
Rendimient
o en idioma
Rendimiento
en
matemticas
Rendimiento
en dibujo
Rendimiento
global
.576**
.010
.239*
.205*
.714**
.
100
.000
100
.922
100
.017
100
.041
100
.000
100
.576**
1.000
.033
.267**
.253*
.752**
.000
100
.
100
.743
100
.007
100
.011
100
.000
100
.010
.033
1.000
-.225*
.044
.288**
.922
.743
.025
.660
.004
100
100
100
100
100
100
.239*
.267**
-.225*
.328**
.530**
.017
100
.007
100
.025
100
.
100
.001
100
.000
100
.205*
.253*
.044
.328**
1.000
.041
100
.011
100
.660
100
.001
100
.714**
.752**
.288**
.000
100
.000
100
.004
100
1.000
.623**
.
100
.000
100
.530**
.623**
1.000
.000
100
.000
100
.
100
**. La correlacin es significativa al nivel 0,01 (bilateral).
*. La correlacin es significante al nivel 0,05 (bilateral).
correlacin de cada variable consigo misma.
En esta tabla podemos ver que existe correlacin (y muy alta en algunos
casos) entre el Rendimiento global de los alumnos y el rendimiento en cada
una de las asignaturas, as como
varias asignaturas.
correlaciones entre los rendimientos de
REGRESIN
Anteriormente hemos visto los coeficientes de correlacin, que indican el grado
o la cuanta en que varan conjuntamente dos mediciones o variables. El conocimiento
de la relacin entre variables es algo ms que un fin en si mismo; en algunas
ocasiones se quiere aprovechar el conocimiento de una relacin entre variables como
punto de partida para realizar un pronstico o prediccin. Es decir, al conocer la
variable X y su relacin con la variable Y, se tratara de averiguar en qu forma se
pueden considerar los valores particulares de la variable X y predecir a partir de ellos
los valores que corresponden en Y. El Anlisis de Regresin es la tcnica que
utilizamos para ello.
La regresin lineal estima los coeficientes de la ecuacin lineal, con una
(regresin simple) o ms (regresin mltiple) variables independientes, que mejor
prediga el valor de la variable dependiente. Tanto la variable dependiente como la/s
independiente/s deben ser continuas (en caso contrario se utilizara Anlisis de
Varianza). Por ejemplo, se puede intentar predecir el rendimiento de un alumno
(variable dependiente) a partir de su nivel de motivacin, edad, o capacidad de
concentracin (variables independientes).
1.- REGRESIN SIMPLE
El anlisis de regresin simple se encuentra en el men Analizar Regresin Lineal
El mtodo que vamos a
utilizar es el de pasos
sucesivos
En este caso, vamos a estimar el Rendimiento en Matemticas de los sujetos
(variable predicha - dependiente) a partir de su Motivacin (variable predictora independiente).
INTERPRETACIN DE RESULTADOS
De entre los diferentes criterios existentes para calcular la recta de regresin,
se va a utilizar el de los MNIMOS CUADRADOS debido a sus excelentes propiedades
estadsticas.
a
Variables introducidas/eliminadas
Modelo
1
Variables
introducidas
Variables
eliminadas
Motivacin
despus del
programa
Esta
Mtodo
Por
pasos
(criterio:
Prob. de
F para
entrar <=
,050,
Prob. de
F para
salir >=
,100).
tabla nos presenta las
variables que han sido incluidas
en el modelo, y el orden de
inclusin de las mismas (como es
regresin simple, solo se incluye
una variable)
a. Variable dependiente: Rendimiento en matemticas
El COEFICIENTE DE DETERMINACIN (R Cuadrado) se utiliza para valorar la
calidad del ajuste obtenido, y se obtiene elevando al cuadrado el coeficiente de
correlacin (R). Para interpretar se utiliza R CUADRADO CORREGIDA. Cuanto mayor
sea el valor del COEFICIENTE DE DETERMINACIN, mayor ser el porcentaje de
cambios explicados por esta variable. En la tabla vemos que el valor del coeficiente de
determinacin obtenido es de ,138, lo que implica que el 13% de los cambios que se
dan en la Rendimiento en Matemticas se debe a la Motivacin de los alumnos.
Queda sin explicar el 87% de los cambios (100-13).
Resumen del modelo
Modelo
1
R
,372a
R cuadrado
,138
R cuadrado
corregida
,129
Error tp. de la
estimacin
1,83
a. Variables predictoras: (Constante), Motivacin despus del
programa
El ERROR TPICO DE LA ESTIMACIN es el error que se comete en toda
prediccin, y su valor oscila entre 0 y S Y . Si el coeficiente de correlacin (R) entre las
variables es grande, el error tpico de la estimacin ser pequeo y viceversa.
A continuacin aparece la tabla del Anlisis de Varianza, en la que se valora la
importancia de la parte de la variable dependiente (Rendimiento en Matemticas)
explicada por la variable independiente (Motivacin). Con este anlisis obtendremos la
probabilidad de que la parte explicada haya podido serlo por azar.
En la columna de la derecha aparece el valor de la significatividad, que nos
indica la probabilidad de que la suma de distancias explicada mediante la regresin
haya sido obtenida por el azar (estamos utilizando el mtodo de los mnimos
cuadrados).
ANOVAb
Modelo
1
Regresin
Residual
Total
Suma de
cuadrados
52,352
326,648
379,000
gl
1
98
99
Media
cuadrtica
52,352
3,333
F
15,707
Sig.
,000a
a. Variables predictoras: (Constante), Motivacin despus del programa
b. Variable dependiente: Rendimiento en matemticas
En este caso, se ha obtenido una significatividad de 0,000, menor que (0,05),
por lo que puede afirmarse que las diferencias no se deben al azar.
Coeficientesa
Modelo
1
(Constante)
Motivacin despus
del programa
Coeficientes no
estandarizados
B
Error tp.
3,687
,540
3,237E-02
,008
Coeficient
es
estandari
zados
Beta
,372
t
6,832
Sig.
,000
3,963
,000
a. Variable dependiente: Rendimiento en matemticas
En la tabla de los coeficientes aparece lo siguiente: en la columna B aparecen
los valores a (3,687) y b (0,0032) de la recta de regresin, que puede escribirse de la
forma siguiente:
Y (Rendimiento en Matemticas) = 3,687+ 0,0032* Motivacin
El valor de la constante a representa el valor que se asigna a la variable
dependiente (Rendimiento en Matemticas) en el caso en que la variable
independiente (Motivacin) fuera 0. El valor de b por su parte, representa el
incremento de la variable dependiente cuando la variable independiente aumenta en
una unidad.
Desde el punto de vista grfico, b representa la pendiente de la recta de
regresin, mientras que a indica el punto de corte de la recta de regresin con el eje
de ordenadas Y.
Coeficientes Beta En ocasiones, sobre todo cuando las variables con las que
trabajamos estn medidas en escalas muy diferentes, puede resultar interesante
trabajar con las puntuaciones estandarizadas en vez de hacerlo con las directas. De
esta forma podremos comparar los resultados obtenidos con variables medidas en
diferentes escalas. Los coeficientes de la recta de regresin obtenidos para las
puntuaciones estandarizadas son los coeficientes BETA (atencin, no confundir con
los coeficientes , que representan a los parmetros poblacionales).
Su interpretacin es la siguiente: el incremento de la variable dependiente (en
puntuaciones tpicas) al aumentar en una unidad la puntuacin tpica de la variable
independiente. O, dicho de otra forma, el nmero de desviaciones tpicas en que se
incrementar el valor de la variable dependiente al incrementarse en una desviacin
tpica la variable independiente. Adems, en el caso de la regresin simple, el
coeficiente BETA coincide con el coeficiente de correlacin.
Cmo realizar la prediccin
Cuando queremos conocer la puntuacin de un sujeto en la variable Y (criterio)
a partir de su puntuacin en la variable X (predictor), se calcula la recta de regresin a
partir de los datos o puntuaciones obtenidas por el grupo normativo, y a partir de esa
recta de regresin, se calcula la puntuacin Y de ese sujeto y se le suma y resta el
error tpico de estimacin dando lugar a un intervalo:
Lmite superior Y + Sxy
Y + - Sxy
Lmite inferior
Y - Sxy
2.- REGRESIN MLTIPLE
La regresin mltiple es la generalizacin de la regresin simple para el caso
en que contemos con ms de una variable explicativa (o independiente). Accedemos,
igual que en el caso de la regresin simple, al men Analizar Regresin Lineal.
Seleccionamos, como en el caso
de Regresin Simple, el mtodo
de Pasos Sucesivos
En este caso se va a predecir el Rendimiento Global de los alumnos (variable
dependiente), a partir de su Motivacin despus del programa (variable independiente
1) y de su Inteligencia general (variable independiente 2).
INTERPRETACIN DE RESULTADOS
a
Variables introducidas/eliminadas
Modelo
1
Variables
introducidas
Inteligencia
general
Variables
eliminadas
Motivacin
despus del
programa
Mtodo
Por
pasos
(criterio:
Prob. de
F para
entrar <=
,050,
Prob. de
F para
salir >=
,100).
Por
pasos
(criterio:
Prob. de
F para
entrar <=
,050,
Prob. de
F para
salir >=
,100).
a. Variable dependiente: Rendimiento global
En esta primera tabla se presentan las
variables que han sido incluidas en el
modelo, y el orden de inclusin de las
mismas
Tenemos dos modelos, el primero (1) con
la
variable
independiente
Inteligencia
General y el segundo (2) con las variables
independientes
Inteligencia
General
Motivacin Despus del Programa.
Aunque habamos seleccionado en primer
lugar la Motivacin Despus del Programa,
en
el
anlisis
ha
entrado
antes
la
Inteligencia General porque explica mayor
porcentaje de los cambios en la variable
Recordar que hemos elegido el mtodo de Pasos Sucesivos que, frente al de
Introducir (que introduce todas las variables independientes a la vez), va
introducindolas una por una.
Resumen del modelo
Modelo
1
2
R
,698a
,745b
R cuadrado
corregida
,482
,546
R cuadrado
,487
,555
Error tp. de la
estimacin
,9175
,8592
a. Variables predictoras: (Constante), Inteligencia general
b. Variables predictoras: (Constante), Inteligencia general,
Motivacin despus del programa
Al utilizar el mtodo de Pasos Sucesivos podemos ver el valor de los
coeficientes para cada modelo. La primera variable independiente que se incluye es la
que tiene una mayor relacin con la variable dependiente (en este caso la Inteligencia
General de los alumnos), y ella sola explica el 48,2% (R cuadrado corregida = 0,482)
de los cambios de la variable Rendimiento Global.
En el segundo modelo, al incluir la segunda variable independiente en la
ecuacin (Motivacin Despus), el porcentaje de varianza explicada aumenta a 54,6%
(R cuadrado corregida = 0,546), al igual que lo hace el coeficiente de correlacin
mltiple R (pasa de 0,698 a 0,745). En este segundo modelo disminuye tambin el
error de estimacin (de 0,9175 a 0,8592)
ANOVAc
Modelo
1
Regresin
Residual
Total
Regresin
Residual
Total
Suma de
cuadrados
78,405
82,505
160,910
89,306
71,604
160,910
gl
1
98
99
2
97
99
Media
cuadrtica
78,405
,842
44,653
,738
F
93,130
Sig.
,000a
60,490
,000b
a. Variables predictoras: (Constante), Inteligencia general
b. Variables predictoras: (Constante), Inteligencia general, Motivacin despus del
programa
c. Variable dependiente: Rendimiento global
En la tabla del Anlisis de Varianza tenemos de nuevo la informacin para los
dos modelos, la interpretacin se hace igual que en el caso de regresin simple.
Vemos que los dos modelos son significativos, es decir, que la parte explicada no se
debe al azar (,000 < )
En la tabla siguiente se presentan los coeficientes de regresin de cada
modelo, en el que solo se incluye la variable Inteligencia General como independiente
(modelo 1), y en el que se incluyen las dos: Inteligencia General y Motivacin
Despus (modelo 2).
Coeficientesa
Modelo
1
2
(Constante)
Inteligencia general
(Constante)
Inteligencia general
Motivacin despus
del programa
Coeficientes no
estandarizados
B
Error tp.
-23,365
2,998
,335
,035
-19,856
2,952
,283
,035
1,601E-02
Coeficient
es
estandari
zados
Beta
,004
,589
t
-7,795
9,650
-6,727
8,028
Sig.
,000
,000
,000
,000
,282
3,843
,000
,698
a. Variable dependiente: Rendimiento global
Las ecuaciones son:
Y ([Link]) = - 23,365 + 0,335 * Inteligencia General
Y ([Link]) = - 19,8 + ,283 * Inteligencia General + 0,001 * Motivacin D
La interpretacin de los coeficientes BETA es la misma que en caso de la regresin simple
En la ltima tabla aparecen las variables que han quedado excluidas del
anlisis. La exclusin no tiene que deberse forzosamente a que la variable no sea
importante a la hora de explicar los cambios de la variable dependiente, simplemente
querr decir que su aportacin a la explicacin de los cambios de la variable
dependiente ya est explicada por otras variables incluidas, y que su inclusin puede
resultar redundante. En este caso se ha excluido finalmente la Motivacin Despus del
Programa porque como puede verse en la tabla-resumen del modelo, su contribucin
al Rendimiento Global es muy pequea.
Variables excluidasb
Modelo
1
Beta dentro
Motivacin despus
del programa
t
a
,282
3,843
Sig.
,000
a. Variables predictoras en el modelo: (Constante), Inteligencia general
b. Variable dependiente: Rendimiento global
Correlacin
parcial
,363
Estadstic
os de
colinealid
ad
Tolerancia
,851
ANLISIS FACTORIAL
El anlisis factorial es una tcnica estadstica multivariada cuya finalidad
consiste en obtener un nmero reducido de variables abstractas, que estn
compuestas por distintas cargas o saturaciones sobre variables empricas, en funcin
de la estructura de los datos obtenidos al realizar el proceso de medida de dichas
variables empricas. Como el nmero de factores que se obtienen al realizar un
anlisis factorial es menor que el nmero de variables de las que partimos y contienen
la misma informacin, cada factor explica una conducta ms compleja que la explicada
por las variables empricas.
Para realizar un Anlisis Factorial con SPSS, elegiremos en el men- analizar,
la opcin Reduccin de datos- Anlisis Factorial
En esta ventana, el programa pide las
variables que queremos introducir para
realizar el anlisis, en nuestro caso
vamos a introducir todas las variables del
fichero para tratar de obtener un nmero
de
factores
variables
que
inferior
al
tenemos
nmero
y
que
A travs de esta pantalla podemos introducir una serie de especificaciones como el
mtodo de rotacin y extraccin de los factores
En
la
opcin
ROTACIN
de
mtodo
los
de
factores,
aparecen varios mtodos, de
entre
Respecto a la EXTRACCIN
de los factores, el mtodo de
Componentes Principales es
el que vamos a utilizar.
los
que
elegiremos
el
de
nos
La opcin DESCRIPTIVOS nos permite especificar al programa si
queremos que en la salida aparezcan la solucin inicial y estadsticos univariados,
as como lo que queremos que aparezca en la matriz de correlaciones
(coeficientes, niveles de significacin, matriz inversa, reproducida o anti-imagen,
determinante y la prueba de Barlett) para elegir cualquiera de ellos, basta con
seleccionarlos ().
La opcin PUNTUACIONES, nos permite obtener las puntuaciones factoriales de
los sujetos, para ello, seleccionamos la opcin y elegimos el mtodo de Barlett. Las
puntuaciones factoriales de cada sujeto en cada factor aparecern al final del
fichero de datos como nuevas variables con el nombre factndel factor_ n de
anlisis.
Interpretacin de resultados
Comunalidades
Edad
Sexo
Grupo
Rendimiento global
Rendimiento en historia
Rendimiento en filosofa
Rendimiento en idioma
Rendimiento en
matemticas
Rendimiento en dibujo
Estudios del padre
Profesin del padre
Estudios de la madre
Profesin de la madre
Nivel social familiar
Situacin laboral del
alumno
Interes profesional del
alumno
Capacidad de
concentracin antes
Capacidad de
concetracin despues
Motivacin antes del
programa
Motivacin despus del
programa
Inicial
1.000
1.000
1.000
1.000
1.000
1.000
1.000
Extraccin
.486
.503
.765
.961
.634
.687
.783
1.000
.582
1.000
1.000
1.000
1.000
1.000
1.000
.536
.646
.785
.636
.607
.728
1.000
.664
1.000
.687
1.000
.859
1.000
.881
1.000
.718
1.000
.805
Mtodo de extraccin: Anlisis de Componentes principales.
La tabla de comunalidades nos
indica cmo est representada cada
una de las variables en la solucin
factorial (utilizamos el criterio > 0,60
para establecer que las variables
estn bien representadas en la
solucin factorial)
La tabla de Varianza total explicada nos informa del nmero total de factores
(componentes) extrados, as como de la varianza explicada por cada factor en la
solucin factorial, tanto antes como despus de la rotacin. En esta tabla podemos ver
cules son los factores significativos, que sern aquellos cuya varianza explicada
Varianza total explicada
Componente
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
Autovalores iniciales
% de la
Total
varianza
% acumulado
4.096
20.482
20.482
2.371
11.853
32.335
2.025
10.123
42.458
1.666
8.329
50.787
1.442
7.212
57.998
1.264
6.321
64.320
1.085
5.425
69.745
.999
4.996
74.740
.858
4.290
79.030
.734
3.671
82.701
.674
3.368
86.069
.583
2.915
88.983
.565
2.824
91.807
.487
2.436
94.244
.350
1.750
95.993
.312
1.562
97.555
.255
1.277
98.832
.176
.878
99.710
5.787E-02
.289
100.000
3.180E-05 1.590E-04
100.000
Sumas de las saturaciones al cuadrado
de la extraccin
% de la
Total
varianza
% acumulado
4.096
20.482
20.482
2.371
11.853
32.335
2.025
10.123
42.458
1.666
8.329
50.787
1.442
7.212
57.998
1.264
6.321
64.320
1.085
5.425
69.745
Suma de las saturaciones al cuadrado
de la rotacin
% de la
Total
varianza
% acumulado
3.926
19.632
19.632
2.274
11.371
31.003
1.938
9.691
40.695
1.522
7.608
48.303
1.467
7.335
55.638
1.424
7.122
62.760
1.397
6.984
69.745
Mtodo de extraccin: Anlisis de Componentes principales.
sea mayor que 1.
Han
salido
siete
factores
significativos
que
explican
el
69,745%
(19,632+11,371+9,691+7,608+7,335+7,7122+6,984) de la varianza total. La varianza
total de la solucin factorial es igual al nmero de variables incluidas en el anlisis; en
nuestro caso, la varianza total es 20.
A continuacin aparece la tabla con las cargas factoriales de las variables,
primero sin rotar y despus rotadas (que es la que tenemos que interpretar). Los
pesos factoriales sern significativos a partir de 0,30.
a
Matriz de componentes rotados
Edad
Sexo
Grupo
Rendimiento global
Rendimiento en historia
Rendimiento en filosofa
Rendimiento en idioma
Rendimiento en
matemticas
Rendimiento en dibujo
Estudios del padre
Profesin del padre
Estudios de la madre
Profesin de la madre
Nivel social familiar
Situacin laboral del
alumno
Interes profesional del
alumno
Capacidad de
concentracin antes
Capacidad de
concetracin despues
Motivacin antes del
programa
Motivacin despus del
programa
1
3.784E-02
4.277E-02
.343
.917
.727
.816
6.141E-02
2
5.927E-02
-4.54E-02
-.127
6.126E-02
-.173
-3.40E-02
4.061E-02
3
-.241
.232
.245
-4.90E-02
.122
-2.92E-02
2.887E-02
Componente
4
.345
.652
-.298
-7.33E-03
-.112
-7.52E-02
3.964E-02
.500
.184
-7.57E-02
.540
-5.95E-02
8.774E-02
-2.09E-02
1.363E-02
7.748E-03
.188
.785
-.868
4.817E-02
-8.66E-04
.846
2.918E-02
5
.376
-8.01E-02
.680
-6.26E-02
.176
9.493E-02
8.593E-02
6
-.391
-7.49E-02
-4.58E-02
.293
9.478E-02
3.712E-02
.872
7
9.626E-02
-8.94E-02
.133
.158
9.488E-02
-5.66E-02
-8.57E-02
-5.88E-03
-.312
-.309
.315
-.197
-2.94E-02
-9.35E-02
1.552E-02
-2.01E-02
-4.69E-02
.146
-7.47E-02
-9.55E-03
.105
.356
-8.57E-02
-.267
-6.74E-02
2.598E-02
.118
.223
1.712E-03
.165
-2.92E-02
-1.79E-02
.119
3.830E-02
4.983E-02
.225
-.123
-.119
-.771
.654
-1.73E-02
-.121
-.120
.774
-3.93E-02
7.180E-02
.170
-.371
-1.89E-02
-.128
1.848E-02
.697
.191
-9.38E-02
-5.43E-02
4.100E-02
.898
9.690E-02
-.151
8.297E-02
-9.63E-02
-6.32E-03
-1.69E-02
.924
-1.98E-02
.157
3.656E-03
5.527E-02
.698
-.164
-3.01E-02
.224
-.122
-.312
-.202
.765
-.129
3.363E-03
.197
-.133
-.347
-.158
Mtodo
extraccin:
Anlisis
de componentes
principales.
Adepartir
de los
pesos
significativos
de las variables en los factores, iramos
Mtodo de rotacin: Normalizacin Varimax con Kaiser.
a. La
ha convergido
en 9 iteraciones.
dando
larotacin
naturaleza
al factor,
es decir, ponindole nombre. En este anlisis se ha
reducido la informacin de 20 variables a 7 factores
PUNTUACIONES FACTORIALES
En caso de haber solicitado al programa las puntuaciones de cada sujeto en
cada factor, al final del fichero de datos aparecern unas variables nuevas, con el
aspecto que se muestra a continuacin:
ANLISIS DE COVARIANZA
El anlisis de covarianza (ANCOVA) es una combinacin de las tcnicas
de regresin y anlisis de varianza, que se utiliza para comprobar la existencia
de diferencias estadsticamente significativas en la variable dependiente
atribuibles a la variable independiente (con dos ms grupos o categoras) y
otra dependiente (nivel de medicin intervalo o razn), eliminando la interaccin
de una variable extraa que controlamos a travs de ste mtodo,
introducindola en el anlisis como COVARIABLE.
La suposicin especfica del ANCOVA es que la variable concomitante
(covariable) no debe ser afectada por los tratamientos, es decir, que los
tratamientos aplicados a las unidades experimentales para poder observar sus
efectos en la variable Y no deberan influir en los valores esperados de X.
Accedemos al anlisis de covarianza a travs del men Analizar
Modelo Lineal General Univariante.
La H0 queda formulada de la forma siguiente: No existen diferencias
estadsticamente significativas en el Rendimiento Global de los alumnos en funcin del
Grupo de clase al que pertenezcan, controlando la influencia del Nivel Social de la familia.
En este caso vamos a coger como
variable dependiente el Rendimiento
Global, como independiente o factor fijo
el Grupo de clase, y se va a controlar el
efecto de la variable Nivel Social de la
familia.
Interpretacin de resultados
De la tabla podemos deducir una serie de conclusiones (tantas como pruebas de
significatividad realizadas) que se presentan a continuacin:
5. Modelo corregido Se pone a prueba la existencia de diferencias estadsticamente
significativas en el Rendimiento Global obtenido por los alumnos en funcin del
Grupo al que pertenecen, controlando el efecto que pueda ejercer el Nivel Social
Familiar. La probabilidad asociada al estadstico F calculado es de 0,000 al ser un
valor menor que (0,05), rechazamos H0 y afirmamos que existen
6.
diferencias en el Rendimiento Global obtenido por los alumnos en funcin
del Grupo al que pertenecen, controlando el efecto que pueda ejercer el Nivel
Social Familiar
7. Interseccin En este caso se pretende comprobar la existencia de diferencias
estadsticamente significativas en el Rendimiento Global de los alumnos,
provocadas por la accin conjunta de las variables Grupo de Clase y Nivel Social
Familiar. En este caso, la probabilidad asociada a F es tambin de 0,000, y al ser
menor que (0,05), se rechaza H0, por lo que se confirma la existencia de
diferencias estadsticamente significativas en el Rendimiento Global de los
alumnos, provocadas por la accin conjunta de las variables Grupo de Clase
y Nivel Social Familiar
Pruebas de los efectos inter-sujetos
Variable dependiente: Rendimiento global
Fuente
Modelo corregido
Interseccin
NIVSOC
GRUPO
Error
Total
Total corregida
Suma de
cuadrados
tipo III
79,255a
445,926
,337
79,000
81,655
3240,050
160,910
gl
4
1
1
3
95
100
99
Media
cuadrtica
19,814
445,926
,337
26,333
,860
F
23,052
518,803
,392
30,637
Significacin
,000
,000
,533
,000
123
4
a. R cuadrado = ,493 (R cuadrado corregida = ,471)
8. Por ltimo se hace un ANOVA con cada una de las variables independientes
utilizadas. En el primer caso (para la Variable Nivel Social Familiar) se acepta la H0
al ser la probabilidad asociada a F mayor que (0,05) (para Nivel Social Familiar
la probabilidad asociada a F es de 0,533), por lo que no hay diferencias
estadsticamente significativas en el Rendimiento Global de los alumnos en
funcin del Nivel Social Familiar.
9. En el segundo caso se rechaza la H0 al ser la probabilidad asociada a F menor
que (0,05) (para Grupo de Clase la probabilidad asociada a F es de 0,000), por
lo que hay diferencias estadsticamente significativas en el Rendimiento
Global de los alumnos en funcin del Grupo de clase al que pertenecen.
ANLISIS DE TEMS: ITEMAN
ITEMAN es un programa diseado para realizar anlisis de tems, y
determinar la proporcin de sujetos que acierta cada tem, los que contribuyen
a la fiabilidad de un test, qu alternativas funcionan mejor y peor para un tem
dado, etc.
EL FICHERO DE DATOS
El programa ITEMAN funciona bajo MS-DOS, por lo que los datos deben
introducirse con formato ASCII (texto), por ejemplo desde el editor del DOS,
Word Pad o Bloc de Notas de Windows. El fichero de datos va a tener un
aspecto similar al siguiente:
Las cuatro primeras lneas del fichero de datos son fundamentales y debe
extremarse la atencin al escribirlas, que cualquier error en ellas (un espacio
de ms o de menos, un punto, etc.) puede hacer que el programa no se ejecute
o lo haga de forma incorrecta.
La primera lnea est formada por 10 columnas que indican lo siguiente:
Columnas 1 a 3 Nmero de tems de que consta el test (mximo
250 tems). En el ejemplo anterior, el test consta de 80 tems, observar
que la primera columna queda en blanco, hubiera sido igual poner 035,
pero siempre respetando las tres columnas.
Columna 4 Espacio en blanco.
Columna 5 Cdigo para las respuestas omitidas (en el Fichero del
ejemplo, el 9 es el valor que se asigna a los tems no contestados).
Columna 6 Espacio en blanco
Columna 7
Cdigo para los tems no alcanzados. Especialmente
importante cuando se trata de test de velocidad, es el valor que se asigna a
los tems que no han sido alcanzados por el alumno por falta de tiempo (en el
Fichero del ejemplo, el 8 es el valor que se asigna a estos tems, pero no
aparece ninguno porque no se trata de una prueba de velocidad).
Columna 8 Espacio en blanco
Columnas 9 y 10 Nmero de caracteres utilizados para identificar a
los sujetos. En el fichero de ejemplo se especifica un 3 porque se utilizan las
dos primeras para enumerar del 1 al 50 y una ms de separacin entre la
identificacin y los datos, total, 3 columnas.
En la segunda lnea se especifica la clave de correccin, la alternativa correcta
de cada tem. Debe haber tantos dgitos como tems.
En la tercera lnea se indica el nmero de alternativas que hay para cada uno
de los tems del test. En el fichero del ejemplo cada tem tiene 4 alternativas
En la cuarta lnea se especifican los tems que entran en el anlisis. Y significa
que el tem se analizar; N significa que no se analizar. Debe haber tantos Y/N
cono tems en el test. En el fichero de ejemplo se pide el anlisis de los 80 tems.
A partir de la quinta lnea se empiezan a escribir los datos.
GUARDAR LOS DATOS
Como ya hemos visto antes, los datos deben guardarse en un fichero de
texto; se recomienda hacerlo en el Word Pad de Windows, que asigna por defecto al
fichero la extensin .txt
Escribir el nombre del fichero, de u mximo de 8 caracteres (recordar que
ITEMAN trabaja bajo MS-DOS y no reconoce nombres largos). No poner ninguna
extensin al fichero, slo el nombre y la ubicacin (en disco de 3 1/2) y Aceptar
EJECUCIN DE ITEMAN
Acceder al programa Inicio - Programas - ITEMAN
Lo primero que pide el programa es el fichero de los datos. Se escribe el nombre
del fichero de datos (por ejemplo a:[Link]) y se pulsa INTRO
A continuacin, el programa pide que se especifique dnde se debe guardar la
salida (por ejemplo a:salida). Si no se pone extensin al fichero, por defecto el
programa le asigna la extensin .out. Pulsar
INTRO
ITEMAN pregunta si se desea crear un fichero con las puntuaciones de cada
sujeto (Do you want the scores written to a file?). Si se escribe Y (yes), el programa
pide la ubicacin de este archivo (por ejemplo a:puntua), si se escribe N (no) pasa a
la siguiente pregunta.
A la siguiente pregunta (Do you want a key exceptions file?) decimos siempre que
NO
ITEMAN pregunta si se quiere un fichero con los estadsticos (Do you wnat to write
statistics to a external file?). En este caso, diremos al programa que
NO,
pero si se
quieren, el programa pide que se le especifique el nombre (por ejemplo a:estadis)
Al pulsar
INTRO,
sale una pantalla en la que hay que especificar las opciones de
configuracin del anlisis. En nuestro caso vienen sealadas por defecto, as que
simplemente pulsamos Continuar (INTRO)
Una vez terminado el anlisis, aparece una barra roja que dice ***ITEM ANALYSIS
COMPLETE***. Para ver los resultados, puede pulsarse directamente F2 para
acceder al editor de ITEMAN o abrir el archivo desde el Word Pad
LOS RESULTADOS
EN la salida encontramos, en primer ligar, informacin referida al programa
(versin, ao, etc.). A continuacin los detalles especficos del anlisis:
********************
Data (Input)
Analysis Output
Score Output
Exceptions
Statistics Output
ANALYSIS SUMMARY INFORMATION
File:
File:
File:
File:
File:
Scale Definition Codes:
********************
A:\[Link]
A:\[Link]
NONE
NONE
NONE
DICHOT = Dichotomous
MPOINT = Multipoint/Survey
Se especifica dnde estaban almacenados los datos, dnde se ha grabado la salida
as como el resto de archivos que se hayan pedido.
Scale:
0
------Type of Scale
DICHOT
N of Items
80
N of Examinees
50
*****
CONFIGURATION INFORMATION
Type of Correlations:
Correction for Spuriousness:
Ability Grouping:
Subgroup Analysis:
Express Endorsements As:
Score Group Interval Width:
*****
Point-Biserial
NO
YES
NO
PROPORTIONS
Aqu se resume la configuracin que se especific en la pantalla
A partir de ahora, aparece el anlisis de cada tem. Se presenta slo un extracto de
la salida con el anlisis de dos de ellos.
La primera parte hace referencia a la
alternativa correcta de cada tem, y se da la
informacin siguiente:
Prop. Correct Parte
Proporcin
de sujetos que
1
eligen esa alternativa (al ser la correcta,
nos da la informacin sobre proporcin de
aciertos del tem). Nos indica el ndice de
dificultad del tem.
Disc. Index. Indice de discriminacin.
Correlacin entre el tem y el test. Indica el
grado en que el tem mide lo que mide el
test
Point. Biser. Indice de homogeniedad
del tem. Equivalente al ndice de
discriminacin
En la segunda parte de la salida, que hace
referencia al tem completo, se da la
informacin correspondiente a todas las
alternativas del tem.
Alt. Nmero de alternativa
[Link] Low. Proporcin del 27%
de los alumnos con peor puntuacin en el
test, que eligen esa alternativa
Parte 2
[Link] High. Proporcin del 27%
de los alumnos con mejor puntuacin en el
test, que eligen esa alternativa
Point Biser. Relacin existente entre cada
alternativa y el test completo
Atl. Alternativa que se ha sealado
como correcta en la clave de
correccin
Un signo de interrogacin (?), por ejemplo el que aparece en el tem 4, indica
que hay que revisar el tem, que se ha especificado la alternativa 3 como correcta en
la clave de correccin, pero est funcionando mejor la 2
A continuacin el programa proporciona una descripcin estadstica completa
de todo el instrumento:
Scale:
0
------N of Items
80
N of Examinees
50
Mean
51.920
Variance
58.554
Std. Dev.
7.652
Skew
0.637
Kurtosis
-0.478
Minimum
41.000
Maximum
69.000
Median
50.000
Alpha
0.798
SEM
3.440
Mean P
0.649
Mean Item-Tot.
0.230
Mean Biserial
0.329
Max Score (Low)
46
N (Low Group)
13
Min Score (High)
56
N (High Group)
14
Un histograma que representa la frecuencia de aciertos:
Number
FreqCum
Correct
uency
Freq
PR
PCT
-----------------------. . . No examinees below this score . . .
40
0
0
1
0
41
3
3
6
6
42
2
5
10
4
43
1
6
12
2
+
|######
|####
|##
44
2
8
16
4
45
2
10
20
4
46
3
13
26
6
47
5
18
36
10
48
2
20
40
4
49
2
22
44
4
50
4
26
52
8
51
2
28
56
4
52
1
29
58
2
53
2
31
62
4
54
4
35
70
8
55
1
36
72
2
56
3
39
78
6
57
0
39
78
0
58
1
40
80
2
59
1
41
82
2
60
1
42
84
2
61
0
42
84
0
62
1
43
86
2
63
2
45
90
4
64
0
45
90
0
65
0
45
90
0
66
1
46
92
2
67
2
48
96
4
68
1
49
98
2
69
1
50
99
2
70
0
50
99
0
71
0
50
99
0
. . . No examinees above this score . . .
|####
+####
|######
|##########
|####
|####
+########
|####
|##
|####
|########
+##
|######
|
|##
|##
+##
|
|##
|####
|
+
|##
|####
|##
|##
+
|
|
|----+----+----+----+----+
5
10
15
20
25
Percentage of Examinees
A continuacin presentamos una tabal que puede resultar til para la interpretacin
de resultados:
INDICE DE DIFICULTAD DEL ITEM
Valor
Interpretacin
Menor de 0,25
Muy difcil
Entre 0,25 y 0,44
Difcil
Entre 0,45 y 0,54
Normal
Entre 0,55 y 0,74
Fcil
Mayor de 0,75
Muy Fcil
INDICE DE VALIDEZ - INDICE DE HOMOGENEIDAD
Valor
Interpretacin
Negativo a menor de 0,20 Rechazar tem
Mayor o igual de 0,55
Bastante alto
Mayor o igual de 0,75
Muy alto