Análisis discriminante.
(4-5-16)
1 variable dependiente v. no métrica. Consumo Si-no
Varias v. independientes v. métricas *Edad *ingresos
- Calificación media
- Número de veces que anualmente van al cine
- Su edad
- El número de libros que leen al año
- La paga semanal
- Las horas semanales de televisión
- El nivel de rechazo a la violencia que tienen activo pasivo
Tenemos 6 variables métricas + 1 variable no métrica.
1º/ A.D simple: v.depend. dicatómica 1FD
múltiple : v. depend + 2 categ +1 FD
D= £sub0+ £sub1Xsub1+ £sub2Xsub2+…
2º/ Método directo
Pasos.
3º/ probabilidades a priori = Por defecto en SPSS
=/
Tipo de cine –A –H –V -S
1º. M de Box
2º normalidad multivariante lo daremos por supuesto
3º Ausencia de multicolinealidad: Para mirarlo con la matriz de correlación. R= / 0,1/ para
tener buena relación mínimo /0´5/-/0´7/ hay correlación media. r>/0´7/ hay problema de
multicolin.
Ejemplo Cine.Sav
Variable dependiente: tipo de cine (A,H,V,S)
Variables independientes (6 variables métricas + 1 no métrica):
-clasificación media
-nº veces cine
-edad
-nº libros al año
-pago semanal
-horas tv
-nivel rechazo violencia (activo-pasivo)
Para hacer un análisis discriminante
Analizar clasificar discriminante.
Como tenemos 4 categorías (a,h,v,s) por lo que será un análisis discriminante múltiple.
Cogemos tipo de cine que te gusta y el rango el 1-4 como podemos observar en el programa
Las señaladas son las variables independientes. Y usar método de inclusión por pasos.
En estadísticos
-ANOVA univariado
- M de Box
- Correlación intra-grupo
En clasificar:
- La vamos a poner diferente según el tamaño de los grupos
- Probabilidades
- Tabla resumen
En guardar
- Pertenencia a grupos pronosticada
Matriz de correlaciones también llamado matriz dentro de grupo combinado
Matrices dentro de grupos combinados
CALIFICACI LIBROS NIVEL DE
ÓN MEDIA LEÍDOS ASISTENCIA HORAS RECHAZO A
PAGA EN ANUALMENT ANUAL AL SEMANALES LA
SEMANAL EDAD ESTUDIOS E CINE TV VIOLENCIA
Correlación PAGA SEMANAL 1,000 ,094 -,179 ,066 -,467 -,066 ,001
EDAD ,094 1,000 ,080 -,113 ,011 ,148 ,092
CALIFICACIÓN MEDIA
-,179 ,080 1,000 -,044 ,365 ,195 ,100
EN ESTUDIOS
LIBROS LEÍDOS
,066 -,113 -,044 1,000 ,140 -,853 -,084
ANUALMENTE
ASISTENCIA ANUAL AL
-,467 ,011 ,365 ,140 1,000 -,115 -,018
CINE
HORAS SEMANALES
-,066 ,148 ,195 -,853 -,115 1,000 ,050
TV
NIVEL DE RECHAZO A
,001 ,092 ,100 -,084 -,018 ,050 1,000
LA VIOLENCIA
Para observarla rápido de la diagonal para abajo o de la diagonal para arriba. Tienen que ser
menor que 0´5.
(-0´853) Que dice que cuanto más horas de televisión veas, menos lees. Cómo es lógico. Con
esto demostramos que hay ausencia de multicolinealidad.
Resultados de pruebas
M de Box 125,847
F Aprox. 13,272
df1 9
df2 4395,599
Sig. ,000
Prueba la hipótesis nula de las
matrices de covarianzas de
población iguales.
H0: la matriz gu p-valor = 0´000 < 0´05 rechazo h0
Resumen de proceso del caso de análisis
Casos sin ponderar N Porcentaje
Válido 165 94,3
Excluido Código de grupo perdidos o
1 ,6
fuera de rango
Como mínimo, falta una
8 4,6
variable discriminatoria
Ambos códigos, los perdidos
o los que están fuera de
1 ,6
rango y, como mínimo, una
discriminación que falta
Total 10 5,7
Total 175 100,0
Tabla resumen del proceso.
Estadísticas de grupo
N válido (por lista)
TIPO DE PELÍCULA QUE TE GUSTA No ponderados Ponderados
AMOR PAGA SEMANAL 78 78,000
EDAD 78 78,000
CALIFICACIÓN MEDIA EN
78 78,000
ESTUDIOS
LIBROS LEÍDOS
78 78,000
ANUALMENTE
ASISTENCIA ANUAL AL
78 78,000
CINE
HORAS SEMANALES TV 78 78,000
NIVEL DE RECHAZO A LA
78 78,000
VIOLENCIA
HUMOR PAGA SEMANAL 34 34,000
EDAD 34 34,000
CALIFICACIÓN MEDIA EN
34 34,000
ESTUDIOS
LIBROS LEÍDOS
34 34,000
ANUALMENTE
ASISTENCIA ANUAL AL 34 34,000
CINE
HORAS SEMANALES TV 34 34,000
NIVEL DE RECHAZO A LA
34 34,000
VIOLENCIA
VIOLENCIA PAGA SEMANAL 45 45,000
EDAD 45 45,000
CALIFICACIÓN MEDIA EN
45 45,000
ESTUDIOS
LIBROS LEÍDOS
45 45,000
ANUALMENTE
ASISTENCIA ANUAL AL
45 45,000
CINE
HORAS SEMANALES TV 45 45,000
NIVEL DE RECHAZO A LA
45 45,000
VIOLENCIA
SEXO PAGA SEMANAL 8 8,000
EDAD 8 8,000
CALIFICACIÓN MEDIA EN
8 8,000
ESTUDIOS
LIBROS LEÍDOS
8 8,000
ANUALMENTE
ASISTENCIA ANUAL AL
8 8,000
CINE
HORAS SEMANALES TV 8 8,000
NIVEL DE RECHAZO A LA
8 8,000
VIOLENCIA
Total PAGA SEMANAL 165 165,000
EDAD 165 165,000
CALIFICACIÓN MEDIA EN
165 165,000
ESTUDIOS
LIBROS LEÍDOS
165 165,000
ANUALMENTE
ASISTENCIA ANUAL AL
165 165,000
CINE
HORAS SEMANALES TV 165 165,000
NIVEL DE RECHAZO A LA
165 165,000
VIOLENCIA
Estadística de grupo.
78 casos de amor, 8 sexo 45 violencia.
Prueba de igualdad de medias de grupos
Lambda de
Wilks F df1 df2 Sig.
PAGA SEMANAL ,992 ,431 3 161 ,731
EDAD ,885 6,980 3 161 ,000
CALIFICACIÓN MEDIA EN
,984 ,882 3 161 ,452
ESTUDIOS
LIBROS LEÍDOS
,981 1,034 3 161 ,379
ANUALMENTE
ASISTENCIA ANUAL AL
,944 3,195 3 161 ,025
CINE
HORAS SEMANALES TV ,998 ,134 3 161 ,940
NIVEL DE RECHAZO A LA
,433 70,149 3 161 ,000
VIOLENCIA
Para ver el poder que tienen las variables, osea que expliquen, cuando p-valor es menor 0
´05. Es significativo en este caso (edad, violencia, asistencia cine).
Autovalores
Función Autovalor % de varianza % acumulado Correlación canónica
1 1,307a 91,5 91,5 ,753
2 ,122a
8,5 100,0 ,330
a. Se utilizaron las primeras 2 funciones discriminantes canónicas en el análisis.
Vemos que % de la varianza tiene cada una.
La primera función es la que explica la mayor parte de la varianza un 91,5%
Coeficientes de función discriminante canónica
estandarizadas
Función
1 2
EDAD -,011 1,004
NIVEL DE RECHAZO A LA
1,001 -,082
VIOLENCIA
La primera función viene definida por la violencia, mientras que la segunda viene definida por la edad
Las dos tablas deben de coincidir, pero aveces no porque no se cumple algún supuesto de partida( matriz de
estructura y coef. Estand).
Matriz de estructuras
Función
1 2
NIVEL DE RECHAZO A LA
1,000* ,011
VIOLENCIA
CALIFICACIÓN MEDIA EN
,099* ,073
ESTUDIOSb
ASISTENCIA ANUAL AL
-,018* ,013
CINEb
EDAD ,082 ,997*
HORAS SEMANALES TVb ,048 ,144*
LIBROS LEÍDOS
-,082 -,106*
ANUALMENTEb
PAGA SEMANALb ,000 ,095*
Correlaciones dentro de grupos combinados entre las
variables discriminantes y las funciones discriminantes
canónicas estandarizadas
Variables ordenadas por el tamaño absoluto de la
correlación dentro de la función.
*. La mayor correlación absoluta entre cada variable y
cualquier función discriminante.
b. Est variable no se utiliza en el análisis.
Con esta variable te explican lo mismo que con la de antes
Las variables que tienen más peso en la función 1: nivel rechazo a la violencia,
eestudios, asistencia cine,
Función 2: edad, horas tv, libros leidos, paga semanal.
Se suele considerar como importantes aquellos que tengan alores superiores a +/-0´33/.
Resultados de clasificacióna
TIPO DE PELÍCULA QUE TE Pertenencia a grupos pronosticada
GUSTA AMOR HUMOR VIOLENCIA SEXO Total
Original Recuento AMOR 81 1 1 0 83
HUMOR 19 14 3 0 36
VIOLENCIA 7 4 35 0 46
SEXO 7 0 1 0 8
Casos sin agrupar 1 0 0 0 1
% AMOR 97,6 1,2 1,2 ,0 100,0
HUMOR 52,8 38,9 8,3 ,0 100,0
VIOLENCIA 15,2 8,7 76,1 ,0 100,0
SEXO 87,5 ,0 12,5 ,0 100,0
Casos sin agrupar 100,0 ,0 ,0 ,0 100,0
a. 75,1% de casos agrupados originales clasificados correctamente.
Se han agrupado correctamente, por lo que es una buena clasificación.