2.
Los tipos de preguntas que resuelve el análisis factorial
Análisis factorial es una técnica estadística de reducción de datos usada para explicar
la variabilidad entre las variables observadas en términos de un número menor de variables
no observadas llamadas factores. El objetivo fundamental del análisis factorial y del análisis
de componentes principales consiste en reducir el gran conjunto de variables medidas a un
conjunto menor de factores.
El análisis factorial se originó en psicometría, y se usa en las ciencias del
comportamiento tales como ciencias sociales, marketing, gestión de productos,
investigación operativa, y otras ciencias aplicadas que tratan con grandes cantidades de
datos.
Cuando recogemos un gran número de variables de forma simultánea, como por
ejemplo en un cuestionario de satisfacción laboral, podemos estar interesados en averiguar
si las preguntas del cuestionario se agrupan de alguna forma característica. Aplicando un
análisis factorial a las respuestas de los sujetos podemos encontrar grupos de variables con
significado común y conseguir de esta manera reducir el número de dimensiones necesarias
para explicar las respuestas de los sujetos.
El análisis factorial es, por tanto, una técnica de reducción de la dimensionalidad de los
datos. Su propósito último consiste en buscar el número mínimo de dimensiones capaces
de explicar el máximo de información contenida en los datos.
A diferencia de lo que ocurre en otras técnicas como el análisis de varianza o el de
regresión, en el análisis factorial todas las variables del análisis cumplen el mismo papel:
todas ellas son independientes en el sentido de que no existe a priori una dependencia
conceptual de unas variables sobre otras.
2.1. Número y naturaleza de los factores
Un factor es un elemento que influye en algo. De esta manera, los factores son
los distintos aspectos que intervienen, determinan o influyen para que una cosa sea
de un modo concreto.
Pensemos en la salud de un adulto. ¿Cuáles son los factores que inciden en
ella? Hay factores genéticos, alimenticios, hábitos de salud y la práctica de ejercicio.
Todos ellos en conjunto condicionan la salud de una persona.
El análisis nos permite resolver cuestiones relativas al número de factores que es
necesario retener para reproducir la matriz de correlaciones observadas.
A las preguntas ¿es necesario un solo factor? ¿Cómo interpretar una solución
con dos factores? La respuesta dependerá de los pesos de cada variable en cada
factor y del patrón de correlaciones que observemos.
Por ejemplo, que A y B correlacionan entre si más que con respecto a C y D, que
también correlacionan entre sí, estamos hablando de una solución de dos factores.
2.2. Importancia de los factores
La noción de varianza se suele emplear en el ámbito de la estadística. Se trata
de una palabra impulsada por el matemático y científico inglés Ronald Fisher (1890–
1962) y sirve para identificar a la media de las desviaciones cuadráticas de una
variable de carácter aleatorio, considerando el valor medio de ésta.
Po ejemplo, se conoce como varianza a la raíz cuadrada que se desprende de
una desviación estándar, la cual permite que las industrias de manufactura
encuentren precisión en el trabajo y producción y, al mismo tiempo, reduzcan el
índice de errores. Esto sucede ya que la varianza toma los datos dispersos de la
media y luego de medirlos le da valor a las variaciones y a las desviaciones y también
contabiliza y asume los errores cometidos previniendo posibles errores.
Ahora bien ¿Qué factores son los que explican mayor cantidad de varianza? Los
métodos de extracción de factores tienden a garantizar que el primer factor extraído
es el que mayor cantidad de varianza explica, después el segundo, y así
sucesivamente. Evidentemente, cuanto mayor varianza explique un factor mayor es
su importancia en la solución obtenida.
2.3. Contraste de modelos
Existen dos modelos de análisis factorial:
El análisis factorial exploratorio, AFE, se usa para tratar de descubrir la
estructura interna de un número relativamente grande de variables. La
hipótesis a priori del investigador es que pueden existir una serie de factores
asociados a grupos de variables. Las cargas de los distintos factores se
utilizan para intuir la relación de éstos con las distintas variables. Es el tipo
de análisis factorial más común.
Si, por ejemplo, para los propósitos de un estudio se elabora o se adapta
una batería de pruebas (pruebas de medición de constructos cognitivos,
cuestionarios de variables afectivas), el AFE se aplica con el objetivo de
comprobar hasta qué punto estos instrumentos o los ítems que los
conforman representan adecuadamente los constructos latentes de interés
del mismo constructo.
El análisis factorial confirmatorio, AFC, trata de determinar si el número
de factores obtenidos y sus cargas se corresponden con los que cabría
esperar a la luz de una teoría previa acerca de los datos. La hipótesis a priori
es que existen unos determinados factores preestablecidos y que cada uno
de ellos está asociado con un determinado subconjunto de las variables. El
análisis factorial confirmatorio entonces arroja un nivel de confianza para
poder aceptar o rechazar dicha hipótesis.
Si, por ejemplo, para los propósitos de un estudio se elabora o se adapta
una batería de pruebas (pruebas de medición de constructos cognitivos,
cuestionarios de variables afectivas), el AFC se aplica con el objetivo de
comprobar la validez de la teoría en relación con los factores planteados.
2.4. Estimación de las puntuaciones factoriales
Se emplea la matriz de coeficientes para el cálculo. ¿Qué es la matriz de los
coeficientes? La matriz de coeficientes de un sistema de ecuaciones lineales también
llamada matriz aumentada, es una matriz que contiene, en cada una de las primeras
columnas, los coeficientes correspondientes a una variable del sistema de ecuaciones
y la última columna contiene el lado derecho de las ecuaciones.
Estas puntuaciones se utilizan para comparar sujetos entre sí, o para proseguir
con más análisis.