Statwiki James
Statwiki James
Agradecimientos
Los materiales y el enfoque de enseñanza adoptados en estos materiales han sido desarrollados por un equipo
de maestros que consiste en Jagdip Singh, Toni Somers, Kalle Lyytinen, Nick Berente, Shyam
Giridharadas y yo durante los últimos varios años. Aunque he desarrollado y refinado gran parte de
el material y los recursos en esta Wiki, no soy el único contribuyente. Aprecio mucho el
trabajo realizado por Kalle Lyytinen (Universidad de Case Western Reserve), Toni Somers (Wayne State
Universidad), Nick Berente (Universidad de Georgia), Shyam Giridharadas (Universidad de Washington)
y Jagdip Singh (Universidad Case Western Reserve) quien seleccionó e identificó gran parte de la
la literatura que subyace a los materiales y también desarrolló originalmente muchas de las diapositivas de Powerpoint.
También me ayudaron a refinar estos materiales al proporcionar comentarios útiles sobre las diapositivas y
videos. También aprecio la contribución y ayuda de Jagdip Singh (Case Western Reserve)
Universidad), que es el propietario de los conjuntos de datos Sohana y Bencare utilizados en los ejemplos y
que se ponen a disposición a continuación. También reconozco el apoyo continuo de laDoctor de
Programa de Gestiónen elEscuela de Administración WeatherheadenCase Western Reserve
Universidad, Cleveland, Ohio por su participación, apoyo y patrocinio de este wiki, así como
a la Universidad Brigham Young por animarme en todos mis esfuerzos relacionados con SEM.
Por favor, informe cualquier problema con la wiki a [email protected][1]
Si tienes problemas y no puedes averiguar qué hacer, incluso después de usar los recursos en
este wiki o en Gaskination, entonces podrías beneficiarte del archivo de correos electrónicos de soporte que tengo
Puede encontrar este conjunto de herramientas de Excel útiles/necesarias para muchos de los análisis que
aprenderás sobre en esta wiki:Paquete de Herramientas EstadísticasPor favor, tenga en cuenta que este es el más
recientemente actualizado, y no incluye una columna de variación en la hoja de Maestro de Validez.
Esto es porque fue un error incluir variaciones al trabajar con estandarizados
estimaciones.
También puedes encontrar este tutorial básico para AMOS y SPSS útil como punto de partida.
Serie SEM de YouTube (estos datos van junto con esta lista de reproducción de YouTube: Serie SEM 2016)
Sohana
Bencare
Desempeño de Ventas
Cómo citar los recursos de Gaskination
artículo de IEEE TPC PLS:
Paul Benjamin Lowry y James Gaskin (2014). “Modelos Estructurales de Mínimos Cuadrados Parciales (PLS)
Modelado de Ecuaciones (SEM) para Construir y Probar Teoría Causal Comportamental: Cuándo
Elíjalo y cómo usarlo
Wiki:
Gaskin, J., (Año de carga del video), "Nombre del video", Gaskination's
Estadísticas.http://youtube.com/Gaskination
Paquete de Herramientas Estadísticas:
Plugin o Estimador:
Datos faltantes
Valores atípicos
Normalidad
Linealidad
Homoscedasticidad
Multicolinealidad
2.Análisis Factorial Exploratorio(EFA)
Tipos de rotación
Métodos de factorización
Validez convergente
Validez discriminante
Validez aparente
Confiabilidad
Formativa vs. Reflectiva
3.Análisis Factorial Confirmatorio(CFA)
Validez y Fiabilidad
Sesgo de Método Común (CMB)
Invarianza
Factores de Segundo Orden
Hipótesis
Controles
Mediación
Interacción
Ajuste del modelo de nuevo
Multi-grupo
De modelo de medición a modelo estructural
Creando Compuestos a partir de Factores Latentes
Instalando PLS-graph
Resolución de problemas
Regla del Tamaño de Muestra
Análisis Factorial
Probando Modelos Causales
Pruebas de Diferencias entre Grupos
Análisis de ejemplo
Diez pasos para construir un buen modelo cuantitativo
Orden de Operaciones
Directrices generales para redactar un artículo cuantitativo
7.Análisis de Cluster
La revisión de datos (a veces llamada "grito de datos") es el proceso de asegurar que tus datos
está limpio y listo para usar antes de realizar más análisis estadísticos. Los datos deben ser revisados en
para asegurar que los datos sean utilizables, confiables y válidos para probar teorías causales. En esta sección yo
se centrará en seis temas específicos que deben abordarse al limpiar (no cocinar) tus datos.
¿Conoces algunas citas que podrían usarse para apoyar los temas y procedimientos?
¿se discutió en esta sección? Por favorenvíamelos por correo electrónicocon el nombre de la sección, procedimiento, o
subsección que apoyan. ¡Gracias!
Contenido
[esconder]
1 Datos faltantes
2 Valores atípicos
o2.1 Univariante
o2.2 Multivariado
3 Normalidad
4 Linealidad
5 Homocedasticidad
6 Multicolinealidad
Datos faltantes
Si te falta gran parte de tus datos, esto puede causar varios problemas. El más evidente
el problema es que simplemente no habrá suficientes puntos de datos para realizar tus análisis. El EFA, CFA,
y los modelos de ruta requieren un cierto número de puntos de datos para poder calcular estimaciones. Esto
el número aumenta con la complejidad de su modelo. Si le faltan varios valores en su
los datos, el análisis simplemente no se ejecutará.
Además, los datos faltantes podrían representar problemas de sesgo. Algunas personas pueden no haber respondido.
preguntas particulares en su encuesta debido a un problema común. Por ejemplo, si usted preguntó
sobre el género, y las mujeres son menos propensas a reportar su género que los hombres, entonces tendrás
datos sesgados hacia los hombres. Quizás solo el 50% de las mujeres reportaron su género, pero el 95% de los hombres
género reportado. Si usas el género en tus modelos causales, entonces estarás fuertemente sesgado hacia
males, porque no acabarás usando las respuestas no reportadas.
Para averiguar cuántos valores faltantes tiene cada variable, en SPSS ve a Analizar, luego Descriptivo
Estadísticas, luego Frecuencias. Ingrese las variables en la lista de variables. Luego haga clic en Aceptar. La tabla en
la salida mostrará el número de valores faltantes para cada variable.
El umbral para los datos faltantes es flexible, pero en general, si te faltan más del 10% de los
respuestas sobre una variable particular, o de un respondedor particular, esa variable o respondedor
pueden ser problemáticos. Hay varias formas de tratar con variables problemáticas.
Simplemente no uses esa variable.
Si tiene sentido, impute los valores faltantes. Esto solo debe hacerse para continuos o
datos de intervalo (como la edad o las respuestas en una escala de Likert), no para datos categóricos (como el género).
Si tu conjunto de datos es lo suficientemente grande, simplemente no utilices las respuestas que tenían valores faltantes para eso.
variable. Esto puede crear un sesgo, sin embargo, si el número de respuestas faltantes es mayor que
10%.
Para imputar valores en SPSS, ve a Transformar, Reemplazar Valores Perdidos; luego selecciona las variables
que necesitan imputación, y haz clic en Aceptar. Ve las capturas de pantalla a continuación. En esta captura de pantalla, utilizo la Media
método de reemplazo. Pero hay otras opciones, incluido el reemplazo de la mediana. Típicamente con
Datos tipo Likert, deseas utilizar la sustitución de mediana, porque las medias son menos significativas en
estos escenarios. Para más información sobre cuándo usar qué tipo de imputación, consulta:Lynch
(2003)
Valores atípicos
Los valores atípicos pueden influir en tus resultados, desplazando la media lejos de la mediana. Dos tipos de valores atípicos
existen: valores atípicos para variables individuales y valores atípicos para el modelo.
Univariante
Para detectar valores atípicos en cada variable, simplemente produce un diagrama de caja en SPSS (como se demostró en el
video). Los valores atípicos aparecerán en los extremos y estarán etiquetados, como en la figura a continuación. Si tienes
un tamaño de muestra realmente alto, entonces puede que quieras eliminar los valores atípicos. Si estás trabajando con un
conjuntos de datos más pequeños, es posible que desees ser menos liberal al eliminar registros. Sin embargo, esto es un intercambio
fuera, porque los valores atípicos influirán en conjuntos de datos pequeños más que en grandes. Por último, los valores atípicos no
realmente existen en las escalas de Likert. Responder en el extremo (1 o 5) no es realmente un outlier representativo.
comportamiento.
Otro tipo de valor atípico es un encuestado desinteresado. A veces, los encuestados ingresan '3, 3, 3,
3,...' para cada uno de los ítems de la encuesta. Este participante claramente no estaba comprometido, y sus respuestas
desviará tus resultados. Otros patrones indicativos de encuestados desinteresados son '1, 2, 3, 4, 5, 1,
2, ...' o '1, 1, 1, 1, 5, 5, 5, 5, 1, 1, ...'. Hay múltiples formas de identificar y eliminar estos
respondientes no comprometidos
Incluya trampas de atención que pidan al encuestado que 'responda algo de acuerdo para este ítem si
estás prestando atención". Suelo incluir dos de estos en direcciones opuestas (es decir, uno dice
algo de acuerdo y uno dice algo en desacuerdo) aproximadamente a un tercio y dos tercios del camino
a través de mis encuestas. Siempre me sorprende cuántos atrapo de esta manera...
Ver si el participante respondió a las preguntas con puntuación inversa en la misma dirección que las normales
preguntas. Por ejemplo, si respondieron altamente de acuerdo a ambos elementos, entonces ellos
were not paying attention: "I am very hungry", "I don't have much appetite right now".
Multivariante
Los valores atípicos multivariantes se refieren a registros que no se ajustan a los conjuntos estándar de correlaciones exhibidos por
los demás registros en el conjunto de datos, con respecto a su modelo causal. Entonces, si todos menos una persona en el
el conjunto de datos informa que la dieta tiene un efecto positivo en la pérdida de peso, pero este tipo informa que él
gana peso cuando hace dieta, entonces su registro sería considerado un valor atípico multivariante. Para detectar
para estos influyentes outliers multivariantes, necesitas calcular el cuadrado de Mahalanobis d. Esto es un
asunto simple en AMOS. Consulte el tutorial en video para los detalles. Como advertencia, sin embargo, yo
casi nunca se abordan los valores atípicos multivariantes, ya que es muy difícil justificar su eliminación simplemente
porque no coinciden con tu teoría. Además, casi siempre encontrarás multivariado
los valores atípicos, incluso si los eliminas, aparecerán más. Es una pendiente resbaladiza.
Normalidad
TUTORIAL EN VÍDEO: Detección de problemas de normalidad
La normalidad se refiere a la distribución de los datos para una variable determinada. Normalmente asumimos que
los datos están distribuidos normalmente, ¡aunque generalmente no lo están! La normalidad se evalúa en muchos
diferentes maneras: forma, asimetría y curtosis (plano/pico).
Forma: Para descubrir la forma de la distribución en SPSS, construye un histograma (como se muestra en el
video tutorial) y traza la curva normal. Si el histograma no coincide con la curva normal,
entonces probablemente tengas problemas de normalidad. También puedes mirar el diagrama de caja para determinar
normalidad.
Asimetría: La asimetría significa que las respuestas no cayeron en una distribución normal, pero
estaban fuertemente ponderados hacia un extremo de la escala. El ingreso es un ejemplo de un comúnmente
variable sesgada a la derecha; la mayoría de las personas ganan entre 20 y 70 mil dólares en EE. UU.
pero hay un grupo más pequeño que gana entre 70 y 100, y un grupo aún más pequeño que
hace entre 100 y 150, y un grupo mucho más pequeño que hace entre 150 y 250,
etc. hasta Bill Gates y Mark Zuckerberg. Abordar la asimetría puede requerir
transformaciones de tus datos (si son continuos), o eliminar outliers influyentes. Hay dos
reglas sobre la asimetría:
(1) Si tu valor de asimetría es mayor que 1, entonces estás sesgado positivamente (a la derecha); si es menor
menos de -1 eres negativo (izquierda) sesgado, si está entre, entonces estás bien. Algunos publicados
los umbrales son un poco más liberales y permiten hasta +/-2.2, en lugar de +/-1.
Si el valor absoluto de la asimetría es menor que tres veces el error estándar, entonces tú
están bien; de lo contrario, estás sesgado.
Usando estas reglas, podemos ver en la tabla de abajo que las tres variables están bien utilizando la primera
regla, pero usando la segunda regla, todos son sesgados negativamente (a la izquierda).
La asimetría se ve así:
Curtosis
La kurtosis se refiere a los valores atípicos de la distribución de los datos. Los datos que tienen valores atípicos tienen grandes
kurtosis. Los datos sin valores atípicos tienen baja kurtosis. La kurtosis (kurtosis excesiva) de la normal
la distribución es 0. La regla para evaluar si tu kurtosis es problemática es la misma que
regla dos arriba:
Bimodal:
Otro problema que puedes encontrar con la distribución de tus datos es una distribución bimodal. Esto
significa que los datos tienen múltiples (dos) picos, en lugar de alcanzar un pico en la media. Esto puede indicar
hay variables de moderación que afectan estos datos. Una distribución bimodal se ve así:
transformaciones
TUTORIAL EN VIDEO:Transformaciones
Cuando tienes datos extremadamente no normales, influirá en tus regresiones en SPSS y
AMOS. En tales casos, si tienes variables que no son de escala Likert (por lo tanto, variables como la edad, el ingreso,
ingresos, etc.), puedes transformarlos antes de incluirlos en tu modelo. Gary Templeton ha
publicó un excelente artículo sobre esto y creó un video de YouTube que muestra cómo llevar a cabo el
transformación. También hace referencia a su artículo en el video.
Linealidad
La linealidad se refiere a la pendiente constante de cambio que representa la relación entre un IV
y una DV. Si la relación entre la IV y la DV es radicalmente inconsistente, entonces arrojará
fuera de sus análisis SEM. Hay docenas de formas de probar la linealidad. Quizás la más elegante
(fácil y claro, pero riguroso), está disponible la prueba de desviación de linealidad en la prueba ANOVA
en SPSS. En SPSS ve a Analizar, Comparar Medias, Medias. Coloca los IVs y DVs compuestos en el
listas, luego haga clic en opciones y seleccione "Prueba de Linealidad". Luego, en la tabla ANOVA en el resultado
ventana, si el valor Sig para la Desviación de Linealidad es menor que 0.05, la relación entre IV
y DV no es lineal, y por lo tanto es problemático (ver las capturas de pantalla a continuación). Los problemas de linealidad pueden
a veces se puede corregir eliminando los valores atípicos (si la significancia es límite), o mediante una transformación
los datos. En la captura de pantalla a continuación, podemos ver que la primera relación es lineal (Sig = .268), pero
la segunda relación es no lineal (Sig = .003).
Si esta prueba da resultados extraños, simplemente realiza una regresión lineal OLS entre cada uno.
Par de IV->DV. Si el valor de sig es menor que 0.05, entonces la relación puede considerarse
"suficientemente" lineal. Aunque este enfoque es algo menos riguroso, tiene la ventaja de
¡funcionando cada vez! También puedes hacer una regresión curvilínea ('estimación de curva') para ver si
la relación es más lineal que no lineal.
Homoscedasticidad
TUTORIAL EN VÍDEO: Representación de Homocedasticidad
Enciclopedia del Diseño de Investigación, Volumen 1 (2010), Sage Publications, pág. 581
Homoscedasticidad es una palabra desagradable que significa que el residuo (error) de la variable exhibe
varianza consistente a través de diferentes niveles de la variable. Hay buenas razones para desear
esto. Para más información, consulte Hair et al. 2010, capítulo 2. :) Una forma simple de determinar si un
una relación es homocedástica es hacer un gráfico de dispersión simple con la variable en el eje y y el
residual de la variable en el eje x. Para ver una guía paso a paso sobre cómo hacer esto, mira el video
tutorial. Si el gráfico presenta un patrón consistente - como en la figura a continuación, entonces estamos bien -
¡tenemos homocedasticidad! Si no hay un patrón consistente, entonces la relación se considera
heterocedástico. Esto se puede solucionar transformando los datos o dividiendo los datos por subgrupos
(como dos grupos para género). Puedes leer más sobre transformaciones en Hair et al. 2010 cap.
4.
Las escuelas de pensamiento sobre la homocedasticidad aún están en debate. Algunos sugieren que la evidencia de
la heterocedasticidad no es un problema (y de hecho es deseable y esperada en modelos moderados)
y así no deberíamos preocuparnos por probar la homocedasticidad. Nunca realizo esta prueba a menos que
específicamente solicitado por un revisor.
Multicolinealidad
O'Brien, R. M. 2007. Una advertencia sobre las reglas generales para la inflación de varianza
¿Conoces algunas citas que se puedan utilizar para apoyar los temas y procedimientos?
¿se discutió en esta sección? Por favorenvíalos por correo electrónico a mícon el nombre de la sección, procedimiento, o
subsección que apoyan. ¡Gracias!
Contenido
[ocultar]
1 Tipos de rotación
o1.1 Ortogonal
o1.2 Oblicuo
2 Métodos de factorización
6 Validez convergente
7 Validez discriminante
8 Validez aparente
9 Confiabilidad
10 Formativo vs. Reflexivo
11 Problemas Comunes de EFA
Tipos de rotación
La rotación hace que las cargas factoriales estén más claramente diferenciadas, lo que a menudo es necesario para
facilitar la interpretación. Varios tipos de rotación están disponibles para su uso.
Ortogonal
Varimax (el más común)
interpretabilidad disminuida
Promax (Usa este si no estás seguro)
Métodos de factorización
Existen tres métodos principales para la extracción de factores.
Considera solo la varianza común (coloca las estimaciones de communalidad en la diagonal de la correlación)
matrix).
Busca el menor número de factores que puedan explicar la varianza común (correlación) de un conjunto
de variables.
PAF solo está analizando la variabilidad de factores comunes; eliminando la singularidad o lo no explicado
Maximiza las diferencias entre factores. Proporciona una estimación de ajuste del modelo.
Este es el enfoque utilizado en AMOS, así que si vas a usar AMOS para el CFA y estructural
modelado, deberías usar este durante la EFA.
Maravilloso: .90s
Meritorio: .80s
.70s
Mediocre: .60s
Miserable: .50s
Inaceptable: <.50
La Prueba de Esfericidad de Bartlett
Prueba la hipótesis de que la matriz de correlación es una matriz identidad.
Estructura de Factores
La estructura factorial se refiere a las intercorrelaciones entre las variables que se están probando en el EFA. Usando
la matriz de patrones a continuación como una ilustración, podemos ver que las variables se agrupan en factores - más
precisamente, se "cargan" en factores. El ejemplo a continuación ilustra una estructura de factores muy clara en
qué validez convergente y discriminante son evidentes por las altas cargas dentro de los factores, y no
cargas cruzadas importantes entre factores (es decir, una carga principal debe ser al menos 0.200 mayor que
carga secundaria).
validez convergente
La validez convergente significa que las variables dentro de un solo factor están altamente correlacionadas. Esto es
evidente por las cargas factoriales. Las cargas suficientes/significativas dependen del tamaño de la muestra de su
conjunto de datos. La tabla a continuación describe los umbrales para cargas factoriales suficientes/significativas.
En general, cuanto menor es el tamaño de la muestra, mayor es la carga requerida. Podemos ver eso en el
matriz de patrones arriba, necesitaríamos un tamaño de muestra de 60-70 como mínimo para lograr significatividad.
cargas para las variables loyalty1 y loyalty7. Independientemente del tamaño de la muestra, es mejor tener cargas
mayor que 0.500 y promediando a más de 0.700 para cada factor.
Validez discriminante
La validez discriminante se refiere a la medida en que los factores son distintos y no correlacionados. La regla es
que las variables deben relacionarse más fuertemente con su propio factor que con otro factor. Dos principales
existen métodos para determinar la validez discriminante durante un EFA. El primer método es examinar
la matriz de patrones. Las variables deben cargarse significativamente solo en un factor. Si hay "cargas cruzadas"
existen (cargas variables en múltiples factores), entonces las cargas cruzadas deberían diferir en más de 0.2.
El segundo método es examinar la matriz de correlación de factores, como se muestra a continuación. Correlaciones
entre factores no debe exceder 0.7. Una correlación mayor de 0.7 indica una mayoría de
varianza compartida (0.7 * 0.7 = 49% de varianza compartida). Como podemos ver en la correlación factorial
La matriz a continuación, el factor 2 está demasiado correlacionado con los factores 1, 3 y 4.
¿Qué pasa si tienes problemas de validez discriminante - por ejemplo, los ítems de dos teóricamente
diferentes factores terminan cargando en el mismo factor extraído (en lugar de en factores separados). Yo
he encontrado que la mejor manera de resolver este tipo de problema es hacer un EFA separado solo con los artículos
de los factores ofensivos. Trabaja en esta EFA más pequeña (removiendo elementos uno por uno que tengan)
las peores cargas cruzadas), luego reinserte los elementos restantes en el EFA completo. Esto generalmente
resuelve el problema. Si no lo hace, entonces considera si estos dos factores son en realidad solo dos
dimensiones o manifestaciones de algún factor de orden superior. Si este es el caso, entonces podría
considerar hacer el EFA para este factor de orden superior separado de todos los ítems que pertenecen al primero
ordenar los factores. Luego, durante el CFA, asegúrate de modelar el factor de orden superior adecuadamente por
creando una variable latente de segundo orden.
Validez de cara
La validez de cara es muy simple. ¿Tienen sentido los factores? Por ejemplo, ¿son variables que son?
¿similares en naturaleza cargando juntos en el mismo factor? Si hay excepciones, ¿son ellas?
¿Explicable? Los factores que demuestran una validez de cara suficiente deberían ser fáciles de etiquetar. Para
por ejemplo, en la matriz de patrones anterior, podríamos etiquetar fácilmente el factor 1 como "Confianza en el Agente"
(asumiendo que los nombres de las variables son representativos de la medida utilizada para recopilar datos para esto)
variable). Si todas las variables de "Confianza" en la matriz de patrones anterior cargaron en un solo factor, nosotros
puede que tenga que abstraer un poco y llamar a este factor "Confianza" en lugar de "Confianza en el Agente" y "Confianza en
Empresa
Fiabilidad
La confiabilidad se refiere a la consistencia de los errores a nivel de ítem dentro de un solo factor. La confiabilidad significa
justo lo que suena: un conjunto de variables 'confiables' cargará consistentemente en el mismo factor. El
Una forma de probar la fiabilidad en un EFA es calcular el alfa de Cronbach para cada factor. El alfa de Cronbach
debe estar por encima de 0.7; aunque, ceteris paribus, el valor generalmente aumentará para factores con
más variables, y disminuir para factores con menos variables. Cada factor debería tener como objetivo tener en
al menos 3 variables, aunque a veces se permiten 2 variables.
Esto sucede todo el tiempo cuando extraes basado en valores propios. Animo a los estudiantes a
usa primero los valores propios, pero luego también intenta restringir al número exacto de esperado
Los factores. Surgen preocupaciones cuando los valores propios extraen menos de lo esperado, por lo que se limita
termina extrayendo factores con valores propios muy bajos (y, por lo tanto, factores no muy útiles).
2. EFA con bajas communalidades para algunos ítems.
Esto es un signo de baja correlación y generalmente se corrobora con una carga baja en la matriz de patrones.
diga a los estudiantes que no eliminen un ítem solo por tener una baja comunalidad, sino que lo observen
A menudo, cuando hay un factor de segundo orden en un EFA, las subdimensiones de ese factor se cargarán todas.
juntos, en lugar de en factores separados. En tales casos, recomiendo realizar un EFA separado.
para los ítems de ese segundo orden factor. Luego, si ese EFA resulta en eliminar algunos ítems para
para lograr la validez discriminante, puedes intentar reunir el EFA nuevamente con el restante
artículos (aunque aún podría no funcionar). Luego, durante la CFA, asegúrate de modelar adecuadamente el
factor de segundo orden con una variable latente adicional conectada a sus sub-factores.
4. EFA con casos de Heywood
A veces las cargas son mayores a 1.00. No trato estos hasta que he abordado todos los demás.
problemas. Una vez que tengo una buena solución de EFA, entonces si el caso Heywood todavía está ahí (generalmente, esto
se resuelve por sí mismo), entonces intento un método de rotación diferente (Varimax lo solucionará cada vez).
Esta opción no es recomendable ya que suele ser el último recurso a tomar. Deberías
siempre haz todo lo que esté en tu poder para retener los constructos que son clave para tu teoría.
2. Puedes realizar el EFA utilizando un enfoque más exploratorio sin tener en cuenta las cargas esperadas.
Por ejemplo, si esperabas que el ítem foo3 se cargara con los ítems foo1 y foo2, pero en su lugar se cargó con
elementos moo1-3, entonces solo deberías dejarlo. Luego renombra tus factores de acuerdo a lo que se cargó en
ellos.
Esta opción es aceptable, pero te llevará a producir un modelo que probablemente sea algo
diferente de la que esperabas acabar.
3. Puedes decirte a ti mismo: “¿Por qué estoy haciendo un EFA? Estas son escalas establecidas y ya
sé qué elementos pertenecen a qué constructos (teóricamente). No necesito explorar el
relaciones entre los elementos porque ya conozco las relaciones. Entonces, ¿no debería estar haciendo?
¿un CFA en su lugar, para confirmar estas expectativas?” Y luego simplemente saltarías al CFA primero.
para refinar tu modelo de medición (pero luego vuelves a tu EFA después de tu CFA).
Las encuestas generalmente se construyen con constructos y teorías previas en mente, o las encuestas se construyen
de escalas existentes que han sido validadas en la literatura previa. Así, estamos menos inclinados
a "explorar" y más inclinados a "confirmar" al realizar un análisis factorial. El punto de un factor
el análisis es demostrar que tienes constructos distintos (validez discriminante) que cada uno
mide una sola cosa (validez convergente) y que son confiables (fiabilidad). Todo esto puede ser
logrado en el CFA. Sin embargo, deberías volver al EFA y "confirmar" el
CFA en la EFA configurando la EFA como su CFA resultó.
¿Por qué menciono esto? Principalmente porque tus EFAs casi siempre van a salir desordenados, y
porque puedes trastear sin fin con un EFA y si crees todo lo que tu EFA es
te digo, terminarás tirando artículos y construcciones innecesariamente y así
terminar dejando que las estadísticas dirijan tu teoría, en lugar de dejar que la teoría dirija tu teoría. Las EFAs son
exploratorios y pueden ser tratados como tales. Queremos retener tanto como sea posible y aún así ser
produciendo resultados válidos. No sé si esto se enfatiza lo suficiente en nuestros cursos de cuantitativos. También
menciono esto porque realicé un EFA recientemente y obtuve algo que no pude rescatar sin
hackeando un par de construcciones. Sin embargo, después de ejecutar el CFA con el modelo completo (ignorando el
EFA), pude retener todos los constructos al solo eliminar algunos ítems (y no los que yo
esperado según el EFA!). Ahora tengo una excelente fiabilidad, validez convergente, y solo un
un problema menor con la validez discriminante que estoy dispuesto a justificar por el bien mayor del modelo.
ahora puedo volver y reconciliar mi CFA con una EFA.
Para una demostración muy rocosa pero exitosa de cómo manejar un problemático EFA, mira mi SEM.
Campamento de Entrenamiento 2014 Día 3 Video de la Tarde hacia el final. El enlace a continuación te llevará al lugar correcto.
posición de tiempo. En este video, tomo los datos de uno de los participantes del seminario, que nunca había visto
antes, y con el que no había podido llegar a un EFA limpio, y lucho a través de ello hasta que
llegamos a algo válido y utilizable.
¿Conoces algunas citas que podrían usarse para apoyar los temas y procedimientos?
¿Se discutió en esta sección? Por favorenvíamelos por correo electrónicocon el nombre de la sección, procedimiento o
subsección que apoyan. ¡Gracias!
Contenidos
[ocultar]
oMétricas
o1.2 Índices de modificación
o1.3 Covarianzas Residuales Estandarizadas
2 Validez y Fiabilidad
3 Sesgo de Método Común (CMB)
o4.1 Configural
o4.2 Métrico
o4.3 Planes de contingencia
5 Factores de 2da Orden
El ajuste del modelo se refiere a qué tan bien se ajusta nuestro modelo propuesto (en este caso, el modelo de la estructura factorial).
tiene en cuenta las correlaciones entre las variables en el conjunto de datos. Si estamos teniendo en cuenta todos los
correlaciones importantes inherentes en el conjunto de datos (con respecto a las variables en nuestro modelo), luego nosotros
tiene un buen ajuste; si no, entonces hay una "discrepancia" significativa entre las correlaciones propuestas
y las correlaciones observadas, y así tenemos un mal ajuste del modelo. Nuestro modelo propuesto no
"ajustar" el modelo observado o "estimado" (es decir, las correlaciones en el conjunto de datos). Hacer referencia al CFA
tutorial en vídeo para detalles sobre cómo realizar un análisis de ajuste del modelo durante el AFC.
Métricas
Hay medidas específicas que se pueden calcular para determinar la idoneidad del ajuste. Las métricas que
deben ser reportados se enumeran a continuación, junto con sus umbrales aceptables. La bondad del ajuste es
inversamente relacionado con el tamaño de la muestra y el número de variables en el modelo. Así, los umbrales
A continuación se presentan simplemente unas pautas. Para umbrales más contextualizados, consulte la Tabla 12-4 en Hair et al.
2010 en la página 654. Los umbrales enumerados en la tabla a continuación son de Hu y Bentler (1999).
Índices de modificación
Los índices de modificación ofrecen soluciones sugeridas para las discrepancias entre lo propuesto y
modelo estimado. En un CFA, no hay mucho que podamos hacer para agregar líneas de regresión para solucionar
ajuste del modelo, ya que todas las líneas de regresión entre variables latentes y observadas ya están establecidas.
Por lo tanto, en un CFA, buscamos los índices de modificación para las covarianzas. En general, deberíamos
no covarían los términos de error con variables observadas o latentes, o con otros términos de error que no son parte
del mismo factor. Así, la modificación más apropiada que tenemos disponible es covariar el error
términos que son parte del mismo factor. La figura a continuación ilustra esta directriz - sin embargo, hay
son excepciones. En general, deseas abordar los índices de modificación más grandes antes de
abordar los más menores. Para obtener más información sobre cuándo está bien covariar los términos de error
(porque hay otras razones apropiadas), refiérete a los pensamientos de David Kenny sobre el
materiaEl sitio web de David
Covarianzas Residuales Estandarizadas
Las Covarianzas Residuales Estandarizadas (SRC) son muy parecidas a los índices de modificación; señalan
donde están las discrepancias entre los modelos propuestos y estimados. Sin embargo, también
indique si esas discrepancias son significativas o no. Un residuo estandarizado significativo
la covarianza es una con un valor absoluto mayor que 2.58. Covarianzas residuales significativas
disminuir significativamente el ajuste de su modelo. Corregir el ajuste del modelo según la matriz de residuos es similar a corregir
ajuste del modelo según los índices de modificación. Se aplican las mismas reglas. Para un desglose más específico de cómo
para calcular y localizar residuos, consulte el tutorial en video de CFA. Sin embargo, cabe señalar que
En la práctica, nunca me dirijo a las SRC a menos que no pueda lograr un ajuste adecuado a través de los índices de modificación.
porque abordar los SRCs requiere la eliminación de elementos.
Validez y Fiabilidad
CR > 0.7
Validez convergente
Hair, J., Black, W., Babin, B., y Anderson, R. (2010). Análisis de datos multivariantes (7ª ed.):
Prentice-Hall, Inc. Upper Saddle River, NJ, EE. UU.
AVE es una medida estricta de validez convergente. Malhotra y Dash (2011) señalan que 'AVE es un'
medida más conservadora que CR. Basándose únicamente en CR, el investigador puede concluir
que la validez convergente del constructo es adecuada, a pesar de que más del 50% de los
la varianza se debe al error.” (Malhotra y Dash, 2011, p.702).
Malhotra N. K., Dash S. (2011). Investigación de Mercados con una Orientación Aplicada. Londres:
Pearson Publishing.
Aquí hay un video actualizado que utiliza el paquete de herramientas estadísticas más reciente, que incluye un más
medida precisa de AVE y CR.
Variable de Marcador
Este método es simplemente una forma extendida y más precisa de hacer el común factor latente.
método. Para este método, solo agrega otro factor latente al modelo (como en la figura de abajo), pero
asegúrate de que sea algo que no esperarías que se correlacione con los otros factores latentes en
el modelo (es decir, las variables observadas para este nuevo factor deberían tener una baja o nula correlación con
las variables observadas de los otros factores). Luego agrega el factor latente común. Este método
saca a relucir una varianza común más verdadera que el método básico del factor latente común porque es
encontrar la varianza común entre factores latentes no relacionados. Así, cualquier varianza común es
probablemente debido a un sesgo del método común, en lugar de correlaciones naturales. Este método es
demostrado en el tutorial de video sobre sesgo del método común.
Restricciones Cero y Iguales
El enfoque más actual y mejor se describe a continuación.
fuentes específicas de sesgo que pueden dar cuenta de la varianza compartida no debido a una causal
2. Hacer el CFA con constructos de SB covariados con otros constructos (esto parece normal)
CFA).
1. Evaluar y ajustar para lograr una adecuadada calidad de ajuste
2. Si el cambio en el AVE es extremo (por ejemplo, >.300), entonces hay demasiada varianza compartida
atributable a una variable de respuesta. Esto significa que esa variable está comprometida y
cualquier análisis posterior con ello puede estar sesgado.
constriñan los suyos a cero. Luego realiza una prueba de diferencia de chi-cuadrado entre
los modelos restringidos y no restringidos.
2. Si la hipótesis nula no puede ser rechazada (es decir, la restringida y la no restringida
los modelos son los mismos o "invariantes"), has demostrado que eras
no se puede detectar ningún sesgo de respuesta específico que afecte a su modelo. Puede moverse
pasando a la modelización causal, pero asegúrate de retener el/los constructo(s) de SB para incluir como
validez y ajuste del modelo con este modelo de medición final (no restringido), ya que
puede haber cambiado.
5. Si la prueba de diferencia chi-cuadrado con restricciones en cero resultó en un resultado significativo (es decir, rechazar
nulo, es decir, el sesgo de respuesta no es cero), entonces debes realizar una prueba de igualación restringida. Esto
La prueba determina si el sesgo de respuesta está distribuido de manera equitativa entre los factores.
1. Para hacer esto, limita todos los caminos desde el constructo SB a todos los indicadores (sin incluir
su propio) para ser iguales. Hay múltiples formas de hacer esto. Una forma fácil es
simplemente llamarlos a todos lo mismo (por ejemplo, "aaa").
análisis. Toma nota de esto en tu informe. p.ej., "Una prueba de sesgo específico igual"
demostró un sesgo distribuido de manera desigual.
Métrico
Si pasamos la prueba de invariancia configuracional, entonces necesitamos probar la invariancia métrica. Para probar la
invarianza métrica, simplemente realiza una prueba de diferencia chi-cuadrado en los dos grupos tal como lo harías
para un modelo estructural. La evaluación es la misma que en la prueba de invarianza del modelo estructural: si
tienes un valor p significativo para la prueba de diferencia de chi-cuadrado, entonces tienes evidencia de
diferencias entre grupos, de lo contrario, son invariantes y puedes proceder a hacer tu
compuestos de este modelo de medición (pero asegúrate de usar todo el conjunto de datos cuando lo hagas)
crea compuestos, en lugar de usar el conjunto de datos dividido).
Un enfoque aún más simple y menos que consume tiempo para la invariancia métrica es realizar un
prueba de moderación multigrupo utilizando razones críticas para diferencias en AMOS. A continuación se presenta un video para
explica cómo hacer esto. El video trata sobre muchas cosas en el CFA, pero el enlace a continuación comenzará
tú en el punto de tiempo para probar la invariancia métrica con razones críticas.
1. Índices de modificación: Ajusta el modelo para cada grupo utilizando la medición no restringida.
modelo. Puedes alternar entre grupos al observar los índices de modificación. Así que, para
ejemplo, para los masculinos, podría haber un alto MI para la covarianza entre e1 y e2, pero para
para las mujeres, esto podría no ser el caso. Adelante y agrega esas covarianzas adecuadamente para
ambos grupos. Al agregarles al modelo, lo hace para ambos grupos, incluso si solo
necesitaba hacerlo para uno de ellos. Si ajustar el modelo de esta manera no soluciona tu invariancia
cuestiones, entonces necesitarás observar las diferencias en los pesos de regresión.
2. Pesos de regresión: Necesitas averiguar qué elemento o elementos están causando el problema
(es decir, cuáles no miden lo mismo entre grupos). La causa de la falta de
la invariancia se debe en gran medida a una de dos cosas: la fuerza de la carga para uno o más
los elementos difieren significativamente entre grupos, o, un elemento o dos se cargan mejor en un factor diferente de
su propio para uno o más grupos. Para abordar el primer problema, solo mire los estandarizados
pesos de regresión para cada grupo para ver si hay diferencias importantes (solo a simple vista). Si
encuentras un peso de regresión que es excepcionalmente diferente (por ejemplo, el ítem 2 en el Factor 3
tiene una carga de 0.34 para hombres y 0.88 para mujeres), entonces es posible que necesite eliminar ese elemento
si es posible. Vuelve a probar y ve si se solucionan los problemas de invariancia. Si no, intenta abordar el segundo
cuestión (explicada a continuación).
habla un poco sobre esto en mi video llamado“Ajuste del modelo durante un Análisis Factorial Confirmatorio
(CFA) en AMOS” alrededor de la marca de las 8:35. Esta matriz también se puede alternar entre grupos.
Aquí hay un pequeño ejemplo para los CSR y los BCR. Observamos que para el grupo BCR rd3 y q5
tienen altas covarianzas residuales estandarizadas con sw1. Así que podríamos eliminar sw1 y ver si
eso arregla las cosas, pero SW solo tiene tres artículos en este momento, así que otra opción es eliminar rd3 o
q5 y ve si eso soluciona las cosas, y si no, entonces regresa a esta matriz después de volver a ejecutar las cosas, y
ver si hay otros problemas. Quitar elementos con moderación, y solo uno a la vez, intentando tu
es mejor dejar al menos tres elementos con cada factor, aunque dos elementos también a veces
trabaja si es necesario (dos se vuelven inestables). Si aún tienes problemas, entonces tus grupos son
excepcionalmente diferente... Esto puede deberse a un tamaño de muestra pequeño para uno de los grupos. Si tal
si ese es el caso, entonces es posible que tengas que listar eso como una limitación y simplemente seguir adelante.
La mejor manera de abordar CMB es simplemente no restringirlos a ser iguales. En cambio, es mejor hacer un
prueba de diferencia de chi-cuadrado entre el modelo no restringido (con CLF y marcador si
disponible) y el mismo modelo pero con todos los caminos del CLF restringidos a cero. Esto indica
si la varianza común es diferente de cero.
3. CFA con varianzas de error negativas
Esto no debería suceder si todo el análisis de datos y EFA funcionaron bien, pero aún sucede... En
en tales casos, se permite restringir la varianza del error a un pequeño número positivo (por ejemplo,
0.001)
4. CFA con covarianzas de error negativas (a veces aparece como “no definida positiva”)
En tales casos, generalmente hay un problema de medición más profundo (como la asimetría o la curtosis,
o demasiados datos faltantes, o una variable que es nominal). Si no se puede solucionar abordando
estos problemas más profundos, entonces podrías corregirlo moviendo la variable latente
restricción de ruta (generalmente 1) a otra ruta. Por lo general, este problema acompaña al error negativo
varianza, por lo que normalmente podemos solucionarlo corrigiendo primero la varianza de error negativa.
Esto a menudo sucede cuando solo tenemos dos elementos para una variable latente, y uno de ellos es
muy dominante. Primero intenta mover la restricción de ruta de la variable latente a una ruta diferente. Si esto
no funciona entonces, mueve la restricción de la ruta hacia la restricción de la varianza de la variable latente Y
constriñan los caminos a ser iguales (nombrándolos ambos igual, como "aaa").
Esto no debería suceder si la solución EFA fuera satisfactoria. Sin embargo, todavía sucede.
a veces cuando dos factores latentes están fuertemente correlacionados. Esta fuerte correlación es un signo de
rasgos superpuestos. Por ejemplo, confianza y autoeficacia. Estos dos rasgos son demasiado similares.
Cualquiera de los dos podría ser eliminado, o podrías crear un factor de segundo orden a partir de ellos:
A veces, el CFA dirá que necesitas imponer 1 restricción adicional (a veces dice
más que esto). Esto suele ser causado por dibujar el modelo incorrectamente. Verifique si todos
las variables latentes tienen un solo camino restringido a 1 (o la varianza de la variable latente
confinado a 1).
Modelado de Ecuaciones Estructurales
La modelación de ecuaciones estructurales (SEM) surge de y sirve propósitos similares a los múltiples
regresión, pero de una manera más poderosa que toma en cuenta el modelado de interacciones,
no linealidades, independientes correlacionados, error de medición, términos de error correlacionados, múltiples latentes
independientes cada uno medido por múltiples indicadores, y uno o más dependientes latentes también
cada uno con múltiples indicadores. SEM puede ser utilizado como una alternativa más poderosa a múltiples
regresión, análisis de trayectorias, análisis factorial, análisis de series temporales y análisis de covarianza. Eso
es, estos procedimientos pueden verse como casos especiales de SEM, o, para decirlo de otra manera, SEM es un
extensión del modelo lineal general (MLG) del cual la regresión múltiple es un
parte.http://www.pire.org/
SEM es un concepto paraguas para análisis como mediación y moderación. Esta página wiki
proporciona instrucciones generales y orientación sobre cómo escribir hipótesis para diferentes tipos de
SEMs, qué hacer con las variables de control, mediación, interacción, análisis de múltiples grupos y modelo
ajustados para modelos estructurales. Se proporcionan videos y presentaciones en diapositivas en las subsecciones.
¿Conoces algunas citas que se podrían usar para apoyar los temas y procedimientos?
¿se discutió en esta sección? Por favormándamelos por correo electrónicocon el nombre de la sección, procedimiento o
subsección que apoyan. ¡Gracias!
Contenidos
[ocultar]
1 Hipótesis
o1.1 Efectos directos
o1.2 Efectos mediadores
o1.3 Efectos de interacción
o1.4 Efectos de múltiples grupos
6 Multicupos
7 Del Modelo de Medición al Modelo Estructural
8 Creando Puntuaciones de Factores a partir de Factores Latentes
9 Necesita más grados de libertad
Hipótesis
Las hipótesis son un piedra angular de la teoría causal. Sin embargo, redactar hipótesis es claramente una lucha.
para muchos investigadores (simplemente selecciona al azar cualquier artículo de una buena revista académica y cuenta
¡los problemas de redacción!). En esta sección ofrezco ejemplos de cómo podrías redactar diferentes tipos de
hipótesis. Estos ejemplos no son exhaustivos, pero son seguros.
Efectos directos
La dieta tiene un efecto positivo en la pérdida de peso
Un aumento en las horas dedicadas a ver televisión afectará negativamente la pérdida de peso
Efectos mediadores
Para los efectos mediadores, asegúrate de indicar la dirección de la mediación (positiva o negativa), el
grado de la mediación (parcial, total o simplemente indirecta), y la dirección de la mediación
relación (positiva o negativa).
El ejercicio media de manera positiva y parcial la relación positiva entre la dieta y la pérdida de peso
El tiempo de televisión media positiva y completamente la relación positiva entre la dieta y el peso
pérdida
La dieta afecta la pérdida de peso de manera positiva e indirecta a través del ejercicio
Efectos de interacción
El ejercicio modera positivamente la relación positiva entre la dieta y la pérdida de peso.
El ejercicio amplifica la relación positiva entre la dieta y la pérdida de peso
El tiempo de televisión modera negativamente (reduce) la relación positiva entre la dieta y la pérdida de peso
Efectos multi-grupo
El Índice de Masa Corporal (IMC) modera la relación entre el ejercicio y la pérdida de peso, de tal manera que
para aquellos con un IMC bajo, el efecto es negativo (es decir, aumentas de peso - masa muscular), y para
para aquellos con un IMC alto, el efecto es positivo (es decir, hacer ejercicio lleva a la pérdida de peso)
La edad modera la relación entre el ejercicio y la pérdida de peso, de tal manera que para la edad < 40,
el efecto positivo es más fuerte que para la edad > 40
La dieta modera la relación entre el ejercicio y la pérdida de peso, de tal manera que para las dietas occidentales
el efecto es positivo y débil, para las dietas del este (asia), el efecto es positivo y fuerte
Moderación Mediada
Un ejemplo de una hipótesis de moderación mediada sería algo así:
Las preocupaciones éticas fortalecen el efecto indirecto negativo (a través del agotamiento) entre el cliente
rechazo y satisfacción laboral.
En este caso, la IV es el rechazo del cliente, la DV es la satisfacción laboral, y el burnout es el mediador, y
el moderador son preocupaciones éticas. La moderación se lleva a cabo a través de una interacción. Sin embargo,
si tienes un moderador categórico, sería algo más como esto (usando el género como el
moderador):
El efecto indirecto negativo entre el rechazo del cliente y la satisfacción laboral (a través del agotamiento) es
más fuerte para los hombres que para las mujeres.
Manejo de controles
Al incluir controles en las hipótesis (sí, debes incluirlos), simplemente añádelos al final de
cualquier hipótesis, "cuando se controla por...[listar aquí las variables de control]" Por ejemplo:
El ejercicio modera positivamente la relación positiva entre la dieta y la pérdida de peso cuando
controlando el tiempo de televisión y la dieta
La dieta tiene un efecto positivo en la pérdida de peso cuando se controla el tiempo frente a la televisión y la dieta.
Otro enfoque es declaran en algún lugar arriba tus hipótesis (mientras configuras tu)
teoría) que todas sus hipótesis tienen en cuenta los efectos de los siguientes controles: A, B, y
C. Y luego asegúrate de explicar por qué.
Controles
LECCIÓN:Controles
Los controles son variables potencialmente confundidoras que necesitamos tener en cuenta, pero que no impulsan nuestra
teoría. Por ejemplo, en Dietz y Gortmaker 1985, su teoría era que el tiempo frente a la televisión tenía un efecto negativo
efecto en el rendimiento escolar. Pero hay muchas cosas que podrían afectar el rendimiento escolar,
posiblemente incluso más que la cantidad de tiempo pasado frente a la televisión. Así que, para contar con
estas otras variables de confusión potencial, los autores las controlan. Básicamente son
diciendo que, independientemente del CI, el tiempo dedicado a leer por placer, las horas pasadas haciendo la tarea, o
la cantidad de tiempo que los padres pasan leyendo a su hijo, un aumento en el tiempo de televisión sigue siendo significativamente
disminuye el rendimiento escolar. Estas relaciones se muestran en la figura a continuación.
Como nota de precaución, casi siempre debes incluir algunos controles; sin embargo, estos controles
las variables todavía cuentan contra los cálculos del tamaño de su muestra. Por lo tanto, cuantas más variables de control tenga, más
más grande debe ser tu tamaño de muestra. También obtienes un R cuadrado más alto pero con valores cada vez más pequeños.
ganancias por cada control añadido. A veces incluso puede encontrar que agregar un control "ahoga" a todos
los efectos de las IV, en tal caso es posible que necesites realizar tus pruebas sin esa variable de control
(pero entonces solo puedes decir que tus IVs, aunque significativas, solo representan una pequeña cantidad de
la varianza en la DV). Con eso en mente, no puedes y no deberías controlar todo, y como
siempre, tu decisión de incluir o excluir controles debe basarse en la teoría.
Manejar controles en AMOS es fácil, pero desordenado (ver la figura a continuación). Simplemente los tratas como
las otras variables exógenas (las que no tienen flechas que apuntan hacia ellas), y tenerlas
regresar sobre cualquiera de las variables endógenas que puedan afectar lógicamente. En este caso, yo tengo
valShort, una variable potencialmente confusante, como control, con respecto a valLong. Y tengo
LoyRepeat como un control en LoyLong. También he covariado los controles entre sí y con el
otras variables exógenas. Al usar controles en un análisis de mediación moderada, adelante
y poner los controles al principio. Variables de control covariantes con las otras
Las variables exógenas se pueden determinar en función de la teoría, en lugar de ser predeterminadas. Sin embargo, hay
diferentes escuelas de pensamiento sobre esto. El inconveniente de covariar con todas las variables exógenas es
que no obtienes grados de libertad. Si necesitas grados de libertad, intenta eliminar
las covariables no significativas con controles.
Al informar sobre el modelo, debes incluir los controles en todas tus pruebas y resultados, pero
deberías consolidarlos al final donde puedan estar fuera del camino. Además, solo para que sepas
no tengas ideas locas, no probarías ninguna mediación entre un control y un
variable dependiente. Sin embargo, puedes informar cómo el control afecta a una variable dependiente.
diferentemente basado en una variable moderadora. Por ejemplo, valshort puede tener un efecto más fuerte en
valLong para hombres que para mujeres. Esto es algo que debería ser informado, pero no necesariamente.
enfocado en, ya que no es probable que sea una parte clave de tu teoría. Por último, incluso si los efectos de los controles no son
significativo, no necesitas recortarlos de tu modelo (aunque, también hay otras escuelas de
pensamiento sobre este tema).
Mediación
Interacción
LECCIÓN:Efectos de interacción
Concepto
En diseños factoriales, los efectos de interacción son los efectos conjuntos de dos variables predictoras además de
los efectos principales individuales. Esta es otra forma de moderación (junto con la agrupación múltiple) –es decir,
la relación X a Y cambia de forma (se fortalece, se debilita, cambia de signo) dependiendo de la
valor de otra variable explicativa (el moderador). Así que, por ejemplo
El chocolate es delicioso
El queso es delicioso
Ya realizaste el ajuste del modelo en tu CFA, pero necesitas hacerlo de nuevo en tu modelo estructural en
orden para demostrar una exploración suficiente de modelos alternativos. Cada vez que el modelo cambia
y una hipótesis es probada, se debe evaluar el ajuste del modelo. Si se prueban múltiples hipótesis en el
mismo modelo, el ajuste del modelo no cambiará, por lo que solo necesita ser abordado una vez para ese conjunto de
hipótesis. El método para evaluar el ajuste del modelo en un modelo causal es el mismo que para un
modelo de medición: mira los índices de modificación, los residuos y las medidas de ajuste estándar como CFI,
RMSEA etc. Sin embargo, una cosa que debe señalarse aquí en particular es la lógica que debería
determina cómo aplicas los índices de modificación a los términos de error.
Si las variables correlacionadas no están lógicamente correlacionadas causalmente, sino meramente estadísticamente.
correlacionados, entonces puedes covariar los términos de error para tener en cuenta lo sistemático
Esperamos que estos tengan valores similares (residuos) porque son lógicamente similares y
tienen redacción similar en nuestra encuesta, pero no necesariamente tienen ningún vinculo causal.
Si las variables correlacionadas están lógicamente correlacionadas causalmente, entonces simplemente añade una línea de regresión.
por ejemplo, el agotamiento de los clientes está altamente correlacionado con la satisfacción de los clientes
Multigrupo
VIDEO TUTORIAL: Prueba de moderación de múltiples grupos utilizando la diferencia de chi-cuadrado
prueba
TUTORIAL EN VIDEO:Pruebas de diferencias entre múltiples grupos utilizando el multigrupo de AMOS
función
LECCIÓN:Mediación frente a Moderación
Las comparaciones entre múltiples grupos son una forma especial de moderación en la que un conjunto de datos se divide según valores.
de una variable de agrupamiento (como el género), y luego se prueba un modelo dado con cada conjunto de datos.
Usando el ejemplo de género, el modelo se prueba para hombres y mujeres por separado. El uso de
las comparaciones de múltiples grupos tienen como objetivo determinar si las relaciones hipotetizadas en un modelo diferirán según
sobre el valor del moderador (por ejemplo, género). Tomar la hipótesis de la dieta y la pérdida de peso para
ejemplo. Un análisis de múltiples grupos respondería a la pregunta: ¿afecta la dieta a la pérdida de peso?
¿diferente para hombres que para mujeres? En los videos de arriba, aprenderás cómo configurar un
análisis multigrupo en AMOS, y probarlo utilizando diferencias de chi-cuadrado, y la función integrada de AMOS
función de multigrupo. Para aquellos que han visto mi video sobre el enfoque de relaciones críticas, estén advertidos
que actualmente, el enfoque de chi-cuadrado es el más ampliamente aceptado porque las razones críticas
el enfoque no toma en cuenta el error familiar que afecta a un modelo al probar múltiples
hipótesis simultáneamente. Por ahora, recomiendo usar el enfoque de chi-cuadrado. El AMOS
la función multigrupo incluida también utiliza el enfoque de chi-cuadrado.
Si deseas crear puntuaciones de factores (como se utiliza en muchos de los videos) a partir de factores latentes, es un
cosa fácil de hacer. Sin embargo, debes recordar dos advertencias muy importantes:
No se permite tener ningún valor faltante en los datos utilizados. Estos necesitarán ser
imputado previamente en SPSS o Excel (tengo dos herramientas para esto en mi Paquete de Herramientas Estadísticas -
uno para imputar, y uno para simplemente eliminar toda la fila que tiene datos faltantes.
Los nombres de los factores latentes no deben tener espacios ni saltos de línea. Deben ser únicos.
cadenas continuas ("FactorUno" o "Factor_Uno" en lugar de "Factor Uno").
Después de abordar esas dos advertencias, entonces simplemente puedes ir al menú Analizar, y
Selectar Imputación de Datos. Seleccionar Imputación de Regresión, y luego hacer clic en el botón Imputar. Esto
creará un nuevo conjunto de datos de SPSS con el mismo nombre que el conjunto de datos actual, excepto que será
seguido de un "_C". Esto se puede encontrar en la misma carpeta que tu conjunto de datos actual.
1. Si hay oportunidades para usar variables latentes en lugar de variables calculadas, use
latentes.
2. Si tienes variables de control, no las vincules a cada otra variable.
3. No incluyas todos los caminos por defecto. Solo incluye los que tengan un buen fundamento teórico.
sentido.
4. Si un camino no es significativo, omítelo. Si hace esto, asegúrese de argumentar que la razón para
hacer esto fue para aumentar los grados de libertad (y también porque el camino no era
significativo).
Aumentar los grados de libertad permite que AMOS calcule las medidas de ajuste del modelo. Si tienes
cero grados de libertad, el ajuste del modelo es irrelevante porque estás 'perfectamente' contabilizando todo
relaciones posibles en el modelo.
Directrices
En esta página de wiki comparto mis pensamientos sobre varios temas académicos, incluyendo mis 10 pasos para
construir un buen modelo de varianza cuantitativa que se pueda abordar utilizando un bien
encuesta diseñada, así como algunas pautas generales para estructurar un modelo cuantitativo
papel de construcción/pruebas. Estas son solo ideas que se me ocurren y no provienen de ningún tipo de
trabajo publicado. Sin embargo, los he encontrado útiles y espero que tú también lo hagas.
Contenidos
[esconder]
o4.1 Tareas críticas que ocurren entre el desarrollo del modelo y las pruebas del modelo
5 Pautas sobre el Diseño de Encuestas
In a page or less, using only bullet points, answer these questions (or fill out this outline). Then
compártelo con un asesor de confianza (no conmigo a menos que realmente sea tu asesor) para obtener comentarios anticipados.
De esta manera no pierdes tu tiempo en una idea mala o a medio cocinar. También podrías considerar
revisando el editorial de Arun Rai en MISQ titulado: "Evitando Errores Tipo III: Formulando"
Problemas de investigación que importan.
generalizable a todos los campos.
1. ¿Cuál es el problema que estás buscando abordar? (Si no hay problema, entonces no hay
normalmente no se requiere investigación.
2. ¿Por qué es este un problema contemporáneo o próximo importante (no solo interesante)? (es decir,
los viejos problemas no necesitan ser abordados de nuevo si ya no son un problema
3. ¿Quién más ha abordado este problema? (Muy rara vez la respuesta a esto es: "nadie". Sé
creativo. Alguien ha estudiado algo relacionado con este problema, aunque no sea exactamente el mismo.
mismo problema. Esto requiere una revisión de la literatura.
4. ¿De qué manera los esfuerzos anteriores de otros son incompletos? (es decir, si otros ya han realizado)
abordó el problema, ¿qué queda por estudiar - cuáles son las "brechas"?
5. ¿Cómo planeas llenar estos vacíos en la investigación previa? (es decir, diseño del estudio)
1. Identifica y define tus variables dependientes. Estas deberían ser el/los resultado(s) de la
fenómeno que te interesa entender mejor. Deberían ser los afectados
cosa(s) en tus preguntas de investigación.
3. Formule una o dos preguntas de investigación en torno a la explicación y predicción de estas DVs.
1. Delimitar tus preguntas de investigación también puede requerir que identifiques tu población.
4. ¿Existe alguna teoría existente que ayude a explorar estas preguntas de investigación?
1. Si es así, ¿cómo podemos adoptarlo para explorar específicamente esta investigación?
¿Preguntas?
2. ¿Esa teoría también sugiere otras variables que no estamos considerando?
5. ¿Qué piensas (y qué ha dicho la investigación) que impacta las DVs que hemos elegido?
1. Estos se convierten en IVs.
6. ¿Qué es lo que causa este efecto en las DVs por parte de estas IVs?
Estos se convierten en Mediadores.
7. ¿Dependen estas relaciones de otros factores, como la edad, el género, la raza, la religión?
industria, tamaño de la organización y rendimiento, etc.?
Estos se convierten en Moderadores
8. ¿Qué variables podrían explicar y predecir potencialmente las DVs, pero no están directamente relacionadas?
¿a nuestros intereses?
1. Estos se convierten en variables de control. A menudo son algunos de esos moderadores como
¿preguntas?
10. Basado en todo lo anterior, pero particularmente en el #4, desarrolla un modelo conceptual inicial.
propio. Para obtener pautas sobre cómo diseñar su encuesta, consulte la siguiente
sección#Directrices_sobre_Diseño_de_Encuestas
2. Encontrar escalas existentes
3. A lo largo de esta idea de adaptación, también puedes ajustar la escala según sea necesario. Muchos
Desarrollar nuevas escalas es un poco más complicado, pero quizás sea menos abrumador que
muchos lo hacen parecer. Lo primero que debes hacer antes de desarrollar
tu propia escala es definir con precisión tu constructo. No puedes
desarrollar nuevas medidas para un constructo si no sabes con precisión qué
eres tú a quien esperas medir.
2. Una vez que hayas definido tu constructo, te recomiendo encarecidamente desarrollar
escalas reflectantes donde sea aplicable. Son mucho más fáciles de manejar
estadísticamente, y son más propensos a enfoques convencionales de SEM.
Las medidas formativas también se pueden utilizar, pero implican varias advertencias
3. Si estás desarrollando tus propias escalas, haz pruebas preliminares (hablar en voz alta, Q-sort)
1. Para asegurar que las escalas recién desarrolladas tengan sentido para los demás y con suerte
mide el constructo que crees que deberían medir, necesitas hacer algo
pretest. Dos ejercicios de pretest muy comunes son 'hablar en voz alta' y 'Q-sort'.
Los ejercicios de hablar en voz alta incluyen sentarse con entre cinco y ocho.
individuos que están dentro, o cerca de, su población objetivo. Para
Ejemplo, si planeas encuestar a enfermeras, entonces deberías hablar-
en voz alta con enfermeras. Si estás encuestando a un grupo más difícil de acceder
población, como los CEOs, probablemente puedes salir bien haciendo charlas-
en voz alta con la alta dirección en su lugar. El propósito de la charla -
en voz alta es para ver si los nuevos elementos desarrollados tienen sentido para otros. Invitar
en voz alta, revisa tus elementos en consecuencia y luego haz la segunda exposición en voz alta.
1. Antes de que puedas enviar tu estudio para la aprobación de la IRB, debes identificar a quién harás
o posiblemente cirujanos residentes. Los plazos también son reales, y los estudios piloto toman
tiempo, aunque pueden ahorrarte tiempo al final. Si los resultados del piloto
el estudio revela bajos alfa de Cronbach, o cargas pobres, o cruces significativos
cargas, deberías revisar tus elementos en consecuencia. Pobre alfa de Cronbach y
cargas pobres indican demasiada inconsistencia conceptual entre los ítems
dentro de un constructo. Cargas cruzadas significativas indican demasiada conceptualidad
superposición entre elementos a través de construcciones separadas.
Una vez que hayas identificado tu población y obtengas la confirmación de que estarás
capaz de recopilar datos de ellos, ahora estás listo para enviar tu estudio para
aprobación de su IRB local. No puede publicar ningún trabajo que incluya datos
recogido antes de obtener la aprobación de IRB. Esto significa que si hiciste un estudio piloto
antes de obtener la aprobación, no puedes usar esos datos en la muestra final (aunque
todavía puedes decir que hiciste un estudio piloto). La aprobación del IRB puede tardar entre 3
días y 6 semanas (o más), dependiendo de la naturaleza de su estudio y el
población que pretendes objetivo. Normalmente los estudios de organizaciones sobre
el rendimiento y las disposiciones e intenciones de los empleados son simples y no se complican
retenido en revisión del IRB. Estudios que implican cualquier forma de engaño o riesgo
(físico, psicológico o financiero) para los participantes requiere una consideración adicional
y puede requerir defensa oral ante el IRB.
7. Recopilar datos
¡Lo has conseguido! Es hora de recopilar tus datos. Esto podría llevar entre
tres días y tres meses, dependiendo de muchos factores. Esté preparado para enviar
recordatorios. Los incentivos tampoco harán daño. También prepárate para obtener solo una fracción.
de las respuestas que esperabas. Por ejemplo, si estás dirigido a una lista de correos de
10,000 gerentes de marca, esperan que la mitad de los correos electrónicos queden abandonados, tres
cuartos del resto para no ser leídos, y luego el 90% del resto para ir
ignorado. Eso nos deja con solo 125 respuestas, de las cuales el 20% puede ser
inutilizable, dejando así solo 100 respuestas utilizables de nuestra original
10,000.
8.Prueba tu modelo
1. ver la siguiente sección
1. Asegúrate de que estás utilizando medidas formativas o reflexivas de manera intencional (es decir, sabe cuáles
los que son y sean coherentes). Si planeas usar AMOS, asegúrate de que todos
las medidas son reflexivas, o estar dispuesto a crear puntuaciones calculadas a partir de tu formativa
medidas.
2. Si se utilizan medidas reflexivas, asegúrese de que sean verdaderamente reflexivas (es decir, que todos los ítems
acuerdo) para todo, incluso cuando no es apropiado. Por ejemplo, si el ítem es “Tengo
recibí comentarios de mi supervisor directo”, una escala de acuerdo no tiene sentido. Es
una pregunta de sí/no. Podrías quizás cambiarla a una escala de frecuencia: 1=nunca,
5=diariamente, pero una escala de acuerdo no es correcta.
5. En la misma línea, asegúrate de que tus medidas no sean sí/no, verdadero/falso, etc.
están destinados a pertenecer a construcciones reflexivas.
6. Asegúrate de que las escalas vayan de izquierda a derecha, de baja a alta, de negativa a positiva, de ausencia a
presencia, y así sucesivamente. Esto es para que cuando comiences a usar estadísticas sobre los datos, un
flexibilidad para crear más tarde cubos de igual tamaño si así lo deseas. Esto también te brinda una experiencia más rica
datos.
8. Sin embargo, asegúrate de restringir qué tipos de respuestas se pueden dar para los números. Para
ejemplo, en lugar de preguntar la edad de alguien con un cuadro de texto, usa un control deslizante. Esto
el software estadístico no sabe que esos números son inválidos, así que los utiliza como válidos
puntos de datos.
10. A pesar de la literatura que afirma lo contrario, he encontrado que las preguntas codificadas al revés son un perpetuo
pesadilla. Casi siempre fallan en el análisis factorial porque algunas culturas son
atraídos al extremo positivo de la escala, mientras que otros son atraídos al extremo negativo de la
escala. Así que rara vez capturan realmente el rasgo de la manera en que lo intentas. Cuando diseño nuevo
encuestas, casi siempre re-revierto las preguntas con codificación inversa para que estén en el mismo
dirección como los artículos regulares.
11. Mide solo una cosa con cada elemento. No preguntes sobre dos cosas a la vez. Por ejemplo,
no incluyas artículos como este: “Prefiero la comunicación cara a cara y no me gusta hablar a través de
conferencia web.” Esto pregunta sobre dos cosas separadas. ¿Qué pasa si les gusta ambas?
12.No hagas suposiciones con tus medidas. Por ejemplo, este ítem asume que todos
pierdo los estribos: “Cuando pierdo los estribos, es difícil pensar a largo plazo.”
13. Asegúrate de que tus elementos sean aplicables a todos dentro de tu población muestreada. Para
ejemplo, no incluyas elementos como este: "Mis hijos son un desafío." ¿Qué pasaría si este encuestado
¿No tiene hijos? ¿Cómo deberían responder?
14. Ten cuidado al incluir preguntas sensibles, o preguntas que tengan una forma socialmente deseable de
Responder. Las obvias podrían ser como: “A veces robo de la oficina” o “No
informe todos mis activos en mis formularios de impuestos”. Independientemente de la verdad real, los encuestados
ingresar la respuesta más favorable. Medidas más sutiles podrían incluir: “Yo considero
"yo mismo soy un pensador crítico" o "a veces pierdo el autocontrol". Estos son menos obvios, pero
aún resultará en respuestas sesgadas porque todos piensan que son pensadores críticos y
nadie quiere admitir que tiene algo menos que el control total sobre sus emociones
y a uno mismo.
15.Incluye una trampa de atención ocasional para que puedas atrapar a aquellos que están respondiendo
sin pensar. Tales artículos deben mezclarse con los artículos regulares y no deben
destacar. Por ejemplo, si un conjunto de artículos regulares comienza todos con 'Mi equipo de proyecto a menudo...'
entonces asegúrate de formular tu trampa de atención de la misma manera. Por ejemplo, “Mi equipo de proyecto
2. Respuestas no comprometidas
3. Selección de Variables
1. Datos faltantes en las columnas
2. Asimetría y Curtosis
4. Análisis Factorial Exploratorio
1. Itera hasta que llegues a una matriz de patrones limpia
2. Adecuación
3. Validez convergente
4. Validez discriminante
5. Confiabilidad
5. Análisis factorial confirmatorio
1. Obtener un modelo aproximadamente decente rápidamente (ajuste del modelo superficial, validez)
2. Realizar pruebas de invariancia configuracional, métrica y escalar (si se utiliza una variable de agrupamiento en
modelo causal
3. Comprobación de validez y fiabilidad
4. Sesgo de respuesta (también conocido como sesgo de método común, use variable(s) de sesgo específicas si
posible
5. Ajuste del modelo de medición final
6. Modelos Estructurales
1. Suposiciones multivariadas
1. Valores atípicos e influyentes
2. Multicolinealidad
2. Incluir variables de control en todos los análisis siguientes
3. Mediación
1. Probar efectos indirectos utilizando bootstrapping
2. Si tienes múltiples caminos indirectos desde la misma IV hasta el mismo DV, usa AxB
estimador
4. Interacciones
1. Opcionalmente, estandarizar las variables constitutivas
5. Comparaciones Multigrupo
1. Crear múltiples modelos
2. Asignarles los datos del grupo apropiado
3. Prueba de la significancia de la moderación a través de la prueba de diferencia de chi-cuadrado
¿Cuál es el problema?
¿Por qué importa?
¿Cómo abordas el problema?
¿Qué encontraste?
¿Cómo cambia esto la práctica (lo que la gente en los negocios hace), y cómo cambia?
investigación (existente o futura)?
Palabras clave (4-10 palabras clave que capturan el contenido del estudio)
Organizaciones, etc.).
Si estás basando tu modelo en una teoría/modelo existente, utiliza este siguiente espacio para explicar
esa teoría (1 página) y luego explica cómo has adaptado esa teoría a tu estudio.
Si no estás basando tu modelo en una teoría/modelo existente, utiliza este siguiente espacio para
explicar cómo la literatura existente en su campo ha intentado predecir su(s) DV(s) o ha intentado
entender preguntas de investigación relacionadas.
(Opcionalmente) Explica qué otros constructos sospechas que ayudarán a predecir tu(s) DV(s) y
por qué. La inclusión de un constructo debe tener una buena base lógica/teórica y/o bibliográfica
apoyo. Por ejemplo, “estamos incluyendo la construcción xyz porque la teoría en la que nos basamos
nuestro modelo incluye xyz.” O, “estamos incluyendo el constructo xyz porque lo siguiente
la lógica (abc) nos obliga a incluir esta variable para no ser descuidados”. Intenta hacer esto
sin repetir todo lo que vas a decir en la sección de teoría de todos modos.
(Opcionalmente) Discuta brevemente las variables de control y por qué se incluyen.
Teoría y Hipótesis (toma el espacio que necesites, pero trata de ser parsimonioso)
Resume brevemente tu modelo conceptual y muéstralo con las hipótesis etiquetadas (si
posible).
Comience apoyando H1 y luego declare H1 formalmente. El apoyo debe incluir una lógica causal sólida.
y literatura.
H2, H3, etc. Si tiene subhipótesis, enumérelas como H1a, H1b, H2a, H2b, etc.
Métodos (mantenerlo breve; muchos enfoques; este es solo un template común)
Construir operacionalización (¿de dónde obtuviste tus medidas?)
Desarrollo de instrumentos (si creaste tus propias medidas)
Explicación del diseño del estudio (por ejemplo, pretest, piloto y encuesta en línea)
Muestreo (algunas estadísticas descriptivas, como demografía (educación, experiencia, etc.),
tamaño de muestra; no olvides discutir la tasa de respuesta (número de respuestas como un porcentaje
de la cantidad de personas invitadas a realizar el estudio.)
Mencione que se concedió el estatus de exención de IRB y que se siguieron los protocolos si es aplicable.
Método para probar hipótesis (por ejemplo, modelado de ecuaciones estructurales en AMOS). Si tú
realizó comparaciones de múltiples grupos, mediación y/o interacción, explique cómo mantuvo
todos seguidos y cómo los analizaste. Por ejemplo, si lo hiciste
mediación, ¿qué enfoque tomaste (esperemos que fuera bootstrap)? ¿Hubo múltiples?
modelos probados, ¿o mantuviste todas las variables para todos los análisis? Si hiciste interacción,
¿Lo añadiste después, o ya estaba desde el principio?
Análisis (1-3 páginas; a veces combinado con la sección de métodos)
Filtrado de Datos
EFA (matriz de patrones del informe y alfas de Cronbach en el apéndice) - mencionar si los ítems fueron
dejado caer.
CFA (solo menciona que lo hiciste y menciona cualquier problema que encontraste) - menciona cualquier artículo
se eliminó durante el CFA. Informe sobre el ajuste del modelo para el modelo de medición final.
Mencione el enfoque CMB y los resultados y acciones tomadas, si las hay (por ejemplo, si encontró CMB y
tuve que mantener el CLF).
Informe si utilizó el SEM latente completo, o si imputó puntajes de factores para un camino
modelo.
Informe el/los modelo(s) estructural(es) final(es) (incluya R-cuadrados y betas) y el ajuste del modelo para
el(los) modelo(s).
Informe los resultados para cada hipótesis (apoyada o no, con evidencia).
Señala cualquier evidencia no respaldada o contraria (significativa en dirección opuesta)
hipótesis.
Proporcione una tabla que resuma concisamente sus hallazgos.
Discusión (2-5 páginas)
Resume brevemente el estudio y su intención y hallazgos, centrándose principalmente en la investigación.
He presentado y asistido a muchas, muchas conferencias. A lo largo de los años, he visto lo bueno, lo
malo y feo en términos de estructura de presentación, contenido y entrega. Aquí hay algunos de mis
pensamientos sobre qué incluir y qué evitar.
Qué incluir en una presentación de conferencia
Completamente innecesario. No tienes tiempo para esto. Solo menciona las piezas clave que estás
basándose en
Enumerar todas las hipótesis y explicar cada una
Solo muestra un modelo (o alguna figura ilustrativa) y señala las partes más importantes
Incluir grandes tablas de estadísticas (para cuantitativos) o citas (para cualitativos)
De nuevo, creemos que hiciste la cosa bien. Leeremos el documento si queremos verificar tu
modelo de medición.
Repetirte demasiado
El tiempo es corto. No hay necesidad de ser redundante.
Usando más palabras que imágenes
Las presentaciones son cortas y también lo son los lapsos de atención. Usa imágenes con pocas palabras solamente.
no puedo leer tu diapositiva y escucharte al mismo tiempo. Apostaría a que preferirías que te escuchara
que lea su diapositiva.
Leyendo toda la presentación preparada...
Sí, eso ha sucedido, más de una vez... cringe...
No tomar notas de los comentarios
Escribe literalmente en papel los comentarios que recibes, incluso si son estúpidos. Esto es solo
respetuoso.