0% encontró este documento útil (0 votos)
13 vistas9 páginas

Dcart

El artículo aborda el uso de modelos de regresión multinivel en psicología escolar, destacando la inadecuación de la regresión clásica ante el muestreo por agrupamientos. Se propone simplificar el análisis multinivel como una generalización del análisis de covarianza, utilizando conceptos estadísticos comunes. Se presentan ejemplos que ilustran cómo estos modelos pueden ofrecer estimaciones más precisas de la variabilidad contextual en el rendimiento académico de los estudiantes.

Cargado por

elena61168
Derechos de autor
© © All Rights Reserved
Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.
Formatos disponibles
Descarga como PDF, TXT o lee en línea desde Scribd
0% encontró este documento útil (0 votos)
13 vistas9 páginas

Dcart

El artículo aborda el uso de modelos de regresión multinivel en psicología escolar, destacando la inadecuación de la regresión clásica ante el muestreo por agrupamientos. Se propone simplificar el análisis multinivel como una generalización del análisis de covarianza, utilizando conceptos estadísticos comunes. Se presentan ejemplos que ilustran cómo estos modelos pueden ofrecer estimaciones más precisas de la variabilidad contextual en el rendimiento académico de los estudiantes.

Cargado por

elena61168
Derechos de autor
© © All Rights Reserved
Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.
Formatos disponibles
Descarga como PDF, TXT o lee en línea desde Scribd

See discussions, stats, and author profiles for this publication at: https://www.researchgate.

net/publication/28112455

Modelos de regresión multinivel: aplicación en psicología escolar

Article · January 2000


Source: OAI

CITATIONS READS
13 411

3 authors:

Pilar Jara Juan C. Oliver


Universitat Jaume I Universitat Jaume I
45 PUBLICATIONS 101 CITATIONS 20 PUBLICATIONS 334 CITATIONS

SEE PROFILE SEE PROFILE

Jesús Fermín Rosel


Universitat Jaume I
105 PUBLICATIONS 591 CITATIONS

SEE PROFILE

Some of the authors of this publication are also working on these related projects:

Cognition in blind children View project

Educational psychology View project

All content following this page was uploaded by Jesús Fermín Rosel on 18 December 2013.

The user has requested enhancement of the downloaded file.


Psicothema ISSN 0214 - 9915 CODEN PSOTEG
2000. Vol. 12, nº 3, pp. 487-494 Copyright © 2000 Psicothema

Modelos de regresión multinivel: aplicación en psicología escolar

Juan C. Oliver, Jesús Rosel y Pilar Jara


Universitat Jaume I

Es frecuente en la investigación comportamental que el proceso de recogida de datos no siga los prin -
cipios del muestreo aleatorio simple supuesto por la regresión clásica, sino un muestreo por agrupa-
mientos (cluster sampling) en donde junto con los participantes se selecciona también unidades con-
textuales a las que éstos pertenecen tales como escuelas, municipios o empresas. La consecuencia de
utilizar regresión ordinaria es la producción de sesgos en el error típico de medida y un aumento en la
probabilidad de cometer errores de inferencia. El análisis multinivel modela explícitamente estas rela-
ciones jerárquicas proporcionando además estimaciones sobre la variabilidad contextual de los coefi-
cientes de regresión. El objetivo del trabajo es simplificar el análisis multinivel como una generaliza -
ción del análisis de covarianza, a partir de conceptos estadísticos más comunes como los diseños de
medidas repetidas, modelos de efectos fijos y aleatorios. Se presentan ejemplos de aplicaciones en el
contexto de la psicología escolar.

Multilevel regression models: Applications in school psychology. Data collection procedures in the be-
havioral sciences do not always follow the rules of simple random sampling, an assumption of ordi-
nary least squares regression. This is the case in cluster sampling designs which contain more than one
type of experimental unit, such as subjects that are nested within classes, schools or companies. Failu-
re of taking into consideration the special structure of the data results in estimation bias for the stan-
dard error and in an increase in the probability of inference errors. Multilevel analysis models this re-
lationship among the observations while pr oviding unbiased standard error and estimates of the con-
textual variability of regression coefficients. The purpose of this paper is to simplify multilevel analy-
sis as a generalization of the analysis of covariance on the basis of commonly used statistical concepts
such as repeated measures designs, fixed and random effects models. Several application examples in
school psychology are reviewed.

La distinción entre modelos estadísticos de efectos fijos, alea - (A, B, C), como la variabilidad en el efecto de los profesores y la
torios y mixtos fue planteada por Eisenhart (1947) y se ha conver- interacción entre ambos factores sobre el rendimiento. Conviene
tido en nomenclatura básica en la estadística aplicada de nuestros aclarar que la literatura psicológica (Myers y Well, 1991; Keppel
días. En un diseño de investigación, un factor es aleatorio si sus ni- y Zedeck, 1989) se refiere a veces a un diseño mixto como una
veles consisten en una selección al azar de una población de nive- combinación de factores intra y entre sujetos. La acepción de efec-
les posibles. Un factor es considerado fijo, si sus niveles son esco- tos mixtos que se da en la literatura multinivel es un poco más ge-
gidos premeditadamente y por un procedimiento no aleatorio (Mi- neral. El sujeto en un modelo de medidas repetidas es típicamente
lliken y Johnson, 1992). Por ejemplo, en una muestra al azar de un factor aleatorio; sin embargo no es necesaria la existencia de un
profesores en un estudio experimental sobre la influencia de dis- factor intrasujetos para combinar los dos tipos de efectos, tal como
tintos estilos de enseñanza en el rendimiento, la variable profesor se ve en el ejemplo anterior. La clarificación de Eisenhart (1947)
constituiría un factor aleatorio. Si comparamos en cambio la efi- fue más lingüística que conceptual, en el sentido de que sus térmi-
cacia de tres métodos didácticos concretos (A, B y C por ejemplo), nos describían modelos que estaban siendo ya puestos en práctica
éstos constituirían un factor de efectos fijos ya que se está especí- con anterioridad en el diseño y análisis de experimentos (Tippett,
ficamente interesado en estos métodos y no en otros. Se considera 1931, 1937; Daniels, 1939; Jackson, 1939; Cochran, 1939; Winsor
un modelo de efectos mixtos a aquél en el que uno o más factores y Clarke, 1940; Ganguli, 1941; Crump, 1946, 1947; Searle, Case-
son fijos y al menos uno es aleatorio. Una combinación de los dos lla y McCulloch, 1992). Estos modelos han extendido y generali-
estudios arriba citados sería un ejemplo de diseño mixto que per- zado el análisis de varianza introducido por Fisher (1918, 1925),
mitiría evaluar de forma conjunta tanto los métodos de enseñanza surgiendo en contextos de aplicación diversos, como por ejemplo
en biología, ingeniería y ciencias del comportamiento.
La utilización de modelos con efectos aleatorios ha sido un po-
co más tardía en el análisis de regresión, aunque existen antece-
Correspondencia: Juan C. Oliver dentes tempranos (Cochran, 1946; Tukey, 1951; Anderson y Ban-
Facultad de Psicología
croft, 1952). El análisis multinivel es básicamente un modelo de
Universidad Jaume I
Castellón (Spain) regresión de efectos mixtos, en donde se intenta estudiar una rela-
E-mail: [email protected] ción lineal entre dos variables en estudios donde se ha realizado
488 JUAN C. OLIVER, JESÚS ROSEL Y PILAR JARA

muestreo por agrupamientos (cluster sampling) (Goldstein, to que sólo hay un único componente de varianza, σ2 (si asumi-
1986a). Esto ocurre cuando en una investigación psicológica exis- mos, igualmente, que σ21=σ22), correspondiente a las diferencias in-
ten, además de los sujetos, otras unidades de análisis tales como dividuales en cada grupo de refuerzo.
escuelas, municipios, empresas, hospitales, etc. La existencia de En un modelo de medidas repetidas, en cambio, la distribución
estas agrupaciones naturales queda reflejada en la estructura de los sería la siguiente:
datos; esto hace que se incumpla el supuesto del muestreo aleato -
 y1j    µ1   σ 21 σ 
rio simple y que muchas técnicas estadísticas convencionales, ta-
les como el Análisis de Varianza (ANOVA) de efectos fijos o la re-   ≈ N µ =   ,V y =  12 
y   2 
 µ2  σ12 σ2 
2 y
gresión clásica sean inapropiadas. Esto es debido a que se produ-
 2 'j  
cen sesgos en la estimación del error típico de medida y un au- (2)
mento en la probabilidad de cometer el error de rechazar la hipó-
tesis nula cuando ésta es cierta. El análisis multinivel modela ex- para j = 1,2,3,….,n niños
plícitamente estas relaciones jerárquicas, eliminando estos sesgos, en donde y1j e y2j son resultados del mismo niño en las condicio-
proporcionando además estimaciones de interés psicológico sobre nes antes y después del refuerzo; µ1 y µ2 son las medias poblacio-
la variabilidad y replicabilidad de los coeficientes de regresión en nales en cada caso, o efectos fijos. Se asume que σ21=σ22, que lla -
los distintos contextos sociales (Robinson, 1950), y sobre la in- maremos abreviadamente σ2. La diferencia básica entre ambos
fluencia de éstos en el comportamiento del individuo. modelos está en que existe asociación entre las observaciones.
Un investigador educativo puede, por ejemplo, ir a un grupo de Mientras que en el primer caso las mediciones realizadas en los ni-
escuelas y recoger datos sobre el nivel socioeconómico de los alum- ños son independientes, en el segundo caso la matriz de varianzas
nos y su rendimiento académico, a fin de constatar si existe una re- covarianzas contiene un elemento adicional (σ12). Es precisamen-
lación funcional entre ambas variables. Tendríamos así dos tipos de te esta característica la que hace necesario el uso de distintas es-
unidades experimentales: el sujeto y la escuela, correspondientes a trategias de análisis específicas, y por la que se considera que el
lo que en la literatura se denomina también como primer y segundo modelo de medidas repetidas es un modelo de componentes de va-
nivel de análisis (Goldstein, 1986a). En el caso del sujeto, la varia- rianza o de efectos aleatorios.
ble de interés es el rendimiento académico. En el caso de las escue- Una situación análoga en un contexto de regresión diferencia el
las, las variables de interés son sus respectivas medias y pendientes análisis de covarianza clásico del modelo multinivel. Recordemos
de asociación entre nivel socioeconómico y rendimiento, expresadas que el primero es una combinación de un análisis de varianza y de
mediante los estimadores de sus rectas de regresión. El objetivo del regresión clásico. Se haría un análisis de regresión ordinario, por
análisis multinivel consiste en constatar si existe variabilidad en las ejemplo, entre el número de horas de preparación para un examen
rectas de regresión entre las distintas escuelas. De esa manera, y me- y rendimiento académico a fin de estudiar la eficacia de los hábitos
diante una consideración integrada de ambos niveles de análisis, se de estudio en una población de niños. En el análisis de covarianza
pretende cuantificar y contrastar hipótesis estadísticas acerca de la clásico se incluiría el estudio de esta relación en un diseño de dos o
incidencia de los distintos contextos académicos en el rendimiento más grupos, como por ejemplo, dos tipos de entrenamiento en há-
escolar y en su relación con el nivel socioeconómico del niño. Exis- bitos de estudio con respecto a un grupo de control. Los sujetos en
te en la literatura una proliferación algo redundante y en ocasiones este caso podrían ser asignados aleatoriamente a uno de los grupos,
confusa para el investigador usuario de estos métodos. El objetivo y se podrían contrastar hipótesis tanto sobre las diferencias entre los
del trabajo es simplificar y presentar el análisis multinivel como una métodos de estudio, como sobre la eficacia del tiempo invertido.
generalización del análisis de covarianza, y a partir de conceptos es- Los efectos de interés en este caso son fijos, puesto que se han ele-
tadísticos más comunes tales como los diseños de medidas repetidas gido premeditadamente dos programas de entrenamiento de estudio
y la distinción entre modelos de efectos fijos y aleatorios. específicos frente a un grupo de control. Tendríamos un análisis de
covarianza de efectos mixtos o modelo multinivel si en lugar de es-
Análisis Multinivel y Análisis de Co varianza tos programas concretos, el objetivo del estudio fuera, por ejemplo,
el contrastar la eficacia de las horas de estudio en una selección de
La relación entre un modelo multinivel y el análisis de cova- escuelas al azar. En este caso habría dos tipos de unidades experi-
rianza es análoga a la diferencia entre una prueba t de Student pa- mentales, la escuela y el niño, y las medidas de los niños dentro de
ra grupos independientes, y otra prueba t para medidas repetidas. cada escuela estarían correlacionadas, por lo que el modelo de efec-
La diferencia radica en la matriz de varianzas-covarianzas de la tos fijos no sería apropiado. Como consecuencia, la matriz de cova-
distribución de observaciones. Imaginemos un experimento sobre rianzas del modelo multinivel contará con más de un componente.
la eficacia de un determinado refuerzo conductual sobre la cola-
boración de niños en tareas domésticas. En el primer caso, podría- Modelo con pendiente común entre g rupos
mos formular la distribución de las obser vaciones según el mode-
lo lineal de la siguiente manera: Bajo el supuesto de igualdad de pendientes entre escuelas (ver
Figura 1a), el componente de varianza adicional (σ20) representa la
 y1j    µ1  σ 21 0   covarianza entre las observaciones intraescuelas realizadas en los
  ≈ N µ =  V, y =   niños (ver Tabla 1). Es práctica común en estos casos el centrar los
y '  –
 µ2 
2 y
 2 
 0 σ 2 
valores de la variable predictora (Xi – X ); es decir, el expresarlos
 2 j  
(1) como desviaciones respecto de su media, en lugar de mantener la
métrica original. La ventaja de este procedimiento es que el punto
en donde j y j’ son sujetos distintos asignados a dos condiciones de corte en origen de cada recta de regresión para cada grupo se
de refuerzo (1 y 2). Este es un modelo típico de efectos fijos, pues- convierte en la media aritmética de su variable dependiente (ver
MODELOS DE REGRESIÓN MULTINIVEL: APLICACIÓN EN PSICOLOGÍA ESCOLAR 489

Figura 2). Esto facilita la interpretación de los resultados y la rea- mico y rendimiento para diferentes escuelas, en donde algunas de
lización de inferencias sobre los parámetros, ya que a menudo las éstas magnifican las desigualdades iniciales y otras las compen-
variables psicológicas son medidas en escalas de intervalo y el ori- san. El modelo multinivel ha sido así instrumental para describir la
gen es difícilmente interpretable. Tras este procedimiento de cen- naturaleza de las diferencias entre los efectos del proceso educati-
trado en el ejemplo anterior, σ20 representa también la varianza de vo en distintos centros escolares.
las medias entre escuelas.
Elaboración y Generalización del Modelo con Coeficientes
Modelo con pendiente cambiante entre grupos Aleatorios

El supuesto de pendientes iguales para los distintos grupos pue- A fin de explicar o dar cuenta de la variabilidad observada, se
de no estar justificado, por lo que conviene contrastar estadística- pueden construir modelos más complejos. Para ello, incluiríamos
mente su homogeneidad. En el ejemplo anterior, pudiera existir nuevas unidades experimentales o niveles, y / o nuevos factores de
variabilidad entre escuelas en el rendimiento adicional obtenido efectos fijos o aleatorios, que pueden ser tanto variables de clasi-
por cada hora de estudio invertida por sus alumnos. En este caso, ficación como covariantes en cada nivel de análisis. Veamos algu-
la covarianza intragrupos incluye dos parámetros adicionales: la nos ejemplos relacionados con el caso anterior.
varianza de las pendientes de las distintas escuelas (σ21) y la cova-
rianza entre la media y las pendientes de las escuelas (σ01). Las Fi- Inclusión de nuevas variables de clasificación
guras 1a, 1b y 1c ilustran gráficamente el significado de estos pa-
rámetros. Bryk y Raudenbush (1992) presentan un ejemplo con Pongamos por caso que se quiere incluir la variable Tipo de Es-
variabilidad significativa de las pendientes entre nivel socioeconó- cuela en el ejemplo anterior. Este sería un factor de clasificación

1a) σ 20 >0 σ 21 =0 σ 01 = 0 1b) σ 20 >0 σ 21 >0 σ 01 < 0

X X
1c) σ 20 >0 σ 21 >0 σ 01 > 0 1d) σ 20 >0 σ 21 >0 σ 01 = 0

X X
Figura 1. Cuatro posibles resultados alternativos en un modelo de regresión multinivel mostrando distintas combinaciones de varianzas y covarianzas sig -
nificativas en los coeficientes aleatorios de nivel dos. En la figura c) se asume que la variable predictora ha sido centrada, es decir, transformada en pun -
tuaciones diferenciales respecto de su media
490 JUAN C. OLIVER, JESÚS ROSEL Y PILAR JARA

para las unidades de nivel 2, y de efectos fijos si se está interesa- yhij = µh + βh X hij + m hi + bhi X hij + ehij
do de antemano en los niveles de escuela pública y privada. Más (8)
formalmente, se tendría el siguiente modelo lineal, para el que los para h = 1 y 2 tipos de escuela (pública y privada)
efectos fijos aparecen en letras griegas y los efectos aleatorios en i = 1, 2,…., a h escuelas dentro de cada tipo,
letras latinas: j = 1, 2, 3,…., ni sujetos por escuela

Tabla 1
Descripción formal de los modelos de análisis de covarianza y multinivel con pendientes homogéneas. La regresión bivariada ordinaria se incluye a efectos
comparativos

Nota: Las letras griegas indican efectos fijos en el modelo, mientras que las letras latinas representan efectos aleatorios. La sustitución de símbolo ß0 en los modelos anteriores indica que la
variable predictora ha sido centrada; como consecuencia el punto de corte en el origen puede interpretarse como la media global de la variable dependiente (µ) en el modelo multinivel, o la me-
dia de cada grupo (µ’i s) en el análisis de covarianza de efectos fijos.

Tabla 2
Descripción formal de modelos de análisis de covarianza de efectos fijos con pendientes heterogéneas, y modelo multinivel con ambos coeficientes aleatorios
MODELOS DE REGRESIÓN MULTINIVEL: APLICACIÓN EN PSICOLOGÍA ESCOLAR 491

En este caso se podrían contrastar las siguientes hipótesis adi- ciones de los componentes de varianza y covarianza residuales pa-
cionales en el intento de explicar o dar cuenta de variabilidad sig- ra las escuelas se calcula a partir de las desviaciones con respecto
nificativa en los coeficientes de regresión en el apartado anterior. a la media del tipo de centro al que pertenece (sea público o priva-
do), y no con respecto a la media total. Es decir, se trata de varian-
zas y covarianzas condicionales, que cuantifican diferencias entre
H 05 : µ1. = µ2.. H 06 :β1.. = β2..
escuelas de las que los efectos fijos del modelo no dan cuenta.

Ambas especifican posibles efectos del tipo de escuela pública Inclusión de nuevas covariantes
o privada (primer subíndice) sobre el rendimiento académico. Si
ninguna de estas diferencias fuera significativa, se podría reducir el La capacidad de predicción de un modelo puede mejorar a ve-
modelo al expuesto en la fórmula (7). Si en cambio rechazáramos ces con la incorporación de covariantes medidas en cualquiera de
alguna o ambas de estas hipótesis nulas, se habría explicado parte sus unidades experimentales o niveles. La tradición de una escue-
de las diferencias observadas entre escuelas en el modelo (7). El la medida en años de existencia para cada una de ellas, o una me-
nuevo subíndice h de los efectos aleatorios indica que las estima- dida de ajuste o adaptación social para cada alumno como predic-
tor de rendimiento académico serían ejemplos de covariantes de
nivel dos y uno, respectivamente. Con este último ejemplo de co-
15 variante en nivel uno, y a partir de la expresión (7) en la Tabla 2
y = 0,500x + 3,000 podríamos elaborar el siguiente modelo:

12
yij = µ + β1X ij + β2 X ij + mi + b1i X ij + b2i Xij + eij (9)
9 para i = 1, 2, …, a escuelas
Y y j = 1, 2, …., ni sujetos por escuela.
6
Sería posible el contrastar aquí tres nuevas hipótesis estadísticas:

3 H 07 : β2 = 0 H 08 : σ 22 = 0 H 09: σ 02 = 0

0 H07 hace referencia al efecto fijo de asociación lineal entre ajuste


social y rendimiento académico. H08 intenta constatar si esta rela-
0 5 10 15
ción lineal cambia de escuela a escuela, mientras que H09 informa-
X1 rá sobre el patrón concreto de variación de esta asociación lineal
entre adaptación social y rendimiento académico en los distintos
centros educativos (ver Figuras 1b, 1c y 1d, como referencia).

Inclusión de nuevos niveles de análisis


15
y = 0,500x + 7,501
Otra posible concreción del modelo original consistiría en in-
13 corporar una unidad experimental de tamaño intermedio, como la
clase. De este modo, los sujetos (Nivel 1) estarían agrupados en
11
clases (Nivel 2), y éstas en escuelas (Nivel 3). Puede que la in-
9 fluencia de las escuelas se deba más que a la institución en sí mis-
ma, a ciertas características propias de sus clases: métodos de en-
7 señanza, tamaño, cualificación de los profesores, etc.. Este mode-
lo dará pie a realizar un análisis más fino en este sentido. Se asu-
Y
5 me que todas estas unidades experimentales han sido escogidas de
forma aleatoria a partir de poblaciones de sujetos, clases y escue-
3 las definidas de antemano. Más formalmente:

1 yijk = µ + β1X ijk + mi + cij + bij Xijk + eijk


(10)
-8 -6 -4 -2 0 2 4 6 8
para i = 1, 2,…., a escuelas
Xc j = 1, 2,…., b clases por escuela y
k = 1, 2,…., n sujetos por clase
Figura 2. Diagrama de dispersión y recta de mínimos cuadrados en un
ejemplo de regresión. En el gráfico superior la variable predictora es re - Aquí se podrían contrastar las siguientes hipótesis de interés
presentada en su métrica natural, mientras que en el gráfico inferior ha si - frecuente, y adicionales a las que figuran en el modelo (7) de la Ta-
do transformada en desviaciones respecto de su media bla 2:
492 JUAN C. OLIVER, JESÚS ROSEL Y PILAR JARA

H 010 : σ oc
2
=0 H 011: σ1C
2
=0 H 012 : σ01C = 0 para cada unidad experimental de Nivel 2, sino también que la dis-
tribución de los valores de la varia ble predictora (Xs) sea también
la misma para todos los grupos de nivel superior (Bryk y Rauden-
Las hipótesis a contrastar hacen referencia a las varianzas y co- bush, 1992). En la práctica de estudios de campo en psicología, es
varianza entre los coeficientes de regresión entre clases una vez frecuente que esta situación no se cumpla. Tal como ocurre en el
han sido estimados los efectos de las escuelas en donde éstas se análisis de experimentos en estos casos, es aconsejable aquí tam -
encuentran agrupadas. El sufijo c indica que las estimaciones de bién el recurrir a procedimientos de Máxima Verosimilitud (MV)
los coeficientes residuales se han hecho en este caso para cada una iterativos, ya que producen estimadores con propiedades deseables
de las clases muestreadas. De esta manera, se podrá evaluar el con muestras grandes, tales como consistencia y eficiencia: es de-
efecto de pertenencia a diferentes clases sobre el rendimiento aca- cir, si se recoge gran cantidad de datos, el estimador será aproxi-
démico medio, y sobre la pendiente de asociación entre éste y el madamente insesgado y con varianza mínima (Bryk y Rauden-
nivel socioeconómico. Si alguno de estos coeficientes resultara bush, 1992). El desarrollo y clarificación de los métodos anterio-
significativo, se podría dar cuenta de esta variabilidad observada res fue hecho por Hartley y Rao (1967), quienes propusieron una
incorporando covariantes en el modelo o variables de clasificación serie de ecuaciones de MV muy generales aplicables a modelos de
de los tipos de clases pertinentes en el estudio. efectos mixtos y aleatorios, con o sin covariantes y datos equili-
Estos ejemplos puntuales de elaboración del modelo de la Ta- brados o desequilibrados. Sobre la base de estas ideas se ha desa-
bla 2 pueden combinarse en un modelo único. Asimismo, es posi - rrollado en los años ochenta y noventa algoritmos para la estima-
ble añadir variables de clasificación y covariantes en más de un ni- ción de componentes de varianza, incluidos en programas tales co-
vel de análisis. Pongamos por caso que se incluye el sexo del su- mo MLWin en la universidad de Londres (Goldstein, 1986b;
jeto como variable de clasificación en el nivel 1, y el tamaño de la Goldstein et. al., 1998) o el módulo Proc Mixed del Sistema SAS
clase como covariante en el nivel 2. Ambos efectos serían fijos en (Littell, Milliken, Stroup y Wolfinger, 1996).
su nivel de análisis propio, y aleatorios en su interacción con las Coeficientes de regresión fijos. Los procedimientos de MV apli-
unidades de análisis superiores, sea la clase, la escuela o ambas. cados a la estimación de coeficientes de regresión fijos de tenden-
Por ejemplo, puede que se encuentre diferencias generales entre cia central (µ, ß 1) generan expresiones contenidas en las ecuacio-
niños y niñas en una clase de lenguaje (efectos fijos), pero que es- nes del modelo mixto (Hocking, 1995; Henderson, 1984; Diggle,
tas diferencias se magnifiquen o reduzcan según la clase o la es- Liang y Zeger, 1994). Estas son equivalentes a las ecuaciones de
cuela (efectos aleatorios). Bryk y Raudenbush (1992), Goldstein mínimos cuadrados generalizados, que representan una extensión
(1995) y Longford (1993) contienen exposiciones más exhaustivas natural de las ecuaciones normales o de mínimos cuadrados ordi-
y detalladas del modelo general con un número indeterminado de narios en la regresión clásica para aquellos casos en que el mode-
niveles, a donde se remite al lector interesado. A continuación se lo contenga estructuras de covarianza más complejas. Las estima-
revisarán algunos conceptos de inferencia en el análisis multinivel ciones de los coeficientes de regresión de efectos fijos mediante el
que son de utilidad, tanto para la adecuada comprensión del mo- procedimiento de mínimos cuadrados generalizados necesita de
delo, como para la realización de análisis y la interpretación de re- los resultados de la fase anterior de estimación de componentes de
sultados. varianza, teniendo propiedades tales como la de ser mejores esti-
madores lineales insesgados (Littell, Milliken, Stroup y Wolfinger,
Aspectos de Inferencia Estadística 1996).
Coeficientes de regresión aleatorios. Además de los coeficien-
Estimación tes fijos de regresión de tendencia central, las desviaciones aleato-
rias en la media o pendiente propias de cada unidad jerárquica de
Componentes de varianza. La existencia de covarianza entre nivel superior pueden ser de interés substantivo. En el ejemplo an-
observaciones hace que el modelo de regresión por mínimos cua- terior, los efectos fijos indican las tendencias centrales de aso-
drados ordinarios produzca sesgos en la estimación del error típi- ciación lineal entre nivel socioeconómico y rendimiento académi-
co, y producirá como consecuencia errores de inferencia. En una co, mientras que los aleatorios indican las desviaciones en medias
situación similar al ejemplo anterior, el grado de sesgo depende de y pendientes de las escuelas particulares. La solución de las ecua-
la magnitud de la covarianza intra g rupos tanto de la variable de- ciones del modelo mixto generadas por el procedimiento de máxi-
pendiente como de la predictora, así como del número de unidades ma verosimilitud nos proporciona también estos estimadores o
experimentales de primer y segundo nivel. Goldstein (1995) ha predictores, que son función tanto de los coeficientes de regresión
calculado que en circunstancias usuales de muestreo el valor cal- fijos como de los componentes de varianza. En el ejemplo anterior,
culado del error típico estimado mediante una regresión ordinaria el método pondera la magnitud de los coeficientes en función de
puede ser la mitad del valor real, produciendo así intervalos de la cantidad de información que se posee para cada escuela y de la
confianza excesivamente estrechos y un aumento de la probabili- varianza entre escuelas. Una muestra escasa para una escuela con-
dad de Error Tipo I en los contrastes de hipótesis. Para evitarlo hay creta así como varianzas pequeñas entre escuelas provocarán que
que recurrir a procedimientos que nos permitan estimar todos los el algoritmo acerque el coeficiente aleatorio predicho para una es-
parámetros del modelo. cuela concreta a los coeficientes fijos de tendencia central. Aunque
Soluciones analíticas para la estimación de componentes de co- el uso de estos estimadores encogidos ha causado debates en la co-
varianza pueden encontrarse solamente en algunos casos en donde munidad estadística, se ha podido ver que resultan en un error de
haya equilibrio entre el número de observaciones por condición, predicción menor de los resultados obtenidos con muestras nuevas
tal como ocurre análogamente en el caso de los diseños experi- (Effron y Morris, 1975; Bryk y Raudenbush, 1992). Se ha mostra-
mentales balanceados. En un contexto de regresión esto implica do como en general éstos tienen la propiedad de ser mejores pre-
que no solamente el número de unidades de Nivel 1 sea el mismo dictores lineales insesgados (Harville, 1976).
MODELOS DE REGRESIÓN MULTINIVEL: APLICACIÓN EN PSICOLOGÍA ESCOLAR 493

Contrastes de hipótesis regresión intra y entre escuelas. Era frecuente por ejemplo aplicar
una regresión ordinaria al conjunto de medias del rendimiento y de
Además de estimar los componentes de varianza para un mo- la variable predictora de las escuelas. Además de los sesgos a que
delo concreto, el investigador quiere por lo común realizar con- puede dar lugar este procedimiento (Woodhouse y Goldstein,
trastes de hipótesis sobre los mismos. Para ello, un procedimiento 1988), el análisis es ineficiente en cuanto que no se está incluyendo
general utilizado en los programas anteriores es el de razón de ve- las medidas individuales de cada niño (Paterson y Goldstein, 1991;
rosimilitud (likelihood ratio test ), que permite contrastar una Ho Woodhouse y Goldstein, 1988). Utilizando esta información, Aitkin
frente a una Ha que contiene un mayor número de parámetros. El y Longford (1986) encontraron algunas escuelas con pendientes de-
estadístico utilizado es el siguiente: siguales de asociación entre razonamiento verbal previo al ingreso
en la escuela y rendimiento académico posterior, por lo que algunas
escuelas parecen magnificar las diferencias iniciales entre niños
D = −2log(λ 0 / λ1 )
(11) mientras que otras parecen compensarlas. Estudios similares han
mostrado como la desventaja de minorías étnicas en el rendimiento
en donde λ0 y λ1 representan los valores de verosimilitud (like - en matemáticas parece magnificarse en escuelas norteamericanas
lihoods ) de los modelos correspondientes a la hipótesis nula y a la públicas en comparación con las privadas (Lee y Bryk, 1989; Nut-
hipótesis alternativa. El valor D obtenido es contrastado en una Ta- tall, Goldstein, Prosser y Rashbash, 1988). Estos resultados propor-
bla χ2 con grados de libertad igual a la diferencia en el número de cionan una descripción ajustada de los procesos educativos de la
parámetros de ambos modelos (Goldstein, 1995; Raudenbush y que no se disponía antes del uso de estas metodologías.
Bryk, 1992). Imaginemos que en el ejemplo (5) de la Tabla 1 que- Un frente más general de aplicaciones surge en la psicología
remos contrastar la hipótesis nula de que no hay variabilidad en el del desarrollo y del aprendizaje. En los análisis clásicos intrasuje-
rendimiento académico medio entre escuelas: tos, bien univariados o multivariados, las diferencias individuales
en el crecimiento son relegadas a la interacción de las medidas re-
petidas por sujetos. El análisis multinivel, en cambio, proporciona
H02 : σ 20 = 0 H a2 : σ 20 > 0
un modelo explícito de la variabilidad en el cambio personal, con-
siderando al sujeto como nivel 2, y a las medidas repetidas como
Estos dos modelos difieren en la incorporación de un paráme- observaciones anidadas de Nivel 1 (Bryk y Raudenbush, 1992).
tro adicional bajo la hipótesis alternativa. Por este motivo, tras la Las estimaciones de los coeficientes aleatorios personales propor-
estimación de sus respectivas verosimilitudes, el valor D será con- ciona una ecuación de crecimiento para cada sujeto. La inclusión
trastado con el de una distribución χ2 con 1 grado de libertad. El de efectos fijos (sexo, alimentación, número de hermanos) o nue-
nivel de significatividad estadística proporcionará la evidencia pa- vos niveles de análisis (escuela, comarca, provincia…) permitirá
ra concluir si hay o no variabilidad en el rendimiento académico estudiar sus efectos sobre las curvas de crecimiento. En un estudio
medio entre escuelas. La aceptación de la hipótesis nula indicaría sobre el aprendizaje de las ciencias naturales, Lord (1980) encon-
que no hace falta un modelo multinivel para evaluar H 01: β1 = 0; tró componentes de varianza significativos de variabilidad entre
un análisis de regresión por mínimos cuadrados ordinario sería su- sujetos tanto en status inicial, como en el cambio en función de la
ficiente (Modelo (3) de la Tabla 1). El procedimiento de razón de edad. La incorporación del lenguaje materno y número de horas de
verosimilitud puede ser también utilizado de forma análoga para instrucción reveló efectos sobre estas diferencias de desarrollo.
contrastes de hipótesis sobre los efectos fijos del modelo. Huttenlocher, Haight, Bryk y Seltzer (1991) encontraron diferen-
Otra ventaja de estos métodos de inferencia es su flexibilidad cias individuales no sólo en la asociación lineal de la edad con el
para realizar contrastes sobre combinaciones lineales de las va- incremento del vocabulario en niños entre 14 y 26 meses, sino
rianzas del modelo. En el ejemplo anterior, es posible determinar también en los coeficientes de regresión cuadráticos. Tanto el se-
si las varianzas de los niños (Nivel 1) cambian con el status socio- xo como el nivel de uso del lenguaje por la madre en casa eran
económico, si hay diferencias en la variabilidad de niños y niñas, buenos predictores de los diferentes patrones de aceleración y de-
o si estas diferencias dependen de la edad o de si la escuela es pú- saceleración observados en los niños en el aprendizaje de nuevas
blica o privada. En estos casos, los componentes de covarianza tie- palabras. Modelos similares a los anteriores se han aplicado tam-
nen una interpretación análoga a los efectos de interacción en efec- bién a la psicología organizacional y del trabajo en sentido más
tos fijos. La descripción de estas diferencias en los componentes amplio (Bryk y Raudenbush, 1992).
de varianza nos es útil para mejorar la especificación del modelo a Buena parte de las técnicas estadísticas clásicas de uso común en
ajustar, aunque también pueden ser de interés psicológico (Gods- psicología y basadas en el muestreo aleatorio simple tienen o pue-
tein et al., 1998; Goldstein, 1995). den tener una versión multinivel para muestreos por agrupamientos
(cluster sampling ). Goldstein (1995) y Longford (1993) extienden
Aplicaciones el análisis multinivel a medidas repetidas, a casos de variables dis-
cretas con distribuciones no normales, o a modelos multivariados
Buena parte de las primeras aportaciones del análisis de regre- como el análisis factorial. En este sentido, podemos decir que se tra-
sión multinivel han sido realizadas en el ámbito de la psicología es- ta de una técnica de amplio espectro, muchos de cuyos desarrollos
colar. Aitkin y Longford (1986) hacen una revisión exhaustiva de y aplicaciones potenciales en psicología están todavía en gestación.
los métodos utilizados hasta entonces en estudios clásicos de com-
paración de la eficacia de diferentes escuelas sobre el rendimiento Agradecimientos
académico. Típicamente, en estos estudios originales con regresión
clásica no existía un reconocimiento de la estructura jerárquica de Este trabajo ha sido parcialmente financiado por la Fundación
los datos, no habiendo además una distinción entre componentes de Bancaja-Castellón (Proyecto P1B95-20).
494 JUAN C. OLIVER, JESÚS ROSEL Y PILAR JARA

Referencias

Aitkin, M. y Longford,N. (1986). Statistical modelling in school effective- Huttenlocher, J. E., Haight, W., Bryk, A. S. y Seltzer, M. (1991). Early vo-
ness. Journal of the Ro yal Statistical Society A, 149, 1-43. cabulary growth: Relation to langua ge input and gender. Developmen -
Anderson, R. L. y Bancroft, T. A. (1952). Statistical theory in research. tal Psychology, 27 (2), 236-249.
New York: McGraw-Hill. Jackson, R. W. B. (1939). Reliability of mental tests. British Journal of
Bryk, A. S. y Raudenbush, S. W. (1992). Hierarchical linear models: A p - Psychology, 29, 267-287.
plications and data analysis methods. Newbury Park, CA: Sage Publi- Keppel, G. y Zedeck, S. (1989). Data analysis for research designs. San
cations. Francisco: Freeman.
Cochran, W. G. (1939). The use of the analysis of variance in enumeration Latour, S. A., y Miniard P. W. (1983). The Misuse of repeated measures
by sampling. Journal of the American Statistical Association, 34, 492- analysis in marketing research. Journal of Marketing Research, Vol XX,
510. 45-57.
Cochran, W. G. (1946). Analysis of co variance. A paper presented at the Littell, R.C., Milliken, G.A., Stroup, W.W. y Wolfinger, R.D. (1996). SAS
Institute of Mathematica Statistics, Princeton University. System for Mixed Models . Cary NC: SAS Institute.
Crump, S. L. (1946). The estimation of variance components in the analy- Longford, N. T. (1993) Random coef ficient models. Oxford UK: Oxford
sis of variance. Biometrics, 2, 7-11 University Press.
Crump, S. L. (1947). The estimation of variance in multiple classification. Lee, V. y Bryk, A. S. (1989). A multilevel model of the social distribution
Ph.D. Thesis. Iowa State University, Ames Iowa. of achievement. Sociology of Education, 62, 172-192.
Daniels, H. E. (1939). The estimation of components of variance. Journal Lord, F. M. (1980). Aplications of item response theory to practical testing
of the Royal Statistical Society Suppl., 6: 186-197. problems. Hillsdale NJ: Erlbaum.
Diggle, P. J., Liang, K. y Zeger, S. L. (1996). Analysis of longitudinal da - Milliken, G. A. y Johnson, D. E. (1992). Analysis of messy data (Vol. 1):
ta. Oxford UK: Clarendon Press. Designed experiments. New York: Chapman y Hall.
Eisenhart, C. (1947). The assumptions underlying the analysis of variance. Myers, J. L. y Well A. D. (1991). Research Design and Statistical Analy -
Biometrics, 3: 1-21. sis. New York: Harper Collins Publishers.
Effron, B. y Morris, C. (1977, Ma yo). Stein´s paradox in statistics. Scien - Nuttall, D., Goldstein, H., Prosser, R., y Rashbash, J. (1988). Differential
tific American, pp. 119-127. school effectiveness. International Journal of Educational Research,
Fisher, R. A. (1918). The correlation beween relatives on the supposition 13, 769-76.
of mendelian inheritance. Transactions of the Royal Society of Edin - Paterson, L. y Goldstein, H. (1991). New statistical methods for analysing
burgh, 52, 399-433. social structures: an introduction to multilevel models. British Educa -
Fisher, R. A. (1925). Statistical methods for research workers. Edinburgo tional Research Journal, 17 (4), 387-393.
y Londres: Oliver y Boyd,. Robinson, W. S. (1950). Ecolo gical correlations and the behavior of indi-
Ganguli, M. (1941). A note on nested sampling. Sankhya, 5, 449-452. viduals. American Sociological Review, 15, 351-57.
Goldstein, H. (1986a). Multilevel statistical models. London, Arnold. Satterthwaite, F. E. (1946). An approximate distribution of estimates of va-
Goldstein, H. (1986b) Multilevel mixed linear model analysis using itera- riance components. Biometrics Bulletin, 2: 110-14.
tive generalized least squares. Biometrika, 73 (1), pp. 43-56. Searle, S. R., Casella, G. y McCulloch, C. E. (1992) Variance components.
Goldstein, H. (1995). Multilevel Statistical Models (2nd. Ed.). London: Ar- New York: John Wiley y Sons.
nold. Tippett, L. H. C. (1931, 1937). The Methods of Statistics. London: William
Golsdstein, H., Gashbash, J., Plewis, I., Draper,D., Browne, W., Yang, M., and Norgate Ltd.
Woodhouse, G y Healy, M. (1998). A user´s guide to MLWin. London: Tukey, J. (1951). Components in regression. Biometrics, 7, 33-69.
University of London, Institute of Education. Winsor, C. P. y Clarke, G. L. (1940). A statistical sudy of variation in the
Hartley, H. O. y Rao, J. N. K. (1967). Maximum likelihood estimation for catch of plankton nets. Sears Foundation Journal of Marine Research,
the mixed analysis of variance model. Biometrika, 54, 93-108. 3, 1-27.
Harville, D. A. (1976). Extension of the Gauss-Markov theorem to inclu- Woodhouse, G. y Goldstein, H. (1988). Educational performance indica-
de the estimation of random effects. Annals of Statistics, 2, 384-395. tors and LEA League Tables. Oxford Review of Education, 14 (3), 301-
Henderson, C. R. (1984). Applications of linear models in animal bree - 320.
ding. Guelf, Canada: University of Guelf.
Hocking, R. R. (1996). Methods and applications of linear models. New
York: Wiley. Aceptado el 20 de octubre de 1999

Viewpublicationstats

También podría gustarte