0% encontró este documento útil (0 votos)
199 vistas37 páginas

Representaciones HOMALS

Este documento presenta la técnica de análisis multivariante HOMALS (Homogeneous Alternating Least Squares) y su aplicación al estudio del parentesco. HOMALS permite representar tanto individuos como términos de parentesco en el mismo espacio geométrico, revelando las estructuras subyacentes en los datos. El documento incluye una introducción al modelo HOMALS, la codificación de datos categóricos, y un ejemplo ilustrativo con datos y resultados.
Derechos de autor
© © All Rights Reserved
Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.
Formatos disponibles
Descarga como PDF, TXT o lee en línea desde Scribd
0% encontró este documento útil (0 votos)
199 vistas37 páginas

Representaciones HOMALS

Este documento presenta la técnica de análisis multivariante HOMALS (Homogeneous Alternating Least Squares) y su aplicación al estudio del parentesco. HOMALS permite representar tanto individuos como términos de parentesco en el mismo espacio geométrico, revelando las estructuras subyacentes en los datos. El documento incluye una introducción al modelo HOMALS, la codificación de datos categóricos, y un ejemplo ilustrativo con datos y resultados.
Derechos de autor
© © All Rights Reserved
Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.
Formatos disponibles
Descarga como PDF, TXT o lee en línea desde Scribd

ANLISIS MULTIVARIANTE APLICADO AL ESTUDIO DEL PARENTESCO: REPRESENTACIONES HOMALS

por

Francisco Javier Lpez de Ipia Mattern


Ensayo propuesto para el periodo de docencia del doctorado en

Antropologa Social y Cultural

UNED 2008

A la atencin de:

D. ngel Daz de Rada Brun relaciones tnicas (Spmi-Noruega). Un examen concreto de un proceso de investigacin.

Profesor de la asignatura: La interpretacin de un espacio de

Fecha:

1 de septiembre de 2008

UNED Descripcin breve Cronotopos: referentes de memoria y de cultura por: Francisco Javier Lpez de Ipia Mattern Profesor supervisor: D. ngel Daz de Rada Brun Dpto. de Antropologa Social y Cultural

Este ensayo trata de presentar alguna de las tcnicas del Anlisis Multivariante aplicadas a datos de Antropologa que se han difundido en la extensa literatura sobre tales aplicaciones. Dentro de la an ms extensa literatura sobre aplicaciones de la Inferencia Estadstica, y ms general an, de las Matemticas en el mbito de la Antropologa. Este ensayo presenta un humilde botn de muestra, sacado a la luz del abismo de lo ya realizado y de las ideas y proyectos por realizar. He elegido centrarme en la aplicacin a un tema de Antropologa de una tcnica concreta queriendo evitar la dispersin y la extensin inherente a una introduccin donde se pretendiera abarcar las aplicaciones y tcnicas ms utilizadas actualmente. Independientemente de lo anterior, y antes incluso del propsito de llevar a cabo alguna de las aplicaciones de las tcnicas aludidas, hay un vasto dominio de conocimientos acerca de la utilizacin de software aplicado a la recopilacin, gestin, alumbramiento de hiptesis, teoras y anlisis previo que parece ms adecuado para un ensayo ms genrico en otra asignatura de doctorado. Es lo que en el mundo anglo-sajn se conoce como Qualitative Data Analysis (QDA) y que se refiere ms bien a datos textuales, adjetivo este ltimo que evita confusin con el tipo de datos cualitativos que se maneja en Inferencia Estadstica.

Representaciones HOMALS

Representaciones HOMALS TABLA DE CONTENIDOS

PRECEDENTES INTRODUCCIN EL MODELO LA CODIFICACIN DE DATOS CATEGRICOS Cuantificacin La matriz indicador incompleta EL ALGORITMO Notacin Optimizacin de la funcin objetivo Diagnstico

1 1 2 4 8 10 11 11 12 14

EJEMPLO, DATOS, RESULTADOS E INTERPRETACIN 16 EJEMPLO DATOS RESULTADOS E INTERPRETACIN CONCLUSIONES Y SOFTWARE CONCLUSIONES SOFTWARE BIBLIOGRAFA 16 20 23 29 29 30 31

Representaciones HOMALS

Representaciones HOMALS
C a p t u l o 1

PRECEDENTES
Se trata aqu del problema de analizar las caractersticas estructurales de un conjunto de datos razonablemente grande sobre parentesco mediante tcnicas del Anlisis Multivariante. El modelo HOMALS elegido (Homogeneous Alternating Least Squares) es una forma de Anlisis de Componentes Principales (PCA) pero para datos categricos. El modelo proporciona representaciones, con atractivo intuitivo, de la estructura subyacente de los datos representando tanto los individuos como los trminos de parentesco en el mismo espacio geomtrico. Se interpretan despus los agrupamientos y configuraciones resultantes con la referencia del marco ms tradicional del parentesco en la cultura de la que provienen los datos. INTRODUCCIN La mayor parte del debate sobre parentesco y organizacin social se ha centrado en un tema fundamental: el significado mismo de parentesco. En lo referente al estudio de las terminologas de parentesco, los enfoques tericos principales han evolucionado a travs de perspectivas distintas. Por una parte, estn los antroplogos que se centran en las relaciones de los trminos con otros aspectos de la sociedad en los que se utilizan. Desde su punto de vista, la terminologa y comportamiento del parentesco slo se puede entender en trminos del sistema total de ideas y smbolos de cada cultura especfica. Por tanto, estas categoras no deben aislarse artificialmente de las categoras generales basadas en la notacin diferencial de cdigos de naturaleza biolgica-genealgica. Cualquier comparacin formal de la terminologa del sistema de parentesco es as problemtica como mnimo, puesto que el significado de parentesco es al cabo especfico de la cultura y fuertemente dependiente del contexto. 1

Representaciones HOMALS Por otra parte estn los antroplogos que intentan estudiar los sistemas de parentesco (incluida su terminologa) como estructuras lgicas coherentes generadas mediante la aplicacin de una cantidad limitada de principios fundamentales. Aunque distintos autores situarn el campo de accin de los sistemas en diferentes niveles o acentuarn diferentes principios generadores, su metodologa se interesa generalmente en la comparacin controlada de sistemas de parentesco, desde el nivel de la forma estructural as como en lo que se refiere al contenido semntico. El anlisis de parentesco que se propone en este ensayo es bsicamente el anlisis de un tipo particular de datos mediante un modelo formal especfico (la representacin geomtrica de los datos en el espacio eucldeo de dimensin suficientemente pequea). La perspectiva con la que se aborda esta tarea es pragmtica y no se deduce exclusivamente de cualquiera de los dos enfoques mencionados antes. Se pretende centrar la atencin sobre un conjunto de relaciones estructurales subyacentes en los datos, y ello aplicando un modelo matemtico (cuya eleccin est motivada sobre fundamentos tericos as como prcticos). Se pueden interpretar los resultados a partir de o en contraste con las conclusiones deducidas a partir de cualquier punto de vista terico compatible con los pocos supuestos sencillos del modelo y, finalmente, compararlos con otros anlisis llevados a cabo mediante la aplicacin de modelos adecuados a conjuntos de datos similares. EL MODELO Damos aqu un resumen no tcnico del modelo. El procedimiento HOMALS (Homogeneous Alternating Least Squares) pertenece a una familia de modelos matemticos del Anlisis Multivariante, aplicado aqu a datos categricos. Se puede encontrar una descripcin formal del modelo en De Leeuw y Van Rijckevorsel (1980), y en Gifi (1981). Esta ltima fuente incluye tambin una exposicin clara de la relacin entre HOMALS y otros modelos no lineales del anlisis de datos multivariantes. 2

Representaciones HOMALS Es muy til la interpretacin geomtrica del HOMALS, ya que los conceptos intuitivos de distancia y similitud empleados en la teora del parentesco quedan reflejados fcilmente de manera formal en la representacin HOMALS. Bajo esta interpretacin el HOMALS esta muy relacionado con las tcnicas no mtricas (es decir, ordinales) de escalado multidimensional (MDS), que tanto han llamado la atencin de algunos antroplogos. Se describe la relacin entre el HOMALS y el MDS en Gifi (1981). El propsito general del MDS es doble: Evidenciar de alguna manera cualquier patrn o estructura de la matriz de datos empricos que de otra forma permanecera oculto/a. Representar esta estructura de forma que sea mucho ms accesible al ojo humano. Es decir, como un modelo geomtrico o cuadro. Se representan los objetos en estudio mediante puntos en el modelo espacial, y ello de forma tal que las caractersticas significativas de los datos acerca de estos objetos queden evidenciadas en las relaciones geomtricas entre los puntos. De forma ms especfica, el procedimiento HOMALS proporciona un medio para cuantificar datos categricos, que son el tipo de datos habitualmente recogidos por los antroplogos. Dada una matriz de datos categricos se busca representar el conjunto de observaciones en el espacio eucldeo de la menor dimensin posible consistente con una interpretacin viable o interesante desde el punto de vista terico de los datos. Hablando de datos sobre parentesco, el HOMALS representa tanto a los individuos como a los trminos de parentesco (de forma general, las categoras de cada variable), como puntos en el mismo espacio eucldeo. Los individuos que establecen ms o menos a combinaciones similares de trminos al conjunto de personas por las que se les pregunta, se representan como puntos prximos entre s. Inversamente, los individuos cuyo perfil de trminos de parentesco difieren para tal conjunto de personas, se sitan a cierta distancia unos de otros. Al mismo tiempo, los 3

Representaciones HOMALS trminos de parentesco suscitados en la identificacin de cada persona del grupo de personas anterior, se representarn prximos si se obtienen de la misma persona encuestada, y separados si se suscitan a distintas personas. La representacin geomtrica proporcionada por el HOMALS nos permite abordar simultneamente y dentro del mismo marco general dos problemas importantes: El problema de definir la estructura de las relaciones sociales entre individuos (distancia social y genealgica, agrupamientos de individuos, etc.) El problema de proporcionar una descripcin adecuada a la estructura de la terminologa del sistema de parentesco (caractersticas, dimensiones de componentes, etc.) LA CODIFICACIN DE DATOS CATEGRICOS Partimos de un conjunto finito de n objetos (o individuos). Una variable hj relaciona el conjunto de objetos con un conjunto finito de kj categoras; este conjunto de categoras se denomina rango (o recorrido) de hj , Suponemos que hay una cantidad finita de m variables hj (j = 1, .., m ). El producto cartesiano de todos los conjuntos de categoras kj se denomina rango multivariante. Sus elementos son todas las combinaciones posibles de m categoras, cda una de ellas perteneciente a un kj distinto, y se denominan perfiles. La matriz de datos H tiene dimensin n m con elementos hij que dan la categora que la variable hj asigna al objeto i. Estos elementos no son necesariamente nmeros.
m

La cantidad de posibles perfiles es


j 1

k j , el producto de todas las kj . Puede

ocurrir que esta cantidad sea mucho menor que n, en cuyo caso, la matriz de datos no es la forma ms eficiente de codificacin. En su lugar, uno puede preferir una matriz de frecuencias de perfil. Una matriz de frecuencias de perfil completa dar una lista de todos los perfiles posibles e indicar cuan a menudo 4

Representaciones HOMALS
m

ocurre cada perfil. Tal matriz tiene


j 1

k j filas y (m + 1) columnas: los

primeros m elementos de cada fila son las categoras del perfil y el ltimo elemento es su frecuencia. Si hay muchos perfiles con frecuencia nula, es ms cmodo eliminar las filas correspondientes de la matriz de frecuencias de perfil, con lo que se obtiene la matriz reducida. Otra posible codificacin consiste en asignar la frecuencia del perfil a la casilla de la disposicin k1 k2 km de dimensin m, con lo que se consigue una tabulacin cruzada de gran dimensin. Hay una tercera manera de codificar los datos, que es crucial para el tipo de anlisis que se aborda aqu. Para cada variable hj se define una matriz Gj tomando

ir =

si al objeto i se le asigna la categora r de h j

0 si al objeto i no se le asigna la categora r de h j

Gj es la matriz indicador de hj . Se pueden recoger tales matrices en una matriz


m

partida G = G1 ... G j ... G m de dimensin n


j 1

kj = n

k , denominada

tambin matriz indicador (sin referencia a variable alguna). Por ejemplo, consideramos la matriz H con n = 10, m = 3, kj = 3 (j = 1,..., 3), cuyos elementos son etiquetas de categoras, y donde las categoras de la primera variable son a , b , c , es decir k1 = {a, b, c }, y para la segunda y tercera variables tenemos k2 = {p, q, r }, k3 = {u, v, w }. En este ejemplo tenemos que la frecuencia de w es cero. A partir de la matriz H arbitraria, la matriz de frecuencias de perfil reducida, MFPR(H), y la tabulacin cruzada de gran dimensin seran:

Representaciones HOMALS
a b a a b c a a c a p u q r v v
a a a b b c p u p v r q v v p v p v 3 2 1 1 1 2

p u p v p v p u p v p v p v

H=

; MFPR(H) =

Tabulacin cruzada de gran dimensin p A B C 3 0 0 q 0 0 0 u Mientras que la matriz indicador G sera.


a b c 1 0 0 0 1 0 1 0 0 1 0 0 p q r 1 0 0 0 1 0 0 0 1 1 0 0 1 0 0 1 0 0 1 0 0 1 0 0 1 0 0 1 0 0 u v w 1 0 0 0 1 0 0 1 0 1 0 0 0 1 0 0 1 0 1 0 0 0 1 0 0 1 0 0 1 0

r 0 0 0 a b c

p 2 1 2

q 0 1 0 v

r 1 0 0 a b c

p 0 0 0

q 0 0 0 w

r 0 0 0

G = G1 G2 G3 = 0 1 0 0 0 1
1 0 0 1 0 0 0 0 1 1 0 0

Se dice que la matriz indicador Gj es completa si cada fila de Gj tiene slo un elemento igual a 1 y el resto igual a 0, de modo que las sumas por filas de Gj son igual a 1. Se puede expresar esto mismo mediante Gj u k j = un , donde us 6

Representaciones HOMALS es el vector columna de dimensin s 1 y cuyos elementos son todos iguales

a 1. Si todas las Gj son completas, la matriz G se dice tambin que es completa, y entonces se verifica que G uk = m un , las filas de G suman todas
m

lo mismo: m, donde k =
j 1

kj .

Sea dj el vector columna de totales por columnas de Gj . El elemento r , d

j r

corresponde a la frecuencia marginal de la categora r de hj . Adems, la suma de los elementos de dj debe ser igual a u tk j dj = n . Como slo aparece un 1 a lo sumo en cada fila de Gj , las columnas de Gj son ortogonales (el resultado de multiplicar dos columnas distintas es cero), de modo que si definimos mediante el producto la matriz Dj = G tj Gj tenemos una matriz diagonal, y adems, los elementos de su diagonal son las columnas de Gj por s mismas, es decir, las frecuencias marginales, o sea, los elementos de dj. Si definimos Cj l = G tj Gl , tenemos una tabulacin cruzada de entrada doble de las variables hj y hl , cuyos elementos corresponden a la frecuencia de los objetos caracterizados por una combinacin particular de una categora de hj y una categora de hl . La matriz Cj l tiene dimensin kj ahora C = Gt G, cuya dimensin es k kl . Consideramos k, esta matriz combina todas las Cj l , y

en su diagonal tiene las submatrices Cj j = Dj . Dicha matriz C es una matriz de marginales bivariantes. En la literatura francesa, a C se le denomina matriz de Burt. Definimos ahora D como la matriz diagonal partida de C, entendiendo que los elementos de D y de C son iguales en las submatrices diagonales Cj j = Dj , mientras que D tiene todos sus elementos nulos fuera de las submatrices diagonales. D es una matriz de marginales univariantes. Aunque D es realmente una matriz diagonal para una matriz indicador completa, es habitual pensar en ella como matriz diagonal partida, ya que es ms conveniente en determinadas aplicaciones. Para el ejemplo dado anteriormente, tenemos una matriz G 7

Representaciones HOMALS completa, adems, C y D son las presentadas en las tablas siguientes. Se observa que las submatrices de dimensin 3 3 en la diagonal de D son las mismas que las de la diagonal de C. Matriz C de marginales bivariantes a a b c p q r u v w 6 0 0 5 0 1 3 3 0 b 0 2 0 1 1 0 0 2 0 c 0 0 2 2 0 0 0 2 0 p 5 1 2 8 0 0 3 5 0 q 0 1 0 0 1 0 0 1 0 r 1 0 0 0 0 1 0 1 0 u 3 0 0 3 0 0 3 0 0 v 3 2 2 5 1 1 0 7 0 w 0 0 0 0 0 0 0 0 0

Matriz D de marginales univariantes a a b c p q r u v w 6 0 0 0 0 0 0 0 0 b 0 2 0 0 0 0 0 0 0 c 0 0 2 0 0 0 0 0 0 p 0 0 0 8 0 0 0 0 0 q 0 0 0 0 1 0 0 0 0 r 0 0 0 0 0 1 0 0 0 u 0 0 0 0 0 0 3 0 0 v 0 0 0 0 0 0 0 7 0 w 0 0 0 0 0 0 0 0 0

Cuantificacin
Las categoras de las variables pueden ser valores numricos, como los puntos medios de intervalos sobre alguna variable continua, en este caso, la matriz de 8

Representaciones HOMALS datos H es una matriz de datos multivariante clsica y puede manejarse con las tcnicas clsicas del Anlisis Multivariante (MVA) lineal. Sin embargo aqu no se supone tal cuantificacin a priori. An en el caso de que tuviramos disponible tal cuantificacin a priori, podra ignorarse y remplazarse por una categorizacin nominal. Por supuesto que la cuantificacin de categoras seguir reglas con la intencin de optimizar algn criterio o, en otras palabras, con la intencin de minimizar alguna funcin de prdida. No vemos ahora funcin de prdida alguna, sino que indicamos de una forma general como hacer factible la cuantificacin de una matriz indicador. La cuantificacin de las categoras de la variable hj implica que a sus kj categoras se les asigna los kj valores numricos de un vector (columna) yj . Entonces, la variable cuantificada se queda en un nico vector qj = Gj yj que da un resultado numrico para cada objeto, respecto de hj . Definamos x como el vector media de todos los qj : x=
1 m
m

qj
j 1

Este vector x contendr la cuantificacin de los objetos (depende de), y diremos que x es la puntuacin inducida de los objetos para alguna cuantificacin directa yj . Por otra parte, si x es alguna cuantificacin directa de los objetos, entonces definimos la cuantificacin de categoras inducida de una categora en particular, como el promedio de las puntuaciones de aquellos objetos a los que se les asigna dicha categora. Formalmente: yj = D j 1 G tj x (se supone aqu que Dj tiene inversa, lo que implica que no hay categoras con frecuencia nula. Como regla prctica, si alguna categora tiene frecuencia nula, podemos saltarnos su columna en la matriz indicador).

Representaciones HOMALS Se pueden conectar los dos procedimientos como sigue. Sea yj una cuantificacin directa de las categoras de la variable j. Sea y un vector que
m

combina todos los yj en un vector nico de k =


j 1

k j elementos. Las

puntuaciones inducidas de los objetos son entonces Gy/m. Necesitamos ahora que una solucin para la cuantificacin directa de los objetos, x , sea proporcional a las puntuaciones inducidas de los objetos, y viceversa, que la cuantificacin directa de categora yj sea proporcional a la cuantificacin inducida de categora D j 1 G tj x. En la argumentacin que justifica el algoritmo presentado en este ensayo (y que no vemos aqu), se muestra que este requisito no slo hace factibles las soluciones para x e y, sino que adems da lugar a una minimizacin de funciones de prdida habituales. La exposicin anterior no debera sugerir que hay slo una solucin para x e y. En general, podemos estar interesados en p soluciones distintas. Esto implica que la cuantificacin de categora corresponde a una matriz Yj de dimensin kj dimensin n p. Las puntuaciones de objeto inducidas estn en la matriz de p dada por Gy/m. De forma similar, dadas las n p dadas por D j 1 G tj X. p

cuantificaciones de los objetos, las cuantificaciones de categora inducidas aparecen en las matrices de dimensin kj

La matriz indicador incompleta


Hasta aqu hemos considerado slo matrices indicador completas. Su caracterstica es que cada fila de Gj suman 1. Se puede establecer esto ms formalmente definiendo Mj como la matriz diagonal cuyos elementos no nulos son los totales por filas de Gj . Para una matriz indicador completa Gj debe verificarse entonces que Mj = I (la matriz identidad). Definimos adems
m

la matriz M* =
j 1

M j . Para una matriz indicador completa G, se debe

verificar que M* = m I. Una matriz indicador Gj es incompleta si tiene alguna fila cuyos elementos son todos nulos. 10

Representaciones HOMALS Una matriz indicador incompleta puede cuantificarse de acuerdo con los mismos principios vistos para el caso de matriz indicador completa. Buscamos otra vez puntuaciones de objetos que sean proporcionales al vector promedio de las cuantificaciones de categora, para las categoras a las que el objeto se asigna, y viceversa, cuantificaciones de categora proporcionales a la puntuacin promedio de los objetos dentro de la categora. Formalmente, buscamos: x yj
M 1 Gy

D j 1 G tj x

Una solucin basada en estos requisitos ser diferente a una solucin basada en la matriz indicador completa. La razn es que, en general, las puntuaciones de objeto sern ms parecidas a medida que los dos objetos tengan ms categoras en comn. EL ALGORITMO El algoritmo iterativo HOMALS es una versin actualizada del de Guttman (1941). El tratamiento de los valores perdidos, que se describe ms abajo, se basa en establecer ponderaciones en la funcin de prdida igualndola a cero, y se describi en primer lugar por De Leeuw y Van Rijckevorsel (1980). Existen otras posibilidades y pueden llevarse a cabo recodificando los datos (Gifi, 1981; Meulman, 1982).

Notacin
Se utiliza la siguiente notacin a no ser que se especifique otra cosa: n m p nmero de casos (objetos) nmero de variables nmero de dimensiones

Para la variable j , con j = 1, , m

11

Representaciones HOMALS hj kj Gj
g
j ir

vector de dimensin n conteniendo las observaciones categricas nmero de categoras vlidas (valores distintos) de la variable j matriz indicador para la variable j, de orden n kj
1 cuando el objeto i est en la categora r de la variable j 0 cuando el objeto i no est en la categora r de la variable j

Mj por
m

matriz binaria diagonal n

n , con elementos de la diagonal definidos

1 cuando la observacin i est dentro del recorrido 1, k j


j ii

cuando la observacin i est fuera del recorrido 1, k j

Dj

matriz diagonal que contiene las marginales univariantes, es decir, las

sumas por columnas de Gj . Las matrices de cuantificacin son X Yj Y


m

puntuaciones de los objetos de orden n cuantificaciones de categora, de orden kj

p p

matriz de cuantificaciones de categora concatenadas, de orden


kj p

j 1

Optimizacin de la funcin objetivo


El objetivo de HOMALS es hallar puntuaciones de los objetos X y un conjunto de Yj (para j = 1, , m ) de modo que sea mnima la funcin
1 m
m

X, Y =

tr
j 1

X G j Yj

M j X G j Yj

bajo las restricciones de normalizacin Xt M* X = m n I, donde la matriz M* es la suma de las matrices diagonales M* = p p. La inclusin de Mj en
j

M j , e I es la matriz identidad

X, Y asegura que no habr influencia de los

valores observados fuera del recorrido [1, kj ], valores que pueden ser 12

Representaciones HOMALS realmente valores perdidos o simplemente considerados como tales; M* contiene la cantidad de valores observados activos para cada objeto. Las puntuaciones de los objetos son, adems, centradas, es decir, satisfacen ut M* X = 0, donde u denota un vector de dimensin n de unos. Se alcanza la optimizacin a travs del siguiente esquema iterativo: 1. Iniciado 2. Actualizacin de las puntuaciones de los objetos 3. Ortonormalizacin 4. Actualizacin de las cuantificaciones de categoras 5. Contraste de convergencia: repetir los pasos del 2 a 4 o continuar 6. Rotacin Se explican a continuacin estos pasos. 1. Iniciado. Se inician las puntuaciones de los objetos X con nmeros aleatorios, que se normalizan de modo que ut M* X = 0 y Xt M* X = m n I, lo que da lugar a X . Despus se obtienen las cuantificaciones de categoras a partir de Y j = D j 1Gtj X . 2. Actualizacin de las puntuaciones de los objetos. Se calcula primero la matriz auxiliar de puntuaciones Z a partir de
m

Z
j 1

M jG j Yj

y se centra respecto de M* :
Z

M uut M

ut M u

Estos dos pasos dan lugar localmente a las actualizaciones ptimas cuando no se imponen restricciones de ortogonalidad. 3. Ortonormalizacin. El problema de ortonormalizacin es hallar una matriz X+ ortonormal a M* , que sea lo ms prxima a Z en el sentido de mnimos cuadrados. En HOMALS, esto se hace estableciendo 13

Representaciones HOMALS X+
m M GRAM MZ

que es igual a la estimacin por mnimos cuadrados habitual, excepto por una rotacin. Se utiliza la notacin GRAM( ) para denotar la transformacin de Gram-Schmidt (Bjrk y Golub, 1973). 4. Actualizacin de las cuantificaciones de categoras. Se calculan las nuevas cuantificaciones de categoras para j = 1, , m a partir de

Y j = D j 1Gtj X .
5. Contraste de convergencia. Se compara la diferencia entre los valores de la funcin de prdida consecutivos,
X, Y X ,Y

, con el criterio de convergencia

especificado por el usuario

(un nmero positivo pequeo). Se repiten

los pasos del 2 al 4 en tanto que la diferencia de prdidas sea mayor que . 6. Rotacin. Como se indic en el paso 3, durante la iteracin, la orientacin de X e Y con respecto al sistema de coordenadas no es necesariamente la correcta; esto refleja tambin que
X, Y

sea invariante bajo rotaciones

simultneas de X e Y. Se sabe a partir de la teora que las soluciones con dimensin distinta deben estar anidadas; es decir, la solucin con dimensin p debe ser igual a las primeras p columnas de la solucin con dimensin p+1. Se alcanza el anidamiento calculando los autovalores de la matriz
1 m
j

Y tj D j Y j . Los autovalores correspondientes se presentan

despus del mensaje de convergencia alcanzada. Los clculos implican tridiagonalizacin con transformaciones de Householder mediante el algoritmo implcito QL (Wilkinson, 1965).

Diagnstico
Rango mximo (puede emitirse como aviso cuando se excede) 14

Representaciones HOMALS El rango mximo pmax indica la cantidad mxima de dimensiones que pueden calcularse para cualquier conjunto de datos. En general tenemos: pmax = min n 1
j

kj

max m 1,1

donde m1 es el nmero de variables sin valores perdidos. Aunque la cantidad de dimensiones no triviales pude ser menor que pmax cuando m = 2, HOMALS permite dimensionar todo el trayecto hasta pmax. Frecuencias marginales La tabla de frecuencias proporciona las marginales univariantes y el nmero de valores perdidos (es decir, los valores que se considera estn fuera del recorrido en el anlisis actual) para cada variable. Se calculan como las sumas de columnas de Dj y las sumas totales de Mj . Medida de discriminacin Son las varianzas a travs de las dimensiones de las variables cuantificadas. Para la variable j y la dimensin s, tenemos
2 j s

yt j s D j y n
)s

j s

donde y(j

es la columna s de Yj , correspondiente a la variable

cuantificada s , Gj y(j )s . Autovalores Como se dijo en el paso 6, se presentan los autovalores calculados despus del aviso de convergencia alcanzada. Se puede presentar tambin la suma de los autovalores durante la iteracin, bajo el encabezado Ajuste total. Debido al hecho de que la suma de los autovalores es igual a la traza de la matriz original, se puede calcular la suma a partir de
1m
j s 2 js

. El valor de

X, Y es igual a p - 1 m

2 js

15

Representaciones HOMALS
C a p t u l o 2

Ejemplo, datos, resultados e interpretacin


EJEMPLO Consideremos el sistema de relaciones resumido en la siguiente figura:

Suponemos que los cinco parientes utilizan los trminos de parentesco neerlandeses para referirse a cada uno de los otros, y que tambin tenemos disponible la informacin sobre sus edades y familia. La matriz de datos correspondiente es la de la tabla siguiente: h1 h2 h3 h4 h5 h6 h7 n1 F n3 C A B E E 2 E B B 2 E E 1 A 1 1 E F D F I II I II II n2 A F n4 D C n5 D C Variables/terminologa (h1 a h5 ): A = boer B = zoon D = oom E = neef

C = vader F = zeif Variable h6 (edad): 1 = 0-20 aos 2 = mayor de 20 aos Variable h7 (grupo familiar): I, II

E A F

16

Representaciones HOMALS Las variables de terminologa forman una submatriz de dimensin 5 5, complementadas con dos variables aadidas. Se puede remplazar sin perdida de informacin esta matriz de datos 5 7 de la tabla anterior por la matriz indicador de codificacin binaria G, tal y como sigue. Denotamos el conjunto finito de individuos por {n1, , n5} y por {h1, , h7} el conjunto de variables. Para cada variable hj tenemos que kj = {krj } es el conjunto finito de categoras de la variable hj . La matriz indicador binaria de la variable hj se denota por Gj y tiene como elementos, como ya se ha visto:

j ir

si al individuo i se le asigna la categora r de h j

0 si al individuo i no se le asigna la categora r de h j

Es claro que krj es la cantidad de individuos a los que se les asigna la categora r de la variable j. La matriz binaria G se construye adosando todas las matrices binarias indicador Gj , y es la que figura en la tabla siguiente:
G1 A n1 n2 n3 n4 n5 0 1 0 0 0 C 0 0 1 0 0 D 0 0 0 1 1 F 1 0 0 0 0 A 1 0 0 0 0 C 0 0 0 1 1 G2 D 0 0 1 0 0 F 0 1 0 0 0 B 1 0 0 0 0 G3 E 0 1 0 1 1 F 0 0 1 0 0 A 0 0 0 0 1 0 1 0 0 0 G4 B E 1 0 1 0 0 F 0 0 0 1 0 A 0 0 0 0 1 0 1 0 0 0 G5 B E 1 0 1 0 0 F 0 0 0 1 0 1 0 0 1 1 1 G6 2 1 1 0 0 0 I 1 0 1 0 0 G7 II 0 1 0 1 1

Se pueden interpretar intuitivamente los elementos g

j ir

de G como

indicadores de una relacin de asociacin: el individuo ni est asociado con la categora r de la variable hj si y solo si g
j ir

= 1. Se representa ahora esta

relacin de asociacin en un espacio eucldeo de baja dimensin p con una mtrica cuya distancia es . A los individuos y categoras recogidos en G se les hace corresponder los puntos adecuados en este espacio geomtrico mediante

17

Representaciones HOMALS el siguiente requisito: (para p pequeo). Se recogen los valores de siempre es posible construir en una matriz de distancias. En la prctica, no = 0 si y solo si g = 1 cualesquiera que sean i, j, r

j ir

j ir

de modo que se verifiquen todos los requisitos,

especialmente el requisito de que la dimensin p sea suficientemente pequea. Por tanto es necesaria una medida numrica de la adecuacin relativa de la cuantificacin (ver Gifi 1981). Representamos ahora los cinco individuos y las cuatro categoras (trminos de parentesco) de G1 en el espacio de dimensin 2 (p = 2). Una solucin sencilla, consistente con los requisitos formales, es agrupar n4 y n5 , distribuir arbitrariamente los cuatro grupos resultantes distintos de puntos de individuos sobre el espacio de dimensin 2, y colocar los puntos de categoras (trminos de parentesco) A1, C1, D1, F1 directamente sobre los puntos de individuos asociados. La configuracin resultante permanece estable cuando se aaden los puntos de categoras A2, C2, D2, F2 de G2 , y los puntos de categoras B3, E3, F3 de G3 (ver la siguiente figura)

F1 A2 n1

B3

F3 n3

C1 D2

F2 A1

E3 n2

E3 n4 n5 D1 C2

Si ahora tratamos de incluir los puntos de categoras de G4 , los puntos de individuos de n1 y n3 debern mezclarse, puesto que estn asociados al mismo punto de categora de E4 . Esta nueva configuracin de tres grupos distintos 18

Representaciones HOMALS de puntos de individuos y categoras permanece estable si incluimos ahora las categoras A5, B5, E5, F5 (ver la siguiente figura) B3 F1 A2 B4 F2 A1 B5 E3 n2 A5 E4 n1 n3 F3 C1 D2 E5 E3 F4 n4 n5 A4 D1 C2 F5

Cuando se consideran las categoras de las variables restantes, se mezclan finalmente todos los puntos en un nico grupo. La serie de representaciones geomtricas descritas ms arriba pueden proporcionar una interpretacin antropolgica extremadamente interesante. Los individuos n4 y n5 son hermanos del mismo sexo (varn), y como tales, son estructuralmente equivalentes dentro del reducido sistema de parentesco neerlands. Los hermanos son parientes cercanos genealgicamente; de hecho se mezclan en la primera representacin geomtrica de las dos anteriores. Como hemos visto, a medida que progresa la serie, se mezclan n1 y n3, y finalmente n2 con n4 y n5 . Esto es consistente con la identificacin del parentesco patrilineal del sistema neerlands. Queda claro tambin que ciertas variables son formalmente redundantes, puesto que su inclusin no altera la configuracin previa. Por ejemplo, la representacin de los cinco puntos de individuos como dos grupos separados ({n1, n3} frente a {n2, n4, n5}) obtenida a partir del anlisis de las variables de terminologa solamente, se expresa de forma ms directa como las categoras I y II de la variable h7 (grupos familiares). Por tanto, la terminologa y las variables sociales son formalmente interdependientes. 19

Representaciones HOMALS An las representaciones no triviales vistas en este sencillo ejemplo dan alguna idea de las posibilidades de la representacin HOMALS. Como acabamos de ver, aadir variables generalmente dar lugar a que la configuracin de puntos degenere en un nico grupo. Esto se evita en el procedimiento HOMALS representando cada punto individual como el centroide de todos los puntos con los que est asociado. El modelo da lugar entonces a una particin de los datos de forma que los grupos o subconjuntos de puntos son internamente tan homogneos como sea posible, mientras que al mismo tiempo se maximiza le heterogeneidad entre los subconjuntos de la particin. Es decir, se minimiza la suma de todas las distancias al cuadrado de las observaciones dentro del grupo, mientras que se iguala a una constante la suma de todas las distancias al cuadrado. DATOS Desgraciadamente, no he tenido acceso a la matriz de datos a la que se hace referencia en Tjon Sie Fat (1986), es decir, no he sido capaz de acceder a la publicacin de Rose (1965), de modo que solo puedo hacer referencia a lo que se puede leer en Tjon Sie Fat (1986), donde se sugiere la posibilidad de realizar un estudio similar al suyo a partir de los datos tabulados sobre los Wanindiljaugwa en Rose (1960) o a partir de la base de datos sobre los Alyawara dada en Denham et al. (1979). Al primero tampoco he tenido acceso y las tablas que se presentan en el segundo no corresponden a una tabla de datos como la presentada en el apartado anterior. El conjunto de datos en Rose (1965) se refiere a los Pitjandjara de Angas Downs, durante un periodo de tiempo corto de 1962. El conjunto de datos sobre el que se llev a cabo el anlisis puede dividirse en dos subconjuntos de variables. En primer lugar tenemos la tabla de datos sobre los trminos de parentesco utilizados entre 150 personas. Rose suscita el uso de trminos de parentesco Pitjandjara haciendo uso de la tcnica siguiente. Se toman fotografas personales de todos los individuos y se presenta despus el 20

Representaciones HOMALS conjunto completo de fotografas a cada persona para obtener as el trmino correcto utilizado para la persona de la fotografa. De las posibles 22350 identificaciones (son 150 150 150, ya que no se incluyen los 150 casos de autoreferencia), Rose obtuvo 11700 entradas, ms o menos el 52%. Los trminos perdidos se deben a que los nios y los jvenes no son capaces de identificar las fotografa, y a que hubo adultos que abandonaron el rea antes de completar sus respuestas. Por tanto, los datos de terminologa que, idealmente, deberan reflejar el uso de trminos para la poblacin entera, estn de hecho sesgados de una forma que no es aleatoria. En lugar de una matriz 150 150, la matriz de datos real de trminos de parentesco es rectangular, con 150 columnas, pero slo 105 filas. La entrada de la fila i y la columna j corresponde al trmino usado por el individuo i (ego) para el individuo j (alter). Rose identifica 17 trminos distintos, para los que utiliza las letras maysculas A, B, C, , Q. En segundo lugar, Rose tambin recogi informacin sobre otras caractersticas de cada uno de sus informantes. De estas variables aadidas, solo se incluyen 3 en el anlisis que realiza Tjon Sie Fat (1986): sexo, edad y grupo familiar. De modo que el conjunto de datos completo se puede visualizar como una matriz de dimensin 105 153, con valores para las 150 variables de terminologa y las otras tres variables (las columnas) registrados para los 105 individuos (las filas). Tjon Sie Fat (1986) proporciona una tabla resumen de tipos de parentesco y su definicin por piezas del significado primario de cada trmino de parentesco. Tjon Sie Fat (1986) utiliza el anlisis realizado por Scheffler (1978) sobre la terminologa de los Pitjandjara, por considerarlo ms adecuado que el de Rose, ya que sus dimensiones por piezas pueden contrastarse con las dimensiones deducidas a partir del modelo matemtico.

21

Representaciones HOMALS
SIMBOLO DE ROSE A B C E D F I J K N P O Q G H M L tjamu pakali kami puliri mama kamaru nguntju kuntill kuta kangkuru malany-pa watjira yuntal-pa katja ukari waputju umari minkayi inkani tjuwari marutju inkilyi kuru D S mZC, fBC WF WM HF, HM mBW, WZ, fZH, HB fBW, HZ mZH, WB CSpP H, W TRMINO TIPO DE PARENTESCO FF, MF, SS, DS SS, DS FM, MM, SD, DD SD, DD F MB M FZ B+ Z+ SbDEFINICIN POR PIEZAS K . L . G2 . . m K . L . G2 . - . m K . L . G2 . . f K . L . G2 . - . f K . L . G1 . + . m K . C1 . G1 . + . m . X K . L . G1 . + . f K . C1 . G1 . + . f . X K . Col . G= . + . m K . Col . G= . + . f K . Col . G= . K . C4 . G= K . L . G1 . - . f K . L . G1 . - . m K . C1 . G1 . -. X I. I. I. I. I. I. . G1 . + . m . m ego . G1 . f . m ego . G1 . + . . f ego . G= . . X . G= . . f . // . G= . . m . //

Las dimensiones del anlisis de componentes (piezas) de Scheffler quedan especificadas por las siguientes caractersticas bsicas: (1) Pariente (K) frente a no pariente (-K). La mayora de los parientes polticos (I) se consideran parientes por los Pitjandjara.

22

Representaciones HOMALS (2) Parientes lineales (L) frente a colaterales (C). Los relativos colineales (Col) son un caso especial de colaterales de primer grado. (3) Distancia generacional: misma generacin que ego (G=), a una generacin de distancia (G1), a dos generaciones de distancia (G2). (4) (5) (6) (7) Antigedad: mayor que ego (+) frente a menor que ego (-). Sexo de alter: varn (m) frente a mujer (f). Sexo relativo: el mismo (//) frente a opuesto (X). Sexo de ego: varn (m ego) frente a mujer (f ego).

Rose (1965) utiliza dos trminos adicionales: nanandaruka, para todos los miembros de la propia generacin de ego y las generaciones alternativas, y tjanamiltjan, para todos los miembros de las generaciones adyacentes a la generacin de ego. La descripcin por piezas de Scheffler de los trminos de parentesco de los Pitjandjara es una ordenacin simple de unidades de contraste por medio de las que las caractersticas y dimensiones del significado subyacente en la terminologa se hacen corresponder con el conjunto de lexemas. El espacio producto de clases semnticas asociado es no ortogonal, ya que las combinaciones de caractersticas de las dimensiones subyacentes no son independientes. RESULTADOS E INTERPRETACIN La eleccin del HOMALS para el anlisis de los datos de los Pitjandjara est motivada tambin en cuestiones prcticas. La matriz de datos de Rose contiene un gran nmero de entradas perdidas (aproximadamente el 48%). Es generalmente problemtico el anlisis de matrices tan escasas por medio de otras tcnicas de escalado multidimensional (MDS), puesto que uno est obligado a hacer hiptesis aadidas para la estimacin de los datos perdidos o a borrar aquellas observaciones para las que la informacin es incompleta. Este no es el caso con el procedimiento HOMALS, ya que la ubicacin de los 23

Representaciones HOMALS puntos de individuos y los puntos de categoras en el espacio eucldeo est slo restringido a las entradas no perdidas de la matriz de datos. Por tanto, el modelo elegido hace una utilizacin ptima de todos los datos disponibles. Tjon Sie Fat (1986) dice haber obtenido una representacin geomtrica de los datos en un espacio de 3 dimensiones, pero presenta las proyecciones de la nube de puntos sobre los planos cartesianos. Personalmente, a partir de su tabla de puntuaciones en cada dimensin de cada uno de los 105 individuos, obtengo, utilizando el lenguaje R:

24

Representaciones HOMALS

25

Representaciones HOMALS Utilizando despus el SAS, obtengo la representacin tridimensional de la tabla anterior.

Pero lo que interesa para completar este ensayo el conjunto de datos de Rose (1965), cuya tabla con individuos por filas y funciones por columnas, no proporciona. Alude Tjon Sie Fan (1986) a la informacin que obtiene utilizando los programas del paquete SLSS (Software Leiden for the Social Sciences), al parecer compatible con el SPSS. Ms concretamente, utilizando el programa HOMALGS del SLSS. Esta informacin es la habitual y se puede obtener tambin del paquete HOMALS para lenguaje R, escrito por De Leeuw, J. y Mair, P. en 2007. Dicha informacin incluye la tensin para cada dimensin, que refleja la importancia relativa (cuanto menor tensin hay mejor representacin). Incluso Tjon Sie Fan da el valor para cada dimensin (0,143; 0,456; 0,682 para las dimensiones 1, 2 y 3). Tambin incluye dicha informacin las medidas de discriminacin para cada una de las 153 variables y por dimensin, que Tjon Sie Fan no presenta. Las puntuaciones 26

Representaciones HOMALS (coordenadas) de cada uno de los 105 individuos sobre cada dimensin (es la tabla a partir de la que se construyen los grficos anteriores). Y finalmente, las puntuaciones (coordenadas) de las categoras de cada una de las 153 variables sobre cada dimensin (Tjon Sie Fan ni siquiera proporciona la tabla correspondiente, sino slo los grficos de algunas variables seleccionadas frente a las dimensiones 2 y 3). Tjon Sie Fan informa de que el programa que utiliz le proporcion la solucin de tres dimensiones despus de cinco iteraciones del algoritmo, en el que el criterio de convergencia por defecto tiene el valor 0,0003. Como puede verse combinando la informacin de los tres grficos planos y ayudndose del grfico tridimensional anterior, hay dos grupos principales situados en planos perpendiculares separados. La configuracin podra describirse como las alas de una mariposa que han sido giradas: la primera ala se despliega en el plano definido por las dimensiones 1 y 2 (primer grafico plano), mientras que la segunda ala se despliega en el plano definido por las dimensiones 1 y 3 (segundo grfico plano). Estas alas se unen en el origen (con coordenadas (0, 0, 0)). Rose (1965) recogi informacin aadida sobre los enlaces genealgicos bsicos (relaciones padres-hijos y entre hermanos) as como sobre matrimonios entre los aborgenes de Angas Downs. An cuando esta informacin es incompleta, da una tosca referencia para asociar el conjunto de individuos con los niveles generacionales. Tjon Sie Fan interpret las informaciones del HOLMALS con el respaldo de esta fuente de informacin independiente, y obtuvo los resultados siguientes: Los hermanos y las esposas se sitan dentro del mismo grupo (ala de mariposa), pero no los padres e hijos. El grupo desplegado por las dimensiones 1 y 2 contiene tanto a los padres como a los hijos de los individuos del grupo desplegado por las dimensiones 1 y 3. Adems, dentro del primer grupo hay dos 27

Representaciones HOMALS subconjuntos de individuos denominados como abuelos y nietos, y los miembros de las generaciones mayores tienen puntuaciones positivas sobre la dimensin 2, mientras que los de generaciones menores tienen puntuaciones negativas. Dentro de cada grupo, los hermanos y las esposas se representan generalmente por puntos prximos entre s. No hay un agrupamiento obvio de los individuos de acuerdo con el sexo o el grupo familiar. Tjon Sie Fan (1986) alude despus a la posible interpretacin de los grficos de un grupo de variables seleccionadas frente a las dimensiones 2 y 3, cuya tabla soporte no proporciona. Aparte de encontrar otra vez una estructura con forma de alas de mariposa giradas, quiz las conclusiones ms reseables que expone son las que se presentan en el captulo siguiente a modo de resumen.

28

Representaciones HOMALS
C a p t u l o 3

Conclusiones y software
CONCLUSIONES Podemos decir como conclusin que el anlisis HOMALS tridimensional de los puntos de individuos extrae de los datos una configuracin geomtrica que puede ser razonablemente y consistentemente asociada con la informacin genealgica disponible. Adems, la estructura de alas de mariposa giradas es una representacin visual llamativa del principio de clasificacin de generaciones alternativas, reconocido por los mismos Pitjandjara: los individuos del mismo grupo se denominan nanandaruka, los individuos de grupos diferentes se llaman entre s tjanamiltjan. Por otra parte, los hermanos relacionados genealgicamente estn incrustados dentro de grupos mayores de personas con terminologa equivalente. Es decir, los grupos obtenidos a partir de una particin de las variables terminolgicas son enteramente compatibles con los datos generacionales as como con la estructura de puntos de individuos descrita antes. Adems, no hay una interpretacin sencilla de los seis grupos considerados a partir de los grficos de las variables seleccionadas frente a las dimensiones 2 y 3, como clases de matrimonios exgamos. Finalmente, Tjon Sie Fan (1986) alude a la transformacin entre las denominaciones para la misma, anterior y posterior, y para dos generaciones anteriores o posteriores (G=, G-1, G+1, G-2, G+2), para concluir que como transformacin geomtrica sobre el espacio tridimensional, deja invariante la estructura de terminologa generacional, y que la aplicacin de tal transformacin cuatro veces nos devuelve al estado original (lo que da una idea del periodo de tiempo que abarca). Tambin expone Tjon Sie Fan (1986) la transformacin para pasar de un grupo a otro de los seis grupos 29

Representaciones HOMALS aludidos, para llegar a la conclusin que ahora, la aplicacin de esta transformacin dos veces nos devuelve al estado original. Acaba proponiendo explorar todas las combinaciones posibles de estas dos transformaciones que denomina r (entre generaciones) y s (para la misma generacin). Y concluye que dichas combinaciones constituyen un grupo algebraico: el grupo no comunicante G(r, s ) de orden 8, definido por r4 = s2 = e , donde e es la transformacin identidad, y r s = s r3 . Dice Tjon Sie Fan (1986) que este grupo corresponde a una subestructura particular del sistema terminolgico de los Pirjandjara. El anlisis parcial que resulta en G(r, s ) es slo el primer paso de un posible anlisis exhaustivo de la estructura terminolgica. Desde luego, ayudara a la comunidad cientfica y antropolgica que proporcionara un acceso razonablemente fcil al conjunto de datos con el que trabaja. SOFTWARE Independientemente del software que Tjon Sie Fan (1986) ha utilizado para elaborar su anlisis, y de lo que se pueda encontrar en los paquetes de Estadstica habituales en el mercado, mi intencin era utilizar software de libre distribucin, ms concretamente, alguno de los paquetes escritos para el lenguaje R, y para ms concrecin an, el paquete HOMALS escrito por Jan De Leeuw y Patrik Mair, pero no he podido aplicarlo a matriz de datos alguna. En cualquier caso, las pginas de Internet donde recabar ms informacin sobre las herramientas que estoy dispuesto a usar son: Pgina de inicio del lenguaje R: http://www.r-project.org/ Pgina de inicio para aplicaciones psicomtricas de esta tcnica y similares: http://r-forge.r-project.org/projects/psychor Pagina de inicio del profesor De Leeuw: http://gifi.stat.ucla.edu/

30

Representaciones HOMALS

Bibliografa Bjrk, A. & Golub, G.H. (1973) Numerical methods for computing angles between linear subspaces. Mathematics of Computation, 27: 579594. De Leeuw, J. & Van Rijckevorsel, J (1980) HOMALS and PRINCALS Some generalizations of principal components analysis. En: Data Analysis and Informatics, E. Diday et al., eds. Amsterdm: NorthHolland. Denham, W.; McDaniel, CH. and Atkins, J. (1979) Aranda and Alyawara kinship: a quantitative argument for a double helix model. American Ethnologist, 6: 1-24. Gifi, A. (1981) Nonlinear multivariate analysis. Leiden: Department of Data Theory. Levi-Strauss, C. (1969) The Elementary Structures of Kinship. Boston: Beacon Press Meulman, J. (1982) Homogeneity analysis of incomplete data. Leiden: DSWO Press. Rose, F. (1960) Classification of kin, age structure and marriage amongst the Groote Eylandt aborigenees.A study in method and a theory of Australian kinship. Berlin: Akademie Verlag. Rose, F. (1965) The wind of change in Central Australia. The aborigenes at Angas Downs, 1962. Berlin: Akademie Verlag Tjon Sie Fat, F. (1986) Multidimensional analysis of Pitjandjara kin term usage: HOMALS representatons. En New Trends in Mathematical Anthropology; De Meur, G. ed.. London: Routledge & Kegan Paul. Wilkinson, J.H. (1965) The algebraic eigenvalue problem. Oxford: Clarendon Press.

31

También podría gustarte