Tema 2 Redes Complejas
Tema 2 Redes Complejas
sistema complejo
1 Introducción
Los grafos son objetos matemáticos constituidos por un conjunto de nodos
(llamados vértices) conectados mediante uniones (aristas) formando una estructura
más o menos compleja. La teoría de grafos es una rama de las matemáticas que
comenzó a desarrollarse en el siglo XVIII. Fue el gran genio Leonhard Euler
(1707-1783) (ver figura 1) quien primero resolvió un problema combinatorio
haciendo uso de las propiedades estructurales de los grafos. En particular
Leonhard Euler en 1735 resolvió el problema de los Siete Puentes de Königsberg
(actual Kaliningrado, capital del Oblast de Kaliningrado)
En esa época la ciudad de Königsberg, Prusia, tenía 7 puertos conectando
las orillas del río Pregel con dos grandes islas. El problema de los siete puentes
de Königsberg es decidir si es posible seguir un camino que cruce cada puente
sólo una vez y volver al punto de origen del camino.
La respuesta es que no es posible. No existe tal ciclo Euleriano. Euler
demostró que tal camino no existe mapeando el problema en un problema
definido en un grafo (ver figura 2)1 , comenzando la rama de las matemáticas
que se conoce como Teoría de Grafos. De esta forma esta teoría tiene una
antigüedad de 300 años. Sin embargo en este curso vamos a estudiar el nuevo
campo de las redes complejas, que en su lugar sólo lleva desarrollándose unas
pocas décadas. Más concretamente, el campo de las redes complejas aparece
en la última década del siglo pasado con dos artículos seminales, el de Watts
& Strogatz sobre redes pequeño mundo 2 y el de Barabasi & Albert sobre
1 Euler determinó que si tal camino existiera los puntos intermedios del mismo estarán
conectados a un número par de líneas (la entrante y la saliente). Entonces sólo el punto inicial
y el final podrían estar conectados con un número impar de líneas. Pero además se tiene que
cumplir que el punto inicial debe ser igual al final, por lo que tendrán también un número par
de líneas. Conclusión en dicho camino posible no hay ningún punto conectado con un número
impar de líneas. Si vemos el grafo de los puentes de Königsberg, los 4 nodos poseen un número
impar de líneas incidentes por lo que es imposible definir un camino con las características
buscadas.
2 Watts, Duncan J.; Strogatz, Steven H. (June 1998). "Collective dynamics of ’small-world’
1
Figure 1: Retrato de L. Euler (1707-1783), considerado el padre fundador de la
teoría de grafos
2
Figure 3: Las redes complejas representan sistemas cuya complejidad está
comprendida entre estructuras regulares y aleatorias.
3
depredador-presa o de parasitismo sino también relaciones de simbiosis (mutualistas)
cuya ultimo finalidad es incrementar el beneficio mutuo de las especies (nodos)
que intervienen (por ejemplo un alga y un hongo formando un liquen o una abeja
y una flor que favorece el sustento de la abeja y la polinización de la flor). Las
redes complejas se encuentran también en el conjunto de complejas reacciones
entre proteínas que organizan la actividad y metabolismo celular y en la propia
red del cerebro que condiciona los procesos mentales como memoria, recuerdos,
procesamiento de información espacio-temporal y la propia conciencia. Algunos
ejemplos están resumidos en la tabla 1.
2 Teoría de grafos
Como hemos expuesto anteriormente, existen multitud de sistemas naturales
cuyo comportamiento emergente es el resultado de la interacción de un gran
número de constituyentes que interaccionan entre sí mediante influencias diversas,
de forma que su estructura se puede definir en términos de una complicada red
de nodos y uniones entre ellos donde cada constituyente viene definido por
una variable de estado asociada al nodo y donde el estado de las uniones
define la influencia o interacción entre nodos. Esta intrincada red tiene a
priori una estructura compleja, de cuyas propiedades puede inferirse cierto
comportamiento emergente en el sistema.
Históricamente el estudio de las redes complejas ha sido abarcado cierta rama
de las matemáticas discretas denominada teoría de grafos. Una red compleja
se puede representar formalmente por un grafo. Vamos a definir a continuación
este concepto:
1. Un grafo no dirigido (dirigido) G = (N , L) está constituido por dos
conjuntos N = {n1 , . . . , nN } cuyos elementos son los nodos, vértices
o puntos del grafo y L = {l1 , . . . , lL } cuyos elementos son las uniones,
4
n8
l11
n7
l8
n6
l9
l10
n5
n4
l7
l6
l4
n3
l2
n1 l53
l1
n2
3. Las aristas vienen definidas por los órdenes de los nodos que unen, es decir,
la unión entre los vértices ni y nj se denota por lk = (i, j) = (ni , nj ) = lij .
En este caso, si hay una unión o arista entre dos nodos, los nodos se llaman
vecinos o adyacentes.
5
n2 n2 n2 n2
5
n1 n1 n1 n1 1
6
n3 n3 n3 n3
3
n4 n4 n4 n4
5
1
n5 n5 n5 n5
6
n1 m1
n2 m2
n3 m3
n4 m4
n5 m5
Ejercicio: dibujar Li i = 0, . . . , 8
7
Figure 7: Árbol, bosque y estrella.
8
En el grafo simple de la figura 5 la matriz de adyacencia es:
0 1 0 0 0
1 0 1 1 0
A= 0 1 0 1 1
0 1 1 0 1
0 0 1 1 0
9
Nota: En algunos libros se define como matriz de adyacencia de una grafo
dirigido a la AT . Se tiene que la matriz de adyacencia es asimétrica (por
ser el grafo dirigido) y los elementos de la diagonal son cero (por no haber
lazos o auto-conexiones).
Ejercicio: Calcular la lista de aristas y la matriz de adyacencia
para el multigrafo representado en la figura 5
3. Matrix de incidencia para un grafo o red dirigida: la matriz de incidencia
es una matriz B N × L que como antes representan el número de vértices
y aristas de la red, respectivamente, tal que
−1 si la arista l sale del vértice i
Bil = 1 si la arista l apunta al vértice i
0 cualquier otra situación
wij si el nodo j está conectado con el i mediante una arista de peso wij
Aij =
0 cualquier otra situación
wij si el nodo j apunta al nodo i con una unión de peso wij
Aij =
0 cualquier otra situación
10
2.2.4 Matriz de incidencia de un grafo bipartito
Un grafo bipartito GB (N, M, L) viene descrito por una matriz de incidencia
B definida como una matriz N × M con elementos
1 si el nodo i de N está unido por una arista al nodo j de M
Bij =
0 cualquier otra situación
P = BBT
P̃ = BT B
2. Grado de un nodo:
En una red no dirigida se define el grado de un nodo i como el número
total de aristas incidentes en dicho nodo y se denota por ki . En una red
dirigida se distingue entre grado entrante (in-degree) de un nodo i como
el número total de nodos que apuntan a dicho nodo y se representa por
kiin , y grado saliente (out degree) de un nodo i como el número total de
11
nodos a los que apunta el nodo i y se denota por kiout . En el caso de redes
no pesadas el grado de un nodo se puede calcular directamente a partir
de la matriz de adyacencia:
N
X N
X
ki = Aij = Aji red no dirigida
j=1 j=1
XN
kiin = Aij red dirigida
j=1
XN
kiout = Aji red dirigida
j=1
K in = max kiin
i
K out = max kiout
i
12
5. Distribución de probabilidad de grados de un grafo:
El grado de un nodo es una propiedad local de la red pero considerando
la secuencia de grados podemos determinar algunas propiedades globales
de la red. La organización y estructura global de una red inducida por su
secuencia de grados está caracterizada por la distribución de probabilidad
de grados de la red P (k).
Para un grafo no dirigido se define P (k) como la fracción de nodos de
grado k y representa la probabilidad que un nodo elegido al azar en la red
tenga un grado k.
Para un grafo dirigido se definen respectivamente y de forma análoga
P in (k) y P out (k) como la fracción de nodos de grado entrante k y la
fracción de nodos de grado saliente k, que me definen las distribuciones
de probabilidad de grados entrantes y salientes. Esto es P in (k) y P out (k)
representan las probabilidades de que al elegir al azar un nodo en la red
tenga un grado entrante k o, respectivamente, un grado saliente k. Vamos
a formalizar esto que acabamos de definir
(a) Grafo no dirigido: definimos N (k) como el número total de nodos en
la red con conectividad k,es decir
N
X
N (k) = δ(k, ki )
i=1
13
entonces P in (k) y P out (k) se definen como:
N in (k)
P in (k) =
N
N out (k)
P out (k) =
N
de donde se tiene que son definidas positivas y normalizadas a la
unidad, es decir:
in
K
X
P in (k) = 1
k=0
out
K
X
P out (k) = 1
k=0
L=D−A
14
De manera formal definimos un camino en un grafo como una secuencia
de nodos tal que dos nodos consecutivos en la secuencia están conectados
por una arista. Un camino dirigido en una red dirigida es un camino
con las aristas dirigidas desde cada nodo al siguiente en la secuencia.
Cada camino tiene su longitud definida como el número de aristas que
se pasan al seguirlo incluyendo posibles repeticiones en caminos que se
intersectan asimismo. Los caminos que partiendo de un nodo vuelven al
final a él mismo se llaman caminos cíclicos o ciclos, mientras que los
que empiezan y acaban en nodos distintos se llama caminos acíclicos o
aciclos. Los caminos acíclicos que visitan los nodos del camino solo una
vez se llaman caminos acíclicos auto-evitados. Los caminos cíclicos
que visitan los nodos del camino solo una vez, salvo el nodo primero,
también se llaman caminos cíclicos auto-evitados.
El número de caminos (caminos dirigidos en una red dirigida) de longitud
n que unen un nodo j y un nodo i en una red, que denotamos como Nijn
se puede determinar en función de la matriz de adyacencia en la forma
15
redes de aeropuertos ciudades con vuelos directos están a una distancia
más corta que ciudades que se alcanzan a través ce otras intermedias,
aunque pueden estar físicamente más cercanas que las anteriores. Muchas
redes complejas están caracterizadas pequeñas distancias entre nodos, por
ejemplo cada dos personas en el mundo están separadas por unos pocos
saludos de manos a través de otras personas. Vamos a cuantificar todos
esto aspectos con las definiciones que siguen:
Definimos el camino más corto entre dos nodos i y j en una red como el
camino (camino dirigido en el caso de una red dirigida) de mínima longitud
(medida en número de aristas que hay en el camino para llegar de un nodo
al otro). Definimos la distancia más pequeña entre uno nodo i y j y
la denotamos como d(ni , nj ) = d(i, j) como la longitud del camino más
corto entre dichos nodos.
Definimos la longitud promedio de caminos o distancia promedio
como el promedio de las distancias más pequeñas entre dos nodos cualesquiera
de la red (estamos suponiendo que existen un camino conectando cualquiera
dos nodos de la red):
N N
1 X X
`= d(ni , nj )
N (N − 1) i=1
j=1
j 6= i
D = max d(ni , nj )
i,j6=i
D ≈ N 1/d
es decir el número medio de vértices que tenemos que visitar para llegar
a cualquier otro vértice de la red crece con el tamaño (N ) de la red. Sin
embargo en muchas redes reales a pesar de tener tamaños muy grandes
existe un relativamente corta longitud de camino entre cualesquiera dos
nodos, cualidad que caracteriza la propiedad de pequeño mundo que
implica tener un diámetro D ∼ O(ln N ) es decir que
D
lim = cte.
N →∞ ln N
16
La propiedad de pequeño mundo en redes complejas suele estar asociada
con la existencia de un alto grado de agrupamiento de nodos (clustering)
en la red. Por esta razón Watts y Strogatz definieron las redes tipo
pequeño mundo como aquellas que tienen ` pequeño (como veremos las
redes aleatorias) y C grande (coeficiente de agrupamiento grande como en
las redes regulares).
9. Una red puede ser conectada (conteniendo un solo componente) o desconectada
(conteniendo diferentes componentes).
10. Un lazo no dirigido es un tipo especial de subgrafo de un grafo no
dirigido tal que cada nodo del mismo tiene grado 2 y cada nodo se puede
alcanzar desde cualquier otro nodo del lazo. Un lazo dirigido es aquel
subgrafo de un grafo dirigido tal que cada nodo del lazo tiene un grado
saliente 1 y un grado entrante 1, y puede ser alcanzado por todos los otros
nodos del lazo. En un lazo el número de nodos es igual al número de
aristas y a este número n lo llamamos longitud del lazo. Para un grafo no
dirigido se tiene que el número de lazos de longitud n = 3 es:
1
L3 = TrA3
6
17
Figure 8: Calculo del coeficiente de agrupamiento
18
3 Redes regulares y redes aleatorias
De forma intuitiva, una red totalmente conectada tiene la menor longitud promedio
de caminos (` = 1) y el mayor coeficiente de agrupamiento (C = 1). Aunque este
tipo de redes tienen las propiedades de pequeño mundo y alto agrupamiento de
muchas redes reales presenta un alto número de aristas, a saber N (N −1)/2 para
una red no dirigida, mientras que en la mayoría de redes reales tienen un número
de aristas que es O(N ). Las redes complejas están ubicadas como veremos entre
la redes regulares y las redes totalmente aleatorias, por lo que vamos a comenzar
la descripción tanto de redes regulares como de redes aleatorias.
19
3.2 Redes aleatorias: red de Erdös-Rényi
Una red aleatoria es aquella en que el grado de cada nodo es una variable
aleatoria ki ∈ [0, N ]. El estudio sistemático de las redes aleatorias fue iniciado
en 1959 por dos matemáticos Erdös y Rényi (ER) con el propósito original
de estudiar mediante métodos probabilísticos las propiedades de los grafos en
función de un incremento aleatorio del número de conexiones en el grafo. Hicieron
un gran avance en la teoría matemática clásica de grafos que revolucionaría
la forma en que se pueden modelar estos problemas describiendo una red con
topología compleja por medio de un grafo aleatorio, estableciendo los fundamentos
de la teoría de redes aleatorias. Aunque la intuición indica claramente que
muchas redes complejas de la vida real no son ni totalmente regulares ni completamente
aleatorias, el modelo ER fue el único enfoque sensato y riguroso que dominó el
pensamiento de los científicos acerca de las redes complejas durante la segunda
mitad del siglo XX.
El término grafo aleatorio se refiere a la naturaleza aleatoria de la localización
de aristas entre diferentes nodos del grafo ER. En su primer artículo, Erdös
y Rényi propusieron un modelo para generar grafos aleatorios con N nodos
y L aristas, que en lo que sigue denotaremos como red aleatoria de Erdös
y Rényi (ER) o grafo GER (N, L). La forma de construirlo es la siguiente:
Comenzamos con N nodos desconectados y empezamos conectando parejas
de nodos seleccionados al azar mediante aristas, impidiendo la posibilidad de
múltiples aristas entre los mismos nodos, hasta que el número total de aristas
alcanza el valor L. De esta forma el grafo resultante es uno solo de los muchos
que se pueden generar con N nodos y L aristas. Es decir sería un elemento del
conjuntos estadístico de todas las posibles combinaciones de L aristas. Para
una descripción completa del modelo ER necesitaríamos el conjunto entero
estadístico de todas las posibles realizaciones, esto es, en la representación
matricial, del conjunto de matrices de adyacencia.
Una forma alternativa de construir una red ER es conectar cada par de nodos
en la red con probabilidad 0 < p < 1. Este procedimiento define un conjunto
de diferente de grafos con diferentes número de aristas, que denotamos por
GER (N, p). En este conjunto aparecen grafos con L aristas con una probabilidad
pL (1 − p)N (N −1)/2−L . Los dos modelos coinciden en el límite de N 1. Notad
que el límite N → ∞ se toma para mean degree hki fijo, que se corresponde
aPfijar 2L/N Pen el primer modelo y p(N − 1) en el segundo, puesto que hki =
j [A ij ] = j p = p(N − 1), donde [Aij ] es el promedio de los elementos de la
matriz de adyacencia. En este caso se tiene trivialmente hLi = pN (N −1)/2,que
permite ver la equivalencia entre las dos descripciones. El segundo modelo es
más útil para hacer cálculos analíticos.
Las propiedades estructurales de las redes ER varían en función de p mostrando
un cambio muy dramático a pc = 1/N correspondiente a un valor crítico del
grado promedio hkic = 1. Erdös y Rényi demostraron que:
• si p < pc entonces con probabilidad cercana a uno, cuando N → ∞, el
grafo no tiene componentes de tamaño mayor que O(ln N ) y las componentes
no tienen más de un ciclo.
20
• Si p = pc entonces el componente mas grande del grafo es O(N 2/3 )
• Si p > pc entonces el grafo tiene un componente que es O(N ) y tiene un
número O(N ) de ciclos y los otros componentes son O(ln N ) y no tienen
más de un ciclo.
hkik
P (k) = e−hki ,
k!
por lo que también la red ER se llama red aleatoria Poissoniana. En la figura
10 se muestra la forma de la distribución caracterizando una red ER, y muestra
un pico que está centrado entorno a hki. Debido a esta característica se habla
de una distribución de grados homogénea.
21
Figure 10: Diferencias entre la distribución Binomial y la de Poisson y como la
distribución Binomial se aproxima a la de Poisson para N hki.
Las redes aleatorias se pueden generalizar a redes que no tengan una distribución
de tipo Poissoniana dando lugar a lo que se conoce como modelo configuracional
de red aleatoria y que se construye de la siguiente forma:
Especificamos una distribución de probabilidad arbitraria P (k) de forma
que este número representa la fracción de vértices en la red que tienen una
conectividad k. Especificamos una secuencia de grados {k1 , . . . , kN } tomada de
esta distribución. A continuación empezamos a establecer aristas entre nodos
de la red de forma que se satisfaga al final esta secuencia de grados con lo que
generamos una posible topología de red que viene descrita por P (k). Con este
procedimiento se puede generar cualquier configuración o topología de red que
viene descrita por P (k). El modelo configuracional se define entonces como
el conjunto de todas estas posibles topologías que se pueden generar con este
procedimiento y que tienen en común P (k), todas teniendo el mismo peso en
el conjunto. En el límite N 1 se puede demostrar que P (k) coincide con la
distribución de grados de cada configuración. El modelo configuracional falla sin
embargo en incorporar la estructura de bucles que se encuentra en la mayoría
de las redes reales.
En el modelo configuracional se puede demostrar las siguientes propiedades
estructurales:
ln(N/z1 )
• ` = ln(z2 /z1 )
+ 1 donde zm es el número de vecinos a una distancia m de
una nodo dado 4 . En ER se tiene que z1 = hki y z2 = hki2
h 2 i2
• C = hki
N
hk i−hki
hki 2
4 Ver por ejemplo M.E.J. Newman, S.H. Strogatz, D.J. Watts, Phys. Rev. E 64 (2001)
26118.
22
4 Redes pequeño mundo
En 1998, con el fin de describir la transición de una red regular en una red
aleatoria, Watts y Strogatz (WS) introdujeron el concepto de red pequeño
mundo. Debe notarse que el fenómeno de mundo pequeño es de hecho muy
común, y nada alejado de nuestras experiencias diarias. A menudo, poco después
de conocer a un extraño, uno se sorprende al descubrir que tenemos un amigo
común con él, de modo que es habitual la expresión: "¡Qué pequeño es el
mundo!". Un experimento que se realizó hace más de 40 años dio lugar al
llamado "principio de los seis grados de separación", sugerido por el
psicólogo social Milgram a finales de 1960, y que establece que entre cualesquiera
dos personas del mundo hay una media de 6 conexiones de amistad, independientemente
de lo lejanas que estén dichas personas. Aunque este punto sigue siendo controvertido,
el patrón del mundo pequeño ha demostrado estar presente en muchas redes
reales. Una característica importante y común al modelo de redes aleatorias
(ER) y al de mundo pequeño (WS) es que la función de distribución de grados
tiene un máximo en el valor medio del grado y decae exponencial-mente, lo
que quiere decir que casi todos los nodos de la red tienen el mismo número de
conexiones. Por ello, es común denominar a estos tipos de redes de manera
conjunta como redes exponenciales o redes homogéneas.
El modelo de WS fue propuesto como una forma de extender los modelos
de redes aleatorias para explicar dos observaciones que se habían descrito en las
redes reales: a) la propiedad de pequeño mundo que se caracteriza en las redes
reales por tener un longitud media de caminos entre dos nodos que va como
ln N lo que las diferencia de las redes regulares donde va como N , y b) el alto
coeficiente de agrupamiento observado en las redes reales y que las redes ER no
podían explicar (ver figura 11).
Para conseguir una red aleatoria con estas propiedades de las redes complejas
Watts y Strogatz proponen un modelo de red que se obtiene mediante un proceso
de re-cableado con una cierta probabilidad p. La forma de construir la red es la
siguiente:
• Partimos de una red regular de N nodos donde cada nodo tiene k = 2m
vecinos. Los nodos están dispuestos en un anillo circular tal que de cada
nodos salen m aristas conectando los primeros m vecinos a la derechas del
nodo y otras m aristas conectando los primeros m vecinos a la izquierda
del nodo. En la figura 12 se observa en el panel de arriba la red regular de
partida en (a) donde se está tomando m = 2, es decir cada nodo tiene 4
vecinos. El número total de aristas en la red inicial es por tanto K = mN.
• Entonces para cada nodo del anillo, re-cableamos con probabilidad p a un
nodo al azar en el anillo cada una de las aristas con sus vecinos situados
en el sentido de las agujas del reloj. Por lo tanto las aristas con los
vecinos permanecen con probabilidad (1 − p) y se quitan con probabilidad
p. Entonces si p = 0 el re-cableado no se produce y la red sigue siendo la de
partida, es decir regular (caso a en la figura 12). Si p = 1 todas las aristas
son cambiadas y puestas al azar sobre nuevos nodos en la red de forma que
23
Figure 11: Comparación entre el coeficiente de agrupamiento de redes reales
(círculos de colores) con diferente número de nodos con el correspondiente
coeficiente de agrupamiento para una red ER (línea verde)
24
Figure 12: Generación de redes tipo pequeño mundo y su comparación con redes
regulares y redes aleatorias.
para p = 0 se tiene
N (N + 2m − 2) N
`(N, 0) = ∼
4m(N − 1) 4m
para p = 1 se tiene
ln N
`(N, 1) =
ln(2m − 1)
Existen una transición de fase continua entre estos dos valores, es decir un
pc que separa estos dos comportamientos con una longitud característica
que diverge como p−1
• Coeficiente de agrupamiento:
3(m − 1)
C(p) = (1 − p)3
2(2m − 1)
25
Figure 13: Red pequeño mundo en cultivos neuronales (Santos Sierra et al.
Plos One 2014). Panel (A) coeficiente de clusteris y longitud promedio de
caminos mostrando comportamiento pequeño mundo. Panel (B), comparación
de dichos parámetros con respecto a redes aleatorias y redes regulares. Panel
(C), comparación de la eficiencia local y global comparada con la de redes
aleatorias, medidas, respectivamente, como el inverso de la distancia más corta
entre dos nodosPEij = 1/d(i, j) y el promedio de dichas eficiencias locales
E(G) = N (N1−1) i6=j Eij .
5
para k ≥ m y 0 para k < m
Ejercicio: Construir una red WS con re-cableado y otra en la que
no hay re-cableado sino establecimiento con probabilidad p de atajos
y comparar las dos redes resultantes y sus propiedades estructurales,
P (k), ` y C.
J. B 13 (2000) 547.
26
Figure 14: Probabilidad acumulada de la red de servidores en Internet donde
las aristas son conexiones físicas entre servidores.
f (αx) = βf (x)
27
En general denotaremos como redes invariantes de escala la que vienen
descritas por una distribución de grados que tipo ley de potencias pero
esto no significa necesariamente que dichas redes sean también invariantes de
escala respecto de otros propiedades estructurales de la red. Además, la forma
funcional en forma de ley de potencia implica que todos los grados entre kmin y
kmax pueden aparecer en la red, es decir tienen una probabilidad no nula en el
límite termodinámico de aparecer a diferencia de las redes homogéneas donde
casi todos los nodos tienen el mismo grado y la probabilidad de que aparezca
un nodo con un grado muy diferente de la media decae rápidamente a cero.
Este hecho implica una alta heterogeneidad en los posibles grados en la red
y la existencia de unos pocos nodos con una alto grado, los llamados “hubs”
conectados con un alto número de nodos con grados pequeños. En redes de
tamaño finito pueden existir cortes (“cut-offs”) en la distribución de grados.
También para grandes grados las distribuciones muestran una alta dispersión a
conectividades altas, es decir en las colas, debido a la pobre estadística. En estos
P∞ es más0 útil estudiar la probabilidad acumulada definida como Pcum (k) =
caso
k0 =k P (k ) (ver por ejemplo figura 14). En este caso se puede obtener el
exponente de P (k) como γ = 1 + γcum .
28
5.2 Modelos dinámicos de redes invariantes de escala
Estos modelos surgen cuando se trata de modelar la dinámica de crecimiento
de ciertas redes reales. En estos casos las propiedades estructurales de la red
resultante dependen de la propia dinámica evolutiva de la red que la ha llevado
a ese estado final. El modelo más conocido de este tipo es el modelo de Barabási
y Albert (BA) también conocido como de añadido preferencial de nodos 7 .
El modelo BA está basado en como la WWW se ha ido formando y se
basa fundamentalmente en dos aspectos: crecimiento y añadido preferencial
de nodos. La idea principal es que los lugares de la WWW con grados altos
adquieren nuevas aristas a nuevos nodos con más probabilidad que los lugares
con grados más bajos. De forma más precisa un grafo GBA (N, L) se construye
de la siguiente forma. Se parte de m0 nodos aislados y a cada instante de tiempo
t = 1, 2 . . . , N − m0 se añade un nuevo nodo j a la red con m ≤ m0 aristas. La
probabilidad de que una arista conecte el nodo nuevo j con un nodo i de los m0
existentes es proporcional al grado del nodo i, es decir ki :
ki
pj→i = P .
l kl
Dado que cada nodo que se añade tiene m aristas entonces en cada instante
de tiempo t tenemos N = m0 + t nodos y L = mt aristas, de forma que la
conectividad promedio es hki = 2m para tiempos muy grandes.
El modelo BA has sido resuelto en aproximación de campo medio obteniendo
una ecuación de tipo rate y una ecuación maestra. En el límite de t → ∞ se
puede obtener como solución una distribución P (k) ∼ k −γ con γ = 3 (ver figura
15)
Podemos determinar una ecuación dinámica para la evolución de las conectividades
en el modelo BA en la siguiente forma: supongamos que añadimos un nuevo
nodo j a la red que se puede conectar con los existentes a través de m aristas
entonces se tiene que
dki
= mpj→i
dt
pues el nodo i tiene m posibilidades
P de poder conectarse con el j con
probabilidad pj→i . Por otra parte l kl = 2mt − m pues la suma se extiende a
número total de nodos menos el j, que tiene una conectividad kj = m. Usando
este resultado tenemos
dki ki
=
dt 2t − 1
cuya solución para t largos es
1/2
t
ki (t) = m
ti
7 Albert-László Barabási & Réka Albert (1999). "Emergence of scaling in random
networks". Science 286: 509-512.
29
Figure 15: Generación de una topología de red BA con m = 3 y N = 100000
nodos. Los puntos morados corresponden al histograma que se obtiene con
intervalos lineales, y los verdes al que se obtiene con intervalos tomados en
escala log.
6 Correlaciones grado-grado
La distribución de grados P (k) caracteriza completamente las propiedades estadísticas
de redes complejas descorrelacionadas, que son aquellas en las que el grado de
un nodo es independiente del grado del resto de los nodos en la red. Sin embargo
hay multitud de redes reales en las que la probabilidad de que un nodo de grado
k esté conectado a otro nodo de grado k 0 depende de k. En estos caso es necesario
30
Figure 16: Panel superior: dependencia de las conectividades ki con el tiempo.
Panel inferior: evolución de la P (k) con el tiempo en el modelo de BA
31
introducir una probabilidad condicional P (k 0 |k) definida como la probabilidad
de que un nodo de grado k y un nodo de grado k 0 estén conectados por una
arista. Esta probabilidad satisface la normalización
X
P (k 0 |k) = 1
k0
y la condición de balance detallado
kP (k 0 |k)P (k) = k 0 P (k|k 0 )P (k 0 ).
Para redes descorrelacionadas P (k 0 |k) no depende de k de donde usando la
normalización y la condición anterior obtenemos
P (k 0 |k) = k 0 P (k 0 )/hki.
Aunque las correlaciones grado-grado quedan formalmente caracterizadas
por P (k 0 |k) en la práctica debido al tamaño finito de muchas redes complejas
(que da resultados muy ruidosos para esta probabilidad condicionada) es más
conveniente trabajar para medir correlaciones grado-grado con el grado promedio
de los vecinos próximos de un grado i definido como
N
i 1 X 1 X
knn = kj = Aij kj
ki ki j=1
j∈vec(i)
32
Figure 17: Generación de redes invariantes de escala con diferentes tipos de
correlaciones grado-grado.
kl y kl0 son
donde P P los grados de los dos nodos conectados por una arista l y
1
[.] = hkiN l (.) = ij Aij es un promedio sobre todas las aristas en la red que
se puede escribir en la forma:
y es tal que para un valor positivo significa que la red es asortativa (como
ocurre en la mayoría de las redes sociales) y un valor negativo implica disasortatividad
(como en las redes biológicas y tecnológicas) como se muestra en la figura 19.
7 Redes jerárquicas.
Muchas redes reales presentan dos propiedades genéricas: invariante de escala
y un elevado coeficiente de agrupamiento para todos los nodos. Estas dos
características pueden aparecer debido a la existencia de una alta jerarquización
en la forma que pequeños grupos de nodos se organizan de una forma jerárquica
en grupos de nodos mayores manteniendo la invariante de escala. Podemos
así definir las redes jerárquicas como aquellas redes complejas que presentan
invariancia de escala a la vez que un coeficiente de agrupamiento muy elevado
para todos los nodos. En estas redes el grado de agrupamiento que caracterizan
los diferentes grupos de nodos sigue una estricta ley de escala que puede ser
usada para detectar jerarquización en redes reales.
33
Figure 18: Panel superior, diferencias entre redes asortativas y disasortativas.
Panel inferior muestras dos ejemplos de redes reales con diferente asortatividad,
por ejemplo en (a) (grupos de amigos en una escuela de EEUU) una red
asortativa y en (b) (red de interacción de proteínas en la levadura de la cerveza
Saccharomyces cerevisae) una red real disasortativa.
34
Figure 20: Comparación entre redes aleatorias, invariantes de escala y redes
jerarquizadas.
35
Propiedades:
P (k) = ck −γ
C(N ) ∼ cte
Review E. 67 (4)
36
Figure 21: Propiedades estructurales de redes jerárquicas aleatorias.
Figure 22: Redes reales jerárquicas: (a) red de actores (b) red semántica de
palabras inglesas (c) la red WWW y (d) Internet
37
8 Redes modulares
Muchas redes reales muestran cierta modularidad , en el sentido que puede
subdividirse en grupos de nodos más interconectados entre sí, que constituyen
comunidades o módulos, que a su vez están conectados entre sí con una menor
densidad de aristas (ver figura 23) . Este característica ya la hemos visto en el
caso de las redes jerárquicas que muestran una clara modularidad. El problema
de detectar y caracterizar las estructura modular de una red compleja tiene una
gran interés actual pues permite entender la estructura y función de la red y su
mecanismo de crecimiento. De hecho constituye una de las principales líneas de
investigación en el campo de las redes complejas. Generalmente para determinar
los módulos o comunidades presentes en una red compleja se utiliza un proceso
de optimización que maximiza un determinado parámetro que denotamos por
“modularidad”.
De forma más cuantitativa se puede definir la modularidad de una red
compleja como la fracción de aristas que caen dentro de un grupo de
nodos en una red compleja menos la fracción de aristas que habría en
dicho grupo de nodos si la red fuera aleatoria. El rango de la modularidad
es [−1/2, 1), donde un valor positivo indica que el número de aristas dentro del
grupo de nodos es mucho más grande que el que se esperaría simplemente de
conectar al azar los nodos. Podemos por lo tanto determinar la estructura en
comunidades de una red compleja, explorando divisiones de la red que impliquen
una modularidad positiva. Uno de los métodos tradicionales que se han utilizado
para esto es optimizar la modularidad sobre diferentes particiones de la red
mediante el algoritmo de “recocido simulado” (simulated annealing). Sin
embargo este método requiere un alto coste computacional. Los métodos más
aceptados actualmente son los que re-formulan la modularidad en términos de
las propiedades espectrales de la red en cuestión.
Supongamos una red constituida por N vértices y L aristas. Supongamos
que la red puede dividirse en dos grupos I y II. Denotamos si = 1 si el vértice i
pertenece al grupo I y si = −1 si i pertenece al grupo II. Sea Aij el elemento ij
de la matriz de adyacencia que en principio puede tomar el valor 0 o 1, aunque
también puede tomar otro valor si consideramos la posibilidad de múltiples
aristas entre dos nodos. De esta forma Aij nos da el número de aristas entre
los nodos i y j. Por otra parte el valor esperado de aristas entre los nodos
ki kk ki kj
i y j si la red fuera aleatoria sería [Aij ]RAN D = N hki = 2L . Entonces la
modularidad, que denotamos por la letra Q, se define como la suma de las
diferencias Aij − [Aij ]RAN D sobre todo par de índices (ij) que caen en el mismo
grupo. Dado que la cantidad ηij = 12 (si sj + 1) es 1 si los nodos i y j están en el
mismo grupo y 0 si no lo están entonces se puede poner (la suma es ahora sin
restricciones)
1X
Q= (Aij − [Aij ]RAN D )ηij (1)
L ij
38
Figure 23: Ejemplo de red modular.
39
que se puede expresar como
1 X
Q= (Aij − [Aij ]RAN D )si sj (2)
2L ij
40
Sea uα los auto-vectores de la matriz B, es decir
Buα = λα uα
dado que los {uα } constituyen una base orto-normal. Entonces nos queda
1 X 2 1 X T 2
Q= aα λα = (u ·s) λα .
2L α 2L α α
Como tenemos que decidir que nodos pertenecen a cada grupo, esto en la
práctica significa elegir el vector s. Entonces para maximizar Q deberíamos
elegir s tal que sea paralelo al auto-vector asociado al auto-valor más grande,
esto es λ1 , pues de esta forma solo nos queda un término en la suma anterior,
el correspondiente a α = 1. Sin embargo el vector s tiene componentes binarias
por lo que no podemos hacerlo paralelo a u1 . De todas formas, todavía podemos
maximizar Q eligiendo s en la forma si = 1 si u1,i > 0 y si = −1 si u1,i < 0.
Si tenemos más de dos particiones procedemos de la siguiente forma, la idea
es dividir cada una de las dos particiones que resultan del método anterior
en otras dos particiones y así sucesivamente hasta que tengamos el número de
particiones que queremos. Lo que se hace dividir la modularidad de un grupo
g en la suma de la modularidad que queda después de dividirlo en dos más una
cantidad ∆Qg en la forma:
Qg = Qdespués + ∆Qg .
y de (1) se tiene
1 X
Qdespués = Bij ηij
L i,j∈g
con lo que
1 X X
∆Qg = Bij si sj − Bij
2L ij∈g ij∈g
41
que se puede poner como:
1 X X
∆Qg = Bij − δij Bik si sj
2L ij∈g
k∈g
finalmente obtenemos:
1 T (g)
∆Qg = s B s
2L
que tiene la forma de la ecuación (5) y por tanto podemos también maximizar
por el mismo método espectral que hemos descrito anteriormente.
El proceso continua hasta el momento en que una nueva división no incremente
la modularidad de la red, es decir el ∆Q que resulte de la nueva división del
grupo sea cero o negativo.
9 Redes multiplex.
Muchas redes reales están interrelacionadas entre ellas y no se pueden analizar
de forma aislada. En este sentido en los últimos años se ha empezado a estudiar
redes de redes reales, lo que se conoce con el nombre de redes multiplex ,
o redes multicapa no solo desde un punto de vista estático sino también
dinámico. Un ejemplo muy fácil de entender es la red de transportes que incluye
por ejemplo la red de aeropuertos, la red de carreteras y la red de metro.
En el caso de la red de aeropuertos se suele modelar como una sola red
donde los nodos son los aeropuertos y las aristas son los vuelos directos entre
aeropuertos. Sin embargo una mejor representación sería considerar una red
multiplex constituida de muchas redes cada una de las cuales correspondería a
una compañía aérea particular, donde cada nodo sería de nuevo los aeropuertos y
cada arista correspondería a los vuelos directos entre aeropuertos realizados por
esa compañía. Puede ocurrir cada una de estas redes tenga el mismo conjunto de
nodos pero diferentes aristas, pues no todas las compañías aéreas tienen vuelos
entre los mismos aeropuertos. El estudio de esta red multiplex tiene mucha
importancia por ejemplo para re-alojar pasajeros que han perdido sus vuelos
y deben ser re-colocados en algún vuelo de otra compañía por el elevado coste
económico que este hecho lleva consigo.
En general las infraestructuras complejas son totalmente interdependientes
de forma que un pequeño fallo en una red puede provocar una cascada de fallos
en todas las redes interdependientes (ver figura 25)
Otro ejemplo claro lo tenemos en la biológica y más concretamente en la
neurociencia, donde en medios neuronales como el cerebro encontramos tanto
42
Figure 24: Red multicapa de transporte en EEUU. Las líneas azules
corresponden a líneas de transporte terrestre (coches, trenes, etc). Las líneas
rojas, naranjas y amarillas corresponden a líneas de transporte aéreo siendo las
rojas las que mayor intensidad llevan.
43
Figure 25: Cascada de fallos originada por una avería en un planta eléctrica
de la red eléctrica de Italia (nodos sobre el mapa) y como afecta a la red de
Internet ( nodos fuera del mapa) eliminando importantes hubs en esa red que a
su vez induce fallos de nuevo en otras plantas eléctricas (Italia 2003).
44
Figure 26: Red multicapa y su grafo proyección
45
Figure 27: Red multiplex.
46
Figure 28: Redes interactuantes y su descripción en forma de multicapa
ki = (ki1 , . . . , kiM )
47
donde Lα (i) = {(nα α
k , nj ) ∈ Lα ; k, j ∈ Nα (i)} y Nα (i) es el conjunto de
nodos que son vecinos del nodo i en el grafo proj(M) Tde la red multicapa
y que pertencen a la capa α (es decir Nα (i) = N (i) Nα , donde N (i) es
el conjunto de nodos vecinos del nodo i en el grafo proj(M)), y donde |A|
denota el cardinal del conjunto A. El coeficiente de agrupamiento de la
red multicapa se puede definir como el promedio de CM (i).
• Longitud de caminos más corta. Una geodésica entre dos nodos u y
v de una red multicapa es una de las distancias más cortas que unen u y
v. La distancia d(u, v) se define como la longitud de cualquier geodésica
entre u y v.
• La máxima distancia entre dos nodos de M define el diámetro de la red
multicapa y se denota por D(M).
• Se define la longitud de caminos característica como
1 X
L(M) = d(u, v)
N (N − 1)
u, v
u 6= v
P (k α , k β )
P (k α |k β ) = P α β
kα P (k , k )
N (k α , k β )
P (k α , k β ) =
N
48
donde N (k α , k β ) es el número de nodos que tienen grado k α en la capa α y
grado k β en la capa β.
• Grado promedio en la capa α condicionado a tener un grado en la
capa β X
k̄ α (k β ) = k α P (k α |k β )
kα
• Coeficiente de Pearson:
49