0% encontró este documento útil (0 votos)

34 vistas24 páginas

Consultas y Procesamiento en Grafos

El documento aborda las consultas en bases de datos de grafos, describiendo operaciones como adyacencia, alcance y pattern matching, y presentando lenguajes de consulta como Cypher y Gremlin. También se discuten modelos de procesamiento distribuido para grafos, como Apache Giraph, y se mencionan desafíos como el particionamiento de grafos y el manejo de grafos dinámicos. Finalmente, se detalla el almacenamiento en Neo4j y se proporcionan recursos adicionales sobre bases de datos de grafos.

Cargado por

Andres

Derechos de autor

Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.

Formatos disponibles

Descarga como PDF, TXT o lee en línea desde Scribd

0% encontró este documento útil (0 votos)

34 vistas24 páginas

Consultas y Procesamiento en Grafos

Cargado por

Andres

Derechos de autor

Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.

Formatos disponibles

Descarga como PDF, TXT o lee en línea desde Scribd

Consultas en

bases de
datos de
grafos

Bases de Datos No Relacionales

Instituto de Computación, FING, UdelaR – 2022
CC-BY Lorena Etcheverry [email protected]
¿qué es una consulta
sobre un grafo?

¿qué tipo de operaciones se hacen

sobre grafos?
Operaciones sobre grafos (i)
● Adyacencia: obtener los nodos adyacentes
a cierto nodo.
● Alcance: Ej: determinar si existe un camino
entre 2 nodos, y si existe cual es.
● Pattern matching: obtener sub grafos
isomórficos a cierto patrón dado.
● Agregación: derivar de un grafo valores
escalares agregados.
SPARQL para RDF
Gremlin (Apache Tinkerpop) y Cypher (Neo4j) para PGM
son lenguajes de consultas que soportan estos operadores
Cypher, algunas ideas básicas

Cypher como Data Definition Language

(emil:Person {name:'Emil'})
<-[:KNOWS]-(jim:Person {name:'Jim'})
-[:KNOWS]->(ian:Person {name:'Ian'})
-[:KNOWS]->(emil)

variables
Cypher como data query language

MATCH (a:Person {name:'Jim'})-[:KNOWS]->(b)-[:KNOWS]->(c),

(a)-[:KNOWS]->(c)
RETURN b, c

MATCH (a:Person)-[:KNOWS]->(b)-[:KNOWS]->(c),
(a)-[:KNOWS]->(c)
WHERE a.name = 'Jim'
RETURN b, c
Referencia del lenguaje Cypher
Más acerca de Cypher
Puedo especificar caminos de largo
arbitrario, sobre ciertas propiedades, etc

MATCH (p:Person {name:'Al Pacino'})-[*1..4]-(p1:Person)

RETURN DISTINCT p1

¡Cuidado!
No devuelve un grafo,
devuelve una tabla
Aún más
● Puedo usar funciones que implementan
algoritmos sobre los grafos
Ej: el camino más corto
Número de Bacon sobre el grafo de
películas
MATCH p=shortestPath((kevin:Person)-[r:ACTED_IN*]-(actor))
WHERE kevin.name='Kevin Bacon' AND actor.name='Al Pacino'
RETURN p, length(p)

● The Neo4j Graph Data Science Library

Pero aún no hay un standard

EDBT 2022, Keynote: Peter Boncz - The (sorry) State of Graph Database Systems
https://www.youtube.com/watch?v=aDoorU4X6Jk&t=423s
Otros modelos de procesamiento
de grafos
Las bases de datos de grafos resuelven
consultas en forma eficiente,
pero pueden no ser eficientes para
procesar iterativamente grafos grandes.

Algoritmos usados para análisis de grafos como

PageRank, conteo de triángulos, búsqueda de
componentes conexas, etc. requieren iterar
sobre el grafo.
Surgen entornos de procesamiento de grafos,
inspirados en Google Pregel1
Procesamiento distribuído.
Bajo intercambio entre procesos.
Tolerancia a fallas.
Paradigma “Think like a vertex”.

Apache Giraph es la implementación

opensource de Pregel.
1
Pregel: a system for large-scale graph processing.
G. Malewicz et al, SIGMOD 2010
Ejemplo: hallar componentes
débilmente conexas1
Componente conexa: existe un camino entre
cualquier par de nodos.
Componente débilmente conexa (WCC): se
ignora la dirección de las aristas.
1 2 4 5

3
6 7 8

VC1={1,2,3,6,7} VC2={4,5,8}

1 Management and Analysis of Big Graph Data: Current Systems and Open Challenges,
M.Junghanns et al. Hanbook of Big Data Technologies, Springer 2017
Procesamiento distribuído (i)

Master node (mn): coordina

Worker nodes (wn): realizan el cómputo.
El grafo se particiona entre los wn.

Cada wn conoce un conjunto de nodos y de

cada nodo:
- el valor asociado al nodo
- las aristas salientes con sus valores
- los ids de nodos en el otro extremo de las aristas
entrantes
Procesamiento distribuído (ii)
A 2 B A 2 B
5 5
1 1
4 4
3 3 8
6

C D 8 C 3 D 5
6 4 8
7 7
6 7
6

Modelo Modelo
“think like a vertex” “think like a graph”
Modelo de cómputo
Se basa en vertex compute function (vcf) que consiste en:
1) leer los mensajes entrantes
2) actualizar el valor del nodo
3) enviar mensajes a los nodos adyacentes

La invocación a la vcf se organiza en supersteps.

En cada superstep cada wn:

1) llama a la vcf para cada nodo activo
2) marca como inactivo un nodo si se llamó a voteToHalt()
3) recoge los mensajes de salida

Cuando todos los wn terminan se mandan los mensajes.

Los nodos que reciben mensajes pasan a activos.
Modelo de cómputo (ii)
Hallar componentes débilmente conexas en Apache
Giraph

void compute(Vertex v) {
if (getSuperstep() == 0)
v.setValue(v.getVertexID())
sendMessageToAllEdges(v.getVertexValue())
else
minValue = min(v.getMessages())
if (minValue < v.getVertexValue())
v.setVertexValue(minValue)
sendMessageToAllEdges(v.getVertexValue())
v.voteToHalt();
}
Modelo de cómputo (iii)
A 2 B
5
1
4
3

C D 8
6
7

Comunicación y sincro
Comunicación y sincro

Comunicación y sincro
Comunicación y sincro
A 1[1],2[2],3[3] 1[1],2[1],3[1] 1[1],2[1],3[1] 3[1]
B 4[4],5[5] 4[4],5[4] 4[4],5[4]
C 6[6] 6[3] 6[1] 6[1] 6[1]
D 7[7],8[8] 7[6],8[4] 7[3],8[4] 7[1]

Superstep 0 Superstep Superstep Ss 3 Ss 4

1 2
Algunos desafíos
● Particionamiento de grafos
– Es un problema NP-hard
– Soluciones aproximadas y estáticas
– ¿qué pasa cuando la cantidad de nodos cambia
por partición? Balance de carga
● Manejo y análisis de grafos dinámicos
● Visualización
● Construcción de benchmarks
Bases de datos de grafos: modelo
físico
Fuente: Timón-Reina, S., Rincón, M., & Martínez-Tomás, R. (2021). An overview of graph databases and their
applications in the biomedical domain. Database : the journal of biological databases and curation, 2021,
baab026. https://doi.org/10.1093/database/baab026
Sobre un RDBMS

Usando ● Búsqueda en índice O(log n) (depende de la implementación).

índices ● Atravesar un camino de largo m tiene un costo O(m log n)

● Índices en una sola dirección
Index-free adjacency

Objetivo: acceder al adyacente en O(1)

¿cómo se implementa?
Almacenamiento en Neo4j
● Datos almacenados en diferentes store files,
un por cada parte del grafo (nodos,
relaciones, propiedades y etiquetas)
● Registros de largo fijo:
– Permiten computar el offset fácilmente
● Punteros entre store files.
● Las listas de relaciones son doblemente
enlazadas.

¡Multiestructuras!
Ejemplo: nodos y relaciones

Fuente: Robinson, Ian, Jim Webber, and Emil Eifrem. Graph

databases: new opportunities for connected data. " O'Reilly
Media, Inc.", 2015. Chapter 6.
Material adicional
● Graph Databases, Ian Robinson et al,
O’Reilly 2015.
– http://graphdatabases.com/?ref=blog
● Documentación, cursos y videos de Neo4J
– https://neo4j.com/developer/

También podría gustarte

Introducción a Grafos y Neo4j
Aún no hay calificaciones
Introducción a Grafos y Neo4j
28 páginas
Gestión de Datos y Estructuras de Grafos
Aún no hay calificaciones
Gestión de Datos y Estructuras de Grafos
86 páginas
Grafos
Aún no hay calificaciones
Grafos
26 páginas
Grafos Algoritmos Basicos
100% (1)
Grafos Algoritmos Basicos
26 páginas
Introducción a bases de datos de grafos
Aún no hay calificaciones
Introducción a bases de datos de grafos
14 páginas
Introducción a NoSQL en grafos
Aún no hay calificaciones
Introducción a NoSQL en grafos
5 páginas
Representación y Algoritmos de Grafos
Aún no hay calificaciones
Representación y Algoritmos de Grafos
56 páginas
Qué Es Un Componente Conexo
Aún no hay calificaciones
Qué Es Un Componente Conexo
6 páginas
04 Grafos 01 Definicion
Aún no hay calificaciones
04 Grafos 01 Definicion
27 páginas
Aplicaciones de Grafos en Informática
Aún no hay calificaciones
Aplicaciones de Grafos en Informática
14 páginas
Bases de Datos en Grafos: Ventajas y Desafíos
Aún no hay calificaciones
Bases de Datos en Grafos: Ventajas y Desafíos
9 páginas
Detección de Comunidades en Grafos
Aún no hay calificaciones
Detección de Comunidades en Grafos
12 páginas
Clase 1 - Neo4J
Aún no hay calificaciones
Clase 1 - Neo4J
90 páginas
Introducción a Bases de Datos en Grafos
Aún no hay calificaciones
Introducción a Bases de Datos en Grafos
16 páginas
Introducción a Bases de Datos de Grafos
Aún no hay calificaciones
Introducción a Bases de Datos de Grafos
18 páginas
Sesión 12
Aún no hay calificaciones
Sesión 12
90 páginas
Introducción a Neo4j: Base de Datos de Grafos
Aún no hay calificaciones
Introducción a Neo4j: Base de Datos de Grafos
5 páginas
Introducción a los Grafos en Ingeniería
Aún no hay calificaciones
Introducción a los Grafos en Ingeniería
26 páginas
Resumen Grafos.
Aún no hay calificaciones
Resumen Grafos.
7 páginas
Introducción a Bases de Datos de Grafos
Aún no hay calificaciones
Introducción a Bases de Datos de Grafos
63 páginas
Introducción a Grafos en Estructuras de Datos
Aún no hay calificaciones
Introducción a Grafos en Estructuras de Datos
6 páginas
GRAFOS
Aún no hay calificaciones
GRAFOS
8 páginas
Introducción a los Grafos en Informática
Aún no hay calificaciones
Introducción a los Grafos en Informática
8 páginas
Grafos
Aún no hay calificaciones
Grafos
5 páginas
Introducción a Grafos y Recorridos
Aún no hay calificaciones
Introducción a Grafos y Recorridos
20 páginas
Introducción a Grafos y sus Aplicaciones
Aún no hay calificaciones
Introducción a Grafos y sus Aplicaciones
21 páginas
Unidas 4-Hacer Un Mapa Conceptual o Mental Del Uso y Aplicaciones de Los Grafos
Aún no hay calificaciones
Unidas 4-Hacer Un Mapa Conceptual o Mental Del Uso y Aplicaciones de Los Grafos
4 páginas
Tema8 Grafos New
Aún no hay calificaciones
Tema8 Grafos New
41 páginas
Introducción a Grafos en Estructuras de Datos
Aún no hay calificaciones
Introducción a Grafos en Estructuras de Datos
8 páginas
Introducción a Grafos en Python
Aún no hay calificaciones
Introducción a Grafos en Python
22 páginas
Fundamentos de la Teoría de Grafos
Aún no hay calificaciones
Fundamentos de la Teoría de Grafos
9 páginas
Aplicaciones de Grafos en Computación
Aún no hay calificaciones
Aplicaciones de Grafos en Computación
11 páginas
Introducción a Grafos y Estructuras de Datos
Aún no hay calificaciones
Introducción a Grafos y Estructuras de Datos
19 páginas
Introducción a los Grafos y sus Aplicaciones
Aún no hay calificaciones
Introducción a los Grafos y sus Aplicaciones
3 páginas
An Overview of Graph Databases and Their Applications in The Biomedical Domain - En.es
Aún no hay calificaciones
An Overview of Graph Databases and Their Applications in The Biomedical Domain - En.es
22 páginas
Guía Completa de Teoría de Grafos
Aún no hay calificaciones
Guía Completa de Teoría de Grafos
78 páginas
Grafos
Aún no hay calificaciones
Grafos
19 páginas
Grafos
Aún no hay calificaciones
Grafos
32 páginas
PTT Unidad IV - Grafos (Continuación)
Aún no hay calificaciones
PTT Unidad IV - Grafos (Continuación)
23 páginas
Grafos No Dirigidos
Aún no hay calificaciones
Grafos No Dirigidos
37 páginas
Tipos de Grafos y Algoritmos Clave
Aún no hay calificaciones
Tipos de Grafos y Algoritmos Clave
85 páginas
Bases de Datos 2-7
Aún no hay calificaciones
Bases de Datos 2-7
36 páginas
Introducción a Grafos y Algoritmos
Aún no hay calificaciones
Introducción a Grafos y Algoritmos
10 páginas
Introducción a Grafos y Métodos de Búsqueda
Aún no hay calificaciones
Introducción a Grafos y Métodos de Búsqueda
7 páginas
Sistemas de Procesamiento y Bases de Datos de Grafos
Aún no hay calificaciones
Sistemas de Procesamiento y Bases de Datos de Grafos
25 páginas
Tarea 1 Equipo U5
Aún no hay calificaciones
Tarea 1 Equipo U5
8 páginas
Introducción a los Grafos y sus Operaciones
Aún no hay calificaciones
Introducción a los Grafos y sus Operaciones
17 páginas
Tarea 11
Aún no hay calificaciones
Tarea 11
8 páginas
Aplicacion de Los Arboles
Aún no hay calificaciones
Aplicacion de Los Arboles
4 páginas
Informe Sobre Los Grafos E.D
Aún no hay calificaciones
Informe Sobre Los Grafos E.D
14 páginas
Análisis de Grafos: Estructuras y Propiedades
Aún no hay calificaciones
Análisis de Grafos: Estructuras y Propiedades
15 páginas
Introducción a los Grafos y sus Tipos
Aún no hay calificaciones
Introducción a los Grafos y sus Tipos
3 páginas
Busqueda en Profundidad
Aún no hay calificaciones
Busqueda en Profundidad
7 páginas
Algoritmos de Búsqueda en Grafos
Aún no hay calificaciones
Algoritmos de Búsqueda en Grafos
6 páginas
Introducción a los Grafos y sus Tipos
Aún no hay calificaciones
Introducción a los Grafos y sus Tipos
2 páginas
Grafos
Aún no hay calificaciones
Grafos
10 páginas
Grafos Avanzados en Python: DFS, BFS y Dijkstra
Aún no hay calificaciones
Grafos Avanzados en Python: DFS, BFS y Dijkstra
23 páginas
Neo4j: La Base de Datos de Grafos Líder
Aún no hay calificaciones
Neo4j: La Base de Datos de Grafos Líder
7 páginas
Milo Beretta y Pedro Figari: Amistad artística
Aún no hay calificaciones
Milo Beretta y Pedro Figari: Amistad artística
51 páginas
Exposición "Presencia del Paisaje" de León
Aún no hay calificaciones
Exposición "Presencia del Paisaje" de León
40 páginas
6 Fdace
Aún no hay calificaciones
6 Fdace
5 páginas
Introducción a Neo4J y Bases de Datos Grafos
Aún no hay calificaciones
Introducción a Neo4J y Bases de Datos Grafos
73 páginas
Cálculo del Máximo Común Divisor (MCD)
Aún no hay calificaciones
Cálculo del Máximo Común Divisor (MCD)
9 páginas
Introducción a Números Binarios
Aún no hay calificaciones
Introducción a Números Binarios
5 páginas
Ejercicios de Potenciación y Radicación
Aún no hay calificaciones
Ejercicios de Potenciación y Radicación
6 páginas
Guía de Cálculo de Raíces Cuadradas
Aún no hay calificaciones
Guía de Cálculo de Raíces Cuadradas
2 páginas
Laura A0111921821
Aún no hay calificaciones
Laura A0111921821
6 páginas
ED3 - Matematica Discreta Rodriguez Ospina Amir
Aún no hay calificaciones
ED3 - Matematica Discreta Rodriguez Ospina Amir
7 páginas
Fracciones Continuas y Algoritmo de Euclides
Aún no hay calificaciones
Fracciones Continuas y Algoritmo de Euclides
24 páginas
Ejercicios de Números Enteros 3º ESO
Aún no hay calificaciones
Ejercicios de Números Enteros 3º ESO
231 páginas
MCD y MCM: Definiciones y Propiedades
Aún no hay calificaciones
MCD y MCM: Definiciones y Propiedades
4 páginas
GUIA 5TO BÁSICO Decimales Refuerzo
Aún no hay calificaciones
GUIA 5TO BÁSICO Decimales Refuerzo
5 páginas
Algoritmos Voraces: Ventajas y Desventajas
Aún no hay calificaciones
Algoritmos Voraces: Ventajas y Desventajas
8 páginas
Ajuste de Curvas y Análisis de Grafos
Aún no hay calificaciones
Ajuste de Curvas y Análisis de Grafos
54 páginas
Optimizacion Dinamica
Aún no hay calificaciones
Optimizacion Dinamica
2 páginas
Grafos y Algoritmos en Informática
Aún no hay calificaciones
Grafos y Algoritmos en Informática
13 páginas
Gaus Pivoteo Parcial
Aún no hay calificaciones
Gaus Pivoteo Parcial
18 páginas
Preguntas Examen Álgebra Discreta 2021
Aún no hay calificaciones
Preguntas Examen Álgebra Discreta 2021
2 páginas
Test Diagnostico M30M
Aún no hay calificaciones
Test Diagnostico M30M
55 páginas
SEMANA 13 - Multiplicacion y Division PRE 2025-2 FINAL
Aún no hay calificaciones
SEMANA 13 - Multiplicacion y Division PRE 2025-2 FINAL
27 páginas
Factorización de Polinomios: Guía 2021
Aún no hay calificaciones
Factorización de Polinomios: Guía 2021
10 páginas
Algoritmos de Caminos Cortos
Aún no hay calificaciones
Algoritmos de Caminos Cortos
4 páginas
Números Primos
Aún no hay calificaciones
Números Primos
6 páginas
Divisivilidad de Un Número
Aún no hay calificaciones
Divisivilidad de Un Número
4 páginas
NUMEROS PRIMOS Ejercicios
100% (1)
NUMEROS PRIMOS Ejercicios
2 páginas
Ordenaciones y Permutaciones en Combinatoria
Aún no hay calificaciones
Ordenaciones y Permutaciones en Combinatoria
3 páginas
Ficha Ejercicios Fracciones
Aún no hay calificaciones
Ficha Ejercicios Fracciones
3 páginas
Máximo Común Divisor
Aún no hay calificaciones
Máximo Común Divisor
6 páginas
Guia #3. Multiplos y Divisores de Un Numero
Aún no hay calificaciones
Guia #3. Multiplos y Divisores de Un Numero
6 páginas
Sistemas de Codificación
Aún no hay calificaciones
Sistemas de Codificación
11 páginas
Criterios de Divisibilidad por 11
Aún no hay calificaciones
Criterios de Divisibilidad por 11
3 páginas
2adicion y Sutraccion de Numeros Enteros
Aún no hay calificaciones
2adicion y Sutraccion de Numeros Enteros
5 páginas