otras tendencias en bases de datos -...
Post on 01-Oct-2018
219 Views
Preview:
TRANSCRIPT
Otras Tendencias en Bases de Datos
Curso 2010/2011
Sergio Ilarri Artigas
B d D t P t PBases de Datos Peer-to-Peer
Sistemas P2P (I)
Cada nodo participante actúa como cliente y como servidor
Cada nodo participa proporcionando Cada nodo participa proporcionando acceso a algunos de sus recursos
ó No hay un nodo central de coordinación No hay una base de datos centralizada No hay una base de datos centralizada Ningún peer tiene una vista global del
i tsistema
Sistemas P2P (II)
Los peers son autónomos Los peers y sus conexiones son poco
fiablesfiables El comportamiento global emerge de las
interacciones locales Los datos y servicios son accesibles Los datos y servicios son accesibles
desde distintos peers
Sistemas P2P (III)
Las aplicaciones P2P más populares son de compartición de ficheros: Kazaa Kazaa Gnutella
M l eMule Freenet …
Motivación para las Bases de pDatos P2P
Compartición de datos a gran escala (Internet)
Sistemas descentralizados autónomos Sistemas descentralizados, autónomos, y posiblemente heterogéneos
é Débil acoplamiento entre los sistemas participantesp p
Definición
P2P Database System (PDBS) Colección de repositorios locales autónomos que
interaccionan siguiendo un estilo P2P (de igual a ig al)igual) Para establecer correspondencias, intercambiar
preguntas y datos, etc.p g y ,
Peers autónomos Con los mismos derechos Ligados sólo a sus vecinos No necesariamente tienen una BD completa (ej., pueden
ser ficheros) repositorioser ficheros) repositorio
Características
1. Escalabilidad Número de nodos y su distribución
2 Acceso directo a los datos2. Acceso directo a los datos Garantía de que están actualizados (vs.
i t t li d )sistemas centralizados)
3. Robustez y fiabilidad frente a ataquesy q Principios de auto-organización
Facilidad de despliegue4. Facilidad de despliegue Añadir un nuevo nodo es inmediato
Bases de Datos P2P vs. Bases de Datos Distribuidas (I)
En Bases de Datos P2P no existe un esquema global Idea principal para la integración de datos Idea principal para la integración de datos
e interoperabilidad en estos sistemasEn lugar de eso existen mappings entre En lugar de eso, existen mappings entre pares de fuentes de información
No es necesario que haya mappings entre No es necesario que haya mappings entre todos los pares de fuentes, basta con que el grafo de mappings esté conectadografo de mappings esté conectado
Bases de Datos P2P vs. Bases de Datos Distribuidas (II)
Esquema global
p
Esquema canónico exportado p
Esquema canónico exportado
Esquema canónico
Esquema canónico
Base dedatosfederada
Esquema Esquema
local local
SGBD 1 SGBD 2
local local
Información InformaciónInformaciónde enlace
Informaciónde enlace
Bases de Datos P2P vs. Bases de Datos Distribuidas (III)
Grafo de mappings
EsquemaBase dedatosEsquemaEsquema
exportado/instanciasdatosP2P
Esquema exportado/instancias
Repositorio 1 Repositorio 2
Esquema local/instancias
Esquema local/instancias
Repositorio 1 Repositorio 2
Procesamiento de Consultas
Problema fundamental: localizar los nodos que contienen datos relevantes
Una pregunta se lanza sobre un peer y éste puede diseminarla también a otros peers (forwarding) Sin cambios o modificada La diseminación depende generalmente del grafo p g g
de mappings
No se garantiza una respuesta completag p p Un peer puede aparecer o desaparecer en
cualquier momento (autonomía)
Una Clasificación de Arquitecturas P2P1. Redes P2P puras no estructuradas
T d l d i l ( i f i lid d) h Todos los nodos son iguales (misma funcionalidad) y no hay estructuras de datos centralizadas (índices)
No hay restricciones en cuanto a la distribución de los datosy
2. Redes P2P puras estructuradas Distributed Hash Tables (DHTs)
3. Redes con super-peers Algunos peers, llamados super-peers, tienen índices que
d ib d ddescriben datos de otros peers y super-peers Comunicación y distribución a dos niveles
4 Redes híbridas:4. Redes híbridas: Redes P2P con servidores que almacenan índices globales
Características (I)
Distribución de los datos En redes P2P no estructuradas, cada peer
tiene autoridad y decide autónomamentey En redes P2P estructuradas, determinada
por una función de dispersiónpor una función de dispersión
Independencia de los datos Deseable, los datos deberían ser
independientes de su localización física en la red
Características (II)
Soporte para transacciones: Necesario al menos si hay réplicas y
actualizaciones ¿Pueden satisfacerse las propiedades ACID
en sistemas débilmente acoplados deen sistemas débilmente acoplados de nodos autónomos?Algunas propuestas para soportar Algunas propuestas para soportar propiedades ACID relajadas…
bá i t t bi t … pero básicamente es un tema abierto
Características (III)
Mundo abierto (vs. mundo cerrado) Suposición de que los datos y los resultados son
incompletosí El concepto tradicional de mundo cerrado es difícil
(o imposible) de garantizar en este contexto
Ti d d Tipos de preguntas soportadas Redes no estructuradas: keyword-based queries Redes estructuradas: lookups y range queries
Respuestas incompletas Al menos en las redes no estructuradas
Características (IV)
Grado de acoplamiento Conciencia de la existencia de otros peers Normalmente un peer es consciente de la Normalmente, un peer es consciente de la
existencia de ciertos vecinos (cambiantes)Influye en el nivel de auto organización: Influye en el nivel de auto-organización: En redes estructuradas, donde el sistema
controla la distribución de los datos máscontrola la distribución de los datos, más limitado
Características (V)
Topología de la red En redes no estructuradas:
No hay topología fijaNo hay topología fija La topología viene determinada por las
conexiones que se establecen entre los nodosq
En redes con super-peers: Los super-peers se conectan entre sí de una Los super peers se conectan entre sí de una
forma predefinida (por ejemplo, en anillo)
En redes estructuradas: En redes estructuradas: Topología fija: en anillo, en árbol, etc.
Características (VI)
Enrutamiento de preguntas (y respuestas) Muy relacionado con la topología de la red Muy relacionado con la topología de la red En sistemas no estructurados:
Flooding Flooding Semantic routing
E i t t t d En sistemas estructurados Uso de información de vecinos para enrutar Normalmente, algún tipo de greedy routing
Características (VII)
EscalabilidadUna simple petición en Napster (18 B) 90 MB de tráfico
Las redes no estructuradas basadas en flooding son poco escalables. Soluciones:g p Uso de super-peers: limitación del flooding a la
comunicación entre los super-peersp p Random walks: comunicar la pregunta sólo a
un peer cada vez
Las redes estructuradas son más escalables Las preguntas se enrutan sólo a ciertos peers
Características (VIII)
Privacidad y seguridad Si queremos mantener en el anonimato a
las fuentes de preguntas y de informaciónp g y Enrutamiento a través de múltiples peers Replicación del contenido Replicación del contenido
Para acceder a datos sensibles, necesidad de mecanismos de autentificación dede mecanismos de autentificación de usuarios y control de accesoTemas discutidos principalmente sólo para Temas discutidos principalmente sólo para sistemas P2P de compartición de ficheros
G tió d D t R d dGestión de Datos en Redes de VehículosVehículos
Contexto Tecnológico (I)
Reciente desarrollo de: Redes inalámbricas y dispositivos móviles Sensores
Embebidos en los coches En las carreteras
Si t d N ió Gl b l N i ti Sistemas de Navegación - Global Navigation Satellite Systems (GNSS)
Si t d t t i t li t Sistemas de transporte inteligentes Comunicaciones vehículo a vehículo (V2V o Inter-
Vehicle Communications IVC )Vehicle Communications –IVC–) Intercambio de información: accidentes, frenazos, etc.
Contexto Tecnológico (II)
Numerosas fuentes de datos: Sensores, servicios web remotos, BDs, etc.
Múltiples formas de acceso a los datos: Múltiples formas de acceso a los datos: Redes de corto alcance vs. redes de largo
l (t l f í )alcance (telefonía) Push vs. Pull
Red de Vehículos Ad Hoc
Comunicaciones V2V- GPS- WIFI, UWB, IEEE 802.11p
T j t d l i t Comunicaciones V2V- Tarjeta de almacenamiento- PDA, …
Adaptado de una transparencia de Thierry Delot
Red de Vehículos Ad Hoc Es una red móvil P2P Objetivo:
Sistemas de transporte inteligentesf ó d é l Proporcionar información de interés a los
conductoresIntercambio de información entre vehículos Intercambio de información entre vehículos Relevancia espacio-temporal de los datos
Información altamente dinámica diferente a la Información altamente dinámica, diferente a la gestionada por los sistemas de navegación GPS
Numerosos proyectos: Numerosos proyectos: FleetNet, CarTalk, TrafficView, Mobi-Dik, VESPA,
etc.
Procesamiento de Consultas en Redes de Vehículos Diversas consultas se pueden procesar localmente
sobre los datos recibidos¿Dónde está la
plaza de aparcamiento libre
sobre los datos recibidos
plaza de aparcamiento libre más cercana?
DataQuery DataQuery DatosPregunta
Plaza de aparcamiento libre…
Adaptado de una transparencia de Thierry Delot
Ejemplo de Aplicación
Informar sólo a los vehículos interesados
Tuve un accidente
Accidente a 100 m
Accidente a 200 m
Accidente a 300 m
accidente
¡Accidente!
A mí no me afecta… estoy yendo en
dirección opuesta
Adaptado de una transparencia de Thierry Delot
Ejemplo de Aplicación
Algunos vehículos pueden actuar como f ótransportadores de la información
Tuve un accidente accidente
¡Accidente! Accidente a 100 m
??? ???
¿Quieres que transporte la información?
Adaptado de una transparencia de Thierry Delot
Otro Ejemplo
¡Me voy!
Compartir información sobre plazas de aparcamiento libres diseminar y replicar la información entre vehículos diseminar y replicar la información entre vehículos (Wolfson et. al, 2004)
Adaptado de una transparencia de Thierry Delot
Otro Ejemplo
Adaptado de una transparencia de Thierry Delot
Otro Ejemplo
Adaptado de una transparencia de Thierry Delot
Otro Ejemplo
No recibo nada…
Importancia de la relevanciaespacio-temporal
Adaptado de una transparencia de Thierry Delot
Importancia de la Semánticap
Bitch!Pig!
Je, je
Pig!!!
Fuente: “A New Ph.D. Program in Computational Transportation Science”, Ouri Wolfson
Cómo Devolver el Resultado de una Consulta
Si la consulta no se procesa de forma local, puede ser complicado…
TrayectoriaA
¡Tengo la t !
yA
A lθmin
respuesta!
Q Peer estático
Cli t ( ó il)
Q
Cliente (móvil)
Q = Consulta
A Resp esta
Q
Q A = Respuesta
Adaptado de una transparencia de Thierry Delot
VESPA (I) El objetivo es permitir el intercambio de
cualquier tipo de evento entre vehículos:cualquier tipo de evento entre vehículos: Estacionarios y no dependientes de la dirección
Ej: Plaza de aparcamiento Ej: Plaza de aparcamiento Estacionarios y dependientes de la dirección
Ej: Obstáculo en la carretera, accidente, etc.j , , Móviles y no dependientes de la dirección
Ej: persona conduciendo de forma temerariaó ó Móviles y dependientes de la dirección Ej: Vehículo de emergencia pidiendo paso
VESPA (II) Necesidad de una solución unificada
Adaptado de una transparencia de Thierry Delot
VESPA (III) Necesidad de una solución unificada
http://www.univ-valenciennes.fr/ROI/SID/tdelot/vespa/
VESPA (IV)
La relevancia de los eventos determina: Cómo se informa al conductor de los
eventos recibidos Cómo se diseminan los eventos en la red
Relevancia: Encounter Probability (EP) Relevancia: Encounter Probability (EP)
Penalty Coefficients
VESPA (V)
Vector de movilidad: Proporciona una visión global del patrón de
movilidad del objetoj
Objeto móvil
MobilityRefPos
Adaptado de una transparencia de Thierry Delot
VESPA (VI)
Vector de dirección: Calculada con una posición de referencia
más cercana Proporciona una estimación más precisa a
corto plazocorto plazoObjeto móvil
DirectionRefPos
Adaptado de una transparencia de Thierry Delot
VESPA (VII)
4 Criterios de relevancia: Coeficiente de colinearidad (c)
¡A id t !¡Accidente!
Adaptado de una transparencia de Thierry Delot
VESPA (VIII)
4 Criterios de relevancia: Coeficiente de colinearidad (c) Mínima distancia a lo largo del tiempo (Δd) Mínima distancia a lo largo del tiempo (Δd)
¡A id t ! Mí i di t i ¡Accidente! Mínima distancia geográfica entre el vehículo y el evento a lo largo del tiempolargo del tiempo
A
Adaptado de una transparencia de Thierry Delot
VESPA (IX)
4 Criterios de relevancia: Coeficiente de colinearidad (c) Mínima distancia a lo largo del tiempo (Δd) Mínima distancia a lo largo del tiempo (Δd) Distancia temporal (Δt)
¡A id t !La diferencia entre el
¡Accidente!La diferencia entre el instante de tiempo actual y el instante de tiempo cuando el vehículo estará más cerca del evento
A
Adaptado de una transparencia de Thierry Delot
VESPA (X)
4 Criterios de relevancia: Coeficiente de colinearidad (c) Mínima distancia a lo largo del tiempo (Δd) Mínima distancia a lo largo del tiempo (Δd) Distancia temporal (Δt)
L d d d l t (Δ ) La edad del evento (Δg)
VESPA (XI)
Diseminar los datos de forma escalable: área de diseminación determinada por la EPla EP
¡Salgo!
Adaptado de una transparencia de Thierry Delot
VESPA (XII)
Diseminar los datos de forma escalable: área de diseminación determinada por la EPla EP
Adaptado de una transparencia de Thierry Delot
VESPA (XIII)¡Evitar sobrecargar la red!
48Adaptado de una transparencia de Thierry Delot
VESPA (XIV) Para ello, se puede limitar el número de vehículos que
retransmiten el mensajeretransmiten el mensaje Retransmisión sólo si el mensaje es relevant según la EP El vehículo más alejado es el mejor candidato El vehículo más alejado es el mejor candidato
Adaptado de una transparencia de Thierry Delot 49
top related