otras tendencias en bases de datos -...

Post on 01-Oct-2018

219 Views

Category:

Documents

0 Downloads

Preview:

Click to see full reader

TRANSCRIPT

Otras Tendencias en Bases de Datos

Curso 2010/2011

Sergio Ilarri Artigas

B d D t P t PBases de Datos Peer-to-Peer

Sistemas P2P (I)

Cada nodo participante actúa como cliente y como servidor

Cada nodo participa proporcionando Cada nodo participa proporcionando acceso a algunos de sus recursos

ó No hay un nodo central de coordinación No hay una base de datos centralizada No hay una base de datos centralizada Ningún peer tiene una vista global del

i tsistema

Sistemas P2P (II)

Los peers son autónomos Los peers y sus conexiones son poco

fiablesfiables El comportamiento global emerge de las

interacciones locales Los datos y servicios son accesibles Los datos y servicios son accesibles

desde distintos peers

Sistemas P2P (III)

Las aplicaciones P2P más populares son de compartición de ficheros: Kazaa Kazaa Gnutella

M l eMule Freenet …

Motivación para las Bases de pDatos P2P

Compartición de datos a gran escala (Internet)

Sistemas descentralizados autónomos Sistemas descentralizados, autónomos, y posiblemente heterogéneos

é Débil acoplamiento entre los sistemas participantesp p

Definición

P2P Database System (PDBS) Colección de repositorios locales autónomos que

interaccionan siguiendo un estilo P2P (de igual a ig al)igual) Para establecer correspondencias, intercambiar

preguntas y datos, etc.p g y ,

Peers autónomos Con los mismos derechos Ligados sólo a sus vecinos No necesariamente tienen una BD completa (ej., pueden

ser ficheros) repositorioser ficheros) repositorio

Características

1. Escalabilidad Número de nodos y su distribución

2 Acceso directo a los datos2. Acceso directo a los datos Garantía de que están actualizados (vs.

i t t li d )sistemas centralizados)

3. Robustez y fiabilidad frente a ataquesy q Principios de auto-organización

Facilidad de despliegue4. Facilidad de despliegue Añadir un nuevo nodo es inmediato

Bases de Datos P2P vs. Bases de Datos Distribuidas (I)

En Bases de Datos P2P no existe un esquema global Idea principal para la integración de datos Idea principal para la integración de datos

e interoperabilidad en estos sistemasEn lugar de eso existen mappings entre En lugar de eso, existen mappings entre pares de fuentes de información

No es necesario que haya mappings entre No es necesario que haya mappings entre todos los pares de fuentes, basta con que el grafo de mappings esté conectadografo de mappings esté conectado

Bases de Datos P2P vs. Bases de Datos Distribuidas (II)

Esquema global

p

Esquema canónico exportado p

Esquema canónico exportado

Esquema canónico

Esquema canónico

Base dedatosfederada

Esquema Esquema

local local

SGBD 1 SGBD 2

local local

Información InformaciónInformaciónde enlace

Informaciónde enlace

Bases de Datos P2P vs. Bases de Datos Distribuidas (III)

Grafo de mappings

EsquemaBase dedatosEsquemaEsquema

exportado/instanciasdatosP2P

Esquema exportado/instancias

Repositorio 1 Repositorio 2

Esquema local/instancias

Esquema local/instancias

Repositorio 1 Repositorio 2

Procesamiento de Consultas

Problema fundamental: localizar los nodos que contienen datos relevantes

Una pregunta se lanza sobre un peer y éste puede diseminarla también a otros peers (forwarding) Sin cambios o modificada La diseminación depende generalmente del grafo p g g

de mappings

No se garantiza una respuesta completag p p Un peer puede aparecer o desaparecer en

cualquier momento (autonomía)

Una Clasificación de Arquitecturas P2P1. Redes P2P puras no estructuradas

T d l d i l ( i f i lid d) h Todos los nodos son iguales (misma funcionalidad) y no hay estructuras de datos centralizadas (índices)

No hay restricciones en cuanto a la distribución de los datosy

2. Redes P2P puras estructuradas Distributed Hash Tables (DHTs)

3. Redes con super-peers Algunos peers, llamados super-peers, tienen índices que

d ib d ddescriben datos de otros peers y super-peers Comunicación y distribución a dos niveles

4 Redes híbridas:4. Redes híbridas: Redes P2P con servidores que almacenan índices globales

Características (I)

Distribución de los datos En redes P2P no estructuradas, cada peer

tiene autoridad y decide autónomamentey En redes P2P estructuradas, determinada

por una función de dispersiónpor una función de dispersión

Independencia de los datos Deseable, los datos deberían ser

independientes de su localización física en la red

Características (II)

Soporte para transacciones: Necesario al menos si hay réplicas y

actualizaciones ¿Pueden satisfacerse las propiedades ACID

en sistemas débilmente acoplados deen sistemas débilmente acoplados de nodos autónomos?Algunas propuestas para soportar Algunas propuestas para soportar propiedades ACID relajadas…

bá i t t bi t … pero básicamente es un tema abierto

Características (III)

Mundo abierto (vs. mundo cerrado) Suposición de que los datos y los resultados son

incompletosí El concepto tradicional de mundo cerrado es difícil

(o imposible) de garantizar en este contexto

Ti d d Tipos de preguntas soportadas Redes no estructuradas: keyword-based queries Redes estructuradas: lookups y range queries

Respuestas incompletas Al menos en las redes no estructuradas

Características (IV)

Grado de acoplamiento Conciencia de la existencia de otros peers Normalmente un peer es consciente de la Normalmente, un peer es consciente de la

existencia de ciertos vecinos (cambiantes)Influye en el nivel de auto organización: Influye en el nivel de auto-organización: En redes estructuradas, donde el sistema

controla la distribución de los datos máscontrola la distribución de los datos, más limitado

Características (V)

Topología de la red En redes no estructuradas:

No hay topología fijaNo hay topología fija La topología viene determinada por las

conexiones que se establecen entre los nodosq

En redes con super-peers: Los super-peers se conectan entre sí de una Los super peers se conectan entre sí de una

forma predefinida (por ejemplo, en anillo)

En redes estructuradas: En redes estructuradas: Topología fija: en anillo, en árbol, etc.

Características (VI)

Enrutamiento de preguntas (y respuestas) Muy relacionado con la topología de la red Muy relacionado con la topología de la red En sistemas no estructurados:

Flooding Flooding Semantic routing

E i t t t d En sistemas estructurados Uso de información de vecinos para enrutar Normalmente, algún tipo de greedy routing

Características (VII)

EscalabilidadUna simple petición en Napster (18 B) 90 MB de tráfico

Las redes no estructuradas basadas en flooding son poco escalables. Soluciones:g p Uso de super-peers: limitación del flooding a la

comunicación entre los super-peersp p Random walks: comunicar la pregunta sólo a

un peer cada vez

Las redes estructuradas son más escalables Las preguntas se enrutan sólo a ciertos peers

Características (VIII)

Privacidad y seguridad Si queremos mantener en el anonimato a

las fuentes de preguntas y de informaciónp g y Enrutamiento a través de múltiples peers Replicación del contenido Replicación del contenido

Para acceder a datos sensibles, necesidad de mecanismos de autentificación dede mecanismos de autentificación de usuarios y control de accesoTemas discutidos principalmente sólo para Temas discutidos principalmente sólo para sistemas P2P de compartición de ficheros

G tió d D t R d dGestión de Datos en Redes de VehículosVehículos

Contexto Tecnológico (I)

Reciente desarrollo de: Redes inalámbricas y dispositivos móviles Sensores

Embebidos en los coches En las carreteras

Si t d N ió Gl b l N i ti Sistemas de Navegación - Global Navigation Satellite Systems (GNSS)

Si t d t t i t li t Sistemas de transporte inteligentes Comunicaciones vehículo a vehículo (V2V o Inter-

Vehicle Communications IVC )Vehicle Communications –IVC–) Intercambio de información: accidentes, frenazos, etc.

Contexto Tecnológico (II)

Numerosas fuentes de datos: Sensores, servicios web remotos, BDs, etc.

Múltiples formas de acceso a los datos: Múltiples formas de acceso a los datos: Redes de corto alcance vs. redes de largo

l (t l f í )alcance (telefonía) Push vs. Pull

Red de Vehículos Ad Hoc

Comunicaciones V2V- GPS- WIFI, UWB, IEEE 802.11p

T j t d l i t Comunicaciones V2V- Tarjeta de almacenamiento- PDA, …

Adaptado de una transparencia de Thierry Delot

Red de Vehículos Ad Hoc Es una red móvil P2P Objetivo:

Sistemas de transporte inteligentesf ó d é l Proporcionar información de interés a los

conductoresIntercambio de información entre vehículos Intercambio de información entre vehículos Relevancia espacio-temporal de los datos

Información altamente dinámica diferente a la Información altamente dinámica, diferente a la gestionada por los sistemas de navegación GPS

Numerosos proyectos: Numerosos proyectos: FleetNet, CarTalk, TrafficView, Mobi-Dik, VESPA,

etc.

Procesamiento de Consultas en Redes de Vehículos Diversas consultas se pueden procesar localmente

sobre los datos recibidos¿Dónde está la

plaza de aparcamiento libre

sobre los datos recibidos

plaza de aparcamiento libre más cercana?

DataQuery DataQuery DatosPregunta

Plaza de aparcamiento libre…

Adaptado de una transparencia de Thierry Delot

Ejemplo de Aplicación

Informar sólo a los vehículos interesados

Tuve un accidente

Accidente a 100 m

Accidente a 200 m

Accidente a 300 m

accidente

¡Accidente!

A mí no me afecta… estoy yendo en

dirección opuesta

Adaptado de una transparencia de Thierry Delot

Ejemplo de Aplicación

Algunos vehículos pueden actuar como f ótransportadores de la información

Tuve un accidente accidente

¡Accidente! Accidente a 100 m

??? ???

¿Quieres que transporte la información?

Adaptado de una transparencia de Thierry Delot

Otro Ejemplo

¡Me voy!

Compartir información sobre plazas de aparcamiento libres diseminar y replicar la información entre vehículos diseminar y replicar la información entre vehículos (Wolfson et. al, 2004)

Adaptado de una transparencia de Thierry Delot

Otro Ejemplo

Adaptado de una transparencia de Thierry Delot

Otro Ejemplo

Adaptado de una transparencia de Thierry Delot

Otro Ejemplo

No recibo nada…

Importancia de la relevanciaespacio-temporal

Adaptado de una transparencia de Thierry Delot

Importancia de la Semánticap

Bitch!Pig!

Je, je

Pig!!!

Fuente: “A New Ph.D. Program in Computational Transportation Science”, Ouri Wolfson

Cómo Devolver el Resultado de una Consulta

Si la consulta no se procesa de forma local, puede ser complicado…

TrayectoriaA

¡Tengo la t !

yA

A lθmin

respuesta!

Q Peer estático

Cli t ( ó il)

Q

Cliente (móvil)

Q = Consulta

A Resp esta

Q

Q A = Respuesta

Adaptado de una transparencia de Thierry Delot

VESPA (I) El objetivo es permitir el intercambio de

cualquier tipo de evento entre vehículos:cualquier tipo de evento entre vehículos: Estacionarios y no dependientes de la dirección

Ej: Plaza de aparcamiento Ej: Plaza de aparcamiento Estacionarios y dependientes de la dirección

Ej: Obstáculo en la carretera, accidente, etc.j , , Móviles y no dependientes de la dirección

Ej: persona conduciendo de forma temerariaó ó Móviles y dependientes de la dirección Ej: Vehículo de emergencia pidiendo paso

VESPA (II) Necesidad de una solución unificada

Adaptado de una transparencia de Thierry Delot

VESPA (III) Necesidad de una solución unificada

http://www.univ-valenciennes.fr/ROI/SID/tdelot/vespa/

VESPA (IV)

La relevancia de los eventos determina: Cómo se informa al conductor de los

eventos recibidos Cómo se diseminan los eventos en la red

Relevancia: Encounter Probability (EP) Relevancia: Encounter Probability (EP)

Penalty Coefficients

VESPA (V)

Vector de movilidad: Proporciona una visión global del patrón de

movilidad del objetoj

Objeto móvil

MobilityRefPos

Adaptado de una transparencia de Thierry Delot

VESPA (VI)

Vector de dirección: Calculada con una posición de referencia

más cercana Proporciona una estimación más precisa a

corto plazocorto plazoObjeto móvil

DirectionRefPos

Adaptado de una transparencia de Thierry Delot

VESPA (VII)

4 Criterios de relevancia: Coeficiente de colinearidad (c)

¡A id t !¡Accidente!

Adaptado de una transparencia de Thierry Delot

VESPA (VIII)

4 Criterios de relevancia: Coeficiente de colinearidad (c) Mínima distancia a lo largo del tiempo (Δd) Mínima distancia a lo largo del tiempo (Δd)

¡A id t ! Mí i di t i ¡Accidente! Mínima distancia geográfica entre el vehículo y el evento a lo largo del tiempolargo del tiempo

A

Adaptado de una transparencia de Thierry Delot

VESPA (IX)

4 Criterios de relevancia: Coeficiente de colinearidad (c) Mínima distancia a lo largo del tiempo (Δd) Mínima distancia a lo largo del tiempo (Δd) Distancia temporal (Δt)

¡A id t !La diferencia entre el

¡Accidente!La diferencia entre el instante de tiempo actual y el instante de tiempo cuando el vehículo estará más cerca del evento

A

Adaptado de una transparencia de Thierry Delot

VESPA (X)

4 Criterios de relevancia: Coeficiente de colinearidad (c) Mínima distancia a lo largo del tiempo (Δd) Mínima distancia a lo largo del tiempo (Δd) Distancia temporal (Δt)

L d d d l t (Δ ) La edad del evento (Δg)

VESPA (XI)

Diseminar los datos de forma escalable: área de diseminación determinada por la EPla EP

¡Salgo!

Adaptado de una transparencia de Thierry Delot

VESPA (XII)

Diseminar los datos de forma escalable: área de diseminación determinada por la EPla EP

Adaptado de una transparencia de Thierry Delot

VESPA (XIII)¡Evitar sobrecargar la red!

48Adaptado de una transparencia de Thierry Delot

VESPA (XIV) Para ello, se puede limitar el número de vehículos que

retransmiten el mensajeretransmiten el mensaje Retransmisión sólo si el mensaje es relevant según la EP El vehículo más alejado es el mejor candidato El vehículo más alejado es el mejor candidato

Adaptado de una transparencia de Thierry Delot 49

top related