bases de datos distribuidas carlos rojas kramer universidad cristóbal colón
TRANSCRIPT
![Page 1: Bases de datos distribuidas Carlos Rojas Kramer Universidad Cristóbal Colón](https://reader033.vdocuments.site/reader033/viewer/2022051818/54b47c174979594d3a8b5fbe/html5/thumbnails/1.jpg)
Bases de datos distribuidas
Carlos Rojas Kramer
Universidad Cristóbal Colón
![Page 2: Bases de datos distribuidas Carlos Rojas Kramer Universidad Cristóbal Colón](https://reader033.vdocuments.site/reader033/viewer/2022051818/54b47c174979594d3a8b5fbe/html5/thumbnails/2.jpg)
Orígenes
• Evolución acelerada de los sistemas de información
• Crecimiento no planeado de la información al interior de las organizaciones
• Dispersión en sitios geográficamente distantes
• Sistemas tecnológicamente diferentes
![Page 3: Bases de datos distribuidas Carlos Rojas Kramer Universidad Cristóbal Colón](https://reader033.vdocuments.site/reader033/viewer/2022051818/54b47c174979594d3a8b5fbe/html5/thumbnails/3.jpg)
Orígenes
• Necesidad de compartir e integrar la información dispersa
• Se requiere un tipo de tecnología diferente al tradicional
• La Base de Datos Distribuida es una buena solución a lo anterior.
![Page 4: Bases de datos distribuidas Carlos Rojas Kramer Universidad Cristóbal Colón](https://reader033.vdocuments.site/reader033/viewer/2022051818/54b47c174979594d3a8b5fbe/html5/thumbnails/4.jpg)
Definición
• Una Base de Datos Distribuida (BDD) es una colección de datos relacionados lógicamente, pero dispersos entre diversos sitios de una red de computadoras. [Ceri y Pelagatti]
• Cada sitio en la red tiene capacidad de procesamiento autónomo y puede ejecutar aplicaciones locales.
![Page 5: Bases de datos distribuidas Carlos Rojas Kramer Universidad Cristóbal Colón](https://reader033.vdocuments.site/reader033/viewer/2022051818/54b47c174979594d3a8b5fbe/html5/thumbnails/5.jpg)
BDD (ilustración esquemática)
![Page 6: Bases de datos distribuidas Carlos Rojas Kramer Universidad Cristóbal Colón](https://reader033.vdocuments.site/reader033/viewer/2022051818/54b47c174979594d3a8b5fbe/html5/thumbnails/6.jpg)
Razones para la dispersión
• Naturaleza de la información
• Motivos económicos
• Consideraciones de desempeño
• Necesidades de fiabilidad
• Requerimientos de disponibilidad
• Etc.
![Page 7: Bases de datos distribuidas Carlos Rojas Kramer Universidad Cristóbal Colón](https://reader033.vdocuments.site/reader033/viewer/2022051818/54b47c174979594d3a8b5fbe/html5/thumbnails/7.jpg)
Consecuencias de la dispersión
• Incremento en la complejidad de diseño
• Mayores dificultades para la instrumentación de las soluciones
• Administración y resolución de problemas implican aplicación de mejores recursos
• Necesidad de apego a estándares
![Page 8: Bases de datos distribuidas Carlos Rojas Kramer Universidad Cristóbal Colón](https://reader033.vdocuments.site/reader033/viewer/2022051818/54b47c174979594d3a8b5fbe/html5/thumbnails/8.jpg)
Software para BDD
• DDBMS = Distributed DataBase Management System
• Debe permitir la creación, el uso y el mantenimiento de la BDD
• Debe realizar funciones típicas de un DBMS no distribuido
• También debe soportar otras funciones
![Page 9: Bases de datos distribuidas Carlos Rojas Kramer Universidad Cristóbal Colón](https://reader033.vdocuments.site/reader033/viewer/2022051818/54b47c174979594d3a8b5fbe/html5/thumbnails/9.jpg)
Funciones extra para un DDBMS
• Capacidad de accesar sitios remotos y transmitir consultas y datos entre diversos sitios a través de una red de computadoras
• Capacidad de rastrear la pista de distribución y de replicación de los datos en el catálogo del DDBMS
![Page 10: Bases de datos distribuidas Carlos Rojas Kramer Universidad Cristóbal Colón](https://reader033.vdocuments.site/reader033/viewer/2022051818/54b47c174979594d3a8b5fbe/html5/thumbnails/10.jpg)
• Capacidad de elaborar estrategias de ejecución para consultas y transacciones que accesan datos en más de un sitio
• Capacidad de mantener la consistencia en las copias de un elemento de información
![Page 11: Bases de datos distribuidas Carlos Rojas Kramer Universidad Cristóbal Colón](https://reader033.vdocuments.site/reader033/viewer/2022051818/54b47c174979594d3a8b5fbe/html5/thumbnails/11.jpg)
• Capacidad de recuperarse ante caídas de sitios individuales y fallos de un enlace de comunicación
• Capacidad de decidir cual de las copias de un elemento de información será accesada
![Page 12: Bases de datos distribuidas Carlos Rojas Kramer Universidad Cristóbal Colón](https://reader033.vdocuments.site/reader033/viewer/2022051818/54b47c174979594d3a8b5fbe/html5/thumbnails/12.jpg)
Componentes de un DDBMS
• Componente de manejo de Base de Datos (DB)
• El componente de Comunicación de Datos (DC)
• El Diccionario de Datos (DD), el cual es
extendido para representar información sobre la
distribución de los datos sobre la red
• El componente de base de datos distribuida (BDD)
![Page 13: Bases de datos distribuidas Carlos Rojas Kramer Universidad Cristóbal Colón](https://reader033.vdocuments.site/reader033/viewer/2022051818/54b47c174979594d3a8b5fbe/html5/thumbnails/13.jpg)
Tipos de DDBMs
• Clasificados según su grado de:
– homogeneidad / heterogeneidad
– autonomía
– transparencia de la distribución
![Page 14: Bases de datos distribuidas Carlos Rojas Kramer Universidad Cristóbal Colón](https://reader033.vdocuments.site/reader033/viewer/2022051818/54b47c174979594d3a8b5fbe/html5/thumbnails/14.jpg)
Grado de homogeneidad
• Un DDBMS homogéneo se caracteriza principalmente por la utilización del modelo descendente para la conceptualización del diseño de la BD, en donde la fragmentación vertical u horizontal de un esquema global de datos determina la naturaleza de cada uno de los componentes de la BDD
![Page 15: Bases de datos distribuidas Carlos Rojas Kramer Universidad Cristóbal Colón](https://reader033.vdocuments.site/reader033/viewer/2022051818/54b47c174979594d3a8b5fbe/html5/thumbnails/15.jpg)
• Un DDBMS heterogéneo se caracteriza por la diversidad de DBMSs, modelos de diseño, sistemas operativos, conceptualización del diseño y hardware utilizado en cada uno de sus componentes de BD
![Page 16: Bases de datos distribuidas Carlos Rojas Kramer Universidad Cristóbal Colón](https://reader033.vdocuments.site/reader033/viewer/2022051818/54b47c174979594d3a8b5fbe/html5/thumbnails/16.jpg)
• La heterogeneidad debida a diversos DBMSs es común en organizaciones que crecen sin una planeación en cuanto a sus sistemas de información.
• Dichos sistemas evolucionan paulatinamente en diferentes DBMSs o diferentes modelos de conceptualización, tales como: jerárquico, de red, relacional u orientado a objetos
![Page 17: Bases de datos distribuidas Carlos Rojas Kramer Universidad Cristóbal Colón](https://reader033.vdocuments.site/reader033/viewer/2022051818/54b47c174979594d3a8b5fbe/html5/thumbnails/17.jpg)
Tipos de heterogeneidad según Larson y Sheth
![Page 18: Bases de datos distribuidas Carlos Rojas Kramer Universidad Cristóbal Colón](https://reader033.vdocuments.site/reader033/viewer/2022051818/54b47c174979594d3a8b5fbe/html5/thumbnails/18.jpg)
Heterogeneidad semántica
• Ocurre cuando existe una diferencia en el significado, interpretación o uso del mismo modelo de datos
![Page 19: Bases de datos distribuidas Carlos Rojas Kramer Universidad Cristóbal Colón](https://reader033.vdocuments.site/reader033/viewer/2022051818/54b47c174979594d3a8b5fbe/html5/thumbnails/19.jpg)
Sistemas de Multibase de Datos
• MDBMS = multi database management system
• También llamado Sistema de Base de Datos Federado
• Es un tipo de DDBMS
• Se compone de una colección de DBMS con alto grado de autonomía
![Page 20: Bases de datos distribuidas Carlos Rojas Kramer Universidad Cristóbal Colón](https://reader033.vdocuments.site/reader033/viewer/2022051818/54b47c174979594d3a8b5fbe/html5/thumbnails/20.jpg)
MDBMS (cont.)
• Cada servidor es un DBMS centralizado independiente y autónomo que tiene sus propios usuarios locales, transacciones locales y administrador de base de datos (DBA)
• Por lo mismo, cada uno posee un alto grado de autonomía local
![Page 21: Bases de datos distribuidas Carlos Rojas Kramer Universidad Cristóbal Colón](https://reader033.vdocuments.site/reader033/viewer/2022051818/54b47c174979594d3a8b5fbe/html5/thumbnails/21.jpg)
• En un MDBMS cada servidor puede autorizar el acceso a porciones específicas de la BD definiendo un esquema de exportación, el cual especifica la parte de la BD a la cual puede tener acceso una cierta parte de usuarios no locales
• Los MDBMS son catalogados como un sistema híbrido entre los sistemas distribuidos y los centralizados
![Page 22: Bases de datos distribuidas Carlos Rojas Kramer Universidad Cristóbal Colón](https://reader033.vdocuments.site/reader033/viewer/2022051818/54b47c174979594d3a8b5fbe/html5/thumbnails/22.jpg)
Grado de autonomía
• Es el grado de independencia de operación de cada uno de los DBMS componentes del DDBMS
![Page 23: Bases de datos distribuidas Carlos Rojas Kramer Universidad Cristóbal Colón](https://reader033.vdocuments.site/reader033/viewer/2022051818/54b47c174979594d3a8b5fbe/html5/thumbnails/23.jpg)
Autonomía de diseño
• La capacidad de que cada Base de Datos Componente (BDC) decida los aspectos concernientes con su diseño. Es decir, las personas involucradas son libres de decidir cualquier particularidad e incluso decidir que DBMS usar.
![Page 24: Bases de datos distribuidas Carlos Rojas Kramer Universidad Cristóbal Colón](https://reader033.vdocuments.site/reader033/viewer/2022051818/54b47c174979594d3a8b5fbe/html5/thumbnails/24.jpg)
Aspectos a considerar en la autonomía de diseño
– El universo de datos relevante para el sistema
– La representación (modelo de datos, lenguaje de consultas) y el nombrado de los datos
– La conceptualización o interpretación semántica de los datos (heterogeneidad semántica)
– Restricciones usadas para administrar los datos
– La funcionalidad del sistema
– La asociación y compartición con otros sistemas y
– La implementación (p.e. registros y estructuras de archivos).
![Page 25: Bases de datos distribuidas Carlos Rojas Kramer Universidad Cristóbal Colón](https://reader033.vdocuments.site/reader033/viewer/2022051818/54b47c174979594d3a8b5fbe/html5/thumbnails/25.jpg)
Autonomía de comunicación
• La habilidad de que una BDC decida comunicarse o no con otro componente de una misma federación
![Page 26: Bases de datos distribuidas Carlos Rojas Kramer Universidad Cristóbal Colón](https://reader033.vdocuments.site/reader033/viewer/2022051818/54b47c174979594d3a8b5fbe/html5/thumbnails/26.jpg)
Autonomía de ejecución
• Es la habilidad de una BDC para ejecutar operaciones locales sin la interferencia de operaciones externas, en el orden que la BDC lo decida
![Page 27: Bases de datos distribuidas Carlos Rojas Kramer Universidad Cristóbal Colón](https://reader033.vdocuments.site/reader033/viewer/2022051818/54b47c174979594d3a8b5fbe/html5/thumbnails/27.jpg)
Autonomía de asociación
• Cada BDC decide cuánto y cuándo puede compartir su funcionalidad y recursos con otros componentes, inclusive la capacidad de asociarse o retirarse de una o más federaciones
![Page 28: Bases de datos distribuidas Carlos Rojas Kramer Universidad Cristóbal Colón](https://reader033.vdocuments.site/reader033/viewer/2022051818/54b47c174979594d3a8b5fbe/html5/thumbnails/28.jpg)
Grado de Transparencia de Distribución
• Si el usuario percibe un solo esquema integrado sin información alguna relativa a la fragmentación, replicación o distribución, se dice que el DDBMS tiene un alto grado de transparencia de distribución.
• Si el usuario puede ver toda la fragmentación, el reparto y la aplicación, el DDBMS no tiene transparencia de distribución
![Page 29: Bases de datos distribuidas Carlos Rojas Kramer Universidad Cristóbal Colón](https://reader033.vdocuments.site/reader033/viewer/2022051818/54b47c174979594d3a8b5fbe/html5/thumbnails/29.jpg)
Distribución de los datos
![Page 30: Bases de datos distribuidas Carlos Rojas Kramer Universidad Cristóbal Colón](https://reader033.vdocuments.site/reader033/viewer/2022051818/54b47c174979594d3a8b5fbe/html5/thumbnails/30.jpg)
Fragmentación
• La fragmentación de una base de datos consiste en descomponer en partes los datos, siguiendo algún patrón conveniente y relacionado con la forma como estos serán alimentados y explotados.
![Page 31: Bases de datos distribuidas Carlos Rojas Kramer Universidad Cristóbal Colón](https://reader033.vdocuments.site/reader033/viewer/2022051818/54b47c174979594d3a8b5fbe/html5/thumbnails/31.jpg)
Tipos de fragmentación
• Tipos primitivos de fragmentación:– Horizontal– Vertical
• Tipos derivados:– Horizontal derivada– Mixta
![Page 32: Bases de datos distribuidas Carlos Rojas Kramer Universidad Cristóbal Colón](https://reader033.vdocuments.site/reader033/viewer/2022051818/54b47c174979594d3a8b5fbe/html5/thumbnails/32.jpg)
Objetivos ideales
• Separar el concepto de fragmentación de los datos del concepto de localización (o ubicación) de los mismos.
• Control explícito de la redundancia
• Independencia de DBMSs locales
![Page 33: Bases de datos distribuidas Carlos Rojas Kramer Universidad Cristóbal Colón](https://reader033.vdocuments.site/reader033/viewer/2022051818/54b47c174979594d3a8b5fbe/html5/thumbnails/33.jpg)
Tipos de transparencia
• Transparencia de fragmentación
• Transparencia de localización
• Transparencia de replicación
• Transparencia de correspondencia
![Page 34: Bases de datos distribuidas Carlos Rojas Kramer Universidad Cristóbal Colón](https://reader033.vdocuments.site/reader033/viewer/2022051818/54b47c174979594d3a8b5fbe/html5/thumbnails/34.jpg)
Niveles de transparencia
1. Transparencia de fragmentación
2. Transparencia de localización
3. Transparencia de correspondencia local
4. Sin transparencia