39633286 bases de datos difusas
TRANSCRIPT
-
7/27/2019 39633286 Bases de Datos Difusas
1/38
2/2010
Ing. Enrique Yaez
-
7/27/2019 39633286 Bases de Datos Difusas
2/38
Introducciny Una de las caractersticas del lenguaje natural, que
hace difcil su utilizacin en sistemas es su
imprecisin. Por ejemplo conceptos como pequeoo grande, tienen significados diferentes de acuerdo alcontexto en el que se estn utilizando, e incluso dentrodel mismo contexto, pueden significar cosas diferentespara diferentes individuos.
-
7/27/2019 39633286 Bases de Datos Difusas
3/38
Introducciny La teora de los conjuntos difusos desarrollada por
Zadeh, provee una poderosa herramienta para la
representacin y manejo de la imprecisin por lo queactualmente est siendo utilizada en varios campospara el diseo de sistemas basados en reglas difusas.
-
7/27/2019 39633286 Bases de Datos Difusas
4/38
Introducciny El grado de pertenencia a un conjunto en la teora
clsica tiene solo dos valores posibles: 0y1.
-
7/27/2019 39633286 Bases de Datos Difusas
5/38
Introducciny La teora de conjuntos difusos, extiende la teora
clsica de conjuntos al permitir que el grado de
pertenencia de un objeto a un conjunto searepresentada como un nmero real entre 0 y 1
-
7/27/2019 39633286 Bases de Datos Difusas
6/38
Conjuntos Difusosy La edad de una persona es un atributo que la
caracteriza, entonces el concepto joven, puede ser
representado por un conjunto difuso, de la forma:Joven = {0/15, 1/20, 1/25, 0/30}. Esto, quiere decir, quelas personas de 15 30 aos no son jvenes, pero si loson las personas de 20 25 aos. En tanto, que unapersona de 26 aos lo es con grado 0.8. En este caso elconjunto difuso es representado por valoresnumricos.
-
7/27/2019 39633286 Bases de Datos Difusas
7/38
Conjuntos Difusosy El conjunto de las personas que son altas es un
conjunto difuso, pues no est claro el lmite de altura
que se establece a partir de que medida una persona esalta o no lo es. Ese lmite es difuso y, por lo tanto, elconjunto que lo delimita tambin lo ser. En este caso,el conjunto difuso es representado por escalaressimples.
-
7/27/2019 39633286 Bases de Datos Difusas
8/38
Sistemas basados en reglas difusasy Un sistema basado en reglas difusas es un sistema
basado en reglas donde la lgica difusa es utilizada
como una herramienta para representar diferentesformas de conocimiento acerca del problema aresolver, as como para modelar las interacciones yrelaciones que existen entre sus variables.
-
7/27/2019 39633286 Bases de Datos Difusas
9/38
Sistemas basados en reglas difusasy El modelo relacional no permiten el
procesamiento de consultas del tipo:
Encontrar a todos los gerentes cuyo sueldo nosea muy alto
y Dado que ni el clculo ni el lgebra relacional, queestablecen el resultado de cualquier consulta comouna nueva relacin, tienen la capacidad de permitirconsultas de una manera difusa.
-
7/27/2019 39633286 Bases de Datos Difusas
10/38
Modelos de Implementacin
y El problema de la implementacin de los sistemasgestores de bases de datos difusas ha sido tratado endos vertientes principales:
-
7/27/2019 39633286 Bases de Datos Difusas
11/38
Modelos de Implementaciny Iniciar con un sistema gestor de bases de datos relacionales
(SGBD) con informacin precisa y desarrollar una sintaxisque permita formular consultas imprecisas, lo cual daorigen a extensiones SQL, como Fuzzy SQL, concapacidades de manejar la imprecisin.
SGBD
Gestor deconsultas
imprecisas
-
7/27/2019 39633286 Bases de Datos Difusas
12/38
Modelos de Implementaciny Construir un gestor de bases de datos relacionales
difusas (SGBDRD) prototipo que implemente unmodelo concreto de base de datos relacional difusa en
el que la informacin imprecisa pueda ser almacenada.Dentro de esta vertiente existen dos grandes ramas: Losmodelos a travs de unificacin por relaciones desimilitud y los modelos relacionales basados endistribuciones de probabilidades.
SGBDRD
distribuciones deprobabilidades
relaciones desimilitud
-
7/27/2019 39633286 Bases de Datos Difusas
13/38
Representacin de la informaciny Datos Precisos.
y Manejados usualmente mediante la representacin
provista por la base de datos relacional husped.y Datos Imprecisos.
y Los modelos usualmente consideran dos tipos derepresentacin para los datos imprecisos adems de
la informacin desconocida o indeterminada que semaneja mediante los tipos:
unknown, undefined y null:
-
7/27/2019 39633286 Bases de Datos Difusas
14/38
Tipo de dato Indefinido
(undefined)
y Cuando un atributo toma el valor undefined, esto refleja
el hecho de que ningn valor de su dominio espermitido.
y Por ejemplo: el nmero de telfono de alguien que notiene telfono.
-
7/27/2019 39633286 Bases de Datos Difusas
15/38
Tipo de dato desconocido
(unknown)
y Los datos de este tipo expresan nuestra ignorancia
sobre el valor que el atributo toma, sin embargo expresatambin que puede tomar uno de los valores deldominio.
y Por ejemplo la fecha de nacimiento de alguien, ladesconocemos pero tiene que tener alguna.
-
7/27/2019 39633286 Bases de Datos Difusas
16/38
Tipo de dato nulo (null)
y Cuando un atributo toma el valor nulo, esto significa que
no tenemos informacin sobre l, ya sea porque noconocemos su valor o porque es imposible asignarle unvalor del dominio.
y Por ejemplo el email de alguien es null si desconocemossu valor o si lo tiene o no.
-
7/27/2019 39633286 Bases de Datos Difusas
17/38
Operaciones relacionales difusasy Los diferentes operadores de comparacin que se
utilizan para representar relaciones en la base de datos
son los operadores relacionales. Para que estosfuncionen sobre informacin imprecisa es necesarioextender estos operadores.
-
7/27/2019 39633286 Bases de Datos Difusas
18/38
Operaciones relacionales difusasy Igual a:
y Este operador modela el concepto de igualdad para
datos imprecisos.
-
7/27/2019 39633286 Bases de Datos Difusas
19/38
Operaciones relacionales difusasy Aproximadamente igual:
y Este operador define el grado en el que dos
valores numricos (no difusos) sonaproximadamente iguales de acuerdo a si la diferenciade sus valores se encuentra dentro de un lmitepreestablecido. Y se calcula mediante la siguiente
expresin:
-
7/27/2019 39633286 Bases de Datos Difusas
20/38
l modelo GEFREDy El modelo relacional difuso GEFRED (GEneralized
model for FuzzyRElational Databases) permiterepresentar los siguientes atributos difusos:y Atributodifuso de Tipo 1: Estos atributos son
utilizados para representar valores precisos.
y Atributodifusode Tipo 2: Estos atributos sonutilizados para representar valores imprecisos sobre
referenc ial ordenado.y Atributodifusode Tipo 3: Estos atributos son
utilizados para representar valores imprecisos sobrereferencial no ordenado.
-
7/27/2019 39633286 Bases de Datos Difusas
21/38
Atributo difuso de Tipo 1y El dominioD, asociado a este tipo de atributo puede
estar definido por:
y valores numricos o por escalares simples, en amboscasos, el grado de posibilidad es 1, es decir con
A(u) = 1.
-
7/27/2019 39633286 Bases de Datos Difusas
22/38
Atributo difuso de Tipo 2y El dominio D, asociado a este tipo de atributo puede estar
definido por:y valores numricos o por escalares simples, en ambos casos,
con grado de posibilidad 1;y por etiquetas lingsticas;y por valores parcialmente desconocidos entre dos valores
precisos;y por valores parcialmente desconocidos entre un valor preciso,
en esos tres casos, con grado de posibilidad entre 0 y 1, es
decir, con A (u) [0,1];y por valores desconocidos con grado de posibilidad 1;y por valores inaplicables con grado de posibilidad 0;y por valores nulos con grado de posibilidad 1.
-
7/27/2019 39633286 Bases de Datos Difusas
23/38
Atributo difuso de Tipo 3y El dominio D, asociado a este tipo de atributo puede
estar definido por:
y
valores excluyentes de nmeros o escalares con grado deposibilidad 1, es decir, con A (u) = 1;
y por relaciones de similitud con grado de posibilidadentre 0 y 1, es decir, con A (u) [0,1];
y por valores desconocidos con grado de posibilidad 1;
y por valores inaplicables con grado de posibilidad 0
y por valores nulos con grado de posibilidad 1.
-
7/27/2019 39633286 Bases de Datos Difusas
24/38
Manejo de las BDRDy Para el manejo de las bases de datos relacionales
difusas (BDRD) se utiliza el lenguaje Fuzzy SQL
(FSQL) que es un lenguaje que deriva de SQL,incorporando las siguientes novedades.
-
7/27/2019 39633286 Bases de Datos Difusas
25/38
Etiquetas Lingsticasy En las sentencias FSQL las etiquetas van
precedidas del smbolo $, para poder distinguirlas
fcilmente. Esta representada por el conjunto difusoLABEL
y El conjunto difuso LABEL es definido por unadistribucin de posibilidad sobre un intervalo real [0,1]
de la forma:
-
7/27/2019 39633286 Bases de Datos Difusas
26/38
Etiquetas Lingsticasy Supongamos que sobre el atributo edad, adems de la etiqueta
lingstica joven, se encuentra definidas otras dos etiquetas:maduro y mayor. La figura , muestra el dominio de la funcin
de pertenencia para cada una de esas etiquetas. As, la edad 26tiene un grado de pertenencia 0.8 para la etiqueta lingsticajoven. Grficamente, la funcin de pertenencia, corresponde aun trapecio dado por sus 4 valores caractersticos, por ejemplo:{0/25, 1/30, 1/40, 0/45}, para la etiqueta lingstica maduro.
-
7/27/2019 39633286 Bases de Datos Difusas
27/38
Relacin de similitudy Una relacin de similitud permite comparar etiquetas
lingsticas definidas en dominios con referencial no
ordenado. Esta relacin indica, que para cada dominio,es necesario definir una funcin de similitud quepermita medir la similitud o parecido entre dos valoresdel dominio.
y
Matemticamente, una funcin de similitud sr puedeser vista como el producto cartesiano sobre dosdominiosD, tal que:
-
7/27/2019 39633286 Bases de Datos Difusas
28/38
Relacin de similitudy Supongamos que tenemos el atributo color de pelo, donde
el dominio se encuentra definido por tres etiquetaslingsticas: Rubio, Moreno, y Pelirrojo. Es este caso el
conjunto difuso definido por esas etiquetas, no seencuentra definido en un referencial ordenado, lo que hacenecesario la implementacin de una funcin de similitud,que por comodidad, normalmente se presenta en unformato de matriz, tal como lo muestra la tabla
-
7/27/2019 39633286 Bases de Datos Difusas
29/38
Comparadores Difusosy Permiten comparar dos atributos o un atributo con una
constante.
y
ConectivasLgicas:y Pueden usarse NOT,AND y OR, para enlazar
condiciones difusas simples.
-
7/27/2019 39633286 Bases de Datos Difusas
30/38
Umbral de Cumplimiento
(threshold)y Tras cada condicin simple puede imponerse un
umbral de cumplimiento mnimo (por defecto es 1),
con el siguiente formato: THOLD
La palabra reservada THOLD es opcional ypuede sustituirse por un comparador tradicional (=,
-
7/27/2019 39633286 Bases de Datos Difusas
31/38
Constantes Difusasy Pueden usarse en el SELECT todas las constantes
difusas ya definidas:
y
UNKNOWN, UNDEFINED y NULL,y $[a,b,c,d] (Distribucin de posibilidad Trapezoidal),
y $label (Etiquetas),
y [n,m] (Intervalo),
y #n (valores aproximados).
-
7/27/2019 39633286 Bases de Datos Difusas
32/38
Distribucin de posibilidad
Trapezoidaly El conjunto difuso TRAPECIO es definido por una
distribucin de posibilidad sobre un intervalo real [0,1]
de la forma:
y En que, para todo valor trapecio x de un atributo
difuso Tipo 2, en un dominio ordenado U,caracterizado por el intervalo [a,b,c,d] con a
-
7/27/2019 39633286 Bases de Datos Difusas
33/38
Intervaloy El conjunto difuso INTERVALO es definido por una
distribucin de posibilidad sobre un intervalo real [0,1]
de la forma:
y En que, para todo valor x de un atributo difuso Tipo 2,en un dominio ordenado U, caracterizado por el
intervalo = [n,m] con n
-
7/27/2019 39633286 Bases de Datos Difusas
34/38
FuzzySQL (FSQL)y Obtener todas las personas cuya edad es
aproximadamente 20 aos: (con grado mnimo 0.6):
y SELECT * FROM Personas WHEREEdad FEQ #20THOLD 0.6;
-
7/27/2019 39633286 Bases de Datos Difusas
35/38
FuzzySQL (FSQL)y Obtener todas las personas ms o menos Rubias
(con grado mnimo 0.5) cuya edad es posiblemente
superior a Joven (con grado mnimo 0.8):
y SELECT * FROM Personas WHERE Pelo FEQ $RubioTHOLD 0.5ANDEdad FGT $Joven THOLD 0.8;
-
7/27/2019 39633286 Bases de Datos Difusas
36/38
FuzzySQL (FSQL)y Equipos que tienen muchos ms de 3 (con grado
mnimo 0.5) jugadoresAltos (con grado mnimo0.75):
y SELECT Equipo,CDEG(*) FROM Personas GROUPBYEquipo HAVING $Muchos_Mas_Que[3] (AlturaFEQ $Alto 0.75) 0.5;
-
7/27/2019 39633286 Bases de Datos Difusas
37/38
Ventajasy AlmacenarImprecisin, la informacin que
tengamos de un atributo particular de un objeto,aunque esta informacin no sea el valor exacto.
y Operar con esa informacin de forma coherente(especialmente en las operaciones de consulta).
y Soporte a latomade decisionescomo una
herramienta de consulta
-
7/27/2019 39633286 Bases de Datos Difusas
38/38
Desventajasy Lenguaje de consulta incmodo, debido al gran
nmero de parmetros que deben utilizarse
y
Comparadores abstractos que hacen difcil la decisinde cul debemos usar
y Falta de estandarizacin, derivado de la pocapopularidad de este tipo de bases de datos