resumen inteligencia artificial 2012

1

INTELIGENCIA ARTIFICIAL

1) Introduccin a Inteligencia Artificial 2) Sistemas Expertos 3) Sistemas Difusos 4) Algoritmos Genticos 5) Redes Neuronales

1) Introduccin a I.A La inteligencia es la capacidad de entender, asimilar, elaborar informacin y utilizarla para resolver problemas. La inteligencia parece estar ligada a otras funciones mentales como la percepcin, o capacidad de recibir informacin, y la memoria, o capacidad de almacenarla. Inteligencias mltiples Howard Gardner, psiclogo norteamericano de la Universidad de Harvard, escribi en 1983 Las estructuras de la mente, un trabajo en el que consideraba el concepto de inteligencia como un potencial que cada ser humano posee en mayor o menor grado, planteando que sta no poda ser medida por instrumentos normalizados en test de CI y ofreci criterios, no para medirla, sino para observarla y desarrollarla. Segn Howard Gardner, creador de la Teora de las inteligencias mltiples, la inteligencia es la capacidad para resolver problemas o elaborar productos que puedan ser valorados en una determinada cultura. Propuso varios tipos de inteligencia, igual de importantes:

Inteligencia lingstica: capacidad de usar las palabras de manera adecuada. Caracteriza a escritores y poetas. Implica la utilizacin de ambos hemisferios cerebrales.

Inteligencia lgica-matemtica: capacidad que permite resolver problemas de lgica y matemtica. Es fundamental en cientficos y filsofos. Al utilizar este tipo de inteligencia se hace uso del hemisferio lgico. Era la predominante en la antigua concepcin unitaria de "inteligencia".

Inteligencia musical: capacidad relacionada con las artes musicales. Es el talento de los msicos, cantantes y bailarines. Es conocida comnmente como "buen odo".

Inteligencia espacial: la capacidad de distinguir aspectos como: color, lnea, forma, figura, espacio, y sus relaciones en tres dimensiones.

Esta inteligencia atae a campos tan diversos como el diseo, la arquitectura, la ingeniera, la escultura, la ciruga o la marina.

Inteligencia corporal-cenestsica: capacidad de controlar y coordinar los movimientos del cuerpo y expresar sentimientos con l.

Es el talento de los actores, mimos, o bailarines. Implica a deportistas o cirujanos.

Inteligencia intra personal: est relacionada con las emociones, y permite entenderse a s mismo. Relacionada con las ciencias psicolgicas.

Inteligencia interpersonal o social: capacidad para entender a las dems personas con empata; est relacionada con las emociones.

Es tpica de los buenos vendedores, polticos, profesores o terapeutas. Posteriormente aadi:

Inteligencia naturalista: la utilizamos al observar y estudiar la naturaleza para organizar y clasificar. Los bilogos y naturalistas son quienes ms la desarrollan.

Inteligencia existencial o filosfica: la capacidad para situarse a s mismo con respecto al cosmos y autosugestionarse.

Requiere de un estudio ms profundo para ser caracterizada como inteligencia. La crtica ms comn es que la inteligencia musical y la cenestsica no muestran inteligencia, sino talento. Introduccin a Inteligencia Artificial En ciencias de la computacin se denomina inteligencia artificial (IA) a las inteligencias no naturales en agentes racionales no vivos. Segn John McCarthy "Es la ciencia e ingeniera de hacer mquinas inteligentes, especialmente programas de cmputo inteligentes." Un Agente inteligente, permite pensar, evaluar y actuar conforme a ciertos principios de optimizacin y consistencia, para satisfacer algn objetivo o finalidad.

I.A es la disciplina que se encarga de construir procesos que al ser ejecutados sobre una arquitectura fsica producen acciones o resultados que maximizan una medida de rendimiento determinada, basndose en la secuencia de entradas percibidas y en el conocimiento almacenado en tal arquitectura. Existen distintos tipos de conocimiento y medios de representacin del conocimiento, el cual puede ser cargado en el agente por su diseador o puede ser aprendido por el mismo agente utilizando tcnicas de aprendizaje. Tambin se distinguen varios tipos de procesos vlidos para obtener resultados racionales, que determinan el tipo de agente inteligente. De ms simples a ms complejos, los cinco principales tipos de procesos son:

Ejecucin de una respuesta predeterminada por cada entrada (anlogas a actos reflejos en seres vivos). Bsqueda del estado requerido en el conjunto de los estados producidos por las acciones posibles. Algoritmos genticos (anlogo al proceso de evolucin de las cadenas de ADN). Redes neuronales artificiales (anlogo al funcionamiento fsico del cerebro de animales y humanos). Razonamiento mediante una lgica formal (anlogo al pensamiento abstracto humano).

Tambin existen distintos tipos de percepciones y acciones, pueden ser obtenidas y producidas, respectivamente por sensores fsicos y sensores mecnicos en mquinas, pulsos elctricos u pticos en computadoras, tanto como por entradas y salidas de bits de un software y su entorno software. Varios ejemplos se encuentran en el rea de control de sistemas, planificacin automtica, la habilidad de responder a diagnsticos y a consultas de los consumidores, reconocimiento de escritura, reconocimiento del habla y reconocimiento de patrones. Los sistemas de IA actualmente son parte de la rutina en campos como economa, medicina, ingeniera y la milicia, y se ha usado en gran variedad de aplicaciones de software, juegos de estrategia como ajedrez de computador y otros videojuegos. Categoras de la Inteligencia Artificial

Sistemas que piensan como humanos.- Estos sistemas tratan de emular el pensamiento humano; por ejemplo las redes neuronales artificiales. La automatizacin de actividades que vinculamos con procesos de pensamiento humano, actividades como la Toma de decisiones, resolucin de problemas, aprendizaje.

Sistemas que actan como humanos.- Estos sistemas tratan de actuar como humanos; es decir, imitan el comportamiento humano; por ejemplo la robtica. El estudio de cmo lograr que los computadores realicen tareas que, por el momento, los humanos hacen mejor.

Sistemas que piensan racionalmente.- Es decir, con lgica (idealmente), tratan de imitar o emular el pensamiento lgico racional del ser humano; por ejemplo los sistemas expertos. El estudio de los clculos que hacen posible percibir, razonar y actuar.

Sistemas que actan racionalmente (idealmente). Tratan de emular en forma racional el comportamiento humano; por ejemplo los agentes inteligentes .Est relacionado con conductas inteligentes en artefactos.

John Searle Alan Turing John searle distingue la I.A entre dbil y fuerte: I.A dbil: simular estados mentales y no tiene conciencia. I.A fuerte: computadora con conciencia. Este concepto est asociado con Alan turing. Leyes de la robtica El termino robot fue introducido por el checo Karel Capek en 1921, y viene de la combinacin de las palabras checas robota que significa trabajo obligatorio y robotnik que significa siervo. La palabra robtica fue utilizada por primera vez por el cientfico y escritor de ciencia ficcin Isacc Asimov en 1942. El propuso las llamadas leyes de la robtica:

2

Estas leyes surgen como medida de proteccin para los seres humanos. Segn Isacc Asimov, la concepcin de las leyes de la robtica busca contrarrestar un supuesto temor que el ser humano desarrollara frente a unas mquinas que hipotticamente pudieran rebelarse y levantarse contra sus creadores. Las tres leyes de la robtica representan el cdigo moral del robot. 2) Sistemas Expertos (tambin conocidos como Sistemas basados en el conocimiento Facilitar la toma de decisin) Conocimiento: una comprensin terica o prctica de un dominio de inters. Tambin la suma de lo que conocemos Experto: individuo que tiene conocimiento especializado sobre el problema a resolver. Definicin de S.E: Es un SW que imita el comportamiento de un experto humano en la solucion de un problema. Puede almacenar conocimientos de expertos para un campo determinado y solucionar un problema mediante deduccin lgica de conclusiones. Caractersticas

Se basan principalmente en procesos heursticos antes que algortmicos.

Pueden tomar decisiones aunque el conocimiento sea incierto, impreciso o incompleto. Arquitectura o estructura bsica de un S.E

a) Base de conocimiento b) Base de hechos o base de datos (memoria de trabajo) c) Motor de inferencia d) Mdulo de justificacin o sub-sistema de explicaciones e) Interfaz de usuario

a) Base de conocimiento: parte del S.E que contiene el conocimiento del domino representado a travs de reglas. Modos de representar el conocimiento

1)Reglas Heursticas, 2) Triplos OAV, 3) Redes Semnticas, 4) Marcos (FRAMES), 5) Frmulas Lgicas, 6) Redes Neuronales

Una regla es una estructura condicional que relaciona lgicamente la informacin contenida en la parte del antecedente con otra informacin contenida en la parte del consecuente. [If antecedente Then Consecuente1 - Else Consecuente2] El antecedente incorpora 3 partes: Objeto Atributo Valor Ejemplo: Si el ratn es marrn entonces es malo Forma general de la regla If condicion1 (AND/OR) Condicion2 Then Conclusin1 (AND/OR) Conclusion2 Un hecho es un caso particular de la regla. Entonces podemos considerar un hecho como informacin y una regla como conocimiento.

b) Base de hechos (memoria de trabajo): incluye un conjunto de hechos utilizados en la parte de de la base de conocimiento. c) Motor de inferencia: trabaja con la informacin contenida en la base de conocimientos y la base de hechos para deducir nuevos hechos. Contrasta los hechos particulares de la base de hechos con el conocimiento contenido en la base de conocimientos para obtener conclusiones acerca del problema. Encadenamiento de reglas: Cuando se dispara una regla se produce una cadena inferencial, la cual indica como un S.E aplica las reglas para alcanzar una conclusin: -Encadenamiento hacia adelante (Forward): o inferencia ascendente. Orientado por hechos. Partiendo de un conjunto de hechos, usar reglas para deducir nuevos hechos.

Dado un conjunto de Hechos, elegir una regla cuyo Antecedente sea verdadero; disparar la regla; el Consecuente de la regla es un nuevo hecho; Continuar (recursivamente) con un nuevo conjunto de datos; Parar cuando no se pueda disparar ninguna regla. -Encadenamiento hacia atrs (Backward): o inferencia descendente. Orientado por objetivos. Partiendo de un objetivo, usar reglas para buscar soporte del objetivo. Dado un conjunto de Hechos, elegir una regla cuyo Antecedente sea verdadero; disparar la regla; el Consecuente de la regla es un nuevo hecho; Continuar (recursivamente) con un nuevo conjunto de datos; Parar cuando no se pueda disparar ninguna regla. -Encadenamiento mixto. Consejos de cuando conviene utilizar los encadenamientos

Si un experto necesita tener informacin primero y luego trata de inferir de ella lo que se pueda, se utiliza encadenamiento hacia adelante. (trabaja con varios hechos, de lo contrario, resulta ineficiente)

Si un experto comienza con una solucion hipottica y luego trata de encontrar hechos que la sustenten, la eleccin es encadenamiento hacia atrs.

Cuando 2 reglas se disparan al mismo tiempo, existen 2 mtodos de solucion: disparar la regla con la mayor prioridad o disparar la regla mas especifica (estrategia de mxima equiparacin)

d) Modulo de justificacin: Una caracterstica de los sistemas expertos es su habilidad para explicar su razonamiento. Usando el mdulo del subsistema de explicacin, un sistema experto puede proporcionar una explicacin al usuario de por qu est haciendo una pregunta y cmo ha llegado a una conclusin. Este mdulo proporciona beneficios tanto al diseador del sistema como al usuario. El diseador puede usarlo para detectar errores y el usuario se beneficia de la transparencia del sistema. e) Interfaz de usuario: La interaccin entre un sistema experto y un usuario se realiza en lenguaje natural. 3) Sistemas difusos Lgica Difusa Es una metodologa que proporciona una manera simple de obtener una conclusin a partir de informacin de entrada vaga, imprecisa, distorsionada o incompleta. La lgica fuzzy est basada en la idea de que todas las cosas admiten grados (temperatura, velocidad, altura, belleza). Todos los valores de sus objetos aparecen sobre una escala graduada: Carlos es un hombre alto, Luisa es una linda chica. Surgi como una herramienta importante para el control de sistemas y procesos industriales complejos, as como tambin para la electrnica de entretenimiento y hogar, sistemas de diagnostico y otros sistemas expertos. Logia difusa vs. Lgica tradicional o convencional En la lgica clsica (binaria o booleana) se tiene solo dos estados posibles: verdadero o falso (1 o 0). En la lgica difusa se asigna valores intermedios dentro de una escala a fin de cuantificar una incertidumbre (conjuntos). La lgica difusa en comparacin con la lgica convencional permite trabajar con informacin que no es exacta para poder definir evaluaciones convencionales, contrario con la lgica tradicional que permite trabajar con informacin definida y precisa. En qu situaciones es til aplicar la lgica difusa?

En procesos demasiados complejos

Cuando no existe un modelo de solucion simple o un modelo matemtico preciso.

Cuando se necesite usar el conocimiento de un experto que utiliza conceptos ambiguos o imprecisos.

Cuando ciertas partes de un sistema a controlar son desconocidas y no pueden medirse de forma confiable.

Cuando el ajuste de una variable puede producir el desajuste de otras. No es recomendable utilizar la lgica difusa cuando algn modelo matemtico ya soluciona eficientemente el problema, cuando los problemas son lineales o cuando no tienen solucion. Conjuntos difusos La necesidad de trabajar con conjuntos difusos surge del hecho que existen conceptos que no tienen lmites claros. Un conjunto difuso se encuentra asociado por un valor lingstico que est definido por una palabra, etiqueta lingstica o adjetivo. En los conjuntos difusos la funcin de pertenencia puede tomar valores del intervalo entre 0 y 1, y la transicin del valor entre cero y uno es gradual y no cambia de manera instantnea como pasa con los conjuntos clsicos. Un conjunto difuso en un universo de discurso puede definirse como: A= {(x, uA (x))/x E U} Donde:

uA (x) es la funcin de pertenencia de la variable x.

3

U es el universo de discurso. Cuando mas este la pertenencia del conjunto A al valor de 1, mayor ser la pertenencia de la variable x al conjunto A.

Variable lingstica: es una variable fuzzy. Por ejemplo, la sentencia Pablo es alto implica que la variable lingstica Pablo toma el valor alto. Operaciones en conjuntos difusos: Complemento: el complemento de un conjunto es el opuesto a dicho conjunto. uA(x) = 1 - uA(x) Contencin: un conjunto puede contener a otros conjuntos. El conjunto contenido se denomina subconjunto. Interseccin: La interseccin fuzzy est dada por el menor grado de pertenencia en ambos conjuntos para cada elemento. Unin: en la unin de dos conjuntos fuzzy estamos interesados en el mayor valor de pertenencia a ambos conjuntos.

Funciones de pertenencia (tambin denominada de membresia, transferencia) La funcin de pertenencia de un conjunto nos indica el grado en que cada elemento de un universo dado, pertenece a dicho conjunto. Es decir, la funcin de pertenencia de un conjunto A sobre un universo X ser de la forma: A:X [0,1], donde A (x) = r ; r es el grado en que x pertenece a A. Si el conjunto es ntido, su funcin de pertenencia (funcin caracterstica) tomar los valores en {0,1}, mientras que si es borroso, los tomar en el intervalo [0,1]. Si A(x) = 0 el elemento no pertenece al conjunto, si A(x) = 1 el elemento s pertenece totalmente al conjunto. Las funciones de pertenencia son una forma de representar grficamente un conjunto borroso sobre un universo.

La funcin caracterstica del conjunto de los elementos que verifican un predicado clsico est perfectamente determinada. No ocurre lo mismo cuando se intenta obtener la funcin de pertenencia de un conjunto formado por los elementos que verifican un predicado borroso. Dicha funcin depender del contexto (o universo) en el que se trabaje, del experto, del usuario, de la aplicacin a construir, etc. A la hora de determinar una funcin de pertenencia, normalmente se eligen funciones sencillas, para que los clculos no sean complicados. En particular, en aplicaciones en distintos entornos, son muy utilizadas las triangulares y las trapezoidales:

Funcin Triangular Definida mediante el lmite inferior a, el superior b y el valor modal m, tal que a

4

Controlador difuso o sistema difuso La lgica difusa se aplica principalmente en sistemas de control difuso que utilizan expresiones ambiguas para formular reglas que controlen el sistema. Un sistema de control difuso trabaja de manera muy diferente a los sistemas de control convencionales. Estos usan el conocimiento experto para generar una base de conocimientos que dar al sistema la capacidad de tomar decisiones sobre ciertas acciones que se presentan en su funcionamiento. Los sistemas de control difuso permiten describir un conjunto de reglas que utilizara una persona para controlar un proceso y a partir de estas reglas generar acciones de control. El control difuso puede aplicarse tanto en sistemas muy sencillos como en sistemas cuyos modelos matemticos sean muy complejos. Los mas populares sistemas de lgica difusa que se encuentran son: a) Sistemas difusos tipo Mamdani (con fuzzificador y defuzzificador). b) Sistemas difusos tipo Takagi-Sugeno. a) La estructura de un sistema difuso Mandani es la siguiente:

Fusificacin La entrada de un sistema de lgica difusa tipo Mamdani normalmente es un valor numrico proveniente, por ejemplo, de un sensor; para que este valor pueda ser procesado por el sistema difuso se hace necesario convertirlo a un "lenguaje" que el mecanismos de infererencia pueda procesar. Esta es la funcin del fuzzificador, que toma los valores numricos provenientes del exterior y los convierte en valores "difusos" que pueden ser procesados por el mecanismo de inferencia. Estos valores difusos son los niveles de pertenencia de los valores de entrada a los diferentes conjuntos difusos en los cuales se ha dividido el universo de discurso de las diferentes variables de entrada al sistema. Base de conocimiento o base de reglas La base de reglas son la manera que tiene el sistema difuso de guardar el conocimiento lingstico que le permiten resolver el problema para el cual ha sido diseado. Estas reglas son del tipo IF-THEN. Una regla de la base de reglas o base de conocimiento tiene dos partes, el antecedente y el consecuente.

Inferencia Teniendo los diferentes niveles de pertenencia arrojados por el fusificador, los mismos deben ser procesados para generar una salida difusa. La tarea del sistema de inferencia es tomar los niveles de pertenencia y apoyado en la base de reglas o base de conocimiento genera la salida del sistema difuso. Defusificacin La salida que genera el mecanismo de inferencia es una salida difusa, lo cual significa que no puede ser interpretada por un elemento externo (por ejemplo un controlador) que solo manipule informacin numrica. Para lograr que la salida del sistema difuso pueda ser interpretada por elementos que solo procesen informacin numrica, hay que convertir la salida difusa del mecanismos de inferencia; este proceso lo realiza el defusificador. b) Los sistemas difusos tipo Sugeno incluyen:

Fusificador (igual funcin que los de Mandani). Inferencia (igual funcin que los de tipo mandani). Base de reglas o base de conocimiento Las reglas de la base de conocimiento de un sistema Sugeno es diferente a las de los sistemas Mamdani, el consecuente de estas reglas ya no es una una etiqueta lingustica sino que es una funcin de la entrada que tiene el sistema en un momento dado, esto se ilustra a continuacin:

En los sistemas difusos tipo Sugeno, los valores que arrojan los consecuentes de las diferentes reglas que se han activado en un momento determinado ya son valores numricos por lo que no se necesita una etapa de Defusificacin. Definicin de reglas usando la matriz Variables de entrada: Temperatura y humedad Variable de salida: velocidad de un ventilador La temperatura tendr 3 Term set (alta, media, baja) La humedad tendr 2 Term set (alta, baja) La velocidad del ventilador 3 Term set (rpido, medio, lento)

Temperatura\Humedad alta baja

Baja Lento Lento

Media Rpido Medio

alta Rpido Rpido

Para calcular la cantidad de reglas a utilizar se debe multiplicar la cantidad de term set que tenga cada entrada. En este caso 3 de temp. X 2 de humed. = 6 reglas. Los valores de la funcin de pertenencia de salida no indican la cantidad de reglas, estos pueden repetirse. (mirar color rosa) 4) Algoritmos Genticos Algoritmos Genticos (permite optimizar la solucin, trabaja con tcnicas heursticas) Algoritmos genticos: intentan emular la capacidad que tiene la naturaleza de evolucionar hacia individuos cada vez ms aptos. Usan una analoga directa con el comportamiento natural. Trabajan con una poblacin de individuos, cada uno representa una solucin factible a un problema dado. Cuanto mayor sea la adaptacin del individuo al problema, mayor ser la posibilidad de que el mismo sea seleccionado para reproducirse, cruzando su material gentico con otro individuo seleccionado de igual forma. Esta cruza producir nuevos individuos (descendientes de los anteriores) los cuales compartirn algunas de las caractersticas de sus padres.

Valores de la funcin de

pertenencia de entrada temp.

Valores de la funcin de

pertenencia de entrada

humed.

Valores de la funcin

de pertenencia de

salida

VelocidadVentilador.

5

De esta manera se produce una nueva poblacin de posibles soluciones, la cual reemplazar a la anterior y verifica una interesante prioridad: contiene una mayor proporcin de buenas caractersticas en comparacin con la poblacin anterior.

Seleccin Natural o Supervivencia del ms Apto: es un mecanismo de la naturaleza sobre todo los individuos de una especie, por el cual el ms apto tiene ms posibilidades de sobrevivir y de propagar las cualidades genticas a sus descendientes.

Conceptos Bsicos de Algoritmos Genticos

Cromosoma: es la representacin codificada de una posible solucin. Generalmente se usa la representacin como cadenas de bits. Tambin se pueden usar punto flotante, cdigos alfabticos.

Gen: a cada posicin de la cadena se denomina gen y al valor dentro de esta posicin se le llama alelo.

Evaluacin de Adaptabilidad (fitness): a cada solucin (cromosoma) se le asigna un valor de adaptabilidad dependiendo de qu tan bueno es el cromosoma solucionando el problema.

Genotipo: conjunto de cromosomas.

Fenotipo:

Conceptos de Poblacin

Tamao de Poblacin: es el tamao idneo de la poblacin. En poblaciones pequeas se corre el riesgo de no cubrir adecuadamente el espacio de bsqueda, mientras que en poblaciones de gran tamao puede acarrear problemas relacionados con el excesivo costo computacional. El tamao optimo de la poblacin para cadenas de longitud m; con codificacin binaria, crece exponencialmente con el tamao de la cadena. En evidencia empirica sugiere que el tamao de la poblacin comprendida entre 1 y 21 es suficiente para atacar con xito los problemas con el considerado.

Poblacin Inicial: debe contener cromosomas que estn bien dispersos por el espacio de soluciones. La poblacin inicial se escoge generando cadenas al azar, pudiendo contener cada gen uno de los posibles valores del alfabeto con probabilidad uniforme. En pocos casos la inicializacin se hace en forma no aleatoria, esto puede llegar a acelerar la convergencia del algoritmo gentico; y esto pude llevar a una desventaja que la convergencia hacia ptimos locales.

Funcin Objetivo: Llamamos as a la funcin que evala la adaptacin al medio de los individuos de la poblacin, y es la que nos delimita el criterio a la hora de reproducir y seleccionar unos individuos de la poblacin en lugar de otros.

Seleccin Natural: Es el proceso que se lleva a cabo al final de cada generacin, y consiste en escoger un conjunto de individuos de tamao N (igual al nmero de individuos de la poblacin inicial), que sern los individuos que sobrevivan y pasen a la siguiente generacin.

Mecanismos para la Seleccin de Padres:

Elitismo: se toman los organismos con los valores ms altos de adaptacin.

De Estado Estable: desecha los menos adaptados.

Seleccin de la Ruleta: se debe pensar en una ruleta, cada organismo tendr un segmento de la ruleta, su tamao depender de su adaptacin. La ruleta gira y al detenerse sealar un organismo.

Seleccin de torneo: se eligen dos integrantes de la poblacin, se los compara y se determina un ganador, que regresa a la poblacin de la que puede ser elegido nuevamente. El perdedor pasa a una pila. Se repite hasta que no haya ms individuos en la poblacin y se elige al que est en el tope de la pila como el ganador del torneo.

Seleccin Escalada: al incrementarse la aptitud media de la poblacin, la fuerza de la presin selectiva tambin aumenta y la funcin de aptitud se hace ms discriminadora.

Seleccin por Rango: a cada individuo de la poblacin se le asigna un rango numrico basado en su aptitud, y la seleccin se basa en este ranking, en lugar de las diferencias absolutas en aptitud.

Operadores Genticos: Para efectuar los cambios pertinentes en la poblacin, se emplean los Operadores Genticos:

Reproduccin: Se trata de simular la reproduccin de dos individuos de la poblacin, obteniendo como resultado un nuevo individuo intermedio entre sus dos progenitores.

Cruce: Se trata de generar un nuevo individuo como resultado del cruce de dos individuos originales, dividiendo en un cierto punto el cdigo gentico de stos y siendo el nuevo individuo el resultado de concatenar la primera parte del cdigo gentico del primer original con la segunda parte del cdigo del segundo original.

Punto Sencillo (Cruce Bsico): se selecciona una posicin al azar en el cromosoma. Se toma el primer padre de los genes que van desde el inicio a la posicin y se colocan en el hijo, luego se toman los genes que van desde la posicin hasta el final del cromosoma del segundo padre y se colocan en el hijo, de esta forma el hijo tiene informacin gentica de ambos padres.

Dos Puntos: se seleccionan dos puntos al azar dentro del cromosoma. El padre 1 pone sus genes desde el inicio del cromosoma hasta la primera posicin y desde la segunda posicin hasta el fin del cromosoma el segundo padre coloca sus cromosomas entre las dos posiciones.

Mltiples Puntos (Cruce Multipunto): se selecciona al azar cual es el padre que aporta informacin gentica para un gen en particular.

Cruce Segmentado: existe una probabilidad de que un cromosoma sea un punto de cruce. Conforme se va formando la nueva cadena, para cada gen, se verifica si ah se va a producir el cruce.

Cruce Uniforme: para cada gen de la cadena del descendiente existe una probabilidad de que el gen pertenezca al padre, y la otra de que pertenezca a la madre. Esta tcnica permite un intercambio de los bloques en una manera que es independiente del orden que la codificacin impuso a cada uno dentro del cromosoma.

Mutacin: Se trata de producir una leve modificacin en el cdigo gentico de un individuo, con vistas a diversificar la poblacin, y a la salida de un eventual estado estable en el cul la similitud de todos los individuos corten en gran medida la evolucin hacia individuos con mayor funcin objetivo. Se recomienda un porcentaje del 2%.

De un Punto: se muta un solo gen por vez. Multipunto: se mutan varios genes a la vez. Global: mutan todos los genes del individuo.

Reemplazo: la reinsercin de hijos consiste en incorporar los nuevos cromosomas en la poblacin. Los mtodos de reemplazo son:

Se generan tantos cromosomas como elementos en la poblacin: (reinsercin pura) consiste en generar mediante la reproduccin tantos hijos como elementos existen en la poblacin, reemplazar todos los cromosomas de la generacin anterior por los nuevos. Cada cromosoma vive exactamente una generacin. Un inconveniente es que se puede reemplazar buenas soluciones por soluciones de menor calidad.

Se generan ms cromosomas que elementos en la poblacin: se eligen los mejores cromosomas entre los generados, y se eliminan los cromosomas sobrantes. Luego se reemplaza la poblacin completa por la nueva generacin.

6

Se generan menos cromosomas que elementos en la poblacin: selecciona entre los cromosomas de la poblacin aquellos que se eliminaran.

Insercin Uniforme: los cromosomas a ser reemplazados se eligen al azar entre los miembros de la poblacin.

Insercin Elitista: se eligen los cromosomas menos aptos para ser reemplazados. Insercin por Torneo: se utiliza en combinacin con el mtodo de seleccin por

torneo.

Asociadas a los operadores genticos de cruce y mutacin existen:

La probabilidad de cruce: Pc. La probabilidad de mutacin: Pm (2%)

La primera es la probabilidad de aplicar el operador de cruce sobre parejas de cadenas de "ADN" obtenidas en la reproduccin; la segunda es la probabilidad de aplicar el operador de mutacin sobre los caracteres de la cadena.

Seudocdigo de un Algoritmo Gentico

Procedimiento Algoritmo Gentico

Inicializar poblacin P(0)

Evaluar poblacin inicial

Mientras no se cumpla la condicin de parada, para cada generacin t, hacer:

Seleccionar la poblacin P(t) desde P(t-1)

Recombinar P(t)

Evaluar P(t)

Fin Mientras

Fin Procedimiento

Criterios de Terminacin del Algoritmo: es el encargado de definir el momento en el cual debe detenerse el ciclo de evolucin y adoptar el cromosoma ms apto como la solucin encontrada.

Criterio de Convergencia de Identidad: consiste en detener al algoritmo gentico cuando un determinado porcentaje de los cromosomas representan a la misma solucin.

Criterio de Convergencia de Aptitud: puede suceder que existan soluciones equivalentes o cuasi equivalentes a un problema, que obtenga valores de aptitud similares. Este criterio finaliza la ejecucin cuando los valores de aptitud de un determinado porcentaje de las soluciones son iguales, o difieren en u pequeo porcentaje.

Criterio de Cantidad de Generaciones: consiste en finalizar la ejecucin una vez que ha transcurrido un nmero determinado de generaciones. Este mtodo permite determinar con precisin los tiempos de ejecucin del algoritmo a costa de detener la evolucin sin la certeza de que las soluciones no seguirn mejorando.

5) Redes Neuronales Las redes neuronales son una forma de emular ciertas caractersticas propias de los humanos, como la capacidad de memorizar y de asociar hechos.

Es un modelo artificial y simplificado del cerebro humano, sistema que es capaz de adquirir conocimiento a travs de la experiencia. Una red neuronal es un nuevo sistema para el tratamiento de la informacin, cuya unidad bsica de procesamiento est inspirada en la clula fundamental del sistema nervioso humano: la neurona. Mas definiciones de red neuronal: 1) Una nueva forma de computacin, inspirada en modelos biolgicos. 2) Un modelo matemtico compuesto por un gran nmero de elementos procesales organizados en niveles. 3) Un sistema de computacin compuesto por un gran nmero de elementos simples, elementos de procesos muy interconectados, los cuales procesan informacin por medio de su estado dinmico como respuesta a entradas externas. 4) Redes neuronales artificiales son redes interconectadas masivamente en paralelo de elementos simples (usualmente adaptativos) y con organizacin jerrquica, las cuales intentan interactuar con los objetos del mundo real del mismo modo que lo hace el sistema nervioso biolgico. Aprendizaje significa que aquellos problemas que inicialmente no pueden resolverse, pueden ser resueltos despus de obtener ms informacin acerca del problema. Por lo tanto, las Redes Neuronales:

Consisten de unidades de procesamiento que intercambian datos o informacin. Se utilizan para reconocer patrones, incluyendo imgenes, manuscritos y secuencias de tiempo,

tendencias financieras. Tienen capacidad de aprender y mejorar su funcionamiento.

Las RNA presentan un gran nmero de caractersticas semejantes a las del cerebro. Por ejemplo, son capaces de aprender de la experiencia, de generalizar de casos anteriores a nuevos casos, de abstraer caractersticas esenciales a partir de entradas que representan informacin irrelevante, etc. Esto hace que ofrezcan numerosas ventajas:

Aprendizaje Adaptativo: capacidad de aprender a realizar tareas basadas en un entrenamiento o en una experiencia inicial.

Auto-organizacin: una red neuronal puede crear su propia organizacin o representacin de la informacin que recibe mediante una etapa de aprendizaje.

Tolerancia a fallos: la destruccin parcial de una red conduce a una degradacin de su estructura; sin embargo, algunas capacidades de la red se pueden retener, incluso sufriendo un gran dao.

Operacin en tiempo real: los cmputos neuronales pueden ser realizados en paralelo; para esto se disean y fabrican mquinas con hardware especial para obtener esta capacidad.

Fcil insercin dentro de la tecnologa existente: se pueden obtener chips especializados para redes neuronales que mejoran su capacidad en ciertas tareas. Ello facilitar la integracin modular en los sistemas existentes.

El conocimiento es adquirido por la red a travs de un proceso que se denomina aprendizaje. El conocimiento se almacena mediante la modificacin de la fuerza o peso sinptico de las distintas uniones entre neuronas.(la informacin se guarda en los pesos) Estructura histolgica Las dendritas (entradas), son la va de entrada de las seales que se combinan en el cuerpo de la neurona. De alguna manera la neurona elabora una seal de salida a partir de ellas. El axn (salidas), es el camino de salida de la seal generada por la neurona. Una neurona enva su salida a otras por su axn. Las sinapsis (pesos), conexin entre una neurona y otra (Interaccin). En las terminaciones de las sinapsis se encuentran unas vescula que contienen unas sustancias qumicas llamadas neurotransmisores, que ayudan a la propagacin de las seales electroqumicas de una neurona a otra.

7

Lo que bsicamente ocurre en una neurona biolgica es lo siguiente: la neurona es estimulada o excitada a travs de sus entradas (inputs) y cuando se alcanza un cierto umbral, la neurona se dispara o activa, pasando una seal hacia el axn. La neurona recoge las seales por su sinapsis sumando todas las influencias excitadoras e inhibidoras. Si las influencias excitadoras positivas dominan, entonces la neurona da una seal positiva y manda este mensaje a otras neuronas por sus sinapsis de salida.

En una red neuronal cada neurona recibe una serie de entradas a travs de interconexiones y emite una salida. Esta salida viene dada por tres funciones:

1. Una funcin de propagacin (tambin funcin de red) tambin conocida como funcin de excitacin que por lo general consiste en el sumatorio de cada entrada multiplicada por el peso de su interconexin o sinapsis. Si el peso es positivo, la conexin se denomina excitatoria; si es negativo, se denomina inhibitoria.

2. Una funcin de activacin, que modifica a la anterior y es el valor que la neurona recibe para activarse. Puede no existir, siendo en este caso la salida la misma funcin de propagacin.

3. Una funcin de transferencia, que se aplica al valor devuelto por la funcin de activacin. Se utiliza para acotar la salida de la neurona y generalmente viene dada por la interpretacin que queramos darle a dichas salidas. Algunas de las ms utilizadas son la funcin sigmoidea (para obtener valores en el intervalo [0,1]) y la tangente hiperblica (para obtener valores en el intervalo [-1,1]). Existen cuatro funciones de transferencia tpicas que determinan distintos tipos de neuronas:

o Funcin escaln o Funcin lineal y mixta o Sigmoidal o Funcin gaussiana

Clasificacin de las redes neuronales

Clasificacin segn su topologa o arquitectura de la red, podemos distinguir como caracterstica de una red, el nmero de capas (monocapa o multicapa), el tipo de las capas, (ocultas o visibles, de entrada o de salida) y la direccionalidad de las conexiones de las neuronas.

Clasificacin segn su algoritmo de aprendizaje, como la red aprende los patrones, (supervisada, no supervisada, competitiva o por refuerzo).

Tipos de capas

Capa de entrada: las neuronas reciben estmulos externos relacionados con el aparato sensorial, que tomarn la informacin de entrada.

Capa oculta: Dicha informacin se transmite a ciertos elementos internos que se ocupan de su procesamiento. Es en las sinapsis y neuronas correspondientes a esta capa donde se genera cualquier tipo de representacin interna de informacin. Como no tienen relacin directa con la informacin de entrada ni con la salida, estos elementos se denominan unidades ocultas.

Capa de salida: Una vez finalizado el perodo de procesado, la informacin llega a las unidades de salida, cuya misin es dar la respuesta al sistema.

Capa: conjunto de neuronas cuyas entradas provienen de la misma fuente, y cuyas salidas se dirigen a un mismo destino. Los datos ingresan por medio de la capa de entrada, pasan a travs de la capa oculta y salen por la capa de salida. Cabe mencionar que la capa oculta puede estar constituida por varias capas. Formas de Conexin entre neuronas Los tipos de conexiones entre neuronas que consideraremos pueden clasificarse en:

o Conexiones feedforward (propagacin hacia adelante): conectan neuronas de una capa con neuronas de capas ms alejadas de la capa de entrada.

o Conexiones feedback(propagacin hacia atras): inversas a las definidas previamente. o Conexiones laterales: conectan neuronas de una misma capa. o Conexiones autoenlazadas: conectan una neurona consigo mismo.

Caractersticas de las Redes Neuronales Existen cuatro elementos que caracterizan una red neuronal: su topologa, el mecanismo de aprendizaje, tipo de asociacin realizada ente la informacin de entrada y salida y la forma de representacin de estas informaciones. En trminos topolgicos podemos clasificar las redes entre: redes de una sola capa y las redes con mltiples capas.

8

RN monocapa y multicapa En trminos topolgicos podemos clasificar las redes entre: redes de una sola capa y las redes con mltiples capas.

a) Monocapa: En las redes monocapa se establecen conexiones laterales entre las neuronas que pertenecen a la nica capa de la red. Adems pueden existir conexiones auto recurrente. Las redes monocapa se utilizan tpicamente en tareas relacionadas con lo que se conoce como auto asociacin, por ejemplo para regenerar informaciones de entrada que se presentan distorsionadas o incompletas.

b) Multicapas: Son aquellas que disponen las neuronas agrupadas en varias capas. Una las forma para distinguir la capa a la que pertenece una neurona, consistira en fijarse en el origen de las seales que recibe a la entrada y el destino de la seal de salida.

Mecanismo de aprendizaje (supervisado y no supervisado) Redes con aprendizaje supervisado El proceso de aprendizaje se realiza mediante un entrenamiento controlado por un agente externo (supervisor o maestro) que determina la respuesta que debera generar la red a partir de una entrada determinada. El supervisor comprueba la salida de la red y en caso de que sta no coincida con la deseada, se proceder a modificar los pesos de las conexiones, con el fin de que la salida obtenida se aproxime a la deseada. Se suelen considerar tres formas de llevar a cabo el aprendizaje:

a) Aprendizaje por correccin de error b) Aprendizaje por refuerzo c) Aprendizaje estocstico.

a) Aprendizaje por correccin de error Consiste en ajustar los pesos de las conexiones de la red en funcin de la diferencia entre los valores deseados y los obtenidos en la salida de la red; es decir, en funcin del error cometido en la salida. Una regla o algoritmo simple podra ser el siguiente:

b) Aprendizaje por refuerzo Es un aprendizaje ms lento que el anterior, que se basa en la idea de no disponer de un ejemplo completo del comportamiento deseado; es decir, de no indicar durante el entrenamiento exactamente la salida que se desea que proporcione la red ante una determinada entrada. En el aprendizaje por refuerzo la funcin del supervisor se reduce a indicar mediante una seal de refuerzo si la salida obtenida en la red se ajusta a la deseada (xito = +1 o fracaso = -1), y en funcin de ello se ajustan los pesos basndose en un mecanismo de probabilidades. c) Aprendizaje estocstico Este tipo de aprendizaje consiste bsicamente en realizar cambios aleatorios en los valores de los pesos de las conexiones de la red y evaluar su efecto a partir del objetivo deseado y de distribuciones de probabilidad.

Redes con aprendizaje no supervisado Las redes con dicho aprendizaje no requieren de influencia externa para ajustar los pesos de las conexiones entre sus neuronas. La red no recibe ninguna informacin por parte del entorno que le indique si la salida generada en respuesta de una entrada es o no correcta. Suele decirse que estas redes son capaces de auto organizarse. Suelen considerarse dos algoritmos de aprendizaje no supervisado:

a) Aprendizaje hebbiano b) Aprendizaje competitivo y cooperativo: las neuronas compiten (y cooperan) unas con otras con el fin de

llevar a cabo una tarea dada. Redes Neuronales de Kohonen Modelo de red neuronal con capacidad para formar mapas de caractersticas de manera similar a como ocurre en el cerebro. Este modelo tiene dos variantes, denominadas LVQ (Learning Vector Quantization) y TPM (Topology-Preserving Map) o SOM (Self-Organizating Map). Ambas se basan en el principio de formacin de mapas topolgicos para establecer caractersticas comunes entre las informaciones (vectores) de entrada a la red, aunque difieren en las dimensiones de stos, siendo de una sola dimensin en el caso de LVQ, y bidimensional, e incluso tridimensional, en la red TPM. Caractersticas Pertenece a la categora de las redes competitivas o mapas de auto-organizacin (SOM), es decir, con aprendizaje no supervisado de tipo competitivo, funciones de activacin lineales y flujo de informacin unidireccional (son redes en cascada). No existe ningn maestro externo que indique si la red neuronal est operando correcta o incorrectamente. Arquitectura Poseen una arquitectura de dos capas (una de entrada, una de salida) y una sola capa de conexiones.

En la versin LVQ no existen conexiones hacia atrs. Existen N neuronas de entrada y M neuronas de salida. Cada una de las N neuronas de entradas se conecta hacia las M neuronas de salidas a travs de conexiones hacia adelante (feedfoward). Entre las neuronas de la capa de salida, puede decirse que existen conexiones laterales de inhibicin (peso negativo) implcitas, pues aunque no estn conectadas, cada una de las neuronas va a tener cierta influencia sobre sus vecinas. El valor que se asigne a los pesos de las conexiones hacia adelante entre las capas de entrada y salida (Wji) durante el proceso de aprendizaje de la red va a depender precisamente de esta interaccin lateral. La influencia que una neurona ejerce sobre las dems es funcin de la distancia entre ellas, siendo muy pequeas cuando estn muy alejadas. Por otra parte, la versin del modelo denominado TPM (Topology Preserving Map) trata de establecer una correspondencia entre los datos de entrada y un espacio bidimensional de salida, creando mapas topolgicos de dos dimensiones, de tal forma que ante datos de entrada con caractersticas comunes se deben activar neuronas situadas en prximas zonas de la capa de salida.

9

Aprendizaje El aprendizaje en el modelo de Kohonen es de tipo Off-line, por lo que se distingue una etapa de aprendizaje y otra de funcionamiento. En la etapa de aprendizaje se fijan los valores de las conexiones (feedforward) entre la capa de entrada y la salida. Esta red utiliza un aprendizaje no supervisado de tipo competitivo, las neuronas de la capa de salida compiten por activarse y slo una de ellas permanece activa ante una determinada informacin de entrada a la red, los pesos de las conexiones se ajustan en funcin de la neurona que haya resultado vencedora. Durante la etapa de entrenamiento, se presenta a la red un conjunto de informaciones de entrada (vectores de entrenamiento) para que sta establezca en funcin de la semejanza entre los datos las diferentes categoras (una por neurona de salida), que serviran durante la fase de funcionamiento para realizar clasificaciones de nuevos datos que se presenten a la red. Los valores finales de los pesos de las conexiones entre cada neurona de la capa de salida con las de entrada se correspondern con los valores de los componentes del vector de aprendizaje que consigue activar la neurona correspondiente. En el caso de existir ms patrones de entrenamiento que neuronas de salida, ms de uno deber asociarse con la misma neurona, es decir pertenecern a la misma clase. En este modelo el aprendizaje no concluye despus de presentarle una vez todos los patrones de entrada, sino que habr que repetir el proceso varas veces para refinar el mapa topolgico de salida, de tal forma que cuantas ms veces se presenten los datos, tanto ms se reducirn las zonas de neuronas que se deben activar ante entradas parecidas, consiguiendo que la red pueda realizar una clasificacin mas selectiva. Un concepto muy importante en la red de Kohonen es la zona de vecindad, o vecindario alrededor de la neurona vencedorai*, los pesos de las neuronas que se encuentren en esta zona a la que se le dar el nombre de X(q), sern actualizados junto con el peso de la neurona ganadora, en un ejemplo de aprendizaje cooperativo. El algoritmo de aprendizaje utilizado para establecer los valores de los pesos de las conexiones entre las N neuronas de entrada y las M de salida es el siguiente:

1. En primer lugar se inicializan los pesos (wij) con valores aleatorios pequeos y se fija la zona inicial de vecindad entre las neuronas de salida.

2. A continuacin se presenta a la red una informacin de entrada (la que debe aprender) en forma de vector p = (p1, p2, ..., pn), cuyas componentes pisern valores continuos.

3. Puesto que se trata de un aprendizaje competitivo, se determina la neurona vencedora de la capa de salida, esta ser aquella cuyo vector de pesos wi(vector cuyas componentes son los valores de los pesos de las conexiones entre esa neurona y cada una de las neuronas de la capa de entrada) sea el ms parecido a la informacin de entrada p(patrn o vector de entrada). Para ello se calculan las distancias o diferencias entre ambos vectores, considerando una por una todas las neuronas de salida, suele utilizarse la distancia eucldea o la siguiente expresin que es similar a aquella, pero eliminando la raz cuadrada:

pj: Componente i-simo del vector de entrada wij: Peso de la conexin entre la neurona j de la capa de entrada y la neurona i de la capa de salida.

4. Una vez localizada la neurona vencedora (i*), se actualizan los pesos de las conexiones entre las neuronas de entrada y dicha neurona, as como los de las conexiones entre las de entrada y las neuronas vecinas de la vencedora, en realidad lo que se consigue con esto es asociar la informacin de entrada con una cierta zona de la capa de salida. Esto se realiza mediante la siguiente ecuacin

El tamao deX(q)se puede reducir en cada iteracin del proceso de ajuste de los pesos, con lo que el conjunto de neuronas que pueden considerarse vecinas cada vez es menor como se observa en la figura 2.5.2, sin embargo en la prctica es habitual considerar una zona fija en todo el proceso de entrenamiento de la red. El trmino a(q)es el coeficiente de aprendizaje o parmetro de ganancia, con un valor entre 0 y 1 el cual decrece con el nmero de iteraciones(q) del proceso de entrenamiento, de tal forma que cuando se ha presentado un gran nmero de veces todo el juego de patrones de aprendizaje su valor es prcticamente nulo, con lo que la modificacin de los pesos es insignificante.

Para hallar suele utilizarse una de las siguientes expresiones [20]:

Siendo a1 un valor de 0.1 0.2 y a2 un valor prximo al nmero total de iteraciones del aprendizaje, que por lo general se toma como 10000 para esta red.

5. El proceso debe repetirse, volviendo a presentar todo el juego de patrones de aprendizaje p1, p2..,pn hasta obtener la salida deseada.

REDES BACKPROPAGATION

El mtodo de back-propagation (o entrenamiento hacia atrs) es un sistema automtico de entrenamiento de redes neuronales con capas ocultas.

En una red Backpropagation existe una capa de entrada con n neuronas y una capa de salida con m neuronas y al menos una capa oculta de neuronas internas. Cada neurona de una capa (excepto las de entrada) recibe entradas de todas las neuronas de la capa anterior y enva su salida a todas las neuronas de la capa posterior (excepto las de salida). No hay conexiones hacia atrs feedback ni laterales entre las neuronas de la misma capa.

Consiste en un aprendizaje de un conjunto predefinido de pares de entradas-salidas dado como ejemplo, empleando un ciclo de propagacin-adaptacin de dos fases.

Fases

Primero (hacia adelante): se aplica un patrn de entrada como estmulo para la primera capa de las neuronas de la red, se va propagando a travs de todas las capas superiores hasta generar una salida. Despus se compara el resultado obteniendo en las neuronas de salida que se desea obtener y se calcula un valor del error para cada neurona de salida.

Segundo (hacia atrs): estos errores se transmiten hacia atrs, partiendo de la capa de salida, hacia todas las neuronas de la capa intermedia que contribuyan directamente a la salida, recibiendo el porcentaje de error aproximado a la particin de la neurona intermedia en la salida original. Se pasa a la capa anterior con una retropopagacin del error, ajustando los pesos y continuando con este proceso hasta llegar a la primera capa.

Importancia

10

La importancia de este algoritmo consiste en su capacidad de auto adaptar los pesos de las neuronas de las capas intermedias para aprender la relacin que existe entre un conjunto de patrones dados como ejemplo y sus salidas correspondientes.

Generalizacin

Ya entrenada la red se podr aplicar esa misma relacin (terminado el entrenamiento), a nuevos vectores de entrada con ruido o incompletos, dando una salida activa si la nueva entrada es parecida a las presentadas durante el aprendizaje.

Regla Delta de Generalizada

Se usa en redes con capas intermedias con conexiones hacia adelante y cuyas clulas tienen funciones de activacin continuas. Estas funciones continuas son no decrecientes y derivables (la funcin sigmoidal pertenece a este tipo de funciones).

Superficie de Error

El algoritmo utiliza una superficie de error asociada a la red, buscando el estado de mnimo error a travs del camino descendiente de la superficie del error.

Estructura y Aprendizaje 1) capa de entrada con n neuronas. 2) Capa de salida con m neuronas. 3) Al menos una capa oculta de neuronas.

Cada neurona de una capa recibe entradas de todas las neuronas de la capa anterior y enva su salida a todas las neuronas de la capa posterior. No hay conexiones hacia atrs ni laterales entre neuronas de la misma capa. Control de Convergencia

La velocidad de aprendizaje se controla mediante . Normalmente, debe ser un nmero entre 0.05 y 0.25.

Velocidad de Convergencia

El valor de se aumenta a medida que disminuye el error.

Aadir un momento (sumar una fraccin del ajuste de peso anterior al ajuste actual). Si una red deja de aprender:

Realizar un cambio en el nmero de neuronas ocultas.

Volver a empezar con un conjunto distinto de pesos. El algoritmo en general funciona de esta manera:

En este tipo de redes, el problema a la hora de entrenarlas estriba en que slo conocemos la salida de la red y la entrada, de forma que no se pueden ajustar los pesos sinpticos asociados a las neuronas de las capas ocultas, ya que no podemos inferir a partir del estado de la capa de salida como tiene que ser el estado de las capas ocultas.

El sistema de entrenamiento mediante back-propagation consiste en:

Empezar con unos pesos sinpticos cualquiera (generalmente elegidos al azar).

Introducir unos datos de entrada (en la capa de entradas) elegidos al azar entre los datos de entrada que se van a usar para el entrenamiento.

Dejar que la red genere un vector de datos de salida (propagacin hacia delante).

Comparar la salida generada por la red con la salida deseada.

La diferencia obtenida entre la salida generada y la deseada (denominada error) se usa para ajustar los pesos sinpticos de las neuronas de la capa de salidas.

El error se propaga hacia atrs (back-propagation), hacia la capa de neuronas anterior, y se usa para ajustar los pesos sinpticos en esta capa.

Se continua propagando el error hacia atrs y ajustando los pesos hasta que se alcance la capa de entradas.

Este proceso se repetir con los diferentes datos de entrenamiento.

Es difcil encontrar el mejor conjunto de pesos sinpticos para la red de manera que la eficiencia sea mxima.

Esto se debe a que la funcin que mide la eficiencia de las redes con capas ocultas, en la mayora de los casos, es una funcin compleja que presenta muchos mnimos locales. Y el mejor conjunto de pesos sinpticos es aquel que hace que la funcin alcance un mnimo global.

Visto en Clases: (cada neurona de una capa se conecta con todas las neuronas de la capa siguiente conexin feedforward)

11

La informacin queda guardada en los pesos ; en la etapa inicial se los elige aleatoriamente entre 0

12

Caracterticas de los Sistemas Expertos segn Bruce G. Buchaman y Edgard H. Shortlife

Utilidad

Usabilidad

Educatividad

Responsivos

Explicativo

Aprendizaje

Fcil de Modificar

Inferencia: Es la capacidad del sistema para deducir por si solo y obtener el valor de una variable sin haber preguntado explcitamente al usuario. Es el proceso por el cual el sistema experto reconoce qu regla aplicar. Metodologas de Inferencia

Se conoce el objetivo, y se deben seleccionar las reglas que, al dispararse, lleven a l.

Pasos para Crear un Sistema Experto

El orden es importante, pero tal vez se deba regresar a etapas anteriores si se descubren fallas en algn paso.

Diapositivas de clases

Los procesos mentales humanos son internos y muy complejos para representarse mediante algoritmos. A pesar de ello, la mayora de los expertos son capaces de expresar sus conocimientos en la forma de reglas de tipo IF-THEN

IF La luz de trfico est en verde THEN la accin es cruzar IF La luz de trfico est en rojo THEN la accin es detenerse

El trmino regla en AI, el tipo de representacin mas utilizada para representar el conocimiento, puede definirse como una estructura de tipo IF-THEN que relaciona informacin o hechos conocidos en su parte IF con acciones en la parte THEN. Un conjunto de reglas provee descripcin acerca de cmo solucionar un problema. Las reglas son relativamente simples de crear y comprender.

Toda regla est conformada por dos partes: la parte IF denominada antecedente o condicin y la parte THEN nombrada como consecuente, conclusin o accin.

Una regla puede tener antecedentes mltiples unidos por nexos lgicos tales como AND (conjuncin) o OR (disyuncin) o combinaciones de ambas. IF THEN IF a AND b AND z THEN IF a OR b OR z THEN

El antecedente de una regla incorpora dos partes: un objeto (objeto lingstico) y su valor. El objeto y su valor esta relacionado mediante un operador. Este operador identifica al objeto y le asigna un valor. Los operadores tpicos IS, ARE, IS NOT, ARE NOT se utilizan para asignar valores simblicos a un objeto lingstico.

Los Sistemas Expertos tambin pueden utilizar operadores matemticos para definir un objeto como numrico y asignar un valor tambin numrico.

13

IF edad del consumidor < 18 AND retiro de dinero > 1000 THEN se requiere la firma de uno de los padres Las reglas pueden representar relaciones, recomendaciones, directivas, estrategias y heursticas: Relacin

IF el tanque de combustible est vaco THEN el auto no funciona

Recomendacin

IF estamos en otoo AND el cielo est nublado AND el pronstico es lloviznas THEN el consejo es llevar paraguas

Directiva

IF el auto no anda AND el tanque de combustible est vaco THEN la accin es cargar combustible

Estrategia

IF el auto no anda THEN la accin es revisar el nivel de combustible; PASO 1: cumplido IF PASO 1 cumplido AND hay combustible en el tanque THEN la accin es comprobar la batera; PASO 2: cumplido

Heuristica IF el derrame es lquido AND el derrame tiene un PH < 6 AND el derrame huele a vinagre THEN el derrame es cido actico Integrantes principales en un equipo de desarrollo

Existen cinco miembros en un equipo de desarrollo de un sistema experto: el experto en el dominio, el ingeniero de conocimiento, el programador, el gerente del proyecto y el usuario final.

El xito del sistema experto desarrollado depende completamente en la coordinacin de esfuerzos y del tiempo dedicado.

El experto en el dominio es una persona con los conocimientos y la experiencia suficiente para permitirle resolver problemas en un rea especfica. Esta experiencia debe capturarse en el Sistema Experto a desarrollar. Entonces este experto debe tener la habilidad de comunicar su conocimiento, estar dispuesto a participar en el desarrollo del proyecto del Sistema Experto y entregar una cantidad sustancial de tiempo al mismo. El experto en el dominio es la persona mas importante en el equipo de desarrollo del proyecto.

El Ingeniero de Conocimiento (Knowledge Engineer) es una persona capacitada para disear construir y

comprobar un Sistema Experto. Se encarga de entrevistar al experto en el dominio para delimitar el problema a resolver. El Ingeniero de Conocimiento establece los mtodos de razonamiento que el experto utiliza para resolver un problema, usando hechos y reglas y decidiendo como representarlos en un sistema experto. Despus es su tarea elegir un software apropiado para el desarrollo o un shell de sistema experto o un lenguaje de programacin apropiado para codificar el conocimiento. Finalmente, es responsable de las comprobaciones, revisiones y la integracin del sistema experto a un sistema productivo.

El programador es la persona responsable de la codificacin eficiente que describa el dominio de

conocimiento en trminos computacionales. Debe tener experiencia en programacin simblica en lenguajes propios de la AI como LISP, Prolog o OPS5 y tambin conocimientos suficientes en la aplicacin de cascaras de Sistemas Expertos (quizs CLIPS). En adicin, el programador debe tener conocimientos de programacin convencional en lenguajes como Java, C, C++ o Basic.

El gerente del proyecto (project manager) es el lder del Grupo de Desarrollo del Sistema Experto.

Responsable de hacer funcionar todo. Debe preocuparse del cumplimiento de metas, interactuar con el experto y dems participantes del grupo de desarrollo, poniendo especial cuidado con el usuario final.

El usuario final (end-user) , o usuario,, es la persona que utilizar el Sistema Experto desarrollado, no solo debe confiar en su capacidad de resolver problemas, sino que debe sentirse confortable en su uso. Resulta as que el diseo de una interfase amigable y sencilla de aprender sea vital para el xito del proyecto: la contribucin del usuario es crucial en este punto.

A comienzos de los 70, Newell y Simon de la Carnegie-Mellon University propusieron un modelo para sistemas de produccin, cimentando los Sistemas Expertos modernos basados en reglas. Este modelo est basado en la idea que los humanos resuelven sus problemas aplicando sus conocimientos (expresados como reglas de produccin) sobre un determinado problema representado por informacin especfica del problema. Las reglas de produccin estn almacenadas en una memoria de largo-plazo y la informacin especfica del problema o hechos yacen en la memoria de corto- plazo.

La Base de Conocimientos (Knowledge Base: KB) contiene el conocimiento til del dominio para resolver

problemas. En un Sistema Experto Basado en Reglas, el conocimiento se representa mediante reglas. Cada regla especifica una relacin, recomendacin, directiva, estrategia o heurstica. Compuesta por dos estructuras: IF (condicin) y THEN (accin). Cuando se satisface la , decimos que la regla se dispara y se ejecuta la La Base de Datos (Data Base: DB) incluye un conjunto de hechos utilizados en la parte de de la KB.

El Motor de Inferencia (Inference Engine) se encarga del razonamiento mediante el que el experto alcanza una solucin. Realiza el enlace de las reglas en la KB con los hechos provistos por la DB.

Expert System

End-user

Knowledge Engineer ProgrammerDomain Expert

Project Manager

Expert SystemDevelopment Team

Conclusion

REASONING

Long-term Memory

ProductionRule

Short-term Memory

Fact

14

Las facilidades de explicacin (explanation facilities) permiten al usuario que realice preguntas al Sistema Experto en cuanto a como lleg a una conclusin determinada y por qu es necesario un determinado hecho. Un Sistema Experto debe ser capaz de explicar sus decisiones y justificar sus aconsejamiento, anlisis o conclusiones. La interfase de usuario (user interface) es el medio mediante el cual se comunica un usuario en procura de una solucin para un problema con el Sistema Experto.

Un Sistema Experto (Expert System: ES) se construye para que se comporte a nivel humano experto en un dominio estrecho, especializado. De modo que la caracterstica mas importante de un ES yace en su performance de alta calidad. No importando cuan rpido el sistema puede resolver un problema, el usuario no estar conforme frente a resultados errneos. Por otra parte, la velocidad de alcanzar una solucin es muy importante. Aun la mas ajustada y correcta de las decisiones o diagnostico pueden no resultar utilizables si las obtenemos demasiado tarde para aplicarlas, por ejemplo, en una emergencia con la posibilidad de muerte de una persona o explosin de una Planta Nuclear.

Los ES aplican heursticas para guiar sus razonamientos, reduciendo el rea de bsqueda en procura de

una solucin. Una caracterstica nica de los ES es su capacidad para explicar su comportamiento. Esto permite que revean su propio razonamiento y expliquen sus decisiones. Los ES emplean razonamiento simblico cuando resuelven un problema. Se utilizan smbolos para representar diferentes tipos de conocimientos tales como hechos, conceptos y reglas.

En los ES, el conocimiento est separado de su procesamiento (la Base de Conocimientos y el Motor de

Inferencia son partes separadas). En un programa convencional encontramos una mezcla de conocimiento y estructura de control que procesa este conocimiento. Esta mezcla lleva a dificultades en la comprensin y revisin del cdigo del programa, ya que cualquier cambio en el cdigo afecta tanto al conocimiento como a su proceso.

Cuando se utiliza una cscara experta (expert shell), un Ingeniero de Conocimiento o un experto

simplemente ingresan reglas en la KB, adicionando con cada regla nuevo conocimiento, haciendo de esta manera al sistema experto mas inteligente.

En un sistema experto basado en reglas, el dominio de conocimiento est representado por un conjunto de reglas de produccin del tipo IF-THEN y los datos son representados por un conjunto de hechos acerca de la situacin actual. El motor de inferencia compara cada regla almacenada en la KB con hechos contenidos en la DB. Cuando se satisface el con los valores almacenados como hechos, entonces decimos que la regla se dispara, ejecutando la . Este proceso de disparo produce una cadena inferencial. Esta cadena indica como un sistema experto aplica las reglas para alcanzar una conclusin.

Encadenamiento hacia adelante (Forward chaining)

Un encadenamiento para adelante nos lleva a un razonamiento manejado por los datos. El razonamiento comienza a partir de los hechos conocidos y contina hacia adelante validando nuevos datos. Cada unidad de tiempo de proceso solo se ejecuta la regla en el tope de la lista. Cuando se dispara, la regla adiciona un nuevo dato en DB. Cada regla solo puede dispararse una sola vez, y el ciclo se detiene cuando ya no se puede disparar ninguna regla mas. El encadenamiento hacia adelante es una tcnica de recoleccin de informacin y luego inferir lo que pueda ser inferido. Sin embargo, en encadenamiento hacia adelante, pueden ejecutarse muchas reglas que no tienen nada que ver con la meta procurada. Entonces, si nuestra meta es inferir solo un hecho en particular, la tcnica de encadenamiento hacia adelante no resulta eficiente.

Encadenamiento hacia Atrs (Backward Chaining)

El encadenamiento hacia atrs es una tcnica de razonamiento manejada por meta. En ella, un ES tiene

una meta (una solucin hipottica) y el motor de inferencia trata de encontrar la evidencia necesaria para probarla. Lo primero es revisar la KB buscando reglas que puedan tener la solucin adecuada. Tales reglas deben tener la meta en su , y si encontramos alguna con esta condicin, buscamos si su parte de satisface la DB, caso en que la regla se dispara y la meta es comprobada.

En el caso general, el motor de inferencia separa la regla sobre la que est trabajando, colocndola en un esquema de stack. Esto crea sub-metas correspondiente a la evaluacin y satisfaccin de . Luego, la KB es revisada nuevamente para encontrar reglas que puedan satisfacer sub-metas. El motor de inferencia repite este proceso hasta que no encuentra reglas que puedan satisfacer la sub-meta actual. Como elegimos entre FC y BC

Si un experto necesita obtener informacin primero, y luego trata de inferir de ella lo que se pueda, la eleccin es encadenamiento hacia adelante para el motor de inferencia.

Mientras que si un experto comienza con una solucin hipottica y luego trata de encontrar hechos que la sustentes, la eleccin es encadenamiento hacia atrs para el motor de inferencia. Resolucin de Conflictos Tenemos dos reglas: Rule 2 y Rule 3, con el mismo . Entonces las dos pueden dispararse cuando se satisface el hecho luz roja, representando una situacin de conflicto. Es tarea del motor de inferencia determinar cual regla disparar a partir de este conjunto conflictivo. Un mtodo utilizado en elegir la regla a disparar en un ciclo se denomina resolucin de conflicto. En encadenamiento para adelante, AMBAS reglas se disparan. Rule 2 se dispara primero ya que est en el tope con respecto a Rule 3, y como resultado se ejecuta su parte THEN y el objeto lingstico accin obtiene el valor stop. No obstante, la Rule 3 tambin se dispara debido a que si equipara el hecho traffic light is red, que aun est en la DB. Como consecuencia, el objeto accin toma el nuevo valor go. Mtodos usados para resolucin de Conflictos

Disparar la regla con la mayor prioridad. En aplicaciones simples, la prioridad se establece colocando las reglas en un orden apropiado en la KB. Usualmente esto funciona bien para SE con no mas de 100 reglas.

Disparar la regla ms especfica. Este mtodo tambin se conoce como estrategia de mxima equiparacin, y est basada en la presuncin que una regla especfica procesa mas informacin que una general.

Disparar la regla que utiliza datos ingresados ms recientemente en la DB. Este mtodo se basa en las estampillas de tiempo (time tags) agregadas a cada hecho en la DB. A partir del conjunto conflictivo, el sistema experto dispara primero la regla cuyo antecedente usa el dato mas reciente en la DB.

Metaknowledge

El metaconocimiento puede definirse simplemente como conocimiento acerca del conocimiento. El metaconocimiento es conocimiento acerca del uso y control del dominio de conocimiento de un sistema experto.

En sistemas expertos basados en reglas, el metaconocimiento est representado por metareglas. Una metaregla determina la estrategia de la utilizacin de reglas para tareas especficas en el sistema experto.

Ventajas de los Sistemas Expertos basados en reglas

Representacin del conocimiento de forma natural. Usualmente un experto explica los procedimientos que utiliza para resolver problemas mediante expresiones del tipo en tales y tales circunstancias, hago

15

esto y esto. Estas expresiones se pueden representar de manera bastante natural como reglas de produccin de tipo IF-THEN.

Estructura uniforme. Las reglas de produccin tienen la estructura uniforme de tipo IF-THEN. Cada regla es una pieza de conocimiento independiente, y la sintaxis con las que se escriben les permite ser auto-documentadas.

Separacin del conocimiento de su procesamiento. La estructura de un sistema experto basado en reglas provee una separacin efectiva de la base de conocimientos y el motor de inferencia. Esto hace posible desarrollar diferentes aplicaciones utilizando la misma cascara de ES (expert system shell).

Permite tratar con conocimiento incompleto e incierto. La mayora de los sistemas expertos basados en reglas son capaces de representar y razonar con conocimiento incompleto e incierto.

Desventajas de los Sistemas Expertos basados en reglas

Relaciones opacas entre reglas. A pesar que las reglas de produccin individuales son relativamente simples y auto-documentadas, su interaccin lgica dentro del gran conjunto de reglas puede no ser tan sencillo de entender. Los sistemas basados en reglas hacen difcil observar como las reglas individualmente sirven a una estrategia global.

Estrategia de bsqueda ineficiente. El motor de inferencia aplica una bsqueda exhaustiva sobre todas las reglas de la KB cada ciclo, y si esta KB es de grandes dimensiones (miles de reglas) torna al proceso lento. Esta situacin puede ser determinante en sistemas de tiempo real.

Baja Capacidad para aprender. En general, los sistemas expertos basados en reglas no poseen ninguna capacidad para aprender a partir de su experiencia. A diferencia de los seres humanos, que sabe cuando saltarse las reglas, un sistema experto no puede modeficar de manera automtica su KB, o ajustar reglas existentes o adicionar reglas nuevas. El Ingeniero de Conocimiento es aun insustituible y responsable de revisar y mantener el sistema.

Ventajas de las redes neuronales

Debido a su constitucin y a sus fundamentos, las redes neuronales artificiales presentan un gran nmero de caractersticas semejantes a las del cerebro. Por ejemplo, son capaces de aprender de la experiencia, de generalizar de casos anteriores a nuevos casos, de abstraer caractersticas esenciales a partir de entradas que representan informacin irrelevante, etc.

Aprendizaje: la etapa de aprendizaje consiste en proporcionar a la Red Neuronal datos como entrada a su vez que se le indica cul es la salida (respuesta) esperada. Auto organizacin: Una Red Neuronal crea su propia representacin de la informacin en su interior, descargando al usuario de esto. Tolerancia a fallos: Debido a que una Red Neuronal almacena la informacin de forma redundante, sta puede seguir respondiendo de manera aceptable aun si se daa parcialmente. Flexibilidad: Una Red Neuronal puede manejar cambios no importantes en la informacin de entrada, como seales con ruido u otros cambios en la entrada (ej. si la informacin de entrada es la imagen de un objeto, la respuesta correspondiente no sufre cambios si la imagen cambia un poco su brillo o el objeto cambia ligeramente) Tiempo real: La estructura de una Red Neuronal es paralela, por lo cul se pueden obtener respuestas en tiempo real. Redes Neuronales

Consisten de unidades de procesamiento que intercambian datos o informacin, se utilizan para reconocer patrones, incluyendo imgenes, manuscritos y secuencias de tiempo, tendencias financieras. Tienen capacidad de aprender y mejorar su funcionamiento. Una primera clasificacin de los modelos de redes neuronales podra ser, atendiendo a su similitud con la realidad biolgica:

1) El modelo de tipo biolgico. Este comprende las redes que tratan de simular los sistemas neuronales biolgicos, as como las funciones auditivas o algunas funciones bsicas de la visin. 2) El modelo dirigido a aplicacin. Este modelo no tiene por qu guardar similitud con los sistemas biolgicos. Su arquitectura est fuertemente ligada a las necesidades de las aplicaciones para la que es diseada.

Definiciones de una red neuronal

Existen numerosas formas de definir a las redes neuronales; desde las definiciones cortas y genricas

hasta las que intentan explicar ms detalladamente qu son las redes neuronales. Por ejemplo:

Una nueva forma de computacin, inspirada en modelos biolgicos

Un modelo matemtico compuesto por un gran nmero de elementos procesales organizados en niveles

Un sistema de computacin compuesto por un gran nmero de elementos simples, elementos de procesos muy interconectados, los cuales procesan informacin por medio de su estado dinmico como respuesta a entradas externas

Redes neuronales artificiales son redes interconectadas masivamente en paralelo de elementos simples (usualmente adaptativos) y con organizacin jerrquica, las cuales intentan interactuar con los objetos del mundo real del mismo modo que lo hace el sistema nervioso biolgico

En cualquier sistema que se est modelando, es til caracterizar tres tipos de unidades: entradas, salidas y ocultas.

Las unidades de entrada reciben seales del entorno, stas pueden ser provenientes de censores o de otros

sectores del sistema. Las unidades de salida envan la seal fuera del sistema; stas pueden controlar directamente

potencias u otros sistemas. Las unidades ocultas son aquellas cuyas entradas y salidas se encuentran dentro del

sistema; es decir no tienen contacto con el exterior.

16

Se conoce como nivel o capa a un conjunto de neuronas cuyas entradas provienen de la misma fuente, y cuyas

salidas se dirigen a un mismo destino.

Estado de Activacin

Todas las neuronas que componen la red se hallan en cierto estado. Podemos decir que hay dos posibles estados,

reposo y excitado, a los que denominaremos estados de activacin y a cada uno de los cuales se le asigna un valor.

Los valores de activacin pueden ser continuos o discretos. Adems pueden ser limitados o ilimitados.

Funcin de salida o transferencia

Existen cuatro funciones de transferencia tpicas que determinan distintos tipos de neuronas:

Funcin escaln

Funcin lineal y mixta

Sigmoidal

Funcin gaussiana

La funcin escaln nicamente se utiliza cuando las salidas de la red son binarias. La salida de una neurona se activa

slo cuando el estado de activacin es mayor o igual a cierto valor umbral. La funcin lineal o identidad equivale a

no aplicar funcin de salida. Las funciones mixtas y sigmoidal son las ms apropiadas cuando queremos como salida

informacin analgica.

Regla de aprendizaje

Existen muchas definiciones del concepto aprendizaje, una de ellas podra ser: La modificacin del

comportamiento inducido por la interaccin con el entorno y como resultado de experiencias conducente al

establecimiento de nuevos modelos de respuesta a estmulos externos.

Niveles o capas de neuronas

La distribucin de neuronas dentro de la red se realiza formando niveles o capas de un nmero

determinado cada una. Se pueden distinguir tres tipos de capas:

De Entrada: es la capa que recibe directamente la informacin proveniente de las fuentes externas de la

red.

Ocultas: son internas a la red, no tiene contacto directo con el exterior. El nmero de niveles ocultos

puede ser de cero a un nmero elevado. Las neuronas de las capas ocultas pueden estar interconectadas de

distintas maneras, lo que determina junto a su nmero, las distintas topologas.

De Salida: transfieren informacin de la red hacia el exterior.

Se dice que una red es totalmente conectada si todas las salidas desde un nivel llegan a todos y cada uno de los

nodos del mismo nivel siguiente.

Formas de Conexin entre neuronas

La conectividad entre los nodos de una red neuronal est relacionada con la forma en que las salidas de las

neuronas estn canalizadas para convertirse en entradas de otras neuronas. La seal de salida de un nodo puede ser

una entrada de otro elemento de proceso, o incluso de s mismo (conexin auto-recurrente).

Cuando ninguna salida de las neuronas es entrada de neuronas del mismo nivel o de niveles precedentes, la red se

describe como propagacin hacia delante. Cuando las salidas pueden estar conectadas como entradas de neuronas

de niveles previos o del mismo nivel, incluyndose ellas mismas, la red es de propagacin hacia atrs. Las redes de

propagacin hacia atrs que tiene lazos cerrados son sistemas recurrentes.

Conexiones hacia delante.

17

b) Conexiones laterales.

c) Conexiones hacia atrs (o recurrentes).

Caractersticas de las Redes Neuronales

Existen cuatro elementos que caracterizan una red neuronal: su topologa, el mecanismo de aprendizaje, tipo de

asociacin realizada ente la informacin de entrada y salida y la forma de representacin de estas informaciones.

Topologa de las Redes Neuronales

Consiste en la organizacin de las neuronas en la red formando capas o agrupaciones de neuronas ms o menos

alejadas de la entrada y salida de la red. Los parmetros fundamentales de la red son: el nmero de capas, el

nmero de neuronas por capa, el grado de conectividad y el tipo de conexiones ente neuronas.

En trminos topolgicos podemos clasificar las redes entre: redes de una sola capa y las redes con mltiples capas.

Redes con conexiones hacia adelante y hacia atrs (feedforward/feedback)

En ste tipo de redes circula informacin tanto hacia delante como hacia atrs durante el funcionamiento de la red.

Para que eso sea posible existen conexiones feedforward y feedback entre las neuronas.

En general, suelen ser bicapas, existiendo por lo tanto dos conjuntos de pesos: los correspondientes a las

conexiones feedforward de la primera capa ( capa de entrada) hacia la segunda (capa de salida) y los de las

conexiones feedback de la segunda a la primera. Los valores de los pesos de estos tipos de conexiones no tienen

porqu coincidir, siendo diferentes en la mayor parte de los casos.

Se suelen considerar dos tipos de reglas de aprendizaje:

aprendizaje supervisado

aprendizaje no supervisado. La diferencia fundamental entre ambos tipos es la existencia o no de un agente externo (supervisor) que controle el

proceso de aprendizaje.

Otro criterio para diferenciar las reglas de aprendizaje se basan en considerar si la red puede aprender durante su

funcionamiento habitual (aprendizaje ON LINE),o si el aprendizaje supone una desconexin de la red; es decir su

inhabilitacin hasta que el proceso termine (aprendizaje OFF LINE).

Ventajas que ofrecen las redes neuronales

Son capaces de aprender de la experiencia, de generalizar de casos anteriores a nuevos casos, de abstraer caractersticas esenciales a partir de entradas que representan informacin irrelevante, etc. Aprendizaje adaptativo: capacidad de aprender a realizar tareas basadas en un entrenamiento o en una experiencia

inicial.

Auto-organizacin: una red neuronal puede crear su propia organizacin o representacin de la informacin que

recibe mediante una etapa de aprendizaje.

Tolerancia a fallos: la destruccin parcial de una red conduce a una degradacin de su estructura; sin embargo,

algunas capacidades de la red se pueden retener, incluso sufriendo un gran dao.

Operacin en tiempo real: los cmputos neuronales pueden ser realizados en paralelo; para esto se disean y

fabrican mquinas con hardware especial para obtener esta capacidad.

Fcil insercin dentro de la tecnologa existente: se pueden obtener chips especializados para redes neuronales

que mejoran su capacidad en ciertas tareas. Ello facilitar la integracin modular en los sistemas existentes.

Redes Neuronales de Kohonen

Arquitectura no-supervisada. Consiste de un nmero de neuronas organizadas en una red n-dimensional. Cada neurona es conectada a todas las otras neuronas, pero es localmente conectada solo a sus vecinas. Cada neurona tiene un vector de pesos W de entrada asociado y la neurona con el vector de peso ms cercano a la entrada P se activar. En cada vector se presenta la siguiente secuencia de pasos: Encontrar el nodo k cuyo vector de peso est ms prximo al vector de entrada actual. Entrenar el nodo k y todos los nodos ms prximos a este. cuando se presenta un patrn de entrenamiento, se debe identificar la neurona de salida vencedora, esto es, la neurona cuyo vector de pesos sea el ms parecido al patrn presentado. De acuerdo con este criterio, dos vectores sern ms similares cuanto menor sea su distancia. Una medida de similitud alternativa ms simple que la euclidiana, es la correlacin o producto escalar: segn la cual, dos vectores sern ms similares cuanto mayor sea su correlacin.

ALGORITMO

Decrementarsuavemente la razn de aprendizaje. Despus de M ciclos, decrementarel tamao de la vecindad. Entrenamiento

Se inicializan los pesos de forma aleatoria. Se presenta un vector de entrenamiento. La neurona mas cercana al vector es la nica que se activa Solo se modifican los pesos de la neurona activa y de sus vecinas

Lgica difusa (fuzzy)

Fuzzy Logic tiene sus races en la teora de conjuntos difusos desarrollada por Zadeh en la dcada de los

60, la que propone que un elemento siempre pertenece en un cierto grado a un conjunto y nunca pertenece del todo al mismo, esto permite establecer una manera eficiente para trabajar con incertezas, as como para acondicionar el conocimiento en forma de reglas hacia un plano cuantitativo, factible de ser procesado por computadores. Toda lgica consiste en formalizar el pensamiento humano, desde este punto de vista,

18

Lgica Clsica: Establece que cualquier enunciado o proposicin puede tener un valor lgico verdadero o

falso, en definitiva 1 y 0. De esta forma es posible desarrollar toda una lgica basada en leyes de este tipo.

Logica Difusa: En vez de trabajar con el clsico concepto de inclusin o exclusin, introduce una funcin que expresa el grado de pertenencia de una variable hacia un atributo o variable lingstica tomando valores en el rango de 0 a 1.

Conjunto Difuso: Par Variable lingstica funcin de pertenencia A = {x / A(x) x X} Ejemplo: Descripcin del estado de una puerta Lgica Clsica: De acuerdo a la lgica clsica existen dos estados posibles para una puerta.

Una puerta est abierta (1) Una puerta est cerrada (0)

Lgica Difusa: establece que una puerta no tiene por que estar necesariamente abierta o cerrada, existen adems otros estados.

Puerta abierta (1) Puerta bastante abierta (0.8) Puerta abierta a medias (0.5) Puerta casi cerrada (0.1) Una puerta est cerrada (0)

Ventajas de lgica Difusa

La principal ventaja de utilizar trminos lingsticos como: a medias, bastante, casi, un poco, mucho,

algo, etc, est en que permite plantear el problema en los mismos trminos en los que lo hara un experto humano.

El xito de esta tcnica radica en que El mundo es Fuzzy. En otras palabras, no tiene sentido buscar la

solucin a un problema no perfectamente definido por medio de un planteamiento matemtico muy exacto,

cuando es el ser humano el primero que razona empleando la inexactitud.

1. Proceso de Fuzzificacin

El proceso de fuzzificacin consiste en convertir una variable real en un grado de pertenencia que cuantifica el grado de posesin hacia su correspondiente variable lingstica.

Las variables lingsticas son representativas de situaciones como: Positivo, alrededor de, alto, medio, etc.

El primer paso consiste en tomar las entradas y determinar el grado al que ellos pertenecen a cada uno de los conjuntos fuzzy apropiados.

La entrada siempre es un valor numrico limitado al universo del discurso de la variable de entrada (0-10).

Funciones de pertenencia

Las funciones de pertenencia representan las coordenadas difusas del atributo. Son funciones continuas, que

pueden ser bsicamente de los tipos:

Trapezoidales y Triangulares: Son funciones lineales por tramos, pero representan una discontinuidad en la primera derivada que hereda la accin de control.

Exponenciales: (distribucin normal), muestran un comportamiento muy adecuado y no representan discontinuidad en la derivada.

Polinmicas: Son funciones sencillas de calcular y tienen una forma similar a la de las funciones de densidad normal.

Operadores difusos

Los operadores ms comunes son:

Operacin Max(): asigna la correspondiente al valor mximo

Operacin Min(): asigna la correspondiente al valor mnimo

que son equivalentes a las sentencias or y and de la lgica booleana.

2. Definicin de las reglas:

ENUNCIADOS DE REGLAS:

1. Si (servicio es pobre) o (comida es mala) entonces (restaurant es barato)

2. Si (servicio es bueno) entonces ( restaurant es promedio)

3. Si (servicio es excelente) o (comida es rica) entonces (restaurant es caro)

MTODO DE AGREGACIN DE REGLAS:

La agregacin es cuando se unifican las salidas de cada regla en forma paralela.

Posteriormente se realiza la defuzzificacin del resultado.

3. Defuzzificacin El proceso inverso llamado defuzzificacin transforma un conjunto difuso, es decir un conjunto de

variables lingsticas con sus respectivos grados de pertenencia, en un nmero real.

El mtodo ms comn es asimilarlo al centro de gravedad de la combinacin de cada una de las reglas inferidas.

Tambin se usa el criterio mximo, que escoge el punto donde la funcin inferida tiene su mximo o el criterio de la media de los mximos.

Controlador Difuso

En un controlador a partir del valor de referencia (setpoint) y del valor de entrada del proceso, se calcula el error (E) y el cambio del error (CE).

El controlador difuso toma como variables de partida E y CE y tiene como variable de salida el cambio en la accin de control a aplicar (CU), o bien una accin de control absoluta (U).

El controlador difuso se compone internamente de reglas lingsticas, que tienen como condiciones los valores posibles de las variables de entrada, y que concluyen la variacin a efectuar en la accin de control, en trminos tambin lingsticos. Posteriormente se transforma en un valor determinista.

La tabla de reglas est determinada por las caractersticas del proceso y debe ser configurada por el experto.

Adems debe cumplir algunas normas elementales:

COMPLETITUD: Las reglas han de cumplir todas las combinaciones posibles de entradas al controlador, con el fin

de que no queden fisuras en las cuales no se tome una accin.

CONSISTENCIA: No pueden coexistir dos acciones de control para la misma situacin, lo que producira una

contradiccin.

19

INTERACCIN: Corresponde al peso propio que tiene una regla entre las restantes, para esto se debe analizar el

efecto de las reglas en la accin de control.

ROBUSTEZ: Es una medida de la reaccin del controlador fren

resumen inteligencia artificial 2012

Documents