ingenieria del conocimiento unidad 2

Upload: jlwayas

Post on 15-Oct-2015

425 views

Category:

Documents


0 download

TRANSCRIPT

INGENIERIA DEL CONOCIMIENTO UNIDAD 2MODELADO Y ADMINISTRACIN DEL CONOCIMIENTO2.1 Introduccin al modelado y administracin del conocimiento.

En la actualidad es cada vez ms comn utilizar el trmino gestin del conocimiento (knowledge management) en las organizaciones, segn [1] The Knowledge Creating Company, en una economa donde la nica certeza es la incertidumbre, la nica fuente segura de ventaja competitiva es el conocimiento y de esto cada vez son ms las empresas que se dan cuenta. Asimismo las ltimas investigaciones, estudios y artculos acerca de la gestin del conocimiento mencionan la importancia de herramientas que faciliten la captura, conservacin, organizacin, procesamiento y sobre todo difusin del conocimiento, de tal forma que se transforme dicho recurso, hoy disperso, en un capital intelectual administrable.Finalmente es importante aclarar, como se ver ms adelante, que las tecnologas de informacin juegan un rol muy importante pero no son el componente principal de la gestin del conocimiento y a medida que se investiga ms sobre este tema ms se tiene la certeza que la esencia de la gestin del conocimiento son las personas.En la actualidad, entender cul es el rol de las tecnologas de informacin entorno a la gestin del conocimiento es la pieza clave para no cometer un error de concepto. Este error radica en concebir la implantacin de la gestin del conocimiento como un tarea de la tecnologas de informacin. Es importante comprender que las tecnologas de informacin proveen el marco, pero no el contenido.Antes de seleccionar y clasificar las diversas tecnologas de informacin es necesario entender el significado de lo que diversos autores llaman:1.- herramientas de la gestin del conocimiento O2.- software de la administracin del conocimiento.Una de las mejores definiciones aportadas es la de:Ruggles (1997) 2que concibe este concepto como el software o herramienta que apoya y da soporte a las aplicaciones, actividades o acciones como la de generacin, codificacin y transferencia del conocimiento.Las clasificacin de las tecnologas de informacin segn la capacidad de generar ocrear, codificar y transferir conocimiento con base en el Modelo de :

Espiral de creacin del conocimiento: Sociabilizacin Externalizacin Internalizacin Combinacin

Objetivo del modelo De esta manera segn el objetivo que persigue el modelo en vas de gestionar el conocimiento, la clasificacin de las tecnologas de informacin sera la siguiente: Tecnologas enfocadas a la codificacin y transferencia de conocimiento. Tecnologas enfocadas a la generacin, codificacin y transferencia de conocimiento Tecnologas enfocadas a la generacin y codificacin del conocimiento1. Tecnologas enfocadas a la codificacin y transferencia de conocimiento

2. Tecnologas enfocadas a la creacin, codificacin y transferencia de conocimiento

3. Tecnologas enfocadas a la creacin y codificacin del conocimiento

2.2 Mtodos de modelado: modelos organizacionales Common KADS, Modelos de procesos IDEF, Diagramas de clases UML, modelos relacionales de datos, ontologas.La Ingeniera del Conocimiento (IC) posibilita laconstruccin de productos del aprendizaje tales como cursos, talleres, programas educativos, etc.; de manera interactiva, no lineal y a distancia; en las modalidades semi-virtual, virtual y colaborativa.Entre las metodologas con que cuenta la IC se destaca CommonKADS como el estndar europeo para el desarrollo de sistemas basados en el conocimiento.Esta metodologa es el resultado del proyecto ESPRITKADS-II (P5248) que es una continuacin del proyecto KADS.Cubre todos los aspectos del desarrollo de un SBC enmarcados en un nico ciclo de vida de carcter espiral, que llega incluso a la definicin del programa que finalmente ser ejecutado. KADS-I (ESPRIT-I P1098) se quedaba en la definicin del modelo conceptual.Una de las principales contribuciones de este proyecto es el introducir las ltimas tcnicas aplicadas en la ingeniera del software en el campo de la IA.El trabajo se comenz en 1983En ese momento, la construccin de sistemas de conocimiento estaba enmarcada bajo el paradigma de desarrollo por prototipos y de representacin del conocimiento a travs de reglas de produccin, con hardware y software de propsito especial como mquinas LISP y PROLOGA pesar de que el proyecto termin en 1994, se han seguido desarrollando investigaciones alrededor de CommonKADS.La metodologa CommonKADS abarca todo el ciclo de desarrollo de softwareEl proceso de desarrollo de SBC consiste en rellenar un conjunto de .plantillas de los modelos. Asociados a estas plantillas, CommonKADS define estados. De los modelos que caracterizan hitos en el desarrollo de cada modelo.Estos estados permiten la gestin del proyecto, cuyo desarrollo se realiza de una forma cclica dirigida por los riesgos.Hay seis modelos definidos en CommonKADS:

1.- Modelo de la Organizacin (OM): es una herramienta para analizar la organizacin en que el SBC va a ser introducido, y pretende descubrir problemas y oportunidades.2.- Modelo de Tarea (TM) (Subpartes relevantes del proceso): describe a un nivel general las tareas que son realizadas o sern realizadas en el entorno organizativo en que se propone instalar el SBC y proporciona el marco para la distribucin de tareas entre agentes3.- Modelo de Agente (AM): un agente es un ejecutor de una tarea. Puede ser humano, software o cualquier otra entidad capaz de realizar una tarea.Este modelo describe las competencias, caractersticas, autoridad y restricciones para actuar de los agentes.4.- Modelo de Comunicaciones (CM): detalla el Intercambio de informacin entre los diferentes agentes involucrados en la ejecucin de las tareas descritas en el modelo de tarea.5.- Modelo del Conocimiento (de Pericia o de Experiencia -EM): este es el corazn de la metodologa CommonKADS y modela el conocimiento de resolucin de problemas empleado por un agente para realizar una tarea.El modelo de la experiencia distingue entre el conocimiento de la aplicacin y el conocimiento de resolucin del problema.El conocimiento de la aplicacin se divide en tres subniveles: a) nivel del dominio (conocimiento declarativo sobre el dominio)b) nivel de inferencia (una biblioteca de estructuras genricas de inferencia)c) nivel de tarea (orden de las inferencias).6.- Modelo de Diseo (DM): mientras que los otros cinco modelos tratan del anlisis del SBC, este modelo se utiliza para describir la arquitectura y el diseo tcnico del SBC como paso previo a su implementacin.En general produce la especificacin tcnica en trminos de arquitectura, plataforma de implementacin, mdulos de software, construcciones de representacin, y mecanismos computacionales para la implementacin de SC.

Para los tres primeros modelos, del contexto, es posible utilizar 9 formularios o plantillas propuestas por CommonKADS: Modelo Organizacional. Son 5 cuestionarios:

Para los tres primeros modelos, del contexto, es posible utilizar 9 formularios o plantillas propuestas por CommonKADS (continuacion): Modelo de Tareas: 2 formularios (subporcin de un proceso de la organizacin, actividad que agrega-valor de manera dirigida por metas).

Para los tres primeros modelos, del contexto, es posible utilizar 9 formularios o plantillas propuestas por CommonKADS (continuacion): Modelo de agentes: 1 formulario (perspectiva proceso/tarea, perspectiva de agentes individuales).

Para los tres primeros modelos, del contexto, es posible utilizar 9 formularios o plantillas propuestas por CommonKADS (continuacion): Resumen:

Modelo de conocimiento:Este modelo, describe el conocimiento que tiene undeterminado agente y que es relevante para la consecucin de una determinada tarea, adems de describir la estructura del mismo en funcin de su uso.Para poder llevar a cabo este modelado de los distintos papeles que puede jugar el conocimiento, ste est distribuido en tres categoras:1. Conocimiento de Tareas:2. Conocimiento del Dominio: Ontologas del Dominio Modelos del Dominio Conceptos Propiedades Expresiones Relaciones3. Conocimiento sobre Inferencias:Modelos De Procesos IdefEs un subconjunto de la metodologa del SADT (Structured Analysis and Design Technique) y se caracteriza por ser un mtodo formalizado de descripcin de procesos que permite evitar las dificultades que implica el uso de diagramas (por ejemplo, "grafos").En el programa norteamericano del Departamento de Defensa denominado "Integrated ComputerAided Manufacturing - (ICAM)" se ha reconocido su utilidad y se le ha estandarizado en llamado IDEF0 (ICAM Definition Method Zero[1]) - se pronuncia "eyedeff- zero"[2].Bajo este nombre de IDEF0, la metodologa del SADT se utiliza en cientos de organizaciones relacionadas con la defensa y en industrias de altas tecnologas.En 1989 se constituy una asociacin de usuarios, el IDEF-Users Group (IDEF-UG).El IDEF0 es muy utilizado para describir procesos de negocio (atendiendo a los objetivos centrales) y existen numerosas aplicaciones de software que apoyan su desarrollo.El IDEF0 gua en la descripcin de cada proceso (o actividad) considerada como combinacin de cinco magnitudes bsicas que se representan grficamente como:

El IDEF0 utiliza unos grafos de visualizacin de sus elementos, no slo para facilitar la aplicacin del mtodo, sino para diferenciar claramente las magnitudes a tratar en aplicaciones de software.En realidad, esas magnitudes del modelo constituyen una variante del clsico modelo de bases de datos:entity-relationship.El elemento central del "diagrama" en que se describe (modeliza) el proceso es una forma rectangular a la que se unen ciertas flechas que representan inputs, outputs, controles, mecanismos que permiten funcionar:

Por ejemplo: en un proceso de produccin: Los "inputs" designan la materia prima que es transformada en la actividad (barra de acero a transformar en tubo, planos de trabajo). Los "controles" designan las actividades o entidades que influencia la forma en que trabaja el proceso; p.ej.: cumplir normas de seguridad, responder a exigencias del cliente, ejecutar planes de trabajo. El control marca restricciones u obligaciones y dirige las actividades. Los "mecanismos" designan los factores que permiten las operaciones desarrolladas en el proceso; p.ej.: personas, herramientas, software, informacin. Los "outputs" designan el resultado de la actividad y se transmiten a otros procesosEn el nivel ms elevado puede tratarse de representar un proceso de negocios completo. A continuacin y a un nivel inferior, este proceso se divide en varios bloques de actividades.De este modo se efecta una descomposicin en niveles jerrquicos de mayor detalle hasta llegar a un punto en que se disponga de datos suficientes para poder planificar los cambios que se consideren necesarios.

Evidentemente, un proceso complejo consta de mltiples unidades sencillas encadenadas como se muestra en la fig. IDEF-3.

La metodologa del IDEF trabaja con una lgica de desglose que permite pasar del anlisis de un proceso global al de sus subprocesos (similar a la lgica en la programacin por objetos).Esto es lo que visualiza la figura IDEF-4

El "nudo" (rectngulo) del diagrama se desompone - en una especie de Zoom en subnudos (sub-diagramas) que pueden oscilar entre tres y seis rectngulos, luego stos se descomponen a su vez (si se considera necesario) en otros subdiagramas de cada nudo.Las conexiones entre los nudos del diagrama desglosado se articulan en los siguientes tipos:

Se prosigue la descomposicin hasta completar la descripcin de todos los aspectos y magnitudes relevantes del proceso.Ventajas del uso del IDEF0Como ventajas del IDEF para el anlisis de procesos se consideran:La descomposicin en niveles jerrquicos facilita la rapidez en la determinacin del mapa de procesos y posibilita visualizar al nivel ms alto las relaciones de cambio con los factores de xito. Esto ayuda sobre todo en cambios radicales.El remontar a contracorriente la cadena/flujo de inputs-outputs permite determinar fcilmente elementos que no agregan valor, o detectar limitaciones y cuellos de botella.Cundo se recomienda el uso del IDEF0 Cuando hay que preparar un modelo de proceso que facilite exactitud, detalle, y claridad en la descripcin. Cuando el proceso posee cierta complejidad y los otros mtodos de descripcin daran lugar a diagramas confusos. Cuando se trata de modelar una amplia gama de procesos distintos en un PDL (Process Description Language) consistente y con capacidades de metrizacin . Cuando se posee cierto tiempo para trabajar y desarrollar una descripcin/modelo completo y correcto del proceso. En el flujo de proceso. el uso de IDEF0 se recomienda en los puntos de identificacin/definicin (con aspectos metrizables), en la comprensin y delimitacin de aspectos de problemas que se plantean en el proceso, en la presentacin de soluciones, y en la estandarizacin de las mejoras/cambios.ONTOLOGALa ingeniera del conocimiento, y en particular el procesamiento de ontologas, son uno de los problemas en los que ms se est centrando la atencin en la informtica actual.La razn principal es la emergencia de un nuevo conjunto de aplicaciones en las que las ontologas juegan un papel fundamental, la mayora de las cuales se encuentran en dos campos:1. La ltima generacin de sistemas para la Web (Web 2.0, Web Semntica)2. La necesidad de integracin de aplicaciones empresariales cada vez ms distribuidas.Definicin de OntologaEn la prctica informtica, el trmino ontologa ha adoptado unas connotaciones peculiares, alejadas de su sentido filosfico original. A partir de principios de la dcada de 1990 han proliferado las definiciones de ontologa en la literatura informtica.Gmez Prez et al. (2005) proporcionan una discusin completa; pero dentro de las ms relevantes, entre las que destaca la dada por Gruber (1993), que es la ms citada: A conceptualization is an abstract, simplified view of the world that we wish to represent for some purpose. Every knowledge base, knowledge-based system, or knowledge level agent is committed to some conceptualization, explicitly or implicitly . An ontology is an explicit specification of a conceptualization. The term is borrowed from philosophy, where an Ontology is a systematic account of Existence. For AI systems, what exists is that which can represented.La definicin de Gruber fue clarificada por Borst (1997): An ontology is a formal specification of a shared conceptualization.Se pone el nfasis en dos ideas clave: Una ontologa debe ser especificada usando un lenguaje formal, que pueda ser procesado por ordenadores y no slo por personas La ontologa es conocimiento compartido, fruto del consenso dentro de un grupo.Elementos de una OntologaUna ontologa contiene reglas especificadas mediante algn tipo de formalismo lgico.Estas reglas pueden cumplir varias funciones: Restricciones y reglas de validacin paraasegurarse de que la ontologa es coherente: Todas las uvas deben ser o blancas o tintas Definicin intensional de clases (en lugar de por simple enumeracin de individuos): la clase uvas est compuesta por la unin de las uvas tintas y las uvas blancasParadigmas De Modelado De OntologasActualmente existen diferentes formas de representacin del conocimiento, desde simples listas de trminos hasta lgicas muy expresivas.En la siguiente figura se puede apreciar el espectro de representacin de conocimiento.En general, solo las redes semnticas y representaciones ms expresivas son consideradas ontologas, aunque hay un cierto debate al respecto; obviamente, la clasificacin de modelos cercanos a la frontera y de modelos hbridos es complicada, y pueden aparecer excepciones.

Aplicaciones de las Ontologas

2.3 Formalizacin del conocimientoSe han de considerar los diferentes esquemas de razonamiento que se pueden utilizar para modelizar las diferentes necesidades de resolucin de problemas identificadas en las fases anteriores.En este punto, se ha de poder comprender la naturaleza del espacio de bsqueda y el tipo de bsqueda que habr que hacer . Para ello, se puede comparar sta con diferentes mecanismos prototpicos de resolucin de problemas como la clasificacin, abstraccin de datos, razonamiento temporal, estructuras causales, etc.En esta etapa tambin tendr que analizarse la certidumbre y completitud de la informacin disponible, dependencias temporales, o la fiabilidad y consistencia de la informacin. Se deber descubrir qu partes del conocimiento constituyen hechos seguros y cules no. Para stos ltimos deber adaptarse alguna metodologa de tratamiento de la incertidumbre, de manera que sta pueda ser modelizada dentro del sistema.