final

12
CLASIFICACION DE PERSONAS ACUSADAS DE ASESINATO QUE HAYAN ACTUADO BAJO EL EFECTO DE LAS DROGAS UTILIZANDO REDES BAYESIANAS Marcela T. Gómez González [email protected] UNIVERSIDAD TECNICA PARTICULAR DE LOJA Ingeniería en Sistemas Informáticos y Computación INTELIGENCIA ARTIFICIAL AVANZADA ABSTRACT Drugs consumption is a relevant social problem because of this addiction causes big familiarly, couple, school, work and legal problems that deteriorate people’s social environment. This research make a classification of people accused of murder under the influence of drugs. Actually, there are many strategies for objects, people and diseases diagnosis and classification, processes carried out in order to assign one or more objects to a defined class or group. This research is the study of Bayesian networks, which is a method based in probability theories and let us to make inferences by integrating an expert opinion with available databases. This method has some advantages over others when the data are imprecise and especially when relationships between variables are nonlinear. RESUMEN: El consumo de drogas constituye un problema social de gran relevancia, ya que ésa adicción origina graves conflictos familiares, de pareja, escolares, laborales e, incluso, problemas legales que deterioran el entorno social de la persona. En éste artículo se realiza la clasificación de personas acusadas por asesinato y que hayan actuado bajo efectos de drogas. En la actualidad se cuenta con gran cantidad de estrategias para realizar diagnostico y clasificación de objetos, personas, enfermedades, etc; procesos que se realizan con el fin de asignar uno o más objetos a una clase o grupo definidos. La presente investigación trata el estudio de redes bayesianas, siendo éstas un método que basa su estudio en teorías de probabilidad y permiten realizar una inferencia al integrar el juicio de un experto con las bases de datos de las que se dispone, éste método presenta algunas ventajas sobre otros cuando los datos son imprecisos y sobre todo cuando las relaciones entre variables son no lineales. PALABRAS CLAVE: Redes bayesianas, aprendizaje, clasificación, Weka, Elvira, NaiveBayes, BayesNet 1. PLANTEAMIENTO DEL PROBLEMA Realizar una clasificación de personas de una manera manual sin la utilización de algún sistema computacional es un gran problema para la sociedad en general, por lo que éste proyecto se realiza con la finalidad

Upload: marcela-gomez

Post on 20-Jun-2015

323 views

Category:

Documents


2 download

TRANSCRIPT

Page 1: Final

CLASIFICACION DE PERSONAS ACUSADAS DE ASESINATO QUE HAYAN

ACTUADO BAJO EL EFECTO DE LAS DROGAS UTILIZANDO REDES BAYESIANAS

Marcela T. Gómez González

[email protected]

UNIVERSIDAD TECNICA PARTICULAR DE LOJA

Ingeniería en Sistemas Informáticos y Computación

INTELIGENCIA ARTIFICIAL AVANZADA

ABSTRACT

Drugs consumption is a relevant social

problem because of this addiction causes big

familiarly, couple, school, work and legal

problems that deteriorate people’s social

environment. This research make a

classification of people accused of murder

under the influence of drugs.

Actually, there are many strategies for

objects, people and diseases diagnosis and

classification, processes carried out in order

to assign one or more objects to a defined

class or group. This research is the study of

Bayesian networks, which is a method based

in probability theories and let us to make

inferences by integrating an expert opinion

with available databases. This method has

some advantages over others when the data

are imprecise and especially when

relationships between variables are

nonlinear.

RESUMEN:

El consumo de drogas constituye un

problema social de gran relevancia, ya que

ésa adicción origina graves conflictos

familiares, de pareja, escolares, laborales e,

incluso, problemas legales que deterioran el

entorno social de la persona. En éste

artículo se realiza la clasificación de

personas acusadas por asesinato y que hayan

actuado bajo efectos de drogas.

En la actualidad se cuenta con gran cantidad

de estrategias para realizar diagnostico y

clasificación de objetos, personas,

enfermedades, etc; procesos que se realizan

con el fin de asignar uno o más objetos a

una clase o grupo definidos. La presente

investigación trata el estudio de redes

bayesianas, siendo éstas un método que

basa su estudio en teorías de probabilidad y

permiten realizar una inferencia al integrar

el juicio de un experto con las bases de

datos de las que se dispone, éste método

presenta algunas ventajas sobre otros

cuando los datos son imprecisos y sobre todo

cuando las relaciones entre variables son no

lineales.

PALABRAS CLAVE:

Redes bayesianas, aprendizaje,

clasificación, Weka, Elvira, NaiveBayes,

BayesNet

1. PLANTEAMIENTO DEL PROBLEMA

Realizar una clasificación de personas de

una manera manual sin la utilización de

algún sistema computacional es un gran

problema para la sociedad en general, por lo

que éste proyecto se realiza con la finalidad

Page 2: Final

de construir un clasificador inteligente, que

mediante la especificación de una serie de

características permita realizar la

clasificación de dependiendo de ciertos

criterios, en éste caso la clasificación de

personas asesinas que hayan cometido un

delito por consecuencia de las drogas.

Se plantea una solución ante éste problema

mediante la utilización de un clasificador

que responda de manera eficaz y eficiente

mediante la utilización de software que sea

accesible tanto de manera económica y

física.

OBJETIVOS

2.1. OBJETIVOS GENERAL

- Construir un clasificador de personas

(asesinos) que hayan actuado bajo efectos

de estupefacientes mediante la aplicación

de Redes Bayesianas y utilizando los

algoritmos BayesNet y NaiveBayes.

2.2. OBJETIVOS ESPECIFICOS

- Investigar diferentes herramientas que

permitan realizar un clasificador que

permita emitir información clasificada de

una manera eficiente y un mínimo

porcentaje de error.

- Investigar técnicas utilizadas en redes

bayesianas para la clasificación de objetos.

- Investigar trabajos relacionados en el área

de clasificación mediante Redes Bayesianas

- Implementar el modelo en Weka

- Implementar el modelo en Elvira

3. INTRODUCCION

Con frecuencia se encuentran situaciones o

fenómenos que contienen algunos eventos

aleatorios asociados con este. Existen

Modelos Probabilísticos que pueden ser

aprovechados cuando existan relaciones

probabilísticas entre un conjunto de

variables aleatorias afectadas y Modelos

Gráficos, los cuales han llegado a ser

populares entre comunidades estadísticas y

de inteligencia artificial debido a su

facilidad de simplificar la comunicación

entre el dominio experto y el modelador.

Las redes Bayesianas son una clase de

modelos gráficos que modelan relaciones

probabilísticas a través de un grafico

acíclico dirigido , en el cuál cada nodo

corresponde a una variable aleatoria y cada

flecha corresponde una relación de

dependencia probabilística entre dos

variables afectadas[2]

Existen muchas tareas prácticas que pueden

reducirse a problemas de clasificación como

diagnósticos de enfermedades,

reconocimiento de patrones y en caso de

éste proyecto diagnostico o probabilidad de

consumo de drogas de una persona; éste

tipo de tareas tienen la finalidad de asignar

objetos a categorías o clases determinadas

según sus propiedades. Clasificación que se

realizará mediante los programas Weka y

Elvira

4. MARCO TEORICO

4.1. REDES BAYESIANAS Y CLASIFICACION

Una red Bayesiana es un grafo acíclico que

representa relaciones probabilísticas entre

variables aleatorias [7]. El razonamiento

probabilístico en éste tipo de redes consiste

en propagar los efectos de la evidencia a

través de la red para conocer la

probabilidad a posteriori de las variables. Se

Page 3: Final

asignan valores a ciertas variables de la base

de datos y se obtiene la probabilidad

posterior de las demás variables dadas las

variables conocidas [22]

Las redes bayesianas pueden realizar a

cabalidad la tarea de clasificación, ya que

es un caso particular de la tarea de

predicción, se caracteriza por tener una sola

de las variables de la base de datos

(clasificador) que se desea predecir, en éste

proyecto ésta variable es “consumedrogas”

mientras que todas las otras son los datos

propios del caso que se desea clasificar, es

decir las características de las personas, se

pueden citar por ejemplo: fatiga,

somnolencia, alucinaciones, etc. Pueden

existir una gran cantidad de variables en la

base de datos, algunas de las cuales estarán

directamente relacionadas con la variable

clasificadora que se quiere predecir pero

también pueden existir otras variables que

no lo estén.[21]

La idea de utilizar redes Bayesianas en éste

proyecto es que se puede estimar

probabilidades a posteriori de cualquier

hipótesis con el conjunto de datos de

entrenamiento, para así escoger la hipótesis

más probable.

Los métodos bayesianos en tareas de

aprendizaje poseen ciertas características,

entre las cuáles se pueden citar las

siguientes:

- La hipótesis perteneciente a un ejemplo

aumenta o disminuye la probabilidad. Al

momento que no concuerde con un conjunto

de ejemplos más o menos grande ésta

probabilidad no es desechada por completo

sino que se disminuirá esa probabilidad

estimada para la hipótesis.

- Entre las principales ventajas de las redes

bayesianas se puede citar que ellas son

capaces de generalizar, adaptar señales de

ruido y distorsión sin perder su robustez [1],

son entrenadas y no requieren de una

descripción precisa de patrones a ser

clasificados

- Los métodos bayesianos permiten tener en

cuenta en la predicción de la hipótesis el

conocimiento a priori en forma de

probabilidades. El problema puede surgir al

tener que estimar ese conocimiento

estadístico sin disponer de datos

suficientes.[12].

- Las redes bayesianas permiten definir

modelos y utilizarlos tanto para hacer

razonamiento de diagnóstico (pues obtienen

las causas más probables dado un conjunto

de síntomas), como para hacer

razonamiento predictivo (obteniendo la

probabilidad de presentar un cierto síntoma

suponiendo que existe una causa

conocida)[21].

- Una de las características de las redes

bayesianas es que un mismo nodo puede ser

fuente de información u objeto de

predicción dependiendo de cuál sea la

evidencia disponible.

4.2. APRENDIZAJE DE UNA RED BAYESIANA

El aprendizaje en la redes bayesianas

consiste en definir una estructura grafica a

partir de datos almacenados en bases de

datos. El aprendizaje en éste tipo de redes

consiste en definir la red probabilística a

partir de datos almacenados en bases de

datos en lugar de obtener el conocimiento

del experto. Este tipo de aprendizaje ofrece

la posibilidad de inducir la estructura grafica

de la red a partir de los datos observados y

de definir las relaciones entre los nodos

basándose también en dichos casos. Se

definen en aprendizaje estructural y

paramétrico

Page 4: Final

En el aprendizaje estructural se debe

obtener la estructura de la Red Bayesiana

con sus respectivas relaciones. Tomando en

cuenta que éste tipo de aprendizaje

depende del tipo de estructura de la red.

[15]

A diferencia del aprendizaje estructural, el

aprendizaje paramétrico consiste en

encontrar parámetros asociados a una

estructura de una red bayesiana dada [14],

es decir, parámetros conformados por las

probabilidades del nodo raíz y de las demás

variables.

En general, una red bayesiana en sus

primeros estados, puede ser constituida

según la opinión de los expertos o bien

según la información de la que se parta o

teniendo en cuenta ambas cosas. Conforme

se añade información a la misma, se va

modificando tanto su estructura como los

parámetros mediante un proceso de

aprendizaje [5].

5. DISENO E IMPLEMENTACION DEL

CLASIFICADOR

5.1. HERRAMIENTAS UTILIZADAS

En el presente proyecto se utilizara las

herramientas: Weka y Elvira para realizar el

clasificador.

Figura1. Herramienta Elvira

5.1.1. ELVIRA 0.162

El programa Elvira está destinado a la

edición y evaluación de modelos gráficos

probabilistas, concretamente redes

bayesianas y diagramas de influencia. [17]

Cuenta con un formato propio de codificación de los modelos, un lector intérprete para los modelos codificados, una interfaz gráfica para la construcción de redes, con opciones específicas para

modelos canónicos (Noisy OR, Noisy AND, etc...), algoritmos exactos y aproximados (estocásticos) de razonamiento tanto para variables discretas como continuas, métodos de explicación del razonamiento, algoritmos de toma de decisiones, aprendizaje de modelos a partir de base de datos, fusión de redes, etc [24] Elvira puede operar en tres modos: • Modo Editar, éste modo se utiliza para crear y modificar Redes bayesianas e influenciar diagramas cuyas variables son solamente discretas.

• Modo Inferencia, para hacer propagación

de evidencia

• Modo aprendizaje.- permite construir

redes Bayesianas desde bases de datos. [16]

Su mayor ventaja es que éste software

permite representar de una manera gráfica

los resultados de los análisis de sensibilidad,

además mostrar los caminos de

razonamiento y de clasificar los hallazgos en

función del tipo de impacto que ejercen

sobre una variable.

5.1.2. WEKA 3.6

Figura 2. Herramienta Weka

Es un entorno para experimentación de

análisis de datos que permite aplicar,

analizar y evaluar las técnicas más

Page 5: Final

relevantes de análisis de datos,

principalmente las provenientes del

aprendizaje automático, sobre cualquier

conjunto de datos del usuario. [19].

Se utiliza ésta herramienta debido a que

está disponible de una manera libre bajo la

licencia pública general de GNU y es un

software muy portable que puede correr

bajo cualquier plataforma.

5.2. ALGORITMOS UTILIZADOS

5.2.1. ALGORITMO NaiveBayes

La implementación de éste algoritmo se

encuentra en el clasificador

weka.classifiers.bayes.NaiveBayes. Se ha

ejecutado con sus parámetros por defecto:

sin desratización supervisada y con

distribución normal aplicada a los atributos

numéricos. [24]

Naive Bayes es un método de clasificación

probabilístico. Se utiliza una distribución

normal para clasificar una nueva instancia

de un conjunto D dentro de un conjunto

finito C de clases predeterminadas. [27]

5.2.2. ALGORITMO BayesNet

El algoritmo de clasificación BayesNet se

aprovecha para desarrollar la red de

creencia bayesiana. Las opciones que deben

ser abordadas en Weka incluyen el

estimador que calcula las tablas de

probabilidad condicional de las redes de

Bayes. [25]

Bayes Net (Pearl 1988) es un método basado

en “score” y búsqueda, en los cuales la

medida de bondad (verosimilitud, entropía,

porcentaje de bien clasificados) de una

estructura particular es definida, y se lleva a

cabo un procedimiento de búsqueda a lo

largo del espacio de todas posibles

estructuras de redes bayesianas [27]

5.3. MODELO

Las drogas actúan sobre el sistema nervioso

central produciendo varios efectos como

efectos depresores que disminuyen o inhiben

los mecanismos de funcionamiento normal

del sistema nervioso central y efectos

alucinógenos o perturbadores, que alteran la

percepción de la realidad

y alteraciones psicológicas van desde

cambios en el estado de ánimo a crisis de

ansiedad.

Se evalúan en el modelo variables que

representan factores de Riesgo y variables

que representan los síntomas que son

causados por ingerir alguna clase de droga.

Los factores de riesgo que influyan a una

persona para ser consumidor de drogas son

los siguientes:

Edad: se ha tomado „esta variable

como un factor de riesgo, asignándole una

mayor probabilidad a las personas adultas y

adultas mayores más que a los adolescentes

Sexo: El género de mayor riesgo en el

modelo es el género masculino

Los síntomas que permiten identificar si una

persona está bajo efectos de droga son los

siguientes:

ojos irritados

Efecto depresor

Efecto perturbador

Relajación

Page 6: Final

Sedación

Somnolencia

Hipnosis

Fatiga

Alteración de sueno

Alteración de apetito

Alucinaciones

Cambios de animo

Pánico

Ansiedad

Estos efectos en su totalidad dan un 100%,

pero a la hora de simularos en la

herramienta Elvira, todos dan un porcentaje

del 10%, ya que es el porcentaje equivalente

al 100%.

5.3.1. ANALISIS

Para la modelización del proyecto

probabilístico se necesita de la

especificación de variables que permitan

determinar el nivel de riesgo o probabilidad

de que una persona haya estado bajo

efectos de estupefacientes y se debe contar

con una base de datos que contienen

factores de riesgo, en este caso 2 y atributos

de clase las cuales se las especifican con

detalle a continuación:

5.3.1.1 VARIABLES A EVALUAR

Para determinar la probabilidad de que un

asesino haya estado bajo efectos de drogas

se lo determinara en base a ciertos atributos

que a la hora de clasificar vienen a ser los

síntomas a evaluar ,éstos atributos o

características en su mayoría contienen

información de tipo booleano , es decir

verdadero y falso. Los atributas a evaluar

son los siguientes:

Edad INTEGER

Sexo (0:HOMBRE, 1:MUJER)

Ojos irritados (TRUE, FALSE)

Efecto depresor (TRUE, FALSE)

Efecto perturbador (TRUE, FALSE)

Relajación (TRUE, FALSE)

Sedación (TRUE, FALSE)

Somnolencia (TRUE, FALSE)

Hipnosis (TRUE, FALSE)

Fatiga (TRUE, FALSE)

Alteración de sueno (TRUE, FALSE)

Alteración de apetito (TRUE, FALSE)

Alucinaciones (TRUE, FALSE)

Cambios de ánimo(TRUE, FALSE)

Pánico(TRUE, FALSE)

Ansiedad(TRUE, FALSE)

5.4. DATOS

La base de datos consta de información

recolectada de ciertas personas,

información que corresponde a los valores

asignados a las variables anteriormente

citadas.

Para realizar la simulación se utilizo la

siguiente base de datos, la cual se encuentra

en formato .arff

@relation DROGAS

@attribute EDAD numeric

@attribute OIRRITADOS {TRUE,FALSE}

@attribute DEPRESION {TRUE,FALSE}

@attribute PERTURBACION {TRUE,FALSE}

@attribute RELAJACION {FALSE,TRUE,'TRUE

'}

@attribute SEDACION {TRUE,FALSE,'TRUE '}

@attribute SOMNOLENCIA {'TRUE ',FALSE}

@attribute HIMNOSIS {FALSE,TRUE}

@attribute FATIGA {FALSE,TRUE}

@attribute ALTERAAPETITO {TRUE,FALSE}

@attribute CAMBIOANIMO {TRUE,FALSE}

@attribute PANICO {FALSE,TRUE}

@attribute ANSIEDAD {FALSE,TRUE,'TRUE '}

@attribute CONSUMIDOR {'TRUE ',FALSE}

@data

18,TRUE,TRUE,TRUE,FALSE,TRUE,'TRUE

',FALSE,FALSE,TRUE,TRUE,FALSE,FALSE,'TRU

E '

Page 7: Final

20,FALSE,FALSE,TRUE,FALSE,TRUE,FALSE,FA

LSE,FALSE,TRUE,TRUE,FALSE,FALSE,FALSE

22,TRUE,TRUE,TRUE,FALSE,TRUE,'TRUE

',FALSE,FALSE,TRUE,TRUE,FALSE,FALSE,'TRU

E '

24,FALSE,FALSE,TRUE,FALSE,TRUE,FALSE,FA

LSE,FALSE,TRUE,TRUE,FALSE,FALSE,FALSE

42,FALSE,FALSE,TRUE,FALSE,TRUE,FALSE,TR

UE,TRUE,FALSE,FALSE,TRUE,FALSE,FALSE

5.5. EXPERIMENTACION

5.5.1. EXPERIMENTACION CON ELVIRA

En base a la investigación de los efectos

causados por las drogas en una persona se

procedió a diseñar la red. En la figura 3. se

muestra la clase principal que viene a ser la

enfermedad o anomalía , los atributos edad,

sexo que son los factores de riesgo y los

demás atributos que son los síntomas a

evaluar.

Figura 3. Red Bayesiana del Modelo

Figura 4 . Valores asignados a los atributos

Una vez realizada la red, se procede a

asignar valores probabilísticos a cada una de

las variables dependiendo su influencia o

importancia como se muestra en la figura 4.

5.5.1.1. RESULTADOS

Una vez especificados los grados de

probabilidad de cada uno de los atributos

correspondientes al modelo, se procede a

realizar la inferencia de casos al modelo

para así obtener resultados para cada uno

de los casos.

Al realizar la inferencia de datos al modelo

asignando valores a cada atributo se obtiene

las estadísticas y probabilidad de que si una

persona ingirió estupefacientes como se

muestra en la figura 5.

En el caso 1 , el cual se muestra en la figura

6. , se realiza la inferencia de los atributos:

alucinaciones, somnolencia, pánico y

ansiedad asignado un valor negativo, dando

como resultado Un valor negativo en la clase

principal “Consume drogas”. En la figura . se

muestra el caso contrario

Figura 5 . Resultado de la Inferencia utilizando Elvira

para el caso de una persona que no utiliza

estupefacientes

Page 8: Final

Figura 6. Resultado de la Inferencia utilizando Elvira

para el caso de una persona que utilizó

estupefacientes

5.5.3 CLASIFICACION CON WEKA

Las siguientes figuran muestran los

atributos del modelo, la frecuencia y

categorías para el atributo seleccionado y

las estadísticas del atributo seleccionado

respectivamente.

Figura 7. Atributos del modelo

Figura 8 . Frecuencia y categorías para el atributo

Figura 9. Estadísticas del atributo seleccionado

RESULTADOS CON WEKA

La clasificación se realiza mediante la

utilización de dos algoritmos: algoritmo

NaiveBayes y algoritmo

5.5.3. ALGORITMO NaiveBayes

La primera clasificación realizada es

mediante el algoritmo NaiveBayes obteniendo los siguientes resultados:

Figura 10. Número y porcentajes de las instancias

clasificadas correcta e incorrectamente.

Figura 11. Matriz de confusión

Figura 12. Detalle de la exactitud de las clases

Page 9: Final

5.5.4. ALGORITMO BayesNet

La segunda clasificación realizada es

mediante el algoritmo BayesNet obteniendo

los siguientes resultados:

Figura 13. Número y porcentajes de las instancias

clasificadas correcta e incorrectamente.

Figura 14. Matriz de confusión

Figura 15 . Detalle de la exactitud de las clases

Figura16. Atributos

Figura 17. Ejecución de la aplicación

5.5.5. MINIMIZACION DEL MARGEN DE

ERROR DE LOS ALGORITMOS BAYESNET Y

NAIVEBAYES

Mediante la simulación realizada en el

programa Weka se pueden resumir los

siguientes resultados en cuanto a las

instancias clasificadas.

BayesNet Vs NaiveBayes

Algortimo Instancias correctamente

clasificadas

Instancias Incorrectamente

clasificadas

BayesNet 34 (79%) 9 (21%)

NaiveBayes 29 (67%) 14 (32%) Tabla 1. Porcentaje de instancias correctamente

clasificados por los algoritmos de clasificación en el set de

datos experimentales

Se puede observar además que el algoritmo

BayesNet presenta un mejor desempeño que

el algoritmo NaiveBayes; aunque aún así no

son los resultados deseados en el presente

proyecto.

Para resolver el problema propuesto en éste

artículo es de gran relevancia que el

clasificador construido clasifique de una

manera eficiente y eficaz a las personas

para así obtener el diagnostico ideal.

Como solución al problema se agregaron más

instancias al conjunto de entrenamiento, ,

una vez modificado éste modelo , ya se

puede realizar la inferencia bayesiana sobre

las variables del modelo, obteniendo los

siguientes resultados:

Page 10: Final

Figura 17. Resultados del algoritmo BayesNet con menor tasa de

error

La clasificación utilizando el algoritmo

NavieBayes, presenta los siguientes

resultados:

Figura 17. Resultados del algoritmo Naviebayes con menor tasa de

error

Aun mas, mediante la utilización del

estimador de clases

“userSupervisedDiscretization” en el

algoritmo NavieBayes, se puede minimizar

más la tasa de error, ésta clase convierte los

atributos numéricos a atributos nominales.

Se obtienen los siguientes resultados:

Figura 17. Resultados del algoritmo Naviebayes con menor tasa de

error utilizando la clase userSupervisedDiscretization

La tabla 2. Muestra un resumen de

resultados obtenidos mediante la

experimentación del modelo de

clasificación:

Instancias

Instancias correctamente

clasificadas

Instancias Incorrectamente

clasificadas

BayesNet 44(98%) 1(2%)

NavieBayes 41 (91%) 4 (8%)

NavieBayes (userSupervised Discretization)

44(98%) 1(2%)

Tabla 2. Porcentaje de instancias correctamente

clasificados por los algoritmos de clasificación en el set de

datos experimentales modificados

Se puede observar que el algoritmo

BayesNet al igual que en la experimentación

anterior obtuvo mejores resultados, aunque

mediante la utilización de un estimador de

clases “userSupervisedDiscretization”, se llegó a

obtener los mismos resultados, es decir se

minimizó a cabalidad el margen de error en

el modelo propuesto. Obteniendo así un

clasificador con un margen de error del 1%.

Con un gran margen de credibilidad.

6. TRABAJOS RELACIONADOS

Entre los trabajos relacionados con la

clasificación mediante el uso de redes

bayesianas se pueden citar los siguientes:

- CLASIFICACION DE LEUCOCITOS MEDIANTE

REDES BAYESIANAS.- este es un proyecto de

tesis realizado por Lucio Jiménez Díaz en

[4]. Fue realizado con la finalidad de

desarrollar un clasificador de leucocitos ya

que la clasificación manual es una tarea

engorrosa que sigue existiendo en algunos

laboratorios clínicos. Este clasificador

comprende las etapas: obtención de

imágenes, segmentación, extracción de

características y clasificación. En este

proyecto el autor concluye que es posible

adaptar redes bayesianas de tal forma que

permitan obtener resultados satisfactorios

incluso cuando los datos con que se cuenta

Page 11: Final

para su aprendizaje estén lejos de ser los

ideales.

- En [28] los autores realizan el ensamblaje de los algoritmos NeiveBayes y BayesNet utilizando el método Stacked Generalization, conocido también como Stacking. Este método combina múltiples modelos que han sido entrenados para una tarea de clasificación, es decir, combina

varios clasificadores para inducir un clasificador de nivel más alto con un mejor rendimiento.

-En la Universidad de TALCA, FRANCISCO

GABRIEL REYES MATUS se ha realizado un

sistema de PREDICCION DE RIESGOS EN

PROYECTOS DE SOFTWARE USANDO

MODELOS EN REDES BAYESIANAS.- En este

proyecto se ha construido un software que

toma los modelos en redes bayesianas,

permite el ingreso de evidencias que

representan un proyecto nuevo y entrega la

probabilidad de éxito de éste. [23]

- CADECEUS Diagnóstico de enfermedades

reumáticas. En el área de medicina ha

realizado aplicado también clasificación

mediante este método. Jonh Myres y Harry

Pople en la Universidad de Pittsburgh, puede

diagnosticar enfermedades que no están

relacionadas apelando a la heurística con

objeto de limitar el campo y extraer

información de su gran banco de memoria.

7. CONCLUSIONES

- Mediante la implementación de los

algoritmos Naivebayes y BayesNet en la

clasificación del modelos se ha

comprobado que el algoritmo BayesNet

ha dado menos errores, es decir que en

la implementación de NaiveBayes

existieron más instancias clasificadas

incorrectamente que con el algortimo

BayesNet.

- La implementación de modelo en WEKA

es sencilla y fácil de interpretar y se

realiza a partir de una base de datos ,

además brinda mayor información que el

modelo Elvira ya que éste se realiza a

partir de la construcción de una red para

obtener valores de probabilidad.

- La exactitud de predicción en la

experimentación mediante la utilización

de los algoritmos bayesianos puede ser

mejorada mediante la utilización de un

set de evidencia bastante representativo

del problema

- Las redes bayesianas han aparecido como

una herramienta muy importante en el

campo de la clasificación ya que permite

manipular la información de manera

flexible debido a que se fomenta en

bases rigurosamente matemáticas.

8. REFERENCIAS

[1] Guoqiang Peter Zhang.- Neural Networks

for Classification: A Survey

[2] Priyantha Wijayatunga.- Bayesian

networks for classification

[3] Minoo Aminian, Amina Shabbeer, Kristin

P Bennett.- A conformal Bayesian network

for classification of Mycobacterium

tuberculosis complex lineages

[4] Lucio Jimenez Diaz.-CLASIFICACI_ON DE

LEUCOCITOS MEDIANTE REDES BAYESIANAS"

[5] Mar Abad Grau, María Visitación Hurtado

Torres, Rosana Montes Soldado, Miguel J.

Hornos Barranco.- LAS REDES BAYESIANAS

COMO SISTEMAS DE SOPORTE A LA DECISIÓN

Page 12: Final

EN LA EMPRESA

[6] Paul Helman,1 Robert Veroff,1 Susan R.

Atlas,2 and Cheryl Willman3.- Paul Helman,1

Robert Veroff,1 Susan R. Atlas,2 and Cheryl

Willman3

[7] Jie Cheng1, Russell Greiner2.- Jie

Cheng1, Russell Greiner2.- Learning

Bayesian Belief Network Classifiers:

Algorithms and System

[8] Nir Friedman, Moises Goldszmidt- - .-

Building Classifiers using Bayesian Networks

[9] Carlos López de Castilla Vásquez.-

CLASIFICADORES POR REDES BAYESIANAS

[10] David A. Velasco Villanueva.- RREDES

BAYESIANAS

[11] Robin hanson, John Stutz, Peter

Cheeseman .- Bayesian Classification Theory

[12] Constantino Malagón Luque.-

Clasicadores bayesianos. El algoritmo Naïve

Bayes

[13] Bayesian Networks en diagnóstico

psiquiátrico o psicopatológico. Lic. Mariano

Acciardi. http://www.marianoacciardi.

com.ar/textos_ia/BN1.pdf

14] Redes Bayesianas en Minería de Datos.

http://ccc.inaoep.mx/~emorales/Cursos/Nv

oAprend/node68.html

[15] Álvaro Marín Illera, Sistemas Expertos,

Redes Bayesianas y sus aplicaciones.

http://www.e-

ghost.deusto.es/docs/2005/conferencias/Ba

yes05.pdf

[16] Carmen Lacave – UCLM, Fco. Javier Díez

– UNED.- Elvira 0.11. Graphical User

Interface

[17] Javier Díez .- ELVIRA

[18] G. Holmes; A. Donkin and I.H. Witten

(1994). «Weka: A machine learning

workbench».Proc Second Australia and New

Zealand Conference on Intelligent

Information Systems, Brisbane, Australia.

Consultado el 25-06-2007.

[19] Weka,

http://www.cs.waikato.ac.nz/ml/weka/

[20] Angel Kuri, Martha Ortiz, Lucía

Castellanos, Carlos Ponce, Christopher

Gasca, Oscar Herrera.- Clasificación No

Sesgada de Proteínas con Redes Neuronales

y Computación Evolutiva

[21]Pablo Ezequiel FELGAER.- OPTIMIZACIÓN

DE REDES BAYESIANAS BASADO EN TÉCNICAS

DE APRENDIZAJE POR INDUCCIÓN

[22] Fausto Andrés Monreal, WEKA

[23] FRANCISCO GABRIEL REYES MATUS.- “ UNA HERRAMIENTA PARA LA PREDICCION DE RIESGOS EN PROYECTOS DE SOFTWARE USANDO MODELOS EN REDES BAYESIANAS” [24] David A. Velasco Villanueva.- Redes Bayesianas [25] Jiakai Li, Gursel Serpen, Steven Selman, Matt Franchetti, Mike Riesen and Cynthia Schneider .- Bayes Net Classifiers for Prediction of Renal Graft Status and Survival Period [26] Remco R. Bouckaert.- Bayesian Network

Classfiers in Weka

[27] Ramírez López, Leonardo.- Modelo de

clasificación de arritmias mediante técnicas de aprendizaje de máquina.

[28] Roberto Portugal & Miguel A. Carrasco .- ENSAMBLE DE ALGORITMOS BAYESIANOS CON ÁRBOLES DE DECISIÓN, UNA ALTERNATIVA DE CLASIFICACIÓN.