inteligencia artificial un enfoque moderno, 2da ed

1242

Click here to load reader

Upload: sebastian-vasquez

Post on 22-Nov-2014

3.439 views

Category:

Technology


191 download

DESCRIPTION

 

TRANSCRIPT

  • 1. www.FreeLibros.me

2. www.FreeLibros.me 3. INTELIGENCIA ARTIFICIAL UN ENFOQUE MODERNO Segunda edicinwww.FreeLibros.me 4. www.FreeLibros.me 5. INTELIGENCIA ARTIFICIAL UN ENFOQUE MODERNO Segunda edicin Stuart J. Russell y Peter Norvig Traduccin: Juan Manuel Corchado Rodrguez Facultad de CienciasUniversidad de SalamancaFernando Martn Rubio, Jos Manuel Cadenas Figueredo, Lus Daniel Hernndez Molinero y Enrique Paniagua Ars Facultad de InformticaUniversidad de Murcia Raquel Fuentetaja Pinzn y Mnica Robledo de los Santos Universidad Pontificia de Salamanca, campus Madrid Ramn Rizo Aldeguer Escuela Politcnica SuperiorUniversidad de AlicanteRevisin tcnica: Juan Manuel Corchado Rodrguez Facultad de CienciasUniversidad de SalamancaFernando Martn Rubio Facultad de InformticaUniversidad de Murcia Andrs Castillo Sanz y Mara Luisa Diez Plata Facultad de InformticaUniversidad Pontificia de Salamanca, campus MadridCoordinacin general de la traduccin y revisin tcnica: Luis Joyanes Aguilar Facultad de InformticaUniversidad Pontificia de Salamanca, campus Madrid PEARSONMadrid Mxico Santaf de Bogot Buenos Aires Caracas Lima Montevideo San Juan San Jos Santiago So Paulo White Plainswww.FreeLibros.me 6. __________________________/Datos de catalogacin bibliogrficaRUSSELL, S. J.; NORVIG, P. INTELIGENCIA ARTIFICIAL. UN ENFOQUE MODERNO Segunda edicinPEARSON EDUCACIN, S.A., Madrid, 2004 ISBN: 978-84-205-4003-0 Materia: Informtica 681.3 Fbnnato 195 X 250Pginas: 1240Todos los derechos reservados. Queda prohibida, salvo excepcin prevista en la ley, cualquier forma de reproduccin, distribucin, comunicacin pblica y transformacin de esta obra sin contar con autorizacin de los titulares de propiedad intelectual. La infraccin de los derechos mencionados puede ser constitutiva de delito contra la propiedad intelectual (arts. 270ysgts. Cdigo Penal). DERECHOS RESERVADOS 2004 por PEARSON EDUCACIN, S.A. Ribera del Loira, 28 28042 Madrid (Espaa) INTELIGENCIA ARTIFICIAL UN ENFOQUE MODERNO. Segunda edicin RUSSELL, S. J.; NORVIG, P. ISBN: 978-84-205-4003-0 Depsito Legal: M-14511-2008 ltima reimpresin: 2008 PEARSON PRENTTCE HALL es un sello editorial autorizado de PEARSON EDUCACIN, S.A. Authorized translation from the English language edition, entitled ARTIFICIAL INTELLIGENCE: A MODERNAPPROACH, V* edition by RUSSELL, STUART; NORVIG, PETER. Published by Pearson Education, Inc, publlshing as Prentice Hall. 2003. AU rights reserved. No par or this book may be reproduced or transmitted in any form or by any means, electronic or mechanical, including photocopying recording or by any Information storage retrieval system, without permission from Pearson Educaon, Inc. ISBN: 0-13-790395-2 E quipo ed ito rial:Editor: David Fayerman Aragn Tcnico editorial: Ana Isabel Garda Borro E quipo d e proA iccin:Director: Jos Antonio Clares Tcnico: Jos Antonio Hernn Diseo de cubierta: Equipo de diseo de PEARSON EDUCACIN, S.A. Composicin: COPIBOOK, S.L. Impreso por: IMPRESO EN MXICO - PRINTED IN MEXICO PEA RSO Nwww.FreeLibros.me 7. C ontenidoM ogoXIXSobre los autores 1XXVIntroduccin11.1 Qu es la IA ? ............................................................................................................ Comportamiento humano: el enfoque de la Prueba de Turlng .................................. Pensar como un humano: el enfoque del modelo cognitlvo ...................................... Pensamiento racional: el enfoque de las leyes del pensamiento............................ Actuar de forma racional: el enfoque del agente racional.......................................... 1.2 Los fundamentos de la inteligencia artificial.............................................................. Filosofa (desde el ao 428 a.C. hasta el presente)................................................... Matemticas (aproximadamente desde el ao 800 al presente) ................................ Economa (desde el ao 1776 hasta el presente)....................................................... Neuroclencia (desde el ao 1861 hasta el presente) ................................................. Psicologa (desde el ao 1879 hasta el presente)....................................................... Ingeniera computactonal (desde el ao 1940 hasta el presente) .............................. Teora de control y ciberntica (desde el ao 1948 hasta el presente) ...................... Lingstica (desde el ao 1957 hasta el presente)..................................................... 1.3 Historia de la inteligencia artificial............................................................................. Gnesis de la Inteligencia artificial (1943-1955)....................................................... Nacimiento de la Inteligencia artificial (1956) ......................................................... Entusiasmo Inicial, grandes esperanzas (1952-1969) ................................................ Una dosis de realidad (1966-1973)........................................................................... Sistemas basados en el conocimiento: clave del poder? (1969-1979)...................... La IA se convierte en una industria (desde 1980 hasta el presente) .......................... Regreso de las redes neuronales (desde 1986 hasta el presente)................................ IA se convierte en una ciencia (desde 1987 hasta el presente) .................................. Emergencia de los sistemas inteligentes (desde 1995 hasta el presente) .................. 1.4 El estado del a r te ........................................................................................................ 1.5 Resumen .................................................................................................................... Notas bibliogrficas e histricas......................................................................................... Ejercicios .......................................................................................................................... 22 3 3 4 5 6 6 9 11 12 14 16 17 18 19 19 20 21 24 26 28 29 29 31 32 33 34 35Agentes inteligentes372.1 Agentes y su entorno.................................................................................................. 2.2 Buen comportamiento: el concepto de racionalidad.................................................. Medidas de rendimiento ........................................................................................... Racionalidad .............................................................................................................37 40 40 41www.FreeLibros.me 8. VICONTENIDOOmnisciencia, aprendizaje y autonoma ................................................................... 2.3 La naturaleza del entorno .......................................................................................... Especificacin del entorno de trabajo ....................................................................... Propiedades de los entornos de trabajo..................................................................... 2.4 Estructura de los agentes............................................................................................ Programas de los agentes ......................................................................................... Agentes reactivos sim ples......................................................................................... Agentes reactivos basados en m odelos..................................................................... Agentes basados en objetivos ................................................................................... Agentes basados en utilidad ..................................................................................... Agentes que aprenden............................................................................................... 2.5 Resumen .................................................................................................................... Notas bibliogrficas e histricas......................................................................................... Ejercicios .......................................................................................................................... 342 44 44 47 51 51 53 55 57 58 59 62 63 65ResolvH- problemas mediante bsqueda673.1 Agentes resolventes-problemas.................................................................................. Problemas y soluciones bien definidos..................................................................... Formular los problemas............................................................................................. 3.2 Ejemplos de problemas.............................................................................................. ftoblemas de juguete................................................................................................. Problemas del mundo r e a l......................................................................................... 3.3 Bsqueda de soluciones.............................................................................................. Medir el rendimiento de la resolucin del problema.................................................. 3.4 Estrategias de bsqueda no informada ...................................................................... Bsqueda primero en anchura................................................................................... Bsqueda de costo uniforme..................................................................................... Bsqueda primero en profundidad ........................................................................... Bsqueda de profundidad limitada ........................................................................... Bsqueda primero en profundidad con profundidad iterativa.................................... Bsqueda bidireccional............................................................................................. Comparacin de las estrategias de bsqueda no informada ...................................... 3.5 Evitar estados repetidos.............................................................................................. 3.6 Bsqueda con informacin parcial ............................................................................ Problemas sin sensores ............................................................................................. Problemas de contingencia ....................................................................................... 3.7 Resumen .................................................................................................................... Notas bibliogrficas e histricas......................................................................................... Ejercicios .......................................................................................................................... 467 70 71 72 73 76 78 80 82 82 84 85 87 87 89 91 91 94 95 96 97 98 100Bsqueda inferna d a y exploracin1074.1 Estrategias de bsqueda informada (heursticas) ...................................................... Bsqueda voraz primero el m e jo r............................................................................. Bsqueda A*: minimizar el costo estimado total de la solucin................................ Bsqueda heurstica con memoria acotada............................................................... Aprender a buscar m ejor........................................................................................... 4.2 Funciones heursticas ................................................................................................ El efecto de la precisin heurstica en el rendimiento............................................... Inventar funciones heursticas admisibles................................................................. Aprendizaje de heursticas desde la experiencia....................................................... 4.3 Algoritmos de bsqueda local y problemas de optimizacin ....................................107 108 110 115 118 119 120 121 124 125www.FreeLibros.me 9. CONTENIDOV IIBsqueda de ascensin de colinas............................................................................. Bsqueda de temple simulado................................................................................... Bsqueda por haz lo c a l............................................................................................. Algoritmos genticos................................................................................................ 4.4 Bsqueda local en espados continuos........................................................................ 4.5 Agentes de bsqueda Online y ambientes desconocidos............................................ Problemas de bsqueda en lnea (anlne) ................................................................. Agentes de bsqueda en lnea (onJln) ..................................................................... Bsqueda local en lnea (anline)............................................................................... Aprendizaje en la bsqueda en lnea (online)........................................................... 4.6 Resumen ................................................................................................................... Notas bibliogrficas e histricas......................................................................................... Ejercicios .......................................................................................................................... 5126 129 131 131 136 138 138 141 142 144 145 146 1517155155 159 162 163 163 164 166 167 169 171 175 176 178Bsqueda entre ad vesarios1816.1 Juegos ....................................................................................................................... 6.2 Dedsiones ptimas en ju e g o s.................................................................................... Estrategias ptimas .................................................................................................. El algoritmo minimax............................................................................................... Decisiones ptimas en juegos multt-jugador............................................................. 6.3 Poda alfa-beta ........................................................................................................... 6.4 Decisiones en tiempo real imperfectas ...................................................................... Funciones de evaluacin .......................................................................................... Corte de la bsqueda................................................................................................ 6.5 Juegos que incluyen un elemento de posibilidad ...................................................... Evaluacin de la posicin en juegos con nodos de posibilidad................................. Complejidad del mlnlmaxesperado........................................................................... Juegos de cartas........................................................................................................ 6.6 Programas de juegos ................................................................................................. 6.7 Discusin................................................................................................................... 6.8 Resumen ................................................................................................................... Notas bibliogrficas e histricas......................................................................................... prcidos ..........................................................................................................................6Problemas d e satisfaccin de rastrcrion e5.1 Problemas de satisfaccin de restricciones................................................................ 5.2 Bsqueda con vuelta atrs para P S R .......................................................................... Variable y ordenamiento de valor ............................................................................. Propagacin de la informacin a travs de las restricciones..................................... Comprobacin hada delante..................................................................................... Propagacin de restrlcdones..................................................................................... Manejo de restricciones especiales ........................................................................... Vuelta atrs Inteligente: mirando hacia atrs............................................................. 5.3 Bsqueda local para problemas de satisfaccin de restrlcdones .............................. 5.4 La estructura de los problemas ................................................................................. 5.5 Resumen ................................................................................................................... Notas bibliogrficas e histricas......................................................................................... Ejercicios ..........................................................................................................................181 183 183 185 186 188 191 192 194 196 198 199 200 202 205 207 208 212A g ite l ceo s2177.1 Agentes basados en conocimiento.............................................................................. 7.2 El mundo de wumpus ...............................................................................................219 221www.FreeLibros.me 10. vmCONTENIDO7.3 Lgica ....................................................................................................................... 7.4 Lgica preposicional: una lgica muy sencilla.......................................................... Sintaxis ..................................................................................................................... Semntica ................................................................................................................ Una base de conocimiento sencilla........................................................................... Inferencia.................................................................................................................. Equivalencia, validez y satisfacibidad................................................................... 7.5 Patrones de razonamiento en lgica preposicional.................................................... Resolucin................................................................................................................ Forma normal conjuntiva........................................................................................... Un algoritmo de resolucin....................................................................................... Completud de la resolucin..................................................................................... Encadenamiento hacia delante y hacia a tr s ............................................................. 7.6 Inferencia preposicional efectiva................................................................................ Un algoritmo completo con backtracking (vuelta atrs)....................................... Algoritmos de bsqueda lo c a l................................................................................... Problemas duros de satisfacibilidad......................................................................... 7.7 Agentes basados en lgica preposicional .................................................................. Encontrar hoyos y wurnpus utilizando la inferencia lgica........................................ Guardar la pista acerca de la localizacin y la orientacin del agente ...................... Agentes basados en circuitos..................................................................................... Una comparacin....................................................................................................... 7.8 Resumen .................................................................................................................... Notas bibliogrficas e histricas......................................................................................... Ejercicios .......................................................................................................................... 8224 229 229 230 233 233 235 236 239 241 242 243 244 248 248 249 251 253 253 255 256 260 261 262 266L^ca de primer arden 8.1 Revisin de la representacin .................................................................................... 8.2 Sintaxis y semntica de la lgica de primer orden .................................................... Modelos en lgica de primer orden........................................................................... Smbolos e interpretaciones....................................................................................... Trminos .................................................................................................................. Sentencias atmicas.................................................................................................. Sentencias compuestas ............................................................................................. Cuantificadores ........................................................................................................ Cuantificador universal (V )....................................................................................... Cuantificacin existencia! (3) ................................................................................... Cuantificadores anidados........................................................................................... Conexiones entre V y 3 ............................................................................................. Igualdad..................................................................................................................... 8.3 Utilizar la lgica de primer o rd e n .............................................................................. Aserciones y peticiones en lgica de primer orden................................................... El dominio del parentesco......................................................................................... Nmeros, conjuntos y listas....................................................................................... El mundo de wumpus ............................................................................................... 8.4 Ingeniera del conocimiento con lgica de primer orden .......................................... El proceso de ingeniera del conocimiento............................................................... El dominio de los circuitos electrnicos................................................................... Identificar la tarea .................................................................................................... Recopilar el conocimiento relevante......................................................................... Decidir el vocabulario...............................................................................................271 271 277 277 278 280 281 281 281 282 283 284 285 286 287 287 288 290 292 295 296 297 298 298 299www.FreeLibros.me 11. CONTENIDOCodificar el conocimiento general del dominio ....................................................... Codificar la instancia del problema especfico......................................................... Plantear peticiones al procedimiento de inferencia................................................... Depurar la base de conocimiento ............................................................................. 8.5 Resumen ........................................................................................ Notas bibliogrficas e histricas......................................................................................... Ejercicios .......................................................................................................................... 9IX300 300 301 301 302 303 304Inferencia en l^ ca d e prim er crden3099.1Lgica preposicional vs. Lgica de primer orden......................................................... Reglas de inferencia para cuantificadores................................................................. Reduccin a la inferencia preposicional................................................................... 9.2 Unificacin y sustitucin............................................................................ Una regla de inferencia de primer orden................................................................... Unificacin .............................................................................................................. Almacenamiento y recuperacin............................................................................... 9.3 Encadenamiento hacia delante ....................................................................... Clusulas positivas de primer orden ......................................................................... Un algoritmo sencillo de encadenamiento hacia delante ......................................... Encadenamiento hacia delante eficiente................................................................... Emparejar reglas con los hechos conocidos ............................................................. Encadenamiento hacia delante incremental............................................................... Hechos irrelevantes.................................................................................................. 9.4 Encadenamiento hacia atrs ......................................................................... Un algoritmo de encadenamiento hacia atrs ........................................................... Programacin lgica ................................................................................................ Implementacin eficiente de programas lgicos....................................................... Inferencia redundante y bucles infinitos................................................................... Programacin lgica con restricciones..................................................................... 9.5 Resolucin....................................................................................... Formas normales conjuntivas en lgica de primer orden ......................................... La regla de inferencia de resolucin......................................................................... Demostraciones de ejemplo....................................................................................... Completitud de la resolucin..................................................................................... Manejar la igualdad.................................................................................................. Estrategias de resolucin.......................................................................................... Resolucin unitaria .................................................................................................. Resolucin mediante conjunto soporte..................................................................... Resolucin lin eal...................................................................................................... Subsuncin .............................................................................................................. Demostradores de teoremas....................................................................................... Diseo de un demostrador de teoremas..................................................................... Ampliar el Prolog ..................................................................................................... Demostradores de teoremas como asistentes ........................................................... Usos prcticos de los demostradores de teoremas..................................................... 9.6 Resumen ........................................................................................ Notas bibliogrficas e histricas......................................................................................... Ejercicios ..........................................................................................................................310 310 311 312 313 314 315 318 318 320 322 322 324 326 326 327 328 330 332 334 335 336 338 338 341 345 346 346 347 347 347 348 348 349 350 351 352 353 35910 Representacin del conodm iento10.1 Ingeniera ortolgica............................................................................................. 10.2 Categora y objetos ...............................................................................................www.FreeLibros.me363363 366 12. XCONTENIDOObjetos compuestos.............................................................................................. Medidas................................................................................................................ Sustancias y objetos............................................................................................... 10.3 Acciones, situaciones y eventos ............................................................................ La ontologa del clculo de situaciones................................................................. Descripcin de acciones en el clculo de situaciones........................................... Resolver el problema de la representacin del m arco........................................... Resolver el problema de la Inferencia del marco ................................................. El tiempo y el clculo de eventos ......................................................................... Eventos generalizados........................................................................................... Procesos................................................................................................................ Intervalos.............................................................................................................. Flujos y objetos..................................................................................................... 10.4 Eventos mentales y objetos mentales .................................................................... Una teora formal de creencias ............................................................................. Conocimiento y creencia....................................................................................... Conocimiento, tiempo y accin............................................................................. 10.5 El mundo de la compra por Internet ...................................................................... Comparacin de ofertas......................................................................................... 10.6 Sistemas de razonamiento para categoras ............................................................ Redes semnticas.................................................................................................. Lgica descriptiva................................................................................................. 10.7 Razonamiento con informacin por defecto.......................................................... Mundos abiertos y cerrados................................................................................... Negacin como fallo y semnticas de modelado estables..................................... Circunscripcin y lgica por defecto..................................................................... 10.8 Sistemas de mantenimiento de verdad .................................................................. 10.9 Resumen ............................................................................................................... Notas bibliogrficas e histricas....................................................................................... Ejercicios ........................................................................................................................ 11368 369 371 373 373 375 377 379 380 381 383 384 386 387 387 389 390 391 395 397 397 401 402 403 405 406 409 411 412 419P laiificarin42711.1 El problema de planificacin................................................................................. El lenguaje de los problemas de planificacin ..................................................... Expresividad y extensiones................................................................................... Ejemplo: transporte de caiga areo ....................................................................... Ejemplo: el problema de la rueda de recambio..................................................... Ejemplo: el mundo de los bloques ....................................................................... 11.2 Planificacin con bsquedas en espacios de estado .............................................. Bsquedas hada-delante en el espacio de estados ............................................... Bsquedas hada-atrs en el espacio de estados ................................................... Heursticas para la bsqueda en el espado de estados ......................................... 11.3 Planificacin ordenada parcialmente...................................................................... Ejemplo de planificadn de orden parcial ........................................................... Planificacin de orden pardal con variables independientes ................................ Heursticas para planificacin de orden parcial..................................................... 11.4 Grafos de planificacin......................................................................................... Grafos de planificacin para estimacin de heursticas ........................................ El algoritmo G r a p h p l a n ....................................................................................... Interrupcin de G r a p h p l a n ................................................................................... 11.5 Planificacin con lgica proposidonal..................................................................428 429 431 433 434 434 436 436 438 439 441 445 448 449 450 453 454 457 458www.FreeLibros.me 13. CONTENIDOXIDescripcin de problemas de planificacin en lgica preposicional .................... Complejidad de codificaciones preposicionales................................................... 11.6 Anlisis de los enfoques de planificacin............................................................. 11.7 Resumen ............................................................................................................... Notas bibliogrficas e histricas....................................................................................... prcidos ........................................................................................................................458 462 463 465 466 46912 Planificarin y accin o d m u id o real12.1 Tiempo, planificacin y recursos........................................................................... Programacin con restriccin de recursos............................................................. 12.2 Redes de planificacin jerrquica de tareas............................................................ Representacin de descomposicin de acciones................................................... Modificacin de planificadores para su descomposicin ..................................... Discusin.............................................................................................................. 12.3 Planificacin y accin en dominios no deterministas............................................ 12.4 Planificacin condicional ..................................................................................... Planificacin condicional en entornos completamente observables...................... Planificacin condicional en entornos parcialmente observables.......................... 12.5 Vigilancia de ejecucin y replanificacin............................................................. 12.6 Planificacin continua........................................................................................... 12.7 Planificacin multiagente ..................................................................................... Cooperacin: planes y objetivos conjuntos........................................................... Planificacin condicional en entornos parcialmente observables.......................... Mecanismos de coordinacin ............................................................................... Mecanismos de coordinacin ............................................................................... 12.8 Resumen ............................................................................................................... Notas bibliogrficas e histricas....................................................................................... prcidos ........................................................................................................................ 13 Incfrtdiiinbre475475 478 481 482 484 487 490 493 493 498 502 507 512 512 514 515 517 517 518 522 52713.1 Comportamiento bajo inceitidumbre..................................................................... Manipulacin del conocimiento incierto............................................................... Incertidumbre y decisiones racionales ................................................................. Diseo de un agente de decisin terico............................................................... 13.2 Notacin bsica con probabilidades ..................................................................... Proposiciones........................................................................................................ Sucesos atmicos.................................................................................................. Probabilidad priori................................................................................................ Probabilidad condidonal...................................................................................... 13.3 Los axiomas de la probabilidad............................................................................. Utilizadn de los axiomas de probabilidad ......................................................... Por qu los axiomas de la probabilidad son razonables ....................................... 13.4 Inferenda usando las distribuciones conjuntas totales .......................................... 13.5 Independencia ....................................................................................................... 13.6 La Regla de Bayes y su u so ................................................................................... Aplicadn de la regla de Bayes: el caso sencillo ................................................. Utilizadn de la regla de Bayes: combinacin de evidencia ................................ 13.7 El mundo wumpus revisado................................................................................... 13.8 Resumen ............................................................................................................... Notas bibliogrficas e histricas....................................................................................... prcidos ........................................................................................................................www.FreeLibros.me527 528 530 531 532 532 534 534 536 537 539 540 541 544 546 547 548 550 554 555 557 14. X IICONTENIDO1415Razonamiento prahaUHala56114.1 La representacin del conocimiento en un dominio incierto ................................ 14.2 La semntica de las redes bayesianas .................................................................... La representacin de la distribucin conjuntacompleta........................................ Un mtodo para la construccin de redes bayesianas........................................... Compactacin y ordenacin de nodos................................................................... Relaciones de independencia condicional enredes bayesianas ............................. 14.3 Representacin eficiente de las distribuciones condicionales................................ Redes bayesianas con variables continuas ........................................................... 14.4 Inferencia exacta en redes bayesianas.................................................................... Inferencia por enumeracin................................................................................... El algoritmo de eliminacin de variables ............................................................. La complejidad de la inferencia exacta................................................................. Algoritmos basados en grupos ............................................................................. 14.5 Inferencia aproximada en redes bayesianas............................................................. Mtodos de muestreo directo ............................................................................... Muestreo por rechazo en redes bayesianas........................................................... Ponderacin de la verosimilitud ........................................................................... Inferencia por simulacin en cadenas de Markov................................................. 14.6 Extensin de la probabilidad a representaciones de primer orden ........................ 14.7 Otros enfoques al razonamiento con incertidumbre.............................................. Mtodos basados en reglas para razonamiento con incertidumbre........................ Representacin de la ignorancia: teora de Dempster-Shafer................................ Representacin de la vaguedad: conjuntos difusos y lgica difusa........................ 14.8. Resumen ............................................................................................................... Notas bibliogrficas e histricas....................................................................................... Ejercicios ........................................................................................................................561 564 564 565 566 568 569 571 574 575 577 580 580 581 582 583 585 587 590 595 596 598 599 601 601 606Razonamienlo p rahaU h bi en d tiem po61115.1 El tiempo y la incertidumbre................................................................................. Estados y observaciones ....................................................................................... Procesos estacionarios e hiptesis de Markov....................................................... 15.2 Inferencia en modelos temporales.......................................................................... Filtrado y prediccin............................................................................................. Suavizado ............................................................................................................. Encontrar la secuencia ms probable ................................................................... 15.3 Modelos ocultos de Markov .................................................................................. Algoritmos matridales simplificados ................................................................... 15.4 Filtros de Raiman ................................................................................................. Actualizacin de distribuciones gaussianas........................................................... Un ejemplo unidimensional sencillo..................................................................... El caso general....................................................................................................... Aplicabilidad del filtrado de Raiman ................................................................... 15.5 Redes bayesianas dinmicas................................................................................. Construccin de RBDs ......................................................................................... Inferencia exacta en RBDs ................................................................................... Inferencia aproximada en R B D s........................................................................... 15.6 Reconocimiento del h ab la..................................................................................... Sonidos del habla.................................................................................................. Palabras................................................................................................................ Oraciones..............................................................................................................611 612 613 616 617 619 622 624 624 627 628 629 632 633 635 636 640 641 645 647 649 651www.FreeLibros.me 15. CONTENIDOConstruccin de un reconocedor del h a b la ........................................................... 15.7 Resumen ............................................................................................................... Notas bibliogrficas e histricas....................................................................................... Ejercicios ........................................................................................................................ 16 Toma d e decisiones sencillas16.1 Combinacin de creencias y deseos bajo condiciones de incertidumbre .............. 16.2 Los fundamentos de la teora de la utilidad............................................................ Restricciones sobre preferencias racionales ......................................................... ... y entonces apareci la utilidad ......................................................................... 16.3 Funciones de utilidad............................................................................................. La utilidad del dinero ........................................................................................... Escalas de utilidad y evaluacin de la utilidad....................................................... 16.4 Funciones de utilidad multiatributo........................................................................ Predominio .......................................................................................................... Estructura de preferencia y utilidad multiatributo................................................. Preferencias sin incertidumbre ............................................................................. Preferencias con Incertidumbre............................................................................. 16.5 Redes de decisin ................................................................................................. Representacin de un problema de decisin mediante una red de decisin Evaluacin en redes de decisin........................................................................... 16.6 El valor de la informacin...................................................................................... Un ejemplo sencillo............................................................................................... Una frmula general ............................................................................................. Propiedades del valor de la informacin............................................................... Implementacin de un agente recopilador de informacin................................... 16.7 Sistemas expertos basados en la teora de la decisin............................................ 16.8 Resumen ............................................................................................................... Notas bibliogrficas e histricas....................................................................................... Ejercicios ........................................................................................................................ 17 Toma d e decisiones conqdejas17.1 Problemas de decisin secuenciales ...................................................................... Un ejemplo .......................................................................................................... Optimalidad en problemas de decisin secuenciales ........................................... 17.2 Iteracin de valores............................................................................................... Utilidades de los estados....................................................................................... El algoritmo de iteracin de valores ..................................................................... Convergencia de la iteracin de valores ............................................................... 17.3 Iteracin de polticas............................................................................................. 17.4 Procesos de decisin de Markov parcialmenteobservables ................................... 17.5 Agentes basados en la teora de la decisin .......................................................... 17.6 Decisiones con varios agentes: teora de ju e g o s.................................................... 17.7 Diseo de mecanismos ......................................................................................... 17.8 Resumen ............................................................................................................... Notas bibliogrficas e histricas....................................................................................... prcidos ........................................................................................................................ 18 A pratdzaje d e observaciones18.1 Formas de aprendizaje........................................................................................... 18.2 Aprendizaje inductivo...........................................................................................www.FreeLibros.meX III654 656 656 659 663664 665 666 668 669 669 671 674 674 677 677 678 679 679 681 682 682 683 685 685 686 690 690 692 697698 698 701 704 704 705 707 710 712 716 719 729 732 733 736 739739 742 16. X IVCONTENIDO18.3 Aprender rboles de decisin ................................................................................ rboles de decisin como herramienta de desarrollo........................................... Expresividad de los rboles de decisin ............................................................... Inducir rboles de decisin a partir de ejemplos................................................... Eleccin de los atributos de test ........................................................................... Valoracin de la calidad del algoritmo de aprendizaje ......................................... Ruido y sobreajuste............................................................................................... Extensin de la aplicabilidad de los rboles de decisin........................................ 18.4 Aprendizaje de conjuntos de hiptesis .................................................................. 18.5 Por qu funciona el aprendizaje?: teora computacional del aprendizaje Cuntos ejemplos se necesitan?........................................................................... Aprendizaje de listas de decisin ......................................................................... Discusin.............................................................................................................. 18.6 Resumen ............................................................................................................... Notas bibliogrficas e histricas....................................................................................... Ejercicios ........................................................................................................................ 19744 744 745 746 750 752 753 755 756 760 761 763 765 766 767 76930Canorimieno en d aprendizaje77319.1 Una formulacin lgica del aprendizaje................................................................ Ejemplos e hiptesis ............................................................................................. Bsqueda mejor-hiptesis-actual........................................................................... Bsqueda de mnimo compromiso ....................................................................... 19.2 Conocimiento en el aprendizaje ............................................................................ Algunos ejemplos sencillos................................................................................... Algunos esquemas generales................................................................................. 19.3 Aprendizaje basado en explicaciones .................................................................... Extraer reglas generales a partir de ejemplos ....................................................... Mejorar la eficiencia............................................................................................. 19.4 Aprendizaje basado en informacin relevante........................................................ Determinar el espacio de hiptesis ....................................................................... Aprender y utilizar informacin relevante............................................................. 19.5 Programacin lgica inductiva ............................................................................. Un ejemplo ........................................................................................................... Mtodos de aprendizaje inductivo de arriba a abajo (Tq)-down) .......................... Aprendizaje inductivo con deduccin inversa....................................................... Hacer descubrimientos con la programacin lgica inductiva .............................. 18.6 Resumen ............................................................................................................... Notas bibliogrficas e histricas....................................................................................... Eercicios..........................................................................................................................773 774 776 778 782 784 784 786 787 789 791 792 792 795 795 798 801 803 805 806 809M todos estadsticos d e apnntE zaje81120.1 Aprendizaje estadstico......................................................................................... 20.2 Aprendizaje con datos completos .......................................................................... Aprendizaje del parmetro de mxima verosimilitud:modelos discretos............... Modelos de Bayes simples (Naive Bayes) ........................................................... Aprendizaje de parmetros de mxima verosimilitud: modeloscontinuos Aprendizaje de parmetros Bayesiano ................................................................. Aprendizaje de la estructura de las redes bayesianas.............................................. 20.3 Aprendizaje con variables ocultas: el algoritmo EM ..................................... Agrupamiento no supervisado: aprendizaje de mezclas de gaussianas.................. Aprendizaje de redes bayesianas con variables ocultas ........................................811 815 815 818 819 821 823 825 826 829www.FreeLibros.me 17. CONTENIDOAprendizaje de modelos de Markov ocultos......................................................... Forma general del algoritmo EM ......................................................................... Aprendizaje de la estructura de las redes de Bayes con variables ocultas ............ 20.4 Aprendizaje basado en instancias ........................................................................ Modelos de vecinos ms cercanos......................................................................... Modelos ncleo..................................................................................................... 20.5 Redes neuronales.................................................................................................. Unidades en redes neuronales............................................................................... Estructuras de las red e s......................................................................................... Redes neuronales de una sola capa con alimentacin-hacia-delante (perceptrones). Redes neuronales multtcapa con alimentacin hacia delante................................ Aprendizaje de la estructura de las redes neuronales ........................................... 20.6 Mquinas ncleo .................................................................................................. 20.7 Caso de estudio: reconocedor de dgitas escritos a m ano..................................... 20.8 Resumen .............................................................................................................. Notas bibliogrficas e histricas....................................................................................... prcidos ........................................................................................................................ 21XV831 832 833 834 835 837 838 839 840 842 846 851 851 855 857 859 863A praiifizaje por refuerzo86721.1 21.2867 869 870 871 872 876 876 880 882 885 886 887 890 891 894Introduccin.......................................................................................................... Aprendizaje por refuerzo pasivo.......................................................................... Estimacin recta de la utilidad........................................................................... Programacin dinmica adaptativa ....................................................................... Aprendizaje de diferencia temporal ..................................................................... 21.3 Aprendizaje por refuerzo activo .......................................................................... Exploracin.......................................................................................................... Aprendizaje de una Funcin Accin-Valor........................................................... 21.4 Generalizacin en aprendizaje por refuerzo ......................................................... Aplicaciones a juegos ........................................................................................... Aplicacin a control de robots............................................................................... 21.5 Bsqueda de la poltica........................................................................................ 21.6 Resumen .............................................................................................................. Notas bibliogrficas e histricas...................................................................................... prcidos ........................................................................................................................ 22La conM iicaoi89722.1898 899 900 903 904 904 905 908 914 916 918 919 920 921 92222.222.3 22.422.5La comunicacin como accin ............................................................................ Fundamentos del lenguaje..................................................................................... Rapas de la comunicacin ................................................................................... Una gramtica formal para un fragmento del espaol ......................................... H lxico de eO ...................................................................................................... La Gramtica de e O ............................................................................................... Anlisis sintctico................................................................................................ Anlisis sintctico eficiente................................................................................... Gramticas aumentadas........................................................................................ Subcategorizacin del v erb o ................................................................................. Capacidad generativa de las gramticas aumentadas ........................................... Interpretadn semntica...................................................................................... La semntica de un fragmento en espaol............................................................. Tiempo y forma verbal ......................................................................................... Qiantificacin......................................................................................................www.FreeLibros.me 18. XVICONTENIDOInterpretacin pragmtica ..................................................................................... Generacin de lenguajes con DCGs ..................................................................... 22.6 Ambigedad y desambigedad............................................................................. Desambiguacin ................................................................................................... 22.7 Comprensin del discurso.................................................................................... Resolucin por referencia..................................................................................... La estructura de un discurso coherente................................................................. 22.8 Induccin gramatical............................................................................................ 22.9 Resumen .............................................................................................................. Notas bibliogrficas e histricas....................................................................................... Ejercicios ........................................................................................................................ 23 P rocesainm to probabiMstico tld len ^ iaje23.1Modelos probabilsticos del lenguaje ................................................................... Gramticas probabilsticas independientes del contexto....................................... Aprendizaje de probabilidades para PCFGs ......................................................... Aprendizaje de la estructura de las reglas para PCFGs......................................... 23.2 Recuperacin de datos.......................................................................................... Evaluacin de los Sistemas de RD ....................................................................... Refinamientos R D ................................................................................................. Presentacin de los conjuntos de resultados......................................................... Implementar sistemas R D ..................................................................................... 23.3 Extraccin de la informacin .............................................................................. 23.4 Traduccin automtica ........................................................................................ Sistemas de traduccin automticos ..................................................................... Traduccin automtica estadstica......................................................................... Probabilidades de aprendizaje para la traduccin automtica................................ 23.5 Resumen .............................................................................................................. Notas bibliogrficas e histricas....................................................................................... Ejercicios ........................................................................................................................ 24 F vceprin925 926 927 929 930 931 932 934 936 937 941 945945 949 950 951 952 955 956 957 959 961 964 966 967 970 972 972 975 97924.1 24.2Introduccin.......................................................................................................... Formacin de la imagen ...................................................................................... Imgenes sin lentes: la cmara de orificio o pinhole............................................. Sistemas de le n tes................................................................................................. Luz: la fotometra de la formacin de imgenes................................................... Color: la espectrofotometra de la formacin de imgenes................................... 24.3 Operaciones de procesamiento de imagen a bajo nivel......................................... Deteccin de aristas............................................................................................... Segmentacin de la imagen................................................................................... 24.4 Extraccin de informacin tridimensional ........................................................... Movimiento........................................................................................................... Estereoscopia binocular......................................................................................... Gradientes de textura............................................................................................. Sombreado............................................................................................................ Contorno .............................................................................................................. 24.5 Reconocimiento de objetos.................................................................................. Reconocimiento basado en la intensidad............................................................... Reconocimiento basado en las caractersticas....................................................... Estimacin de postura...........................................................................................www.FreeLibros.me979 981 982 983 983 985 986 987 990 991 993 996 997 999 1000 1004 1007 1008 1010 19. CONTENIDOXVn24.6 Empleo de la visin para la manipulacin y navegacin...................................... 24.7 Resumen .............................................................................................................. Notas bibliogrficas e histricas...................................................................................... prcidos ........................................................................................................................ 251012 1014 1015 1018 1023Introduccin.......................................................................................................... Hardware robtico................................................................................................ Sensores................................................................................................................ Efectores .............................................................................................................. 25.3 Percepcin robtica.............................................................................................. Localizacin ........................................................................................................ Generacin de mapas............................................................................................ Otros tipos de percepcin..................................................................................... 25.4 Planear el movimiento.......................................................................................... Espacio de configuracin ..................................................................................... Mtodos de descomposicin en celdas ................................................................. Mtodos de esqueletizacin................................................................................... 25.5 Planificar movimientos inciertos.......................................................................... Mtodos robustos.................................................................................................. 25.6 Movimiento.......................................................................................................... Dinmica y control ............................................................................................... Control del campo de potencial............................................................................. Control reactivo..................................................................................................... 25.7 Arquitecturas software robticas.......................................................................... Arquitectura de subsumpcin ............................................................................... Arquitectura de tres cap as..................................................................................... Lenguajes de programacin robticos................................................................... 25.8 Dominios de aplicacin........................................................................................ 25.9 Resumen .............................................................................................................. Notas bibliogrficas e histricas....................................................................................... prcidos ........................................................................................................................1023 1025 1025 1027 1029 1031 1036 1039 1039 1040 1043 1046 1047 1048 1051 1051 1054 1055 1057 1058 1059 1060 1061 1064 1065 1069Fundamentos filosficos107526.12BRobtica25.1 25.21075 1077 1078 1079 1081 1084 1085 1086 1088 1090 1095 1095 1098IA dbil: pueden las mquinas actuar con inteligencia?..................................... 0 argumento de incapaddad................................................................................. La objecin matemtica......................................................................................... 0 argumento de la informalidad........................................................................... 26.2 IA fuerte: pueden las mquinas pensar de verdad?............................................. 0 problema de mente-cuerpo............................................................................... 0 experimento del cerebro en una cubeta......................................................... 0 experimento de la prtesis cerebral................................................................... La habitacin c h in a .............................................................................................. 26.3 La tica y los riesgos de desarrollar la Inteligencia Artificial............................... 26.4 Resumen .............................................................................................................. Notas bibliogrficas e histricas...................................................................................... Ejercicios ........................................................................................................................ 27IA: presente y futuro109927.1 27.21099 1102Componentes de los agentes................................................................................ Arquitecturas de agentes......................................................................................www.FreeLibros.me 20. xvmCONTENIDO27.3 27.4 AEstamos llevando la direccin adecuada?.......................................................... Qu ocurrira si la IA tuviera xito? ..................................................................1104 1106 1109Anlisis de la complejidad y la notacin 0 ( ) ....................................................... Anlisis asinttico................................................................................................. Los problemas inherentemente difciles y N P ....................................................... A. 2 Vectores, matrices y lgebra lineal ...................................................................... A.3 Distribuciones de probabilidades ........................................................................ Notas bibliogrficas e histricas.......................................................................................1109 1109 1110 1112 1114 1115Notas sobre lenguajes y algoritm os1117B. 1 B.2 B.3BF indam aitos matemticosA. 11117 1118 1119Definicin de lenguajes con Backus-Naur Form (BNF)....................................... Algoritmos de descripcin en pseudocdigo......................................................... Ayuda en ln ea......................................................................................................BiM iog-afla1121tntficc alfabtico1179www.FreeLibros.me 21. PrlogoLa Inteligencia Artificial (IA) es un campo grande (enorme), y este libro tambin. He intentado explorarlo con plena profundidad acompandolo constantemente de lgica, probabilidad y matemticas; de percepcin, razonamiento, aprendizaje y accin, es decir, de todo lo que procede de los dispositivos microelectrnicos hasta los explorado res del planetario de la robtica. Otra razn para que este libro se pueda considerar esplndido es la profundidad en la presentacin de los resultados, aunque nos hayamos esforzado por abarcar slo las ideas ms centrales en la parte principal de cada captu lo. En las notas bibliogrficas al final de cada captulo se proporcionan consejos para promover resultados. El subttulo de este libro es Un Enfoque Moderno. La intencin de esta frase bas tante vaca es el hecho de que hemos intentado sintetizar lo que se conoce ahora dentro de un marco de trabajo comn, en vez de intentar explicar cada uno de los subcampos de la IA dentro de su propio contexto histrico. Nos disculpamos ante aquellos cuyos subcampos son, como resultado, menos reconocibles de lo que podran haber sido de cual quier otra forma. El principal tema unificador es la idea del ag m tein td ig m te Definimos la IA como el estudio de los agentes que reciben percepciones del entorno y llevan a cabo las ac ciones. Cada agente implementa una funcin la cual estructura las secuencias de las per cepciones en acciones; tambin tratamos las diferentes formas de representar estas fun dones, tales como sistemas de produccin, agentes reactivos, planificadores condicionales en tiempo real, redes neurales y sistemas tericos para las decisiones. Explicaremos el papel del aprendizaje cuando alcanza al diseador y cmo se introduce en entornos des conocidos, mostrando tambin cmo ese papel limita el diseo del agente, favorecien do as la representacin y el razonamiento explcitos del conocimiento. Trataremos la robtica y su visin no como problemas con una definicin independiente, sino como algo que ocurre para lograr los objetivos. Daremos importancia al entorno de las tareas al determinar el diseo apropiado de los agentes.www.FreeLibros.me 22. XXPRLOGONuestro objetivo principal es el de transmitir las ideas que han surgido durante los ltimos 50 aos de investigacin en IA y trabajos afines durante los dos ltimos mile nios. Hemos intentado evitar una excesiva formalidad en la presentacin de estas ideas a la vez que hemos intentado cuidar la precisin. Siempre que es necesario y adecuado, incluimos algoritmos en pseudo cdigo para concretar las ideas, lo que se describe en el Apndice B. Las implementaciones en varios lenguajes de programacin estn dis ponibles en el sitio Web de este libro, en la direccin de Internet na.cs.boi Q-?cr c5Actuadores -AccionesFigura 2.1 Los agentes interactan con el medioambiente mediante sensores y efectores.PERCEPCINSECUENCIA DE PERCEPTORESpie. Un agente humano tiene ojos, odos y otros rganos sensoriales adems de manos, piernas, boca y otras partes del cuerpo para actuar. Un agente robot recibe pulsaciones del teclado, archivos de informacin y paquetes va red a modo de entradas sensoriales y acta sobre el medio con mensajes en el monitor, escribiendo ficheros y enviando pa quetes por la red. Se trabajar con la hiptesis general de que cada agente puede perci bir sus propias acciones (pero no siempre sus efectos). El trmino p t r a p d A i se utiliza en este contexto para indicar que el agente puede recibir entradas en cualquier instante. La s e m a n a de poxepdones de un agente refleja el historial completo de lo que el agente ha recibido. En general, un agentetomar una decisin en un momento dado dependiendo de la secuencia completa de per cepciones hasta ese instante. Si se puede especificar qu decisin tomar un agente paraFUNCIN DEL AGENTEcada una de las posibles secuencias de percepciones, entonces se habr explicado ms o menos todo lo que se puede decir de un agente. En trminos matemticos se puede de cir que el comportamiento del agente viene dado por la fundn d d aganeque proyecta una percepcin dada en una accin. La funcin que describe el comportamiento de un agente se puede presentar en for ma de tabla; en la mayora de los casos esta tabla sera muy grande (infinita a menos que se limite el tamao de la secuencia de percepciones que se quiera considerar). Dado un agente, con el que se quiera experimentar, se puede, en principio, construir esta ta bla teniendo en cuenta todas las secuencias de percepcin y determinando qu accin lleva a cabo el agente en respuesta2. La tabla es, por supuesto, una caracterizacin ex terna del agente. Inicialmente, la funcin del agente para un agente artificial se imple2 Si el agente selecciona la accin de manera aleatoria, entonces seria necesario probar cada secuencia mu chas veces para identificar la probabilidad de cada accin. Se puede pensar que actuar de manera aleatoria es ridiculo, pero como se ver posteriormente puede ser muy inteligente.www.FreeLibros.me 67. AGENTES INTELIGENTESPROGRAMA DEL AGENTE39mentar mediante el ro m a n a del agente Es importante diferenciar estas dos ideas. La funcin del agente es una descripcin matemtica abstracta; el programa del agente es una implementacin completa, que se ejecuta sobre la arquitectura del agente. Para ilustrar esta idea se utilizar un ejemplo muy simple, el mundo de la aspirado ra presentado en la Figura 2.2. Este mundo es tan simple que se puede describir todo lo que en l sucede; es un mundo hecho a medida, para el que se pueden inventar otras va riaciones. Este mundo en particular tiene solamente dos localizaciones: cuadrcula A y B. La aspiradora puede percibir en qu cuadrante se encuentra y si hay suciedad en l. Puede elegir si se mueve hacia la izquierda, derecha, aspirar la suciedad o no hacer nada. Una funcin muy simple para el agente vendra dada por: si la cuadrcula en la que se encuentra est sucia, entonces aspirar, de otra forma cambiar de cuadrcula. Una muestra parcial de la funcin del agente representada en forma de tabla aparece en la Figura 2.3. Un programa de agente simple para esta funcin de agente se mostrar posteriormente en la Figura 2.8.Flgpra 2.2 El mundo de la aspiradora con dos localizaciones solamente.Secuencia de percqtdonesAccin[A, Limpio) [A, Sucio) [B, Limpio) B, Sucio] [A, Limpio], [A, Limpio] [A, Limpio], [A, Sucio]Derecha Aspirar Izquierda Aspirar Derecha Aspirar[A, Limpio], [A, Limpio], )A, Limpio) [A, Limpio], [A, Limpio], [A, Sucio]Derecha Aspirar^ p r a 2 . 3 Tabla parcial de una funcin de agente sencilla para el mundo de la aspiradora que se muestra en la Figura 2.2.www.FreeLibros.me 68. 40INTELIGENCIA ARTIFICIAL. UN ENFOQUE MODERNORevisando la Figura 2.3, se aprecia que se pueden definir varios agentes para el mundo de la aspiradora simplemente rellenando la columna de la derecha de formas distintas. La pregunta obvia, entonces es: cul es la mejor forma de rellenar una tabla? En otras palabras, qu hace que un agente sea bueno o malo, inteligente o estpido? Estas pre guntas se responden en la siguiente seccin. Antes de terminar esta seccin, es necesario remarcar que la nocin de agente es su puestamente una herramienta para el anlisis de sistemas, y no una caracterizacin ab soluta que divida el mundo entre agentes y no agentes. Se puede ver una calculadora de mano como un agente que elige la accin de mostrar 4 en la pantalla, dada la secuencia de percepciones 2 + 2 =. Pero este anlisis difcilmente puede mejorar nuestro conocimiento acerca de las calculadoras.2.2Buen com portam iento: el concepto de racionalidad e n t e r a c io n a lUn agm teradonales aquel que hace lo correcto; en trminos conceptuales, cada elemento de la tabla que define la funcin del agente se tendra que rellenar correctamente. Obvia mente, hacer lo correcto es mejor que hacer algo incorrecto, pero qu significa hacer lo correcto? Como primera aproximacin, se puede decir que lo correcto es aquello que per mite al agente obtener un resultado mejor. Por tanto, se necesita determinar una forma de medir el xito. Ello, junto a la descripcin del entorno y de los sensores y actuadores del agente, proporcionar una especificacin completa de la tarea que desempea el agente. Dicho esto, ahora es posible definir de forma ms precisa qu significa la racionalidad.Medidas de rendimiento MEDIDAS DE RENDIMIENTOLas medidas de rm d b m a d o incluyen los criterios que determinan el xito en el com portamiento del agente. Cuando se sita un agente en un medio, ste genera una secuencia de acciones de acuerdo con las percepciones que recibe. Esta secuencia de acciones hace que su hbitat pase por una secuencia de estados. Si la secuencia es la deseada, enton ces el agente habr actuado correctamente. Obviamente, no hay una nica medida adecuada para todos los agentes. Se puede preguntar al agente por su opinin subjetiva acerca de su propia actuacin, pero muchos agentes seran incapaces de contestar, y otros podran engaarse a s mismos3. Por tanto hay que insistir en la importancia de utilizar medidas de rendimiento objetivas, que normalmente determinar el diseador encarga do de la construccin del agente. Si retomamos el ejemplo de la aspiradora de la seccin anterior, se puede proponer utilizar como medida de rendimiento la cantidad de suciedad limpiada en un perodo de 3 Los agentes humanos son conocidos en particular por su acidez, hacen creer que no quieren algo des pus de no haberlo podido conseguir, por ejemplo, Ah bueno, de todas formas no quera ese estpido Pre mio Nobel.www.FreeLibros.me 69. AGENTES INTELIGENTES41ocho horas. Con agentes racionales, por supuesto, se obtiene lo que se demanda. Un agen te racional puede maximizar su medida de rendimiento limpiando la suciedad, tirando la basura al suelo, limpindola de nuevo, y as sucesivamente. Una medida de rendimiento ms adecuada recompensara al agente por tener el suelo limpio. Por ejemplo, podra ga nar un punto por cada cuadrcula limpia en cada perodo de tiempo (quizs habra que incluir algn tipo de penalizacin por la electricidad gastada y el ruido generado). Comoregla general, es mejor disear medidas de utilidad de acuerdo con lo que se quiere para el entorno, ms que de acuerdo con cmo se cree que el agente debe comportarse. La seleccin de la medida de rendimiento no es siempre fcil. Por ejemplo, la no cin de suelo limpio del prrafo anterior est basada en un nivel de limpieza medio a lo largo del tiempo. Adems, este nivel medio de limpieza se puede alcanzar de dos for mas diferentes, llevando a cabo una limpieza mediocre pero continua o limpiando en pro fundidad, pero realizando largos descansos. La forma ms adecuada de hacerlo puede venir dada por la opinin de un encargado de la limpieza profesional, pero en realidad es una cuestin filosfica profunda con fuertes implicaciones. Qu es mejor, una vida temeraria con altos y bajos, o una existencia segura pero aburrida? Qu es mejor, una economa en la que todo el mundo vive en un estado de moderada pobreza o una en la que algunos viven en la abundancia y otros son muy pobres? Estas cuestiones se dejan como ejercicio para los lectores diligentes.Racionalidad La racionalidad en un momento determinado depende de cuatro factores: La medida de rendimiento que define el criterio de xito. El conocimiento del medio en el que habita acumulado por el agente. Las acciones que el agente puede llevar a cabo. La secuencia de percepciones del agente hasta este momento.Esto nos lleva a la d d n n de agarfe racional: En cada posible secuencia de percepciones, un agente racional deber emprender aque lla accin que supuestamente maximice su medida de rendimiento, basndose en las evi dencias aportadas por la secuencia de percepciones y en el conocimiento que el agente mantiene almacenado.Considerando que el agente aspiradora limpia una cuadrcula si est sucia y se mueve a la otra si no lo est (sta es la funcin del agente que aparece en la tabla de la Figu ra 2.3), se puede considerar racional? Depende! Primero, se debe determinar cul es la medida de rendimiento, qu se conoce del entorno, y qu sensores y actuadores tiene el agente. Si asumimos que: La medida de rendimiento premia con un punto al agente por cada recuadro lim pio en un perodo de tiempo concreto, a lo largo de una vida de 1.000 perodos. La geografa del medio se conoce apriori (Figura 2.2), pero que la distribucin de la suciedad y la localizacin inicial del agente no se conocen. Las cuadrculas se mantienen limpias y aspirando se limpia la cuadrcula en que se encuentre el agente. Las acciones Izquierda y Derecha mueven al agente hacia la izquierda ywww.FreeLibros.me 70. INTELIGENCIA ARTIFICIAL. UN ENFOQUE MODERNOderecha excepto en el caso de que ello pueda llevar al agente fuera del recinto, en este caso el agente permanece donde se encuentra. Las nicas acciones permitidas son Izquierda, Derecha, Aspirar y NoOp (no ha cer nada). El agente percibe correctamente su localizacin y si esta localizacin contiene su ciedad. Puede afirmarse que bajo estas circunstancias el agente es verdaderamente racional; el rendimiento que se espera de este agente es por lo menos tan alto como el de cualquier otro agente. El Ejercicio 2.4 pide que se pruebe este hecho. Fcilmente se puede observar que el agente puede resultar irracional en circunstan cias diferentes. Por ejemplo, cuando toda la suciedad se haya eliminado el agente osci lar innecesariamente hacia delante y atrs; si la medida de rendimiento incluye una penalizacin de un punto por cada movimiento hacia la derecha e izquierda, la respuesta del agente ser pobre. Un agente ms eficiente no har nada si est seguro de que todas las cuadrculas estn limpias. Si una cuadrcula se ensucia de nuevo, el agente debe iden tificarlo en una de sus revisiones ocasionales y limpiarla. Si no se conoce la geografa del entorno, el agente tendr que explorarla y no quedarse parado en las cuadrculas A y B. El Ejercicio 2.4 pide que se diseen agentes para estos casos.Om nisciencia, aprendizaje y autonoma OMNISCIENCIAEs necesario tener cuidado al distinguir entre racionalidad y m uiisciencia Un agente omnisciente conoce el resultado de su accin y acta de acuerdo con l; sin embargo, en realidad la omnisciencia no es posible. Considerando el siguiente ejemplo: estoy pa seando por los Campos Elseos y veo un amigo al otro lado de la calle. No hay trfico alrededor y no tengo ningn compromiso, entonces, actuando racionalmente, comenzara a cruzar la calle. Al mismo tiempo, a 33.000 pies de altura, se desprende la puerta de un avin4, y antes de que termine de cruzar al otro lado de la calle me encuentro aplastado. Fue irracional cruzar la calle? Sera de extraar que en mi nota necrolgica apareciera Un idiota intentando cruzar la calle. Este ejemplo muestra que la racionalidad no es lo mismo que la perfeccin. La ra cionalidad maximiza el rendimiento esperado, mientras la perfeccin maximiza el resul tado real. Alejarse de la necesidad de la perfeccin no es slo cuestin de hacer justicia con los agentes. El asunto es que resulta imposible disear un agente que siempre lleve a cabo, de forma sucesiva, las mejores acciones despus de un acontecimiento, a menos que se haya mejorado el rendimiento de las bolas de cristal o las mquinas de tiempo. La definicin propuesta de racionalidad no requiere omnisciencia, ya que la eleccin racional depende slo de la secuencia de percepcin hasta la fecha. Es necesario ase gurase de no haber permitido, por descuido, que el agente se dedique decididamente a llevar a cabo acciones poco inteligentes. Por ejemplo, si el agente no mirase a ambos la dos de la calle antes de cruzar una calle muy concurrida, entonces su secuencia de per * Vase N. Henderson, New door latches urged for Boeing 747 jumbo jets (es urgente dotar de nuevas cerraduras a las puertas de los Boeingjumbo 747), Washington Post, 24 de agosto de 1989.www.FreeLibros.me 71. AGENTES INTELIGENTESRECOPILACIN DE INFORMACINEXPLORACINAPRENDIZAJEAUTONOM IA43cepcin no le indicara que se est acercando un gran camin a gran velocidad. La definicin de racionalidad nos est indicando que est bien cruzar la calle? fTodo lo con trario! Primero, no sera racional cruzar la calle slo teniendo esta secuencia de per cepciones incompleta: el riesgo de accidente al cruzarla sin mirar es demasiado grande. Segundo, un agente racional debe elegir la accin de mirar antes de intentar cr