6.4.2 Agentes inteligentes y la naturaleza de su entorno

Agente inteligente

En este caso se entiende agente como aquello que es capaz de percibir su medioambiente con la ayuda de sensores y actuar en ese medio utilizando actuadores o efectores. Ejemplos de agentes los tenemos en todas partes y son conocidos: un agente humano usa ojos, oídos y otros órganos sensoriales como son las manos, piernas, boca y otras partes del cuerpo para actuar; un agente robot recibe ciertas señales, ya sean pulsaciones del teclado, información a procesar contenida en archivos computaciones y/o paquetes por la red, equivalentes todas ellas como medios de entrada sensoriales, y actúa sobre el entorno que le rodea realizando acciones, mostradas como mensajes en el monitor, escritura en ficheros y envío de paquetes a otros receptores usando la misma red. Se trabajará en el presente proyecto con la hipótesis general de que un agente puede percibir sus propias acciones pero no siempre sus efectos.

Con el término percepción se indica en este contexto que el agente puede recibir entradas en cualquier instante. La secuencia de percepciones por lo tanto no es otra cosa que el reflejo o el historial completo de lo que el agente ha recibido, y que en términos informales es tratado como “la experiencia” del mismo.

En general, un agente tomará una decisión en un momento dado dependiendo de la secuencia completa de percepciones hasta ese instante. Será entonces cuando, en función de las acciones realizadas por parte del agente sobre las correspondientes secuencias de percepciones recibidas y un conocimiento a priori sobre el entorno, cuando se podrá definir el papel de éste en el entorno. En términos matemáticos se puede decir que el comportamiento del agente viene dado por la función del agente que proyecta una percepción dada en una acción. Este comportamiento se entiende como una actividad que el agente racional en cada posible secuencia de percepciones, deberá emprender aquella acción que supuestamente maximice su medida de rendimiento, basándose en las evidencias aportadas por la secuencia de percepciones y en el conocimiento que el agente mantiene almacenado.

Medidas de Rendimiento

Las medidas de rendimiento definen el grado de éxito del agente ante su forma de actuación racional sobre el entorno. Como ya hemos tratado anteriormente, las etapas de síntesis de resultados de un agente inteligente parten al ubicar a un agente en un medio, y cuando, tras captar secuencias de percepciones que vienen de éste, generar una secuencia de acciones. Esta secuencia de acciones hace que su hábitat pase por una secuencia de estados, que harán determinar cómo correcto el funcionamiento de un agente si la misma es la deseada; será labor del diseñador del agente, en este caso nuestra, de enfatizar en una serie de medidas de rendimiento ajustadas a nuestros propósitos y que eviten ambigüedades entorno a la optimalidad de la elección de las acciones y su consideración de mejores respecto a otras, labor que el propio agente no podría, en muchos casos, determinar.

Racionalidad

¿Qué hace que un agente sea bueno o malo, inteligente o estúpido? Su buen comportamiento, basado en una manera correcta de hacer las cosas, entendiendo por esto la realización de acciones genere el mejor resultado. La selección racional de acciones en un momento determinado sólo se basa en la información disponible por el agente, dependiente de cuatro factores:

  • La medida de rendimiento que define el criterio de éxito.
  • La secuencia de percepciones del agente hasta este momento, tomada como su experiencia con el entorno.
  • El conocimiento del medio a priori en el que se encuentra por el agente.
  • · Capacidades: las acciones que el agente puede emprender en ese medio.

Estructura de los agentes

El programa del agente aplica los métodos de la función del agente. Existe una gran variedad de diseños de programas de agentes, que varían en eficiencia, solidez y flexibilidad, y que reflejan el tipo de información que se hace explícita y se utiliza en el proceso de decisión. Por ello, el diseño apropiado del programa del agente depende en gran parte de la naturaleza del medio. La clasificación según estructuras sería la siguiente:

  • Agentes reactivos simples, los cuales responden directamente a las percepciones.
  • Agentes reactivos basados en modelos mantienen un estado interno que les permite seguir el rastro de aspectos del mundo que no son evidentes según las percepciones actuales. Dentro de estos encontramos:
    • Agentes basados en objetivos actúan con la intención de alcanzar sus metas (como en nuestro caso, alcanzar la estación destino con la solución apropiada)
    • Agentes basados en utilidad intentan maximizar su “felicidad” deseada.

La naturaleza del entorno

Ahora que se tiene una definición de racionalidad, se podría iniciar cautelosamente (debido a su natural complejidad ya explicada) la construcción de agentes racionales. El entorno sobre el cual los agentes se sitúan representa al conjunto de problemas para los cuales la existencia de estos pretende dar solución. Un análisis descriptivo de las características que conforman nuestro entorno hace simplificar el nivel de complejidad del entendimiento de las dificultades que entrañan los problemas derivados a objeto de estudio, y facilitan su comprensión de cara a la integración de los artefactos racionales sobre el mismo, determinando su diseño, implementación y  uso. Por ello, toda naturaleza del entorno se categoriza bajo una serie de principios o propiedades que reflejan de una manera u otra las condiciones sobre las cuales los agentes actuarían ante un problema concreto en la consecución de una solución. Se definen a continuación:

  • Totalmente observable vs Parcialmente observable

Se dice que un entorno de trabajo es totalmente observable si los sensores detectan todos los aspectos que son relevantes en la toma de decisiones y en las medidas de rendimiento. Este entorno es el más conveniente, ya que el agente no necesita mantener ningún estado interno para saber qué sucede en el exterior. Por otro lado el entorno puede ser parcialmente observable debido al ruido y a la existencia de sensores poco exactos o porque los sensores no reciben información de parte del sistema.

  • Determinista vs Estocástico

Si el siguiente estado del medio está totalmente determinado por el estado actual y la acción ejecutada por el agente, entonces el entorno es determinista; de otra forma es estocástico. En principio, un agente no se tiene que preocupar de la incertidumbre en un medio totalmente observable y determinista. Sin embargo, si el medio es parcialmente observable entonces puede parecer estocástico. Si el medio es determinista, excepto para las acciones de otros agentes, decimos que el medio es estratégico.

  • Episódico vs Secuencial

En un entorno de trabajo episódico, la experiencia del agente se divide en episodios. Cada episodio consiste en la percepción del agente y la realización de una única acción posterior. Es muy importante saber que el siguiente episodio no depende de las acciones que se realizaron anteriormente y es que en los medios episódicos la elección de la acción en cada episodio depende sólo del episodio en sí mismo. Muchas tareas de clasificación son episódicas.

  • Estático vs Dinámico

Si el entorno puede cambiar cuando el agente está deliberando, entonces se dice que el entorno es dinámico para el agente; de otra forma se dice que es estático. En los medios estáticos el agente no necesita estar pendiente del mundo mientras está tomando una decisión sobre una acción, ni necesita preocuparse sobre el tiempo transcurrido. Los medios dinámicos, por el contrario, preguntan continuamente al agente qué quiere hacer. Si no ha decidido aún, entonces se entiende que ha tomado la decisión de no hacer nada.

  • Discreto vs Continuo

La distinción entre discreto y continuo se puede aplicar al estado del medio, a la forma en la que se maneja el tiempo y a las percepciones y acciones del agente.

En este sentido, y valorando las definiciones teóricas que entrañan el cuerpo y forma de nuestro entorno como dominio del problema y desencadenante de una solución a través de agentes, la estructura del metro de Madrid se considera un medio parcialmente observable, puesto que el agente conocerá los aspectos relevantes en la toma de decisiones de los nodos contiguos a este, ligados por las correspondencias existentes entre estaciones/líneas, estocástico, ya que no se puede predecir que un tren pueda averiarse o si la infraestructura necesita de una rehabilitación o mantenimiento por urgencia sin previo aviso, secuencial, puesto que la decisión de avanzar por una estación creando una ruta puede afectar a decisiones futuras, estático, puesto que aunque el entorno puede cambiar cuando el agente está deliberando (inesperadamente se averían una o varias estaciones), se tomarán como ciertos y no modificables los datos a priori cargados de la base de datos (estructura de almacenamiento de datos remoto actualizada en todo momento con la situación global del entorno de la Red) sobre las disponibilidades o no de las estructuras que conforman el metro   – líneas y estaciones – en el inicio del cálculo, y discreto, porque, dado cualquier instante de tiempo t, consideraremos que los trenes se encuentran siempre ubicados en una estación a u otra b (0 o 1), y no desplazándose entre medias del tramo de línea que las conectan.

Creative Commons License
Poiritem by Ismael Rihawi Aragón is licensed under a Creative Commons Reconocimiento-No comercial-Sin obras derivadas 3.0 España License.
Anuncios

Los comentarios están cerrados.