PABLO JOSÉ VILLACORTA IGLESIAS

Universidad de Granada | Escuela de Posgrado | Administración electrónica

Buscar

PABLO JOSÉ VILLACORTA IGLESIAS

Descargar versión en PDF
  • Premio Extraordinario de Doctorado 2015-16 (Ingeniería y Arquitectura)

ADVERSARIAL DECISION AND OPTIMIZATION-BASED MODELS

Pablo_Villacorta

Resumen

La tesis parte de una formalización matemática de la interacción repetida entre dos personas u organizaciones, conocidas genéricamente como agentes, uno de los cuales trata de aprender a imitar el comportamiento del otro a través de la observación. Ante una determinada situación de decisión o estímulo, el agente que se sabe observado tiene por objetivo llevar a cabo la acción que le va a dar una máxima recompensa según un sistema de pagos que dependen de la acción escogida. Sólo él conoce estos pagos. Sin embargo, solo obtendrá esa recompensa cuando su acción no haya sido adivinada por el agente observador. Por este motivo, decide introducir conscientemente cierta aleatoriedad en sus decisiones con el fin de no ser fácilmente predecible. El imitador tiene por objetivo predecir la acción que el otro agente va a realizar, utilizando para ello las observaciones que va memorizando acerca de las acciones elegidas por el otro agente en el pasado. El estudio de la relación entre la aleatoriedad introducida, el grado de confusión inducido en el imitador, y las estrategias que pueden utilizar los agentes en este contexto de interacción repetida son objeto de la tesis.

El modelo anterior es suficientemente abstracto como para ser aplicable a numerosas situaciones. Algunos ejemplos son los modelos de patrullaje autónomo, donde uno o varios robots (drones, o bien robots terrestres) vigilan un perímetro o en un área para prevenir intrusiones, donde el potencial intruso primero observa e intenta aprender el movimiento de los robots antes de intentar una intrusión. Estos modelos de seguridad se están utilizando en la actualidad en varios aeropuertos estadounidenses (en especial en Los Ángeles), protección de reservas naturales frente a cazadores furtivos, vigilancia de costas, etc. En la tesis planteamos la resolución con métodos alternativos a los tradicionales (teoría de juegos), tales como simulaciones computacionales, dado que en la realidad, los supuestos de dicha teoría con frecuencia no se cumplen.

Algunas de las aportaciones más importantes derivadas de esta Tesis doctoral

  • Villacorta, P.J., and Pelta, D.A. (2012) Theoretical Analysis of Expected Payoff in an Adversarial Domain. Information Sciences 186 : 93 – 104.
  • Villacorta, P.J., Pelta, D.A. and Lamata, M.T. (2013). Forgetting as a way to avoid deception in a repeated imitation game. Autonomous Agents and Multi Agent Systems 27(3): 329 – 354.
  • Villacorta, P.J., and Verdegay, J.L. (2016) FuzzyStatProb: An R Package for the Estimation of Fuzzy Stationary Probabilities from a Sequence of Observations of an Unknown Markov Chain. Journal of Statistical Software 71(8): 1 – 27