Upgrade to Pro — share decks privately, control downloads, hide ads and more …

Cómo dejar de ser un noob gracias a la Intelige...

Javi
November 23, 2018

Cómo dejar de ser un noob gracias a la Inteligencia Artificial

En pleno auge de la Inteligencia Artificial cada vez es mayor la necesidad de disponer de entornos controlados, replicables y disponer de una cantidad infinita de datos etiquetados, lo que ha aumentado el empleo de algoritmos de Deep Learning y Reinforcement Learning al mundo de los videojuegos como entornos de prueba antes de aplicarlos en diversos campos como medicina, ciberseguridad o banca electrónica. Esta ponencia contará con multitud de demos en directo en las que mostraremos el funcionamiento de varios algoritmos de Deep Q-Learning en distintos escenarios, desde los clásicos juegos de ATARI hasta juegos de mundo abierto como Minecraft.

Javi

November 23, 2018
Tweet

Other Decks in Programming

Transcript

  1. Cómo dejar de ser un noob gracias a la Inteligencia

    Artificial MAD · NOV 23-24 · 2018 Javier Jiménez del Peso Data Scientist @JavierJim1993
  2. ¿Por qué videojuegos? Suministro infinito de datos etiquetados Controlable y

    replicable Sin problemas éticos ni de seguridad Bajo coste por muestra Dinámicas complicadas con reglas simples Algoritmos lentos Requiere muchos recursos Difícil evaluar el progreso Paso de videojuego al mundo real ?
  3. Deep Q- Learning Deep Q-Network (DQN) = Q-Learning + Deep

    Neural Networks Experience reply: guarda experiencias { , , +1 , +1 } en memoria, lo que permite aprender del pasado.
  4. Paper: https://arxiv.org/pdf/1705.05363.pdf Code: https://github.com/pathak22/noreward-rl Intrinsic Motivation (IM): ignorar los aspectos

    que no afectan al agente y usar la curiosidad como señal de recompensa que incita al agente a explorar su entorno y aprender comportamientos que serán útiles en escenarios posteriores. LIVE DEMO
  5. Paper: https://arxiv.org/pdf/1606.01868v1.pdf Paper: https://arxiv.org/pdf/1703.01310.pdf Montezuma's Revenge Problema con algoritmos de

    RL y DQN: recompensas y feedback escasos. Aplicación de curiosidad como un método de recompensa (Intrinsic Motivation).
  6. A pesar del gran incremento de estudios y publicaciones, el

    campo de RL se encuentra dando sus primeros pasos: • La mayoría de estudios relacionados con RL en videojuegos están enfocados en aprender a jugar a un solo juego. • En las aproximaciones existentes se tiene que dedicar gran esfuerzo a diseñar la arquitectura de la red y elegir la función de recompensa para el juego en cuestión. • Los juegos con recompensas dispersas siguen suponiendo un reto enorme en RL. • La mayoría de enfoques actuales se centran en el entrenamiento de un único agente y los métodos aplicados a juegos con interacción de múltiples agentes al mismo tiempo no son igual de potentes. • En un futuro se podría aplicar dentro de la propia industria del videojuego, no con el objetivo de crear IA’s que se adaptan al modo de juego de la persona y aprende a jugar contra sus tácticas, si no para el desarrollo de contenido del juego a partir de las muestras ya diseñadas. Conclusiones
  7. Javier Jiménez del Peso Data Scientist @JavierJim1993 MAD · NOV

    23-24 · 2018 Cómo dejar de ser un noob gracias a la Inteligencia Artificial [email protected]