Las técnicas de Aprendizaje Automático (Machine Learning) se han vuelto muy populares en los últimos
años debido a la aparición de nuevos frameworks, herramientas y plataformas que han permitido democratizar el uso de estas
técnicas y aplicarlas pare resolver diversos problemas relacionados con banca, medicina, robótica, recomendación,
etc a través del Big Data. Pero en la mayor parte de los casos las técnicas de Aprendizaje utilizadas se limitan a
Aprendizaje Supervisado y en algunos casos Aprendizaje no Supervisado, pero existen algo más aparte de las técnicas
ofrecidas por estos paradigmas.
De forma que los algoritmos de Aprendizaje por refuerzo intentan construir modelos o políticas que
permitan determinar la acción a aplicar en un entorno en base a algún tipo
de ""noción"" de recompensa o refuerzo. Esto convierte al Aprendizaje por Refuerzo en una técnica
perfecta para la construcción de sistemas de control para robots, videojuegos, agentes interactivos, etc.
En esta charla realizaremos una descripción teórica de como funciona el Aprendizaje por Refuerzo,
presentaremos el principal algoritmo de Aprendizaje por Refuerzo y describiremos como modelarlo usando TensorFlow. Además
presentaremos un caso práctico de como definir los elementos básicos para construir un controlador para jugar a
StarCraft: Brood war utilizando Reinforcement Learning con TensorFlow y los diferentes problemas que nos hemos encontrado al
intentar hacerlo.