Notas sobre aprendizaje por refuerzo (IX): aprendizaje de políticas y el ascenso de gradiente
Hablamos del aprendizaje de políticas en el caso del deep reinforcement learning en problemas continuos y revisamos el ascenso de gradiente.
Tecnologías digitales. Tendencias tecnológicas. Estándares. Personajes.
Hablamos del aprendizaje de políticas en el caso del deep reinforcement learning en problemas continuos y revisamos el ascenso de gradiente.
En este post presentamos los Problemas continuos de aprendizaje por refuerzo, sus particularidad, ideas principales y campos de aplicación.
Se comenta cómo el deep learning supero sus retos para ser aplicado en aprendizaje por refuerzo, con el éxito de Deep Q-Network
Comento tres retos del deep reinforcement learning a que se tiene que enfrentar para conseguir buenos resultados.
En este post explico cuándo se usa deep learning en aprendizaje por refuerzo dando lugar al deep reinforcement learning.
Aparte de nuevos conceptos sobre aprendizaje por refuerzo, se habla de los métodos tabulares sin modelo y finaliza esbozando Q-Learning
Hablo de trazas y recompensas en el contexto de modelos de decisión de Markov y aprendizaje por refuerzo (reinforcement learning).
Recordamos conceptos de aprendizaje por refuerzo y recordamos y visualizamos el aprendizaje en procesos de Markov
Reseña del libro ‘Cuando fuimos jóvenes’ de Martiniano Mallavibarrena, historia de la tecnología digital en el ultimo cuarto del siglo XX.
Como inicio de una serie dedicada al aprendizaje por refuerzo, en este post explico los Procesos de decisión de Markov