Notas sobre aprendizaje por refuerzo (III): recompensas, trazas y valores
Hablo de trazas y recompensas en el contexto de modelos de decisión de Markov y aprendizaje por refuerzo (reinforcement learning).
Hablo de trazas y recompensas en el contexto de modelos de decisión de Markov y aprendizaje por refuerzo (reinforcement learning).