Notas sobre aprendizaje por refuerzo (IV): Metodos tabulares. SARSA Y Q-Learning.
Aparte de nuevos conceptos sobre aprendizaje por refuerzo, se habla de los métodos tabulares sin modelo y finaliza esbozando Q-Learning
Aparte de nuevos conceptos sobre aprendizaje por refuerzo, se habla de los métodos tabulares sin modelo y finaliza esbozando Q-Learning