Notas sobre aprendizaje por refuerzo (IX): aprendizaje de políticas y el ascenso de gradiente
Hablamos del aprendizaje de políticas en el caso del deep reinforcement learning en problemas continuos y revisamos el ascenso de gradiente.
Hablamos del aprendizaje de políticas en el caso del deep reinforcement learning en problemas continuos y revisamos el ascenso de gradiente.