Notas sobre aprendizaje por refuerzo (XII): autoaprendizaje y el caso de AlphaGo y AlphaZero
En este post hablamos del aprendizaje por refuerzo para casos con dos agentes y explicamos el muy interesante concepto de autoaprendizaje.
En este post hablamos del aprendizaje por refuerzo para casos con dos agentes y explicamos el muy interesante concepto de autoaprendizaje.