Notas sobre aprendizaje por refuerzo (III): recompensas, trazas y valores
Hablo de trazas y recompensas en el contexto de modelos de decisión de Markov y aprendizaje por refuerzo (reinforcement learning).
Hablo de trazas y recompensas en el contexto de modelos de decisión de Markov y aprendizaje por refuerzo (reinforcement learning).
Recordamos conceptos de aprendizaje por refuerzo y recordamos y visualizamos el aprendizaje en procesos de Markov
Como inicio de una serie dedicada al aprendizaje por refuerzo, en este post explico los Procesos de decisión de Markov
En este post describo tres posibles opciones para la adopción de modelos de machine learning por parte de las empresas y organizaciones.
Hablo sobre el machine learning y las predicciones, cómo éstas se apoyan en datos del pasado pero se pueden seguir considerando predicciones.
En este post comento cinco diferencias entre el Machine Learning en investigación y Machine learning en producción.
La tecnología supone una forma de externalización para conseguir apalancamiento y con la IA esto se convierte en Apalancamiento cognitivo
Con base en aportaciones filosóficas, se describen siete elementos del juicio humano y se explora si se pueden implementar en máquinas
En este post se presenta, sin profundidades, la inteligencia artificial neurosimbólica como una tercera ola en inteligencia artificial.
Se describe un esquema muy sencillo, los requisitos 3H del usuario, que sirven de marco para buscar una inteligencia artificial segura.