Tres formas de personalizar un LLM
En este post se describen tres formas de personalizar un LLM : mediante fine tunning, mediante RAG y mediante interacción con el usuario.
DetallesEn este post se describen tres formas de personalizar un LLM : mediante fine tunning, mediante RAG y mediante interacción con el usuario.
DetallesEn este post hablamos del aprendizaje por refuerzo para casos con dos agentes y explicamos el muy interesante concepto de autoaprendizaje.
DetallesSe cuentan los fundamentos de RAG (Retrieval Augmented Generation) como una forma de extensión y personalización de modelos generativos.
DetallesAvanzando en la revisión del aprendizaje por refuerzo, en este post se revisan brevemente los métodos basados en modelo
DetallesEl aprendizaje por refuerzo, en la situación de problemas continuos y métodos basados en políticas, puede usarse en locomoción de robots.
DetallesReseña del libro ‘Azure OpenAI Service for Cloud Native Applications’ de Adrián González , un recorrido muy completo por este servicio.
DetallesHablamos del aprendizaje de políticas en el caso del deep reinforcement learning en problemas continuos y revisamos el ascenso de gradiente.
DetallesEn este post presentamos los Problemas continuos de aprendizaje por refuerzo, sus particularidad, ideas principales y campos de aplicación.
DetallesSe comenta cómo el deep learning supero sus retos para ser aplicado en aprendizaje por refuerzo, con el éxito de Deep Q-Network
DetallesComento tres retos del deep reinforcement learning a que se tiene que enfrentar para conseguir buenos resultados.
Detalles