Para un proyecto de ai-clase, necesito implementar un algoritmo de aprendizaje de refuerzo que supera un simple juego de tetris. El juego está escrito en Java y tenemos el código fuente. Conozco los conceptos básicos de la teoría del aprendizaje reforzado, pero me preguntaba si alguien en la comunidad SO tenía experiencia práctica en este tipo de cosas.Buenas implementaciones de aprendizaje de refuerzo?
- ¿Cuáles serían sus lecturas recomendadas para ser una implementación de aprendizaje reforzado en un juego de Tetris?
- ¿Hay algún buen proyecto de código abierto que logre cosas similares que valdría la pena revisar?
Editar: Cuanto más específico mejor, pero los recursos generales sobre el tema son bienvenidos.
seguimiento:
pensó que sería bueno si he publicado un seguimiento.
Aquí está la solución (código y descripción) que terminé con cualquier futuro estudiante :).
+1 por hacer una buena pregunta de tarea. Es refrescante ver a alguien pidiendo aprender algo que pedir que le den algo. –
Definitivamente de acuerdo; pedir buenos recursos de aprendizaje es una gran pregunta, y también es útil para otros en el futuro – Sukasa