Тег: r-learning
- Another and nonstandart methods of reinforcemebt learning
Другие и нестандартные методы обучения с подкреплением - Deep Q-learning
Глубокое Q-обучение - Dynamic programming for reinforcement-learning
Методы динамического программирования в обучении с подкреплением - Gymnasium
Gymnasium библиотека для построения стред обучения с подкреплением на python - Monte-Carlo methods
Методы Монте-Карло - MPPR
Конечные марковские процессы принятия решения - Multy armed bandits
Многорукие бандиты - Policy Gradient Methods
Методы градиента стратегии в обучении с подкреплением - Reinforcement learning
Обучение с подкреплением - Stable baseline 3
stable baseline - алгоритмы reinforcement learning на pytorch - Temporal difference methods and n-steps methods
Методы обучения с подкреплением, основанные на временных различиях и n-шаговые методы