如何为自定义问题创建MDP（RL）环境？

问题描述投票：0回答：1

我正在尝试使用RL / GA解决资源调度问题。我被困在如何为问题创建自定义环境并实际进行一些测试的过程中。我阅读并实现了针对其他GYM环境的Q-Learning，但是仍然为解决手头的问题而创建自定义环境。

Q-Learning会带来问题，因为可能的状态-动作对数量庞大，因此可以使用DQN。但是究竟如何解决这个问题？

任何指针都会有所帮助。

python artificial-intelligence scheduling genetic-algorithm reinforcement-learning

1个回答

0
投票

查看自定义环境的标准稳定基准实现，并尝试自己构建。您可以使用它轻松加载dqn模型，但是您将需要构建观察空间的所有部分以及在step函数中对观察空间执行的操作。将有一个标准模板可供定制。

最新问题

© www.soinside.com 2019 - 2024. All rights reserved.