OpenAI Gym是一个强化学习研究平台,旨在为各种环境提供通用智能基准。
我有一个rb.py文件,大致结构如下: import gym def main(): env = gym.make('ComplexMiniGolf-v0')问题是,如果我创建另一个文件,然后做: from rb import main ...
PyTorch DQN代码不能解决OpenAI CartPole问题。
该代码来自DeepLizard教程;它显示,代理只能实现100集移动平均80-120秒,然后再重置下一集。OpenAI健身房认为195的平均数是 ...
我想用RL-Coach和一个自定义的健身房环境做一个简单的BC实验。基于这个想法,我试图根据f_1,f_2和f_3来预测目标变量。Gym ...
在openai gym中从图像中学习:渲染函数的内存泄漏或离屏glfw问题。
我正试图从openai gym中的图像中学习一个控制策略。我的代码非常简单,但是由于某些原因,我产生了巨大的内存需求,并且随着代码的运行而不断增加。
强化学习--当游戏的输入只有像素时,我们如何决定对代理的奖励?
我是RL新手,我做得最好的是openAI gym中的CartPole。在CartPole中,API会自动提供给定动作的奖励。我如何决定奖励,当我有......。
无法将 pytorch 安装到我的 anaconda 虚拟环境中。
我正在遵循OpenAI的spinningUp教程,我卡在了项目的安装部分。我使用的是Anaconda,当我这样做:Pip install -e 。它给出了以下错误:...
我刚刚开始使用强化学习,并试图使用OpenAI gym创建一个自定义环境。然而,我在尝试创建一个环境(有道路和交叉口)时陷入了困境......。
我试图在Openai的atari健身房环境中实现MCTS,这需要计划的能力:在环境中行动并将其恢复到以前的状态。我读到可以用 ...
在使用OpenAI gym时,用import gym导入库后,可以用env.action_space检查动作空间。但这只给出了动作空间的大小。我想知道的是...
ImportError:无法从'roboschool'导入名称'cpp_household'
请帮助我。我无法导入lib roboschool 1.0.49 Gym == 0.15.4输入导入roboschool输出D:\ Users \ gumin \ anaconda3 \ python.exe D:/ Users / gumin / anaconda3 / Lib / site-packages / roboschool / test。 py ...
我正在使用Gym版本-'0.9.7'和mujoco_py版本1.50.1.41,Python 3.6.1 | Anaconda 4.4.0,安装在Mac上。尝试时:import gym env = gym.make('Humanoid-v1')我得到以下信息...
OpenAI的基线使用以下代码返回LazyFrames而不是串联的numpy数组以节省内存。这个想法是利用了一个事实,即可以在...
我已经使用PyGame制作了游戏。我想使用游戏屏幕的输出作为观察的习惯,而不是一组距离和角度。 (我看过用于自定义文档的文档...
有没有一种方法可以实现OpenAI的环境,在该环境中,操作空间在每个步骤上都会发生变化?
有没有一种方法可以实现OpenAI的环境,每个动作空间在每个步骤都会改变?
如何使用OpenAi-Gym和Scoop产生可再现的随机性?
如何使用OpenAi-Gym和Scoop产生可再现的随机性?每次重复该示例时,我都希望得到完全相同的结果。如果可能的话,我希望它可以与现有的库一起使用...
在OpenAI健身房的classic_control环境中无法更改模型参数
我正在使用CartPole-v1环境,正在尝试更改某些模型参数(例如force_mag),以测试带有模型变化的算法的稳健性。我是...
我想创建自己的健身环境。我已按照此处说明的步骤进行操作:https://github.com/openai/gym/blob/master/docs/creating-environments.md。根据他们的建议,我创建了...
ImportError:无法导入名称'SkipWrapper'
我正在使用Gym Open AI处理此AI代码。所以我试图导入这个包装器,并且得到这个ImportError。导入numpy作为np导入火炬导入torch.nn作为nn导入torch.nn。功能为...
Openai的PPO2模型在通过我的自定义环境(Python)时返回NANs
我制作了以下自定义环境:Market(gym.Env)类:“”“此环境用于使用OpenAI健身房强化学习算法来训练BUYING vwap殴打算法”“”“元数据= ...