我构建了一个自定义的开放人工智能健身房环境,它使用简单的元组观察空间。
self.observation_space = spaces.Tuple((spaces.Discrete(2,),spaces.Discrete(1)))
但是当我尝试使用 q-learning 示例时,他们使用
observation_space.n
有没有办法在这种观察空间中使用q-learning?
刚刚遇到同样的问题,以防有人仍在阅读: 由于元组空间没有属性
n
,我通过简单地自己定义它来使用解决方法:
self.observation_space.n = self.dimension1 * self.dimension2
基本上是将元组的离散空间输入参数相乘。希望这是有道理的
要访问维度,您必须使用
observation_space[0].n
访问第一个 Disceret
,使用 observation_space[1].n
访问第二个 Disceret