在openai体育馆中创建自定义环境，以游戏画面为观察依据

Question

我已经使用PyGame制作了游戏。我想将游戏屏幕的输出用作观察的习惯，而不是一组距离和角度。（我看过用于创建自定义环境的文档，但那不是游戏画面）。

Answer 1

我将遵循卷积强化学习的教程。 http://karpathy.github.io/2016/05/31/rl/

从Pygame提取原始像素很简单，以形成观察阵列，该观察阵列进入神经网络，其前几层将是卷积。有很多可用的示例。Google“强化学习原始像素”。