我已经使用PyGame制作了游戏。我想将游戏屏幕的输出用作观察的习惯,而不是一组距离和角度。 (我看过用于创建自定义环境的文档,但那不是游戏画面)。
我将遵循卷积强化学习的教程。 http://karpathy.github.io/2016/05/31/rl/
从Pygame提取原始像素很简单,以形成观察阵列,该观察阵列进入神经网络,其前几层将是卷积。有很多可用的示例。Google“强化学习原始像素”。