这个算法击败了这个纽约时报的人工智能而没有在Rock / Paper / Scissors中强行逼迫? (退伍军人模式)
http://www.nytimes.com/interactive/science/rock-paper-scissors.html?_r=1&(闪光灯必须启用才能玩AI)(网站不断提供有关人工智能在您至少玩过5次后如何选择下一步动作的信息)
我正在学习自己的机器学习,而且我很新手。 (刚开始昨天)。
我的朋友告诉我,他们被分配来解决上述问题,而没有在他们的ML课程中学习任何ML技术。我也想这样做,但除了野蛮强迫之外我无法想到任何其他方式。
对于训练数据集,玩AI 100或更多时间并收集这100个或更多数据。使用此数据创建算法,以便您在使用程序时赢得更多游戏而不使用程序。作为一个超级新手,我什么都想不到。
任何提示?谢谢
新手模式
所以这个网站的好处是,它表明这个想法是每一个举动背后的。它会通过查看您的动作历史来尝试预测您的行为。所以你的移动历史可能如下:(rock = r,scissor = s and paper = p)
r p s p p s s r r p s
现在它查看历史,并试图找到r p s
的复发。它在历史的开头发现了这个,并且发现你之后玩过p
。因此,计算机的下一步将是s
。
如果它找不到字符串的重复(r p s
),它会查看较小的字符串(p s
),依此类推。如果它发现多次复发,则选择最复发的那个(或者甚至只是随机选择一个)。
所以你可以编写一个与网站上完全相同的程序。您试图预测自己的行动(就像网站的程序一样)。所以举个例子(r p s
),计算机会预测p
的移动,所以有了这些知识,你会选择s
。
退伍军人模式
在退伍军人模式中,AI使用200000个游戏的历史来预测您的下一步行动。因此,为了尝试击败你,你将使用100个游戏的历史,就像AI一样。
你看看你当前尝试的历史加上你的历史(100场比赛)并试图找到某种类型的复发(例如r s p r
)。你看一下计算机对此的反应。现在你选择相应的,以便击败电脑。当然,这并不总能获胜,因为计算机经常使用两个选择之间的随机响应(以及更长的历史记录以便从中挑选更多的样本)。但这应该会增加你获得的胜利数量。
我也没有机器学习的经验,但这是我编写程序的策略。
我希望这有帮助。
如果你不能打败他们加入他们;)干杯
在你开始游戏之前,获得一副牌并摆脱俱乐部和笑话。这让你有三件大事。黑桃(岩石)心(剪刀)和钻石(纸)。洗牌非常好。然后按照他们所在的顺序使用这些卡片 - 当你用完时,将它们洗牌并再次进行。我通常会赢。
LDA