当使用最速爬山搜索时,当你到达一个无限循环时会发生什么——也就是说,你发现自己在相同的两个状态之间来回移动,因为它们都是彼此的最佳后继者?
例如,在下图中,
(J)
会反复进行(K)
,反之亦然。
如果我正在对其进行编程,我想我会在访问过的状态上放置某种标志,这样我就知道我是否正在重新访问同一个状态。但是,在有关最速爬山算法的文档(即here,here)中没有提及这一点。
如果是纯粹的爬山,那么你忽略非提升动作,没有循环。如果它应该找到全局最优值,那么应该有一些其他机制来逃避局部最大值(随机移动、重新启动等)。
请务必回答问题。提供详细信息并分享您的研究! 但要避免……
寻求帮助、澄清或回应其他答案。 根据意见发表声明;用参考资料或个人经验来支持他们。