“机器人控制标签”的AWS 提供的定义
awswaf:managed:aws:bot-control:bot: user_triggered :verified
和
awswaf:managed:aws:bot-control:bot: developer_platform :verified
对我来说很难理解。定义粘贴在下面,可以通过上面的链接找到。
问题是:
根据定义,
user_triggered
“类似于经过验证的机器人”,但行为却像人类。我的第一个想法是,这可能是开发人员通过手动控制的浏览器测试经过验证的机器人/抓取器。在这种情况下,开发人员将坐在计算机上或公司网络内部,因此传出请求可能看起来像是来自通常在该网络上运行的机器人。这是思考这个标签的正确方式吗?
awswaf:managed:aws:bot-control:bot: user_triggered :verified
的名称表明这是一个经过验证的机器人。但它既不是机器人,也未经验证。有人可以解释为什么此流量被视为未经验证吗?
再说一遍,是什么让
awswaf:managed:aws:bot-control:bot: developer_platform :verified
“类似于经过验证的机器人”,但仍然不相等?
“开发者平台 [...] Google Apps 脚本”是什么意思?这是开发人员在 Google 托管的服务(例如 Google Sheets 脚本)上编写的机器人,并且直接在 Google 的基础设施上运行,因此看起来像经过验证的流量(因为它来自 Google),但可能由有 Google Workspace 或 Gmail 用户吗?对于任何其他允许用户在提供全面服务的基础设施上运行脚本的平台来说,这也同样适用吗?
– 用于指示与经过验证的机器人类似的机器人,但可能由最终用户直接调用。机器人控制规则将此类机器人视为未经验证的机器人。awswaf:managed:aws:bot-control:bot: user_triggered :verified
– 用于指示与经过验证的机器人类似的机器人,但由开发者平台用于编写脚本,例如 Google Apps 脚本。机器人控制规则将此类机器人视为未经验证的机器人。awswaf:managed:aws:bot-control:bot: developer_platform :verified
bot:verified
标签适用于 AWS 信任并视为合法的机器人。如此处所述,AWS 使用 IP 地址来识别机器人是否经过验证。
Bot Control 使用来自 Web 请求源的 IP 地址来帮助 确定机器人是否经过验证。
但是,这还不足以建立机器人的合法性。所以我去挖掘并发现了这个视频。根据此,AWS 维护一个经过验证的机器人的内部数据库,并使用基于签名的方法来识别和维护该数据。
根据上述内容,任何带有
bot:verified
以外标签的机器人实际上都将未经验证。
所以
user_triggered:verified
意味着 AWS 认为这个机器人/脚本是由用户在本地运行的,而不是由网络上的任何僵尸网络运行的,而 developer_platform:verified
意味着这个机器人/脚本是通过某些开发者平台(如前面提到的 Google Apps 脚本)运行的在文档中。这两个都是未经验证的机器人,因为它们不是经过验证的机器人数据库的一部分,并且与经过验证的机器人签名不匹配。