我正在开发一个使用 HTTP 与内部 Web 服务通信的应用程序。
是否有自定义用户代理字符串的“最佳实践”,以便我可以在我的应用程序中放置一个好的字符串?它是一个Python库,底层传输是Python自己的httplib。用户代理字符串应该这样说还是其他什么?
对于内部使用,您实际上可以使用任何东西。
当然,无论是内部还是外部,最好包含联系信息(网址或电子邮件地址),以防出现问题或应用程序失控。
查看这个用户代理的大列表以获取灵感:https://user-agents.net/
最好至少包含一个电子邮件地址,以便人们在您的应用程序出现问题时可以与您联系。这也将是您不被阻止的最佳机会。
通常还添加名称和版本号。除此之外,大部分都是自由泳。 user-agents.org 有很多例子。
也不要忘记尊重robots.txt。
你可以在user-agent中写你想要的东西!但是,如果您注意您的应用程序对此服务器的 HTTP 查询可能会被阻止,请将用户代理设置为通用浏览器(例如 Gecko 引擎上的 Firefox),然后服务器管理员不知道哪个应用程序读取了她的页面,并且在服务器日志中看不到您的申请。