我一直在兜圈子试图从外部网站提取元标签信息。我开始使用 XML 方法,但由于标签链接文档类型等,我的应用程序不断抛出错误。
我现在采用 HttpResponse 方法,我知道如何恢复网站并将其作为字符串存储在变量中,但是
我不知道如何从元标记的内容中提取子字符串?
我几天来一直在寻找这个问题的解决方案。
使用 HTML Agility Pack 下载、解析和查询外部 HTML。
我从未尝试过使用元标记,但对于 HTML 文档来说,Html Agility Pack 是一个很好的解决方案。有关一些示例,请参阅此博客文章。