我正在.Net Core 2.2下使用HtmlAgilityPack
1.11.18。
我想从HTML片段(不是完整的文档)的<p>
节点中删除所有HTML属性。
var htmlDoc = new HtmlDocument();
htmlDoc.LoadHtml(input);
var pNodes = htmlDoc.DocumentNode.SelectNodes("//p");
foreach (var node in pNodes)
{
node.Attributes.Remove();
}
return htmlDoc.Text;
这不是解决问题的方法,我缺少什么吗?该方法返回一个string
,该长度应为片段减去所有<p>
元素上的属性。
[我知道您不应该使用RegEx来解析HTML,但是这些都是小片段,我希望使用RegEx方法,这样我就可以删除对HtmlAgilityPack
的依赖,而我只是为了处理这一点而干净地对待它。
我更喜欢RegEx方法,因此我可以删除对HtmlAgilityPack的依赖,而我仅引入它来进行干净处理。