给定一个获取的 html 页面,我想找到包含一部分文本的特定节点。我想最困难的方法是逐一迭代所有节点,尽可能深入,并针对每种情况进行搜索,例如
.includes()
但是明智的做法是怎样的呢?一定有什么东西,但我无法正确谷歌到它
response = axios.get(url);
let parsedHtml = parser.parseFromString(response.data, 'text/html');
for (let i = 0; i < parsedHtml.children.length; i++)
if (parsedHtml.children[i].textContent.includes('hello'))
console.log(parsedHtml.children[i])
*这不起作用
*示例代码
<html>
<body>
<div>dfsdf</div>
<div>
<div>dfsdf</div>
<div>dfsdf</div>
</div>
<div>
<div>
<div>hello</div>
</div>
</div>
<div>dfsdf</div>
</body>
</html>
我想检索
<div>hello</div>
作为节点元素
几乎确信我必须以经典方式遍历 DOM 后,我在这里找到了这个 Javascript:如何循环遍历页面上的所有 DOM 元素?这确实很棒:
let nodeIterator = document.createNodeIterator(
parsedHtml,
NodeFilter.SHOW_ELEMENT,
(node) => {
return (node.textContent.includes('mytext1')
|| node.textContent.includes('mytext2'))
&& node.nodeName.toLowerCase() !== 'script' // not interested in the script
&& node.children.length === 0 // this is the last node
? NodeFilter.FILTER_ACCEPT : NodeFilter.FILTER_REJECT;
}
);
let pars = [];
let currentNode;
while (currentNode = nodeIterator.nextNode())
pars.push(currentNode);
console.log(pars[0].textContent); // for example
您可以像这样使用 jQuery 的
:contains()
选择器:
$(":contains('hello')")
请注意,这也会计算恰好包含相同文本的所有父节点。如果您的 DOM 结构允许,最好定位您正在查找的节点的type(即类选择器),然后检查该类型的元素是否包含您正在查找的文本。
曾考虑将 CSS 中的
:contains
作为 CSS 3 中的内容选择器,但已被放弃。