我需要通过PHP DOMDocument
获取所有页面段落和所有列表项的所有父项
比方说,我们有这样的HTML:
<div>
<p>Some text</p>
<p>Some text</p>
</div>
<section>
<p>Some text</p>
<p>Some text</p>
<p>Some text</p>
</section>
<ul>
<li>Item 1</li>
<li>Item 2</li>
<li>Item 3</li>
<li>Item 4</li>
</ul>
如果我使用以下两个循环
$parents = [];
foreach($dom->getElementsByTagName('p') as $paragraph) {
$parents[] = $paragraph->parentNode;
}
foreach($dom->getElementsByTagName('li') as $li) {
$parents[] = $li->parentNode;
}
最后我只需要为每个父类添加一个类
foreach($parents as $key => $parent) {
$parent->setAttribute('class', 'prefix_'.$key);
}
并希望获得输出
<div class="prefix_0">
...
</div>
<section class="prefix_1">
...
</section>
<div class="prefix_2">
...
</div>
但我明白了
<div class="prefix_0 prefix_1">
...
</div>
<section class="prefix_2 prefix_3 prefix_4">
...
</section>
<div class="prefix_5 prefix_6 prefix_7 prefix_8">
...
</div>
如果我添加条件
if(!in_array($paragraph->parentNode, $parents)) {
它没有像我看到的那样工作,因为我们没有数组而是节点列表
那么如何避免添加同一个父级?
非常简单的功能,以避免它:
function compareParentNode($compare_node,$parents){
foreach($parents as $parent){
if ($parent->isSameNode($compare_node)) return true;
}
return false;
}
使用:
$parents = [];
foreach($dom->getElementsByTagName('p') as $paragraph) {
$parentNode = $paragraph->parentNode;
if (!compareParentNode($parentNode,$parents)){
$parents[] = $paragraph->parentNode;
}
}
查看更多isSameNode