我正在努力理解如何在 PHP 中使用 DOMElement 对象。我找到了这段代码,但我不确定它是否适用于我:
$dom = new DOMDocument();
$dom->loadHTML("index.php");
$div = $dom->getElementsByTagName('div');
foreach ($div->attributes as $attr) {
$name = $attr->nodeName;
$value = $attr->nodeValue;
echo "Attribute '$name' :: '$value'<br />";
}
基本上我需要的是在 DOM 中搜索具有特定
element
的 id
,之后我需要提取一个非标准的 attribute
(即我用 JS 编写并添加的),所以我可以看到它的价值。原因是我需要 $_GET
中的一部分和基于重定向的 HTML 中的一部分。如果有人可以解释我如何使用 DOMDocument 来实现此目的,那将会很有帮助。我真的很难理解正在发生的事情以及如何正确实施它,因为我显然做得不对。
编辑(我基于评论的位置):
这是我的代码第 4-26 行供参考:
<div id="column_profile">
<?php
require_once($_SERVER["DOCUMENT_ROOT"] . "/peripheral/profile.php");
$searchResults = isset($_GET["s"]) ? performSearch($_GET["s"]) : "";
$dom = new DOMDocument();
$dom->load("index.php");
$divs = $dom->getElementsByTagName('div');
foreach ($divs as $div) {
foreach ($div->attributes as $attr) {
$name = $attr->nodeName;
$value = $attr->nodeValue;
echo "Attribute '$name' :: '$value'<br />";
}
}
$div = $dom->getElementById('currentLocation');
$attr = $div->getAttribute('srckey');
echo "<h1>{$attr}</a>";
?>
</div>
<div id="column_main">
这是我收到的错误消息:
Warning: DOMDocument::load() [domdocument.load]: Extra content at the end of the document in ../public_html/index.php, line: 26 in ../public_html/index.php on line 10
Fatal error: Call to a member function getAttribute() on a non-object in ../public_html/index.php on line 21
getElementsByTagName
返回一个元素列表,因此首先需要循环遍历元素,然后遍历它们的属性。
$divs = $dom->getElementsByTagName('div');
foreach ($divs as $div) {
foreach ($div->attributes as $attr) {
$name = $attr->nodeName;
$value = $attr->nodeValue;
echo "Attribute '$name' :: '$value'<br />";
}
}
就您而言,您说您需要一个特定的 ID。这些应该是唯一的,所以要做到这一点,您可以使用(注意
getElementById
可能不起作用,除非您先调用 $dom->validate()
):
$div = $dom->getElementById('divID');
然后获取你的属性:
$attr = $div->getAttribute('customAttr');
编辑:
$dom->loadHTML
仅读取文件的内容,不执行它们。 index.php
不会这样运行。你可能需要做类似的事情:
$dom->loadHTML(file_get_contents('http://localhost/index.php'))
如果重定向来自外部服务器,您将无法访问 HTML。让我这样说:在您尝试解析 DOM 时,该 DOM 并不存在。您可以做的是将文本传递给 DOM 解析器,然后以这种方式操作元素。或者更好的方法是将其添加为另一个 GET 变量。
编辑:您是否也知道客户端可以更改 HTML 并让它传递他们想要的任何内容? (使用Firebug等工具)