我即将知道如何做到这一点,但我只知道如何从给定的名为 _____ for ex 的 h1 标签中获取特定的内容。我对 php 很陌生,所以我不完全确定如何操纵它。我想看看我是否能弄清楚,对于一个随机网站,如何使用例如 h1 标签来抓取和输出所有内容。
这是我迄今为止所能做的。它可能只需要一个小的修改。想法?谢谢你。
这会刮掉名为“world-market”的< a >标签中的所有内容。在不破坏代码的情况下,我无法弄清楚如何简单地在 < a > 标签中输出任何内容
<?php
$doc = new DOMDocument;
// foriegn stocks
$doc->preserveWhiteSpace = false;
$doc->strictErrorChecking = false;
$doc->recover = true;
$doc->loadHTMLFile('http://www.money.cnn.com/data/markets/');
$xpath = new DOMXPath($doc);
$query = "//a[@class='world-market']";
$entries = $xpath->query($query);
foreach ($entries as $entry) {
echo trim($entry->textContent); // use `trim` to eliminate spaces
}
?>
如果您想要给定标签的所有内容,仅仅查询“//a”还不够吗?或者“//a/text()”?如果您正在寻找 href 部分,您可以尝试“//a/@href”。
祝你好运。