php 抓取并输出具有标签、h1、p 等类型的所有内容

问题描述 投票:0回答:1

我即将知道如何做到这一点,但我只知道如何从给定的名为 _____ for ex 的 h1 标签中获取特定的内容。我对 php 很陌生,所以我不完全确定如何操纵它。我想看看我是否能弄清楚,对于一个随机网站,如何使用例如 h1 标签来抓取和输出所有内容。

这是我迄今为止所能做的。它可能只需要一个小的修改。想法?谢谢你。

这会刮掉名为“world-market”的< a >标签中的所有内容。在不破坏代码的情况下,我无法弄清楚如何简单地在 < a > 标签中输出任何内容

<?php 

 $doc = new DOMDocument;

// foriegn stocks
 $doc->preserveWhiteSpace = false;


 $doc->strictErrorChecking = false;
  $doc->recover = true;

 $doc->loadHTMLFile('http://www.money.cnn.com/data/markets/');

 $xpath = new DOMXPath($doc);

  $query = "//a[@class='world-market']";

  $entries = $xpath->query($query);
 foreach ($entries as $entry) {
 echo trim($entry->textContent);  // use `trim` to eliminate spaces
 }

 ?>
php web-scraping xpath
1个回答
0
投票

如果您想要给定标签的所有内容,仅仅查询“//a”还不够吗?或者“//a/text()”?如果您正在寻找 href 部分,您可以尝试“//a/@href”。

祝你好运。

© www.soinside.com 2019 - 2024. All rights reserved.