PHP 抓取因重定向而受阻

问题描述 投票:0回答:1

我正在尝试使用 php 脚本将图书馆搜索引擎转换为移动设备友好的网站。我们的计划是抓取结果并呈现一个简化的形式,因为该网站目前仅在大型浏览器中看起来不错。

我在使用 http://simplehtmldom.sourceforge.net 时遇到了一些麻烦,因为每次我尝试通过加载此页面

www.librarywebsite.com/search.php?query=BOOKTITLE
来加载查询时,它都会经历几次重定向,然后呈现一个最终结果页面,该页面具有类似的内容url 中的一组参数,但如果刷新,无论如何都会坚持重定向。

有人知道如何在所有重定向完成后执行 DOM 抓取吗?

php web-scraping dom
1个回答
3
投票

您可以考虑使用类似 cURL 并启用跟随重定向的功能。我相信 cURL 选项是 CURLOPT_FOLLOWLOCATION。请参阅:http://php.net/manual/en/function.curl-setopt.php

© www.soinside.com 2019 - 2024. All rights reserved.