我尝试通过流行的拍卖网络服务刮取Goutte列表,但他们的代码片段是由javascript呈现的,问题是Goutte只返回没有JS工作的DOM。因此,如果交响乐是无头浏览器,是否可以等待抓取直到呈现完整内容?我检查了phantomjs哪里正常,但我从来没有在Goute找到这种能力..
https://github.com/FriendsOfPHP/Goutte
Goutte不会解析Javascript,它不是一个无头浏览器,它只是下载内容并解析它而不运行javascript。
技术信息
Goutte是围绕以下优秀PHP库的薄包装:
Symfony组件:BrowserKit,CssSelector和DomCrawler; Guzzle HTTP组件。