使用 JavaScript 抓取/窃听 AJAX 数据?

问题描述 投票:0回答:1

是否可以使用 JavaScript 抓取通过 AJAX 实时更新的网页的所有更改?我希望每秒使用 AJAX 抓取更新数据的网站,并且我想获取所有更改。这是一个拍卖网站,每当用户出价时,多个对象可能会发生变化。出价后发生以下变化:

当前买入价 目前的最高出价者 拍卖计时器已重新添加时间

我希望使用基于 JavaScript 构建的 Chrome 扩展来获取这些数据。是否有 JavaScript 的 AJAX 侦听器可以完成此任务?工具包?我需要一些指导。 JavaScript 可以完成这个吗?

javascript ajax web-scraping google-chrome-extension hook
1个回答
29
投票

我将展示解决问题的两种方法。无论您选择哪种方法,请不要忘记阅读我答案的底部!

首先,我提出一个简单的方法,该方法仅在页面使用 jQuery 时才有效。第二种方法看起来稍微复杂一些,但也适用于没有 jQuery 的页面。

以下示例展示了如何基于方法(例如 POST/GET)、URL 以及读取 (POST) 数据和响应正文来实现过滤器。

在 jQuery 中使用全局 ajax 事件

有关 jQuery 方法的更多信息可以在

.ajaxSuccess
的文档中找到。 用途:

jQuery.ajaxSuccess(function(event, xhr, ajaxOptions) {
    /* Method        */ ajaxOptions.type
    /* URL           */ ajaxOptions.url
    /* Response body */ xhr.responseText
    /* Request body  */ ajaxOptions.data
});

纯 JavaScript 方式

当网站不使用 jQuery 进行 AJAX 请求时,您必须修改内置的

XMLHttpRequest
方法。这需要更多代码...:

(function() {
    var XHR = XMLHttpRequest.prototype;
    // Remember references to original methods
    var open = XHR.open;
    var send = XHR.send;

    // Overwrite native methods
    // Collect data: 
    XHR.open = function(method, url) {
        this._method = method;
        this._url = url;
        return open.apply(this, arguments);
    };

    // Implement "ajaxSuccess" functionality
    XHR.send = function(postData) {
        this.addEventListener('load', function() {
            /* Method        */ this._method
            /* URL           */ this._url
            /* Response body */ this.responseText
            /* Request body  */ postData
        });
        return send.apply(this, arguments);
    };
})();

让它在 Chrome 扩展程序中工作

前面显示的代码必须在页面上下文中运行(在您的例子中是拍卖页面)。因此,必须使用内容脚本注入(!)脚本。使用这个并不困难,我参考这个答案以获得详细的解释和使用示例:Building a Chrome Extension - Inject code in a page using a Content script

通用方法

您可以使用

chrome.webRequest
API 读取请求正文、请求标头和响应标头。标题也可以修改。然而(尚)不可能读取,更不用说修改请求的响应正文了。如果您想要此功能,请加注星标 https://code.google.com/p/chromium/issues/detail?id=104058

© www.soinside.com 2019 - 2024. All rights reserved.