是否可以使用 JavaScript 抓取通过 AJAX 实时更新的网页的所有更改?我希望每秒使用 AJAX 抓取更新数据的网站,并且我想获取所有更改。这是一个拍卖网站,每当用户出价时,多个对象可能会发生变化。出价后发生以下变化:
当前买入价 目前的最高出价者 拍卖计时器已重新添加时间
我希望使用基于 JavaScript 构建的 Chrome 扩展来获取这些数据。是否有 JavaScript 的 AJAX 侦听器可以完成此任务?工具包?我需要一些指导。 JavaScript 可以完成这个吗?
我将展示解决问题的两种方法。无论您选择哪种方法,请不要忘记阅读我答案的底部!
首先,我提出一个简单的方法,该方法仅在页面使用 jQuery 时才有效。第二种方法看起来稍微复杂一些,但也适用于没有 jQuery 的页面。
以下示例展示了如何基于方法(例如 POST/GET)、URL 以及读取 (POST) 数据和响应正文来实现过滤器。
.ajaxSuccess
的文档中找到。
用途:
jQuery.ajaxSuccess(function(event, xhr, ajaxOptions) {
/* Method */ ajaxOptions.type
/* URL */ ajaxOptions.url
/* Response body */ xhr.responseText
/* Request body */ ajaxOptions.data
});
当网站不使用 jQuery 进行 AJAX 请求时,您必须修改内置的
XMLHttpRequest
方法。这需要更多代码...:
(function() {
var XHR = XMLHttpRequest.prototype;
// Remember references to original methods
var open = XHR.open;
var send = XHR.send;
// Overwrite native methods
// Collect data:
XHR.open = function(method, url) {
this._method = method;
this._url = url;
return open.apply(this, arguments);
};
// Implement "ajaxSuccess" functionality
XHR.send = function(postData) {
this.addEventListener('load', function() {
/* Method */ this._method
/* URL */ this._url
/* Response body */ this.responseText
/* Request body */ postData
});
return send.apply(this, arguments);
};
})();
前面显示的代码必须在页面上下文中运行(在您的例子中是拍卖页面)。因此,必须使用内容脚本来注入(!)脚本。使用这个并不困难,我参考这个答案以获得详细的解释和使用示例:Building a Chrome Extension - Inject code in a page using a Content script。
chrome.webRequest
API 读取请求正文、请求标头和响应标头。标题也可以修改。然而(尚)不可能读取,更不用说修改请求的响应正文了。如果您想要此功能,请加注星标 https://code.google.com/p/chromium/issues/detail?id=104058。