所以目前我正在开发一个 HTML 页面,该页面显示我计划使用网络抓取工具获取的网络上的各种内容。我见过各种各样的抓取工具,其中大多数使用 Cheerio 和 Request API/库。然而,所有这些教程(例如:http://www.netinstructions.com/simple-web-scraping-with-node-js-and-javascript/)都使用 Node.js 而不仅仅是 HTML 文件和 . js 文件。我对使用node.js没有兴趣,因为这是一个纯粹在本地PC上运行的页面(不托管也不作为网页运行),使用node.js似乎只会增加复杂性,因为至少在我的理解中Node.js 的作用是允许 JavaScript 在服务器端而不是客户端执行。所以我的问题是如何下载和导入库(例如:https://github.com/cheeriojs/cheerio)到我的主javascript文件中,以便它可以通过浏览器运行?
编辑:即使node.js不仅仅用于服务器端,我的问题仍然存在。浏览器运行 Javascript,因此如果我将想要与主 .js 一起使用的库打包并引用它们,它将在没有 Node.js 的情况下工作。我只是不知道如何正确地使用例如有许多 .js 文件的 Cheerio 来做到这一点。 编辑2:另外,如果有人可以给我指出正确的方向或教程,可以帮助我制作一个刮刀,如果你不能在客户端使用这些东西,这也可能会有所帮助。
您无法在客户端导入cheerio,因为它是专门为nodejs制作的。但 cherrio 是 jQuery 的服务器端实现(仅在浏览器中运行)。
要导入 jquery,您可以将其作为 html 中的链接。例如:
<script src="https://ajax.googleapis.com/ajax/libs/jquery/3.3.1/jquery.min.js"></script>
您应该在导入您自己的 javascript 文件之前放置此文件。
然后在 javascript 中,您将可以访问
$
,这是主 jQuery 对象的别名。
这是您可以执行的操作的一个很好的示例:如何将 JavaScript 文件链接到 HTML 文件?