是否有任何在线工具(无需在计算机上安装软件)从网站中提取带有URL列表的数据。我想从www.indiabix.com中提取数据,例如:
1)问题
2)选项1
3)选项2
4)选项4
5)回答(这是启用了javascript)
6)解释
我希望所有这些信息都能出类拔萃。我尝试了import.io,但效果不大,另一个工具WEBCONTENTEXTRACTOR不是免费的,试用版只有14天。
我刚试过“火车上的问题”部分:
http://www.indiabix.com/aptitude/problems-on-trains/
仅使用Magic(即基于Web的工具),我认为您可以获得与您想要的格式非常接近的数据 - 并以CSV格式下载(然后可以在Excel中打开):
不幸的是,由于答案是隐藏的,我担心你需要桌面应用程序来提取它(它是免费的 - 虽然我感谢你提到你不想安装任何东西)。来自[email protected]的人很棒,你可以随时联系他们,看看是否有任何技巧/提示可以达到你想要的。
希望这可以帮助。
可以在名为divspacer_contents的列中找到答案。如果查看该列的内容,您将看到每个问题的答案。
问题是旧的,但值得一提的是DataScraping.co,你可以在chrome商店使用名为“Advanced web scraper”的chrome扩展来设置抓取代理,然后在线应用程序提取几乎任何网站。
注意:我是该产品的创始成员之一