长话短说。我在当地的五金店工作,我正在努力简化和自动化尽可能多的东西。因此,这是我试图完成的一个更大项目的一部分。
就像标题所述,我正在尝试从 Excel 文件中提取列表(UPC 条形码列表)。然后我想使用他们的搜索功能在 www.truevalue.com 上搜索每个条形码;最后,我想从每个结果中提取 SKU 编号,并将其放入另一个带有相应 UPC 条形码的 Excel 文件中。您可能认为我们的商店代表愿意帮助我们获取此信息,但公司却没有提供帮助。
我花了几天时间试图解决这个问题;不幸的是,我上的学校学习的是生物、化学和商科,而不是计算机科学。所以这东西对我来说相当新鲜。
在尝试解决这个问题的过程中,我已经熟悉了 Scrapy 和 Selenium。我读过/观看过的所有教程和常见问题解答都展示了如何搜索 1 个单独的项目并从结果页面中提取信息;因此,我相信我可以(用 Python)编写代码来实现这一点。但是,我还没有找到任何关于搜索多个产品然后将 SKU 列表导出到 Excel 文件的解释。
我想我只是不知道需要使用什么模块或函数来允许我以这种方式连接 Excel 和 Selenium。我并不一定要使用 Scrapy 或 Selenium。我愿意学习任何我需要的东西,让我能够解决这个问题。所以如果你们有更好的主意,我愿意。如果我误用了任何技术术语,请原谅我,正如我所说,我对这一切都是新手。感谢您花时间阅读,希望对您有所帮助!
Openpyxl 是读取 Excel 电子表格的绝佳资源。您想要做的是使用 load_workbook() 方法打开 Excel 文件,然后从您的信息所在的单元格中读取并将所有值保存到单个列表或字典中。
如果您找到了一种抓取one项目数据的方法,您所要做的就是循环列表/字典并对列表中的每个项目执行搜索/抓取,将每个抓取的结果添加到当你走的时候,还有第二个清单。然后,您可以再次使用 openpyxl 将新数据写入相同或单独的电子表格中。