如何提取被刮图像的文件修改时间?

问题描述 投票:3回答:1

我正试图抓取包含部件图像的部分网站的一部分,以收集一些统计数据。但是,没有网址或图片上传或创建日期,因此我必须使用近似图像文件修改日期来获取此信息。使用cURL,这是一项简单的任务:

curl -sI https://path.to.com/blahblah_123/item_picture.jpg |grep "last-modified"

但是,我认为在scrapy蜘蛛中获得它会更方便。但我不知道scrapy是否支持这一点,因为我在文档中找不到它。

有没有办法在scrapy中获取刮削图像的最后修改日期?

python web-scraping scrapy scrapy-spider
1个回答
2
投票

Scrapy的文档中,response有一个headers字典。

所以你可以用last-modified访问response.headers.get('Last-Modified')

© www.soinside.com 2019 - 2024. All rights reserved.