为什么我不能使用wget从S3下载？

Question

当我将https://s3.amazonaws.com/nyc-tlc/trip+data/fhv_tripdata_2015-01.csv放入浏览器时，我可以下载文件没问题。但是当我说，

wget.download('https://s3.amazonaws.com/nyc-tlc/trip+data/fhv_tripdata_2015-01.csv', out='data/')

我收到404错误。该URL的格式有问题吗？

这不是HTTP Error 404: Not Found when using wget to download a link的副本。 wget与其他文件一起正常工作。这似乎是S3特有的，下面将对此进行说明。

Answer 1

根本原因是S3中的错误，如下所述：https://stackoverflow.com/a/38285197/4323

一种解决方法是使用requests库：

r = requests.get('https://s3.amazonaws.com/nyc-tlc/trip+data/fhv_tripdata_2015-01.csv')

这很好用。您可以检查r.text或将其写入文件。有关最有效的方法，请参阅https://stackoverflow.com/a/39217788/4323