当我将https://s3.amazonaws.com/nyc-tlc/trip+data/fhv_tripdata_2015-01.csv放入浏览器时,我可以下载文件没问题。但是当我说,
wget.download('https://s3.amazonaws.com/nyc-tlc/trip+data/fhv_tripdata_2015-01.csv', out='data/')
我收到404错误。该URL的格式有问题吗?
这不是HTTP Error 404: Not Found when using wget to download a link的副本。 wget与其他文件一起正常工作。这似乎是S3特有的,下面将对此进行说明。
根本原因是S3中的错误,如下所述:https://stackoverflow.com/a/38285197/4323
一种解决方法是使用requests
库:
r = requests.get('https://s3.amazonaws.com/nyc-tlc/trip+data/fhv_tripdata_2015-01.csv')
这很好用。您可以检查r.text
或将其写入文件。有关最有效的方法,请参阅https://stackoverflow.com/a/39217788/4323