如何读取大型CSV文件,添加多维数据并将每小时转换为每天?

问题描述 投票:0回答:1

我有一个大型CSV文件,它们以5毫米格网的小时分辨率表示美国的天气数据。每天都保存数据,因此我将它们串联在一起以获取年度文件。最终目标是通过纬度和经度计算变量(风速,温度,降水,压力等)的每日,每周和每月平均值。没有列标题,因此在读入文件时会在文件中添加列名。

[当我尝试用Python读取Pandas时,它失败了,因为它不适合内存。我可以使用Dask进行阅读,但是后来找不到找到将维度添加到Dask数据框或转换为xarray并进行相同操作的方法。有没有一种方法可以读取这些太大的内存文件,添加纬度,经度,日期时间维度,计算每个纬度/经度的每日,每周和每月平均值,然后输出文件?或者,在读入之前是否需要将csv转换为netCDF或类似内容?

我有一个大型CSV文件,它们以5毫米格网的小时分辨率表示美国的天气数据。每天都保存数据,因此我将它们串联在一起以获取年度文件。最终的...

python csv multidimensional-array dask dask-dataframe
1个回答
0
投票

据我所知,不通过熊猫就无法将CSV加载到xarray中。因此,是的,您将需要更改文件格式才能使用xarray。您也可以考虑将数据分解为较小的文件。

© www.soinside.com 2019 - 2024. All rights reserved.