我使用 Python polars'
.write_parquet
方法创建了一个镶木地板文件。 Python 可以毫无问题地读回它,MATLAB 也可以使用 parquetinfo
毫无问题地读取文件的信息about。
parquetread
来实际加载数据时,它很快就会失败,并出现错误“无法读取 Parquet 文件”,而没有更多详细信息。
如何使用 Python 创建可由 MATLAB 读取的 parquet 文件?
事实证明 parquetfile 使用的压缩与 MATLAB 2024a 不兼容。
在我的Python代码中我写道:
df.write_parquet("./file.parquet", compression="lz4")
我选择了压缩,因为根据文档它更快。继续阅读后,我发现 compression
参数的
the docs也声明了(强调我的):
选择“zstd”以获得良好的压缩性能。选择“lz4”进行快速压缩/解压缩。 当您处理较旧的镶木地板阅读器时,选择“snappy”以获得更多向后兼容性保证。
将压缩选项设置为“snappy”后,生成的文件可以由 MATLAB 读取。所以Python代码行变成:
df.write_parquet("./file.parquet", compression="snappy")