MATLAB 不读取 Parquet 文件,只是显示“无法读取 Parquet 文件”。我怎么还能读呢?

问题描述 投票:0回答:1

我使用 Python polars'

.write_parquet
方法创建了一个镶木地板文件。 Python 可以毫无问题地读回它,MATLAB 也可以使用 parquetinfo
 毫无问题地读取文件的信息 
about

但是,当我在 MATLAB 中运行

parquetread
来实际加载数据时,它很快就会失败,并出现错误“无法读取 Parquet 文件”,而没有更多详细信息。

如何使用 Python 创建可由 MATLAB 读取的 parquet 文件?

python matlab parquet
1个回答
0
投票

事实证明 parquetfile 使用的压缩与 MATLAB 2024a 不兼容。

在我的Python代码中我写道:

df.write_parquet("./file.parquet", compression="lz4")

我选择了压缩,因为根据文档它更快。继续阅读后,我发现 compression 参数的

the docs
也声明了(强调我的):

选择“zstd”以获得良好的压缩性能。选择“lz4”进行快速压缩/解压缩。 当您处理较旧的镶木地板阅读器时,选择“snappy”以获得更多向后兼容性保证。

将压缩选项设置为“snappy”后,生成的文件可以由 MATLAB 读取。所以Python代码行变成:

df.write_parquet("./file.parquet", compression="snappy")
© www.soinside.com 2019 - 2024. All rights reserved.