使用pydub为Google语音导出音频

问题描述 投票:1回答:1

我正在尝试将音频文件导出到LINEAR16 for Google Speech,我注意到它们指定了little-endian字节顺序。我正在使用pydub导出为'raw'格式,但我无法从文档(或源代码)判断导出的文件是以小端还是大端格式?我正在使用以下命令进行导出:

audio = pydub.from_file(self.mFilePathName, "mp4")
fullFileNameRaw = "audio.raw"
audio.export(fullFileNameRaw, format='raw')

谢谢。 -K

python audio google-speech-api pydub google-cloud-speech
1个回答
0
投票

根据this answer,标准(RIFF)波形文件是小端。 Pydub使用stdlib wavemodule来写波形文件,所以我猜它是小端。 (如果你用波形标题编写文件,它实际上在开头就有RIFF)。

然而,进一步研究它似乎可能取决于硬件平台的字节顺序。虽然x86和AMD64都是小端,所以基本上涵盖了人们运行pydub的所有地方(我想?)

© www.soinside.com 2019 - 2024. All rights reserved.