我该如何输入音频？ [关闭]

Question

TL; DR：我已将1,000个mp3文件合并到一个大型mp3文件中，但无法通过Torch框架传递此文件。

我已经能够使用Torch成功生成莎士比亚样品的独特输出。现在，我想更进一步，输入音频文件而不是文本文件。

bash$ audio.load(/path/to/fullyMerged.mp3)
-bash: syntax error near unexpected token `/path/to/fullyMerged.mp3'

我尝试使用audio.load（path）按照火炬文档here的建议，但是我收到了意外的令牌错误。

编辑：以下是我尝试过的一些事情，但都失败了

尝试直接使用输入mp3，然而，mp3是无效输入：python scripts/preprocess.py --input_mp3 data/fullyMerged.mp3 --output_h5 data/fullyMerged.h5 --output_json data/fullyMerged.json
尝试将.mp3扩展名重命名为.txt并将其输入Torch，然而，返回UnicodeDecodeError，因为音频不能表示为文本
尝试将我的.mp3文件转换为.raw格式，.wav格式以及许多其他格式，但是，Torch没有可处理的音频格式。
还尝试将这些转换的.raw和.wav文件的扩展名重命名为.txt，但这仍然给了我一个UnicodeDecodeError

我花了无数个小时试图让Torch处理音频，但我无法这样做！任何反馈都将非常感激。

Answer 1

audio.load不是有效的Bash命令。错误消息有点混乱，因为括号也是无效的;甚至在Bash尝试执行任何操作之前触发解析错误。

要启动交互式Python会话，请在Bash提示符下键入python。你仍然需要在Python之前使用import，或者接受audio.load作为函数名称。

也许你应该花一些时间熟悉Python，然后再尝试将它用于非常重要的新开发工作。

...除非它看起来像你链接的库是一个Lua库，而不是一个Python库。我对Lua并不熟悉，但其余的答案仍然存在。可能从the Lua-Audio project's README末尾附近的用法示例开始，然后将其复制/粘贴到文本文件中，然后找出如何使用Lua运行它。

Answer 2

你应该给audio.load而不是/Users/.../fullyMerged.mp3一个字符串

你应该更换

audio.load(/Users/.../fullyMerged.mp3)

同

audio.load('/Users/.../fullyMerged.mp3')