我该如何输入音频? [关闭]

问题描述 投票:-3回答:2

TL; DR:我已将1,000个mp3文件合并到一个大型mp3文件中,但无法通过Torch框架传递此文件。

我已经能够使用Torch成功生成莎士比亚样品的独特输出。现在,我想更进一步,输入音频文件而不是文本文件。

bash$ audio.load(/path/to/fullyMerged.mp3)
-bash: syntax error near unexpected token `/path/to/fullyMerged.mp3'

我尝试使用audio.load(path)按照火炬文档here的建议,但是我收到了意外的令牌错误。

编辑:以下是我尝试过的一些事情,但都失败了

  • 尝试直接使用输入mp3,然而,mp3是无效输入:python scripts/preprocess.py --input_mp3 data/fullyMerged.mp3 --output_h5 data/fullyMerged.h5 --output_json data/fullyMerged.json
  • 尝试将.mp3扩展名重命名为.txt并将其输入Torch,然而,返回UnicodeDecodeError,因为音频不能表示为文本
  • 尝试将我的.mp3文件转换为.raw格式,.wav格式以及许多其他格式,但是,Torch没有可处理的音频格式。
  • 还尝试将这些转换的.raw.wav文件的扩展名重命名为.txt,但这仍然给了我一个UnicodeDecodeError

我花了无数个小时试图让Torch处理音频,但我无法这样做!任何反馈都将非常感激。

python algorithm machine-learning artificial-intelligence torch
2个回答
1
投票

audio.load不是有效的Bash命令。错误消息有点混乱,因为括号也是无效的;甚至在Bash尝试执行任何操作之前触发解析错误。

要启动交互式Python会话,请在Bash提示符下键入python。你仍然需要在Python之前使用import,或者接受audio.load作为函数名称。

也许你应该花一些时间熟悉Python,然后再尝试将它用于非常重要的新开发工作。

...除非它看起来像你链接的库是一个Lua库,而不是一个Python库。我对Lua并不熟悉,但其余的答案仍然存在。可能从the Lua-Audio project's README末尾附近的用法示例开始,然后将其复制/粘贴到文本文件中,然后找出如何使用Lua运行它。


0
投票

你应该给audio.load而不是/Users/.../fullyMerged.mp3一个字符串

你应该更换

audio.load(/Users/.../fullyMerged.mp3)

audio.load('/Users/.../fullyMerged.mp3')
© www.soinside.com 2019 - 2024. All rights reserved.