Python 语音到 mikrofon 流中的文本

问题描述 投票:0回答:1

我想用 python 编写自己的语音助手,然后在 rapsberry pi 上运行它。我要做的第一步是转录 microfon 流的语音。 因此,我希望麦克风收到的语音立即转换为文本,以便我可以检查该文本中是否有信号词,例如“嘿 Siri”。

我已经尝试过大部分 STT API,例如语音识别、耳语和 Google Cloud Speech_To_Text。我遇到的问题是他们在直播期间没有转录。例如,语音识别会等到我停止说话为止。然后将录制的音频文件发送到服务器并进行转录。这花了很长时间。

有什么想法吗?

python speech-recognition whisper
1个回答
0
投票

您在这里试图解决的具体问题是音频的实时转录。 Python 的

SpeechRecognition
库能够执行此操作,但需要一些额外的操作。请参阅此问题了解更多信息。

© www.soinside.com 2019 - 2024. All rights reserved.