我正在使用 MS 语音服务 sdk 进行语音到文本的转换。当我说话时,即使我没有停止说话,我的讲话也会在 60 秒后转换为文本。它基本上将其视为一大块并开始处理它。我可以做什么来增加这个超时时间?
我希望即使我说话 80 秒,服务也能继续收听,并在我说完后才将语音转换为文本。
感谢您联系我们并发布此查询。
您可以使用
SegmentationSilenceTimeoutMs
请参阅此文档,其中详细讨论了此设置:
如果用户说话速度比平时更快或更慢,输入音频中非语音静音的默认行为可能不会产生预期结果。请参阅此文档,其中解释了如何处理此超时。
此外,这个 SO 线程 和 这篇文章 对语音 sdk 中可用的超时设置(如 InitialSilenceTimeout 和 EndSilenceTimeout)有一些建议。希望这有帮助。