Azure TTS 部分渲染 MP3 输出,然后出现“内部服务器错误”

问题描述 投票:0回答:1

我通过 python API 在 Azure 上使用 F1(非免费层、OpenAI Neural 非高清语音)文本转语音。我有确定性的部分完成,并带有“内部服务器错误”和“收到部分数据”消息,结束了音频渲染中字。然而,通过 Speech Studio 使用相同的 TTS 实例,相同的 SSML 可以完美地工作。

输入SSML xml文件:demo.xml

独立Python API代码:demo.py

日志文件输出:log.txt(可以看到综合超时)

  • SSML 在语音工作室工作
  • SSML 无法使用 python 代码完全渲染
  • 但是,SSML 部分渲染,因此语音 sdk 配置是正确的

日志文件摘录

[405035]: 35806ms SPX_TRACE_VERBOSE:  synthesizer_timeout_management.cpp:85 IsTimeout: synthesis might timeout, current RTF: 0.77 (threshold: 2.00), frame interval 9967 ms (threshold 3000ms)
[405035]: 35856ms SPX_TRACE_WARNING: synthesizer_timeout_management.cpp:80 IsTimeout: synthesis timed out, current RTF: 0.78 (threshold: 2.00), frame interval 10017 ms (threshold 3000ms)
[405035]: 35857ms SPX_DBG_TRACE_VERBOSE:  usp_tts_engine_adapter.cpp:376 StopSpeaking
[405035]: 35857ms SPX_DBG_TRACE_VERBOSE:  usp_tts_engine_adapter.cpp:1040 Response: On Error: Code:6, Message: Timeout while synthesizing. Current RTF: 0.775118 (threshold 2), frame interval 10018ms (threshold 3000ms)..
azure text-to-speech azure-speech
1个回答
0
投票

酷!我们了解到,如果 SSML 元素由空格缩进,Python API 就会中断。我认为这是一个错误,但我还没有阅读 SSML 规范来了解更多信息。

感谢 Suresh 提出 SSML 可能是罪魁祸首,即使某些语音服务可以接受它。

© www.soinside.com 2019 - 2024. All rights reserved.