Azure TTS 部分渲染 MP3 输出，然后出现“内部服务器错误”

Question

我通过 python API 在 Azure 上使用 F1（非免费层、OpenAI Neural 非高清语音）文本转语音。我有确定性的部分完成，并带有“内部服务器错误”和“收到部分数据”消息，结束了音频渲染中字。然而，通过 Speech Studio 使用相同的 TTS 实例，相同的 SSML 可以完美地工作。

输入SSML xml文件：demo.xml

独立Python API代码：demo.py

日志文件输出：log.txt（可以看到综合超时）

SSML 在语音工作室工作
SSML 无法使用 python 代码完全渲染
但是，SSML 部分渲染，因此语音 sdk 配置是正确的

日志文件摘录

[405035]: 35806ms SPX_TRACE_VERBOSE:  synthesizer_timeout_management.cpp:85 IsTimeout: synthesis might timeout, current RTF: 0.77 (threshold: 2.00), frame interval 9967 ms (threshold 3000ms)
[405035]: 35856ms SPX_TRACE_WARNING: synthesizer_timeout_management.cpp:80 IsTimeout: synthesis timed out, current RTF: 0.78 (threshold: 2.00), frame interval 10017 ms (threshold 3000ms)
[405035]: 35857ms SPX_DBG_TRACE_VERBOSE:  usp_tts_engine_adapter.cpp:376 StopSpeaking
[405035]: 35857ms SPX_DBG_TRACE_VERBOSE:  usp_tts_engine_adapter.cpp:1040 Response: On Error: Code:6, Message: Timeout while synthesizing. Current RTF: 0.775118 (threshold 2), frame interval 10018ms (threshold 3000ms)..

Answer 1

酷！我们了解到，如果 SSML 元素由空格缩进，Python API 就会中断。我认为这是一个错误，但我还没有阅读 SSML 规范来了解更多信息。

感谢 Suresh 提出 SSML 可能是罪魁祸首，即使某些语音服务可以接受它。

Azure TTS 部分渲染 MP3 输出，然后出现“内部服务器错误”

问题描述投票：0回答：1

1个回答

最新问题

Azure TTS 部分渲染 MP3 输出，然后出现“内部服务器错误”

问题描述 投票：0回答：1

1个回答

最新问题

问题描述投票：0回答：1