我已经使用下面给出的 python 代码成功地从我的文本生成音频文件。 但是现在我想减慢说话速度,但是将spoken_rate更改为任何值都不会影响音频输出。没有错误。音频文件输出良好。但每次都是完全相同的(也就是说,speaking_rate 不起作用)。
en-US-Journey-O 语音是否支持spoken_rate?
如果不是,我可以使用什么声音来听起来自然并且可以控制语速?
我在这里看到了完全相同的问题但没有解决方案: https://www.googlecloudcommunity.com/gc/AI-ML/speaking-rate-has-no-effect-for-Journey-Voice-in-Text-To-Speech/td-p/759770
这是我的代码: `def Synthesize_text(文本, 输出文件): 客户端 = texttospeech.TextToSpeechClient()
# Synthesize text output
input_text = texttospeech.SynthesisInput(text=text)
# Voice parameters
voice = texttospeech.VoiceSelectionParams(
language_code="en-US",
name = "en-US-Journey-O"
)
# Set up the audio configuration (output format)
audio_config = texttospeech.AudioConfig(
audio_encoding=texttospeech.AudioEncoding.LINEAR16,
speaking_rate = 0.5
)
# The text-to-speech request
response = client.synthesize_speech(
input=input_text, voice=voice, audio_config=audio_config
)
# Write the response (audio content) to the output file
with open(output_file, "wb") as out:
out.write(response.audio_content)
print(f"Audio content written to {output_file}")`
根据https://cloud.google.com/text-to-speech/docs/voice-types:
Journey Voices 不支持 SSML 输入、语速和音调 音频参数和 A-Law 音频编码。