更改speech_rate对Google TTS Journey没有影响

问题描述 投票:0回答:1

我已经使用下面给出的 python 代码成功地从我的文本生成音频文件。 但是现在我想减慢说话速度,但是将spoken_rate更改为任何值都不会影响音频输出。没有错误。音频文件输出良好。但每次都是完全相同的(也就是说,speaking_rate 不起作用)。

en-US-Journey-O 语音是否支持spoken_rate?

如果不是,我可以使用什么声音来听起来自然并且可以控制语速?

我在这里看到了完全相同的问题但没有解决方案: https://www.googlecloudcommunity.com/gc/AI-ML/speaking-rate-has-no-effect-for-Journey-Voice-in-Text-To-Speech/td-p/759770

这是我的代码: `def Synthesize_text(文本, 输出文件): 客户端 = texttospeech.TextToSpeechClient()

# Synthesize text output
input_text = texttospeech.SynthesisInput(text=text)

# Voice parameters
voice = texttospeech.VoiceSelectionParams(
    language_code="en-US",
    name = "en-US-Journey-O"
)

# Set up the audio configuration (output format)
audio_config = texttospeech.AudioConfig(
    audio_encoding=texttospeech.AudioEncoding.LINEAR16,
    speaking_rate = 0.5
)

# The text-to-speech request
response = client.synthesize_speech(
    input=input_text, voice=voice, audio_config=audio_config
)

# Write the response (audio content) to the output file
with open(output_file, "wb") as out:
    out.write(response.audio_content)
print(f"Audio content written to {output_file}")`
python-3.x text-to-speech google-text-to-speech
1个回答
0
投票

根据https://cloud.google.com/text-to-speech/docs/voice-types

Journey Voices 不支持 SSML 输入、语速和音调 音频参数和 A-Law 音频编码。

© www.soinside.com 2019 - 2024. All rights reserved.