text-to-speech 相关问题

文本到语音或语音合成是人类语音的人工产生。

TextToSpeech.setEngineByPackageName() 触发 NullPointerException

我的活动的 onInit() 包含对 TextToSpeech.setEngineByPackageName() 的调用： tts = new TextToSpeech(这,这); tts.setEngineByPackageName("com.ivona.tts.voicebeta.eng.usa.kendra"); 它...

android text-to-speech

回答 3 投票 0

连接来自 Azure 语音服务 tts 的缓冲区

我有一篇来自学术论文的巨大文本，我想将其转换为音频。由于音频太大，我将其分成 4096 个字符的块。然后我将其发送到 OpenAi tts api ch...

azure text-to-speech speech

回答 1 投票 0

文本转语音和 gif Flutter

我在我的 flutter 应用程序中使用文本转语音插件和 gif。如果助理正在说话，我希望屏幕上显示的 gif 发生变化。当助理说完之后，我...

flutter text-to-speech

回答 2 投票 0

ModelCheckpoint 未保存 hdf5 文件

我在构建语音到文本模型时遇到了一个奇怪的问题。该模型已被训练和创建，但是当我尝试将其保存为 hdf5 文件，以便将其重新用于测试目的时，

tensorflow keras speech-recognition text-to-speech speech-to-text

回答 1 投票 0

查看寻呼机上的文本转语音

我有查看寻呼机，每个页面上只有很少的文本，我有一个按钮，按下按钮时文本转语音事件被触发我知道如何使用文本转语音，但说到 viewPager 我不知道代码：酒吧...

android android-viewpager text-to-speech

回答 2 投票 0

SpeechSynthesisUtterance 不能跨浏览器？

var msg = new SpeechSynthesisUtterance(); msg.text = "你好世界"; window.speechSynthesis.speak(msg); 这在brave和chrome浏览器上没有任何声音，但在firefox中却有声音

text-to-speech

回答 1 投票 0

文本转语音网页阅读器忽略表单

我有一个非常简单的文件来测试文本转语音的可访问性：我有一个非常简单的文件来测试文本转语音的可访问性： <!DOCTYPE html> <html lang="en"> <head> <meta charset="UTF-8"> <meta name="viewport" content="width=device-width, initial-scale=1.0"> <title>Document</title> </head> <body> <h1>Lorem ipsum</h1> <form method="POST" action=""> <input id="check1" type="checkbox" value="1" aria-labelledby="check1-label" /> <label id="check1-label" for="check1">This is an input label</label> <button type="submit">Submit</button> </form> </body> </html> 我正在使用 read-aloud Chrome / Firefox 扩展程序，因为它似乎是这方面最流行的扩展程序之一。它只是忽略了形式。我有什么遗漏的吗？关于屏幕阅读器和 TTS 扩展此类浏览器扩展程序根本不能代表因障碍（盲人、视力不佳、有障碍等）而需要屏幕阅读或 TTS 的用户。所有这些用户都使用可以在其设备上的任何位置读取屏幕的软件，而不仅仅是在浏览器中。无论作者怎么说，这些扩展的功能对于具有真正可访问性需求的用户来说还远远不够完整。它们更适合偶尔需要 TTS 但并不总是需要它的用户。例如，将文本快速转换为有声读物，供不想阅读的傻瓜或儿童使用。请注意，不过，有一些更高级的专用应用程序可以制作有声读物或将几段文本转换为语音。对于您作为开发人员/设计人员来说，如果您的目标是测试网站的可访问性，那么基本上意味着您没有使用具有可访问性需求的真实用户每天真正使用的正确工具进行测试。换句话说，你没有达到目标，你的测试无效，你在浪费时间。您应该使用用户在现实生活中使用的真实软件来测试可访问性，以便真正体验它的含义。没有 36 种方法，您应该在计算机中运行屏幕阅读器。例如，Windows 上的 NVDA、Mac/iPhone/iPad 上的 VoiceOver、Android 上的 Talkback。所有这些都是免费的，VoiceOver 和 Talkback 通常甚至无需安装任何东西即可使用。关于您的代码 Jaws、NVDA、VoiceOver 和 Talkback 等真正的屏幕阅读器或多或少遵循可访问性和 ARIA 标准。他们所有人在阅读您所呈现的页面时都不会有任何重大问题。我没有看到任何重大错误。不过，存在无用的冗余。由于您的 <input> 已经正确链接到您的 <label>，因此您不需要另外将其与 aria-labelledby 链接。您应该删除 aria-labelledby。这是完全多余的，它可能是导致您的浏览器扩展无法读取它的原因。但是，TTS 浏览器扩展可以或多或少地遵循标准，或者根本不遵循标准，并且不期望或不需要这样做，因此很难说您观察到的行为是错误还是有意为之，也很难说您应该做什么准确地修复它（如果可以修复）。根据可访问性标准，这绝对是错误的，但由于此类浏览器扩展主要不是针对残障用户，因此可能有不同的意图。

html accessibility text-to-speech wai-aria read-aloud

回答 1 投票 0

Azure 语音服务 + 文本转语音 + Silent SpeakSsmlAsync

我正在使用 Azure 文本转语音，它是认知服务的一部分。我将请求编写为 SSML，然后调用函数 SpeakSsmlAsync。如果我选择输出格式Audio24Khz160KBitRateMonoMp3，...

text-to-speech azure-cognitive-services

回答 1 投票 0

如何使用 espeak API 枚举可用的语音和语言？

我正在使用 C++ 中的 espeak API 从我的嵌入式应用程序中进行一些简单的文本到语音合成。目前，我从有关如何开始的基本示例中复制了这一行： espeak_SetVoiceByNa...

c++ text-to-speech espeak

回答 3 投票 0

如果你想开发一个语音助手，你会使用哪种语言？

我正在尝试开发语音助手，但我对使用哪种语言感到困惑。我希望该应用程序能够在 Windows 和 Android 上正常运行。如果您有任何建议请留言。

artificial-intelligence text-to-speech voice assistant

回答 3 投票 0

如何在 Windows 11 中注册 TTS 语音？

我在使用另外 2 个声音时遇到一些麻烦，就我而言，我尝试使用 Pablo（西班牙语 - 西班牙）和 George（英语 - 英国）。我用 python/Django 开发了一个应用程序，从前面我发送了一个带有

python django text-to-speech win32com windows-11

回答 1 投票 0

头像无法启动。错误：InvalidCharacterError：无法在“Window”上执行“atob”：要解码的字符串未正确编码

//utilty.js 导出 const fetchIceCredentials = async () => { 尝试 { const 响应 = 等待 axios.get('https://westus2.tts.speech.microsoft.com/cognitiveservices/avatar/relay/token/v1...

azure webrtc text-to-speech avatar

回答 1 投票 0

使用预先训练的 VITS 模型与看不见的扬声器合成音频

我一直在使用预训练的 VITS 模型（VCTK 数据集）进行文本到语音合成。我已使用以下命令成功获取了可用发言人的列表： !tts --模型名称 tts_models/en/vctk...

text-to-speech voice-recognition speech-synthesis

回答 1 投票 0

我可以在 Flutter 中更改 Google TTS 的声音吗？

我编写了一个函数，它接受 2 个字符串（陈述、问题）并使用 Google TTS 大声朗读。我正在使用 flutter_tts: ^1.3.0 包并尝试 setVoice 方法来更改

flutter dart text-to-speech

回答 2 投票 0

如何将 Edge TTS 生成的音频直接播放到扬声器而不先保存？

这是保存edge tts音频的代码导入异步导入edge_tts 声音= ['en-US-GuyNeural'] text =“嗨，这是测试” 声音=声音[0] 输出文件=“测试r...