文本到语音或语音合成是人类语音的人工产生。
TextToSpeech.setEngineByPackageName() 触发 NullPointerException
我的活动的 onInit() 包含对 TextToSpeech.setEngineByPackageName() 的调用: tts = new TextToSpeech(这,这); tts.setEngineByPackageName("com.ivona.tts.voicebeta.eng.usa.kendra"); 它...
我有一篇来自学术论文的巨大文本,我想将其转换为音频。由于音频太大,我将其分成 4096 个字符的块。然后我将其发送到 OpenAi tts api ch...
我在我的 flutter 应用程序中使用文本转语音插件和 gif。如果助理正在说话,我希望屏幕上显示的 gif 发生变化。当助理说完之后,我...
我在构建语音到文本模型时遇到了一个奇怪的问题。 该模型已被训练和创建,但是当我尝试将其保存为 hdf5 文件,以便将其重新用于测试目的时,
我有查看寻呼机,每个页面上只有很少的文本,我有一个按钮,按下按钮时文本转语音事件被触发 我知道如何使用文本转语音,但说到 viewPager 我不知道 代码 : 酒吧...
SpeechSynthesisUtterance 不能跨浏览器?
var msg = new SpeechSynthesisUtterance(); msg.text = "你好世界"; window.speechSynthesis.speak(msg); 这在brave和chrome浏览器上没有任何声音,但在firefox中却有声音
我有一个非常简单的文件来测试文本转语音的可访问性: 我有一个非常简单的文件来测试文本转语音的可访问性: <!DOCTYPE html> <html lang="en"> <head> <meta charset="UTF-8"> <meta name="viewport" content="width=device-width, initial-scale=1.0"> <title>Document</title> </head> <body> <h1>Lorem ipsum</h1> <form method="POST" action=""> <input id="check1" type="checkbox" value="1" aria-labelledby="check1-label" /> <label id="check1-label" for="check1">This is an input label</label> <button type="submit">Submit</button> </form> </body> </html> 我正在使用 read-aloud Chrome / Firefox 扩展程序,因为它似乎是这方面最流行的扩展程序之一。它只是忽略了形式。 我有什么遗漏的吗? 关于屏幕阅读器和 TTS 扩展 此类浏览器扩展程序根本不能代表因障碍(盲人、视力不佳、有障碍等)而需要屏幕阅读或 TTS 的用户。 所有这些用户都使用可以在其设备上的任何位置读取屏幕的软件,而不仅仅是在浏览器中。 无论作者怎么说,这些扩展的功能对于具有真正可访问性需求的用户来说还远远不够完整。 它们更适合偶尔需要 TTS 但并不总是需要它的用户。例如,将文本快速转换为有声读物,供不想阅读的傻瓜或儿童使用。 请注意,不过,有一些更高级的专用应用程序可以制作有声读物或将几段文本转换为语音。 对于您作为开发人员/设计人员来说,如果您的目标是测试网站的可访问性,那么基本上意味着您没有使用具有可访问性需求的真实用户每天真正使用的正确工具进行测试。 换句话说,你没有达到目标,你的测试无效,你在浪费时间。 您应该使用用户在现实生活中使用的真实软件来测试可访问性,以便真正体验它的含义。没有 36 种方法,您应该在计算机中运行屏幕阅读器。 例如,Windows 上的 NVDA、Mac/iPhone/iPad 上的 VoiceOver、Android 上的 Talkback。所有这些都是免费的,VoiceOver 和 Talkback 通常甚至无需安装任何东西即可使用。 关于您的代码 Jaws、NVDA、VoiceOver 和 Talkback 等真正的屏幕阅读器或多或少遵循可访问性和 ARIA 标准。他们所有人在阅读您所呈现的页面时都不会有任何重大问题。我没有看到任何重大错误。 不过,存在无用的冗余。 由于您的 <input> 已经正确链接到您的 <label>,因此您不需要另外将其与 aria-labelledby 链接。您应该删除 aria-labelledby。 这是完全多余的,它可能是导致您的浏览器扩展无法读取它的原因。 但是,TTS 浏览器扩展可以或多或少地遵循标准,或者根本不遵循标准,并且不期望或不需要这样做,因此很难说您观察到的行为是错误还是有意为之,也很难说您应该做什么准确地修复它(如果可以修复)。 根据可访问性标准,这绝对是错误的,但由于此类浏览器扩展主要不是针对残障用户,因此可能有不同的意图。
Azure 语音服务 + 文本转语音 + Silent SpeakSsmlAsync
我正在使用 Azure 文本转语音,它是认知服务的一部分。 我将请求编写为 SSML,然后调用函数 SpeakSsmlAsync。 如果我选择输出格式Audio24Khz160KBitRateMonoMp3,...
我正在使用 C++ 中的 espeak API 从我的嵌入式应用程序中进行一些简单的文本到语音合成。目前,我从有关如何开始的基本示例中复制了这一行: espeak_SetVoiceByNa...
我正在尝试开发语音助手,但我对使用哪种语言感到困惑。 我希望该应用程序能够在 Windows 和 Android 上正常运行。 如果您有任何建议请留言。
我在使用另外 2 个声音时遇到一些麻烦,就我而言,我尝试使用 Pablo(西班牙语 - 西班牙)和 George(英语 - 英国)。我用 python/Django 开发了一个应用程序,从前面我发送了一个带有
头像无法启动。错误:InvalidCharacterError:无法在“Window”上执行“atob”:要解码的字符串未正确编码
//utilty.js 导出 const fetchIceCredentials = async () => { 尝试 { const 响应 = 等待 axios.get('https://westus2.tts.speech.microsoft.com/cognitiveservices/avatar/relay/token/v1...
我一直在使用预训练的 VITS 模型(VCTK 数据集)进行文本到语音合成。我已使用以下命令成功获取了可用发言人的列表: !tts --模型名称 tts_models/en/vctk...
我可以在 Flutter 中更改 Google TTS 的声音吗?
我编写了一个函数,它接受 2 个字符串(陈述、问题)并使用 Google TTS 大声朗读。 我正在使用 flutter_tts: ^1.3.0 包并尝试 setVoice 方法来更改
如何将 Edge TTS 生成的音频直接播放到扬声器而不先保存?
这是保存edge tts音频的代码 导入异步 导入edge_tts 声音= ['en-US-GuyNeural'] text =“嗨,这是测试” 声音=声音[0] 输出文件=“测试r...
我将在 flutter 中将文本更改为语音,并且我安装了 flutterTts 包,因此它只能读取英文文本,而无法读取波斯语。 我还将语言设置为 颤抖Tts。
Azure TTS、Python SDK 错误 1007:根级别的数据无效
将 xml 传递到 Azure 时收到此错误代码,假设问题在于我如何设置 xml。 这是我构建 xml 的代码: 从 lxml.builder 导入 ElementMaker 纳秒 = { ...
在 C# 中使用 Azure TTS API 进行音频检索,缺少某些单词的音频
我正在使用我的 C# 代码和“https://eastus.tts.speech.microsoft.com/cognitiveservices/v1”来获取英语单词的音频。它运行良好,直到我突然注意到对于某些工作......
Delphi 和 Azure 认知服务示例:始终 401 访问被拒绝
我正在使用 CE 10.4 和 Stephen Ball 的这个示例: https://github.com/DelphiABall/Azure-Cognitive-Services 从这个例子中,我尝试了“语音服务”并且总是得到 401: 进入书房...
我们可以在 Swift 中根据推送通知制作文本转语音功能吗?
目前,我正在开发一个项目,以在应用程序收到推送通知时实现文本转语音功能。通知保存在本地并使用带