speech 相关问题

言语是人类交流的发声形式。

SAPI-如何停止所有异步语音任务？我使用Microsoft的语音应用程序编程接口（SAPI）来启用我的应用程序中的语音。但是，当我尝试停止异步语音任务时，它们会停止，但是一秒钟后。在.net

sapi

c++ windows text-to-speech speech sapi

回答 1 投票 0

google语音识别api

https://www.google.com/speech-api/v2/recognize?...

google-api speech-recognition speech

回答 5 投票 0

我使用javascript和node.js。我试图在我的应用程序中添加语音识别，尽管不在浏览器中。我知道那里有很多使用浏览器的语音识别API的东西，但是我通常使用Mac在终端运行脚本。例如，我要实现的目标是如下：我会说些什么，如果这与if语句相对应，那么脚本将按照要求执行任何任务。因此，如果我说“你好”，它将完成所说的任何任务。有什么像这样吗？

有很多节点模块，这些模块只需包装浏览器的语音识别，如果您不在浏览器中，则没有帮助。还有几个模块是外部服务的接口，如果您向您发送音频，可以为您提供语音识别。

javascript speech-recognition speech

回答 1 投票 0

如何从音频文件（在C ++或Java中）拆分男性和女性声音。

audio speech-recognition speech

回答 3 投票 0

多种语言的语音转文本（支持波斯语和阿拉伯语）[关闭]

有谁知道iOS中的将语音转换为多语言文本API支持波斯语和阿拉伯语吗？我使用 Swift 语言

ios speech

回答 1 投票 0

Windows 语音 C++

有没有办法在C++中使用语音？如果是这样，有人可以给我指点参考资料和书籍吗？

c++ speech

回答 1 投票 0

有更好的 .Net 源 TTS 包吗？

我需要在我的 C#.Net 应用程序中实现文本转语音 (TTS) 系统。现在我使用C# .Net TTS包（System.Speech.Synthesis），它应该与Windows中的扬声器相同。但我...

.net speech text-to-speech speech-synthesis

回答 1 投票 0

在线自由语音识别器和API

我想为孩子们开发一些基于网络的互动活动，我想使用语音识别作为一种输入。我可以通过

speech-recognition speech

回答 2 投票 0

良好的语音识别API

我正在 Windows 7 上开发一个语音识别项目，我正在使用 .net 附带的 system.speech API 包，我正在 C# 上进行。我面临的问题是听写识别...

c# .net speech-recognition speech speech-to-text

回答 2 投票 0

SFSpeechRecognitionResult 在进行长时间停顿时会丢弃之前的转录本

我遇到了此线程中描述的相同问题。从 iOS 18 开始，当我使用 SFSpeechAudioBufferRecognitionRequest 时，返回的不是最终的 SFSpeechRecognitionResult 之前丢弃了

swift speech-to-text speech sfspeechrecognizer ios18

回答 1 投票 0

SFSpeechRecognitionResult 在进行长时间中断时会丢弃之前的转录本

我遇到了此线程中描述的相同问题。从 iOS 18 开始，当我使用 SFSpeechAudioBufferRecognitionRequest 时，返回的不是最终的 SFSpeechRecognitionResult 之前丢弃了

swift speech-to-text speech sfspeechrecognizer ios18

回答 1 投票 0

(Swift) 条件绑定的初始化程序必须具有可选类型，而不是“AVAudioInputNode”

我正在尝试创建语音转文本功能，但收到错误：条件绑定的初始化程序必须具有可选类型，而不是“AVAudioInputNode” 守卫让 inputNode = audioEngine。

xcode conditional-statements option-type speech avaudioengine

回答 2 投票 0

连接来自 Azure 语音服务 tts 的缓冲区

我有一篇来自学术论文的巨大文本，我想将其转换为音频。由于音频太大，我将其分成 4096 个字符的块。然后我将其发送到 OpenAi tts api ch...

azure text-to-speech speech

回答 1 投票 0

SpeechSynthesis，Web 语音 API，消除说话结束后的延迟和 onend 属性触发？

当 SpeechSynthesisUtterance 说话时，我正在显示动画图形。我使用 onend 属性来检测说话何时完成以删除动画图形。然而有一个

javascript speech speech-synthesis

回答 1 投票 0

如何使用Python检测音频重录？

我有很多讲座录音，我多次说过同一件事，大部分都是不完整的陈述，例如： “这就是部分”（然后重试） “这是 p...

python audio signal-processing speech librosa

回答 1 投票 0

window.speechSynthesis 发音错误的单词

window.speechSynthesis 发音为lamé /ˈlɑː.meɪ/，为什么？有什么办法解决吗？ const message = new SpeechSynthesisUtterance(); message.text = &quo...

javascript google-chrome browser text-to-speech speech

回答 1 投票 0

Flutter：是否可以测量单词正确发音与玩家发音的相似度？

我正在创建一个使用语音识别的简单游戏应用程序。在游戏中，玩家要发音该单词，然后系统会评估或处理玩家的单词发音是否...

flutter dart speech-recognition game-development speech

回答 1 投票 0

使用CTCloss进行ASR任务时的一些问题

使用torch.nn.CTCloss时，为什么我的损失曲线收敛了，但模型似乎重复只输出几个标记？例如：我的标签是：[220, 1122, 172, 26, 460, 836, 171, 1813, 113, 39,...

speech-recognition speech ctc

回答 1 投票 0

2 个音频文件的相似性检查

我想问一个关于语音相似性检查的问题。假设我有 2 个包含相同单词的音频文件，由 2 个不同的扬声器录制，我想验证这 2 个音频是否...

python audio similarity speech dtw

回答 1 投票 0

如何使用Python中的语音识别自动检测语言

我正在开发一个应用程序，我想自动检测语言然后打印它。我的代码：以 sr.Microphone() 作为源：音频 = r.listen(来源) 尝试： # 自动检测语言 p...

python-3.x api audio voice speech

回答 2 投票 0

speech 相关问题

最新问题