语音识别(SR)是计算语言学的跨学科子领域,它将语言学,计算机科学和电气工程领域的知识和研究结合起来,开发出能够通过计算机识别和翻译口语的方法和技术。和计算机化的设备,如分类为智能技术和机器人技术的设备
如何为 Node JS 的 MS Azure 语音转文本服务启用字级置信度
据此,可以在 Azure STT 服务的 JSON 输出中获取每个单词的置信度。问题是我似乎无法找到如何使用 Node JS 库来做到这一点......
我尝试在Python脚本中使用Vosk语音识别,但结果总是: { “文本” : ”” } 这不是我的文件的问题,因为当我在 DOS 中使用“vosk-
我正在构建一个应用程序来根据找到的关键字计算延迟。我使用的方法不准确甚至是错误的(错误)。使用的方法如下: @覆盖 公共空间
如何在Android中同时使用OpenTok SDK和语音识别器进行音频/视频通话?
我们在 Android 应用程序中使用 OpenTok SDK 开发了音频/视频通话功能。现在,我们需要集成 SpeechRecognizer API,以便在正在进行的 OpenTok 测试期间将语音转录为文本...
RecognizerIntent.EXTRA_LANGUAGE 最近没有更改识别器语言
我的应用程序中有一个代码可以识别“波斯语”语言并创建语音转文本功能: 意图意图 = new Intent(RecognizerIntent.ACTION_RECOGNIZE_SPEECH); 意图。
RecognizerIntent.EXTRA_LANGUAGE 突然不改变识别器语言
我的应用程序中有一个代码可以识别“波斯语”语言并创建语音转文本功能: 意图意图 = new Intent(RecognizerIntent.ACTION_RECOGNIZE_SPEECH); 意图。
RecognizerIntent.EXTRA_LANGUAGE 不会突然改变识别器语言
我的应用程序中有一个代码可以识别“波斯语”语言并创建语音转文本功能: 意图意图 = new Intent(RecognizerIntent.ACTION_RECOGNIZE_SPEECH); 意图。
是否可以使用RecognizerIntent或任何其他在android中使用语音识别的方式来检测您正在讲话的语言,并以该语言发送结果。就像,如果我说 ro...
上下文:我们正在使用 Azure 通信服务 (ACS) 和 Azure 语音服务构建一个机器人来处理电话。该机器人提出问题(通过 TTS)并使用语音捕获用户响应...
有什么方法可以在 VS Code 控制台中正确获取孟加拉字体吗?
我正在尝试在 VSCode 上使用 python(Google 语音识别)构建孟加拉语语音识别机器人。该程序正在运行 很好,但字体无法正常显示。
将 Objective-C 框架连接到 Swift iOS 项目(SpeechSDK 框架)时出现致命错误
我按原样转换了 Objective-C 语音识别 API Swift。 类 ViewController: UIViewController, SpeechRecognitionProtocol { var micClient: 麦克风识别客户端 var isMicrophoneReco: B...
我正在尝试向我的java项目添加实时语音识别(最好是离线的)。通过谷歌搜索并尝试其他解决方案,我决定使用 VOSK 进行语音识别。优先...
使 SpeechRecognizer 在聆听时忽略大声播放的文本转语音
我的实验代码如下(compileSdk 34,minSdk 33),只要单独考虑文本到语音和语音识别,效果就很好: 包 com.example.speechandspeak; 导入 android.Mani...
Python“speech_recognition”模块没有“recognize”?
我正在尝试在视频上观看的一些代码,但是当我必须运行该程序时,它显示以下文本:“发生错误:模块‘语音识别’没有属性‘识别’”我...
我正在尝试在视频上观看的一些代码,但是当我必须运行该程序时,它显示以下文本:“发生错误:模块‘语音识别’没有属性‘识别’”我...
我正在构建一个快速应用程序,允许用户对着手机说话并将转录保存到文本视图中。当我说出一个句子并转录它后,文本字段
我一直在尝试在我的Expo应用程序上实现语音识别,我尝试使用名为react-native-voice的语音到文本库,但它不支持Expo。有谁知道其他图书馆吗...
我正在开发Android应用程序。我的应用程序需要语音识别。但我需要语音识别作为服务。我已经创建了简单的语音识别,当我点击按钮时它
我想为我家里的实验室创建一个小型应用程序,并且我需要语音识别,因此 java 语音 API 似乎是解决我寻找合适 API 问题的一个很好的解决方案。我有
我最近在 Google 搜索中通过 C# 语音发现了一段很棒的代码,它帮助我了解了如何将用户输入转换为程序可以读取的文本,并将其制作成网页...