语音识别(SR)是计算语言学的跨学科子领域,它将语言学,计算机科学和电气工程领域的知识和研究结合起来,开发出能够通过计算机识别和翻译口语的方法和技术。和计算机化的设备,如分类为智能技术和机器人技术的设备
我在语音框架的 iOS 语音识别中遇到了奇怪的行为。 它会暂停转录一段时间,并在一段时间后恢复转录,而无需从应用程序端执行任何操作(字面意思...
自动检测两种语言 WebkitSpeechRecognition javascript
我正在开发一个使用 WebkitSpeechRecognition 的简单应用程序。但我希望它能够自动检测我提供的两种语言之间的语言(例如“en-US”和“vi-VN”)。这是...
语音识别 Webkit API 的 Onspeechend 运行缓慢
我正在使用 onspeechend 事件通过 SpeechRecognition Webkit API 创建一些简单的应用程序。它在我的电脑上运行得很好,但是当我用我的手机(Android)测试它时,当我停止讲话时,
我构建了一个使用 android 语音识别 API 的语音驱动的 android 应用程序。我目前正在尝试将该应用程序转换为 wear-os 版本。我已经将语音识别权限包含在 ...
请帮我优化这个脚本。我在 Google Colab GPU 运行时中运行它。我已经实施了许多优化,但它们使情况变得更糟。我需要认真的帮助。我必须在 3 天内提交我的项目...
使用麦克风作为实时音频的输入。如何从音频中提取当前所说的音素? 我需要它来对付 2d 角色。 基本上,我的方法是: 取...
我想获取 python 中所有单词的时间戳,并使用 python 从音频和视频文件中静音或发出特定的声音。如果有人知道我如何使用 python3 实现此目的...
哪个 GEO-API 解码器是 AI 语音到文本地址地理解码的领导者?
假设我是一家 TAXI 公司,我不是,但它很能说明问题。 我是一家超级先进的 TAXI 公司,使用新的 OPEN AI Whisper SPEECH->TEXT 解码或类似的 AI 服务,例如 deepg...
我需要识别语音(只有一个字母/字符,例如 A、B、C、...)。 有人知道怎么做吗? 我的想法是,点击一个按钮后,启动监听,当使用...
我创建了一个程序,使用谷歌语音识别来收听我们的声音,然后执行为该短语编写的程序。 这是部分代码: 导入 speech_recognition a...
Chrome浏览器Web Speech API SpeechRecognition()只懂英文(`lang`属性的实现)
我在 Chrome 中实现的 Web Speech API SpeechRecognition() 在我说英语时效果很好,但在其他语言中它经常返回英文单词。我有没有实现 this.recognition.lang
将 speech_recognition 导入为 sr def noice_fix(麦克风): 以麦克风为来源: sr.adjust_for_ambient_noise(来源) 而真实的: 尝试: 音频 = sr.listen(来源,
我正在尝试创建一个程序来拍摄视频并将语音转换为文本。视频语言为阿尔巴尼亚语。我一直在尝试使用 google text to speech api 但它似乎很漂亮
使用 React.js 时未定义 Web Speech API SpeechRecognition
我将 React.js 与 Web Speech API 的 SpeechRecognition 一起使用,但是,它不起作用并且我收到错误“ReferenceError:SpeechRecognition 未定义。”我正在使用的代码...
如何使用 vosk 库从语音中检测或提取数字 我已经实现了 vosk 库来识别 Android 中的语音,现在我可以识别语音了。 但是,我想检测...
当我运行我的项目“voicy -a desktop assistant”时,为什么我的 python 程序显示回溯并引发 WaitTimeOut 错误?
代码行: audio = r.listen(source, timeout=3) ......第 72 行 query = takeCommand().lower() .....................第 92 行 结果: 文件“C:\Users\Lenovo\OneDrive\Desktop\MyCode> python voicy.py
C# - 免费语音识别引擎库 (SDK) System.Speech.Recognition 非常糟糕...我想要另一个 SDK 可以给我很好的结果并在 Visual Studio 上使用 c#... 我想要离线...
我想制作一个将语音转换为文本的程序,我只想使用离线库。 我找到了 cmusphinx 库并尝试使用它。但我不知道如何安装它我试过安装...
我pip安装了pydub和SpeechRecognition后,虽然我从ffmpeg中提取文件并在相应的文件夹名称bin中指定文件夹名称bin,但我仍然无法使程序成功运行...
我在处理音频文件时遇到了 OpenAI 的耳语和快速耳语的问题。具体来说,一些文件无法完全处理并且进度条冻结,随机发生