speech-recognition 相关问题

语音识别(SR)是计算语言学的跨学科子领域,它将语言学,计算机科学和电气工程领域的知识和研究结合起来,开发出能够通过计算机识别和翻译口语的方法和技术。和计算机化的设备,如分类为智能技术和机器人技术的设备

iOS 语音识别反复暂停和恢复转录

我在语音框架的 iOS 语音识别中遇到了奇怪的行为。 它会暂停转录一段时间,并在一段时间后恢复转录,而无需从应用程序端执行任何操作(字面意思...

回答 1 投票 0

自动检测两种语言 WebkitSpeechRecognition javascript

我正在开发一个使用 WebkitSpeechRecognition 的简单应用程序。但我希望它能够自动检测我提供的两种语言之间的语言(例如“en-US”和“vi-VN”)。这是...

回答 0 投票 0

语音识别 Webkit API 的 Onspeechend 运行缓慢

我正在使用 onspeechend 事件通过 SpeechRecognition Webkit API 创建一些简单的应用程序。它在我的电脑上运行得很好,但是当我用我的手机(Android)测试它时,当我停止讲话时,

回答 0 投票 0

Android Wear-OS App 的语音识别

我构建了一个使用 android 语音识别 API 的语音驱动的 android 应用程序。我目前正在尝试将该应用程序转换为 wear-os 版本。我已经将语音识别权限包含在 ...

回答 0 投票 0

优化 Python 脚本以更快地训练 Keras 模型

请帮我优化这个脚本。我在 Google Colab GPU 运行时中运行它。我已经实施了许多优化,但它们使情况变得更糟。我需要认真的帮助。我必须在 3 天内提交我的项目...

回答 0 投票 0

将实时音频转换为音素

使用麦克风作为实时音频的输入。如何从音频中提取当前所说的音素? 我需要它来对付 2d 角色。 基本上,我的方法是: 取...

回答 1 投票 0

带时间戳的语音转文本

我想获取 python 中所有单词的时间戳,并使用 python 从音频和视频文件中静音或发出特定的声音。如果有人知道我如何使用 python3 实现此目的...

回答 0 投票 0

哪个 GEO-API 解码器是 AI 语音到文本地址地理解码的领导者?

假设我是一家 TAXI 公司,我不是,但它很能说明问题。 我是一家超级先进的 TAXI 公司,使用新的 OPEN AI Whisper SPEECH->TEXT 解码或类似的 AI 服务,例如 deepg...

回答 0 投票 0

Delphi FMX 中的语音(字符)识别

我需要识别语音(只有一个字母/字符,例如 A、B、C、...)。 有人知道怎么做吗? 我的想法是,点击一个按钮后,启动监听,当使用...

回答 0 投票 0

如何从 python 中的短语识别和执行多个命令?

我创建了一个程序,使用谷歌语音识别来收听我们的声音,然后执行为该短语编写的程序。 这是部分代码: 导入 speech_recognition a...

回答 3 投票 0

Chrome浏览器Web Speech API SpeechRecognition()只懂英文(`lang`属性的实现)

我在 Chrome 中实现的 Web Speech API SpeechRecognition() 在我说英语时效果很好,但在其他语言中它经常返回英文单词。我有没有实现 this.recognition.lang

回答 1 投票 0

语音识别,Python 3.11.2

将 speech_recognition 导入为 sr def noice_fix(麦克风): 以麦克风为来源: sr.adjust_for_ambient_noise(来源) 而真实的: 尝试: 音频 = sr.listen(来源,

回答 2 投票 0

Python 语音转文本创建字幕

我正在尝试创建一个程序来拍摄视频并将语音转换为文本。视频语言为阿尔巴尼亚语。我一直在尝试使用 google text to speech api 但它似乎很漂亮

回答 0 投票 0

使用 React.js 时未定义 Web Speech API SpeechRecognition

我将 React.js 与 Web Speech API 的 SpeechRecognition 一起使用,但是,它不起作用并且我收到错误“ReferenceError:SpeechRecognition 未定义。”我正在使用的代码...

回答 3 投票 0

如何使用 vosk 库从语音中检测或提取数字

如何使用 vosk 库从语音中检测或提取数字 我已经实现了 vosk 库来识别 Android 中的语音,现在我可以识别语音了。 但是,我想检测...

回答 0 投票 0

当我运行我的项目“voicy -a desktop assistant”时,为什么我的 python 程序显示回溯并引发 WaitTimeOut 错误?

代码行: audio = r.listen(source, timeout=3) ......第 72 行 query = takeCommand().lower() .....................第 92 行 结果: 文件“C:\Users\Lenovo\OneDrive\Desktop\MyCode> python voicy.py

回答 0 投票 0

C# - 免费的离线语音识别库 (SDK)

C# - 免费语音识别引擎库 (SDK) System.Speech.Recognition 非常糟糕...我想要另一个 SDK 可以给我很好的结果并在 Visual Studio 上使用 c#... 我想要离线...

回答 2 投票 0

如何使用 cmusphinx for Java?

我想制作一个将语音转换为文本的程序,我只想使用离线库。 我找到了 cmusphinx 库并尝试使用它。但我不知道如何安装它我试过安装...

回答 0 投票 0

我已经通过 pip 安装了 pydub,但仍然没有用

我pip安装了pydub和SpeechRecognition后,虽然我从ffmpeg中提取文件并在相应的文件夹名称bin中指定文件夹名称bin,但我仍然无法使程序成功运行...

回答 2 投票 0

OpenAI Whisper 在某些音频文件上挂起/冻结

我在处理音频文件时遇到了 OpenAI 的耳语和快速耳语的问题。具体来说,一些文件无法完全处理并且进度条冻结,随机发生

回答 0 投票 0

© www.soinside.com 2019 - 2024. All rights reserved.