speech-recognition 相关问题

语音识别（SR）是计算语言学的跨学科子领域，它将语言学，计算机科学和电气工程领域的知识和研究结合起来，开发出能够通过计算机识别和翻译口语的方法和技术。和计算机化的设备，如分类为智能技术和机器人技术的设备

iOS 语音识别反复暂停和恢复转录

我在语音框架的 iOS 语音识别中遇到了奇怪的行为。它会暂停转录一段时间，并在一段时间后恢复转录，而无需从应用程序端执行任何操作（字面意思...

ios swift speech-recognition

回答 1 投票 0

自动检测两种语言 WebkitSpeechRecognition javascript

我正在开发一个使用 WebkitSpeechRecognition 的简单应用程序。但我希望它能够自动检测我提供的两种语言之间的语言（例如“en-US”和“vi-VN”）。这是...

javascript webkit speech-recognition

回答 0 投票 0

语音识别 Webkit API 的 Onspeechend 运行缓慢

我正在使用 onspeechend 事件通过 SpeechRecognition Webkit API 创建一些简单的应用程序。它在我的电脑上运行得很好，但是当我用我的手机（Android）测试它时，当我停止讲话时，

javascript android webkit speech-recognition

回答 0 投票 0

Android Wear-OS App 的语音识别

我构建了一个使用 android 语音识别 API 的语音驱动的 android 应用程序。我目前正在尝试将该应用程序转换为 wear-os 版本。我已经将语音识别权限包含在 ...

android kotlin speech-recognition wear-os speech-to-text

回答 0 投票 0

优化 Python 脚本以更快地训练 Keras 模型

请帮我优化这个脚本。我在 Google Colab GPU 运行时中运行它。我已经实施了许多优化，但它们使情况变得更糟。我需要认真的帮助。我必须在 3 天内提交我的项目...

machine-learning pytorch google-colaboratory speech-recognition

回答 0 投票 0

将实时音频转换为音素

使用麦克风作为实时音频的输入。如何从音频中提取当前所说的音素？我需要它来对付 2d 角色。基本上，我的方法是：取...

javascript python speech-recognition phoneme

回答 1 投票 0

带时间戳的语音转文本

我想获取 python 中所有单词的时间戳，并使用 python 从音频和视频文件中静音或发出特定的声音。如果有人知道我如何使用 python3 实现此目的...

python speech-recognition speech-to-text pydub google-speech-to-text-api

回答 0 投票 0

哪个 GEO-API 解码器是 AI 语音到文本地址地理解码的领导者？

假设我是一家 TAXI 公司，我不是，但它很能说明问题。我是一家超级先进的 TAXI 公司，使用新的 OPEN AI Whisper SPEECH->TEXT 解码或类似的 AI 服务，例如 deepg...

api geolocation speech-recognition text-to-speech speech-to-text

回答 0 投票 0

Delphi FMX 中的语音（字符）识别

我需要识别语音（只有一个字母/字符，例如 A、B、C、...）。有人知道怎么做吗？我的想法是，点击一个按钮后，启动监听，当使用...

delphi speech-recognition firemonkey speech-to-text delphi-10.4-sydney

回答 0 投票 0

如何从 python 中的短语识别和执行多个命令？

我创建了一个程序，使用谷歌语音识别来收听我们的声音，然后执行为该短语编写的程序。这是部分代码：导入 speech_recognition a...

python python-3.x speech-recognition speech-to-text

回答 3 投票 0

Chrome浏览器Web Speech API SpeechRecognition()只懂英文（`lang`属性的实现）

我在 Chrome 中实现的 Web Speech API SpeechRecognition() 在我说英语时效果很好，但在其他语言中它经常返回英文单词。我有没有实现 this.recognition.lang

google-chrome speech-recognition webkitspeechrecognition

回答 1 投票 0

语音识别，Python 3.11.2

将 speech_recognition 导入为 sr def noice_fix（麦克风）：以麦克风为来源： sr.adjust_for_ambient_noise（来源）而真实的：尝试：音频 = sr.listen(来源,

python speech-recognition

回答 2 投票 0

Python 语音转文本创建字幕

我正在尝试创建一个程序来拍摄视频并将语音转换为文本。视频语言为阿尔巴尼亚语。我一直在尝试使用 google text to speech api 但它似乎很漂亮

python google-api speech-recognition speech-to-text google-speech-to-text-api

回答 0 投票 0

使用 React.js 时未定义 Web Speech API SpeechRecognition

我将 React.js 与 Web Speech API 的 SpeechRecognition 一起使用，但是，它不起作用并且我收到错误“ReferenceError：SpeechRecognition 未定义。”我正在使用的代码...

javascript reactjs speech-recognition webspeech-api

回答 3 投票 0

如何使用 vosk 库从语音中检测或提取数字

如何使用 vosk 库从语音中检测或提取数字我已经实现了 vosk 库来识别 Android 中的语音，现在我可以识别语音了。但是，我想检测...

android speech-recognition vosk

回答 0 投票 0

当我运行我的项目“voicy -a desktop assistant”时，为什么我的 python 程序显示回溯并引发 WaitTimeOut 错误？

代码行： audio = r.listen(source, timeout=3) ......第 72 行 query = takeCommand().lower() .....................第 92 行结果：文件“C:\Users\Lenovo\OneDrive\Desktop\MyCode> python voicy.py

audio timeout speech-recognition

回答 0 投票 0

C# - 免费的离线语音识别库 (SDK)

C# - 免费语音识别引擎库 (SDK) System.Speech.Recognition 非常糟糕...我想要另一个 SDK 可以给我很好的结果并在 Visual Studio 上使用 c#... 我想要离线...

c# visual-studio speech-recognition speech-to-text speech

回答 2 投票 0

如何使用 cmusphinx for Java？

我想制作一个将语音转换为文本的程序，我只想使用离线库。我找到了 cmusphinx 库并尝试使用它。但我不知道如何安装它我试过安装...

java gradle speech-recognition speech-to-text cmusphinx

回答 0 投票 0

我已经通过 pip 安装了 pydub，但仍然没有用

我pip安装了pydub和SpeechRecognition后，虽然我从ffmpeg中提取文件并在相应的文件夹名称bin中指定文件夹名称bin，但我仍然无法使程序成功运行...

python ffmpeg speech-recognition pydub

回答 2 投票 0

OpenAI Whisper 在某些音频文件上挂起/冻结

我在处理音频文件时遇到了 OpenAI 的耳语和快速耳语的问题。具体来说，一些文件无法完全处理并且进度条冻结，随机发生

speech-recognition torch openai-api whisper

回答 0 投票 0

speech-recognition 相关问题

最新问题