speech-recognition 相关问题

语音识别(SR)是计算语言学的跨学科子领域,它将语言学,计算机科学和电气工程领域的知识和研究结合起来,开发出能够通过计算机识别和翻译口语的方法和技术。和计算机化的设备,如分类为智能技术和机器人技术的设备

在线自由语音识别器和API

我想为孩子们开发一些基于网络的互动活动,我想使用语音识别作为一种输入。 我可以通过

回答 2 投票 0

Android语音识别API

我正在开发一个需要语音识别才能保持的应用程序 活跃整整一分钟。在查看文档后,我发现 2.2 中添加了“SPEECH_INPUT_MINIMUM_LENGTH_MILLIS”。然而 格...

回答 1 投票 0

良好的语音识别API

我正在 Windows 7 上开发一个语音识别项目,我正在使用 .net 附带的 system.speech API 包,我正在 C# 上进行。 我面临的问题是听写识别...

回答 2 投票 0

Google 语音转文本功能可以离线使用吗?

我想利用 Google 的语音转文本服务来开发桌面应用程序,但我希望它能够离线。这可能吗? 他们有本地解决方案,但是否可以离线以便不发送数据?

回答 3 投票 0

创建并使用 WAV 文件作为对象 Python

我正在用Python创建一个个人助理。我正在使用 Snowboy 来录制音频,效果非常好。 Snowboy 有一个 saveMessage() 方法,可以创建 wav 文件并将其写入磁盘。这波...

回答 2 投票 0

尝试做助手但面临速度问题

我的程序运行得很好,但我遇到了速度问题。响应和给出结果需要太长时间。运行 2,3 次后,需要比以前更多的时间。此外,还需要很多...

回答 2 投票 0

我正在使用语音识别模块,但它给了我这个错误 ModuleNotFoundError:没有名为“aifc”的模块

导入speech_recognition为sr r = sr.Recognizer() 以 sr.Microphone() 作为源: 打印(“谈话”) audio_text = r.listen(源) print("时间到了,谢谢") 尝试: ...

回答 1 投票 0

如何让 vosk 通过语音识别加载文本

我收到的是这个{“text”:“hello”},而不是我说的“你好”。我该如何摆脱剩下的东西 stuff = {"text" : ''"} 部分 我尝试过...

回答 1 投票 0

未检测到麦克风,因为 sound.query_devices() 返回空列表?

我正在尝试使用Python中的“sounddevice”库获取麦克风的信号。 将声音设备导入为 SD 打印(sd.query_devices()) 但它返回空列表。 我尝试了 arecord -f cd -d 6 test...

回答 2 投票 0

如何正确安装最新版本Python的PyAudio?

我正在使用最新版本的Python(3.9)的语音识别。由于某种原因,pip 不允许(仍然不允许)我安装 pyaudio。 错误消息示例: _portaudio模块....

回答 2 投票 0

Flutter 语音转文本

目前我面临着语音转文本包的问题。新的 android (33+) 版本存在限制。我想要来自不同国家的阿拉伯语演讲并显示结果...

回答 1 投票 0

android,RecognizerIntent.EXTRA_LANGUAGE_PREFERENCE 不适用于语音转文本

突然,我的语音短信应用程序出现以下语句不起作用。它仍然是英语(英国)。对话框上的语言不会更改。 意图.putExtra(识别器中...

回答 1 投票 0

为什么faster_whisper模型在运行几个实例后会意外终止内核?

我正在尝试使用 OpenAI Whisper 将少量音频数据转换为文本数据,虽然较大的模型精度非常好,但处理音频非常慢。但后来我发现更快的耳语...

回答 1 投票 0

PermissionStatus API:Safari 似乎支持更改事件,但当用户允许麦克风时不会触发任何内容

当本机对话框显示时,我们希望对用户关于允许或不允许应用程序访问设备麦克风的选择做出反应。 那是, 如果他|她点击[允许],请执行某些操作 再做一次...

回答 1 投票 0

Android 上的语音识别 API 重复短语

我发现,语音识别 API 在我的 Android 上重复结果短语(并且在桌面上不重复)。 对于所说的每个短语,它返回两个结果。第一个是 第二个是 ...

回答 3 投票 0

为什么我的Python语音识别代码在后台音频监听期间没有调用回调函数?

我试图在脚本运行时在后台收听音频我有这部分代码用于收听 导入CV2 将 mediapipe 导入为 mp 导入 pyautogui 导入语音识别...

回答 2 投票 0

如何从huggingface load_dataset加载一定百分比的数据

我正在尝试下载总计 29GB 的“librispeech_asr”数据集,但由于 google colab 空间有限,我无法下载/加载该数据集,即笔记本崩溃。 所以...

回答 3 投票 0

ModelCheckpoint 未保存 hdf5 文件

我在构建语音到文本模型时遇到了一个奇怪的问题。 该模型已被训练和创建,但是当我尝试将其保存为 hdf5 文件,以便将其重新用于测试目的时,

回答 1 投票 0

react-speech-recognition 包不起作用

这是一个简单的反应包,可将用户音频转换为文本。我安装该包并尝试其基本代码示例,但它显示错误“RecognitionManager.js:247 Uncaught ReferenceError:

回答 1 投票 0

Google Cloud Speech:区分声音?

我有兴趣编写一个能够识别多个扬声器的语音识别应用程序。例如,如果比尔、乔和简正在说话,那么应用程序不仅可以将声音识别为...

回答 6 投票 0

© www.soinside.com 2019 - 2024. All rights reserved.