语音识别(SR)是计算语言学的跨学科子领域,它将语言学,计算机科学和电气工程领域的知识和研究结合起来,开发出能够通过计算机识别和翻译口语的方法和技术。和计算机化的设备,如分类为智能技术和机器人技术的设备
我正在尝试使用流音频输入谷歌的语音到文本。 我有一个简单的 JS 代码,该代码在按下按钮时记录音频并使用 websockets 将音频发送到 fastapi 后端。在 fastapi 中...
我试图让这个脚本得到我所说的内容并将其打印在终端上,但我收到此错误 TypeError:不允许捕获不继承自 BaseException 的类 为此我
我有一个项目,我正在使用语音识别模块。我注意到识别器在处理短发音单词的输入时遇到问题,例如“next”、“search”、“...
为什么我会收到“运行时错误:input_lengths 的大小必须为batch_size”,尽管 input_lengths 等于batch_size?
我正在尝试在我的数据上训练 ASR 的 Wav2Vec2CTC 模型。我正在使用 CTC 损失。以下是代码: def train_model(模型,train_loader,优化器,标准,设备): 模型.train()
所以我有一个 Electron 应用程序,它使用网络语音 API(语音识别)来获取用户的语音,但是它不起作用。代码: if (窗口中的“webkitSpeechRecognition”) { 让
Python 无法以我可以在 if 语句中使用它的方式识别我的语音到文本
我目前正在使用Python构建一个个人助理,并且我让它在一定程度上发挥了作用。我一直在使用这个视频教程。我正在让助理“harvey”说出所有内容
我从事一个人类机器人项目,我想让这个机器人在说话时动嘴 方法是什么?是否有声音传感器或专门的软件算法? 我想要所有的东西...
Azure Recognize_once_async().get() 在使用我的 UI 运行时未接收输入
TLDR是,当translator.recognize_once_async().get()运行时,它会阻止我的代码,但是,无论我对着麦克风说多少话,它都不起作用。 我再次测试了这个...
这确实是一个大声思考的问题,所以如果这是在错误的地方,我们深表歉意,因为这不是一个真正的问题 - 更多地寻求建议/评论。 我最近开始使用Win...
使用 Google Web Speech API 的 Python 语音识别不起作用
我正在尝试在Python中使用Google Web Speech API。我刚刚尝试了以下代码: import voice_recognition as sr import pyaudio r = sr.Recognizer() 以 sr.Microphone() 作为源: # r...
我无法弄清楚如何允许浏览器使用我的麦克风。我用 npm 语音识别 图书馆。 我的代码如下: 从“react”导入React,{useEffect};
您是否了解 Google 在语音识别中使用哪种模型,特别是有关“recognize_google”的信息? 我一直在寻找他们的文档以确定他们的型号......
ModuleNotFoundError:没有名为“distutils”的模块如何在 MacOS 中解决此问题
试图让Python使用语音识别 文件“/Users/hridayjain/PycharmProjects/Jarvis/main.py”,第 18 行,位于 文本=takeCommand() ^^^^^^^^^^^^^^ 文件&...
我可以同时使用 python 语音识别 和 openAI 的耳语库将麦克风中的语音转录为文本吗?
我正在尝试使用语音识别来录制音频,然后使用耳语来转录该音频。理想情况下,我喜欢在不保存到文件的情况下执行此操作,但我不确定这是否可能。 我试过了...
我可以在没有expo-react本机应用程序后端的情况下实现Azure语音到文本服务吗
嗨,我正在尝试使用 expo、microsoft-cognitiveservices-speech-sdk 和本机反应来实现语音到文本演示应用程序。我想知道我是否使用 expo 将 .wav 格式的音频文件存储在设备中
如何在所有移动浏览器中为 WebRTC 应用程序捕获音频以使用 Web Speech API 启用字幕?
我实现了一个 WebRTC 应用程序,其中包含使用 Web Speech API 语音识别功能从用户音频生成的实时字幕。虽然桌面浏览器运行顺利,...
跨网站语音转文本的最佳扩展是什么?我想要一个用于语音到文本转换的免费工具。还有精度很高的东西吗?
PyDub:[WinError 6]句柄无效。当 recognize_google 转录文本时。 FFMPEG
我正在尝试使用 pydub 和语音识别库将音频转录为文本。我的代码成功地将“.mp3”文件转换为“.wav”,但在使用
今天我第一次尝试用Python编写语音助手。使用语音识别、pyttsx3、fuzzywuzzy、日期时间、时间、操作系统。很快就遇到了这样的问题:我的助手执行了
speech_recognition python 模块没有输出
我正在mac上运行python模块语音识别 系统本身可以工作(就像没有出现错误一样),但没有结果输出。我正在说话,但没有文字。 导入语音识别...