语音识别(SR)是计算语言学的跨学科子领域,它将语言学,计算机科学和电气工程领域的知识和研究结合起来,开发出能够通过计算机识别和翻译口语的方法和技术。和计算机化的设备,如分类为智能技术和机器人技术的设备
如何将在 server.js 中创建的数组导出到我的 App.jsx?
我正在创建一个转录麦克风输入的语音应用程序 - 到目前为止,我正在使用 rev.ai 来转录语音,并将其保存到 voicearray 数组中。然后我怎样才能将语音导出到我的 App.js fi...
有没有一种方法可以使用 flutter 将语音转换为文本(特别是如果是阿拉伯语语音并且我也想要阿拉伯语的结果文本)我找到了许多资源来解释语音如何...
我正在开发 ASR 应用程序,虽然我知道使用 VAD 或质量更好的音频只能在一定程度上最大限度地减少幻觉,但转录中仍然存在错误的空间。我是
我正在构建一个支持语音识别并将语音转换为文本的搜索,因此我使用 SFSpeechRecognizer。但问题是我需要同时支持多种语言...
我在 Jupyter 笔记本中使用 pyannote.audio,我收到 ValueError: No loader for files with '.rttm' suffix
我正在使用 pyannote-audio 开发扬声器二值化管道。 我已经训练了模型并加载了检查点,在 Jupyter 笔记本中运行 python 脚本。 但是我遇到了一个问题
导入错误:Python IDLE 中没有名为“speech_recognition”的模块
我正在尝试使用Python 3.5.1的语音识别模块来让我的jarvis AI语音激活!我查看了堆栈溢出并发现了一些与我类似的问题,但他们没有......
如何根据音频文件添加时间戳到转录文件中? (结果是srt文件)
我使用语音转文本API,使用Python脚本为音频ideo(带有时间戳的字幕)制作srt文件。但它并不是 100% 准确。我有准确的音频文件转录(它有一些
我正在使用下面的代码使用 Azure 语音到文本服务将语音转换为文本。我想将我的音频文件转换为文本。下面是相同的代码: 导入操作系统 导入 azure.cognitivese...
Google Cloud 的语音转文本 API 中出现音频超时错误
我的目标是制作我的贾维斯,它会一直监听并在我打招呼时激活。我了解到Google云Speech to Text API不会监听超过60秒,但后来我发现这不是......
我正在使用 Azure AI 语音识别,我认为它已正确配置为标点 en-GB。目前,已识别的返回值不带标点,并以纯文本形式显示 _语音配置 =
如何增加Microsoft Speech Service SDK一次性监听的时间?
我正在使用MS语音服务sdk进行语音到文本的转换。当我说话时,即使我没有停止说话,我的讲话也会在 60 秒后转换为文本。它基本上认为它是一chun...
有没有一种流畅的方法可以在Raspberry Pi 5上集成两个Python脚本?第一个脚本涉及语音识别,将口语单词转换为文本。第二个脚本将文本转换为 G...
我有这段代码,可以转录一些 YouTube 视频的音频流(给定链接), 现在你可能会发现这很慢,因为我必须先将视频流下载为 .mp4,然后再传输...
语音转文本:google.api_core.exceptions.PermissionDenied:403
我正在尝试使用Google语音转文本服务,根据https://googleapis.github.io/google-cloud-python/latest/speech/index.html 我已经创建了项目,将音频上传到gs:cloud,添加了
我在 Node js 中使用 Google 的 Speech-to-Text API。它返回前几个单词的识别结果,但随后忽略音频文件的其余部分。截止点是任何
如何在 Typescript 中删除 SpeechRecognition API 的“找不到名称”,又名“现在由 --lib dom 提供”是什么意思?
识别:语音识别|不明确的; this.recognition = new webkitSpeechRecognition(); this.recognition.onresult = (事件: SpeechRecognitionEvent) => {}); 每次抛出一个找不到名字
我是Python新手,正在编写一个简单的代码,在其中使用语音识别,每当我调用代码时都会得到语音响应。然而,python并没有结束它的运行。我怎样才能保留python文件
如何将 value 声明为 none 并重新声明它,然后将其用于 python 中的 if 语句? [已关闭]
我的问题很简单我该怎么做 全局命令 命令=无 def user_commands(): def take_command(): 尝试: 以 sr.Microphone() 作为源: print('听着...
我的问题很简单我该怎么做 def user_commands(): ... ... 返回命令 def run_alexa(): 全局命令 命令=用户命令() 当我这样做时会发生什么...
我正在尝试在我的 next.js 网站中实现语音识别。我下载并尝试使用此链接中的相同代码,但出现此错误: ReferenceError:regeneratorRuntime 不是