speech-recognition 相关问题

语音识别(SR)是计算语言学的跨学科子领域,它将语言学,计算机科学和电气工程领域的知识和研究结合起来,开发出能够通过计算机识别和翻译口语的方法和技术。和计算机化的设备,如分类为智能技术和机器人技术的设备

RESOURCE_PROJECT_INVALID 错误:GCP 语音转文本 v2 NodeJS

我正在尝试在 NodeJS 应用程序中使用 Cloud Speech-To-Text v2。我的代码适用于 v1: 从“@google-cloud/speech”导入 { v1 }; const { SpeechClient } = v1; 让语音客户端:v1.SpeechCl...

回答 1 投票 0

Raspberry Pi 上的语音识别

我正在Raspberry Pi上进行语音识别,但功能recognize_google在Raspberry Pi上不起作用。它说识别器没有识别谷歌的属性。但在我的LO上效果很好...

回答 1 投票 0

我无法在我的语音识别代码中生成来自 google/youtube 的研究结果

我正在尝试构建一个可以与人们互动并帮助他们快速更新的聊天机器人。下面是我用来从 youtube/google 获取搜索结果的代码。请告诉我在哪里...

回答 1 投票 0

通过任何方法都无法通过speech_recognition python获取音频?

我尝试让 SpeechRecognition 3.8.1 听我的声音四天。我已经在互联网上看到过以下内容: https://github.com/Uberi/speech_recognition/issues/20 https://www.

回答 2 投票 0

如何使用变压器的管道处理大文件

我使用管道从 Hugging Face 加载模型: device = "cuda:0" if torch.cuda.is_available() else "cpu" torch_dtype = torch.float16 if torch.cuda.is_available() else torch.floa...

回答 1 投票 0

抱脸、耳语模型大v2,训练后输出奇怪的字符

我一直在 JASMIN CGN 上微调 Whisper,这是一个荷兰数据集。我已经在本地进行了预处理。句子的原始编码是 latin_1,但我确保转换每一个......

回答 1 投票 0

检测语音中 2 秒或以上的停顿

有没有可靠且一致的方法来检测AssemblyAi实时转录中超过2秒的暂停。 https://www.assembleai.com/docs/guides/real-time-streaming-transcription 当前...

回答 1 投票 0

用于语音转文本(语音识别)iPhone 的 API 或 SDK

我想要一个语音识别API或SDK来识别用户所说的语音并给出它的文本形式。 详细说明如下: 在我的应用程序中,我需要播放音频...

回答 3 投票 0

PC 音频实时语音识别

我正在尝试制作实时语音识别软件,该软件将在屏幕上显示文本(使用 tkinter)。我已经找到了一种使用虚拟电缆音频、pyaudio 和

回答 1 投票 0

Google Cloud Speech-To-Text API 响应不返回单词

我正在尝试使用 Google Cloud Speech-To-Text API 和 Python 在我的应用程序中实现 Speech-To-Text。我正确地得到了转录,但是响应仅包含转录和

回答 3 投票 0

Whisper openai 大文件处理速度慢

我正在开发一个网络工具,使用 python 中的 open ai Whisper 库将音频/视频转录为文本或字幕。 它工作正常,但问题是转录 lar 需要太多时间......

回答 2 投票 0

如何评估ASR(自动语音识别)中的WER(单词错误率)?

如何评估ASR(自动语音识别)中的WER(单词错误率)? 例如,如果我有 ASR 的句子和输出(人工参考翻译)。 我知道方程式,但我知道...

回答 4 投票 0

UnboundLocalError:无法访问未与值关联的局部变量“print”?

这是代码 def takeCommand() : r = 语音识别.Recognizer() 以 voice_recognition.Microphone() 作为源: print("正在听……") r.pause_threshol...

回答 1 投票 0

Python 语音识别可以作为音频源与 WebRTC 一起使用吗?

我需要实现可以使用WebRTC作为音频源的连续实时语音到文本。我很想使用语音识别库(此处),因为它满足了这个美妙的 .listen()...

回答 1 投票 0

Python语音识别转换mp3文件时出错

我第一次尝试音频转文本。 将语音识别导入为 sr r = sr.Recognizer() 以 sr.AudioFile("/path/to/.mp3") 作为源: 音频 = r.record(源) 当我执行上面的代码时,

回答 3 投票 0

INVALID_ARGUMENT:请求负载大小超出限制:10485760 字节

我第一次在项目中使用 GCS Speech API 将一系列音频文件转换为文本。每个文件大约有60分钟,并且是一个人在整个过程中不断地说话......

回答 2 投票 0

Python;使用语音命令控制车辆的应用程序

这是我的代码 导入系统 将语音识别导入为 sr 导入pygame 导入时间 从 pygame.locals 导入退出 汽车控制类: def __init__(自身): pygame.init() 自我.scr...

回答 1 投票 0

语音识别Python出现奇怪的请求错误

以下代码的语音识别根本不起作用 以 sr.Microphone() 作为源: # 从默认麦克风读取音频数据 音频= r.record(源,持续时间= 4) 打印(“

回答 2 投票 0

浏览器内的语音活动检测

所以这是一个棘手的问题。 我希望编写一个网络应用程序,记录用户所说的一句话,然后将样本发送到服务器端进行处理。 我想到的算法是

回答 1 投票 0

MAUI 语音识别 - 启用 SpeechInputCompleteSilence 意图时无法存储已处理语音的最终结果

我正在使用 Gerald Versluis 方法在 Android 上使用 MAUI 启用语音识别和语音转文本 - https://github.com/jfversluis/MauiSpeechToTextSample 我正在尝试制作识别文本

回答 1 投票 0

© www.soinside.com 2019 - 2024. All rights reserved.