语音识别(SR)是计算语言学的跨学科子领域,它将语言学,计算机科学和电气工程领域的知识和研究结合起来,开发出能够通过计算机识别和翻译口语的方法和技术。和计算机化的设备,如分类为智能技术和机器人技术的设备
我正在使用Python。我有两个音频文件,其中一个是原始的,一个是编辑过的(一半是原始的,一半是插入的音频)。 我使用过像 inaSpeechSegmenter 和 Speech 这样的库
ValueError:音频文件无法读取为 PCM WAV、AIFF/AIFF-C 或 Native FLAC;
这是代码: def voice_Translation(): 源= sr.Recognizer() 使用 sr.AudioFile('file.flac') 作为 voice_file: 音频 = source.record(voice_file) 返回源.recognize_sphinx(
正常调用时,除了 onClick 等按钮事件之外,语音识别器无法工作
我的程序中有语音识别器,当我直接在 onCreate 方法中运行 startListening 方法时,语音识别器似乎不起作用。 但是当我将 startListening 方法放在按钮中时
我需要一个示例,说明如何通过语音命令(触发词)启动我的应用程序。 因此,某种在后台运行的服务会监听所有内容,如果该单词与一组文本匹配...
我在 jupyter 笔记本中使用 pyannote.audio,我收到 ValueError: No loader for files with '.rttm' suffix
我正在使用 pyannote-audio 开发扬声器二值化管道。 我已经训练了模型并加载了检查点,在 jupyter 笔记本中运行 python 脚本。 但是我遇到了一个问题
在前端 javascript 中使用带有 API 密钥的 google-speech-to-text
我知道在前端代码中使用 API 密钥是一个坏主意, 我知道 google-speech-to-text 有 HTML5 的免费版本 但是我可以在 html javascript 中使用带有 API 密钥的 google-speech-to-text 吗?
我一直在尝试使用 Android 模拟器上的语音识别来做一些事情,但经历了一段艰难的旅程。 终于安装了市场和 Google 语音搜索应用程序 - 我已经很接近
我想用 python 编写自己的语音助手,然后在 rapsberry pi 上运行它。我要做的第一步是转录 microfon 流的语音。 所以我想要我的
早上好, 我正在尝试使用 Azure 认知服务,并有一个 C# 应用程序来监视放入存储帐户的 wav 文件。文件到达后,认知服务将
我之前发布过此内容,但范围太广了。我正在尝试创建一个人工智能驱动的 3D 动画角色。它应该与用户交互,就像我们正在与他们进行视频通话一样。茶...
如何停用 OpenAI Whisper 对超过 30 秒的音频输入的标准化? (转录填充词)
OpenAI 的 Whisper 提供漂亮、干净的成绩单。现在我希望它能生成更多原始记录,其中还包含填充词(ah、mh、mhm、uh、oh 等)。这里的帖子告诉我......
在 Azure 中是否可能,或者 Azure 中是否有服务可以用来根据源视频的口语获取每个纯文本的位置? 基本上,我有一个纯文本可以...
我有一个Python项目中的语音识别。所以,我需要它来识别 5 种语言。 我的代码: 将语音识别导入为 sr r = sr.Recognizer() 以 sr.Microphone() 作为源: 音频 = r.li...
如何在 JavaScript 中将音频 Mp3 文件转换为文本?
我正在用语音(麦克风输入)提取文本,效果很好。但我想将音频文件转换为文本。因此,我将在其中添加用于获取音频文件并自动转换为文本的代码。下面是我的c...
我正在寻找有关识别音频文件中重复语音片段的最佳方法的信息。 假设有人正在录制自己说的文字,有时他会被一句话噎住......
通过运行以下代码,我获得了所有可用的麦克风: 将语音识别导入为 sr 对于索引,枚举中的名称(sr.Microphone.list_microphone_names()): print(f'{索引}, {名称}') ...
我希望天蓝色语音转文本服务在开始识别语音之前等待至少 1 分钟。或者演讲者自己在完成演讲后点击按钮,然后蓝色演讲...
speech_recognition 抛出错误``audio_data`` 必须是音频数据
我有一个视频文件,我想确定演讲者的置信度。为了执行此操作,我首先从视频文件中提取音频。下面是代码。 来自 moviepy.edi...
获取 Android 13 上 Google SpeechRecognizer (GoogleTTSRecognitionService) 支持的语言列表
在android 13之前,我可以使用意图RecognizerIntent.ACTION_GET_LANGUAGE_DETAILS通过广播接收器成功获取支持的语言。在 Android 13 上,额外内容为空。代码如下: 公开
我正在尝试使用 Swift 构建一个儿童游戏。我想在我的应用程序中使用文本转语音 API,但我通过的所有 API 都是男性或女性机器人的声音。有没有API可用...