speech-recognition 相关问题

语音识别（SR）是计算语言学的跨学科子领域，它将语言学，计算机科学和电气工程领域的知识和研究结合起来，开发出能够通过计算机识别和翻译口语的方法和技术。和计算机化的设备，如分类为智能技术和机器人技术的设备

我正在使用Python。我有两个音频文件，其中一个是原始的，一个是编辑过的（一半是原始的，一半是插入的音频）。我使用过像 inaSpeechSegmenter 和 Speech 这样的库

python audio speech-recognition

回答 1 投票 0

ValueError：音频文件无法读取为 PCM WAV、AIFF/AIFF-C 或 Native FLAC；

这是代码： def voice_Translation(): 源= sr.Recognizer() 使用 sr.AudioFile('file.flac') 作为 voice_file：音频 = source.record(voice_file) 返回源.recognize_sphinx(

python windows speech-recognition

回答 1 投票 0

正常调用时，除了 onClick 等按钮事件之外，语音识别器无法工作

我的程序中有语音识别器，当我直接在 onCreate 方法中运行 startListening 方法时，语音识别器似乎不起作用。但是当我将 startListening 方法放在按钮中时

java android speech-recognition

回答 2 投票 0

通过语音命令启动应用程序（android）

我需要一个示例，说明如何通过语音命令（触发词）启动我的应用程序。因此，某种在后台运行的服务会监听所有内容，如果该单词与一组文本匹配...

java android speech-recognition voice launcher

回答 4 投票 0

我在 jupyter 笔记本中使用 pyannote.audio，我收到 ValueError: No loader for files with '.rttm' suffix

我正在使用 pyannote-audio 开发扬声器二值化管道。我已经训练了模型并加载了检查点，在 jupyter 笔记本中运行 python 脚本。但是我遇到了一个问题

python pytorch speech-recognition python-3.10 pytorch-lightning

回答 1 投票 0

在前端 javascript 中使用带有 API 密钥的 google-speech-to-text

我知道在前端代码中使用 API 密钥是一个坏主意，我知道 google-speech-to-text 有 HTML5 的免费版本但是我可以在 html javascript 中使用带有 API 密钥的 google-speech-to-text 吗？

javascript speech-recognition google-speech-api

回答 1 投票 0

如何在android模拟器中启用麦克风输入

我一直在尝试使用 Android 模拟器上的语音识别来做一些事情，但经历了一段艰难的旅程。终于安装了市场和 Google 语音搜索应用程序 - 我已经很接近

java android speech-recognition adb microphone

回答 6 投票 0

Python 语音到 mikrofon 流中的文本

我想用 python 编写自己的语音助手，然后在 rapsberry pi 上运行它。我要做的第一步是转录 microfon 流的语音。所以我想要我的

python speech-recognition whisper

回答 1 投票 0

认知服务语音翻译作为 JSON 对话？

早上好，我正在尝试使用 Azure 认知服务，并有一个 C# 应用程序来监视放入存储帐户的 wav 文件。文件到达后，认知服务将

c# json speech-recognition azure-cognitive-services

回答 1 投票 0

Python、Blender 和 ChatGPT 集成

我之前发布过此内容，但范围太广了。我正在尝试创建一个人工智能驱动的 3D 动画角色。它应该与用户交互，就像我们正在与他们进行视频通话一样。茶...

speech-recognition blender python-3.10 chatgpt-api

回答 1 投票 0

如何停用 OpenAI Whisper 对超过 30 秒的音频输入的标准化？（转录填充词）

OpenAI 的 Whisper 提供漂亮、干净的成绩单。现在我希望它能生成更多原始记录，其中还包含填充词（ah、mh、mhm、uh、oh 等）。这里的帖子告诉我......

python python-3.x speech-recognition openai-whisper

回答 1 投票 0

将转录文本与音频中的特定时间戳对齐

在 Azure 中是否可能，或者 Azure 中是否有服务可以用来根据源视频的口语获取每个纯文本的位置？基本上，我有一个纯文本可以...

text c#-4.0 speech-recognition speech-to-text speech

回答 1 投票 0

Python 多语言语音识别

我有一个Python项目中的语音识别。所以，我需要它来识别 5 种语言。我的代码：将语音识别导入为 sr r = sr.Recognizer() 以 sr.Microphone() 作为源：音频 = r.li...

python speech-recognition

回答 1 投票 0

如何在 JavaScript 中将音频 Mp3 文件转换为文本？

我正在用语音（麦克风输入）提取文本，效果很好。但我想将音频文件转换为文本。因此，我将在其中添加用于获取音频文件并自动转换为文本的代码。下面是我的c...

javascript speech-recognition webkitspeechrecognition

回答 1 投票 0

识别音频文件中的重复句子

我正在寻找有关识别音频文件中重复语音片段的最佳方法的信息。假设有人正在录制自己说的文字，有时他会被一句话噎住......

speech-recognition speech-to-text speech audio-fingerprinting text-comparison

回答 1 投票 0

Python 语音识别在麦克风之间的变化

通过运行以下代码，我获得了所有可用的麦克风：将语音识别导入为 sr 对于索引，枚举中的名称(sr.Microphone.list_microphone_names())： print(f'{索引}, {名称}') ...

python speech-recognition pyaudio

回答 2 投票 0

如何等待说话者沉默1分钟后再开始识别

我希望天蓝色语音转文本服务在开始识别语音之前等待至少 1 分钟。或者演讲者自己在完成演讲后点击按钮，然后蓝色演讲...

reactjs azure speech-recognition azure-cognitive-services speech-to-text

回答 1 投票 0

speech_recognition 抛出错误``audio_data`` 必须是音频数据

我有一个视频文件，我想确定演讲者的置信度。为了执行此操作，我首先从视频文件中提取音频。下面是代码。来自 moviepy.edi...

python machine-learning speech-recognition google-speech-api speech-recognition-api

回答 1 投票 0

获取 Android 13 上 Google SpeechRecognizer (GoogleTTSRecognitionService) 支持的语言列表

在android 13之前，我可以使用意图RecognizerIntent.ACTION_GET_LANGUAGE_DETAILS通过广播接收器成功获取支持的语言。在 Android 13 上，额外内容为空。代码如下：公开

android speech-recognition speech-to-text

回答 2 投票 0

适用于 iOS 的带有儿童语音的文本到语音框架

我正在尝试使用 Swift 构建一个儿童游戏。我想在我的应用程序中使用文本转语音 API，但我通过的所有 API 都是男性或女性机器人的声音。有没有API可用...

ios swift speech-recognition text-to-speech

回答 1 投票 0

speech-recognition 相关问题

最新问题