speech-recognition 相关问题

语音识别(SR)是计算语言学的跨学科子领域,它将语言学,计算机科学和电气工程领域的知识和研究结合起来,开发出能够通过计算机识别和翻译口语的方法和技术。和计算机化的设备,如分类为智能技术和机器人技术的设备

如何解决这个python portaudio绑定问题?

我在python中编写了一个用于语音的代码,但是面对这个问题却陷入困境“请首先构建并安装PortAudio Python绑定。”导入speech_recognition为sr; R = SR ....

回答 1 投票 0

如何修复#issue 400指定FLAC编码以匹配文件头?

我正在使用谷歌API语音到文本。下面是我的python代码:从google.cloud导入speech_v1p1beta1作为语音导入os os.environ [“GOOGLE_APPLICATION_CREDENTIALS”] =“C:\\ Users \\ chetan ....

回答 1 投票 1

SpeechRecognizer:未连接到识别服务

在我的应用中,我直接使用SpeechRecognizer。我销毁SpeechRecognizer onPause of Activity,我在onResume方法中重新创建它,如下所示... public class NoUISpeechActivity extends Activity {...

回答 2 投票 4

Google WebSpeech API为麦克风许可提出了“不允许”的错误

我正在使用此网站上的Google的WebSpeech API:https://developers.google.com/web/updates/2013/01/Voice-Driven-Web-Apps-Introduction-to-the-Web-Speech-API With Python's http.server在我...

回答 3 投票 3

拼写字母与语音识别库python

我有我的军舰游戏项目,我想用口袋狮身人面像库进行语音识别。我想使用字典而不是谷歌API,因为我想要一些特别的...

回答 1 投票 0

Python - TypeError:listen()缺少1个必需的位置参数:'self'

我一直在使用PyCharm中的AI但是我似乎遇到了一个错误,其中speech_recognition试图调用一个方法来尝试获取音频输入:/ Users / waynedeng / Desktop / AI / venv / ...

回答 1 投票 1

Swift 3音频无法播放

基本上我正在尝试将语音识别结合到我正在构建的应用程序中。我希望能够在按下麦克风按钮时播放声音,然后开始录制和识别...

回答 2 投票 0

创建功能后,在创建UBM期间,Sidekit代码会冻结

我一直在尝试运行UBM.EM_Split()函数。我创建了一个功能文件feat.h5(3.8 MB),它存储了24个音频文件的功能。我试图使用此功能文件作为...的输入

回答 1 投票 1

使用sidekit在UBM发言人适应期间出错

我已经训练了一个UBM模型,现在我正试图在我得到跟随错误时实现扬声器适应。例外:show enroll / something.wav不在HDF5文件中我有两个文件“...

回答 1 投票 1

用离子语音识别捕捉“再试一次”

我正在使用文档中概述的Ionic Native语音识别:https://ionicframework.com/docs/native/speech-recognition:startListening(){this.speechRecognition.startListening()....

回答 1 投票 0

使用PocketSphinx识别多个关键字

我已经安装了PocketSphinx演示版,它在Ubuntu和Eclipse下工作正常,但是尽管我尝试了,但我无法弄清楚如何添加多个单词的识别。我想要的只是代码......

回答 3 投票 16

来自麦克风的Python口袋识别器

我在python中安装并设置了pocketsphinx和sphinxbase软件包。我还为github采用了语音识别代码,并根据需要更改了数据和模式目录,但......

回答 1 投票 0

语言为多语言的文本

我正致力于语音识别,我需要使用多种语言。如果用户用印地语或任何其他语言说话,我真正想要的是,然后需要在文本View上显示它。现在它......

回答 3 投票 1

掩模张量在张量流,数据增量中

我正在尝试实现以下文章:https://arxiv.org/abs/1904.08779,以便在Speech to Text中获得更好的结果。我正在尝试使用mozilla DeepSpeech repo来实现它。它......

回答 1 投票 0

具有基于自定义SRGS的语法的自由格式文本

我正在尝试开发一个基于语音的应用程序,它将接受用户输入作为语音并根据输入执行一些操作。这是我第一次尝试这项技术而且我...

回答 2 投票 3

使用long_running_recognize()时超时错误

我正在尝试使用Google Speech API转录音频文件并使用long_running_recognize。它工作了一次,但现在我开始每次尝试时都会出现以下错误 - 任何指导都是......

回答 1 投票 0

如果扬声器远离麦克风,Google Speech / NAudio会有很大的延迟

我正在使用google speech api和NAudio(使用NAudio WaveInEvent类)对文本进行语音处理。像这样:https://cloud.google.com/speech-to-text/docs/streaming-recognize?hl = en(C#示例为“...

回答 2 投票 2

如何持续进行语音识别,并尽快输出识别出的单词

我正在从事一个涉及使用 SpeechRecognition 模块进行语音识别的项目。我想做的一件事是提高我的语音识别能力,就是能够输出具有 b...

回答 5 投票 0

RuntimeError:无法找到二进制'sox'

我正在使用谷歌语音库,如下所示:来自google_speech import语音#说“Hello World”text =“Hello World”lang =“en”speech = Speech(text,lang)speech.play()得到这个......

回答 1 投票 0

如何开始语音识别,文本语音即将停止。

我想在Text To Speech停止后立即开始语音识别。以下是我采取的步骤。第1步:初始化语音识别。 mSpeechRecognizer = SpeechRecognizer ....

回答 2 投票 0

© www.soinside.com 2019 - 2024. All rights reserved.