语音识别(SR)是计算语言学的跨学科子领域,它将语言学,计算机科学和电气工程领域的知识和研究结合起来,开发出能够通过计算机识别和翻译口语的方法和技术。和计算机化的设备,如分类为智能技术和机器人技术的设备
我在python中编写了一个用于语音的代码,但是面对这个问题却陷入困境“请首先构建并安装PortAudio Python绑定。”导入speech_recognition为sr; R = SR ....
我正在使用谷歌API语音到文本。下面是我的python代码:从google.cloud导入speech_v1p1beta1作为语音导入os os.environ [“GOOGLE_APPLICATION_CREDENTIALS”] =“C:\\ Users \\ chetan ....
在我的应用中,我直接使用SpeechRecognizer。我销毁SpeechRecognizer onPause of Activity,我在onResume方法中重新创建它,如下所示... public class NoUISpeechActivity extends Activity {...
Google WebSpeech API为麦克风许可提出了“不允许”的错误
我正在使用此网站上的Google的WebSpeech API:https://developers.google.com/web/updates/2013/01/Voice-Driven-Web-Apps-Introduction-to-the-Web-Speech-API With Python's http.server在我...
我有我的军舰游戏项目,我想用口袋狮身人面像库进行语音识别。我想使用字典而不是谷歌API,因为我想要一些特别的...
Python - TypeError:listen()缺少1个必需的位置参数:'self'
我一直在使用PyCharm中的AI但是我似乎遇到了一个错误,其中speech_recognition试图调用一个方法来尝试获取音频输入:/ Users / waynedeng / Desktop / AI / venv / ...
基本上我正在尝试将语音识别结合到我正在构建的应用程序中。我希望能够在按下麦克风按钮时播放声音,然后开始录制和识别...
我一直在尝试运行UBM.EM_Split()函数。我创建了一个功能文件feat.h5(3.8 MB),它存储了24个音频文件的功能。我试图使用此功能文件作为...的输入
我已经训练了一个UBM模型,现在我正试图在我得到跟随错误时实现扬声器适应。例外:show enroll / something.wav不在HDF5文件中我有两个文件“...
我正在使用文档中概述的Ionic Native语音识别:https://ionicframework.com/docs/native/speech-recognition:startListening(){this.speechRecognition.startListening()....
我已经安装了PocketSphinx演示版,它在Ubuntu和Eclipse下工作正常,但是尽管我尝试了,但我无法弄清楚如何添加多个单词的识别。我想要的只是代码......
我在python中安装并设置了pocketsphinx和sphinxbase软件包。我还为github采用了语音识别代码,并根据需要更改了数据和模式目录,但......
我正致力于语音识别,我需要使用多种语言。如果用户用印地语或任何其他语言说话,我真正想要的是,然后需要在文本View上显示它。现在它......
我正在尝试实现以下文章:https://arxiv.org/abs/1904.08779,以便在Speech to Text中获得更好的结果。我正在尝试使用mozilla DeepSpeech repo来实现它。它......
我正在尝试开发一个基于语音的应用程序,它将接受用户输入作为语音并根据输入执行一些操作。这是我第一次尝试这项技术而且我...
使用long_running_recognize()时超时错误
我正在尝试使用Google Speech API转录音频文件并使用long_running_recognize。它工作了一次,但现在我开始每次尝试时都会出现以下错误 - 任何指导都是......
如果扬声器远离麦克风,Google Speech / NAudio会有很大的延迟
我正在使用google speech api和NAudio(使用NAudio WaveInEvent类)对文本进行语音处理。像这样:https://cloud.google.com/speech-to-text/docs/streaming-recognize?hl = en(C#示例为“...
我正在从事一个涉及使用 SpeechRecognition 模块进行语音识别的项目。我想做的一件事是提高我的语音识别能力,就是能够输出具有 b...
我正在使用谷歌语音库,如下所示:来自google_speech import语音#说“Hello World”text =“Hello World”lang =“en”speech = Speech(text,lang)speech.play()得到这个......
我想在Text To Speech停止后立即开始语音识别。以下是我采取的步骤。第1步:初始化语音识别。 mSpeechRecognizer = SpeechRecognizer ....