语音识别(SR)是计算语言学的跨学科子领域,它将语言学,计算机科学和电气工程领域的知识和研究结合起来,开发出能够通过计算机识别和翻译口语的方法和技术。和计算机化的设备,如分类为智能技术和机器人技术的设备
我试图找出是否可以使用System.Speech.SpeechRecognitionEngine在5秒的时间间隔内计算音节或单词。我一直在使用SpeechRecognitionEngine进行一些测试,使用...
似乎微软提供了不少语音识别产品,我想知道它们之间的差异。有Microsoft Speech API或SAPI。但不知何故,微软认知......
tensorflow:transpose期望一个大小为1的向量。但input(1)是一个大小为2的向量
我想使用经过训练的RNN语言模型进行推理。所以:我使用tensorflow :: MetaGraphDef graph_def在c ++中加载训练好的模型图; TF_CHECK_OK(ReadBinaryProto(Env :: Default(),...
我想补充一点,每当它识别出“搜索X”时它就会搜索“X”,但我不知道如何将其添加到语法中,或者如何用我的开关来做这样的事情声明。 ...
我正在尝试使用语音识别来浏览文件夹并根据语音内容命名所有文件。只要音频文件位于文件夹中,此代码目前有效...
基本上我希望能够扫描已经上传到我的网络服务器(LAMP)的音频片段,并获得音频片段的文本内容。有这样的方法吗?有没有......
我正在使用Google语音识别API成功入门后我试图理解并在第一个示例中进行了一些更改,但我不知道“gs”协议是什么以及如何...
目前我正在MATLAB中从事语音识别项目。我已经拍摄了两个语音信号,并提取了相同的MFCC系数。据我所知,我现在应该计算......
我开发了一个新程序来与我的聊天机器人交谈。它工作得很好,但有一个我似乎无法弄清楚的奇怪问题。每次重复该过程(控制台输出收听和...
为了开发基于桌面的应用程序,我正在寻找Java中的语音到文本转换第三方库。 (开源将是首选)任何人都知道这样的API将是灵活的...
我正在编写一个需要识别用户口头命令的WPF应用程序。作为语音识别引擎的新手,我不确定如何以最好的方式完成我需要的工作......
Python,speech_recognition工具无法识别.wav文件
我已经生成了一个.wav音频文件,其中包含一些语音和后台的其他干扰语音。这段代码对我来说是一个测试.wav文件:import speech_recognition as sr ...
是否有任何方法可以使用Unity为Vuzix m300提供语音识别和触摸板支持。共享的代码适用于Android Studio开发。我要求Unity3D。
如何在android中使用pocketsphinx进行多个关键字激活而无需进入菜单
我希望pocketsphinx能够听取某些关键字并执行各自的操作,而不是像他们的演示应用程序那样进入菜单。我有三个关键字private static final String KEYPHRASE1 =“good ...
由于某种原因,Dialogflow无法识别Training短语中存在的名称。在示例中,我发送“我的名字是Ashvin”并且应该回复。 “你的姓是什么?我也试过......
如何返回ffmpeg进程输出文件并将其传递给另一个函数?使用python
我想使用ffmpeg将视频转换为音频,我还想返回该音频文件并将其传递给另一个从该音频生成文本的函数。但是,当我通过'音频'功能...
作为一个自学项目,我使用我在python上学到的一些基础语音助手进行了一些研究。链接到代码在这里我基本上将音频转换为文本然后...
使用AudioKit播放音频文件作为麦克风输入 - 用于iOS模拟器听写测试
我正在寻找一种播放音频文件的方式,并将其作为iOS模拟器麦克风的输入。我正在为使用听写(语音到文本)的iOS应用程序创建一堆UI测试,但我没有......
我正在尝试在我的应用程序(启动器)中使用Google语音识别。当我尝试将它用于诸如Call to X之类的简短命令或者说一个像123456789这样的短号时,一切正常,但......
我正在尝试编写一个Python-3.6脚本,它将空的.aif音频记录(即仅包含环境噪声)与包含语音的记录分开。我的目标不是承认语音内容 - ......