用于语音识别的开源工具包。包括语音识别器Sphinx 2-4,PocketSphinx和一套补充识别器的工具。
我刚刚搜索了一个开源库来使用我的项目来构建语音控制机器人,并找到了 CMUsphinx。但我的机器人将构建在基于 ARM 的微控制器上,而我没有 Linux 或
我想制作一个将语音转换为文本的程序,我只想使用离线库。 我找到了 cmusphinx 库并尝试使用它。但我不知道如何安装它我试过安装...
我已经学会了如何使用Shpinx-4作为语音识别工具包的基础知识。我已经写了一些句子来为我的小项目建立语言模型(作为一个开始的10句),自 ...
问题:我正在寻找一种调试工具/方法,当PocketSphinx.js无法识别我定义的自定义单词时,我可以使用它来发现问题所在。具体来说,我想...
Sphinx4 StreamSpeechRecognizer实时
我正在尝试在客户端录制音频,将其发送到“服务器”,然后通过Sphinx4在“服务器”上使用语音转文本。我的代码:公共类SoundModifier实现Runnable {private static ...
我正在开发一个python应用程序,该应用程序旨在根据演员在屏幕上所说的内容来对齐视频片段。举个例子,我有一个场景,演员从剧本中阅读对话。他们确实...
我正在尝试在Windows 10上安装pocketsphinx。我已经下载了pocketsphinx和sphinxbase,并同时构建了它们,并将sphinxbase.dll放入Pocketsphinx容器中。但是,当我复制并粘贴...
我想为Pocketsphinx(.lm)用德语构建一个小的词汇模型,该模型只能识别0-9之间的德语数字。使用Voxforge de-de模型时,性能非常差(几乎没有...
我有一个Python脚本,使用了Speech_recognition包来识别语音并返回所讲内容。但是,转录有几秒钟的延迟。还有另一种方法可以...
任务':app:swigPs'执行失败。 >处理'命令'swig'完成,退出值非零1
我想运行我的项目以测试已创建的程序,而同步Gradle则不是错误,但是当项目生成错误时:Error:任务':app:swigPs'的执行失败。 > ...
我想知道我是否可以将Google的语音识别api用于我的桌面应用程序。我已经看到一些示例,在该示例中,我必须将语音转换为文件并发送到url。但是它将是...
我尝试为我的应用程序使用pocketsphinx软件包,并且需要将演示软件包名称重命名为有用的名称(例如com.myname.foo),我花了数小时才弄清楚,但我根本无法使它正常工作。 ...
我正在开发语音识别软件,并想测试Pocketsphinx,并尝试在Windows 10 python版本3.8上使用pip安装它,通常我不会下载...
我的输出是:[' ','does','any',' ','unable','to(3)','bear','the','senate','is ','触摸','情感','转过身','离开',' ','and(2)','生病','阿福德',' > 如果不检查将每个单词与其发音相关联的字典文件(通常使用扩展名.dict很难确定)。然后,您可以检查它与(假设是)to(2)或to有什么不同。 但是,由于许多具有相同拼写的单词具有不同的发音,因此惯例是考虑到具有不同单词的单词,如official tutorial中所述。 字典也可以包含其他发音。在这种情况下,您可以在括号中用数字指定它们: TH IH [(2)TH AH 如果您使用的是预制的官方型号,那么肯定是这种情况。
我已经安装了pocketsphinx和sphinxbase(0.8)的最新版本。我尝试导入pocketsphinx到Python代码(Python的3.4.2版本),并使用“解码器”是这样的:尝试:进口...
我已经运行Pocketsphinx的Python的例子,我现在面对的,我想运行在英语语音识别的60秒的wav文件,并希望作为输出的问题 - 英语翻译 - ...
pocketsphinx设置国语/中国模式,并使用Python字典的问题
(同时要求在sourceforge.net)我从源代码安装sphinxbase和pocketsphinx(官方CMU github上,而不是从sourceforge.net)在Ubuntu 18(主持人:Mac Pro的;使用VMware Fusion 11;蟒蛇:3.6)我...
我可以使用Sphinx4附带的en-us东西,没问题:cfg.setAcousticModelPath(“resource:/ edu / cmu / sphinx / models / en-us / en-us”)cfg.setDictionaryPath(“resource:/ edu / CMU /狮身人面像/模型/ EN-US / ...
我正在尝试使用CMUSphinx和Java实现德语命令和控制应用程序。到目前为止,应用程序应该只识别几个单词(数字从1到9,是/否)。不幸的是......
我正在寻找德语发音词典,以便用于PocketSphinx / CMU Sphinx。字典看起来像这样:BACK B AE K CALL K AO L NO N OW NUMBER N AH M B ER ONE W AH ...