问题:我正在寻找一种调试工具/方法,当PocketSphinx.js无法识别我定义的自定义单词时,我可以用它来发现问题所在。具体来说,我希望能够看到在无法识别单词时PocketSphinx.js实际听到的音素。
详细信息:我正在为网站开发语音界面。我需要使用自定义关键字,并且正在使用PocketSphinx.js。我选择的自定义关键字是“ Berk-o-bot”,CMU pronunciation为“ B ER OW B A A T”。我对这个词组认识得很少。 (仅能识别大约四分之一的时间,我会慢慢地故意说出这个词,如果我以正常的速度讲话则永远不会。)注意:如果我将单词分成较小的块(Berk [B ER K],Berk-O [B ER K OW],O-bot [OW B A T]或bot [B AA T]),则较小的块很容易识别。
失败尝试的想法:
您需要先在Pocketsphinx_continuous和预先录制的音频文件上使其在桌面上运行。一旦工作,您可以尝试使用具有相同配置和型号的网络浏览器。
如果仍然无法获得更多详细的帮助,您可以共享音频文件和配置/模型。
总体而言,pocketsphinx是一项非常古老的技术,很难使其准确无误。您最好尝试使用https://github.com/castorini/honkling或vosk-api