CMU狮身人面像和时间索引的话

Question

我已经运行Pocketsphinx的Python的例子，我现在面对的，我想运行在英语语音识别的60秒的wav文件，并希望作为输出的问题 - 英语翻译 - 在该第二每个字被提及。

现在，我不知道从哪里开始圆顶一些研究，以获得所需的输出。任何人都可以请点我在正确的方向？

Answer 1

OK，开源工具，如Kaldi自动提供这样的：https://americanarchivepb.wordpress.com/2017/12/04/dockerized-kaldi-speech-to-text-tool/

Answer 2

您需要forced alignment认可。下面是pocketsphinx的example：

pocketsphinx_continuous
    -infile with.wav
    -jsgf with-word.jsgf
    -dict words.dict
    -backtrace yes
    -fsgusefiller no
    -bestpath no 
  2>&1 > with-word.txt

输出：

==> with-word.txt <==
INFO: fsg_search.c(869): fsg 0.05 CPU 0.051 xRT
INFO: fsg_search.c(871): fsg 0.09 wall 0.084 xRT
INFO: pocketsphinx.c(1171): sil with sil (-2607)
word                 start end   pprob ascr       lscr       lback
sil                  3     77    1.000 -1602      0          1
with                 78    102   1.000 -845       0          1
sil                  103   107   1.000 -160       0          1
INFO: fsg_search.c(265): TOTAL fsg 0.05 CPU 0.051 xRT
INFO: fsg_search.c(268): TOTAL fsg 0.09 wall 0.085 xRT
sil with sil

对于CMU狮身人面像4，你需要从狮身人面像API的SpeechAligner类。 Here你会发现简单的矫正工具的实现。

./align.sh sample.wav sample.txt 2>/dev/null

输出：

"it's","IH T S","false","0.0","170","200"
"a","AH","false","-5540774.0","200","390"
"crowd","K R AW D","false","-1.13934288E8","850","1300"
"in","IH N","false","-1.95127088E8","1300","1470"
"two","T UW","false","-2.23176048E8","1470","1700"
"distinct","D IH S T IH NG K T","false","-2.6345264E8","1700","2230"
"ways","W EY Z","false","-3.58427808E8","2230","2730"
"the","DH AH","false","-4.72551168E8","2920","3100"
"fruit","F R UW T","false","-5.24233504E8","3220","3530"
"of","AH V","false","-5.79971456E8","3530","3640"
"a","AH","false","-5.99515456E8","3640","3760"
"figg","F IH G","false","-6.2017152E8","3760","4060"
"tree","T R IY","false","-6.72126656E8","4060","4490"
"is","IH Z","false","-7.4763744E8","4490","4570"
"apple","AE P AH L","false","-7.73581184E8","4630","5040"
"shaped","SH EY P T","false","-8.44424704E8","5040","5340"

CMU狮身人面像和时间索引的话

问题描述投票：1回答：2

2个回答

最新问题

CMU狮身人面像和时间索引的话

问题描述 投票：1回答：2

2个回答

最新问题

问题描述投票：1回答：2