包括CMU pocketsphinx gstream的语法

2024-05-23 18:44:15 发布

您现在位置:Python中文网/ 问答频道 /正文

我一直在寻找CMU pocketsphinx进行语音识别。理想情况下,我希望能够通过现场音频作为输入,识别出“Please pick”这一行的句子结构,其中有大量对象(约200个)。最初,我在Ubunutu上安装pocketsphinx时遇到了很多困难,最终我能够使用gstreamer让它正常工作。现在我有了它,我正在努力提高准确性。我无法找到任何语法或语法方面的例子,但我想在代码中找到。在

我将非常感谢你的帮助。在


Tags: 对象语法情况语音音频结构现场句子
1条回答
网友
1楼 · 发布于 2024-05-23 18:44:15

您现在不能在gstreamer中使用JSGF,尽管这只是插件的一个小改动。但是可以使用FSG格式的语法。您可以自己构造FSG格式的语法,也可以将JSGF格式的语法转换为FSG格式:

sphinx_jsgf2fsg -jsgf grammar.jsgf -fsg grammar.fsg

要使用fsg格式的语法,请使用插件的“fsg”属性,就像使用“lm”属性一样,而不是:

^{pr2}$

您将FSG属性设置为FSG文件:

    g_object_set(G_OBJECT(filter), "fsg", 
         "pocketsphinx/test/data/goforward.fsg", NULL);

在python中也可以这样做:

    asr.set_property("fsg", "pocketsphinx/test/data/goforward.fsg")

相关问题 更多 >