自动语音识别中的句子校正

2024-04-27 23:02:35 发布

您现在位置:Python中文网/ 问答频道 /正文

我想知道在端到端ASR模型的末尾添加一些层来进行文本更正是否会显著提高准确性。我的模型已经有28%的功率了。最后一层是带有时间步长和标签的softmax,然后使用CTC损耗进行模型训练

作为下一步,我试图用分离的方法纠正输出句子(n个gram模型(单词)、markov模型(字母)),但这是不够的

如果您知道扩展ASR神经网络的方法或有任何其他想法,以提高精度(不包括增加训练数据)


Tags: 方法模型文本时间标签asr功率句子