使用Enchan进行拼写检查时忽略某些单词

chkr = SpellChecker("en_GB") f = open('ca001_mci_17071971.txt', 'r', encoding = 'utf-8') text = f.read() tagged = pos_tag(word_tokenize(text)) NNP = [(word) for word, tag in tagged if tag == 'NNP'] chkr.set_text(text) for err in chkr: if err is word in NNP: err.ignore_always() else: sug = err.suggest()[0] err.replace(sug) corrected = chkr.get_text() print (NNP) print (corrected)

1条回答

网友

1楼 · 发布于 2024-05-19 01:45:50

我想出来了。必须告诉它错误的单词是刺，以便它可以将它们与NNP列表中的单词进行比较。新代码：

chkr = SpellChecker("en_GB")

for file in os.listdir(path):       
        f = open(file, 'r', encoding = 'utf-8')
        text = f.read()
        tagged = pos_tag(word_tokenize(text))
        NNP = [word for word, tag in tagged if tag == 'NNP']
        chkr.set_text(text)
        for err in chkr:
            if str(err.word) in NNP:
                err.ignore_always()
            else:
                sug = chkr.suggest()
                if len(sug) is not 0:
                    err.replace(sug[0])

        corrected = chkr.get_text()

同时也修正了，如果附魔没有任何建议，它会留下错误。在

相关问题更多 >

编程相关推荐

热门问题

热门文章

使用Enchan进行拼写检查时忽略某些单词

相关问题 更多 >

编程相关推荐

热门问题

热门文章

相关问题更多 >