尝试将标记化输出写入fi时出现nltk错误

2条回答

网友

1楼 · 编辑于 2024-04-25 22:13:23

首先，你不应该使用单词“file”，因为它是一个python关键字。使用另一个词，比如“fp”作为要写入的文件的文件指针。现在要写入文件，请使用以下语句：

fp.write('\n -\n'.join(s.tokenize(r.strip())))

网友

2楼 · 编辑于 2024-04-25 22:13:23

为了更清楚地说明，OP要求一个句子标记器，以及如何在NLTK中使用句子标记器，以便它输出到一个文件：

$ echo "Frau Präsidentin! Ist meine Stimme mitgezählt worden? Betrachten wir z.B. die Automobilindustrie, wo die Subventionen und verschiedenen staatlichen Beihilfen während des Berichtszeitraums um 24% gestiegen sind. Zu welchem Zweck?" > in.txt
$ cat in.txt
Frau Präsidentin! Ist meine Stimme mitgezählt worden? Betrachten wir z.B. die Automobilindustrie, wo die Subventionen und verschiedenen staatlichen Beihilfen während des Berichtszeitraums um 24% gestiegen sind. Zu welchem Zweck?

$ python
>>> import io
>>> import nltk
>>> sent_tokenizer = nltk.data.load('tokenizers/punkt/german.pickle')
>>> with io.open('in.txt', 'r', encoding='utf8') as fin, io.open('out.txt', 'w', encoding='utf8') as fout:
...     sentences = sent_tokenizer.tokenize(fin.read())
...     fout.write('\n'.join(sentences))
>>> exit()

$ cat out.txt
Frau Präsidentin!
Ist meine Stimme mitgezählt worden?
Betrachten wir z.B. die Automobilindustrie, wo die Subventionen und verschiedenen staatlichen Beihilfen während des Berichtszeitraums um 24% gestiegen sind.
Zu welchem Zweck?

相关问题更多 >

编程相关推荐

热门问题

热门文章

尝试将标记化输出写入fi时出现nltk错误

相关问题 更多 >

编程相关推荐

热门问题

热门文章

相关问题更多 >