识别Tex中的所有物质

2024-03-28 12:13:41 发布

您现在位置:Python中文网/ 问答频道 /正文

我目前正在为ISTQB测试管理器培训。为此,我想使用ANKI及其完形填空删除。在

我想自动生成抽认卡,即通过一个Python脚本。这个脚本应该用完形填空删除替换所有的实体。在

我的问题是:

如何用python脚本识别文本中的实体?

不幸的是,教学大纲没有德语版本。德语有一个很大的优势,即实体是大写的。在


Tags: 文本版本实体脚本管理器大写优势anki
1条回答
网友
1楼 · 发布于 2024-03-28 12:13:41

注意句法分析或词性标记(词性=词性,如动词、名词)

pattern和{a2}为此提供了包。在

模式示例:

>>> from pattern.en import parse
>>> print parse('I eat pizza with a fork.')

I/PRP/B-NP/O eat/VBD/B-VP pizza/NN/B-NP/O with/IN/B-PP/B-PNP a/DT/B-NP/I-PNP
fork/NN/I-NP/I-PNP ././O/O

NLTK的一个例子:

^{pr2}$

一旦你知道了哪些是实体或名词(通常POS标记以N开头),你就可以对它们进行完形删除。请注意,词性标记并不完美,因此性能将取决于您正在处理的文本的完整性。(我也假设你是用英语工作的,但是有很多种语言都有POS-tagers。)

相关问题 更多 >