2024-03-28 12:13:41 发布
网友
我目前正在为ISTQB测试管理器培训。为此,我想使用ANKI及其完形填空删除。在
我想自动生成抽认卡,即通过一个Python脚本。这个脚本应该用完形填空删除替换所有的实体。在
我的问题是:
如何用python脚本识别文本中的实体?
不幸的是,教学大纲没有德语版本。德语有一个很大的优势,即实体是大写的。在
注意句法分析或词性标记(词性=词性,如动词、名词)
pattern和{a2}为此提供了包。在
模式示例:
>>> from pattern.en import parse >>> print parse('I eat pizza with a fork.') I/PRP/B-NP/O eat/VBD/B-VP pizza/NN/B-NP/O with/IN/B-PP/B-PNP a/DT/B-NP/I-PNP fork/NN/I-NP/I-PNP ././O/O
NLTK的一个例子:
一旦你知道了哪些是实体或名词(通常POS标记以N开头),你就可以对它们进行完形删除。请注意,词性标记并不完美,因此性能将取决于您正在处理的文本的完整性。(我也假设你是用英语工作的,但是有很多种语言都有POS-tagers。)
注意句法分析或词性标记(词性=词性,如动词、名词)
pattern和{a2}为此提供了包。在
模式示例:
NLTK的一个例子:
^{pr2}$一旦你知道了哪些是实体或名词(通常POS标记以N开头),你就可以对它们进行完形删除。请注意,词性标记并不完美,因此性能将取决于您正在处理的文本的完整性。(我也假设你是用英语工作的,但是有很多种语言都有POS-tagers。)
相关问题 更多 >
编程相关推荐