我想用German STW Thesaurus for Economics注释两个XML文件。您可以将文件here作为RDF/XML、N3和Turtle格式的ZIP归档文件(每个文件大约14MB)。在
所以我写了一个Python脚本,它删除了停止词、词素化和词性标记。现在我想检查一个XML文件中的名词是否在STW本体中。如果是,我想为以后的自动分类做不同的选择:
skos:altLabel
字,则用skos:prefLabel
字替换它skos:prefLabels
,并计算skos:prefLabel
和关联的skos:altLabels
的出现次数skos:broader
查找与skos:prefLabel
相关的Economic sectors或{a4}。在我知道GATE和{a6},它们都能做到这一点,但它们都是基于Java的,我想在最后用一个Python脚本完成所有工作。在
有什么建议吗?在
我不知道它是否正是您要寻找的,但是对于使用RDF,您有RDFLib。在
您可以在this answer或here中指向的工具/库中获得更多指导。在
希望这能有所帮助!:)
相关问题 更多 >
编程相关推荐