将wikidata转储分解为更小的知识图

wikidatasets的Python项目详细描述


维基数据集

https://img.shields.io/pypi/v/wikidatasets.svghttps://img.shields.io/travis/armand33/wikidatasets.svgDocumentation StatusUpdates

将wikidata转储分解为更小的知识图(例如人类实体图)。

数据集

数据集在此page上可用。

功能

这是一个非详尽的有用函数列表:

  • wikidatasets.processFunction.get_subclasses:获取作为主题子类的实体的wikidata id列表。
  • wikidatasets.processFunction.query_wikidata_dump:通过wikidata转储。它既可以收集作为测试实体实例的实体,也可以收集标签字典。它也可以两者兼得。
  • wikidatasets.processFunction.build_dataset:从查询wikidata转储生成的pickle文件生成数据集。
  • wikidatasets.utils.load_data_labels:将边和属性文件加载到pandas数据帧中,并合并要获取的实体和关系的标签。

示例/文件夹包含创建数据集(例如build_humans.py)的脚本示例。 这样的脚本应该放在主目录(连同utils.pyprocessFunctions.py)中,并且应该调整硬编码路径以匹配您的安装。

引文

如果您发现此代码对您的研究有用,请考虑引用我们的paper

@misc{arm2019wikidatasets,
    title={WikiDataSets : Standardized sub-graphs from WikiData},
    author={Armand Boschin},
    year={2019},
    eprint={1906.04536},
    archivePrefix={arXiv},
    primaryClass={cs.LG}
}

学分

这个包是用Cookiecutteraudreyr/cookiecutter-pypackage项目模板创建的。

历史记录

0.2.0(2019-07-02)

  • 将nodes.txt的导出添加到build_dataset函数。

0.1.0(2019-07-01)

  • pypi上的第一个版本。

欢迎加入QQ群-->: 979659372 Python中文网_新手群

推荐PyPI第三方库


热门话题
java有可能让一个bean在春天拥有多个父对象吗?   java将字符串转换为sparql URI   java如何仅从JPQL中的日期时间字段按日期分组   java到节点。js代码转换   java为什么即使构建成功,applet也不启动?   java多人查询jpql   令牌“}”上的java语法错误,{应为   基于列表的简单留言板实现中的java NullPointerException   javasimplenlg:我们如何指定数量?   java如何仅从Freemarker中的字符串获取字母表?   java Spring引导JPA按实体排序集合   java排序单链表与排序双链表   eclipse将版权头添加到所有项目文件(.java、.xml、…)