知识图嵌入的训练与评估包

pykeen的Python项目详细描述


pykene(python knowledge embeddings)是一个用于训练和评估知识图嵌入的包。目前, 它提供了10个知识图emebddings模型的实现,并且可以在用户使用的training模式下运行 提供自己的超参数值集,或者在hyper parameter optimization mode中找到合适的 来自用户定义值集的超参数值。Pykeen也可以在没有编程经验的情况下运行 通过使用其交互式命令行界面,可以从终端使用命令pykeen启动。

新闻

我们目前正在开发pykeen 0.1.0,它将提供一些附加功能,例如 抽样方法和进一步的评估指标。此外,我们还集成了其他KGE模型。

我们正在开发一种新的package用于培训和评估多模态 KGE模型,稍后将集成到PyKeen中。

引文

如果您发现PyKeen对您的工作有用,请考虑引用:

[1]Ali, M., et al.: The KEEN Universe: An ecosystem for knowledge graph embeddings with a focus on reproducibility and transferability. In: International Semantic Web Conference (2019).

分享您的实验作品

您可以通过KEEN Model Zoo与其他实验工件共享您训练过的kge模型。

安装Current version on PyPISupported Python Versions: 3.6 and 3.7MIT License

要安装pykeen,需要python 3.6+,我们建议将其安装在linux或mac os系统上。 请运行以下命令:

pip install pykeen

或者,也可以使用以下命令从源代码安装以进行开发:

$ git clone https://github.com/SmartDataAnalytics/PyKEEN.git pykeen
$ cd pykeen
$ pip install -e .

但是,gpu加速仅限于具有适当图形卡的linux系统 如pytorch文档中所述。

使用PIP安装附加组件

pykeen使用pip的extras功能,允许跳过一些不必要的特性。它们可以与 以下内容:

  1. pip install pykeen[ndex]支持从ndex加载网络。它们可以添加到培训文件中 用^ {tT3}$
  2. 预编译文件的路径

贡献

无论是提交问题、提出拉式请求还是分叉,我们都会感谢您的贡献。 有关详细信息,请参见CONTRIBUTING.rst 参与的信息。

教程

代码示例可以在notebooks directory中找到。

我们的documentation中提供了更多教程。

cli用法-在60秒内设置您的实验

要启动pykeen cli,请运行以下命令:

pykeen

然后命令行界面将帮助您配置实验。

使用现有配置文件启动PyRIN,运行:

pykeen -c /path/to/config.json

然后不会调用命令行接口,而是立即启动管道。

启动预测管道

要根据训练的模型进行预测,请运行:

pykeen-predict -m /path/to/model/directory -d /path/to/data/directory

其中参数-m的值是包含模型的目录,下面的文件必须更详细 包含在目录中:

  • configuration.json
  • 实体到嵌入.json
  • relations_to_embeddings.json
  • 训练有素的.pkl模型

这些文件是在模型经过培训(和评估)并在 指定的输出目录。

参数-d的值是包含应该应用推断的数据的目录,并且 需要包含以下文件:

  • 实体.tsv
  • relations.tsv

其中entities.tsv包含所有感兴趣的实体,relations.tsv包含所有关系。两个文件都应该包含 包含所有实体/关系的单个列。基于这些文件,pykeen将创建 三重排列,计算它们的预测,并将它们保存在数据目录中 在预测中离子tsv。 注意:只要提供了所有必需的文件,模型和数据目录就可以是同一个目录。

可选地,可以提供一组应该从预测中排除的三元组,例如所有三元组 包含在训练集中:

pykeen-predict -m /path/to/model/directory -d /path/to/data/directory -t /path/to/triples.tsv

因此,很容易计算出训练集中未包含的所有三倍的似然性得分。

总结所有实验的结果

要总结所有实验的结果,请提供包含所有实验的父目录的路径 作为子目录,输出文件的路径:

pykeen-summarize -d /path/to/experiments/directory -o /path/to/output/file.csv

欢迎加入QQ群-->: 979659372 Python中文网_新手群

推荐PyPI第三方库


热门话题
java JOOQ“IN”查询引发空指针异常   在Java中将文本文件读入HashMap   Java慢速socket。连接()   java您可以指定网页的大小,以便排除评论部分吗?   java使用WebViewActivity。kotlin中的额外URL   java检索保存到数据库中的pdf文件,以便在pdfbox中进行操作。Springbot和hibernate应用程序   通过java录制获得巨大回声的音频   java Oracle如何正确执行事务?   如何在OpenAPI 3.0 Java generator中生成具有附加属性的对象体请求   java无法解析符号“ImageReference”   java泛化类的ArrayList之间的搜索方法   多线程可能会影响Java对象。等会被打断吗?   安卓 Java设置alarmmanager的时间间隔,并在特定时间停止   java“数组索引超出范围异常6”   java行业标准布局管理器   循环我的Java代码不会产生下一波吗?   java JavaFx复制超链接