知识图嵌入的训练与评估包
pykeen的Python项目详细描述
pykene(python knowledge embeddings)是一个用于训练和评估知识图嵌入的包。目前, 它提供了10个知识图emebddings模型的实现,并且可以在用户使用的training模式下运行 提供自己的超参数值集,或者在hyper parameter optimization mode中找到合适的 来自用户定义值集的超参数值。Pykeen也可以在没有编程经验的情况下运行 通过使用其交互式命令行界面,可以从终端使用命令pykeen启动。
新闻
我们目前正在开发pykeen 0.1.0,它将提供一些附加功能,例如 抽样方法和进一步的评估指标。此外,我们还集成了其他KGE模型。
我们正在开发一种新的package用于培训和评估多模态 KGE模型,稍后将集成到PyKeen中。
引文
如果您发现PyKeen对您的工作有用,请考虑引用:
[1] | Ali, M., et al.: The KEEN Universe: An ecosystem for knowledge graph embeddings with a focus on reproducibility and transferability. In: International Semantic Web Conference (2019). |
安装
要安装pykeen,需要python 3.6+,我们建议将其安装在linux或mac os系统上。 请运行以下命令:
pip install pykeen
或者,也可以使用以下命令从源代码安装以进行开发:
$ git clone https://github.com/SmartDataAnalytics/PyKEEN.git pykeen
$ cd pykeen
$ pip install -e .
但是,gpu加速仅限于具有适当图形卡的linux系统 如pytorch文档中所述。
使用PIP安装附加组件
pykeen使用pip的extras功能,允许跳过一些不必要的特性。它们可以与 以下内容:
- pip install pykeen[ndex]支持从ndex加载网络。它们可以添加到培训文件中 用^ {tT3}$ 预编译文件的路径
贡献
无论是提交问题、提出拉式请求还是分叉,我们都会感谢您的贡献。 有关详细信息,请参见CONTRIBUTING.rst 参与的信息。
cli用法-在60秒内设置您的实验
要启动pykeen cli,请运行以下命令:
pykeen
然后命令行界面将帮助您配置实验。
使用现有配置文件启动PyRIN,运行:
pykeen -c /path/to/config.json
然后不会调用命令行接口,而是立即启动管道。
启动预测管道
要根据训练的模型进行预测,请运行:
pykeen-predict -m /path/to/model/directory -d /path/to/data/directory
其中参数-m的值是包含模型的目录,下面的文件必须更详细 包含在目录中:
- configuration.json
- 实体到嵌入.json
- relations_to_embeddings.json
- 训练有素的.pkl模型
这些文件是在模型经过培训(和评估)并在 指定的输出目录。
参数-d的值是包含应该应用推断的数据的目录,并且 需要包含以下文件:
- 实体.tsv
- relations.tsv
其中entities.tsv包含所有感兴趣的实体,relations.tsv包含所有关系。两个文件都应该包含 包含所有实体/关系的单个列。基于这些文件,pykeen将创建 三重排列,计算它们的预测,并将它们保存在数据目录中 在预测中离子tsv。 注意:只要提供了所有必需的文件,模型和数据目录就可以是同一个目录。
可选地,可以提供一组应该从预测中排除的三元组,例如所有三元组 包含在训练集中:
pykeen-predict -m /path/to/model/directory -d /path/to/data/directory -t /path/to/triples.tsv
因此,很容易计算出训练集中未包含的所有三倍的似然性得分。
总结所有实验的结果
要总结所有实验的结果,请提供包含所有实验的父目录的路径 作为子目录,输出文件的路径:
pykeen-summarize -d /path/to/experiments/directory -o /path/to/output/file.csv