将NCI-PID数据加载到NDEX中
ndexncipidloader的Python项目详细描述
NDEX NCI-PID内容加载器
将NCI-PID数据加载到ndex中的Python应用程序
此工具从以下位置下载包含NCI-PID数据的文件: ftp://ftp.ndexbio.org/NCI-PID\u biopax\u 2016-06-08-pc2v8-api/ 并执行以下操作:
1) owl文件被转换为扩展的格式,使用扩展的简单交互格式sif network rel="nofollow">sifollow">paxtools和 sif文件加载到网络中
< DL>- 蛋白质 (最初为蛋白质参考)
- 小分子 (最初为小分子参考)
- protein family (如果节点名具有 家族并是 蛋白质,则设置此项)
- rnaReference(原始值)
- 保护引用;小分子引用 (原始值)
3) 将名为 alias的节点属性添加到每个节点,并从 统一外部参照加载 使用扩展简单交互格式sif network" rel="nofollow">sif 文件中的列,该文件由 ; 拆分成一个列表。此列表中的每个元素都以 uniprot: 作为前缀,第一个元素设置为 表示节点中的值,并从 别名属性中移除。如果以后 删除,别名属性值为空,则将其删除。
4) 在 sif 文件 交互类型 定义边缘交互类型和 交互发布医疗ID 定义 引文边缘属性的值。引文边缘属性中的值为 前缀为 pubmed: 删除加载的多余边后 遵循这些惯例:
- 删除 边的邻居
- 如果连接相同节点的另一条边具有以下交互作用,则删除边的控制状态: 控制状态更改、控制传输、控制磷酸化、控制表达
注意: 如果以上结果导致孤立节点,则这些节点也将被删除
5) 如果边缘交互类型是以下类型之一,则名为 定向的边缘属性设置为 真(否则设置为 假)
controls-state-change-of controls-transport-of controls-phosphorylation-of controls-expression-of catalysis-precedes controls-production-of controls-transport-of-chemical chemical-affects used-to-produce
6) 如果节点名匹配 表示节点中的值(添加了 uniprot: 前缀),则节点名将替换为 基因符号映射.json
7) 如果节点名以 chebi开头,则节点名将替换为 参与者名的值工作" rel="nofollow">sif 列
8) 如果node 表示值以 chebi:chebi开始,则删除 chebi: 。
9) 如果在 sif中 给定节点的"参与者名称"列,则t他的值替换为在 gene_symbol_mapping.json中执行查找,除非查找中的值为 - ,在这种情况下保留原始名称
10) 如果根据 gene_symbol_mapping.json对节点名的查找返回一个或多个基因,则具有 家族的任何节点都将更改如下
- 添加名为 member的节点属性并将其设置为查找中找到的基因列表,该列表位于 gene_symbol_mapping.json
- 名为 type 的节点属性更改为 proteinfamily
11) 设置以下网络属性
- 名称 设置为 owl 文件的名称,删除了 .owl.gz 后缀,pathwaycommons.8.nci_pid.biopax 重命名为 nci pid-完成交互
- 作者 (摘自 networkattributes.tsv中的 编辑
- 标签 (来自 networkattributes.tsv中的 pid 列)
- 有机体 从 style.cx的 有机体 属性中提取。
- prov:wasgenetedby 设置为指向此repo的html链接,文本为ndexncipidloader<;version>;(示例:ndexncipidloader 1.2.0)
- prov:wasderivedfrom 设置为ftp站点上的owl文件的完整路径
- 审阅者 (来自 networkattributes.tsv中的 审阅者 栏)
- 版本 设置为缩写月份年份(例如:2019年5月)
- 说明 来自 style.cx的 说明 属性,但 NCI PID-完整交互 具有硬编码的DES描述设置为 此网络包括各个NCI-PID路径的所有交互。
- networktype 被设置为具有单个条目的字符串列表 路径 除了 nci pid-完整交互 还包括 交互组
- \uu iconul 设置为 –iconul 标志的值(当前默认为 http://search.ndexbio.org/static/media/ndex logo.04d7bf44.svg )
- 规格化版本设置为0.1
依赖关系
兼容性
- 巨蟒3.3+
安装
git clone https://github.com/coleslaw481/ndexncipidloader cd ndexncipidloader make dist pip install dist/ndexncipidloader*whl
配置
ndexloadncipid.py需要创建以下格式的配置文件。
此配置的默认路径是
~/.ndexutils.conf
,但可以用重写
--conf
标志。
配置文件格式
[<value in --profile (default ndexncipidloader)>] user = <NDEx username> password = <NDEx password> server = <NDEx server(omit http) ie public.ndexbio.org>
示例配置文件
[ncipid_dev] user = joe123 password = somepassword123 server = dev.ndexbio.org
所需的外部工具
将owl文件转换为sif格式需要paxtools。
请下载<强> PaxToals.jar <强>(<HeRF=)http://www-Popas.org/pxTooss/Re="nfOLLoL>"http://www-Popas.org/Paxtools /< /a>(要求Java 8 +)和 放在当前工作目录中,或指定paxtools.jar的路径,并打开paxtools标志 加载nexncipidloader.py用法
有关更多信息,请调用
ndexloadncipid.py-h
示例用法
本例假设工作目录中有一个paxtools.jar的有效配置文件。
ndexloadncipid.py sif
已下载SIF文件的示例用法
本例假设一个有效的配置文件,并且sif文件位于
sif/
目录中
ndexloadncipid.py --skipdownload sif
通过Docker
示例用法
这个示例 paxtools.jar 位于当前目录中,并且 文件已在当前工作目录中创建并命名为NF
docker run -v `pwd`:`pwd` -w `pwd` coleslawndex/ndexncipidloader:3.0.0 ndexloadncipid.py --paxtools `pwd`/paxtools.jar --conf conf sif
学分
这个包是用cookiecutter和项目模板创建的。