molnetenhancer的python实现

pyMolNetEnhancer的Python项目详细描述


Pymolnetenhancer

pymolnetenhancer是一个python模块,它在质谱分子网络中集成了化学类和子结构信息,这些信息是通过全球自然产品社会分子网络(gnps)平台创建的。类似的R包可在https://github.com/madeleineernst/rmolnetenhancer" rel="nofollow">https://github.com/madeleineernst/rmolnetenhancer上找到。

目录

  • 安装
  • 将ms2lda子结构信息映射到质谱分子网络(经典)
  • 将ms2lda子结构信息映射到质谱分子网络(基于特征)
  • 将化学类信息映射到质谱分子网络
  • 将化学类和ms2lda亚结构信息映射到质谱分子网络
  • 依赖关系
  • 主要引文
  • 其他引文
  • 许可证

安装

使用以下命令安装PymolnetEnhancer:

pip安装pymolnetenhancer

将ms2lda子结构信息映射到质谱分子网络(经典)

为了将子结构信息映射到质谱分子网络,您需要:

然后逐行执行example_notebooks/mass2motifs_2_network_classic.ipynb中的代码。 您只需要指定以下内容:

  1. 你的GNPS工作ID
  2. 你的MS2LDA作业ID 注意:根据此文件的大小,可能会发生服务器连接超时。或者,您可以在http://ms2lda.org/上手动下载该文件:
  3. 用于将mass2motifs映射到网络的用户定义参数 prob:包含mass2motif的最小概率分数。默认值为0.01。< BR>重叠:包含Mass2motif的最小重叠分数。默认值为0.3。< BR>重要信息:概率和重叠阈值可以在ms2lda.org应用程序以及"实验选项"选项卡下设置。建议在Web应用程序中检查结果时执行此操作。重要的是,摘要表包含使用set thre在Web应用程序中显示。< BR>top:此参数指定每个分子家族(网络成分索引)应显示多少个最共享的基序。默认值为5。
  4. < > >

    若要可视化结果,请将.graphml输出文件导入到cytoscape中。要基于节点之间的共享mass2motifs为边着色,请在左侧的"边"选项卡中选择"笔划颜色",并选择"交互"作为,选择"离散映射"作为映射类型

    要按每个分子族(网络组件索引)中共享最多的mass2motifs对节点进行着色,请在左侧的"节点"选项卡中选择"图像/图表",并在边缘表中选择"topsharedmotifs"中显示的mass2motifs:

    或者,边缘和节点输出文件也可以单独加载到cytoscape中。为此,将"mass2motifs_edges_classic.tsv"输出文件作为网络导入到cytoscape中。选择"clusterid1"列作为源节点,选择"interact"列作为交互类型,选择"clusterid2"列作为目标节点:

    然后将"mass2motifs_nodes_classic.tsv"输出文件导入为表:

    将ms2lda子结构信息映射到质谱分子网络(基于特征)

    为了将子结构信息映射到通过基于特征的工作流创建的质谱分子网络,您需要:

    然后逐行执行example\u notebooks/mass2motifs\u 2u network\u featurebased.ipynb中的代码。 您只需要指定以下内容:

    1. 你的GNPS工作ID
    2. 你的MS2LDA作业ID 注意:根据此文件的大小,可能会发生服务器连接超时。或者,您可以在http://ms2lda.org/上手动下载该文件:
    3. 用于将mass2motifs映射到网络的用户定义参数 prob:包含mass2motif的最小概率分数。默认值为0.01。< BR>重叠:包含Mass2motif的最小重叠分数。默认值为0.3。< BR>重要信息:概率和重叠阈值可以在ms2lda.org应用程序中以及在实验选项下设置S标签。建议在Web应用程序中检查结果时执行此操作。重要的是,摘要表包含使用web应用程序中设置的阈值筛选的motif文档关系。< BR>top:此参数指定每个分子家族(网络成分索引)应显示多少个最共享的基序。默认值为5。
    4. < > >

      若要可视化结果,请将.graphml输出文件导入到cytoscape中。要基于节点之间的共享mass2motifs为边着色,请在左侧的"边"选项卡中选择"笔划颜色",并选择"交互"作为,选择"离散映射"作为映射类型

      要按每个分子族(网络组件索引)中共享最多的mass2motifs对节点进行着色,请在左侧的"节点"选项卡中选择"图像/图表",并在边缘表中选择"topsharedmotifs"中显示的mass2motifs:

      或者,边缘和节点输出文件也可以单独加载到cytoscape中。为此,将"mass2motifs_edges_classic.tsv"输出文件作为网络导入到cytoscape中。选择"clusterid1"列作为源节点,选择"interact"列作为交互类型,选择"clusterid2"列作为目标节点:

      然后将"mass2motifs_nodes_classic.tsv"输出文件导入为表:

      将化学类信息映射到质谱分子网络

      为了将化学类信息映射到质谱分子网络,您需要:

      然后执行example_notebooks/chemicalclasses_2_network_classic.ipynbexample_notebooks/chemicalclasses_2_network_featurebased.ipynb逐行。 您只需要指定以下内容:

      1. 你的GNPS工作ID
      2. 您的Dereplicator作业ID
      3. 您的午睡作业ID
      4. < > >

        您可以在silico注释输出中指定任意数量的。如果从不同于NAP或Dereplicator的应用程序导入结果,请确保输入文件是Tab Separa包括一个名为"scan"的列,其中包含与gnps网络中的数字节点标识符匹配的数字标识符,以及一个名为"smiles"的列,其中包含smiles结构。 确保将所有结果作为数据帧列表项包含在"matches"对象中。对象"gnpslib"包含所有gnps库点击:

        匹配=[gnpslib,nap,derep]

        在这个笔记本中,我们使用chemaxon的molconvert将微笑转换成inchikeys。您可以在这里下载Chemaxon的Marvin的独立于平台的版本。确保安装了molconvert并将路径添加到环境:

        path = '/Applications/MarvinSuite/bin/'
        os.environ['PATH'] += ':'+path
        

        若要可视化结果,请将.graphml输出文件导入到cytoscape中。要基于化学子类给节点上色,请在左侧的"节点"选项卡中选择"填充颜色",然后选择"cf_subclass"作为,选择"离散映射"作为映射类型

        要根据化学子类给节点上色,请在左侧的"节点"选项卡中选择"填充颜色",并选择"cf_subclass_score"作为,选择"Continuous mapping"作为映射类型

        与化学类信息相关的所有列都标有"cf",并且化学分类法的其他层次级别的化学类信息可以类似地映射(例如cf_superclass、cf_superclass_score、cf_class等)。.txt输出文件也可以作为表导入到cytoscape中已经存在的网络中。

        将化学类和ms2lda亚结构信息映射到质谱分子网络

        为了将化学类和ms2lda子结构信息映射到质谱分子网络,请按照将ms2lda子结构信息映射到质谱分子网络(classic)中描述的步骤将化学类信息映射到质谱分子网络 对于经典分子网络和步骤,请将ms2lda子结构信息映射到质谱分子网络(基于特征)和映射到化学类质谱分子网络信息用于基于特征的分子网络。要创建包含Mass2motif和化学类信息的GraphML文件,请执行以下操作:

        graphML_classy = make_classyfire_graphml(MG,final)
        nx.write_graphml(graphML_classy, "Motif_ChemicalClass_Network_Classical.graphml", infer_numeric_types = True)
        

        其中"mg"对应于映射mass2motifs的网络,"final"对应于映射化学类信息时创建的数据帧输出。示例如example_notebooks/mass2motifs_2_network_classic.ipynbexample_notebooks/mass2motifs_2_network_featurebased.ipynb。要在细胞景观中可视化网络,请按照将ms2lda子结构信息映射到质谱分子网络(classic)映射化学类信息中所述进行。到质谱分子网络 对于经典的分子网络和步骤,请参见="nofollow">将ms2lda子结构信息映射到质谱分子网络(基于特征)和将化学类信息映射到质谱分子网络(基于特征的分子网络)。

        依赖关系

        python 3.6.5,集合0.6.1,csv 1.0,functools,joblib 0.13.0,json 2.0.9,多处理,networkx 2.1,operator,os,pandas 0.22.0,rdkit,re 2.2.1,请求2.18.4,sys,time

        主要引文

        https://www.biorxiv.org/content/10.1101/654459v1
        https://github.com/madeleineernst/pymolnetenhancer

        其他引文

        molnetenhancer通过gnps使用分子网络:
        Wang,M.;Carver,J.J.;Phelan,V.V.;Sanchez,L.M.;Garg,N.;Peng,Y.;Nguyen,D.D.;Watrous,J.;Kapono,C.A.;Luzzatto Knaan,T.;等人。与全球自然产品社会分子网络共享和社区管理质谱数据。NAT生物技术2016年,第34(8),828–837页。
        https://www.nature.com/articles/nbt.3597

        MolnetEnhancer通过MS2LDA使用无目标的子结构勘探:
        van der Hooft,J.J.J.;Wandy,J.;Barrett,M.P.;Burgess,K.E.V.;Rogers,S.《代谢组学中非目标子结构探索的主题建模》。PNAS 2016,113(48),13738-13743。 https://www.pnas.org/content/113/48/13738

        molnetenhancer使用网络注释传播(nap):
        Da Silva,R.R.;Wang,M.;Nothias,L.-F.;Van der Hooft,J.J.J.;Caraballo Rodríguez,A.M.;Fox,E.;Balunas,M.J.;Klassen,J.L.;Lopes,N.P.;Dorrestein,P.C.。硅碎片中使用的分子网络传播注释。公共科学图书馆计算。Bio.2018年,14(4),E1006089。 http://journals.plos.org/ploscopbiol/article?网址:http://journals.plos.org/ploscopbiol/article?id=10.1371/journal.pcbi.1006089

        molnetenhancer使用dereplicator:
        Mohimani,H.;Gurevich,A.;Mikheenko,A.;Garg,N.;Nothias,L.-F.;Ninomiya,A.;Takada,K.;Dorrestein,P.C.;Pevzner,P.A.。通过质谱数据库搜索肽天然产物的应用。NAT化学。Bio.2017年,13日,30-37日。 https://www.nature.com/articles/nchembio.2219

        Molnetenhancer通过ClassyFire使用自动化学分类:
        Feunang,Y.D.;Eisner,R.;Knox,C.;Chepelev,L.;Hastings,J.;Owen,G.;Fahy,E.;Steinbeck,C.;Subramanian,S.;Bolton,E.;Greiner,R.;Wishart,D.S.ClassyFire:自动化学分类法,具有全面、可计算的分类法。J.化学信息。2016, 8, 61。 https://jcheminf.biomedcentral.com/articles/10.1186/s13321-016-0174-y

        许可证

        此存储库在以下许可证下可用:https://github.com/madeleineernst/pymolnetenhancer/blob/master/license" rel="nofollow">https://github.com/madeleineernst/pymolnetenhancer/blob/master/license

        欢迎加入QQ群-->: 979659372 Python中文网_新手群

        推荐PyPI第三方库


热门话题
virtualbox无法从java移动共享文件夹中的文件   java如何连接Android 4.3.5(GA)的apache HttpClient库?   片段中的java Recyclerview未立即显示警报对话框结果   javac(n,r)计算器程序不工作   java使用BooleanQuery还是编写更多索引?   如何在java中设置y/n循环?   java不兼容的通用通配符捕获   java如何在安卓xml中编写数据绑定时的三元操作条件   java如何使用FileDialog?   java如何创建单元测试来检测是否有人使用错误的编码编辑了文件?   java如何从唯一的字符串生成唯一的int?   java gradletomcatplugin:log4j:WARN找不到记录器的附加程序   java我的动态编程解决方案(Kefa和第一步)在codeforces中有什么问题?   java每天更新两个数据库,使它们都包含相同的有效数据集   java如何检查给定的时间是否在时间限制之间   java在单个json POST上保存父级和子级   java如何获取Solr字段类型