酵母变异与蛋白质修饰及功能区的自动定位方法

ymap的Python项目详细描述


#YMAP-酵母基因型到表型图谱(2016年发布) < BR>
ymap是一种基于python的快速、健壮的自动化方法,用于将大型酵母变体数据映射到 < BR>
-蛋白质翻译后修饰 < BR>
-蛋白质结构域, < BR>
-蛋白质核苷酸结合区, < BR>
-蛋白质结构区, < BR>
-蛋白质活性和结合位点 < BR>
-蛋白质网络可视化。 < BR>< BR>
ymap中的翻译后修饰是从uniprot和sources等不同的存储库中收集的。
带有注释的ptm,如ptmcode 2.0和ptmfunc,有关更多详细信息,请参见下文。 < BR>
在用户友好的三个步骤中,它生成一个"最终报告"文件来报告所有非同义词
重叠或落在上述蛋白质功能区内的突变。
最终报告还补充了另外两个文件:扩展和可视化ID文件 < BR>
依赖关系 < BR>
ymap取决于: < BR>
巨蟒2.6.x < BR>
巨蟒3.x < BR>
橙色生物信息学(http://pythonhosted.org/orange bioinformatics/安装) < BR>
视频演示
https://www.youtube.com/watch?V=PCMKUWVLRZI型 < BR>
安装 < BR>
pip安装ymap < BR> 用法/用法 < BR>
步骤1:$ydata下载正确执行ymap所需的所有数据 < BR>
第二步:复制并粘贴"变异文件"到当前目录 < BR>
步骤3:$yproteins如果起始文件包含蛋白质水平的突变
(请参见example_variation_file/variation.txt)。 < BR>
第3步:$ygenes如果起始文件包含具有遗传坐标的染色体水平的突变(请参见example _variation文件/mutated _proteins.txt)。 < BR>
第4步:$yweb在biogrid db上生成基于html的突变蛋白质可视化。
(注意:当被要求时,用户需要指定"path/to/biog.txt"作为输入) < BR>< BR>
*要从源代码运行: < BR>
将路径更改为包含ymap.py的目录 < BR>
$python ymap.py-d ydata(步骤1) < BR>
$pyhton ymap.py-p yproteins(步骤3) < BR>
$pyhton ymap.py-g ygenes(步骤3) < BR>
$pyhton ymap.py-w yweb(步骤4) < BR>
内容:
介绍不同类型的数据(在ymap中生成/提供)
介绍所有方法
结果(结果数据介绍)
故障排除 < BR>
数据简介: < BR>
----输入--- < BR>
a-突变(tab separated txt"mutated_proteins.txt")文件包含蛋白质通用名称和突变残基位置
(请按照示例数据中输入文件的确切命名约定,以正确执行ymap;请参见示例数据) < BR>< BR>
---输出---(执行ymap所需的预分析数据) < BR>< BR>
(i)通过执行步骤2从uniprot下载并存储在当前目录中的原始文件。 < BR>< BR>
1-原始格式的uniprot_mod_raw.txt < BR>< BR>
2-yeast id.txt包含酵母ID的文件 < BR>< BR>
3-ptms.txt包含酵母蛋白、ptms位置和ptm类型 < BR>< BR>
4-ptm_id_file.txt;2和3的组合文件。 < BR>< BR>
5-domains.txt酵母蛋白质,结构域开始、结束和名称 < BR>< BR>
6-id_domain.txt;2和5的组合文件。 < BR>< BR>
7-bact.txt包含蛋白质id、结合位点和活性位点
位置 < BR>
8-站点ID.txt组合F是2和7。 < BR>< BR>
9-uniprot_biogrid.txt包含所有具有biogrid id的酵母蛋白 < BR>< BR>
(i-b)从ptmcode和ptmfunc预下载的文件 < BR>
(ptmfunc) < BR>
3did_aceksite_interfaceres_sc.txt网站 < BR>
3did_phosphosites_interfaceres_sc.txt < BR>
3id_ubisites_interfacerescc_sc.txt < BR>
sc_psites_interactions_sc.txt < BR>
sc_ubi_interactions_sc.txt < BR>
sc_acet_interactions.txt < BR>
(ptmcode) < BR>
schotspot.txt文件 < BR>
sc_btw_proteins.txt < BR>
sc_in_proteins.txt中 < BR>< BR>< BR>
(ii)通过执行步骤2处理来自uniprot和其他资源的数据。 < BR>
一些文件是从原始uniprot文件中生成的,用于进一步分析: < BR>
ptms.txt文件
包含翻译后修改 < BR>
ptm_id_file.txt
ptms.txt,包含所有蛋白质ID < BR> PDB.txt
包含来自uniprot的pdb结构数据 < BR>
核苷酸.txt
包含dna蛋白质结合基序 < BR>
返回.txt
包含蛋白质的活性和结合位置 < BR>
d_id_map.txt
包含所有ID的蛋白质结构域 < BR>
id_domain.txt
frmt.txt中的gff数据以及所有ID < BR>
域.txt
来自uniprot的域数据 < BR>
frmt.txt文件
格式化gff文件以供进一步处理 < BR>
站点id.xt
具有所有ID的活动/绑定站点 < BR>
unipro_biogrid.txt
含有所有酵母蛋白的生物除虫剂 < BR>
核苷酸.txt
具有dna结合基序的蛋白质(uniprot)id < BR>
id_核苷酸.txt
包含来自核苷酸的数据以及用于处理的所有蛋白质ID < BR>
结果 < BR>
(在ymap results文件夹中,每个子文件夹包含三个文件,一个带有突变分析文件,其中包括突变蛋白质、突变位置、突变功能区和数据源、途径富集的pValue.txt和对应突变蛋白质的biog.txt) < BR>
/ptms/突变蛋白.txt
包含在ptms位点突变的蛋白质id < BR>
/域/域映射.txt
含有蛋白质结构域突变的蛋白质 < BR>
/a-b_binding/ab_variation_file.txt
含有在活性和结合时突变的蛋白质 < BR>< BR>
ppi-ptmfunc数据 < BR>
ppi/乙酰化
ptm型含残渣在ppi中很重要 < BR>
ppi/磷酸化
ptm型含残渣在ppi中很重要 < BR>
ppi/泛素化
ptm型含残渣在ppi中很重要 < BR>
接口 < BR>
界面/泛素化
ptm型含蛋白质界面残留 < BR>
界面/乙酰化
ptm型含蛋白质界面残留 < BR>
界面/磷酸化
ptm型含蛋白质界面残留 < BR>
PTMS U热点
Beltrao等人将ptms集中在一个称为hopspot的小基序中。单元2012。 < BR>
蛋白质之间的ptms-ptmcode2.0数据
ptms存在于两种蛋白质之间,参与串扰。 < BR>
ptms-witnin-u蛋白
ptms存在于蛋白质中,并参与串扰。 < BR>
biog.txt
包含用于-w web函数的蛋白质biogrid id(此文件存在于每个子文件夹中)。 < BR>
p-value.txt文件
包含观察到的每种突变类型的路径丰富信息(此文件存在于每个子文件夹中)。 < BR>
最终报告.txt
它是summary.txt的精炼版本,包含蛋白质uniprot i d、通用名称、氨基酸突变位置、野生型氨基酸、突变氨基酸、突变类型(非同义/终止密码子)、突变特征类型(即ptm类型或域名等)、突变特征(即ptms、domain或其他)和数据源(例如unpt) < BR>< BR>< BR>
简介所有的方法
(个别方法在ymap中的工作原理) < BR>
注意:将包含文件的突变名称更改为"mutated_proteins.txt"(参见示例数据),并复制到cd path/to/ymap < BR>< BR>
函数名称描述 < BR>
突变类型@file()突变类型和氨基酸变化计算(已知参考和突变碱基) < BR>
ptmdata()
将upiprot数据下载为原始txt文件(uniprot_mod_raw.txt) < BR>
清除()
将文件"uniprot_mod_raw.txt"清除为一个标签,标签之间用"ptms.txt"隔开 < BR>
ID-()
此方法检索用于映射的不同ID类型(yeastid.txt) < BR>
PMAP-()
如果蛋白质id不是sdg或uniprot或公共名称,则此方法映射id < BR>
ptm_map()
该方法将先前方法中突变密码子之间的重叠映射到ptm位点 < BR>
清洁()
在映射域之前,需要从uniprot文件中筛选域数据
DY-MAP()
将突变映射到酵母结构域(id_domain.txt) < BR>
DAMP()
将突变映射到蛋白质结构域(domains_mapped.txt) < BR>
丰富()
该方法对突变蛋白进行富集分析,并返回功能富集的p值
不同功能区/残基处的突变蛋白质;关于如何计算pValue,请参见正文。
()
为酵母活性位点和结合位点突变分析(bact.txt)准备原始uniprot数据(uniprot_mod_raw.txt) < BR>
ID-()
将蛋白质id映射到包含蛋白质的活性和结合位点(sites_id.txt) < BR>
MAMP()
将突变映射到蛋白质活性位点和结合位点(ab_variation_file.txt) < BR>
核苷酸()
为定位到突变的核苷酸基序准备uniprot数据 < BR>
n*图()
将不同的蛋白质id映射到核苷酸数据 < BR>
核苷酸图()
将突变映射到核苷酸结合基序 < BR>
生物网格()
从uniprot下载酵母蛋白的biogrid id以进行进一步处理,包括映射和网络浏览
警告:由于在内存不足的机器中打开成本高昂,因此需要使用功能强大的机器。 < BR>
预web()
将突变映射到biogrid id(biog.txt) < BR>
bweb()在浏览器中打开biogrid数据库,其中包含与突变蛋白质一样多的选项卡 < BR>
pdb_c()从uniprot中过滤结构数据 < BR>
mu_map()突变蛋白映射到yeastid文件 < BR>
pdb()此代码将突变映射到蛋白质结构区域 < BR>
interface()ptm存在于两种蛋白质的界面,已知在相互作用中起作用(Beltrao等人单元2012) < BR>
ppi()ptm存在于两种蛋白质的界面,已知在相互作用中起作用(Beltrao等人单元2012) < BR>
在贝克年代,inpro()ptms(预测)参与给定蛋白质内的串扰(minguez el 2012) < BR>
贝克年代参与不同蛋白质串扰的ptms(预测)(ptmcode 2.0;minguez el 2012) < BR>
hotspot()ptm包含的基序非常接近,称为热点(beltrao et al.单元2012) < BR>
故障排除 < BR>< BR>
1-带注释的PTM文件丢失或少于9个。 < BR>
原因:解压data/ptmcode+ptmfunc_data/sc_btw_proteins.txt.zip在$ydata命令中不起作用。
如何更正:手动解压缩sc_btw_proteins.txt.zip文件并运行$ydata(通常不需要) < BR>
2-$ygenes给出错误消息: < BR>
"索引器错误:字符串索引超出范围" < BR>
2(b)-同样的原因(如下)导致突变无法映射到不同的功能区域,如域: < BR>
"错误:输入文件包含brr2蛋白质的错误位置" < BR>
原因:突变的位置不在各自prot的起始和结束处EIN(注:分析
起始文件中的蛋白质具有正确的突变位置,用户可以使用单独的方法uniprot_data()
和functional_data(),完成所有分析,然后执行命令行步骤3) < BR>
如何纠正:观察突变的位置,如果它们对应于起始和结束,则手动进行比较
蛋白质的位置,如果不是,请更正问题并重新运行$ygenes命令。 < BR>
3-yweb找不到目录。 < BR>
如何更正:在Python2.x中,路径应指定为"path/to/biog.txt",但在Python3.x中,路径没有倒序逗号,
路径/to/biog.txt < BR>< BR>
贡献者 < BR>
http://www.biw.kuleuven.be/csb/ < BR>
这项工作由ku leuven研究基金资助。

欢迎加入QQ群-->: 979659372 Python中文网_新手群

推荐PyPI第三方库


热门话题
java数据结构和算法实现字典   java RecyclerView执行项目单击   php解析数据组织时出错。json。JSONException:值<!java类型的DOCTYPE。无法将lang.String转换为JSONObject(Android)   java无法修复ArrayIndexOutOfBoundsException   是否可以将java转换为java。util。Date()到int?   java J2ME本机Mp3播放器,用于播放大于1.5 MB的Mp3文件   java如何在JAXWS web服务上抛出自定义错误?   在Graphstream中检索鼠标单击的图形   java Servlet不显示来自数据库的图像   使用Jackson框架的@RequestBody注释的java Spring引导ObjectMapper   web服务如何查看为Java程序生成的SOAP请求和响应   java打印出三维数组并得到组合的整数值   使用ExtentReports打印Arraylist时发生java错误   java如何在历史日期运行oozie?   java LIBGDX:SpriteBatch draw未在iOS上绘制   java如何将两个具有一些公共实体的不同JSON转换为pojo?   java JPA/Hibernate试图在具有复合Id(和双重属性)的实体中存储太多参数   java如何使用@Resource注册bean