一个python库,用于检索基因的功能注释和分析遗传变异的影响,目前主要关注蛋白质编码基因的蛋白质组数据。

geneffect的Python项目详细描述


什么是基因效应?
-------

它允许您在基因/蛋白质水平上推断遗传变异的功能效应。



基本用法
——


geneffect_setup=geneffect.setup('grch38')
[这可能需要几分钟…]
>;>;gene_hoxd4,=[geneffect_setup.genes if gene.symbol='hoxd4']
>;>;打印(gene_hoxd4)
<;gene:hoxd4,p09016/<;cdsisoform:enst0000306324.3(chr2(+),2个cds外显子)>;
>;>;>;>;print('基因%s(%s)在染色体%s.'%(gene_hoxd4.symbol,gene_hoxd4.name,gene_hoxd4.canonical_cds_isoform.chromosome))
基因hoxd4(homebox d4)在染色体2上。
>;print('dna序列:%s%gene_-hoxd4.canonical_-cds_-isoform.dna_-seq)
dna序列:ATGGTCTGATGGGTGACTCCAGATGGGCCAGCGAGCCTGCGCGGCTAGGCGCGAGCGGGCGCGCGGCTAGGCGGGCGCGCGCGGGCGCGAGCGCGGGCGCAGGCGCAGGCGCAGCTTCCCGGGGCTCCCAGCGCGCGGCTGGGCGGGCGCGGGCGCGCGCGCGCGCGGGCGCGCGCGCGCGCGCGCGCGCGGGCGCGCGCGCGCGCGCGCGCGCGCGCGCGCGCGCGCGCGGGCGCGCGCGCGCGGGCGCGCGCGCGCGCGCGCGCGCGCGCGCGCGCGCGCGCGCGCGCGCGCGCGCGCGCGCGCGCGCGCGCGCGGGCGCGCGCGCGCGCGCGCGCGCGCGCGCGCGCGCGCGCGCGCGCGCGGCGCCGCGCGCCCCTGCGGCCGCGCGCGCGCGCGCGCGCGCGTCGTCAGTCGACCAGCCGCGCGCGCGCGCGCGCGTCCGTGCGCGAGAGAGGAGAGAGAGAGAGAGATGCGCGCGCGAAGAGAGAGAGAGAGATGCGCGCGCGAAGAGAGGCGCGCGCGCGCGCGCGAAGATCCAGAGAGAGAGATGCGAGCGCGCGCGAAGAGAGAGGCGCGCGCGCGCGCGCGCGCGCGCGAAGAGAGAGATCAAGAtcgttccagaccggaggatgaaggatgaaaaaagataagctcccacacataaggggatccgtcctcttcctctctctctctctcgtccccagccagcataggatccgaaaagccaccacggagcatagtta
>;print('蛋白质序列:%s%gene\u hoxd4.uniprot\u record.seq)
蛋白质序列:MVMSsymvnskyvdpkfpceeylqggylgeqgadyygggaqdqdqdppgglypdfgeqpfgggpgsalpghgqepgghyapappappappapplpgaraysdpkpqpkpsgTalkqpavvhkvhvnsvnnytggepkrsrtaytrqvlelekefhryltrrrrieahtlclserrqiwfnrrmkwkhklpntkgrssssssssvapsqhlqpmakdhhtdlttl
>;>print('cds外显子坐标:%s"%",'.join([%d..%d'(exon.chromoson_start,exon.chromoson_end)for exon in gene_hoxd4.canonical_cds_isoform.cds_exons])
cds外显子坐标:176151634..176152066,176152608..176152939
>;print('uniprot features:%s%gene\u hoxd4.uniprot\u record.raw\u biopython\u record.features)
uniprot features:[seqfeaturelocation(featurelocation(0),exactposition(255)),type='chain',id='pro 0000200210'),seqfeature(featurelocation(exactposition(153),exactposition(213)),type='DNA-结合区')、seqFeature(特征定位(exactPosition(132)、exactPosition(138))、type='Short Sequence Motif')、seqFeature(特征定位(exactPosition(221)、exactPosition(234))、type='compositional-biaded region')、seqFeature(特征定位(exactPosition(122)、exactposition(123)),type='sequence variant',id='var_'),seqfeature(featurelocation(exactposition(141),exactposition(142)),type='sequence conflict')]


您还可以解释snp及其对蛋白质编码基因的影响:
>;snp=geneffect_setup.variant_解释器.process_snp('17',43082434,'g','c')
>;>print(snp)
chr17:43082434g>;c[p38398:r1443g]
>;>print('%s>;%s在chr%s处:%d'%(snp.ref_nt,snp.alt_nt,snp.chromome,snp.chromome_coordinate))
g>;c在chr17:43082434
>;>print('%d基因效应:%s'(len(snp.基因效应),snp.基因效应))
1基因效应:[p38398:r1443g]
>;>snp.基因效应,=snp.基因效应
>;>print(snp.基因效应)
p38398:r1443g
>>>>打印(snp_gene_effect.infected_gene)
<;基因:brca1,p38398/<;cdsisoform:enst0000357654.7(chr17-,22个cds外显子)>;
>>>>打印(snp_gene_effect.is同义(),snp_gene_effect.is_missense(),snp_基因效应。是无意义的())
假真假
>;>print(snp_基因效应。蛋白质坐标,snp_基因效应。cds_坐标,snp_基因效应。相位)
1443 4327 0
>;>print(snp_基因效应。ref_aa,snp_基因效应。alt_aa,snp_基因效应。ref_密码子,snp_gene_effect.alt_密码子)
r g cga-gga




或:


(对于后者,必须手动复制配置文件)




安装后,必须设置配置文件(默认情况下,它是homedir中的.geneffect_config.py文件,或者可以通过设置环境变量geneffect_config_file将其定义为任何其他文件)。默认设置也可在此模块中的default_config.py文件中找到。
只需使用您喜爱的编辑器打开您的配置文件,然后按照其中的说明进行操作。为了使这个软件包工作,您必须从五个不同的数据库(来自ucsc的参考基因组、来自gencode的基因注释、来自genenames的基因元数据、来自uniprot的蛋白质记录以及来自pfam的域注释)下载文件。应在配置文件中正确设置这些下载文件的路径。< BR>

欢迎加入QQ群-->: 979659372 Python中文网_新手群

推荐PyPI第三方库


热门话题
java使用McClickListener单击了什么元素   Java时间戳在Oracle时间戳中不同情况下存储12 PM的奇怪行为   java无法使用事件总线对运行在不同机器上的垂直体进行通信   java Mockserver:收到请求后进行回调   java无法将Json字符串转换为Map<string,Object>   java如何按升序排列输出?   java视图行,带有oracle键。jbo。在SrCategoryParentIterator中找不到键[300100120394155]   javafxmysql连接示例   java正在等待加载完成   java是否可以将同一个有状态会话bean实例注入多个其他会话bean?   java无法让万向节检测离开或进入区域   使用JavaCV和OpenCV的java提供了dyld:lazy符号绑定失败:找不到符号:__sincos_stret   xml解析无法使用Java读取xml文档   java无法更改工具栏的颜色   javaapachesshd和JSCH   java无法在firebase存储中检索图像url   java问题与executeUpdate   同一应用程序中不同活动之间的java SharedReference