emase:等位基因特异性表达的期望最大化算法

emase的Python项目详细描述


等位基因特异性表达的期望最大化算法

Narayanan Raghupathy、Kwangbom Choi、Steve Munger和Gary Churchill

  • 免费软件:GNU通用公共许可v3(GPLV3)
  • 文档:https://emase.readthedocs.org rel="nofollow">https://emase.readthedocs.org

注意:Emase的文档仍在工作中。

什么是Emase?

emase是一个用python编写的软件程序,用于量化特定等位基因 从rna序列数据同时表达和基因表达。Emase接受 作为输入的二倍体转录组比对bam文件和gtf文件 使用以下方法估计每个亚型和每个等位基因的表达丰度 期望最大化算法。

为什么使用emase?

目前的rna序列分析管道采用两个步骤来量化基因表达。 和等位基因特异性表达(ase);基因表达由所有 读取对齐,而ase则通过使用 重叠已知的SNP位置。

大规模的基因组测序工作已经使数百万的基因 人类和模式生物中的变种。但是工具的开发 能有效利用个体/菌株的特异性变异来告知 基因表达丰度的定量研究滞后。

emase与g2gtools(https://github.com/churchill-lab/g2gtools" rel="nofollow">https://github.com/churchill lab/g2gtools)一起提供了一个集成的 利用已知遗传变异量化等位基因表达丰度的方法 以及基因/亚型水平。

在模式生物的f1杂种中,emase允许我们利用亲本 rna序列分析中的菌株特异性遗传变异 同时表达和等位基因特异性表达(ase)

在人类中,emase允许我们利用个体的遗传变异 进行个性化的rna序列分析和量化基因表达 等位基因特异性表达(ase)同时进行

简而言之,emase:em用于等位基因的特异表达,使用个体化二倍体 根据已知的遗传变异和数量调整的基因组/转录体 等位基因特异性基因表达与总基因表达同步。EM Emase模型中使用的算法在基因、亚型和 等位基因和概率分配。

早些时候,我们开发seqnature来利用已知的遗传变异,bot snps 和indels,建立独立的基因组并调整注释毫微秒。一个人可以用 seqnature创建个体化的二倍体transcritpme并对齐rna seq-reads 同时到二倍体转录组并在bam中获得比对文件 格式。这个二倍体bam文件可以用作emase的输入。

应用程序

模式生物f1代杂种等位基因特异性基因表达

如果我们有一个带有亲本遗传变异信息的f1杂种,人们可以使用 建立菌株特异性基因组并提取二倍体转录组。 将rna序列读取到二倍体获得的rna序列比对bam文件 转录组用作emase的输入。

人的个性化ase分析

emase可用于人类个体化rna序列分析。为此,我们使用阶段性基因 变异(snp和indel)信息,用于构建个性化的二倍体基因组并将读取的内容与二倍体转录组对齐。

在f1杂种中使用chip-seq进行等位基因特异性结合

尽管我们解释了用emase定量等位基因特异性表达 从rna序列数据来看,该工具可以与其他类型的测序数据一起使用。我们 已经成功地使用emase从芯片序列量化等位基因特异性结合 数据。使用芯片序列时,需要使用二倍体结合靶序列 而不是二倍体转录体,用于对齐目标序列。

挖掘二倍体排列和排列概率

除了运行emase和 获得每个等位基因和亚型的有效读数。例如,我们可以使用emase的计数对齐 为每个基因在等位基因水平上获得唯一读取的程序,基因唯一读取但等位基因水平多重读取, 与每个基因对齐的读取总数。对每一种亚型和基因都有这些排列统计 可用于解释来自emase的表达式估计。

参考文献

  • Emase:等位基因特异性表达的期望最大化算法,Narayanan Raghupathy,Kwangbom Choi,Steve Munger和Gary Churchill,手稿准备中。
  • [与个体基因组的rna序列比对提高了多配居群中转录丰度的估计]( http://www.genetics.org/content/198/1/59.short )Steven C.Munger,Narayanan Raghupathy,Kwangbom Choi,AlleN K.Simons、Daniel M.Gatti、Douglas A.Hinerfeld、Karen L.Svenson、Mark P.Keller、Alan D.Attie、Matthew A.Hibbs、Joel H.Graber、Elissa J.Chesler和Gary A.Churchill。遗传学。2014年9月;198(1):59-73。doi:10.1534/genetics.114.165886.
  • 【PRDM9通过单倍型特异的减数分裂重组启动,驱动小家鼠热点的进化侵蚀】( http://journals.plos.org/plosgenetics/article?id=10.1371/journal.pgen.1004916 )克里斯托弗·L·贝克、Shimpei Kajita、迈克尔·沃克、露丝·L·萨克斯、纳拉亚南·拉格赫帕西、光邦·崔、佩特科·M·佩特科夫、肯尼斯·佩根·普洛斯遗传学:2015年1月8日出版。信息:doi/10.1371/journal.pgen.1004916

欢迎加入QQ群-->: 979659372 Python中文网_新手群

推荐PyPI第三方库


热门话题
netbeans根据命名约定返回布尔类的getter的Java名称   java如何在MessageFormat中使用单引号   java如何在整数数组中只对奇数排序,而将偶数保留在其原始位置?   自定义ArrayAdapter中未定义java构造函数   java joda时间格式化程序解析yyyyymmdd(额外一小时)   java Spring引导控制器测试始终返回404   java如何提取类文件以获取该类文件中的类?   JTable java列不会显示   java Selenium Web驱动程序输出错误的Web表行数   当应用程序在mac上打开时,java SWT选项卡项会从页面上消失   java如何将html文件映射到过滤器   swing Java计算一段时间内两点之间的转换   javawebsphere和javax。xml。ws。spi。提供者:提供者组织。阿帕奇。axis2。jaxws。spi。提供者不是子类型   For循环在Java中没有按预期继续?   java如何配置gson以排除0个整数值   java读取一个由tab分隔的文件,并将单词放入ArrayList中   java我需要做什么才能让LiveConnect重新工作?   sqlservermerge2xml&使用java提取这些数据并将其存储在db表中   java如何在模型中添加新对象时通知网格