基于序列数据的动态异构剪接估计器
diceseq的Python项目详细描述
关于diceseq
DiceSeq(通过序列数据的动态异构剪接估计器)估计 时间序列rna序列实验中异型态比例的动态变化。 DISESEQ是基于混合比例的混合模型的贝叶斯方法 表示异构体比率。它包含了来自时间的关联 结构,通过在不同时间通过 潜在高斯过程。
DiceSeq通过命令行提供以下功能:
- diceseq:估计时间序列数据的异构比例和fpkm 共同的,或一个时间点的。
- dice-count:获取整个基因的读取计数,或特定的读取计数, 例如,junction读,对于只有一个内含子的基因。这是特殊设计 主要用于酵母。
- dice-bias:估计测序偏差的参数,包括片段 长度分布、读取顺序和位置偏差参数。输出 文件可直接用于diceseq中的偏差校正。
此外,diceseq包还提供了一组函数和 属性作为面向对象的python模块。因此,你可以用一些 例如,SampleFile以可视化 高斯处理方式,或者BiasFile来可视化偏差参数。也, gtf_utils提供了一组加载gtf文件、选择基因或 自定义外显子和内含子的坐标,添加和删除 抄本。
快速启动
环境和安装:
diceseq最初是在python 2环境中开发的,因此最好使用 在PY2环境中。通过使用Anaconda平台,不管py2还是py 3,它都是 使用py2很容易设置conda环境,例如遵循commond:
conda create -n dicePy2 python=2.7 numpy==1.15.4 scipy==1.1.0 matplotlib==2.2.3 pysam==0.15.2 source activate dicePy2
在Python2环境中,通常有两种方法可以将 套餐:
- pip install diceseq
- 或者下载此存储库,并键入python setup.py install。
- 如果没有根权限,则可能需要添加--user。 环境。
参数
- 键入命令行diceseq -h
详细手册
请参阅documentation中有关如何安装、使用和查找注释数据的内容 等
参考文献
黄远华和圭多血气方刚。Statistical modeling of isoform splicing dynamics from RNA-seq time series data。 生物信息学,2016,32(19):2965-2972。