原始纳米孔测序数据分析。

ont-tombo的Python项目详细描述


Tombo摘要

travis_badge

tombo是一套主要用于从纳米孔测序数据中鉴定修饰核苷酸的工具。

tombo还为原始纳米孔信号的分析和可视化提供了工具。

安装

bioconda_badgepypi_badge

基本的tombo安装(python 2.7和3.4+支持)

# install via bioconda environment
conda install -c bioconda ont-tombo

# or install pip package (numpy install required before tombo for cython optimization)
pip install numpy
pip install ont-tombo[full]

快速启动

这个快速入门指导了使用tombo命令行界面执行一些常见的修改过的基本检测分析的步骤。

任何tombo分析的第一步是重新弯曲(原始信号到参考序列对齐)原始纳米孔读取。这将创建索引并存储执行下游分析所需的信息。

在本例中,对大肠杆菌样品进行dam和dcm甲基化检测(cpg模型也可用于人类分析)。利用这些结果,原始信号被绘制在最显著修改的dcm位置,dam修改的碱基预测被输出到wiggle文件中,用于基因组浏览器中的下游处理或可视化。

tombo resquiggle path/to/fast5s/ genome.fasta --processes 4 --num-most-common-errors 5
tombo detect_modifications alternative_model --fast5-basedirs path/to/fast5s/ \
    --statistics-file-basename native.e_coli_sample \
    --alternate-bases dam dcm --processes 4

# plot raw signal at most significant dcm locations
tombo plot most_significant --fast5-basedirs path/to/fast5s/ \
    --statistics-filename native.e_coli_sample.dcm.tombo.stats \
    --plot-standard-model --plot-alternate-model dcm \
    --pdf-filename sample.most_significant_dcm_sites.pdf

# produces wig file with estimated fraction of modified reads at each valid reference site
tombo text_output browser_files --statistics-filename native.e_coli_sample.dam.tombo.stats \
    --file-types dampened_fraction --browser-file-basename native.e_coli_sample.dam
# also produce successfully processed reads coverage file for reference
tombo text_output browser_files --fast5-basedirs path/to/fast5s/ \
    --file-types coverage --browser-file-basename native.e_coli_sample

虽然motif模型(CpGdcmdam;最准确)和所有上下文特定的备用基模型(5mC6mA;更准确)是首选,但tombo还允许用户调查其他甚至未知的基修改。

下面是两个运行de_novo方法(检测与预期cannonical信号电平的偏差)和level_sample_compare方法(检测两个感兴趣样本之间的信号电平偏差;在高覆盖率下最有效)的示例命令。

tombo detect_modifications de_novo --fast5-basedirs path/to/fast5s/ \
    --statistics-file-basename sample.de_novo_detect --processes 4
tombo text_output browser_files --statistics-filename sample.de_novo_detect.tombo.stats \
    --browser-file-basename sample.de_novo_detect --file-types dampened_fraction

tombo detect_modifications level_sample_compare --fast5-basedirs path/to/fast5s/ \
    --control-fast5-basedirs path/to/control/fast5s/ --minimum-test-reads 50 \
    --processes 4 --statistics-file-basename sample.level_samp_comp_detect
tombo text_output browser_files --statistics-filename sample.level_samp_comp_detect.tombo.stats \
    --browser-file-basename sample.level_samp_comp_detect --file-types statistic
See more complete tutorials on the documentation page.

核糖核酸

所有tombo命令也可用于直接rna纳米孔读取,但必须为拼接的转录本提供转录组参考序列。

在tombo框架内处理直接rna读取的技巧可以在详细的tombo文档的RNA section中找到。

其他文档

运行tombo -h查看所有tombo命令组,运行tombo [command-group]-h查看每个组中的所有命令。

所有tombo命令和算法的详细文档可以在tombo documentation page上找到。

引文

Stoiber,M.H.等人通过基因组引导的纳米孔信号处理实现dna修饰的从头鉴定。BioXiV(2016)。

http://biorxiv.org/content/early/2017/04/10/094672

已知问题

  • Tombo Conda环境(尤其是Python2.7)可能存在安装问题。

    • tombo在python 3.4+中工作得最好,因此许多问题可以通过升级python来解决。

    • 如果使用conda安装:

      • Ensure the most recent version of conda is installed (^{tt10}$).
      • It is recommended to set conda channels as described for bioconda.
      • Run ^{tt11}$.
    • 在Python2.7中,conda scipy.stats包有一个问题。降级到0.17版本可以解决此问题。

    • 在Python2.7中,conda h5py包有一个问题。降级到<;=2.7.0版本可以解决此问题。

欢迎加入QQ群-->: 979659372 Python中文网_新手群

推荐PyPI第三方库


热门话题
启动tyrus独立服务器时发生java ClassNotFoundException   标签中的javael评估   JavaTomcat服务器变得缓慢且无响应   java按钮导致Android应用程序“不幸关闭”   java Spring solr动态字段解析   java查看是否刚刚创建了属性文件   仅在我的安卓应用程序中使用java make phonethic键盘   使用孵化的Java10HttpClient重建HTTP流   消息太大时java AppEngine任务队列异常   使用Tomcat和数据存储远程访问器的java内存不足   如何在Java中将特定于平台的路径插入数据库的文件   安卓如何在React Native中没有reactContext的情况下从无头JS任务执行Java代码?   java将字符串转换为整数错误   java FileInputStream如何在不替换html图标的情况下读取html文件   okhttp获取java。网SocketException:当使用多线程的okhttpclient时,socket关闭   再次发送sms时gsm At命令显示忙碌(java)   java如何检查值是否至少等于列表中的一个字段?   java如何从后台bean更新jsf数据表   Java:在列表中查找组合日