原始纳米孔测序数据分析。
ont-tombo的Python项目详细描述
安装
基本的tombo安装(python 2.7和3.4+支持)
# install via bioconda environment conda install -c bioconda ont-tombo # or install pip package (numpy install required before tombo for cython optimization) pip install numpy pip install ont-tombo[full]
快速启动
这个快速入门指导了使用tombo命令行界面执行一些常见的修改过的基本检测分析的步骤。
任何tombo分析的第一步是重新弯曲(原始信号到参考序列对齐)原始纳米孔读取。这将创建索引并存储执行下游分析所需的信息。
在本例中,对大肠杆菌样品进行dam和dcm甲基化检测(cpg模型也可用于人类分析)。利用这些结果,原始信号被绘制在最显著修改的dcm位置,dam修改的碱基预测被输出到wiggle文件中,用于基因组浏览器中的下游处理或可视化。
tombo resquiggle path/to/fast5s/ genome.fasta --processes 4 --num-most-common-errors 5 tombo detect_modifications alternative_model --fast5-basedirs path/to/fast5s/ \ --statistics-file-basename native.e_coli_sample \ --alternate-bases dam dcm --processes 4 # plot raw signal at most significant dcm locations tombo plot most_significant --fast5-basedirs path/to/fast5s/ \ --statistics-filename native.e_coli_sample.dcm.tombo.stats \ --plot-standard-model --plot-alternate-model dcm \ --pdf-filename sample.most_significant_dcm_sites.pdf # produces wig file with estimated fraction of modified reads at each valid reference site tombo text_output browser_files --statistics-filename native.e_coli_sample.dam.tombo.stats \ --file-types dampened_fraction --browser-file-basename native.e_coli_sample.dam # also produce successfully processed reads coverage file for reference tombo text_output browser_files --fast5-basedirs path/to/fast5s/ \ --file-types coverage --browser-file-basename native.e_coli_sample
虽然motif模型(CpG、dcm和dam;最准确)和所有上下文特定的备用基模型(5mC和6mA;更准确)是首选,但tombo还允许用户调查其他甚至未知的基修改。
下面是两个运行de_novo方法(检测与预期cannonical信号电平的偏差)和level_sample_compare方法(检测两个感兴趣样本之间的信号电平偏差;在高覆盖率下最有效)的示例命令。
tombo detect_modifications de_novo --fast5-basedirs path/to/fast5s/ \ --statistics-file-basename sample.de_novo_detect --processes 4 tombo text_output browser_files --statistics-filename sample.de_novo_detect.tombo.stats \ --browser-file-basename sample.de_novo_detect --file-types dampened_fraction tombo detect_modifications level_sample_compare --fast5-basedirs path/to/fast5s/ \ --control-fast5-basedirs path/to/control/fast5s/ --minimum-test-reads 50 \ --processes 4 --statistics-file-basename sample.level_samp_comp_detect tombo text_output browser_files --statistics-filename sample.level_samp_comp_detect.tombo.stats \ --browser-file-basename sample.level_samp_comp_detect --file-types statistic
See more complete tutorials on the documentation page.
其他文档
运行tombo -h查看所有tombo命令组,运行tombo [command-group]-h查看每个组中的所有命令。
所有tombo命令和算法的详细文档可以在tombo documentation page上找到。
引文
Stoiber,M.H.等人通过基因组引导的纳米孔信号处理实现dna修饰的从头鉴定。BioXiV(2016)。
已知问题
Tombo Conda环境(尤其是Python2.7)可能存在安装问题。
tombo在python 3.4+中工作得最好,因此许多问题可以通过升级python来解决。
如果使用conda安装:
- Ensure the most recent version of conda is installed (^{tt10}$).
- It is recommended to set conda channels as described for bioconda.
- Run ^{tt11}$.
在Python2.7中,conda scipy.stats包有一个问题。降级到0.17版本可以解决此问题。
在Python2.7中,conda h5py包有一个问题。降级到<;=2.7.0版本可以解决此问题。