命令行工具,用于制作漂亮且可复制的基因组浏览器快照
pyGenomeTracks的Python项目详细描述
pygenometracks
绘制美丽基因组浏览器轨迹的独立程序和库
pygenometracks的目标是产生高质量的基因组浏览器跟踪 高度可定制。目前,可以绘制:
- 大人物
- 床/GTF(多种选择)
- 床形图
- 外延
- 窄峰
- 链接(表示为弧)
- hi-c矩阵
pygenometrack可以绘制带有或不带有hi-c数据的图。下面是来自ramírez等人的pygenometracks输出示例。2017
安装
pygenometracks与python一起工作>;=3.6。
目前,安装pygenometracks的最佳方法是使用anaconda
$ conda install -c bioconda pygenometracks
此外,pygenometracks可以使用pip安装
$ pip install pyGenomeTracks
如果要安装最新版本,请使用:
$ pip install git+https://github.com/deeptools/pyGenomeTracks.git
用法
要运行pygenometracks,需要一个描述跟踪的配置文件。创建此文件的最简单方法是使用程序make_tracks_file
创建配置文件
可以轻松更改的默认值。格式为:
$ make_tracks_file --trackFiles <file1.bed> <file2.bw> ... -o tracks.ini
制作曲目文件
使用文件结尾猜测文件类型。
然后,可以使用以下命令绘制区域:
$ pyGenomeTracks --tracks tracks.ini --region chr2:10,000,000-11,000,000 --outFileName nice_image.pdf
结束--outfilename
定义图像格式。如果使用.pdf
,则生成的图像为pdf。选项包括pdf、png和svg。
引文
如果在分析中使用pygenometracks,可以引用以下文章:
菲德尔·拉米雷斯、维韦克·巴尔德瓦、劳拉·阿里戈尼、林建忠、比约恩·A·格吕宁、何塞·维拉维克斯、比安卡·哈贝曼、阿西法·阿克塔和托马斯·曼克。高分辨率tads揭示了苍蝇基因组结构的dna序列。《自然通信》(2018年)doi:10.1038/s41467-017-02525-w
示例
(这些示例可在examples/
文件夹中找到)
一个包含单个bigwig轨迹的配置文件的最小示例如下:
[bigwig file test]file=bigwig.bw# height of the track in cm (optional value)height=4title=bigwigmin_value=0max_value=30
$ pyGenomeTracks --tracks bigwig_track.ini --region X:2,500,000-3,000,000 -o bigwig.png
现在,让我们添加基因组位置和一些基因:
[bigwig file test]file=bigwig.bw# height of the track in cm (optional value)height=4title=bigwigmin_value=0max_value=30[spacer]# this simply adds an small space between the two tracks.[genes]file=genes.bed.gzheight=7title=genesfontsize=10file_type=bedgene rows=10[x-axis]fontsize=10
$ pyGenomeTracks --tracks bigwig_with_genes.ini --region X:2,800,000-3,100,000 -o bigwig_with_genes.png
现在,我们将在所有轨道上添加一些垂直线。垂直线应为床格式。
$ conda install -c bioconda pygenometracks0
$ conda install -c bioconda pygenometracks1
您也可以覆盖有或没有透明度的大人物。
$ conda install -c bioconda pygenometracks2
$ conda install -c bioconda pygenometracks3
具有峰值的示例
pygenometracks可以选择使用macs2窄峰格式绘制峰值。
下面是峰值形状为 根据峰的起点、终点、顶点和高度绘制。
$ conda install -c bioconda pygenometracks4
具有HI-C数据的示例
下面是一个具有拓扑关联域(TADS)和bigwig文件的HI-C数据覆盖的示例。
$ conda install -c bioconda pygenometracks5
$ conda install -c bioconda pygenometracks6
带有epilogos的示例
pygenometrack可用于将表观遗传状态(例如从chromhmm)可视化为表观遗传。有关更多信息,请参见:https://epilogos.altiusinstitute.org/
要绘制epilogos,需要一个qcat
文件。此文件可以使用epilogos软件打包(https://github.com/altius/epilogos)。
epilogos的跟踪文件示例如下:
$ conda install -c bioconda pygenometracks7
可以使用json
文件设置条形图的颜色。文件的结构如下
$ conda install -c bioconda pygenometracks8
在下面的示例中,顶部epiLogo具有自定义颜色,下面的一个显示为反向。
$ conda install -c bioconda pygenometracks9
具有多个选项的示例
在我们的自动测试中,可以找到一个完整的pygenometrack示例。
请注意,pygenome跟踪还允许使用参数将多个跟踪合并为一个跟踪:overlay previous=yes
或overlay previous=share-y
。
在第二个选项中,覆盖的轨迹的y轴与正在覆盖的轨迹相同。多个曲目可以叠加在一起。
具有多个bigwig轨迹选项的示例
具有HI-C数据的示例
在这些示例中,覆盖轨迹更有用。注意,任何轨道都可以覆盖在HI-C MA上特里克斯最有用的方法是使用三角形覆盖tads或覆盖链接
它将在hi-c矩阵中指向与链接接触的像素。当覆盖链接和tads时,可以设置
overlay previous=share-y
以便两个轨迹匹配位置。这不是
当覆盖其他类型的数据(如具有不同Y刻度的Bigwig文件)时需要。
添加新曲目
向pygenometracks添加新曲目只需要向pygenometracks/tracks
文件夹添加一个新类。
该类应继承genometrack
(或其他可用的track类),并应具有plot
方法。
此外,还应添加一些基本说明。
例如,要制作一个在给定位置打印"hello world"的轨迹,如下所示:
$ pip install pyGenomeTracks0
options_txt应该包含构建默认配置文件的文本。 此信息与支持的结尾信息一起使用 通过程序创建默认配置文件 基于给定文件的结尾。
配置文件是:
$ pip install pyGenomeTracks1
$ pip install pyGenomeTracks2
注意,生成的轨迹已经包含一个y轴(在左侧)和
右边的标签。这是可以更改的默认值
添加plot_y_轴
和plot_标签
方法。
另一个更复杂的例子是将多个床状图数据绘制为矩阵。hicexplorer hicfindtads的输出产生一种数据格式 类似于bedGraph,但具有更多的值列。我们称之为床图矩阵。下面的轨迹图绘制此床形矩阵:
$ pip install pyGenomeTracks3
让我们为此创建一个曲目:
$ pip install pyGenomeTracks4
$ pip install pyGenomeTracks5
尽管这张图片看起来很有趣
数据是一条重叠的线,平均值突出显示。
使用pygenometracks的bedGraph版本
可获得:
pygenometracks由hiexporer和hicbrowser使用。使用HicBrowser制作)