在一个bed或sequence dictfile中分块和分散区域

chunked-scatter的Python项目详细描述


分块散布

此工具以bed文件或序列字典为输入,并将 把染色体连接成一定大小的重叠块。这些块会 然后放入新的床文件,每个文件一个染色体。小染色体 将被放在一起,以避免创建数千个文件。

安装

从github安装:

  • 克隆存储库:git clone https://github.com/biowdl/chunked-scatter.git
  • 输入存储库:cd chunked-scatter
  • 使用pip安装:pip install .

用法

chunked-scatter -p output_prefix -i input.bed

输入应以.bed.dict结尾!

optionargumentsdefinition
-ca numberThe size of the chunks.
-oa numberThe size of the overlap.
-ma numberThe minimum number of bases to be put in a single output file, before a new scatter will be made.

示例

床单

给定位于/data/regions.bed

的床文件
chr1	100	1000
chr1	2000	16000
chr2	5000	10000

命令:

chunked-scatter -p /data/scatter_ -i /data/regions.bed -m 1000 -c 5000

将生成以下两个输出文件:

  • /data/scatter_0.bed
    chr1	100	1000
    chr1	2000	7000
    chr1	6850	12000
    chr1	11850	16000
    
  • /data/scatter_1.bed
    chr2	5000	10000
    

dict文件

给定位于/data/ref.dict

的dict文件
@SQ	SN:chr1	LN:3000000
@SQ SN:chr2 LN:500000

命令:

chunked-scatter -p /data/scatter_ -i /data/regions.bed

将在/data/scatter_0.bed生成以下输出文件:

chr1	0	1000000
chr1	999850	2000000
chr1	1999850	3000000
chr2	0	500000

欢迎加入QQ群-->: 979659372 Python中文网_新手群

推荐PyPI第三方库


热门话题
Java泛型和基类   ProcessBuilder或DefaultExecutor启动的“RunAs”子进程的java读取标准输出   java应用程序在尝试登录时突然停止   Java:神秘的Java未捕获异常处理程序[带代码]   java JavaFX NumberAxis自动范围无限循环   最新版本和旧版本冲突的java双Maven依赖关系   java如何导入带有部署变量类名的静态函数?   编译器构造不同的JDK更新会产生不同的Java字节码吗?   java无法在struts 1.1中上载任何超过250 MB大小的文件   java调整jcombobox下拉菜单的宽度   java如何在某些情况下忽略@SQLDelete注释   在Eclipse for Java EE developers edition中禁用HTML警告   java HttpUrlConnection重置请求属性   java@Provider资源未在rest应用程序中注册   java TOP N使用JPA连接   java在使用反射调用方法时区分int和Integer参数