rna序列数据分析工具。
rnaseqhs的Python项目详细描述
rnasekhs
==
概述
----
rnasekhs可以对rna序列数据进行生物信息学分析,并从hisat2生成干净的bam/sam结果,从stringtie和featurecounts结果生成gtf结果。
rnasekhs在麻省理工学院许可证的条款下可用(参见文件“license``)”
pre-requirements
----
1。$path中的“gzip”、“fastx_trimmer”、“fastqc”、“cutadapt”、“fastq_quality_filter”、“hisat2”、“stringtie”、“samtools(v1.3.1)”、“bedtools(v2.19.1)”。
2。hisat2构建了基因组索引、转录组索引和gtf。
tar zxvf rnasekhs-<;版本>;.tar.gz
2。cd rnasechs-<;版本>;
3。python setup.py install——用户
用法
----
1。在python控制台中将其用作模块::
>;>import rnasekhs
>;>rnasekhs.rnasekhs.main(<;arguments>;)
arguments为::
>;>rnasekhs.rnasekhs.main(ndir,outdir,phred,qccheck,trim,lastkeep,rmadapt,ladapter,radapter
,overlap,minlen,removen,ncutoff,filtq
,minq,pminq,qcstat,mapping,hisat2index,方向
,rnastrandness,gtf,rawcover,genomebed,windowsize])
2。将其用作bash中的命令行:
<;已安装路径>;/rnaseqhsb<;选项>;
选项有::
用法:rnaseqs[-h][-i indir][-o outdir][-p phred][-q qccheck][-t trim]
[-l lastKeep][-r rmadapt][-l ladapter][-r radapter]
[-o overlap][-m minlen][-n removen][-c ncutoff][-f filtq]
[-minq minq][-pminq][-q qcstat m mapping]
[--hisat2index hisat2index][--方向方向]
[--rnastandness rnastandness][--gtf gtf]
[--drawcover drawcover][--genomebed genomebed]
[--windowsize windowsize]
可选参数:
-h,-帮助显示此帮助消息并退出
-Idir印第安纳> BR/> FASQ文件路径
O-Outdir,Outdir Outdir < BR/>输出路径
-P PHRD,PHERD PHRES/BR/> PalReD评分用于平台[33 ]
-QQCCHECK,-QCCHECKQCHECKBR/>进行质量检查[正确]
-t阀内件,--阀内件阀内件,给出fastq简短读数为--lastKeep defined
-l lastKeep,--lastKeep lastKeep
带有“阀内件”选项,最后一个底座保持
-r rmadapt,--rmadapt rmadapt
移除适配器[正确]
-l l adapter,--ladapter ladapter
左转接器[agatcggaagagc]
-r雷达翼,--r adapter雷达翼
右转接器[agatcggaagagc]
-o重叠,--overlap重叠
如果读取和转接器之间的重叠小于重叠长度,则读取不会
被改进的。[6]
-m minlen,--minlen minlen
丢弃短于“minlen”
[75]
-n removen,--removen removen
删除“n”基[true]
-c n cutoff,--ncutoff ncutoff
带有“removen”选项,n截止[0.1]
-ffiltq,--filtq filtq
根据质量筛选序列[true]
--要保持的最小质量分数[20]
--pminq pminq最小碱基百分比[80]
-q qcstat,--qcstat qcstat
为序列生成qc统计图
-m映射,--映射
读取映射[真]
--hisat2 index hisat2index
hisat2 index
--方向方向
方向
--rnastrandity rnastrandity
rna链长度
--用于注释的gtf gtf gtf文件
--drawcover drawcover
基因组区域覆盖率[真]
--基因组床
覆盖基因组床文件
--窗口大小
覆盖窗口大小[500000]
==
概述
----
rnasekhs可以对rna序列数据进行生物信息学分析,并从hisat2生成干净的bam/sam结果,从stringtie和featurecounts结果生成gtf结果。
rnasekhs在麻省理工学院许可证的条款下可用(参见文件“license``)”
pre-requirements
----
1。$path中的“gzip”、“fastx_trimmer”、“fastqc”、“cutadapt”、“fastq_quality_filter”、“hisat2”、“stringtie”、“samtools(v1.3.1)”、“bedtools(v2.19.1)”。
2。hisat2构建了基因组索引、转录组索引和gtf。
tar zxvf rnasekhs-<;版本>;.tar.gz
2。cd rnasechs-<;版本>;
3。python setup.py install——用户
用法
----
1。在python控制台中将其用作模块::
>;>import rnasekhs
>;>rnasekhs.rnasekhs.main(<;arguments>;)
arguments为::
>;>rnasekhs.rnasekhs.main(ndir,outdir,phred,qccheck,trim,lastkeep,rmadapt,ladapter,radapter
,overlap,minlen,removen,ncutoff,filtq
,minq,pminq,qcstat,mapping,hisat2index,方向
,rnastrandness,gtf,rawcover,genomebed,windowsize])
2。将其用作bash中的命令行:
<;已安装路径>;/rnaseqhsb<;选项>;
选项有::
用法:rnaseqs[-h][-i indir][-o outdir][-p phred][-q qccheck][-t trim]
[-l lastKeep][-r rmadapt][-l ladapter][-r radapter]
[-o overlap][-m minlen][-n removen][-c ncutoff][-f filtq]
[-minq minq][-pminq][-q qcstat m mapping]
[--hisat2index hisat2index][--方向方向]
[--rnastandness rnastandness][--gtf gtf]
[--drawcover drawcover][--genomebed genomebed]
[--windowsize windowsize]
可选参数:
-h,-帮助显示此帮助消息并退出
-Idir印第安纳> BR/> FASQ文件路径
O-Outdir,Outdir Outdir < BR/>输出路径
-P PHRD,PHERD PHRES/BR/> PalReD评分用于平台[33 ]
-QQCCHECK,-QCCHECKQCHECKBR/>进行质量检查[正确]
-t阀内件,--阀内件阀内件,给出fastq简短读数为--lastKeep defined
-l lastKeep,--lastKeep lastKeep
带有“阀内件”选项,最后一个底座保持
-r rmadapt,--rmadapt rmadapt
移除适配器[正确]
-l l adapter,--ladapter ladapter
左转接器[agatcggaagagc]
-r雷达翼,--r adapter雷达翼
右转接器[agatcggaagagc]
-o重叠,--overlap重叠
如果读取和转接器之间的重叠小于重叠长度,则读取不会
被改进的。[6]
-m minlen,--minlen minlen
丢弃短于“minlen”
[75]
-n removen,--removen removen
删除“n”基[true]
-c n cutoff,--ncutoff ncutoff
带有“removen”选项,n截止[0.1]
-ffiltq,--filtq filtq
根据质量筛选序列[true]
--要保持的最小质量分数[20]
--pminq pminq最小碱基百分比[80]
-q qcstat,--qcstat qcstat
为序列生成qc统计图
-m映射,--映射
读取映射[真]
--hisat2 index hisat2index
hisat2 index
--方向方向
方向
--rnastrandity rnastrandity
rna链长度
--用于注释的gtf gtf gtf文件
--drawcover drawcover
基因组区域覆盖率[真]
--基因组床
覆盖基因组床文件
--窗口大小
覆盖窗口大小[500000]