BarSeq数据分析。

barseq的Python项目详细描述


Build StatusPython 3.7

barseq

用于分析barseq数据的python包。

安装

pip install git+https://github.com/mjmlab/barseq.git@master

使用量

barseq -i <directory of sequencing reads> -b <barcode file> -e <experiment name>

-i/--input

  • 带illumina的目录在fastq或fastq.gz中读取。

-b/--barcodes

  • 带有条形码和对应基因名的csv文件。

-e/--experiment

  • 实验名称,用于创建结果文件夹。

所需文件

^ illumina的{str 1}$目录读取[-i]进行分析。可以是fastq或fastq.gz格式

@M06026:87:000000000-D69HY:1:1102:15909:1336 1:N:0:TGACCA
CTCTAGAAAGTATAGGAACTTCAGGGCCATTTATATACCTTCCACTCTTCAACCGTGTCTTGACTTGACCTGGATGTCTCTACTGCTGTCATGCTACGTAGCTCATGCTACGTCGATCTAGTCGATGCATGCTAGCTGATCGACTCTCTTC
+
A#>>>3AA2DD>FBFGBFBFBFDDFGGAAEEEHDHFFFDDDBDGDFDDDDDADFGFFDDBFFEBFD5DFEEBBADABFGFGBBFGDD5BF3F43B3F1/11B144BGEBF@BBFB0B0BBFBBBBBBBB?E/FGFBB?/???B???/?FGG

带基因名的条形码文件[-b]。需要采用CSV格式。

Barcode,Gene
ATGAAGACTGTTGCCGTA,WT
CACGACGCCCTCCGCGGA,gene1
ACTATTACGCAAAATAAT,gene2
ATGGAAGATATTATTATT,gene3
CCTCTCCAACCGGGTCTG,gene4
CCCGGTCGCCTAGCCCCG,gene5
GGCCCCCCGCCCGTCCCC,gene6
GGATCACTGCTAGCGTAT,gene7
CCTGCAGCAGCGGCCCGC,gene8
ACACATGCAGACATAGAG,gene9
CGCGCCATCCGCCGCCCA,gene10
AATATTCAGATGGGACGT,gene11

输出

results/目录

  • <;experiment>;_results.csv:在每个序列文件中找到的条形码计数。
GeneBarcodeSample 1Sample 2Sample 3...
gene1^{}50057...
gene2^{}121319...
gene3^{}131110...
_other_other284029...

barseq工作流

barseq_diagram

欢迎加入QQ群-->: 979659372 Python中文网_新手群

推荐PyPI第三方库


热门话题
java SimpleFramework和工厂方法   Java适当地处理异常   java单例类不起作用   java小程序和Swing在eclipse中不显示组件   多个键上的java Redisson FastRemove不起作用   java验证请求正文不等于模式   在Java中从URL读取数据   eche RecyclerView项的java Set自定义字体   string Java如何从Date获取HH:mm:ss   当Java应用程序落后于负载均衡器时,在某些URL上强制使用SSL   使用esapi时发生java错误   java使用流根据第二个列表中的值更新一个列表中的对象   组织。openqa。硒。Java中的NoTouchElementException WebDriver?   从JSON字符串Java创建CSV文件