细胞亚群的全甲基化鉴定及推断片段
CellMeth的Python项目详细描述
细胞法v1
单个体细胞组织细胞群中的dna甲基化模式具有高度的异质性和多态性。我们发展了细胞方法来量化细胞亚群的局部完全甲基化分数(fmc分数),并根据单碱基分辨率的dna甲基化数据识别细胞亚群的完全甲基化区域(cellmethy)。 此脚本用于推断局灶性完全甲基化细胞亚群的分数。
易于启动:
inputfile:bismark处理后用“\t”分隔的文件,包括读取id、链、染色体、cpgc的位置和甲基化状态(z或z)。
结果将被放入输入文件夹:outputfile。
如果使用bismark和提取的甲基化状态完成fastq映射,请使用以下命令:
python CellMethy.py -f inputfile -o outputfile
选项:
-f: The file name of input file after bismark processed, include five columns: read ID, strand, chromosome, position of CpG and methylation states Z (methylated) or z (unmethylated) separated by ‘\t’.
-c: Lowest coverage cutoff in each bin, default is 10.
-b: number of CpGs in each bin, default is 5.
-o: The file name of output file showing full methylation of cell subpopulation, include five columns: chromosome, start, end, FMC fraction, and CpGs number in the region separated by “\t”.
示例:
cd ~/CellMethy-*.*.* python ./CellMethy/bin/CellMethy.py -f ./data/data_file -b5 -c 10 -o myoutput
如何获取输入文件
如果有fastq数据,可以使用bismark工具进行映射。
示例:
bismark ./referenceGenome --bowtie2 test.fastq -o test.sam bismark_methylation_extractor -s --comprehensive test.sam
名为“cpg_context_test.txt”的输出文件是cellmethy的inputfile。 cellmethy输入文件的格式包括读取id、链、染色体、cpgc的位置和甲基化状态(z或z),用'\t'分隔。
Read1 + chr21 9827508 Z Read1 - chr21 9827503 z Read1 - chr21 9827484 z Read2 + chr21 9827434 Z Read2 + chr21 9827454 Z Read2 - chr21 9827483 z