线粒体突变检测的MQuad混合模型

mquad的Python项目详细描述


MQuad:单细胞组学数据中线粒体突变检测的混合模型

MQuad是一种检测线粒体突变的工具,它为克隆亚结构推断提供信息。它使用二项式混合模型来评估背景噪声中mtDNA变异的异质性。在

用于生成必要文件的建议管道:

  1. 使用cellSNP或{a2}(cellSNP的更快版本,仍处于测试阶段,因此可能不稳定)从raw.bam文件中累积mtDNA变体
  2. 使用MQuad区分有信息的mtDNA变体和噪声背景
  3. 使用vireoSNP根据mtDNA变异情况将细胞分配给克隆

如果有必要的文件格式,也可以使用不同的上游/下游软件包。在

安装

MQuad可以通过Python包索引获得。要安装,请键入以下命令行并添加-U进行更新:

pip install -U mquad

或者,您可以通过以下命令行从该GitHub存储库安装最新(通常是开发)版本:

^{pr2}$

手册

安装后,您可以首先使用mquad -h检查版本和输入参数

MQuad识别3种类型的输入:

  1. 带AD和DP稀疏矩阵的cellSNP输出文件夹(.mtx)
mquad -c $INPUT_DIR -o $OUT_DIR -p 20
  1. 仅限.vcf
mquad --vcfData $VCF -o $OUT_DIR -p 20
  1. AD和DP稀疏矩阵(.mtx),逗号分隔
mquad -m cellSNP.tag.AD.mtx, cellSNP.tag.DP.mtx -o $OUT_DIR -p 20

对于基于液滴的测序数据,如10X铬CNV、scATAC等,建议添加--minDP 5或更小的值,以防止拟合过程中出现错误。默认值为10,适用于Smart-seq2数据,但对于低排序深度数据可能过于严格。在

输出文件将在下面的“示例”部分进行说明。在

示例

MQuad附带了一个示例数据集,供您测试。这个数据集的mtDNA突变是从Ludwig et al, Cell, 2019中提取的。它包含500个背景变量,以及Supp图2F(和主图2F)中使用的9个变体。还有一个附加的变体,它是信息性的,但在本文中没有提及。在示例数据集中,总共有510个变体。在

运行以下命令行:

mquad --vcfData example/example.vcf.gz -o example_test -p 5

输出文件应包括:

  • 通过_广告mtx,通过_dp.mtx公司:用于下游克隆分析的合格变体的AD/DP稀疏矩阵文件
  • 顶级变型热图.pdf:合格变异体等位基因频率热图
^{1}$
  • 德尔塔比克_cdf.pdf分布,包括所有tabuad的截断变量
images/cdf.png
  • 银行识别码_参数.csv:包含所有变量的详细参数/统计信息的电子表格,按从高到低排序
  • 调试未排序的BIC_参数.csv:与BIC相同的电子表格_参数.csv但出于开发人员调试的目的,unsorted可能会在MQuad的更高版本中删除

欢迎加入QQ群-->: 979659372 Python中文网_新手群

推荐PyPI第三方库


热门话题
java传递位置作为FragmentPagerAdapter中片段的参数   html Java Jsoup循环打印   java如何使用FileOutputStream写入数据而不丢失旧数据?   java在测试用例类/方法中执行sql before/after/in   java在javafx中注册鼠标处理程序,但处理程序不是内联的   Android嵌入了一个C++库的java代码,不需要TopPLE程序来嵌入它?   片段类内部的java ProgressBar导致setMax方法出现NullPointerException?   带有google app engine的java Activator Play框架   java如何解析星级而不是字符串?   java如何在基本实体中定义通用主键字段?   通过扩展实现Java克隆   使用CipherOutputStream的java递归加密提供一个空字节[]   在运行时提取字段值的Java服务   Java 11和spring boot从spring boot应用程序的fat jar中的依赖项jar加载资源   java尝试使用J2SE枚举所有可用的Wifi网络   使用Java库进行SWIFT MT消息解析   java拆分非逗号分隔的字符串   java为什么toString()不能是静态方法?   java在连接到集群数据库时遇到mongo异常   java访问Hashmap中存储的json有效负载值