混合dna样本的菌株消歧方法

strainpycon的Python项目详细描述


简介

strainpycon是一个python 3包,可用于消除多个 混合DNA样本中的菌株。在数学上,strainpycon可以解二进制 盲源分离问题及某些高维积分的计算 涉及二进制变量。这些数学概念之间的联系 应变识别在以下期刊文章中讨论:

L.Mustonen、X.Gao、A.Santana、R.M.Mitchell、Y.Vigfuson和L.Ruthotto,
从混合诊断样本中识别分子菌株的贝叶斯框架,
反问题34(10),1050092018,
https://doi.org/10.1088/1361-6420/aad7cd

strainpycon基于用julia编写的strainrecon.jl包: https://github.com/lruthotto/StrainRecon.jl

动机

作为一个激励性的例子,假设你有一个血样被多重感染 恶性疟原虫疟原虫。假设你已经对选定的 snp位点,与参考基因组不同的调用数是 表明在那个snp上变异的菌株的比例。 strainpycon是通过 消除歧义(反褶积),无需事先了解 样本或寄生虫。这个过程还可以帮助评估 样本中的感染有助于疟疾监测工作 实例。

引文

如果您在项目中使用strainpycon,请引用上面的日志文章。

完整文档

请参阅strainpycon的完整文档: https://www.ymsir.com/strainpycon/

要求

strainpycon在以下环境中进行了测试:

  • 64位Linux
  • python 3.6.5和numpy 1.14.3

基本用法

通常,用户只想访问straintrecon类中的一些方法:

importstrainpyconS=strainpycon.StrainRecon()

让我们用三个菌株和24个snp位点生成综合测量数据 然后解反问题:

(measurements,strains,freq)=S.random_data(24,3)(strains_recon,freq_recon)=S.compute(measurements,3)

这里,strains_recon应该等于strainsfreq_recon应该等于 freq

接下来,让我们画另一个随机测量,现在是高斯加性噪声。 我们计算misfit或负对数似然,当菌株的数量 在重建中从1到7不等。此外,我们计算后验 量化不确定性的统计:

gamma=0.1# standard deviation of Gaussian noise(measurements,strains,freq)=S.random_data(18,4,gamma=gamma)misfits=S.misfits(measurements,range(1,8))(strains_mean,freq_mean,strains_dev,freq_dev)=S.posterior_stats(measurements,4,gamma)

有关方法和详细示例的完整说明,请参见: 见https://www.ymsir.com/strainpycon/

已知问题

strainpycon还不支持多线程。

联系人

请直接提问: 伊米尔·维弗森,埃默里大学,ymir.vigfusson@emory.edu

欢迎加入QQ群-->: 979659372 Python中文网_新手群

推荐PyPI第三方库


热门话题
相当于加密流。NET在Java 安卓中的应用?   java Android:加载片段时启动动画   java文件从指定的绝对路径上载到服务器   java是否可以自定义Spring缓存抽象所使用的序列化?   当客户端输入为无效字符串时,java从JAXWS接收空的BigDecimal   将数据库从MySQL更改为SQLite后出现Java项目错误   java PrimeFaces在datatable中自定义行编辑器   java在数组中对字符串和双类类型进行排序   图像Java:如何在GridLayout中嵌套JPanel?   java searchByEmail方法不起作用   java运行时。exec(字符串)限制字符串   java通过异步运行lambda访问方法参数   java为什么这个条件语句不编译?   在javajar中添加和使用文件,就像它们在文件夹中一样   使用java查找带有正则表达式的子字符串   在awt所在的地方荡秋千。属性,以及如何在Java插件中提供它的本地化版本