估计基因型-表型图中统计高阶上位性的python api。
epistasis的Python项目详细描述
上位性
python api,用于估计基因型-表型图中的统计性高阶上位性。
所有模型都遵循Scikit learn接口,从而无缝地插入PyData生态系统有关此软件包中包含的型号类型的详细信息, 阅读我们的docs。您还可以在我们的paper中阅读更多关于这些模型背后的理论。
最后,如果您想在不安装任何程序的情况下测试这个包,请尝试这些jupyter笔记本here(谢谢Binder!).
示例
epistasis包与gpmap(一种用于管理 基因型表型图谱数据。构造一个基因型pHNOtypeMap对象并传递它 直接到上位性模型。
# Import a model and the plotting modulefromgpmapimportGenotypePhenotypeMapfromepistasis.modelsimportEpistasisLinearRegressionfromepistasis.pyplotimportplot_coefs# Genotype-phenotype map data.wildtype="AAA"genotypes=["ATT","AAT","ATA","TAA","ATT","TAT","TTA","TTT"]phenotypes=[0.1,0.2,0.4,0.3,0.3,0.6,0.8,1.0]# Create genotype-phenotype map object.gpm=GenotypePhenotypeMap(wildtype=wildtype,genotypes=genotypes,phenotypes=phenotypes)# Initialize an epistasis model.model=EpistasisLinearRegression(order=3)# Add the genotype phenotype map.model.add_gpm(gpm)# Fit model to given genotype-phenotype map.model.fit()# Plot coefficients (powered by matplotlib).plot_coefs(model,figsize=(3,5))
更多的例子可以在这些binder notebooks中找到。
安装
epistasis在python 3+中工作(我们不保证它在python 2中工作)。
要在pypi上安装最新版本:
pip install epistasis
要从源安装,请克隆此repo并运行:
pip install -e .
文件
可以查看文档和API引用here
依赖关系
- gpmap:用于构建强大的基因型-表型映射python数据结构的模块。
- Scikit-learn:简单易用的机器学习算法
- Numpy:python的数组操作包
- Scipy:高效的科学数组操作和拟合
- lmfit:Python中的非线性最小二乘最小化和曲线拟合
可选依赖项
- matplotlib:Python绘图API
- ipython:交互式python内核
- jupyter notebook:交互式笔记本应用程序,用于以交互方式运行python内核
- ipywidgets:python中的交互式小部件。
开发
我们欢迎拉要求!如果你发现一个虫子,我们很乐意请你修理它。如果 有一个功能您想添加,请随时提交 带有添加说明的拉取请求我们也要求你写 对新特性进行适当的单元测试,并将文档添加到sphinx文档中。
要对此包运行测试,请确保已安装pytest
,并从基本目录运行:
pytest
引用
如果你使用这个api进行研究,请引用这个paper。
您也可以直接引用该软件:
@misc{zachary_sailer_2017_252927,
author = {Zachary Sailer and Mike Harms},
title = {harmslab/epistasis: Genetics paper release},
month = jan,
year = 2017,
doi = {10.5281/zenodo.1215853},
url = {https://doi.org/10.5281/zenodo.1215853}
}