python api用于推断稀疏采样的基因型-表型图中缺失的数据。

gpseer的Python项目详细描述


探地雷达

一种在稀疏测量的基因型-表型图中推断缺失数据的固执己见的方法。

基本用法

最简单的用例是在包含基因型表型数据的输入文件上调用gpseer

例如:

gpseer -i phenotypes.csv    \
      --wildtype "00000"\
      --threshold 1\
      --spline_order 2\
      --epistasis_order 2

输出:

[GPSeer] Running GPSeer on phenotypes.csv. Look for a predictions.csv file with your results.

[GPSeer] + Reading data...
[GPSeer] └── Done reading data.

[GPSeer] + Fitting data...
[GPSeer] └── Done fitting data.

[GPSeer] + Predicting missing data...
[GPSeer] └── Done predicting...

[GPSeer] GPSeer finished!

它使用二阶样条函数返回一组表型预测。

命令行选项

要查看所有配置项,请调用gpseer --help

A tool for predicting phenotypes in a sparsely sampled genotype-phenotype maps.

Options
-------

-i <Unicode> (GPSeer.infile)
    Default: 'test'
    Input file.
-o <Unicode> (GPSeer.outfile)
    Default: 'predictions.csv'
    Output file
--model_definition=<Instance> (GPSeer.model_definition)
    Default: None
    An epistasis model definition written in Python.
--wildtype=<Unicode> (GPSeer.wildtype)
    Default: ''
    The wildtype sequence
--threshold=<Float> (GPSeer.threshold)
    Default: 0.0
    Experimental detection threshold, used by classifer.
--spline_order=<Int> (GPSeer.spline_order)
    Default: 0.0
    Order of spline..
--spline_smoothness=<Int> (GPSeer.spline_smoothness)
    Default: 10
    Smoothness of spline.
--epistasis_order=<Int> (GPSeer.epistasis_order)
    Default: 1
    Order of epistasis in the model.
--nreplicates=<Int> (GPSeer.nreplicates)
    Default: None
    Number of replicates for calculating uncertainty.
--model_file=<Unicode> (GPSeer.model_file)
    Default: ''
    File containing epistasis model definition.

高级上位机模型

通过编写一个简短的模型文件,可以使用更高级的模型:

# model.pyfromepistasis.modelsimport(EpistasisPipeline,EpistasisLogisticRegression,EpistasisSpline,EpistasisLinearRegression)c.GPSeer.model_definition=EpistasisPipeline([EpistasisLogisticRegression(threshold=5),EpistasisSpline(k=3),EpistasisLinearRegression(order=3)])

然后调用gpseer命令。

gpseer -i phenotypes.csv --model_file=model.py

安装

克隆此存储库并使用pip安装:

pip install gpseer

依赖关系

  1. gpmap:用于分析基因型-表型图的python api。
  2. 上位性:python api用于提取基因型-表型图中的高阶上位性
  3. traitlets:python中的静态类型和可配置对象

欢迎加入QQ群-->: 979659372 Python中文网_新手群

推荐PyPI第三方库


热门话题
java使用ContentExchange设置请求属性   java Spark/Hdfs/Hdfsclient兼容性   java springcloudstreamkafka配置:instanceCount和instanceIndex   Java中web服务序列化日期   java用动态数据替换占位符   java git gc似乎覆盖了一个packfile,留下了一个打开的文件描述符,其中包含对“oldxxx.pack”的引用   为什么Apache项目对Java版本敏感?   java Anylogic帮助如何在导入的3dobject通过输送机上的多个“站”时更改其颜色?   JavaEclipseNeonM2E可以导入一个大型项目,但似乎不能自动解决依赖关系   java@FindBy搜索具有满足条件的子元素的元素   java如何将ActionEvent e与键绑定一起使用?   java转换以集中方式从外部库抛出的异常   java中用户文件/数据文件与系统/程序文件的区别   java使用变量字符串或字符作为对象名   字体使用Java图形操纵字符串中每个字符的形状   JavaFX图表移动数据   java RandomAccessFile:将所有项设置为相同的字节数?   java Google Play inapp Billing onPurchasesUpdated()错误响应代码1   java在不知道属性名和属性数的情况下处理json对象   java是否可以一次从HazelcastInstance(映射和列表)中删除所有数据?