Python wisestork包_程序模块 - PyPI

在示例cnv调用中

wisestork的Python项目详细描述

doi Wisecondor程序。其最初的目的是检测三体和较小的CNV 使用低覆盖WGS的母体血浆样本。

WiseStork增加了对小型垃圾箱的实用支持，而且对于常规的wgs和外显子组测序也很有用。

为了全面了解与原来的WiseCondor的区别，参见章节差异。

安装

PYPI

从pypi安装wisestork，方法很简单：

pip install wisestork

手动（开发版本）

需要以下系统依赖项

巨蟒3.5+

此外，还需要以下python包：

努比
matplotlib
生物圈
统计模型
sklearn
皮萨姆
Pyfaidx
单击

建议您使用virtualenv。

要安装WiseStork，创建一个virtualenv，安装python 使用pip install-r requirements.txt的需求，然后运行 python setup.py开发

`输入`

WiseStork将BAM文件作为输入。必须为这些BAM文件编制索引。

另外，您必须提供一个引用fasta文件，它应该同样，使用samtools faidx<；fasta>；索引

`运行`

典型的工作流从BAM文件开始。那些bam文件必须是排序和索引。

WiseStork分析的第一步是计数步骤。这个生成每个bin的读取计数，并将其写入bed文件。这个命令，如下所示：

wisestork count-i<；input.bam>；-r<；fasta.fa>；-o<；out.bed>；-b<；binszise>；

-b标志可以省略：wisestork默认为50kb的binsize。但是，您可能需要不同的箱子大小。

一旦你有了盘点床文件，我们必须纠正GC偏差。这个命令如下：

wisestork gc correct-i<；input.bed>；-r<；fasta.fa>；-o<；out.gc.bed>；-b<；binsize>；

下一步，我们需要对结果进行bgzipped和tabixed，这样您就可以必须执行bgzip<；out.gc.bed>&；tabix-pbed<；out.gc.bed.gz>；

最后一步，zscore步骤计算每个箱子的z分数。它要求您事先生成一个参考字典。再次创建z-scores的命令看起来与前两个：

wisestork zscore-i<；input.bed.gz>；-r<；fasta.fa>；-o<；out.z.bed>；-d<；dictionary.bed.gz>；-b<；binsize>；

`用户提供的箱子`

除了为每个步骤提供binsize，还可以提供 bin文件。这个文件应该是一个（最好是分类的）带有区域的床文件存在于输入BAM文件中的。此选项主要用于 wes分析，bin文件将在哪里更正响应目标/诱饵区域文件。请注意，contigs必须与输入BAM文件。

您可以为任何子命令使用-l标志来提供bin文件。这将取代-b标志的任何用法。

`创建引用词典`

以上假设您已经创建了一个引用字典。如果不是这样，则必须生成此文件。

要创建引用字典，需要更正一组gc 常规样本的bed文件（来自wisestork gc correct），并输入要wisestork newref。rewref命令将找到最近的每个垃圾箱的邻居。稍后，在zscore命令中，信息用于从查询中获取一组"引用容器" 样品：

要使用的命令：

wisestork newref-i<；input.gz.bed>；-i<；input2.gz.bed>；[…]-o<；out.ref.bed>；-r<；fasta.fa>；-b<；binsize>；

这个的输出必须用bedtools排序，然后bgzipped 和tabixed。

`用法`

Usage: wisestork [OPTIONS] COMMAND [ARGS]...

  Discover CNVs from BAM files.

  A typical workflow first extracts regions from a BAM file
  The resulting BED tracks must then be GC-corrected.
  Using a reference track of region similarity,
  One can then calculate Z-scores for every region.

  The following sub-commands are supported:
   - count: count coverage per bin
   - gc-correct: GC-correct bins
   - zscore: calculate Z-scores
   - newref: Generate a new reference dictionary of bin similarities

Options:
  --version  Show the version and exit.
  --help     Show this message and exit.

Commands:
  count       Count coverages
  gc-correct  GC correct
  newref      Create new reference
  zscore      Calculate Z-scores

您可以通过键入wisestork<；command>；--help来获得其他帮助

`差异`

这种重新实现之间有几个重要的区别和原来的怀斯康多尔。

这个重新实现被组织为一个普通的python包，同时公开几个命令行工具。
支持Python3。实际上，它只在Python3上测试过。
现在，所有命令行工具都具有unix风格的参数解析功能
现在可以在更少的时间。
pickle文件不再使用。输出格式现在是普通床，可能还有一列。这意味着结果可以由常见的下游工具，如床具。
用户提供的常规床格式的BIN文件。
countgc步骤现在是多余的。其功能现已集成在GCC步骤中。
修改了参考仓选择方法。这个最初的怀斯康德计算了每一个垃圾箱与每一个垃圾箱之间的差异每个样本的箱，然后对每个染色体.因为这是一个指数运算，所以参考仓选择速度太慢，占用内存太多小箱子。新方法代替了计算差异在所有样本的同一个容器上应用一种方法（如中值法）。然后对结果箱列表进行排序。类似的箱子可以是使用常规列表切片选择。这意味着时间的复杂性创建一个新的引用集现在只是loglinear。附加的过滤器保持不变。
使用statsmodelslowess函数，而不是biopython函数。这将显著加快GC校正速度。

`命名`

你可能会想，为什么要给这个工具起名叫怀斯托克？嗯，秃鹰是一种鸟。因为这是聪明的秃鹰，我想另一只鸟会是个好名字。我住在海牙，海牙有一只鹳作为城市的象征，我把一只和一只放在一起。因此，怀斯托克诞生了。

`许可证`

GPLV3

欢迎加入QQ群-->： 979659372

`推荐PyPI第三方库`

导 航 栏

                                            项目 描述
                                        

                                            版本历史
                                        

                                                下载文件
                                            
项目 链接
首页
                                    
标 签
许可证: BSD许可证（BSD 3条款）
作者信息:: 暂无
                                
                            
维护者

                                  sndrtj
                                
最新PyPI项目
italian_vip_says
UFx
vofs
fake_item_generator
NerEva
django-monologue
fio_product_attribute_strict
climailsystem
pyshape
tbb-devel
npy-append-arra
anthill.tal.macrorenderer
odoo11-addon-stock-a
uuuu
contextil
fyl_nester
appomatic_renderable
teacher
chuletas
slackbot_ce
最新Python常见问题
如何在Excel中读取公式并将其转换为Python中的计算？
如何在excel中读取嵌入的excel，并将嵌入文件中的信息存储在主excel文件中？
如何在Excel中返回未知列长度的非空顶行列值？
如何在excel中选择数据列？
如何在Excel中通过脚本自动为一列中的所有单元格创建公共别名
如何在excel中高效格式化范围AttributeError:“tuple”对象没有属性“fill”
如何在excel单元格中编写python函数
如何在excel单元格中自动执行此python代码？
如何在excel工作表中创建具有相应值的新列
如何在Excel工作表中复制条件为单元格颜色的python数据框？
如何在Excel工作表中循环
如何在excel工作表中打印嵌套词典？
如何在excel工作表中绘制所有类的继承树？
如何在Excel工作表中自动调整列宽？
如何在excel工作表中追加并进一步处理

wisestork 0.1.2

wisestork的Python项目详细描述

安装

PYPI

手动（开发版本）

`输入`

`运行`

`用户提供的箱子`

`创建引用词典`

`用法`

`差异`

`命名`

`许可证`

`推荐PyPI第三方库`

chain_joiner

cloudberry-netjson

oceanlib

gadjo

pyramid-oas3

pyproteins

distributions-ac

py-applescript

dsalgorithm

eidos

pokeapi

smiteConnector

BHCAA

reprint

djangosolo

导航栏

项目链接

标签

维护者

最新PyPI项目

最新Python常见问题

wisestork 0.1.2

wisestork的Python项目详细描述

安装

PYPI

手动（开发版本）

输入

运行

用户提供的箱子

创建引用词典

用法

差异

命名

许可证

推荐PyPI第三方库

chain_joiner

cloudberry-netjson

oceanlib

gadjo

pyramid-oas3

pyproteins

distributions-ac

py-applescript

dsalgorithm

eidos

pokeapi

smiteConnector

BHCAA

reprint

djangosolo

导 航 栏

项目 链接

标 签

维护者

最新PyPI项目

最新Python常见问题

`输入`

`运行`

`用户提供的箱子`

`创建引用词典`

`用法`

`差异`

`命名`

`许可证`

`推荐PyPI第三方库`

导航栏

项目链接

标签