没有项目描述

mutacc的Python项目详细描述



mutacc
[![构建状态](https://travis ci.org/clinical genomics/mutacc.png)(https://travis ci.org/clinical genomics/mutacc)
[![覆盖状态](https://coveralls.io/repos/github/clinical-genomics/mutacc/badge.svg?branch=master)"(https://coveralls.io/github/clinical-genomics/mutacc?branch=master)

使用支持真实ngs数据的已知
变量的原始读取,mutacc将每个案例的相关读取存储到
数据库中。然后可以查询该数据库,以创建与真实ngs数据具有相同属性的true
阳性的验证集。


ol
conda create-n<;env廑u name>;python=3.6 pip numpy cython
````

activate environment

``consol
``source activate<;env廑u name>;
````
=v0.9,
和[picard](https://github.com/broadinstitute/picard)>;=v2.18。可以通过

``控制台
conda install-c bioconda picard
conda install-c bioconda seqkit
```

`` git clone https://github.com/adrosenbaum/mutacc
`控制台
git clone安装-e mutacc
````
下面是使用yaml格式的配置文件示例。

``yaml
tacc'
用户名:<;用户名>;
密码:<;密码>;
根目录:<;到根目录的路径>;
````

"根目录"项指定文件系统中的现有目录,其中
mutacc生成的所有文件都将存储在相应的子目录中。例如,所有生成的fastq文件将存储在/../root_dir/reads/



\populate the mutacc database

要从mutacc db导出数据集,必须先填充该数据库。为了提取支持已知变量的原始读取,mutacc使用从ngs实验到变量调用本身生成的所有相关文件。
这是bam文件,而vcf文件只包含感兴趣的变量。

此信息被指定为"case",以yaml格式表示的case示例case字段包含案例本身的元数据case:
case id:'case123';required case id

/>-样本ID:'sample1'必需
分析类型:'wgs'必需
性别:'male'必需
母亲:'sample2'必需(如果没有母亲,可以是0)
父亲:'sample3'必需(如果没有父亲,可以是0)
BAM_U文件:/路径/to/sorted_BAM必需
phenotype:"受影响的"

-样本id:"样本2"
分析类型:'wgs'
性别:'female'
母亲:'0'\0(如果没有父母)
父亲:'0'
bam文件:/路径/到/排序的bam
表型:'unfected'

-样本id:'sample2'
分析类型:'wgs'
性别:'male'
母亲:'0'
父亲:'0'
BAM U文件:./path/to/sorted_bam
表型:"受影响的"

包含案例变量的VCF文件的路径
变量/path/to/VCF
````

如果希望从fastq文件中找到读取,则可以通过指定fastq文件来实现
tq_文件:
-/path/to/fastq1
-/path/to/fastq2
表型:'impacted'
````
从案例中提取读取结果

`` console
`` mutacc--配置文件<;config_file>;提取--padding 600--案例<;案例文件>;
```
填充选项接受所需区域的基对数
填充了。

这将创建一个文件'case_id'。mutacc存储在
/…/root_dir/imports目录中指定的目录中。


数据库进行操作。

这将尝试建立到MongoDB实例的连接,默认情况下
在端口27017上的"localhost"上运行。如果不需要,可以使用--host和--port选项指定它。





`` console
mutacc db-h<;host>;-p<;port>;import case\u id.mutacc
```


如果需要身份验证,可以使用--username和
--密码选项指定它。


主机:<;主机>;
端口:<;端口>;
用户名:<;用户名>;
密码:<;密码>;
````

````控制台
mutacc--config file<;config.yaml>;db-import-case-id.mutacc
`````




主机:<;主机:<;主机>;主机:<;主机>;主机<;主机<;主机<;主机>;
;主机>;
用户名:<;用户名>;用户名<;用户名>;密码&当时的样品。目前,mutacc只支持父/母/子三人组和单个样本。若要导出合成的
数据集,请将"导出"命令与选项一起使用。

export:

-m/--member[子成员父成员受影响]
指定要为其创建数据集的族成员。在数据库中的每种情况下(如果是trio)查找正确的
成员,并仅使用从该
样本中读取的内容来充实背景样本。如果单个样本数据集是
必需的,则可以使用'effected'参数传递该选项,使用
从每个案例中仅读取一个受影响的样本。

-c/--case query\
查询在MongoDB中的案例集合中搜索。一个json字符串,
带有有效的mongodb查询语言。

-v/--variant query\
在variant s集合中搜索的查询。




-s/--sex[male female]\
指定示例的性别

-n/--sample name\

-p/--proband\
此标志将使sample"proband",这将强制
单个案例中的所有变体包含在此示例中

--vcf dir\
指定存储vcf文件(真值集)的目录。默认值
到/../root-dir/variants/



示例:

``console
mutacc--config file<;config.yaml>;db export-m impacted-c'{}
````
将从mutacc数据库中找到所有案例,并将这些信息存储在一个文件/../root-dir/querys/sample-name-query.mutacc.


n由

``控制台
mutacc--config file<;config_file>;db export-m child-c'{}'-p-n child
mutacc--config file<;config_file>;db export-m father-c'{}'-n father
mutacc--config file<;config_file>;db export-m father母亲-c'{}-n母亲
```
这将创建三个文件子查询.mutacc、父亲查询.mutacc和母亲查询.mutacc。

export子命令还将为每个导出的样本生成一个真值集vcf文件,其中包含所有查询变量。

并与以下选项一起使用


-b/--background bam\
用作背景的样本的bam文件路径

-f/--background fastq\
用作背景的样本的fastq文件路径

-f2/--background-fastq2\
-q/--query\
使用export命令创建的查询文件的路径

--dataset dir\
将存储fastq文件的目录。默认为
/>/…/root-dir/root-dir/datasets






>例如,使用上述创建的查询文件



``控制台
mutacc--config-config-file<;config-file>;综合-b<;bam>;-f<;fastq1-child>;-f2<;fastq2-q2-child>;-q child-query.mutacc
mutacc--config-config-file<;config-file>;综合-b<;bam>;-f<;fast;fast<;fast<;fast;第一季度_father>;-f2<;fastq2\u父亲>;-q父亲查询.mutacc
mutacc--config file<;配置文件>;合成-b<;bam>;-f<;fastq1\u母亲>;-f2<;fastq2\u母亲>;-q母亲查询.mutacc
```







>从数据库中删除案例


>要从mutacc db中删除案例,从磁盘中删除该案例中生成的所有bam和fastq文件
>要从mutaccdb中删除案例,使用remove命令

```console
mutacc-mutaccc--config file<;config.yaml>;db remove<;case-id>;
````




<











mutu

(一个样本病例)或母亲/父亲/儿童三人组。此外,假设从mutacc db上传和导出的所有
案例都是成对的端读
实验。




欢迎加入QQ群-->: 979659372 Python中文网_新手群

推荐PyPI第三方库


热门话题
java嵌套循环打印一个数字,旁边有相同数量的星号   java JodReports替代方案   java如何将模型类parcelable对象从片段传递到活动?   java JCS缓存删除功能不删除特定元素   如何打开。Java的dll文件。   java在这种情况下如何选择聚合根?   java从CellEditorListener获取编辑的TreeNode   Java到web服务和mysql   从openssl ec在Java中创建公钥时出现加密无效密钥异常   Java数组:添加多个数组的元素时忽略空数组   java在初始化后向fragment发送数据   JButtons的java数组正在返回void   若联接列不包含特定值,则java JPA条件生成器仅返回实体   java ActionBar问题:NPE   java Portlet是被广泛使用还是非常罕见?