愉快的蟒蛇血统操纵
pedagree的Python项目详细描述
谱系文件工具[PYPI版本](https://badge.fury.io/py/pedagree.svg)(http://badge.fury.io/py/pedagree)
[![构建状态](https://travis-ci.org/brentp/pedagree.svg?branch=master)(https://travis ci.org/brentp/pedagree)
[![文档状态](https://readthedocs.org/projects/pedagree/badge/?版本=最新](http://pedagree.readthedocs.org/en/latest/?Badge=最新)
快速启动
——
大多数用户只需要作为带有PED和VCF的命令行工具运行,例如:
```
python-m pedagree--plot——前缀ceph-1463 ceph1463.vcf.gz ceph1463.ped
````
het呼叫的等位基因频率差异更大。
overview
--
**注意**此模块以前命名为“peddy”。
`pedagree`是一个用于查询、qc'ing的python库,以及操作系谱文件。
至少n代
+在系谱中定义的给定关系的相关系数。
给定一个谱系文件和一个vcf文件,pedagree提供了一些工具:
+查找可能的样本混淆(或ped错误)
-x-chrom上的性混淆
-通过推断与vcf的关系来查找家庭混淆
+查找孟德尔错误
p=ped('my.ped'my.ped')
>
>gt>p=ped('my.ped'my.ped')
>>>>p>p.dot(p.dot)绘制graphviz的系谱图
>
>尚未发现任何明显的问题(3个父母,父母为男性,等等)。
>p.validate(p.validate)(p.validate)
>
>
> >>p.validate(p.validate)
>
n,受影响的数量,联合国,男性,男性,女性,女性等(列联表?)p.summary(p.summary)
>
>
>不可替代的p.sample s(p.samples)(p.samples)
>p.samples(表型=表型。受影响,性别=性别。性别。男性)p.samples(表型=表型。受影响,性别=性别。性别。p.samples)
>样本对象
>s=下一步(p.samples())
>s.samples(p.samples)(p.samples())
>s;s.sample表型
>>s.s.表型
>>>
>>>>>>>s.s.s.
>;>;s.妈妈
>;>;s.dad
>;>;s.signals
>;>;s.kids
````
质量控制
----
我们可以查找在ped文件中定义的关系
与从vcf中的基因型派生的关系不匹配的情况。
``python
>;>pedagree import ped
>;>p=ped('court.ped')
>;>df=p.ped检查('court.vcf.gz')
>;df[df.error];显示样本对其中推断的与报告的不同。
```
[![重新绘制](http://pedagree.readthedocs.org/en/latest/\u images/ped check.png)(http://github.com/brentp/cyvcf2/)
一个明显的错误是当一个红色的点和蓝色的点聚集在一起时。*BR/***********〕具有非常低的IsS0比率,表明它们可能是亲子对。
>BR/>通过寻找Br/x染色体的非PAR区的杂合子频率,我们可以从VCF中确定性别:
Byth> Byth> Br/> Gt;& Gt;and gt;从PePosid导入Pb>gt;p= pED(‘队列’,pED’)
& Gt;>;gt;p.sex_check('court.vcf.gz',plot=true)
…列出所有样本,并在x上标出het、homref、homalt的数目,这样也可以创建一个像这样的图像,在这里我们可以看到一个清晰的样本合成图。[性情节](https://raw.githubusercontent.com/brentp/pedagree/master/images/sex-check.png)(http://github.com/brentp/cyvcf2/)
` pedagree“将酌情向stderr打印警告,例如:
````
系谱警告:'101811-101811'是父亲,但具有女性性别
系谱警告:'101897-101897'是父亲,但具有女性性别
系谱警告:'101896-101896'是自己的母亲
系谱警告:'102110-102110'是母亲,但具有男性性别
系谱警告:'102110-102110'是自己的母亲
系谱警告:'101381-101381'是父亲但有女性性别
系谱警告:'101393-101393'是母亲但有男性性别
未知样本:家庭102498-102498:k34175
未知样本:家庭11509-11509:k567331
未知样本:家庭5180-5180:k8565
```
[![构建状态](https://travis-ci.org/brentp/pedagree.svg?branch=master)(https://travis ci.org/brentp/pedagree)
[![文档状态](https://readthedocs.org/projects/pedagree/badge/?版本=最新](http://pedagree.readthedocs.org/en/latest/?Badge=最新)
快速启动
——
大多数用户只需要作为带有PED和VCF的命令行工具运行,例如:
```
python-m pedagree--plot——前缀ceph-1463 ceph1463.vcf.gz ceph1463.ped
````
het呼叫的等位基因频率差异更大。
overview
--
**注意**此模块以前命名为“peddy”。
`pedagree`是一个用于查询、qc'ing的python库,以及操作系谱文件。
至少n代
+在系谱中定义的给定关系的相关系数。
给定一个谱系文件和一个vcf文件,pedagree提供了一些工具:
+查找可能的样本混淆(或ped错误)
-x-chrom上的性混淆
-通过推断与vcf的关系来查找家庭混淆
+查找孟德尔错误
p=ped('my.ped'my.ped')
>
>gt>p=ped('my.ped'my.ped')
>>>>p>p.dot(p.dot)绘制graphviz的系谱图
>
>尚未发现任何明显的问题(3个父母,父母为男性,等等)。
>p.validate(p.validate)(p.validate)
>
>
>
>
n,受影响的数量,联合国,男性,男性,女性,女性等(列联表?)p.summary(p.summary)
>
>
>不可替代的p.sample s(p.samples)(p.samples)
>p.samples(表型=表型。受影响,性别=性别。性别。男性)p.samples(表型=表型。受影响,性别=性别。性别。p.samples)
>样本对象
>s=下一步(p.samples())
>s.samples(p.samples)(p.samples())
>s;s.sample表型
>>s.s.表型
>>>
>>>>>>>s.s.s.
>;>;s.妈妈
>;>;s.dad
>;>;s.signals
>;>;s.kids
````
质量控制
----
我们可以查找在ped文件中定义的关系
与从vcf中的基因型派生的关系不匹配的情况。
``python
>;>pedagree import ped
>;>p=ped('court.ped')
>;>df=p.ped检查('court.vcf.gz')
>;df[df.error];显示样本对其中推断的与报告的不同。
```
[![重新绘制](http://pedagree.readthedocs.org/en/latest/\u images/ped check.png)(http://github.com/brentp/cyvcf2/)
一个明显的错误是当一个红色的点和蓝色的点聚集在一起时。*BR/***********〕具有非常低的IsS0比率,表明它们可能是亲子对。
>BR/>通过寻找Br/x染色体的非PAR区的杂合子频率,我们可以从VCF中确定性别:
Byth> Byth> Br/> Gt;& Gt;and gt;从PePosid导入Pb>gt;p= pED(‘队列’,pED’)
& Gt;>;gt;p.sex_check('court.vcf.gz',plot=true)
…列出所有样本,并在x上标出het、homref、homalt的数目,这样也可以创建一个像这样的图像,在这里我们可以看到一个清晰的样本合成图。[性情节](https://raw.githubusercontent.com/brentp/pedagree/master/images/sex-check.png)(http://github.com/brentp/cyvcf2/)
` pedagree“将酌情向stderr打印警告,例如:
````
系谱警告:'101811-101811'是父亲,但具有女性性别
系谱警告:'101897-101897'是父亲,但具有女性性别
系谱警告:'101896-101896'是自己的母亲
系谱警告:'102110-102110'是母亲,但具有男性性别
系谱警告:'102110-102110'是自己的母亲
系谱警告:'101381-101381'是父亲但有女性性别
系谱警告:'101393-101393'是母亲但有男性性别
未知样本:家庭102498-102498:k34175
未知样本:家庭11509-11509:k567331
未知样本:家庭5180-5180:k8565
```