来自popoulation基因组数据集的遗传多样性度量。

pypgen的Python项目详细描述


Pypgen为评估标准基因提供了多种实用工具 多样性措施,包括GST、G'ST、G'ST和JOST D 基因组数据集(Hedrick,2005;Jost,2008;Masatoshi Nei,1973;Nei&; 切瑟,1983年)。Pypgen在单个SNP上同时操作 以及用户定义的区域(例如,平铺的5千基窗口 在每个染色体上)。对于窗口分析,Pypgen估计 每个估计器的多轨迹版本。

特点:

  • 处理多等位snp调用
  • 允许单个VCF文件包含多个填充
  • 按标准VCF (Variant Call Format)操作 格式化的snp呼叫
  • 使用bgziped输入 用于快速随机访问
  • 利用多个处理器核
  • 计算其他度量:
    • 每个窗口的snp计数
    • 每个窗口的平均读取深度(+/-stdev)
    • 每个单核苷酸多态性具有固定等位基因的群体
    • 我想得更多

重要提示:

Pypgen仍在积极开发中,几乎肯定包含 漏洞。如果发现错误,请在的issues section中提交报告 github存储库,我会尽快解决它。

所附脚本:

  • 滑动窗口分析(vcf_sliding_window.py)
  • 根据SNP分析(vcf_snpwise_fstats.py)

依赖性:

安装:

首先安装samtools。在os x上,我建议使用homebrew来实现这一点。安装samtools并在终端中可用后,您可以使用pip或setuptools安装当前版本的pypgen:

pip install pypgen

或者,

easy_install pypgen

或者,如果您喜欢生活在边缘,可以从github克隆并安装当前的开发版本。

pip install -e git+https://github.com/ngcrawford/pypgen.git

文档:

将提供更详细的文档,但同时可以通过运行:

python [script name].py --help

输出:

注意:这可能会改变。

vcf_滑动窗口.py:

  • chrm=染色体名
  • start=窗口的起始位置
  • stop=窗口的结束位置
  • snp_count=窗口中snp的总数
  • total_depth_mean=整个窗口的平均读取深度
  • total_depth_stdev=读取深度的标准偏差 窗口
  • pop1.sample_count.mean=对于“pop1”,每个snp的平均样本数
  • pop1.sample_count.stdev=每个snp的样本标准偏差 对于-“pop1”
  • pop2.sample_count.mean=对于“pop2”,每个snp的平均样本数
  • pop2.sample_count.stdev=每个snp的样本标准偏差 对于“POP2”
  • pop2.pop1.d_est=多位点目标(jost 2008)
  • pop2.pop1.g_double_prime_st_est=(Meirmans&hedrick 2011年)
  • pop2.pop1.g_prime_st_est=标准GST(Hedrick 2005)
  • pop2.pop1.gst_est=fst根据样本大小进行了更正,并允许 多等位基因座(nei&chesser 1983)
  • 继续……

vcf_snpwise_fstats.py:

  • chrm=染色体名
  • pos=snp的位置
  • outgroups=样本数
  • pop1=人口id
  • pop1.pop2.d_est=多位点目标(jost 2008)
  • pop1.pop2.g_double_prime_st_est=(梅尔曼和亨德里克 2011年)
  • pop1.pop2.g_prime_st_est=标准GST(Hedrick 2005)
  • pop1.pop2.gst_est=fst根据样本量和 一允许多等位基因座(nei&chesser 1983)
  • pop1.pop2.hs_est
  • pop1.pop2.ht_est
  • 继续……,
  • pop1_fixed=如果样本固定在特定等位基因处,则 标志设置为1(二进制为“真”)。
  • 继续……

欢迎加入QQ群-->: 979659372 Python中文网_新手群

推荐PyPI第三方库


热门话题
java ActiveMQ 5.9.0、Glassfish 3.1.2和MDB用于长时间的消息处理   从main调用的对象数组的Java字符串表示形式   java如何在iText 7中为泰国字母上方的双标记设置GPO   编译如果Java6工件是用Java6、7或8编译的,这有关系吗?   image Java KeyListener未检测到键盘输入   java找不到符号(构造函数)   java如何使Kafka使用者从特定主题分区读取Spring Boot   Java readLine()返回null   从CSV文件计算值时出现java系统错误   java如何避免处理程序。被调用后延迟(可运行运行)?   Java Do和While验证   java如何访问父类型的ArrayList中的子方法?   java如何使用Deepfirstsearch算法获得最高级别的搜索   xml使用SAX解析器Java正确构建字符串   Android片段中的java Toast显示空指针expn   如何在java中将多个文件合并到另一个新文件中?   java在运行时在JVisualVM中更改应用程序的标题   javajavax。命名。NoInitialContextException:需要在环境或sys中指定类名