这是我们为gwas做的小项目

PACtool的Python项目详细描述


概要



pactool是一个对snp变体的控制/病例数据进行gwas分析的程序,并使用python 3实现。

-所有选定snp的每个变体的等位基因频率统一的对照和病例数据集
-两个选择的SNP之间的连锁不平衡性评估(计算d'和r平方)
-对提供的数据集进行关联测试,可选生成曼哈顿图和QQ图sembl变体效果预测数据库。

pactool限制:
-当前版本的pactool不支持对位于不同染色体上的变体进行分析。
请确保数据集中的所有snp都位于同一染色体上。

-??????????????????????输入文件格式必须按照HAPGEN2程序提供,可应用于各种基因组数据集合。
输入文件由行和列组成,其中每一行表示一个snp,列包含以下信息:


column_1:snp_id
-例如snp_0
-每个snp的唯一标识符

column_2:rs_id
-例如rs6054257
-或alte在基因组坐标上,pefix表示染色体,例如20-9150


columns_3:snp_坐标,基于ncbi构建36
-例如9150


column_4:reference等位基因
-表示核苷酸基
-例如c

column_5:alternative等位基因
-用碱基
-例如g


从第6列到最后一列:
-这些列包含每个样本的基因型。
每个样本的基因型由3列组成,由"0"和"1"数字组成,其中"1"的位置是GE的指示器。不是类型。
更具体地说,
-10 0--->;ref ref,参考等位基因纯合子
-0 1 0--->;ref alt,杂合子
-0 1--->;alt alt,替代等位基因纯合子-------------------------------------------------------------------------------


输出文件格式


输出文件遵循与上述输入文件相同的空格分隔文件格式。

是snp_id,而其余列保存来自各个统计测试和分析的值。

/>安装利用率

pactool可以从以下pypi页面下载:


https://pypi.python.org/pypi/pactool

目录):


其中三个参数是必需的,每次都必须提供,否则将收到错误消息。
请确保包含以下内容wing参数:

-controls_file表示包含控制示例的输入文件
-cases_file表示包含case samples的输入文件
-output指定每个输出文件的前缀

ed,以及一个带有snp_代码的文件(每行一个)来执行相应的操作:

-keep_snps仅保留所提供文件中指定的snps用于分析。
-remove_snps从以下分析中删除所提供文件中指定的snps。

上述操作也可以应用于样本(给定文件中的行应为例如。控制5或案例10):

-保留样本仅用于分析所提供文件中指定的控制/案例样本。
-移除样本从进一步分析中移除所提供文件中指定的控制/案例样本。

操作时,可以选择以下分析选项:

-等位基因频率计算对照样本、病例样本中的参考和替代变量的频率及其总频率。
输出文件"output"。频率w有7列:snp_code ref_freq_control alt_freq_control ref_freq_cases alt_freq_cases ref_freq_total alt_freq_total
-hwe,-hwe计算hardy-weinberg平衡和相应的p值。
输出文件"output"。hwe有3列:snp_code hwe_统计量p值
-ld snp1 snp2通过计算d'和r平方统计量估计两个给定snp是否处于连锁不平衡状态。snp1和snp2是必需的snp_代码。
将文件'output'.ld与4个列组合起来:snp1_code snp2_code d'r-squared
-association_test对每个snp执行基因型关联测试,并计算优势比(r=参考、a=替代或控制情况)
输出文件"output"。与8列的关联:snp_code locket ref alt p-value或_rr_ra或_rr_a a或_ra_aa
-曼哈顿为关联测试的p值绘制曼哈顿图。
仅当给定-association_test参数时才能使用。
-qqplot为关联测试的p值绘制qq图。
只能用于-给出关联测试参数
-get_info snp检索有关snp代码为snp的变量的信息。打印一个json格式的输出,其中包含从ensembl的vep数据库中获得的所有信息。


使用以下文件构建和测试:

gwas.cases.gen

,可从以下链接下载:


向运行生物信息学硕士课程"Bio-102编程入门"的团队致意,Uocrete,Heraklion。

作者是:christina chatzipantsiou(chatzipantsiou@gmail.com)


panayiotis linardos(mondestasz@gmail.com)
paschalis natsidis(pnatsidis@hotmail.com)

g所提供的电子邮件地址。

r/>https://opensource.org/license/mit

欢迎加入QQ群-->: 979659372 Python中文网_新手群

推荐PyPI第三方库


热门话题
反射Java反射:高负载下的NoSuchMethodException   java RxJava:one request>list of Integer>sequence of requests for each int>result to list   java为什么循环之前索引会增加   JavaSpring远程处理和RESTfulURL   java Hibernate搜索仅对我的实体的一部分进行索引   使用DPAD快速滚动时,java RecyclerView onCreateViewHolder调用过多   java将JSON解析到一个表中   java导航抽屉标题textview nullpointerexception   基于接口的Java链接队列   java Guice运行时依赖项参数重新注入   java展平/压缩ZSH中的深度嵌套目录   JavaSpring:Http406此请求标识的资源只能   java如何制作Android启动器图标   Java代码在windows上显示不正确(包含希腊语句子)   使用yourkit进行内存分析所用的java时间   java为什么可以序列化属性而不能序列化对象本身?