这是我们为gwas做的小项目
PACtool的Python项目详细描述
概要
pactool是一个对snp变体的控制/病例数据进行gwas分析的程序,并使用python 3实现。
-所有选定snp的每个变体的等位基因频率统一的对照和病例数据集
-两个选择的SNP之间的连锁不平衡性评估(计算d'和r平方)
-对提供的数据集进行关联测试,可选生成曼哈顿图和QQ图sembl变体效果预测数据库。
pactool限制:
-当前版本的pactool不支持对位于不同染色体上的变体进行分析。
请确保数据集中的所有snp都位于同一染色体上。
-??????????????????????输入文件格式必须按照HAPGEN2程序提供,可应用于各种基因组数据集合。
输入文件由行和列组成,其中每一行表示一个snp,列包含以下信息:
column_1:snp_id
-例如snp_0
-每个snp的唯一标识符
column_2:rs_id
-例如rs6054257
-或alte在基因组坐标上,pefix表示染色体,例如20-9150
columns_3:snp_坐标,基于ncbi构建36
-例如9150
column_4:reference等位基因
-表示核苷酸基
-例如c
column_5:alternative等位基因
-用碱基
-例如g
从第6列到最后一列:
-这些列包含每个样本的基因型。
每个样本的基因型由3列组成,由"0"和"1"数字组成,其中"1"的位置是GE的指示器。不是类型。
更具体地说,
-10 0--->;ref ref,参考等位基因纯合子
-0 1 0--->;ref alt,杂合子
-0 1--->;alt alt,替代等位基因纯合子-------------------------------------------------------------------------------
输出文件格式
输出文件遵循与上述输入文件相同的空格分隔文件格式。
是snp_id,而其余列保存来自各个统计测试和分析的值。
/>安装利用率
pactool可以从以下pypi页面下载:
https://pypi.python.org/pypi/pactool
目录):
其中三个参数是必需的,每次都必须提供,否则将收到错误消息。
请确保包含以下内容wing参数:
-controls_file表示包含控制示例的输入文件
-cases_file表示包含case samples的输入文件
-output指定每个输出文件的前缀
ed,以及一个带有snp_代码的文件(每行一个)来执行相应的操作:
-keep_snps仅保留所提供文件中指定的snps用于分析。
-remove_snps从以下分析中删除所提供文件中指定的snps。
上述操作也可以应用于样本(给定文件中的行应为例如。控制5或案例10):
-保留样本仅用于分析所提供文件中指定的控制/案例样本。
-移除样本从进一步分析中移除所提供文件中指定的控制/案例样本。
操作时,可以选择以下分析选项:
-等位基因频率计算对照样本、病例样本中的参考和替代变量的频率及其总频率。
输出文件"output"。频率w有7列:snp_code ref_freq_control alt_freq_control ref_freq_cases alt_freq_cases ref_freq_total alt_freq_total
-hwe,-hwe计算hardy-weinberg平衡和相应的p值。
输出文件"output"。hwe有3列:snp_code hwe_统计量p值
-ld snp1 snp2通过计算d'和r平方统计量估计两个给定snp是否处于连锁不平衡状态。snp1和snp2是必需的snp_代码。
将文件'output'.ld与4个列组合起来:snp1_code snp2_code d'r-squared
-association_test对每个snp执行基因型关联测试,并计算优势比(r=参考、a=替代或控制情况)
输出文件"output"。与8列的关联:snp_code locket ref alt p-value或_rr_ra或_rr_a a或_ra_aa
-曼哈顿为关联测试的p值绘制曼哈顿图。
仅当给定-association_test参数时才能使用。
-qqplot为关联测试的p值绘制qq图。
只能用于-给出关联测试参数
-get_info snp检索有关snp代码为snp的变量的信息。打印一个json格式的输出,其中包含从ensembl的vep数据库中获得的所有信息。
使用以下文件构建和测试:
gwas.cases.gen
,可从以下链接下载:
向运行生物信息学硕士课程"Bio-102编程入门"的团队致意,Uocrete,Heraklion。
作者是:christina chatzipantsiou(chatzipantsiou@gmail.com)
panayiotis linardos(mondestasz@gmail.com)
paschalis natsidis(pnatsidis@hotmail.com)
g所提供的电子邮件地址。
r/>https://opensource.org/license/mit
pactool是一个对snp变体的控制/病例数据进行gwas分析的程序,并使用python 3实现。
-两个选择的SNP之间的连锁不平衡性评估(计算d'和r平方)
-对提供的数据集进行关联测试,可选生成曼哈顿图和QQ图sembl变体效果预测数据库。
pactool限制:
-当前版本的pactool不支持对位于不同染色体上的变体进行分析。
请确保数据集中的所有snp都位于同一染色体上。
-??????????????????????输入文件格式必须按照HAPGEN2程序提供,可应用于各种基因组数据集合。
输入文件由行和列组成,其中每一行表示一个snp,列包含以下信息:
column_1:snp_id
-例如snp_0
-每个snp的唯一标识符
column_2:rs_id
-例如rs6054257
-或alte在基因组坐标上,pefix表示染色体,例如20-9150
columns_3:snp_坐标,基于ncbi构建36
-例如9150
column_4:reference等位基因
-表示核苷酸基
-例如c
column_5:alternative等位基因
-用碱基
-例如g
从第6列到最后一列:
-这些列包含每个样本的基因型。
每个样本的基因型由3列组成,由"0"和"1"数字组成,其中"1"的位置是GE的指示器。不是类型。
更具体地说,
-10 0--->;ref ref,参考等位基因纯合子
-0 1 0--->;ref alt,杂合子
-0 1--->;alt alt,替代等位基因纯合子-------------------------------------------------------------------------------
输出文件格式
输出文件遵循与上述输入文件相同的空格分隔文件格式。
是snp_id,而其余列保存来自各个统计测试和分析的值。
/>安装利用率
pactool可以从以下pypi页面下载:
https://pypi.python.org/pypi/pactool
目录):
请确保包含以下内容wing参数:
-controls_file表示包含控制示例的输入文件
-cases_file表示包含case samples的输入文件
-output指定每个输出文件的前缀
ed,以及一个带有snp_代码的文件(每行一个)来执行相应的操作:
-keep_snps仅保留所提供文件中指定的snps用于分析。
-remove_snps从以下分析中删除所提供文件中指定的snps。
上述操作也可以应用于样本(给定文件中的行应为例如。控制5或案例10):
-保留样本仅用于分析所提供文件中指定的控制/案例样本。
-移除样本从进一步分析中移除所提供文件中指定的控制/案例样本。
操作时,可以选择以下分析选项:
-等位基因频率计算对照样本、病例样本中的参考和替代变量的频率及其总频率。
输出文件"output"。频率w有7列:snp_code ref_freq_control alt_freq_control ref_freq_cases alt_freq_cases ref_freq_total alt_freq_total
-hwe,-hwe计算hardy-weinberg平衡和相应的p值。
输出文件"output"。hwe有3列:snp_code hwe_统计量p值
-ld snp1 snp2通过计算d'和r平方统计量估计两个给定snp是否处于连锁不平衡状态。snp1和snp2是必需的snp_代码。
将文件'output'.ld与4个列组合起来:snp1_code snp2_code d'r-squared
-association_test对每个snp执行基因型关联测试,并计算优势比(r=参考、a=替代或控制情况)
输出文件"output"。与8列的关联:snp_code locket ref alt p-value或_rr_ra或_rr_a a或_ra_aa
-曼哈顿为关联测试的p值绘制曼哈顿图。
仅当给定-association_test参数时才能使用。
-qqplot为关联测试的p值绘制qq图。
只能用于-给出关联测试参数
-get_info snp检索有关snp代码为snp的变量的信息。打印一个json格式的输出,其中包含从ensembl的vep数据库中获得的所有信息。
使用以下文件构建和测试:
,可从以下链接下载:
向运行生物信息学硕士课程"Bio-102编程入门"的团队致意,Uocrete,Heraklion。
作者是:christina chatzipantsiou(chatzipantsiou@gmail.com)
panayiotis linardos(mondestasz@gmail.com)
paschalis natsidis(pnatsidis@hotmail.com)
g所提供的电子邮件地址。
r/>https://opensource.org/license/mit