基因突变先证者hpo项相似性的检测。
hpo-similarit的Python项目详细描述
患者组表型相似性
这估计了一组个体有多可能 表型。要估计这种可能性,我们需要三件事:
- 一种量化两个个体表型相似性的方法。我们使用最大值 每对 两个先证者的HPO条款。
- 一种量化两个以上先证者之间相似性的方法。我们总结表型 所有先证者的相似性评分。
- 这些先证者相似性得分的零分布,由 随机抽样的先证者组
P值的计算方法是模拟分数大于 观察先证者的得分。
安装
安装软件包时使用:
pip install hpo_similarity
运行
hpo_similarity --genes genes.json --phenotypes phenotypes.json
github上的数据目录包括示例文件,其中一个带有先证者ID 每个基因(data/example_genes.json),另一个 每个先证者都有hpo条款(data/example_phenotypes.json)。
其他选项:
--output PATH
将输出基因和p值发送到文件。--ontology PATH
使用默认之外的hpo本体文件。--iterations INTEGER
更改迭代次数(默认值=100000)
您还可以使用 python,例如:
fromhpo_similarityimportopen_ontologygraph,alt_ids,obsolete_ids=open_ontology()# find all descendant termsgraph.get_descendants('HP:0001249')# get the text for the phenotypic abnormalitygraph.nodes['HP:0001249']['name']
致谢
此代码包含以下代码和数据集:
- 一张python ontology parser 作者:塔玛斯·尼普兹。
- 来自 Human Phenotype Ontology Consortium。