相控单倍型hi-c数据处理、偏倚校正及结构分析库
HiCHap的Python项目详细描述
阶段性单倍型的hi-c数据处理、偏倚校正和结构分析库
导言
HiCHap是一个Python包,用于处理和分析Hi-C数据,主要用于使用阶段snp的二倍体Hi-C。 首先,HI-C读数在结扎连接位点分裂,然后将所有分割部分用于映射,以最大限度地利用SNP在等位基因分配中, 从而提高等位基因分配读的比率。噪音读数进一步消除。第二,除了传统的Hi-C实验造成的数据偏差外, 不均匀分布的遗传变异导致hi-c单倍型重建中的额外偏差,因为在染色质区域分配等位基因接触具有更密集的遗传变异可能更容易。 HiCHap使用两步策略,通过仅使用映射和等位基因分配的接触来减少这两种类型的数据偏差。 第三,随着hi-c单倍型重建质量的提高,hichap可以在单倍型水平上识别细胞的间隔、拓扑域/边界和染色质环。 并对这些结构的等位基因特异性进行了检测。 最后,hichap支持传统hi-c的数据处理、偏倚校正和结构分析,而不需要分离同源染色体。
要求
hichap是在unix系统上开发和测试的。hichap使用hdf5和cooler作为默认数据格式,以保持与4dn标准的一致。 总而言之,安装时需要以下软件包。
python包:
- Python2.7+
- 多进程
- 纽比
- 短发
- 统计模型
- SCIKIT学习
- XML
- 皮萨姆
- 温室气体管理
- 生物
- 冷却器
其他:
- bowtie2(测试版本2.2.9)
- samtools(测试版本1.5)
下载
- Source code and manual here
- Code and manual Repository(在github,跟踪包问题)