脊椎动物中保守tfbss的鉴定工具。
TFBS-footprinting的Python项目详细描述
tfbs_示意图
"transcription factors"通过kelvin13派生而来,用于cc by 3.0
基于jaspar数据库中的结合数据,tfbs足迹法使用575个位置权重矩阵(pwms)计算预测目标物种(如智人)中的转录因子结合位点(tfbs)。来自各种来源的额外实验数据用于支持或贬低这些预测:完整文档可在以下位置获得:阅读文档
1背景
2输出
4.1输入
- 选项1:CSV参数
- 选项2:ENSEMBL转录ID的简单文本文件
- jaspar tf id文件(不需要)
https://github.com/thirty6f/tfbs_footprinting"的示例文件tf悱ids.txt) [默认:所有JASPAR TFS]
("低"或"高")[默认值:"低"]-使用哪种ENSEMBL EPO物种对齐。低覆盖率包含的物种明显更多,建议采用。灵长类动物没有低覆盖率版本。
5过程
遍历每个用户提供的Ensembl转录ID:
- 从用户定义物种组(哺乳动物、灵长类动物、鱼类、蜥脚类)的ENSEMBL数据库中检索EPO对齐的同源序列,以获取用户提供的转录物ID启动子,在用户定义的TSS相对起始/终止位点之间。
- 编辑检索到的对齐方式: < > >
- 用空格字符"-"替换与核苷酸(ACGT)不对应的字符
- 从对齐中删除仅间隙的列。
- 从jaspar-po生成位置权重矩阵(pwms)位置频率矩阵(pfms)。
- 使用全部或用户定义的pwms列表对目标物种序列进行评分。
- 保持对数似然得分大于对应于p值0.001或用户定义p值的得分阈值的预测。
- 当目标物种的实验数据可用时,对目标序列区域的以下各项进行评分:
- 同源哺乳动物物种序列的dna序列保守性
- 接近CAGE支持的转录起始位点(TSS)
- 1800多个样本中靶基因与预测转录因子(tf)表达的相关性
- 接近芯片顺序确定的tfbss(gtrd项目)
- 接近影响目标基因表达的质量性状位点(eqtls)(gtex项目)
- 接近CPG
- 接近ATAC序列峰值(编码项目)
- 计算"结合亲和力得分"作为所有实验数据的得分之和。
- 根据结合亲和力得分对目标物种预测进行排序,生成一个矢量图形,显示映射到目标转录物启动子上的前10个(或用户定义的)唯一tfs,以及如下所述的附加输出。
6种
可以将任何列中任何物种的任何ensembl转录物的启动子区域与同一列的其他成员进行比较,以确定jaspar数据库中描述的575个转录因子的保守结合位点。Enredo Pecan-Ortheus管道用于在每一列物种之间建立全基因组比对。epo_low'表示该列还包含当前版本的测序仍被认为覆盖率较低的基因组。由于物种数量明显更多,我们建议使用低覆盖版本,除了灵长类比较没有低覆盖版本。此列表可能无法完全响应 <表><广告>