利用单端和双端rna测序数据从基因转座子融合筛选插入突变中识别转座子插入的工具。
imfusion的Python项目详细描述
IM融合
im融合是一种识别转座插入位点的工具。 用单端和双端rna测序进行插入突变筛选 数据它从基因转座子融合中识别插入位点 在RNA测序数据中,表示 转座子和内生性基因。
im融合还使用 统计检验(基于泊松分布),通常识别 靶向基因(CTGS)–更常受插入影响的基因 比我们预料的要难得多。进一步缩小CTG的范围 可能包含数百个基因,im融合也检测ctg中的插入是否有 对基因表达有显著影响,这是一个强有力的指标 它们具有实际的生物效应。
IM Fusion具有以下关键功能:
- 它从单端和对端识别转座子插入位点 rna测序数据,没有任何特殊的测序要求。
- 它采用了以基因为中心的方法——两种方法都用于鉴定插入物 以及用于检测已识别候选基因的差异表达- 大大减少了假阳性候选基因的数量
- 它实现了多个外显子水平和基因水平的差异表达 测试,提供对插入对 目标基因的表达通过提供 一个单一的样本版本的测试,IM融合可以识别影响 在特定样本中进行一次插入,或确定 肿瘤队列中特定基因插入的影响。
关于该方法的更多细节和与现有方法的比较, 请看我们的手稿
文件
IM Fusion的文档可在 nki-ccb.github.io/imfusion
参考文献
De Ruiter J.R.,Kas S.M.^{EM1}$等人。“识别转座子插入及其 RNA测序数据的影响“核酸研究2017,,按。
许可证
这个软件是在麻省理工学院的许可下发布的。
历史
0.3.2(2017-05-11)
- 正确添加星融合支持到星定位仪(以前没有 完全合并)。
- 已将文档URL更改为新存储库。
0.3.1(2017-05-09)
- 对Python2.7兼容性的几个小修正。
- 修复了CTG测试中在 基因窗口。
- 替换了不推荐的.IX索引器在Pandas数据帧中的用法。
- 更新文件。
0.3.0(2017-05-04)
- 将外部工具重构到imfusion.external模块中。
- 使用docker/tox在本地对多个python版本进行测试。
- 增加了对输入的额外检查和改进的错误消息。
- 增加了对数据帧插入输入的支持,以取消测试功能。
- 作为imfusion构建的一部分,添加了exon gtf构建。
- 用恒星融合作为一部分对内源性融合的附加识别 不融合插入(使用星)还添加了用于构建的脚本 (鼠)恒星融合参考
- 使matplotlib/seaborn惰性导入仅在实际需要时 使用绘图功能。这使得im融合更易于使用 无头服务器/HPC
0.2.0(2017-03-09)
- 增加了对星定位仪的支持。
- 增加了使用StringTie检测新转录本的功能。
- 更改了引用构建以生成自包含的引用。
- 重构差异表达试验+添加基因水平试验。
0.1.0(2016-03年-26)
- GitHub上的第一个版本