提供DNA悬置错误退火数据(Potatov 2018)。
tatapov的Python项目详细描述
塔塔波夫
Tatapov是一个python库,它使人们可以方便地访问和探索DNA 下一篇文章中的过度错误退火数据 (available on arxiv):
应用连接优化金门装配 序列相关的保真度和偏差分析,Potapov Vladimir, 詹妮弗L.昂,丽贝卡B.库塞拉,布拉德利W.兰霍斯特, 凯瑟琳·比洛蒂,约翰·M·普赖尔,埃里克·J·坎托,巴里·坎顿, 托马斯F奈特,托马斯C埃文斯小,格雷戈里罗曼。2018年5月, https://doi.org/10.1101/322297
本文的补充资料提供了悬挑表 4种条件下的退火数据(25℃或37℃下01小时或18小时振荡)。 TATAPOV提供这些表(它将自动从ARXIV下载它们) 在第一次使用时)作为pandas数据帧,因此它们易于操作。
它还提供了构建和绘制数据子集的简单方法(绘制 需要安装matplotlib)。
用法示例
绘图
importtatapov# Get a subset of the data at 25C (1h incubation)data=tatapov.annealing_data["25C"]["01h"]# a pandas dataframeoverhangs=["ACGA","AAAT","AGAG"]subset=tatapov.data_subset(data,overhangs,add_reverse=True)# Plot the data subsetax,_=tatapov.plot_data(subset,figwidth=5)ax.figure.tight_layout()ax.figure.savefig("example.png")
在上面的图中,如果您看到除了 对角线,这意味着在你的悬挑之间有交叉对话(所以有可能退火错误)。 如果这些对中的一对看起来比其他对轻,这意味着 相应的悬挑具有弱的自退火(没有装配的风险)。
识别弱自退火悬挑
importtatapovannealing_data=tatapov.annealing_data['37C']['01h']# Compute a dictionary {overhang: self-annealing score in 0-1}relative_self_annealing=tatapov.relative_self_annealings(annealing_data)weak_self_annealing_overhangs=[overhangforoverhang,self_annealinginrelative_self_annealing.items()ifself_annealing<0.4]
识别具有重要交叉交谈的悬垂对
importtatapovannealing_data=tatapov.annealing_data['37C']['01h']# Compute a dictionary {overhang_pair: cross-talking score in 0-1}cross_annealings=tatapov.cross_annealings(annealing_data)high_cross_annealing_pairs=[overhang_pairforoverhang_pair,cross_annealingincross_annealings.items()ifcross_annealing>0.08]
安装
您可以通过pip安装tatapov
sudo pip install tatapov
或者,您可以解压缩文件夹中的源并键入
sudo python setup.py install
许可证=麻省理工学院
tatapov是一个开源软件,最初是在爱丁堡基因组上编写的。 由Zulko和 released on Github 在麻省理工学院的许可下(爱丁堡基因组铸造厂)。欢迎大家 贡献!
如果有任何关于版权的问题,请联系我们(不应该有 因为存储库不包含任何数据,而纸质数据可以 下载)。