dna-mtase基序检测序列的生成工具
metmap的Python项目详细描述
大都会地图
dna甲基转移酶结合基序质粒组装器
总体目的:
- 同时鉴定多个DNA甲基转移酶(DNA-MTase)的基序
快速启动
- 此脚本需要Python3.6或更新版本。
- 使用“pip install metmap”安装
- 这将在pythons bin文件夹中放置一个名为“run_metmap.py”的脚本。
- Linux:您应该能够从终端键入“run_metmap.py”
- windows:该脚本将放在python文件夹的“scripts”子文件夹中,您可以使用命令行中的“python path\to\python\scripts\run\metmap.py”运行它
- Mac:谁知道呢..可能像linux一样工作
测试
您可以下载tests/test_data.txt并运行run_metmap.py test_data.txt
这将生成一个cas1.fa和cas1.gb文件
概述:
- 你有一个具有多重DNA酶的有机体,你想知道它们各自的基序。
- 你用ngs获得所有甲基化dna位点的基序。
- 其中一些主题将包含模棱两可的基础,而另一些则不会
- 你把那些图案交给这个节目
- 然后,该程序按随机顺序将这些图案缝合在一起
- 根据iupac核苷酸编码,基序可能包含不明确的碱基。
- 我们不能合成很多模棱两可的碱基,所以在把它们放入最终的构造之前,我们先“去模棱两可”它们。
- 根据2条规则中的1条规则,解除约束:
- 规则1:
- 选取l个图案的随机变体。例如,Motif ATGNNTTA共有16个可能的实际序列如果l<;16,则程序将随机选取l个变体(无重复项)。如果L>;16,则每个可能的变体将被至少选择L/16次,有些将被选择1次以上
- 规则2:
- 为每个完全“非限制性”变体制作k个副本:例如,序列“SATC”将被视为2个序列:“GATC”和“CTAC”,每个序列将以k个副本出现。
- 规则1:
- 我们在每个图案之间加上n
- 程序将输出这些盒式磁带的p个版本
- 然后你将这盒磁带克隆到一个质粒中,每个质粒中有一个DNA酶。
- 然后你把这个文库转化成一个不会使DNA甲基化的有机体。
- 生长,收获,序列质粒。
- 是吗?
- 利润
Motif文件格式
- 图案应存储在标准文本文件中
- 每行一个基序,然后是逗号,然后是1或2,以指示此基序是否应使用规则1或2
示例:
ATGCATGCATGC,1
stgcagtcgttk,1
ATCNNNNAAA,2
CGTAGCANNNATCGATGC,2
iupac核苷酸编码:
code | nucs |
---|---|
R | A or G |
Y | C or T |
S | G or C |
W | A or T |
K | G or T |
M | A or C |
B | C or G or T |
D | A or G or T |
H | A or C or T |
V | A or C or G |
N | any base |