dna-mtase基序检测序列的生成工具

metmap的Python项目详细描述


大都会地图

dna甲基转移酶结合基序质粒组装器

总体目的:

  • 同时鉴定多个DNA甲基转移酶(DNA-MTase)的基序

快速启动

  • 此脚本需要Python3.6或更新版本。
  • 使用“pip install metmap”安装
  • 这将在pythons bin文件夹中放置一个名为“run_metmap.py”的脚本。
    • Linux:您应该能够从终端键入“run_metmap.py”
    • windows:该脚本将放在python文件夹的“scripts”子文件夹中,您可以使用命令行中的“python path\to\python\scripts\run\metmap.py”运行它
    • Mac:谁知道呢..可能像linux一样工作

测试

您可以下载tests/test_data.txt并运行
run_metmap.py test_data.txt
这将生成一个cas1.fa和cas1.gb文件

概述:

  • 你有一个具有多重DNA酶的有机体,你想知道它们各自的基序。
  • 你用ngs获得所有甲基化dna位点的基序。
    • 其中一些主题将包含模棱两可的基础,而另一些则不会
  • 你把那些图案交给这个节目
  • 然后,该程序按随机顺序将这些图案缝合在一起
  • 根据iupac核苷酸编码,基序可能包含不明确的碱基。
    • 我们不能合成很多模棱两可的碱基,所以在把它们放入最终的构造之前,我们先“去模棱两可”它们。
    • 根据2条规则中的1条规则,解除约束:
      • 规则1:
        • 选取l个图案的随机变体。例如,Motif ATGNNTTA共有16个可能的实际序列如果l<;16,则程序将随机选取l个变体(无重复项)。如果L>;16,则每个可能的变体将被至少选择L/16次,有些将被选择1次以上
      • 规则2:
        • 为每个完全“非限制性”变体制作k个副本:例如,序列“SATC”将被视为2个序列:“GATC”和“CTAC”,每个序列将以k个副本出现。
  • 我们在每个图案之间加上n
  • 程序将输出这些盒式磁带的p个版本
  • 然后你将这盒磁带克隆到一个质粒中,每个质粒中有一个DNA酶。
  • 然后你把这个文库转化成一个不会使DNA甲基化的有机体。
  • 生长,收获,序列质粒。
  • 是吗?
  • 利润

Motif文件格式

  • 图案应存储在标准文本文件中
  • 每行一个基序,然后是逗号,然后是1或2,以指示此基序是否应使用规则1或2 示例:
    ATGCATGCATGC,1
    stgcagtcgttk,1
    ATCNNNNAAA,2
    CGTAGCANNNATCGATGC,2

iupac核苷酸编码:

codenucs
RA or G
YC or T
SG or C
WA or T
KG or T
MA or C
BC or G or T
DA or G or T
HA or C or T
VA or C or G
Nany base

欢迎加入QQ群-->: 979659372 Python中文网_新手群

推荐PyPI第三方库


热门话题
jframe为什么JAVA paint()方法不起作用?   java Guice:将ContainerRequestContext注入拦截器   java如何优雅地关闭Spring JMS MessageListenerAdapter   java如何在Spring中设置快照隔离级别   Java中的安卓平台独立信任存储路径   java无法在eclipse中运行hello world程序   java Sinch空指针问题   使用Java将JSON流式传输到BigQuery   java从“大数据”中选择什么Swing控件?   java通过对象字段过滤/排序集合?   java将数据从活动传递到另一个活动中的片段   java访问打包在jar文件中的文档   Java获取事件的大小。getDragboard()。getFiles()。流()。映射(文件::长度)。toString());   java Android libgdx:启动程序图标按下后,启动屏幕不会立即显示   java如何在Google App Engine灵活环境中配置oracle jdk   java有没有办法减少这些行?   Java:客户端socket不读取第二行,在终止符行之后保持打开状态   java以编程方式获取api 29上的所有APK文件   java ActionBar按钮不显示