dna-mtase基序检测序列的生成工具

metmap的Python项目详细描述


大都会地图

dna甲基转移酶结合基序质粒组装器

总体目的:

  • 同时鉴定多个DNA甲基转移酶(DNA-MTase)的基序

快速启动

  • 此脚本需要Python3.6或更新版本。
  • 使用“pip install metmap”安装
  • 这将在pythons bin文件夹中放置一个名为“run_metmap.py”的脚本。
    • Linux:您应该能够从终端键入“run_metmap.py”
    • windows:该脚本将放在python文件夹的“scripts”子文件夹中,您可以使用命令行中的“python path\to\python\scripts\run\metmap.py”运行它
    • Mac:谁知道呢..可能像linux一样工作

测试

您可以下载tests/test_data.txt并运行
run_metmap.py test_data.txt
这将生成一个cas1.fa和cas1.gb文件

概述:

  • 你有一个具有多重DNA酶的有机体,你想知道它们各自的基序。
  • 你用ngs获得所有甲基化dna位点的基序。
    • 其中一些主题将包含模棱两可的基础,而另一些则不会
  • 你把那些图案交给这个节目
  • 然后,该程序按随机顺序将这些图案缝合在一起
  • 根据iupac核苷酸编码,基序可能包含不明确的碱基。
    • 我们不能合成很多模棱两可的碱基,所以在把它们放入最终的构造之前,我们先“去模棱两可”它们。
    • 根据2条规则中的1条规则,解除约束:
      • 规则1:
        • 选取l个图案的随机变体。例如,Motif ATGNNTTA共有16个可能的实际序列如果l<;16,则程序将随机选取l个变体(无重复项)。如果L>;16,则每个可能的变体将被至少选择L/16次,有些将被选择1次以上
      • 规则2:
        • 为每个完全“非限制性”变体制作k个副本:例如,序列“SATC”将被视为2个序列:“GATC”和“CTAC”,每个序列将以k个副本出现。
  • 我们在每个图案之间加上n
  • 程序将输出这些盒式磁带的p个版本
  • 然后你将这盒磁带克隆到一个质粒中,每个质粒中有一个DNA酶。
  • 然后你把这个文库转化成一个不会使DNA甲基化的有机体。
  • 生长,收获,序列质粒。
  • 是吗?
  • 利润

Motif文件格式

  • 图案应存储在标准文本文件中
  • 每行一个基序,然后是逗号,然后是1或2,以指示此基序是否应使用规则1或2 示例:
    ATGCATGCATGC,1
    stgcagtcgttk,1
    ATCNNNNAAA,2
    CGTAGCANNNATCGATGC,2

iupac核苷酸编码:

codenucs
RA or G
YC or T
SG or C
WA or T
KG or T
MA or C
BC or G or T
DA or G or T
HA or C or T
VA or C or G
Nany base

欢迎加入QQ群-->: 979659372 Python中文网_新手群

推荐PyPI第三方库


热门话题
java是否在servlet中检索上一页路径?   Java抱怨在开关的默认情况下未初始化最终字段   Java泛型:为什么编译器不能判断这个类<t>对象与这个类的类型参数的对象的类具有相同的类型?   Java:继承方法中使用的私有变量   HibernateJava。ClassCastException:java。lang.Integer不能强制转换为abc。def。我的项目。奥姆。EmployeeTopMetaData   http java发布和下载文件   java改进条件检查   java如何将2d数组的条目作为键放在地图中   java如何获取传递给运行时的值。getRuntime。JUnit测试用例中的exit(value)   java注释来创建所有可能的构造函数   自动建议列表:java。lang.IllegalArgumentException:在XPath表达式为null时找不到元素   为什么MapAPI在Java中不提供流功能?   gradle不导入本地java库   尽管我使用的是SessionCreationPolicy,java Spring安全性似乎仍在使用会话。无国籍   使用java查找MongoDB中数组元素的平均值