基本生物序列操作
nebseq的Python项目详细描述
照常导入
>>> import nebseq
反向补语
这里唯一要注意的是revcomp不检查输入 测序看看它是DNA还是RNA。
>>> nebseq.revcomp('ACGT') 'ACGT' >>> nebseq.revcomp('TTACC') 'GGTAA'
如果我们给它垃圾,它只会把垃圾还给我们。
>>> nebseq.revcomp('ZQ') 'QZ'
翻译
翻译功能应允许完全支持序列 翻译。包括修剪第一对 使用备用翻译表。还有 支持更深奥的翻译后修改 可以在一些genbank文件和翻译中找到 部分肽(如模糊坐标)。
基本翻译:
>>> nebseq.translate('TTGGCCAAGGAACGA', table=11) 'MAKER'
显示部分肽翻译的效果。默认情况下 第一个密码子应该是根据所选的 翻译表,如果不是,则转换为“x”
>>> nebseq.translate('GCCAAG') 'XK' >>> nebseq.translate('GCCAAG', partial=True) 'AK'
或者我们可以去掉模糊坐标的前两个基。
>>> nebseq.translate('TTGCCAAG', start=2, partial=True) 'AK'
修饰被指定为(索引,氨基酸)二元组。通知 将修改索引指定为 氨基酸序列。
>>> nebseq.translate('ATGAAGGAA', modifications=[(2, 'U')]) 'MUE'
提取
序列提取是为了当你想从一个较大的 顺序。如果您使用nebgb模块及其 从join(1..5,9..100)等字符串解析的位置定义。
>>> location = {'type': 'span', 'from': 4, 'to': 10} >>> nebseq.extract('ACCGTACCATAGTT', location) ('GTACCAT', (False, False)) >>> location = { ... "type": "complement", ... "segment": { ... "type": "join", ... "segments": [ ... {"type": "span", "from": 3, "to": 8}, ... {"type": "span", "from": 10, "to": 14} ... ] ... } ... } >>> nebseq.extract('ACCGTATTTCGGGGACAT', location) ('CCCCGAATACG', (False, False))