revtrans-执行肽序列的反向翻译
revtrans的Python项目详细描述
名称
revtrans-执行肽对齐的反向转换
从pepfile发送一组对齐的肽序列,并使用来自dna file的相应dna序列来构建对齐的反向翻译版本。
ptide序列是通过翻译找到的。
在典型情况下,这意味着用户只需要
提供dna和肽序列,并且可以安全地忽略
更高级的选项。例如:
如果指定,最终对齐将写入stdout或outfile,
,默认情况下为fasta格式。
options
-h
help。打印此帮助信息。
-gap in chars
指定输入序列中的间隔字符。
默认值为.-~'
-gapout char
指定应将哪个字符用于
输出中的间隔。
默认值为'-'
-idna format
指定i的格式nput dna文件。
有效格式为:auto(默认)、fasta、msf和aln
-ipep format
指定输入肽文件的格式。
有效格式为:auto(默认)、fasta、msf和aln
-o format
指定输出文件的格式。
有效格式为:fasta(默认情况下),msf和aln
-mtx tablename/file
使用替代翻译矩阵,而不是内置的标准遗传代码进行翻译。
如果"tablename"是1-6、9-16或21-23,则ncbi分类组定义的替代翻译表之一将是
使用。
支原体/螺旋体编码
5:无脊椎动物线粒体编码
6:纤毛虫、天蛾和六边形核编码
9:棘皮动物和扁形虫线粒体编码
10:游仆虫核编码
11:细菌和植物质体编码
12:代用酵母核代码
13:腹水线粒体代码
14:代用扁虫线粒体代码
15:睑缘核代码
16:叶绿体线粒体代码
21:吸虫线粒体代码
22:斜生栅藻线粒体代码
23:thraustochytrium线粒体代码
有关详细说明,请参见http://www.ncbi.nlm.nih.gov/taxonomy[遗传代码]
。请注意,还使用了起始密码子的表
(有关详细信息,请参见下面的-allinal选项
)。
;whitespace>;aa单字母代码必须包含所有64个密码子。终止密码子由"*"指定。T和U可以互换。空白行和以""开头的行将被忽略。
请参阅revtrans source
发行版中的"gcmitvertebrate.mtx"文件,以获取一个有充分文档记录的示例。
-allinternal
默认情况下,每个序列中的第一个密码子假定为初始密码子在成绩单上。这意味着某些非蛋氨酸密码子实际上在这个位置编码蛋氨酸。例如,标准遗传密码中的"ttg"(见上文)。dons.
-readthroughstop
允许在到达终止密码子后继续翻译。
终止密码子将标记为"*"。
请注意,终止密码子的寻址方式与输入肽序列中的相同。fy如何匹配相应的dna和肽
序列。有效的方法是:trans(默认)、name和pos.
请注意,无论采用何种匹配方法,dna和肽序列都应具有
唯一的名称。
trans:
通过翻译匹配序列。如果使用-mtx
选项,则使用标准遗传代码(默认值)或替代翻译矩阵翻译dna序列。
名称:
按名称匹配序列。请注意,对于fasta
文件,">;"之后的所有内容都被视为
序列名。
pos:
按位置匹配。序列通过文件中的位置
匹配(具有第一肽的第一个dna序列
序列等)。
-v
verbose。打印有关文件、序列和一般进度的额外信息到标准文档。
需要进行
调查。
-vv:verbose level 2
as level 1+
打印所有序列名的详细信息。
-vvv:verbose level 3
as level 2+
对
序列的去除长度进行健全检查。如果大小不匹配则发出警告。
author
rasmus wernersson,raz@cbs.dtu.dk
2002年9月、2003年2月、2004年7月、2005年4月参考文献:rasmus wernersson和anders gorm pedersen。根据氨基酸序列重新构建编码dna的序列。酸研究,2003,31(13),3537-3539。
revtrans-执行肽对齐的反向转换
从pepfile发送一组对齐的肽序列,并使用来自dna file的相应dna序列来构建对齐的反向翻译版本。
ptide序列是通过翻译找到的。
在典型情况下,这意味着用户只需要
提供dna和肽序列,并且可以安全地忽略
更高级的选项。例如:
如果指定,最终对齐将写入stdout或outfile,
,默认情况下为fasta格式。
options
-h
help。打印此帮助信息。
-gap in chars
指定输入序列中的间隔字符。
默认值为.-~'
-gapout char
指定应将哪个字符用于
输出中的间隔。
默认值为'-'
-idna format
指定i的格式nput dna文件。
有效格式为:auto(默认)、fasta、msf和aln
-ipep format
指定输入肽文件的格式。
有效格式为:auto(默认)、fasta、msf和aln
-o format
指定输出文件的格式。
有效格式为:fasta(默认情况下),msf和aln
-mtx tablename/file
使用替代翻译矩阵,而不是内置的标准遗传代码进行翻译。
如果"tablename"是1-6、9-16或21-23,则ncbi分类组定义的替代翻译表之一将是
使用。
支原体/螺旋体编码
5:无脊椎动物线粒体编码
6:纤毛虫、天蛾和六边形核编码
9:棘皮动物和扁形虫线粒体编码
10:游仆虫核编码
11:细菌和植物质体编码
12:代用酵母核代码
13:腹水线粒体代码
14:代用扁虫线粒体代码
15:睑缘核代码
16:叶绿体线粒体代码
21:吸虫线粒体代码
22:斜生栅藻线粒体代码
23:thraustochytrium线粒体代码
有关详细说明,请参见http://www.ncbi.nlm.nih.gov/taxonomy[遗传代码]
。请注意,还使用了起始密码子的表
(有关详细信息,请参见下面的-allinal选项
)。
;whitespace>;aa单字母代码必须包含所有64个密码子。终止密码子由"*"指定。T和U可以互换。空白行和以""开头的行将被忽略。
请参阅revtrans source
发行版中的"gcmitvertebrate.mtx"文件,以获取一个有充分文档记录的示例。
-allinternal
默认情况下,每个序列中的第一个密码子假定为初始密码子在成绩单上。这意味着某些非蛋氨酸密码子实际上在这个位置编码蛋氨酸。例如,标准遗传密码中的"ttg"(见上文)。dons.
-readthroughstop
允许在到达终止密码子后继续翻译。
终止密码子将标记为"*"。
请注意,终止密码子的寻址方式与输入肽序列中的相同。fy如何匹配相应的dna和肽
序列。有效的方法是:trans(默认)、name和pos.
请注意,无论采用何种匹配方法,dna和肽序列都应具有
唯一的名称。
trans:
通过翻译匹配序列。如果使用-mtx
选项,则使用标准遗传代码(默认值)或替代翻译矩阵翻译dna序列。
名称:
按名称匹配序列。请注意,对于fasta
文件,">;"之后的所有内容都被视为
序列名。
pos:
按位置匹配。序列通过文件中的位置
匹配(具有第一肽的第一个dna序列
序列等)。
-v
verbose。打印有关文件、序列和一般进度的额外信息到标准文档。
需要进行
调查。
-vv:verbose level 2
as level 1+
打印所有序列名的详细信息。
-vvv:verbose level 3
as level 2+
对
序列的去除长度进行健全检查。如果大小不匹配则发出警告。
author
rasmus wernersson,raz@cbs.dtu.dk
2002年9月、2003年2月、2004年7月、2005年4月参考文献:rasmus wernersson和anders gorm pedersen。根据氨基酸序列重新构建编码dna的序列。酸研究,2003,31(13),3537-3539。