我想知道如何使用Python或R连接exon/DNA fasta文件
到目前为止,我非常喜欢为cbind方法使用rape包,这仅仅是因为fill.with.gaps=TRUE
属性。当一个物种缺失外显子时,我真的需要插入缝隙。在
我的代码:
ex1 <- read.dna("exon1.txt", format="fasta")
ex2 <- read.dna("exon2.txt", format="fasta")
output <- cbind(ex1, ex2, fill.with.gaps=TRUE)
write.dna(output, "Output.txt", format="fasta")
示例:
外显1.txt
^{pr2}$exon2.txt文件
>sp1
AGG-G
>sp2
CTGAT
>sp3
CTTTT
输出文件:
>sp1
AAAAAGG-G
>sp2
CCCCCTGAT
>sp3
----CTTTT
到目前为止,当我有多个exon文件(试图找出一个循环来打开并执行目录中以.fa结尾的所有文件的cbind方法)时,我在尝试应用此技术时遇到了困难,有时并不是所有文件都有长度相同的外显子,因此DNAbin停止工作。在
到目前为止,我已经:
file_list <- list.files(pattern=".fa")
myFunc <- function(x) {
for (file in file_list) {
x <- read.dna(file, format="fasta")
out <- cbind(x, fill.with.gaps=TRUE)
write.dna(out, "Output.txt", format="fasta")
}
}
然而,当我运行这个程序并检查我的输出文本文件时,它遗漏了许多外显子,我认为这是因为并非所有的文件都具有相同的外显子长度。。。或者我的剧本在某个地方失败了,我想不通
有什么想法吗?我也可以试试Python。在
如果您更喜欢使用Linux一行程序
如果您只想从输出文件使用唯一的记录
^{pr2}$我刚刚在Python 3中给出了这个答案:
很难对它进行全面的评论和解释,这可能对你没有帮助,但这总比什么都没有要好:p
我使用了Łukasz Rogalski的代码从应答到Reading a fasta file format into Python ^{} 。在
相关问题 更多 >
编程相关推荐