分割一个fasta文件并基于第一个lin重命名

网友

1楼 · 编辑于 2024-05-14 14:39:18

既然你表明你在Linux系统上，那么“awk”似乎是合适的工具。

用法：
./foo.awk your_input_file

foo.awk:

#!/usr/bin/awk -f

/^>chr/ {
    OUT=substr($0,2) ".fa"
}

OUT {
    print >OUT
}

你也可以在一行中这样做：

awk '/^>chr/ {OUT=substr($0,2) ".fa"}; OUT {print >OUT}' your_input

网友

2楼 · 编辑于 2024-05-14 14:39:18

略显凌乱的脚本，但应该能处理大文件，因为它一次只能读取一行

要运行，您需要python thescript.py input.txt（或者它将从stdin读取，比如cat input.txt | python thescript.py）

import sys
import fileinput

in_file = False

for line in fileinput.input():
    if line.startswith(">"):
        # Close current file
        if in_file:
            f.close()

        # Make new filename
        fname = line.rstrip().partition(">")[2]
        fname = "%s.fa" % fname

        # Open new file
        f = open(fname, "w")
        in_file = True

        # Write current line
        f.write(line)

    elif in_file:
        # Write line to currently open file
        f.write(line)

    else:
        # Something went wrong, no ">chr1" found yet
        print >>sys.stderr, "Line %r encountered, but no preceeding > line found"

网友

3楼 · 编辑于 2024-05-14 14:39:18

如果你发现自己想用FASTA/FASTQ文件做更复杂的事情，你应该考虑Biopython。

这里有一篇关于修改和重新编写FASTQ文件的文章：http://news.open-bio.org/news/2009/09/biopython-fast-fastq/

还有一个关于拆分FASTA文件的问题：http://lists.open-bio.org/pipermail/biopython/2012-July/008102.html

相关问题更多 >

编程相关推荐

热门问题

热门文章

分割一个fasta文件并基于第一个lin重命名

相关问题 更多 >

编程相关推荐

热门问题

热门文章

相关问题更多 >