将fastq文件读入字典问题的回答

将fastq文件读入字典

回答此问题可获得 20 贡献值，回答如果被采纳可获得 50 分。

我有一个这样的fastq文件（文件的一部分）： <pre><code>@A80HNBABXX:4:1:1344:2224#0/1 AAAACATCAGTATCCATCAGGATCAGTTTGGAAAGGGAGAGGCAATTTTTCCTAAACATGTGTTCAAATGGTCTGAGACAGACGTTAAAATGAAAAGGGG + \\YYWX\PX^YT[TVYaTY]^\^H\`^`a`\UZU__TTbSbb^\a^^^`[GOVVXLXMV[Y_^a^BBBBBBBBBBBBBBBBBBBBBBBBBBBBBBBBBBB @A80HNBABXX:4:1:1515:2211#0/1 TTAGAAACTATGGGATTATTCACTCCCTAGGTACTGAGAATGGAAACTTTCTTTGCCTTAATCGTTGACATCCCCTCTTTTAGGTTCTTGCTTCCTAACA + ee^e^\`ad`eeee\dd\ddddYeebdd\ddaYbdcYc`\bac^YX[V^\Ybb]]^bdbaZ]ZZ\^K\^]VPNME][`_``Ubb_bYddZbbbYbbYT^_ @A80HNBABXX:4:1:1538:2220#0/1 CTGAGTAAATCATATACTCAATGATTTTTTTATGTGTGTGCATGTGTGCTGTTGATATTCTTCAGTACCAAAACCCATCATCTTATTTGCATAGGGAAGT + fff^fd\c^d^Ycac`dcdcded`effdfedb]beeeeecd^ddccdddddfff`eaeeeffdTecacaLV[QRPa\\a\`]aY]ZZ[XYcccYcZ\\]Y @A80HNBABXX:4:1:1666:2222#0/1 CTGCCAGCACGCTGTCACCTCTCAATAACAGTGAGTGTAATGGCCATACTCTTGATTTGGTTTTTGCCTTATGAATCAGTGGCTAAAAATATTATTTAAT + deeee`bbcddddad\bbbbeee\ecYZcc^dd^ddd\\`]``L`ccabaVJ`MZ^aaYMbbb__PYWY]RWNUUab`Y`BBBBBBBBBBBBBBBBBBBB </code></pre> FASTQ文件每个序列使用四行。第1行以“@”字符开头，后跟序列标识符。第2行是DNA序列字母。第3行以“+”字符开头。第4行为第2行中的序列（在“+”之后和下一个“@”之前的部分）的质量值进行编码，并且必须包含与序列中字母相同数量的符号。在 我想把fastq文件读入这样的字典（关键是DNA序列，值是质量值，以“@”和“+”开头的行可以丢弃）： ^{pr2}$ 我写了下面的代码，但它没有给我我想要的。有人能帮我修正/改进我的代码吗？在 <pre><code>class fastq(object): def __init__(self,filename): self.filename = filename self.__sequences = {} def parse_file(self): symbol=['@','+'] """Stores both the sequence and the quality values for the sequence""" f = open(self.filename,'rU') for lines in self.filename: if symbol not in lines.startwith() data = f.readlines() return data </code></pre>

0 条评论
分类：Python问答

默认排序时间排序

1 个回答

匿名 1天前

　擅长：python、mysql、java

将fastq文件读入字典

1 个回答

相关Python问题