从多个fasta文件中创建生物体和DNA序列数据列表

data_file = open("multitest.fas","r") data_tmp = [] a=[] #list for organisms name b=[] #list for sequence data for line in data_file: line = line.rstrip() line = line.strip("\n").strip("\r") for i in line: if line[0] == ">": a.append(line[1:]) if data_tmp: b.append("".join(data_tmp)) data_tmp=[] break else: line=line.upper() if all([k==k.upper() for k in line]): data_tmp.append(line) print a print b

1条回答

网友

1楼 · 发布于 2024-05-15 11:17:03

我已经用正则表达式做过了。希望你觉得有用。在

>>> import re
>>> data_file = open("multitest.fas","r")
>>> data=data_file.read()
>>> org=re.findall(r'>(\w*)',data) 
>>> org
['Organism1', 'Organism2']
>>> seq=[i.replace('\n','') for i in re.split(r'>\w*',data,re.DOTALL)[1:]]
>>> seq
['ACTGATGACTGATCGTACGTATCGATCGTAGCTACGATCGATCATGCTATTGTG', 'TACTGTAGCTAGTCGTAGCTATGACGATCGTACGTCGTACTAGCTGACTG']

编程相关推荐

使用jaxrpc的Java eclipse WebService客户端
java编程方式在对象上写入名称
java Spring批处理：重试后跳过
java Android错误：错误：任务执行失败：应用程序：transformClassesWithDexForDebug'
带有清单文件nullPointerException的java Android元数据
spring Java Quartz调度作业停止运行
JavaMockito：如何在不调用实际方法的情况下，模拟带有参数和无效返回类型的静态方法？
java Tomcat连接池问题无法在关闭的连接上调用方法
java如何交换列表中的项目？
java如何停止线程并通过Toast在线程中正确显示文本？

相关问题更多 >

编程相关推荐

热门问题

热门文章

从多个fasta文件中创建生物体和DNA序列数据列表

相关问题 更多 >

编程相关推荐

热门问题

热门文章

相关问题更多 >