使用BioPython根据restrictionsequence过滤FASTA文件

from Bio import SeqIO my_sequences = [] for record in SeqIO.parse(open("example.fa", "rU"), "fasta") : if "CCTACGG" in record.seq : #Works fine with CCTACGG my_sequences.append(record) output_handle = open("my_seqs.fasta", "w") SeqIO.write(my_sequences, output_handle, "fasta") output_handle.close()

1条回答

网友

1楼 · 发布于 2024-05-28 20:53:47

您可以通过Python的^{} module使用正则表达式来执行此操作：

import re

pattern = 'CCNNNGG'
regex = re.compile(pattern.replace('N', '[ACGT]'))
for record in SeqIO.parse(...):
    if re.search(regex, record.seq) is not None:
        my_sequences.append(record)

这会将模式中的每个'N'替换为'[ACGT]'，它将匹配这四个字符中的任何一个，然后在每个record.seq中搜索该模式。在

另外，请注意，您的示例不是很好—第二个示例也与该模式相匹配（它包含'CCCATGG'）—请参见results！在

编程相关推荐

java在panelgrid中填充包含行和列的列表
Java中swing JList作为选项卡
java Zookeeper与spotify kafka图像的cprestproxy连接失败
java maven 3.0+跳过“mvn部署”上的插件执行
多线程在Java中，如何在同一网络上的服务器和客户端之间创建同步连接？
java Hibernate JPA“未找到关联类”，使用另一个实体作为键，可嵌入作为值
java在javamail api中用于会话的库
java活动生命周期回调混乱？
产生乱码输出的java if语句
java我无法从RESTAPI URL获取JSON对象

相关问题更多 >

编程相关推荐

热门问题

热门文章

使用BioPython根据restrictionsequence过滤FASTA文件

相关问题 更多 >

编程相关推荐

热门问题

热门文章

相关问题更多 >