在两个字典之间创建和匹配标记

2024-05-15 09:56:01 发布

您现在位置:Python中文网/ 问答频道 /正文

更新所以我有一种织物,有上千条线,看起来像这样

BRCA A2ML1错义突变TCsA-A1-A0SO A8K2U0 W408C

BRCA A2ML1错义突变TCsA-A8-A08P A8K2U0 R433H

BRCA A2ML1错义突变TCsA-B6-A0WZ A8K2U0 P1341L

我已经写了代码来捕获整行和第6个令牌(代码如下) 现在我正在尝试将第6个标记与它自己的行匹配。你知道吗

我希望得到的输出是,我正在尝试编写一个如下所示的输出文件(这只是几个示例)

A8K2U0 |START=1 END.....| R433H |BRCA A2ML1 Missense_Mutation TCsA-A8-A08P A8K2U0 R433H

和其他线路一样

A8K2U0 |START=1 END.....| P1341L |BRCA A2ML1 Missense_Mutation TCsA-B6-A0WZ A8K2U0 P1341L

这是我的字典代码:

lookup = defaultdict(list) 
wholelookup = defaultdict(list)
wholeline = defaultdict(list)
mydata = open('file.txt')

for line in csv.reader(mydata, delimiter='\t'):
    code = re.match('[a-z](\d+)[a-z]', line[-1], re.I)
    if code:      
       lookup[line[-2]].append(code.group(1))
       wholelookup[line[-2]].append(code.group(0))
       s=' '.join(line)
       wholeline[line[-2]].append(s)

Tags: 代码linecodelistappenda8错义defaultdict
1条回答
网友
1楼 · 发布于 2024-05-15 09:56:01

Question how do i use if statement to find out whether A177T is in COADREAD ZNF271 Missense_Mutation MAAA-AA-3947 Q14591 A177T?

琐碎地:

test_string = 'A177T'
to_search = 'COADREAD ZNF271 Missense_Mutation MAAA-AA-3947 Q14591 A177T'
if test_string in to_search:
    print "found", test_string

或根据DSM的建议:

test_string = 'A177T'
to_search = 'COADREAD ZNF271 Missense_Mutation MAAA-AA-3947 Q14591 A177T'
if test_string in to_search.split(' '):
    print "found", test_string

但我有一种明显的感觉,我误解了这个问题。你知道吗

相关问题 更多 >