正则表达式匹配的词，其中包含模式，但也包括模式加上一些东西

all_keys = list(data.keys()) for i in range(len(all_keys)): if all_keys[i]!='Time': #print all_keys[i] pattern = re.compile(all_keys[i]) for j in range(len(specie_name_and_initial_values)): print re.findall(pattern,specie_name_and_initial_values[j][0])

def calculate_relative_data_based_on_initial_values(self,copasi_file,xlsx_data_file,data_type='fold_change',time='seconds'): copasi_tool = MineParamEstTools() data=pandas.io.excel.read_excel(xlsx_data_file,header=0) #uses custom class and method to get the list of lists from a file specie_name_and_initial_values = copasi_tool.get_copasi_initial_values(copasi_file) if time=='minutes': data['Time']=data['Time']*60 elif time=='hour': data['Time']=data['Time']*3600 elif time=='seconds': print 'Time is already in seconds.' else: print 'Not a valid time unit' all_keys = list(data.keys()) species=[] for i in range(len(specie_name_and_initial_values)): species.append(specie_name_and_initial_values[i][0]) for i in range(len(all_keys)): for j in range(len(specie_name_and_initial_values)): if all_keys[i] in species[j]: print all_keys[i]

1条回答

网友

1楼 · 发布于 2024-04-17 20:49:25

您不需要正则表达式来查找公共元素，set.intersection将查找list2中也在list1中的所有元素：

list1=['xyz','xyz2','other_randoms']
list2=['xyz']

print(set(list2).intersection(list1))
set(['xyz'])

另外，如果您想比较'xyz'和'xyz2'，您可以使用==notin，然后它将正确地返回False。你知道吗

您还可以更简洁地重写自己的代码：

for key in data:
    if key != 'Time':
        pattern = re.compile(val)
        for name, _ in specie_name_and_initial_values:
            print re.findall(pattern, name)

根据您的编辑，您设法将列表转换为字符串，其中一个选项是剥离[]：

all_keys = set([u'Cyp26_G_R1', u'Cyp26_G_rep1', u'Time'])

specie_name_and_initial_values = set(['[Cyp26_R1R2_RARa]', '[Cyp26_SRC3_1]', '[18-OH-RA]', '[p38_a]', '[Cyp26_G_rep1]', '[Cyp26]', '[Cyp26_G_a]', '[SRC3_p]', '[mRARa]', '[np38_a]', '[mRARa_a]', '[RARa_pp_TFIIH]', '[RARa]', '[Cyp26_G_L2]', '[atRA]', '[atRA_c]', '[SRC3]', '[RARa_Ser369p]', '[p38]', '[Cyp26_mRNA]', '[Cyp26_G_L]', '[TFIIH]', '[Cyp26_SRC3_2]', '[Cyp26_G_R1R2]', '[MSK1]', '[MSK1_a]', '[Cyp26_G]', '[Basal_Kinases]', '[Cyp26_R1_RARa]', '[4-OH-RA]', '[Cyp26_G_rep2]', '[Cyp26_Chromatin]', '[Cyp26_G_R1]', '[RXR]', '[SMRT]'])

specie_name_and_initial_values = set(s.strip("[]") for s in specie_name_and_initial_values)

print(all_keys.intersection(specie_name_and_initial_values))

输出：

set([u'Cyp26_G_R1', u'Cyp26_G_rep1'])

仅供参考，如果您在集合中有列表，您会得到一个错误，因为列表是可变的，所以不能散列。你知道吗

相关问题更多 >

编程相关推荐

热门问题

热门文章