set（）不删除重复项

ips = [] # make a list count = 0 count1 = 0 for line in f: #loop through file line by line match = re.search("\d{1,3}\.\d{1,3}\.\d{1,3}\.\d{1,3}", line) #find IPs if match: #if there's a match append and keep track of the total number of Ips ips.append(match) #append to list count = count + 1 ipset = set(ips) print(ipset, count)

1条回答

网友

1楼 · 发布于 2024-05-17 14:35:54

您没有存储匹配的字符串。您正在存储^{} objects。即使它们匹配相同的文本，它们的比较也不相等，因此它们都被set对象视为唯一的：

>>> import re
>>> line = '137.43.92.119\n'
>>> match1 = re.search("\d{1,3}\.\d{1,3}\.\d{1,3}\.\d{1,3}", line)
>>> match1
<_sre.SRE_Match object; span=(0, 13), match='137.43.92.119'>
>>> match2 = re.search("\d{1,3}\.\d{1,3}\.\d{1,3}\.\d{1,3}", line)
>>> match2
<_sre.SRE_Match object; span=(0, 13), match='137.43.92.119'>
>>> match1 == match2
False

而是提取匹配的文本：

^{pr2}$

不带参数的^{}返回匹配的字符串部分（组0）：

>>> match1.group()
'137.43.92.119'
>>> match1.group() == match2.group()
True

相关问题更多 >

编程相关推荐

热门问题

热门文章

set（）不删除重复项

相关问题 更多 >

编程相关推荐

热门问题

热门文章

相关问题更多 >