比较字符串列表和字符串列表（python）

import csv newlist = csv.reader(open('newcomments.csv','rU'), dialect='excel') export = csv.reader(open('oldcomments.csv', 'rU'), dialect='excel') for row in newlist: olddomain=[] domain = row[0:] olddomain.append(domain) for item in olddomain: print item for row in export: newdomain=[] domain= row[0:] newdomain.append(domain) for item in newdomain: print item

3条回答

网友

1楼 · 编辑于 2024-04-27 14:58:15

你似乎在试图将旧的域名列表与新的域名列表进行比较。在建立了这些列表之后，您需要查看列表之间是否存在共性。

在这种情况下，我认为a^{}提供了更丰富的功能，使您的生活更轻松。示例：

>>> olddomains = set(['www.cisco.com', 'www.juniper.com', 'www.hp.com'])
>>> newdomains = set(['www.microsoft.com', 'www.cisco.com', 'www.apple.com'])
>>> olddomains.intersection(newdomains)
set(['www.cisco.com'])
>>>
>>> 'www.google.com' in newdomains
False
>>>

重写部分代码以使用集合如下所示：

# retain newlist, since that's the output from csv...
for row in newlist:
    olddomain = set([])
    domain = row[0]
    olddomain.add(domain.lower())   # use lower() to ensure no CAPS mess things up
    for item in olddomain:
        print item

你问的密码是：

if olddomain.intersection(newdomain) == set([]):
                    print "no match"
                else:
                    print "match"

我在确定使用set()还是list()时使用的一般规则：

如果保留元素的顺序很重要（包括能够用索引访问它们），请使用^{}
在任何其他情况下，使用^{}

编辑

既然你在问为什么我发布的代码会抛出一个TypeError，如果你以我的方式分配row，那么你需要使用row[0]，而不是row[0:]

>>> row = ['example.com', '', 'excomment', 'Parked Page']
>>> row[0:]
['example.com', '', 'excomment', 'Parked Page']
>>> row[0]
'example.com'
>>>

我改变了我的例子来反映这一点，因为我怀疑这就是问题所在。

网友

2楼 · 编辑于 2024-04-27 14:58:15

你很可能只是错过了偏执狂。请注意，以下两行是相等的，因为in和!=的operator precedences是相等的：

if   item in olddomain  != item in newdomain:
if ((item in olddomain) != item) in newdomain:

你可能想要：

if (item in olddomain) != (item in newdomain):

网友

3楼 · 编辑于 2024-04-27 14:58:15

试着让它成为一个集，做和操作。

示例：

在[1]：a=['a'，'b'，'c']

在[2]：b=['b'，'a'，'c']

在[3]：集合（a）和集合（b）

出[3]：{'a'，'b'，'c'}

在[4]：集合（b）==集合（a）&集合（b）

出[4]：对

编辑

相关问题更多 >

编程相关推荐

热门问题

热门文章