我有两个CSV文件,我想比较一个如下所示:
"a" 1 6 3 1 8
"b" 15 6 12 5 6
"c" 7 4 1 4 8
"d" 14 8 12 11 4
"e" 1 8 7 13 12
"f" 2 5 4 13 9
"g" 8 6 9 3 3
"h" 5 12 8 2 3
"i" 5 9 2 11 11
"j" 1 9 2 4 9
所以“a”包含数字1、6、3、1、8等等。实际的CSV文件有1000行长,所以在编写代码时,为了提高效率,您应该知道。在
第二个CSV文件如下所示:
^{pr2}$我已经编写了一些代码将这些CSV文件导入python中的列表中。在
with open('winningnumbers.csv', 'rb') as wn:
reader = csv.reader(wn)
winningnumbers = list(reader)
wn1 = winningnumbers[0]
wn2 = winningnumbers[1]
wn3 = winningnumbers[2]
wn4 = winningnumbers[3]
wn5 = winningnumbers[4]
print(winningnumbers)
with open('Entries#x.csv', 'rb') as en:
readere = csv.reader(en)
enl = list(readere)
我现在如何用第一个CSV文件搜索CSV文件2的交叉参考号4和wn1。所以它返回“b”中有wn1。我把它们作为一个列表导入,想看看我是否能想出办法来做,但结果只是绕了一圈。我也尝试过使用dict(),但没有成功。在
有重复的数字似乎不合逻辑,但如果您想获得每行的匹配数字的计数,而不考虑索引,则将nums设为一个集合,并将每行中的一个数字的次数相加:
使用您的输入将输出:
^{pr2}$假设您的文件是逗号分隔的,并且您的数字文件中每行都有一个数字。在
如果您真的想知道哪些数字(如果有的话)存在,那么您需要迭代该数字并打印我们集合中的每个数字:
不过,我也不确定重复的数字是否有意义。在
要根据匹配的数量对行进行分组,可以使用dict将sum用作键并附加第一列值:
结果:
键是数字匹配,值是与n个数字匹配的行id。在
如果我没听错,你想找到第一个索引(或所有索引)的数字在条目中获胜。如果你想要,你可以这样做:
这将打印条目中第一个中奖号码的索引(如果需要所有索引,请在注释中写下)。在
注意:这不是解决问题的最佳代码。如果您不熟悉Python更高级的特性,那么撤销和调试就更容易了。在
你可能应该考虑不缩短你的变量。
entries_reader
比readere
多花一秒钟的时间写,少花5秒就可以理解。在这是一种更快、更短、更节省内存的变体,但可能更难理解:
^{pr2}$可能不清楚的特征可能是}。让我们一个一个地看一遍。在
enumerate()
,any()
以及在for
中使用else
,而不是{要理解enumerate的这种用法,您需要理解以下语法:
变量}将根据列表中的值分配。在这种情况下,
a
和{a
将是1,b
将是2。使用此语法,我们可以执行以下操作:在每个迭代中,a和b分别是1和2、2和3、“垃圾邮件”和“鸡蛋”。在
假设我们有一个列表
a = ['spam', 'eggs', 'potatoes']
。enumerate()
只返回一个这样的“list”:[(1,'spam'),(2,'eggs'),(3,'potatos')]。所以,当我们这样使用它的时候line_index
将是1,2,3,e.t.cany()
函数接受一个序列(list,tuple,e.t.c.),如果其中的所有元素都等于True
,则返回{生成器表达式
mylist = [line[i] == winningnumbers[i] for i in range(len(line))]
返回一个列表,类似于以下内容:因此,
any
只有在条目中的所有数字都与中奖号码匹配的情况下才会返回True。在只有在
for
没有被break
中断时,for
部分中的代码才会被调用,因此在我们的情况下,设置一个默认索引返回是很好的。在相关问题 更多 >
编程相关推荐