python dict:get与setdefau

3条回答

网友

1楼 · 编辑于 2024-05-14 17:38:17

agf接受的答案并不是将like与like进行比较。之后：

print timeit("d[0] = d.get(0, []) + [1]", "d = {1: []}", number = 10000)

d[0]包含一个包含10000个项的列表，而在之后：

print timeit("d.setdefault(0, []) + [1]", "d = {1: []}", number = 10000)

d[0]只是[]。i、 e.d.setdefault版本从不修改存储在d中的列表。代码实际上应该是：

print timeit("d.setdefault(0, []).append(1)", "d = {1: []}", number = 10000)

而且事实上比错误的setdefault示例更快。

这里的区别实际上是因为当您使用连接进行追加时，每次都会复制整个列表（并且一旦有10000个元素开始变得可测量）。使用append列表更新按O（1）摊销，即有效的恒定时间。

最后，在最初的问题中还有两个未考虑的选项：defaultdict，或者只是测试字典，看看它是否已经包含了密钥。

所以，假设d3, d4 = defaultdict(list), {}

# variant 1 (0.39)
d1[key] = d1.get(key, []) + [val]
# variant 2 (0.003)
d2.setdefault(key, []).append(val)
# variant 3 (0.0017)
d3[key].append(val)
# variant 4 (0.002)
if key in d4:
    d4[key].append(val)
else:
    d4[key] = [val]

到目前为止，variant 1是最慢的，因为它每次都会复制列表，variant 2是第二慢的，variant 3是最快的，但如果您需要2.5以上的Python，它就不起作用，variant 4只是比variant 3慢一点。

如果可以的话，我会说使用variant 3，使用variant 4作为那些defaultdict不完全适合的地方的选项。避免两种原始变体。

网友

2楼 · 编辑于 2024-05-14 17:38:17

您可能需要查看collections模块中的defaultdict。以下内容与您的示例相同。

from collections import defaultdict

data = [('a', 1), ('b', 1), ('b', 2)]

d = defaultdict(list)

for k, v in data:
    d[k].append(v)

还有更多的here。

网友

3楼 · 编辑于 2024-05-14 17:38:17

你的两个例子做了同样的事情，但这并不意味着get和setdefault做了。

两者之间的区别基本上是每次都手动设置d[key]指向列表，而setdefault只在列表未设置时才自动设置d[key]指向列表。

使这两种方法尽可能相似，我运行

from timeit import timeit

print timeit("c = d.get(0, []); c.extend([1]); d[0] = c", "d = {1: []}", number = 1000000)
print timeit("c = d.get(1, []); c.extend([1]); d[0] = c", "d = {1: []}", number = 1000000)
print timeit("d.setdefault(0, []).extend([1])", "d = {1: []}", number = 1000000)
print timeit("d.setdefault(1, []).extend([1])", "d = {1: []}", number = 1000000)

得到了

0.794723378711
0.811882272256
0.724429205999
0.722129751973

因此setdefault比get快10%。

通过get方法，您可以比使用setdefault做的更少。即使不想设置密钥，也可以使用它来避免在密钥不存在时（如果这是经常发生的情况）获得KeyError。

有关这两种方法的更多信息，请参见Use cases for the 'setdefault' dict method和dict.get() method returns a pointer。

关于setdefault的线程得出结论，大多数情况下，您希望使用defaultdict。关于get的线程得出结论，它速度很慢，而且通常您最好（从速度上看）执行双重查找、使用defaultdict或处理错误（取决于字典的大小和您的用例）。

相关问题更多 >

编程相关推荐

热门问题

热门文章