对MongoDB实例中的每个文档执行操作

2条回答

网友

1楼 · 编辑于 2024-04-24 12:49:22

数据库客户机往往从实际的数据库活动中抽象出来，因此观察到的延迟行为可能具有欺骗性。很可能您在这段时间内确实在敲打数据库，但是Python解释器对活动是完全隐藏的

也就是说，你可以做一些事情让它更轻

1）在更新所基于的属性A上建立索引。这将使它更快地返回

2）在您的find调用中放置一个投影操作符：

for doc in collection.find(projection=['A']):

这将确保您只返回需要返回的字段，并且如果您正确地索引了unique A属性，将确保您的结果完全来自非常快速的索引

3）使用update操作符确保只需将新字段发送回。与其发送整个文档，不如发回字典：

{'$set': {'B': a**2}}

它将在每个文档中创建字段B，而不影响任何其他内容

所以，整个街区看起来是这样的：

for doc in collection.find(projection=['A', '_id']):
    collection.update(filter={'_id': doc['_id']},
                      update={'$set': {'B': doc['A']**2}})

这将大大减少Mongo必须做的工作，以及（目前与您无关的）网络流量

网友

2楼 · 编辑于 2024-04-24 12:49:22

也许你应该在多个线程中进行更新。我认为最好是在一个线程中加载数据，将其分成多个部分，然后将这些部分传递给将执行更新的并行工作线程。它会更快

编辑：

我建议你做分页查询。 Python伪代码：

count = collection.count()
page_size = 20
i = 0;
while(i < count):
    for row in collection.find().limit(pageSize).skip(i):
        x = i**2
        collection.update(i, x);
    i += page_size

相关问题更多 >

编程相关推荐

热门问题

热门文章

对MongoDB实例中的每个文档执行操作

相关问题 更多 >

编程相关推荐

热门问题

热门文章

相关问题更多 >