如何在pymongo中使用“group”来分组相似行？

9 投票

1 回答

5541 浏览

提问于 2025-04-16 11:54

我刚接触mongodb和pymongo，已经成功把我的数据导入到mongo里了。现在我想用分组功能把相似的行放在一起。比如说，我的数据看起来是这样的：

data = [{uid: 1 , event: 'a' , time: 1} , 
        {uid: 1 , event: 'b' , time: 2} ,
        {uid: 2 , event: 'c' , time: 2} ,
        {uid: 3 , event: 'd' , time: 4}
       ]

我该怎么用分组功能，根据uid字段把上面的行分组，输出结果应该是这样的呢？

 { {uid: 1} : [{uid: 1 , event: 'a' , time: 1} , {uid: 1 , event: 'b' , time: 2} ],
   {uid: 2} : [{uid: 2 , event: 'c' , time: 2} ],
   {uid: 3} : [{uid: 3 , event: 'd' , time: 4} ] }

我看过http://www.mongodb.org/display/DOCS/Aggregation上的例子。不过我觉得那些例子总是把数据合并成一个数字或一个对象。

谢谢，

pymongo mongodb 数据处理数据分析数据库操作数据分组聚合查询 uid字段

1 个回答

你并不一定要使用 reduce 函数来真正地“减少”什么东西。举个例子：

>>> coll.insert(dict(uid=1,event='a',time=1))
ObjectId('4d5b91d558839f06a8000000')
>>> coll.insert(dict(uid=1,event='b',time=2))
ObjectId('4d5b91e558839f06a8000001')
>>> coll.insert(dict(uid=2,event='c',time=2))
ObjectId('4d5b91f358839f06a8000002')
>>> coll.insert(dict(uid=3,event='d',time=4))
ObjectId('4d5b91fd58839f06a8000003')
>>> result = coll.group(['uid'], None,
                        {'list': []}, # initial
                        'function(obj, prev) {prev.list.push(obj)}') # reducer
>>> len(result) # will show three groups
3
>>> int(result[0]['uid'])
1
>>> result[0]['list']
[{u'event': u'a', u'_id': ObjectId('4d5b...0000'), u'uid': 1, u'time': 1},
 {u'event': u'b', u'_id': ObjectId('4d5b...0001'), u'uid': 1, u'time': 2}]
>>> int(result[1]['uid'])
2
>>> result[1]['list']
[{u'event': u'c', u'_id': ObjectId('4d5b...0002'), u'uid': 2, u'time': 2}]
>>> int(result[2]['uid'])
3
>>> result[2]['list']
[{u'event': u'd', u'_id': ObjectId('4d5b...0003'), u'uid': 3, u'time': 4}]

我在上面的列表中缩短了对象的ID，以便更容易阅读。

回答于 2025-04-16 由 Python大师

分享举报

如何在pymongo中使用“group”来分组相似行？

1 个回答

撰写回答