使用Python进行Cassandra的MapReduce是否愚蠢?
因为Cassandra还没有内置MapReduce功能(我想在0.7版本中会有),所以我用我的Python客户端尝试MapReduce是不是太傻了,还是说我应该直接用CouchDB或Mongo之类的呢?
我的应用是用来收集统计数据的,所以我需要能够对值进行求和,并进行分组来增加计数器。假设我在做谷歌分析,我想跟踪哪些浏览器出现过,用户访问了哪些页面,以及访问次数和页面浏览量的对比。
我本来想在写入时直接更新我的计数器,但Cassandra在处理计数器方面也不是很好。
难道Cassandra根本就不适合这个用途吗?
谢谢!
2 个回答
3
MongoDB支持就地更新,这意味着它在处理计数器时表现得非常好。你可以查看这个链接了解更多信息:http://blog.mongodb.org/post/171353301/using-mongodb-for-real-time-analytics
6
Cassandra 从 0.6 版本开始支持 MapReduce 功能。(目前稳定的版本是 0.5.1,但你可以尝试一下 0.6.0-beta3 中的新 MapReduce 功能。)如果你想入门,建议先看看 'contrib/word_count' 里的单词计数示例。