使用Python和MapReduce实现Top-N

-1 投票
0 回答
24 浏览
提问于 2025-04-12 06:46

我正在用Python写一个MapReduce算法,目的是找出观看次数最多的前十部电影。我用了两个映射器和两个归约器。第一个映射器输出的是(movid, 1),而第一个归约器的输出是电影ID和出现的频率(我们叫它计数器)。我想在保持代码分布式的情况下找到前十部电影。附上的图片是我的输出结果(电影ID,计数)。

在这里查看图片描述

0 个回答

暂无回答

撰写回答