使用数据流的对象上的GroupByKey？

class Split(beam.DoFn): def process(self, element): pollId, answerId = element.split(",") return [{ 'pollId': pollId, 'answerId': answerId, 'votes': 1 }]

1条回答

网友

1楼 · 发布于 2024-04-18 01:23:31

一个答案是认识到你的每一个记录都可以描述为：

键：pollId + answerId
值：1 // The vote

如果有一个PCollection是这种形式的键/值对，那么可以对该集合执行一个CombinePerKey(sum)，该集合将使用相同的键对其值进行相加，从而生成一个新的PCollection，该集合由新的键/值对组成，其中它们的值是具有相同pollId的所有记录的总和和answerId。在

例如，请参阅CombinePerKeyPython文档以了解此函数的用法。在

编程相关推荐

arraylist IndexOutOfBoundsException预防措施不起作用[Java]
java在多个字段上设置唯一约束
java Sonar没有显示测试覆盖范围
java有没有一种直接从我的应用程序发送反馈的方法？
java如何将字符串中的两个值相加？
优先级队列Java TreeSet使用的内存是否比PriorityQueue少？
java如何合并两个参数相同的XML文件？
java RxJava过期订阅
编译器优化反编译工具修改的源代码。java中的类文件
Java Swing GUI按钮和文本字段不会出现。这是一个包含Jbutton和JTextField的测试代码

相关问题更多 >

编程相关推荐

热门问题

热门文章

使用数据流的对象上的GroupByKey？

相关问题 更多 >

编程相关推荐

热门问题

热门文章

相关问题更多 >