在rdd中基于现有列创建列

2条回答

网友

1楼 · 编辑于 2024-04-25 01:34:39

如果你想在RDD中构建这个，你可以试试这个

condition_Check = lambda v: 1 if v >= 10 else 0
NumericalElementsRDD = elementsRDD.map(lambda p: Row(g1=int(p[30]), g2=int(p[31]), g3=int(p[32]),success_fail=condition_Check(int(p[32]))))

使用数据帧或数据集而不是行类型可以提供更好的性能。在

网友

2楼 · 编辑于 2024-04-25 01:34:39

建造这个很容易。在

看，您创建了一个行的RDD。把它转换成数据帧很容易。在

NumericalElementsDF = NumericalElementsRDD.toDF()

在此之后，您可以使用函数withColumn()，此函数将创建或更新现有列，请参见here文档。在

那么，如何更新？使用此命令：

^{pr2}$

您可以看到，我使用了函数when()，它的工作原理与数据帧的if-seehere类似。在

对于python，如果将RDD转换为行的RDD。最好使用数据帧来获得更快的响应。在

编程相关推荐

Java子类在构造函数中少取1个参数
arraylist在java中使用堆栈将对象添加到数组列表中
java如何使用扫描仪或缓冲读取器读取输入文件，并统计输入文件中出现的所有特定字符
java围绕其中心逆时针旋转2D数组，同时保持数组大小
java输入后，println不会输出任何内容
java未知HK2故障多重异常
SimplePath中字段的java Querydsl 4 StringExpression
循环遍历java代码中的多个集合
socket inputstream在使用BOX java sdk时损坏
java什么是面颊新闻活动？

相关问题更多 >

编程相关推荐

热门问题

热门文章

在rdd中基于现有列创建列

相关问题 更多 >

编程相关推荐

热门问题

热门文章

相关问题更多 >