spark RDD中是否有类似于sql中的like函数的函数？

1条回答

网友

1楼 · 发布于 2024-04-20 10:03:07

使用RDD：

rdd = sc.parallelize(['192.168.1.1',
                      '192.168.1.2',
                      '192.168.1.3',
                      '123.123.123.123',
                      '1.1.1.1 2.2.2.2'])

要计算以192.168.1.开头的元素，可以执行以下操作：

>>> rdd.filter(lambda x: x.startswith('192.168.1.')).count()
3

注意filter()是一个转换，而count()是一个动作

对于数据帧：

您可以直接使用sql进行筛选：

>>> the_dataframe.filter('webIP LIKE "192.168.1.%"').count()

假设目标列是'webIP'

编程相关推荐

java为什么这个方法会重复它的循环？
swing如何在Java中拖放鼠标时获取鼠标信息？
java如何处理异常并向SSE客户端发送错误
java在一个我一直试图制作的简单计算器上遇到了问题
java如何使用黄瓜。类和参数化。在同一个跑步者级别上
测试并发性的javajunit
java致命错误：jenkins的身份验证失败
只要我修改服务器，java SSE客户端就会停止工作（服务器发送事件）
java通过JSP获取JSON到JS
java在3d应用程序中集成卫星图像或地图

使用RDD：

对于数据帧：

相关问题更多 >

编程相关推荐

热门问题

热门文章

spark RDD中是否有类似于sql中的like函数的函数？

使用RDD：

对于数据帧：

相关问题 更多 >

编程相关推荐

热门问题

热门文章

相关问题更多 >