如何从DF中获取pyspark（spark）中不包含值None的行

l = [[1], [1], [2], [2], [None]] df = sc.parallelize(l).toDF(['a']) df # DataFrame[a: bigint] df.collect() # [Row(a=1), Row(a=1), Row(a=2), Row(a=2), Row(a=None)] df.where(df.a == 1).count() # 2L df.where(df.a == None).count() # 0L

1条回答

网友

1楼 · 发布于 2024-05-16 04:45:44

您可以使用^{}方法：

df.where(df.a.isNull()).count()

另一方面，这种行为是可以从normal SQL query中得到的。因为NULL标记了“丢失的信息和不适用的信息”[1]，所以询问某个值是否等于NULL是没有意义的。它要么IS要么IS NOT丢失

Scala API提供了特殊的空安全等式<=>运算符，因此可以执行以下操作：

df.where($"a" <=> lit(null))

但如果你问我，这看起来不是个好主意。

1.Wikipedia, Null (SQL)

编程相关推荐

java本机方法的源代码可用吗？
java如何使父方法抛出异常？
java Android以编程方式设置不同屏幕大小/密度的布局
java如何使用一个变量来管理所有客户端请求
java输入一个txt文件，每行有一组数字
json java从jsonobject获取jsonarray错误
java将一个（WAV）写入一个文件只会说一个单词（最后一个单词）
java Telnet忽略原始字节
proguard java。运行桌面应用程序时出现lang.VerifyError
java用左键移动JLabel？

相关问题更多 >

编程相关推荐

热门问题

热门文章

如何从DF中获取pyspark（spark）中不包含值None的行

相关问题 更多 >

编程相关推荐

热门问题

热门文章

相关问题更多 >