如何合并spark databricks中的行

+-------+----+------------------+ |ZipCode|Year|HPI_with_2000_base| +-------+----+------------------+ | 10583|1976| 16.66| | 10583|1977| 16.81| | 10583|1978| 18.37| | 10583|1979| 23.06| | 10583|1980| 24.37| | 10583|1981| 30.82| | 10583|1982| 32.46| | 10583|1983| 35.25| | 10583|1984| 42.15| | 10583|1985| 48.94| | 10583|1986| 57.22| | 10583|1987| 66.24| | 10583|1988| 76.98| | 10583|1989| 77.28| | 10583|1990| 74.44| | 10583|1991| 69.85| | 10583|1992| 70.86| | 10583|1993| 70.98| | 10583|1994| 71.39| | 10583|1995| 71.27| +-------+----+------------------+ only showing top 20 rows

1条回答

网友

1楼 · 发布于 2024-05-29 11:02:15

如果我正确理解了这个问题，您需要将条件Year >= 2000添加到当前SQL语句中。你的"似乎有点放错地方了，你需要用括号把ZipCode or ZipCode or ZipCode部分括起来。工作声明可以如下所示：

val df6 = spark.sql("""select ZipCode, Year, HPI_with_2000_base from df1 
                         where ZipCode IN(94122, 10583, 91411) and Year >= 2000""")

相关问题更多 >

编程相关推荐

热门问题

热门文章