pyspark-python数据帧在不同函数中的重用

def function1(): df_in_concern = sqlContext.read.parquet(...) df_in_concern = df_in_concern.filter(...) df_in_concern = df_in_concern.filter(...) def function2(): df_in_concern = sqlContext.read.parquet(...) df_in_concern = df_in_concern.filter(...) df_in_concern = df_in_concern.filter(...) def main(): function1() function2() if __name__ == "__main__": main()

1条回答

网友

1楼 · 发布于 2024-04-19 23:53:20

spark_dataframe.createOrReplaceTempView("tmp_table_name")可能是您的最佳选择，请按以下方式使用：

def read_table_first_time():
    df1 = spark.createDataFrame([("val",)],["key"])
    df1.createOrReplaceTempView("df1")

def read_table_again():
    df_ref = spark.table("df1")
    df_ref.show()

read_table_first_time()
read_table_again()

这个输出

+ -+
|key|
+ -+
|val|
+ -+

编程相关推荐

Javalog4j2。xml和log4j2test。eclipse中的xml
java映像未显示在surfaceview中
在Java中，能否在for之后立即放置if？
java调用构造函数的不同方式是什么？
java为什么不将其视为多重继承，而所有类都首先从对象类扩展，然后再扩展其他类
带有ms access的java不显示数据库结果
java Eclipse命令行URL参数切断https
java Android JNI回调似乎调用了一个随机方法
java Apache Camel处理XMLFile中声明的编码
java Bonita BPM不要等待Bonita的函数结束

相关问题更多 >

编程相关推荐

热门问题

热门文章

pyspark-python数据帧在不同函数中的重用

相关问题 更多 >

编程相关推荐

热门问题

热门文章

相关问题更多 >