如何将一个py文件中创建的sparkcontext导入/检查到另一个py文件中？

# Calling file name: main_file.py def fb_calling(): import file2 file2.fb_generaldata() f __name__ == "__main__": conf = SparkConf() conf.setAppName('fb_sapp') conf.setMaster('yarn-client') sc = SparkContext(conf=conf) fb_calling() # File:file2.py def fb_generaldata(): sc.parallelize('path')

1条回答

网友

1楼 · 发布于 2024-05-23 15:35:12

可以像这样将sparkContex作为参数传递给file2.py中的函数

# File:file2.py
def fb_generaldata(sc):
    sc.parallelize('path')

# main_file.py 
import file2

if __name__ == "__main__":
    conf = SparkConf()
    conf.setAppName('fb_sapp')
    conf.setMaster('yarn-client')
    sc = SparkContext(conf=conf)
    file2.fb_generaldata(sc)

根据您运行它的方式，您可能需要在导入之前将文件发送给您的工人，您可以使用sc.addPyFile("file2.py")或使用spark submit命令中的py-files参数来完成。在

编程相关推荐

junit cucumber为什么会找到“runTest.java”来运行测试？
在Eclipse中找不到java KeyPairGenerator
java NotSerializableException即使在实现Serializable之后
noclassdeffounderror（java字符串连接）为什么会出现这种异常？
java Guice：将接口绑定到由动态代理创建的实例
使用Spring数据neo4j创建空间索引时发生java错误
java对于需要在50多个excel文件上运行并且每个文件平均包含25k行的项目，最佳的方法是什么
javaNIO中的java缓冲区写入/发送消息问题
如何在Java/eclipse中添加不调用super（）的警告
JavaSpring:mvcUrl映射错误的id

相关问题更多 >

编程相关推荐

热门问题

热门文章

如何将一个py文件中创建的sparkcontext导入/检查到另一个py文件中？

相关问题 更多 >

编程相关推荐

热门问题

热门文章

相关问题更多 >