我是一名Java开发人员,为apachespark编写(独立)应用程序。为了创建工件,我使用Gradle和ShadowJar插件。在
想用几个Python队友。目前,他们使用JetBrains PyCharm编写这些Python脚本,并在Spark集群环境中远程执行它们。但是,这个过程不能很好地扩展(如果涉及多个文件,该怎么办?)我在寻找Python生态系统的解决方案。问题是我和我的团队成员都不是Python专家(事实上,其他团队成员不是开发人员,但必须编写代码)。管理决策…,所以我们不知道什么是Python开发的最佳实践。在
我试过PyGradle,但它并不能很好地集成,尤其是与apachespark。我被一些名字绊倒了,比如Pip,Pex,Setuptools,VirtualEnv。那些工具是什么?它们是如何相互干扰的?在
为了防止X-Y问题:我想要一个可以构建(单元)测试并用一个命令打包的代码库(比如gradlebuild)。生成的工件应该能够在Spark集群上部署和执行。在
我也是这个世界的新人,想在人工智能启动过程中设置程序。我认为http://pybuilder.github.io/至少是自动化的好起点,因为我正在尝试在我们中间设置这个。在
相关问题 更多 >
编程相关推荐