场景:我的Python脚本正在部署在rancher(kubernetes集群)中的docker容器中运行。因此容器总是在运行。我想实现一个方法,在我的HDFS中监视一个目录以获取传入的文件。如果有新的文件,我希望脚本执行进一步的操作(预处理步骤来整理数据)。处理完新文件后,应将其删除。之后,脚本也在等待新的传入文件来处理它们。 因此,它不应该是HDFS中的cronjob。我需要在脚本中的代码,这是由docker容器执行的。目前我正在使用hdfs cli连接到hdfs。但我需要用python来做。在
有没有人知道Python库或者其他的方法来实现它?在
相关问题 更多 >
编程相关推荐