如何使用带有python的ExecuteScript从nifi中的一个传入流文件创建多个流文件

from org.apache.commons.io import IOUtils from java.nio.charset import StandardCharsets from org.apache.nifi.processor.io import StreamCallback class PyStreamCallback(StreamCallback): def __init__(self): pass def process(self, inputStream, outputStream): f = open(inputStream, 'r') for x in f: comp = x[6:10] print("comp: ",comp) newFile = open(comp+"_file.txt","a") newFile.write(x) flowFile = session.get() if (flowFile != None): flowFile = session.write(flowFile, PyStreamCallback()) session.transfer(flowFile, REL_SUCCESS) session.commit()

1条回答

网友

1楼 · 发布于 2024-04-26 17:49:53

您直接写入文件系统中的文件，而不是NiFi生态系统中的对象flowfiles。我建议阅读Apache NiFi Developer's Guide以了解这些模式的上下文，并查看一些Python ExecuteScript examples以查看相关的Python代码

您需要创建多个flowfile对象，将数据映射到它们，然后将它们中的所有传输到相应的关系，而不是将单个flowfile写入

是否有理由需要使用自定义Python代码而不是^{}和/或^{}处理器来完成此任务？我认为PartitionRecord可以很容易地解决你描述的问题

相关问题更多 >

编程相关推荐

热门问题

热门文章