我有以下调用 Rest API 的顺序。
GenerateFlowFile
↓
EvaluateJSONPath
↓
ReplaceText (for post data creation)
↓
InvokeHTTP
↓
EvaluateXPath
↓
Original FlowFile (which was generated by GenerateFlowFile)
因此,在“ReplaceText”处理器之后,原始数据将被新数据替换。
如何获取原始数据并使用调用API后产生的属性?
您可以使用
GenerateFlowFile
的直接输出关系维护原始流文件,并稍后使用 MergeContent
和模式 碎片整理 和 保留所有唯一属性 合并流文件,或者如果原始流文件内容足够小,您可以可以在更改流程文件内容之前将其移动到属性,然后在收到新数据后重新组合它们Update Attribute
/ReplaceText
。
两个通用答案是:
这些解决方案应该具有良好的扩展性并首先考虑。我个人觉得它们有点复杂,因此我在这里也提出了一个解决方法。
如果您正在执行 HTTP 请求,也许您可能只处理少量非常小的消息。在这种情况下,您可以考虑以下“技巧”来避免复杂性。
最简单的解决方法是将所有数据放在一起。无需拆分消息,只需将原始内容的副本放入属性中即可。无论内容中返回什么内容,此属性在您的 HTTP 请求之后仍然可用。
简单的解决方案是在 HTTP 请求之前使用
ExtractText
,并使用整个内容创建一个名为 original 之类的属性。
强制警告:属性设计得很小,因此存储在内存中。因此,将大量内容放入属性中可能会很快消耗您的内存。
为未来可能的读者提供的最终解决方法:如果您控制 HTTP 服务,或者至少了解规范,请考虑是否需要让输出也包含输入。通常不会,但有时你还是能得到它!