Nifi 和 Kafka 现已在 Cloudera Data Platform、CDP 公共云中可用。 Nifi 擅长与一切对话,而 Kafka 是主流消息总线,我只是想知道:
我理想情况下会寻找适用于任何云的步骤,例如 Amazon AWS 和 Microsoft Azure。
我对遵循最佳实践并使用平台默认配置的答案感到满意,但如果有常见的替代方案,也欢迎这些。
将来将会有多种形式可供选择,目前我假设您的环境包含 1 个带有 NiFi 的数据中心和 1 个带有 Kafka 的数据中心。 (如果两者都在同一个数据中心上,答案仍然有效)。
除非另有说明,我已将所有内容保留为默认设置。
在 Kafka 数据中心集群中:
broker1.abc:9093,broker2.abc:9093,broker3.abc:9093
在 NiFi GUI 中:
GenerateFlowFile
处理器PublishKafka_2_0
,配置如下:GenerateFlowFile
处理器连接到您的 PublishKafka_2_0
处理器并启动流程这些是最少的步骤,可以在Cloudera文档中找到更广泛的解释。请注意,最佳实践是显式创建主题(此示例利用 Kafka 的功能,在生成主题时自动创建主题)。
可以很好地检查数据是否已写入 Kafka,是否再次使用它。
在 NiFi GUI 中:
ConsumeKafka_2_0
,配置其Properties如下:就是这样,在 30 秒内,您应该看到您发布到 Kafka 的数据现在再次流入 NiFi。
全面披露:我是 Cloudera 的员工,Cloudera 是 Nifi 背后的推动力。