AWS Glue非常适合将数据从原始格式转换为所需的任何格式,并使源和目标数据集保持同步。
无效数据包括:
胶水可以吗?如果数据已从源存储桶中删除,Glue最终不会在后续更新中将其从下游删除吗?
我是否需要其他工具(例如StreamSets,NiFi或带有AWS Batch的Step Functions进行此验证步骤,并且仅在数据进入湖中时才使用Glue?