顺便说一句,我正在使用firehose将我的应用程序日志推送到redshift进行分析。
唯一性,主键和外键约束仅供参考;它们不是由Amazon Redshift强制执行的。尽管如此,主键和外键用作计划提示,如果您的ETL进程或应用程序中的某个其他进程强制执行其完整性,则应声明它们。
假设:T1和T2是同一Redshift集群中的表。
您可以(虚拟地)拥有任意数量的S3存储桶。对两个传输流使用相同的S3存储桶并不是一个好主意,因为Redshift执行的将数据加载到集群中的COPY命令将查找两个传输流的相同Manifest文件夹。
来自Amazon Kinesis Firehose FAQ:
问:我的Amazon S3存储桶中的清单文件夹是什么?
对于Amazon Redshift目标,Amazon Kinesis Firehose会生成清单文件,以便批量加载Amazon S3对象到Redshift群集。 manifests文件夹存储Firehose生成的清单文件。