我有一个 Hive external 表“customer_main”映射到基于 .orc 的 HDFS 数据集,该数据集具有路径“/dev/customer/customer_main/”。如果我运行 INSERT INTO customer_main VALUES() 向 customer_main Hive 表中插入一行,该行是否也会附加到 /dev/customer/customer_main 中相应的 HDFS 数据集?或者这个插入仅限于 Hive 表?
简短的回答是肯定的。 Hive 仅存储表的位置,当您执行插入时,它将在该表位置中放置一个包含记录的新文件。
在读取时,它将读取所有数据文件,无论这些文件的来源是什么。