我有一个具有当前结构的csv:
Glue中的结果表如下:
[我试图为CSV建立一个分类器,并将其添加到抓取工具中,但是由于引号仅出现在某些行中,所以它无法帮助Glue找到正确的模式,这是:
有什么想法吗?
您应该为此使用OpenCSV SerDe。
您的CREATE TABLE查询将如下所示:
CREATE EXTERNAL TABLE IF NOT EXISTS testtimestamp1(
`profile_id` string,
`creationdate` date,
`creationdatetime` timestamp
)
ROW FORMAT SERDE 'org.apache.hadoop.hive.serde2.OpenCSVSerde'
LOCATION 's3://<location>'
使用上述查询在雅典娜中创建表(而不是使用胶水)
一旦创建了表,请使用MSCK REPAIR TABLE <table_name>
来实际加载分区。