我们如何在Hadoop中导入非结构化和半结构化数据?导入结构化数据很容易,因为我可以使用Sqoop从MySQL直接导入。但是在非结构化数据的情况下该怎么办?
您只是通过文件系统API将其上传到HDFS
例如hadoop fs -put something.ext /tmp
hadoop fs -put something.ext /tmp
对于其他块存储也一样。它的行为没有任何不同。 HDFS添加的唯一一件事是,您需要考虑将文件拆分到多个数据节点之间后如何解析文件