我想提高sqoop导入的性能。我正在使用sqoop版本1.4.7,源数据库是oracle。我有一个事实,其中有将近1亿行。我想将此数据加载到hadoop中。我们可以在下面做几件事]
使用--m选项增加映射器。使用边界查询取得大小我不能使用直接查询。(因为这适用于MYSQL和postgres)
除了这些之外,还有其他方法可以改善性能。
谢谢库玛
嘿,您可以参考下面的站点以了解有关sqoop的性能调整的信息>>
https://community.cloudera.com/t5/Community-Articles/SQOOP-Performance-tuning/ta-p/248260