有关Cloudera的Apache Hadoop(CDH)分布的具体问题。在发布问题之前,请先查看https://community.cloudera.com/。
在CDH 5上找不到Spark的类com.hadoop.compression.lzo.LzoCodec?
我已经在这个问题上工作了两天,仍然没有找到方法。问题:我们通过最新的CDH 5安装的Spark总是抱怨LzoCodec类丢失,即使我安装后...
Cloudera Agent安装失败,并显示错误“无法为其生成证书 ”
添加主机时,cloudera代理安装失败并出现以下错误/tmp/scm_prepare_node.EbLWUx2R无法为ubuntu生成证书,其中ubuntu是我的主机名,ip ...
在配置单元1.1中是否有任何日期函数来查找月份差异,如months_between或datediff(month,day1,day2)
我试图找出2019-04-01和2018-11-01之间的2个日期之间的月份差异,但我不会在hive1.1上使用months_between或datediff(month,day1,day2)函数。 ...
从Knox访问Cloudera上的kerberized WebHDFS
我一直在尝试让Apache Knox在一个kerberra Cloudera Cluster上运行。我下载了包含Knox的zip并安装了它。我还在sandbox.xml文件上对我的集群进行了特定的更改。 ...
我的Hive shell挂起了配置时的日志初始化[cloudera @ quickstart hive] $ hive 2017-03-01 08:23:50,909 WARN [main] mapreduce.TableMapReduceUtil:hbase-prefix-tree模块jar ...
我想更好地了解YARN和Spark之间的通信交流。例如:从触发Spark作业到分配......之间的情况会发生什么?
在cloudera中有一种方法可以使用CM-API或CURL一次更新配置列表吗?目前我正在使用以下CM API逐个更新。 services_api_instance ....
我计划从KNIME分析平台执行spark。为此,我需要在KNIME分析平台中安装KNIME spark执行器。任何人都可以让我知道如何安装KNIME ...
安装cloudera manager yum install cloudera-manager-agent时出错
安装cloudera manager yum install cloudera-manager-agent时出错我正在安装cloudera manager 5.5,但是遇到异常。提前致谢。以下是例外细节。 ...
在PySpark中的Graphframes上运行PageRank和BFS函数时出错
我是Spark的新手,我正在Cloudera Distr for Hadoop(CDH)上学习它。我正在尝试通过Jupyter Notebook执行PageRank和BFS功能,这是使用以下内容启动的...
将Parquet格式的Hive表数据索引到Cloudera Search / Solr
在启用了Kerberos的Cloudera集群中,我想将数据从具有Parquet数据格式的Hive表索引到Cloudera Search(Solr)。实现这一目标的最佳方法是什么?数据可能约为10-20 ......
在升级cloudera manager和cdh服务之前,我们是否需要禁用Kerberos和TLS。我计划将cloudera manager 5.9升级到5.11.2,但cloudera hadooop集群启用了kerberos并且......
我试图在hive中执行偏移查询,我试图排除特定记录,但总是得到以下错误:查询:从id限制1 OFFSET 1中选择样本顺序; ...
通过“1 Click Installer”更新Community Edition中的各个CDH组件
有人可以告诉我是否可以通过“1 Click Installer”为Community Edition将单个CDH组件从5.7更新到5.13?例如,假设我想只更新hadoop-hdfs -...
从Cloudera VM中的HDFS将数据加载到Hive表中
使用Cloudera VM时,如何访问HDFS中的信息?我知道HDFS没有直接的路径,但我也看不到如何动态访问它。创建一个Hive表后......
无法在端口7180上设置cloudera manager Web - 群集安装
我正在使用具有以下主机名的ubuntu本地计算机并尝试设置cloudera Hadoop Distribution CDH5。 chaithu @ localhost:〜$ hostname localhost chaithu @ localhost:〜$ hostname -f localhost chaithu @ ...
我正在尝试使用Cloudera Manager 5在EC2上创建一个用于测试目的的小集群。这些是我关注的方向,http://www.cloudera.com/content/cloudera-content/cloudera-docs / ...
我有什么时候洗牌开始的问题。假设我有2个映射器和1个减速器。每个映射器将生成输出map1和map2。这个map1和map2存储在各自的临时磁盘中......
在Windows上安装没有虚拟机/盒的Cloudera,是否可以使用任何软件包?
在Windows 2008 R2服务器版上,我们无法在vm上运行cloudera。因此,找出一个没有vm依赖的安装选项。我们可以这样做吗?
我正在研究Oozie自动化ETL,涉及100多个步骤。我能够在开发集群中成功创建工作流程。当我试图移动这个巨大的问题时......