mapreduce 相关问题

MapReduce是一种使用大量节点处理某些类型的可分发问题的大型数据集的算法

Windows 上的 Python Hadoop 流,脚本不是有效的 Win32 应用程序

我在使用 Hadoop Streaming.jar 在 Hadoop 上执行 MapReduce Python 文件时遇到问题。 我用: Windows 10 64 位 Python 3.6,我的IDE是spyder 3.2.6, Hadoop 2.3.0 jdk1.8.0_161 我可以得到答案

回答 2 投票 0

配置hadoop.service.shutdown.timeout属性

我需要配置 hadoop.service.shutdown.timeout 的值,因为当我们的 MR 作业停止时关闭钩子会触发超时: 2023-08-25 08:44:39,566 [警告] [Thread-0] [org.apache.hadoop.u...

回答 1 投票 0

SuiteScript - Map/Reduce - 没有上下文值从reduce 阶段传递到summary 阶段

我是新手,目前正在学习 SuiteScript。我无法理解为什么没有上下文值从reduce 函数传递到summary 函数。日志结果...

回答 1 投票 0

Hadoop:MapReduce 作业给出 Java 库错误

当我在 Cloudera VM 中运行任何 MapReduce 作业时,以下警告会连续出现 4-5 次。请让我知道如何解决它。 16/11/06 00:47:38 警告 hdfs.DFSClient:捕获异常...

回答 1 投票 0

python map 迭代一个列表并在另一个列表上运行函数

Python中的map函数是如何用于迭代一个列表(可迭代)并在另一个列表(可迭代)上执行逻辑的。例如,我们有一个索引列表作为索引,一个字符串列表作为 str_l...

回答 1 投票 0

map()、reduce() 和 filter 与 forEach()

刚刚学习MapReduce,所以想知道这样写有什么好处吗 常量初始值 = 0; if (this.items) { 返回 this.items.filter(函数 (项目) { 退货&a...

回答 3 投票 0

MapReduce RunningJob 界面中缺少配置键

我有一个要求,我需要以编程方式访问我之前在 MapReduce 作业上设置的一些配置值。我设置配置对象的方式 最终配置...

回答 0 投票 0

HDFS 中的数据节点与 Spark 集群中的执行器节点相同吗?

我正在学习 Apache Spark 和 HDFS。尽管我对一件事感到困惑,但我大部分都理解它们。我的问题是:HDFS中的数据节点和执行器是一样的吗

回答 4 投票 0

为什么C++标准库中有std::transform_reduce?

C++ 标准库中有 std::transform 和 std::reduce 函数。如果我们使用 std::transform_reduce 而不是 std::

回答 2 投票 0

Apache Pig 执行时间

我正在使用 EC2 运行 Pig 进行 WordCount 分析。我们被指示以本地模式运行 Pig。我想分析执行时间以与 MapReduce 进行比较,但我找不到检查方法...

回答 0 投票 0

使用 apache hadoop 安装/配置 apache ambari 有问题吗?

我已经安装并配置了一个4节点的hadoop集群。现在我想用hadoop集群配置apache ambari,原因很明显,让hadoop管理更简单、更直观。 我是...

回答 0 投票 0

运行 SuiteScript 时出现 MapReduce Netsuite 错误

遇到一个让我抓狂的问题,有人知道出了什么问题吗?尝试对 NetSuite 系统中的当前 S/O 进行映射缩减,调用已保存的搜索。 错误 无法评价

回答 1 投票 0

为什么我成功运行的mapreduce作业没有作为条目显示在资源管理器Web界面(0.0.0.0:8088)中?

您好,我已经完成了我的hadoop集群安装/配置。我已经运行了几个 MapReduce 测试,它们成功地返回了结果。然而,当我尝试在

回答 0 投票 0

我在windows操作系统上运行mapreduce时出现错误

我正在尝试运行 wordcount 示例但出现错误 在此处输入图像描述在此处输入图像描述 toi chua tim ra cach de giai quyet van de nay

回答 0 投票 0

我们什么时候不在Mapreduce中使用Combiner?

每个 Hadoop 开发人员都知道 Combiner 是优化 mapreduce 的关键,但它是可选的。它可以最小化带宽并提高 mapreduce 作业性能。我的问题是,hadoop 使许多功能...

回答 2 投票 0

pool.map() 不能在超过 2 个 CPU 上工作

我有以下代码: 导入 sentence_transformers 导入多处理 从 tqdm 导入 tqdm 来自多处理导入池 将 numpy 导入为 np embedding_model = sentence_transfo...

回答 0 投票 0

仅当字符是字母时如何打印?

这是我之前在这里的帖子: 仅当单词的最后一个字母是元音时如何返回 1?否则返回 0 这是我正在使用的代码: 导入系统 重新进口 pattern = re.compile("^[...

回答 2 投票 0

Java MapReduce 应用程序 Hadoop 中线程“主”java.lang.ClassNotFoundException 中的异常

导入java.io.IOException; 导入 java.util.HashMap; 导入 java.util.Map; 导入 java.util.StringTokenizer; // 兄弟让我们看看这个新包是否有效。 导入 org.apache.hadoop.conf.Configura...

回答 1 投票 0

IndexError:在 Python 中使用 map 时从空双端队列中弹出

我有以下代码,我试图在其中并行计算句子嵌入。 导入多处理 从 tqdm 导入 tqdm # 定义要并行执行的函数 ...

回答 1 投票 0

IndexError:在 Python 中使用 map 时从空双端队列中弹出

我有以下代码,我试图在其中并行计算句子嵌入。 导入多处理 从 tqdm 导入 tqdm # 定义要并行执行的函数 ...

回答 0 投票 0

© www.soinside.com 2019 - 2024. All rights reserved.