mapreduce 相关问题

MapReduce是一种使用大量节点处理某些类型的可分发问题的大型数据集的算法

获得表现指标

如何获取mapreduce应用程序的性能指标我在命令行中运行，如CPU使用率，网络带宽。 IO带宽...但以适当的方式我可以保存结果并可视化......

hadoop mapreduce

回答 1 投票 0

MapReduce Reducer的KeyOut类型

我编写了Map and Reduce程序，其中Reducer的Output键和值与输入或Mapper的输出不同。我在Driver的课上做了相应的更改。这是我得到的例外......

hadoop mapreduce

回答 2 投票 0

Hive中的窗口函数

我正在Hive中探索窗口函数，我能够理解所有UDF的功能。虽然，我无法理解我们使用的分区和顺序...

sql hive mapreduce hadoop-partitioning ranking-functions

回答 1 投票 2

Hive错误：FAILED：执行错误，从org.apache.hadoop.hive.ql.exec.mr.MapRedTask返回代码2

我在HDFS上使用了flume的twitter数据。有3个节点集群和MySQL Metastore用于配置单元。当我执行下面的查询时，选择user_name.screen_name，user_name.followers_count from ...

java hadoop mapreduce hive

回答 1 投票 0

哪个更适合日志分析

我必须使用Hadoop相关工具分析存储在生产服务器上的Gzip压缩日志文件。我无法决定如何做到这一点，以及使用什么，这里有一些方法我...

hadoop mapreduce apache-spark apache-storm flume

回答 4 投票 2

k折交叉验证模型选择方法

我想知道我们如何从k-fold交叉验证方法中选择模型。在k折交叉验证中，我们可以使用k模型的平均精度获得k个模型和精度分数。你能 ...

machine-learning mapreduce ensemble-learning

回答 1 投票 1

ApplicationMaster退出代码杀死的容器是143

我在几种情况下遇到以下错误：2017-03-23 11：55：10,794 INFO [AsyncDispatcher事件处理程序] org.apache.hadoop.mapreduce.v2.app.job.impl.TaskAttemptImpl：诊断报告.. 。

hadoop hive mapreduce hadoop2

回答 2 投票 3

Python：期望缩进块

我试图用mapreduce运行2个python程序，每当我运行它们时都会出现错误。下面是2个文件的代码。它一直告诉我，预计有一个缩进的块错误......

python hadoop mapreduce

回答 2 投票 -1

如何将key为null且setNumReduceTasks（0）为MapReduce程序中的分隔符指定空格

我试过conf.set（“mapreduce.output.textoutputformat.separator”，“”）;但它没有用。 O / P正在获取{tab space} val1 {tab space} val2 O / P预期val1 val2

java hadoop mapreduce bigdata

回答 1 投票 0

“步骤1的计数器：没有计数器发现”使用Hadoop和mrjob

我有一个python文件在Hadoop（版本2.6.0）上使用mrjob来计算bigrams，但我没有得到我希望的输出，我在解码终端输出时遇到问题...

python python-2.7 hadoop mapreduce mrjob

回答 2 投票 2

Map-Reduce作业无法提供预期的分区文件

在Map-Reduce作业中，我使用五个不同的文件，其中我的数据集中包含两个类别P和I下的值。在找到特定值后，我将这些传递给I-part-r-00000文件...

java mapreduce hadoop2 hadoop-partitioning

回答 1 投票 0

在python中的列表列表中使用已定义的函数

我有一个定义的函数：def map（id，txt）：mapop = [] words = txt.split（）用于单词的单词：tmp =（word，id，1）mapop.append（tmp）return mapop我试过了申请这个......

python mapreduce

回答 2 投票 -2

Pydoop mapreduce“AttributeError：module'wordcount_minimal'没有属性'__main__'”

我安装了Pydoop并尝试运行MapReduce作业。为了做一个干运行，我尝试执行单词计数示例wordcount_minimal.py和wordcount_full.py。它们都挂在地图阶段。 ...

python hadoop mapreduce hortonworks-data-platform

回答 1 投票 0

Hive上的小文件的性能问题

我正在阅读一篇关于小文件如何降低hive查询性能的文章。 HTTPS：//community.hitachivantara.com/community/products-and-solutions/pentaho/blog/2017/11/07/working -...

hadoop hive mapreduce hadoop2 apache-tez

回答 1 投票 0

更改关键文件mongodb聚合

聚合是可能的。我将对象的键更改为它的_id。我正在尝试使用map-reduce进行聚合与项目。任何的想法？我有什么：{“serie”：{“_ id”：......

mongodb mongoose mapreduce aggregation-framework

回答 3 投票 2

在Hadoop MapReduce中找到排除“the”，“am”，“is”和“are”的十大最常用字词？

我正在使用MapReduce处理WordsCount问题。我使用了Lewis Carroll着名的透过镜子的txt文件。它非常大的档案。我运行了我的MapReduce代码并且工作正常。现在我 ...

java hadoop mapreduce

回答 1 投票 -1

MongoDb汇总多列

我正在涉足mongoDb并尝试使用map reduce查询。我需要总结来自不同列的多个值（num1，num2，num3，num4，num5）。关闭本指南http：//docs.mongodb.org / ...

mongodb mapreduce

回答 1 投票 0

如何编写hadoop map减少scala中的程序

我正在写一个地图减少应用程序scala。直到地图功能一切正常。但在编写减速机的同时我遇到了问题。 override def reduce（key：Text，values：java.lang.Iterable [Text] ...

java scala hadoop mapreduce

回答 1 投票 2

在hadoop map-reduce中运行jar文件时出错

在Hadoop中运行jar文件时，我遇到了错误。我无法理解问题是什么。下面是地图代码// Mapper类公共静态类E_EMapper扩展...

jar mapreduce

回答 1 投票 0

计算最终地图中的总行数减少hadoop中的输出

目前我的num reduce任务设置为job.setNumReduceTasks（100）;所以我的最终输出目录在S3中，如下所示/output/part-r-00000.gz /output/part-r-00001.gz ...等...

java hadoop mapreduce hadoop2

回答 1 投票 0

mapreduce 相关问题

最新问题