mapreduce 相关问题

MapReduce是一种使用大量节点处理某些类型的可分发问题的大型数据集的算法

Hive查询在Tez上失败，但从Beeline连接时在Map-Reduce上成功

我遇到了一个奇怪的错误。我正在运行带where子句的简单select *查询，以下是查询执行状态的摘要：从EMR（Tez引擎）连接到Hive-后继...

hadoop hive mapreduce amazon-emr apache-tez

回答 2 投票 0

Map减少错误的输出

我正在尝试收集特定站点的最高和最低温度，然后查找每一天的温度总和，但是在映射器中不断出现错误，并尝试了很多其他方法...

java dictionary hadoop mapreduce indexoutofboundsexception

回答 2 投票 0

在datproc中的集群中查找Hadoop流传输jar

所以我想在dataproc群集上运行python map reduce作业，问题是我似乎找不到需要提交到Main类或jar输入中的Hadoop流jar文件，我正在使用.. 。

python hadoop mapreduce google-cloud-dataproc

回答 1 投票 1

将文件作为输入传递给程序，并使用python中的sh库存储其输出

我对应该如何使用python sh库，特别是sh.Command（）感到困惑。基本上，我希望将input_file_a传递给program_b.py并将其输出存储在其他目录中，如...

python mapreduce sh

回答 1 投票 0

Hadoop mapreduce作业创建太大的中间文件

我编写了一个mapreduce程序，但是当我尝试在hadoop上运行时，它无法成功，因为它会生成大量中间数据，而我会收到一条错误消息：该节点上没有更多空间了。 ...

java hadoop mapreduce yarn

回答 1 投票 0

获取错误的值类：org.apache.hadoop.io.LongWritable类不是org.apache.hadoop.io.IntWritable类

我正在学习MapReduce，我编写了一个程序，该程序计算成员和非成员完成的预订总时间。我通过了所需的所有可能的作业配置，但是在运行...

java mapreduce hadoop2

回答 1 投票 0

Apache Spark与MapReduce

我一直在寻找Spark和MapReduce之间的差异，而我真正发现的是Spark在内存和磁盘中运行，这使其运行速度大大提高。我还读到MapReduce是...

apache-spark hadoop mapreduce

回答 1 投票 0

Spark vs MapReduce，为什么Spark比MR快，原理？

hadoop mapreduce apache-spark

回答 2 投票 4

如何通过spark scala或java mapreduce实现此算法

[这里是一个问题，有姓名列表[[“” John“，” 5“] [”比尔“，” 7“] [”比尔“，” 7,8“] [”哈利“，” 0，1 ，2“] [” Harry“，” 2,3“] [” Harry“，” 3,6“] [” Harry“，” 4“]]它需要连接字符串...

scala apache-spark mapreduce

回答 1 投票 0

Scala-根据另一个DF中的事务为每个ID过滤DF中的数据

问题概述：数据集1：用户将具有与某个交易ID相关联的多行数据集2：每个用户将具有与数据库中每个交易ID相关联的行...我想要的...

scala dataframe filter mapreduce

回答 1 投票 0

Hadoop jobcontrol

我正在尝试在Hadoop中运行多个Map / Reduce任务。在Google上搜索后，我按照http：//cloudcelebrity.wordpress.com/2012/03/30/how-to-chain-multiple-mapreduce -...]中所述的方法2进行操作。

java hadoop mapreduce job-control

回答 3 投票 0

在mongodb中查找多维最大值

[如果我有此收藏集{“湿度”：96.5812，“温度”：10.5006} {“湿度”：97.1184，“温度”：10.2808} {“湿度”：96.2882，“温度”：8.4493} {“湿度” ：97.8266，...

mongodb mapreduce

回答 2 投票 2

MongoDB-在集合中查找唯一的名称

假设我有这样的变量列表，例如：{{名称：“鲍勃”，年龄：“ 22”}，{名称：“约翰”，年龄：“ 21”}，{名称：“佩德罗”，年龄： “ 15”}，{名称：“ Bob”，年龄：“ 11”}，{名称：“ Mark”，年龄：“ 24”}]方式...

mongodb mapreduce aggregation-framework

回答 1 投票 0

Hive窗口函数ROW_NUMBER没有分区BY子句是非常慢的。有没有更好的优化方法？

我有一个具有5000万条记录的HDFS文件，原始文件大小为50 GB。我正在尝试将其加载到配置单元表中，并在加载时使用以下内容为所有行创建唯一的ID。我正在使用Hive 1.1 ....

hadoop hive mapreduce query-optimization window-functions

回答 3 投票 1

通过使用如下所述的以下命令编译Java代码

[我正在使用Ubuntu Shell进行WordCount时，如下所述使用以下命令来编译Java代码。javac -classpath $ {HADOOP_CLASSPATH} -d'/ home / abdullah / Desktop / ...>] >>> < [

java hadoop mapreduce

回答 1 投票 -1

将javascript对象从一种形式转换为另一种形式

输入常量乘积= {100：['abc'，'xyz'，'mno'，'pqr']，200：['mno'，'pqr']，300：['abc'，'xyz'] ，400：['abc'，'pqr']，}预期的{abc：[100，300，400]，xyz：[100，...

javascript mapreduce

回答 2 投票 0

Hadoop从HDFS读取JSON

我正在尝试将JSON文件读取到我的hadoop mapreduce算法中。我怎样才能做到这一点？我已经将文件“ testinput.json”放入HDFS内存中的/ input中。当调用mapreduce时，我执行hadoop jar ...

json hadoop mapreduce reader

回答 1 投票 0

MapReduce输出ArrayWritable

我正在尝试通过简单的MapReduce-Task从ArrayWritable获取输出。我发现了一些类似问题的问题，但是我无法用自己的代码解决问题。所以我很期待...

java apache hadoop mapreduce writable

回答 1 投票 7

如何减少元素数量的数组？

我已经从Mapper和Reducer apache hadoop clapss扩展了MyMappep和MyReducer类，并重载了map＆reduce方法。映射后，我得到了pair（键，值），其中值在文本中...

arrays apache hadoop text mapreduce

回答 1 投票 0

Fork / Join和Map / Reduce之间的差异

Fork / Join和Map / Reduce之间的主要区别是什么？它们在分解和分布类型（数据与计算）上是否有所不同？

mapreduce fork-join

回答 2 投票 42

mapreduce 相关问题

最新问题