bigdata 相关问题

我需要计算scala中代码的运行时。代码是。 val data = sc.textFile（“/ home / david / Desktop / Datos Entrada / household / household90Parseado.txt”）val parsedData = data.map（s => ...

scala apache-spark bigdata

回答 5 投票 10

在箭头表上执行转换

您可以对Arrow表应用什么样的转换？它的主要用途（现在）是语言的交换格式吗？

bigdata pyarrow apache-arrow

回答 1 投票 0

在Hive中歪曲的桌子

我正在学习蜂巢，遇到了扭曲的桌子。帮助我理解它。什么是Hive中的倾斜表？我们如何创建倾斜的表？它如何影响性能？

hadoop hive bigdata

回答 2 投票 7

Hive执行钩子

我需要在Apache Hive中挂钩自定义执行挂钩。如果有人知道怎么做，请告诉我。我正在使用的当前环境如下：Hadoop：Cloudera 4.1.2版...

hadoop hive bigdata cloudera

回答 2 投票 1

如何使用HIVE在WHERE语句中对OR子句进行分组

我想通过以下查询（statement1 AND statement2 AND（statement3 OR statement4））这是我的hive查询，我验证它不起作用，因为它只返回statement3，我知道...

sql hadoop hive bigdata

回答 3 投票 1

为字典中的每个密钥对（n0，a），（n0，b）的最大值获取密钥对（n0，_），（n1，_）

假设我们有一个类似的字典：os_stats = {（'USA'，'Mac OS X'）：1，（'墨西哥'，'iOS'）：3，（'USA'，'Windows XP'）：2，（ '德国'，'Windows 7'）：9，（'德国'，'Windows XP'）：7，（...

python python-2.7 data-analysis bigdata

回答 2 投票 1

如何将readLines的输出转换为数据帧

我试图使用readLines将一个17.6GB的csv文件导入到R.我已经尝试过这里，这里，这里和其他地方讨论的几种方法，readLines似乎是唯一的方法......

r function csv data.table bigdata

回答 2 投票 0

Oozie s3作为工作文件夹

当从s3提供workflow.xml时，Oozie失败并出现以下错误，但同样有效的是HDFS提供了workflow.xml。同样适用于早期版本的oozie，有什么......

hadoop amazon-s3 hive bigdata oozie

回答 1 投票 1

如何使用spark scala将包含多个行标记的复杂xml文件加载到数据框中并将其另存为表（注意通用解决方案）

（这是一个带有2个行标记的示例xml文件（任何方法将此加载到具有n个行标记的数据框或使用spark scala中的xpath的元素）马修

xml scala apache-spark-sql bigdata xpath-2.0

回答 1 投票 0

Python函数可以在Flask或Django中使用吗？

我需要帮助解决一个问题。我最近一直致力于大数据和机器学习。我将首先在twitter数据上做一些工作，但我不希望我的工作只留在...

python django flask bigdata

回答 1 投票 0

数据量在数据分析中是否重要？

所以我想知道数据分析是否可以通过使用少量数据来完成，例如存储在数据库中的100到1000条记录。如果我这样做，那么它是否称为数据分析？有人......

dataset bigdata analytics data-science data-analysis

回答 1 投票 0

bigdata 相关问题

最新问题