bigdata 相关问题

从pyspark.sql导入pyspark从pyspark.conf导入SparkSession导入来自pyspark.sql.functions的sparkConf import findspark import countDistinct spark = SparkSession.builder \ .master（“local [*]”...

python-3.x pyspark bigdata data-science

回答 1 投票 0

在Yugabyte MYSQL中启用语句

我想查看正在执行的所有SQL语句。像postgres中的log_statement = all。如何在Yugabyte MYSQL中启用语句日志记录？

database bigdata yugabyte-db

回答 1 投票 2

来自HDFS的OraclePropertyGraphDataLoader loadData

我正在使用Spark + Hive来构建图形和关系，并将平面OPV / OPE文件导出到HDFS，每个减速器一个OPV / OPE CSV。我们所有的图形数据库都已准备好加载到OPG / PGX上进行分析......

oracle bigdata graph-theory cloudera oracle-spatial

回答 2 投票 4

在Python中处理数百万行

我想在这个问题前面加上这样一个事实，即我已经完成了对python时间复杂度和数据结构的研究，可以加快速度。但是，我正在努力想到......

python csv bigdata time-complexity

回答 3 投票 0

HortonWorks或Cloudera认证[已结束]

Hortonworks和cloudera公司现在合并，哪种认证更好？请分享您对此的看法。

hadoop bigdata cloudera hortonworks-data-platform

回答 1 投票 -5

根据条件，在聚合期间无法获得准确的计数

我有一个名为tbl1的表。其中包含3列empId，Designation和salaryScale empId Designation salaryScale Arun Developer 1 Kiran Developer 0 Anu ITA ...

sql hive bigdata

回答 2 投票 0

错误exec.DDLTask：java.lang.NoSuchMethodError：

我使用sqoop将数据从mysql导入到hive：sqoop import --connect jdbc：mysql：// localhost：3306 / DATASET -username root -P -table MATCHES --hive-import FAILED：Execution Error，return ...

mysql hadoop hive bigdata sqoop

回答 1 投票 -2

将与个人相关的所有金额按日期汇总

我有这个Dataframe df：payout person1 person2 date 1 300.0 LA NaN 2012-02-01 2 500.0 DO NaN 2012-02-01 3 600.0 DO NaN 2012-02 -...

python pandas bigdata pandas-groupby pandasql

回答 2 投票 1

如何处理django admin中具有大量记录的选择框

我的应用程序已经增长，以便django管理员的下降有100,000个选项。我甚至无法打开我的管理员，因为它在数据库上的负载，没有提到我将无法...

python django django-admin bigdata

回答 3 投票 4

在Ambari上设置群集时，确认单个节点群集的主机失败

我试图在单节点集群上设置Ambari。 Ambari设置以root用户身份完成我尝试了与此相关的所有帖子，更改权限并设置为权限http：//docs.hortonworks ....