apache-spark-sql 相关问题

Apache Spark SQL是Spark上的“SQL和结构化数据处理”工具,Spark是一种快速通用的集群计算系统。


未指望的是pyspark滤波器行为

df = df.filter( ~((col('CID') == "-") & (col('CID').isNull()) & col('trait_diff').isNull()) ) df = df.filter( ~((col('CID').isNull()) & col('trait_diff').isNull()) ) df = df.filter( ~((col('CID') == "-") & col('trait_diff').isNull()) )

回答 1 投票 0


获取Apache Spark中格式列表(数据源)

我们需要获取某些配置文件验证的格式列表(读写)。我所谈论的格式是: spark.read.format('this') spark.write.format('this') 有没有办法得到它...

回答 1 投票 0

如何在Spark的DataFrame

我将Python代码“翻译”到Pyspark。我想将现有列用作数据框架的索引。我使用熊猫在python中做到了这一点。下面的一小部分代码解释了我的所作所为。 t ...

回答 2 投票 0

SparkSQL传递变量 - 突触(火花池)

我有以下sparksql(spark池-Spark 3.0)代码,我想传递一个变量。我该怎么做?我尝试了以下内容: #cel 1(切换参数单元): %% pyspark stat ='a' #cel2: S ...

回答 3 投票 0





创建流媒体实时视图-Databricks

如何在更改数据feed的基础上在databricks中创建流媒体实时视图。 我有以下代码不起作用 创建流媒体实时视图vw_tms_shipment_bronze 作为 选择 *,,

回答 1 投票 0


将数据转换为列标题

我有一个具有以下内容的数据框-

回答 1 投票 0


pyspark- regexp_extract_all,提取带有模式和常数的值 我有一个以下数据框 datadictionary = [('value1',[{'键':'fruit','value':'apple'},{'key':'color','value':'value':'white'}),),),),),), ('value2',[{'key':'fruit','value':'芒果'},{...

dataDictionary = [('value1', [{'key': 'Fruit', 'value': 'Apple'}, {'key': 'Colour', 'value': 'White'}]), ('value2', [{'key': 'Fruit', 'value': 'Mango'}, {'key': 'Bird', 'value': 'Eagle'}, {'key': 'Colour', 'value': 'Black'}])] df = spark.createDataFrame(data=dataDictionary) df.printSchema() df.show(truncate=False)

回答 1 投票 0



SPARK选择查询忽略Java Spark应用中的分区过滤器,但在Zeppelin

分区过滤器。但是,当我在自己的Spark应用程序(用Java编写)的同一表上运行相同的查询时,物理计划没有对分区的认识,从而导致查询效率较低。根据本文档

回答 1 投票 0

SparkConnect SQL解析异常 - Spark 3.5.3和3.5.4

IM在新鲜的火花3.5.4安装中运行此操作:

回答 0 投票 0


最新问题
© www.soinside.com 2019 - 2025. All rights reserved.