databricks 相关问题

有关Databricks统一分析平台的问题

Pandas to_csv 无法附加到 Databricks 云中的文件(不支持 OSError Errno 95 操作)

为什么我无法使用以下代码覆盖文件? 我希望创建文件 b.csv,然后附加每次迭代。虽然我给出了 mode='a' (追加),但不知何故我可能会创建文件但不会创建文件...

回答 1 投票 0

使用 CONV 函数将 T-SQL 转换为 Databricks SQL

我正在尝试将以下 T-SQL 转换为 Databricks SQL T-SQL 转换(十进制(26,8), ISNULL(SIB.ClientConsideration * ISNULL(RH.ExchangeRateLedger, (1 / NULLIF(ST.TradeDateFx, 0))),...

回答 1 投票 0

需要在 PySpark 或数据场上运行递归 SQL 查询以实现以下场景

这是开发中的一个例子: 设备 1 将设备 3 作为父设备。 设备 3 将设备 53 作为父设备。 设备 53 没有父设备。 在黄金资产表中,您将看到以下 3 条记录...

回答 1 投票 0

将 T-SQL 重构为 Databricks SQL 以从子查询返回结果

我有以下 T-SQL,当我尝试使用 Databricks SQL 执行时,出现错误 SQL 语句错误: AnalysisException: 无法解析 '`rn`' 我有一个名为 db.myview 的视图,它...

回答 1 投票 0

如何在 Pyspark 中读取嵌套 JSON

我正在尝试读取从以下位置下载的嵌套 JSON:text 运行代码时: # 读取指定选项的JSON文件 df = Spark.read.format("json") \ .option("推断模式&q...

回答 1 投票 0

由 detectorron2 引起的服务模型构建过程中的错误

简介:我正在尝试在 Databricks 上注册我的模型,以便我可以将其作为端点。我需要的软件包是“torch”、“mlflow”、“torchvision”、“

回答 1 投票 0

接受空字符串和增量表结构值的列

我正在使用 Pyspark 在 Databricks 中处理非结构化数据、JSON 文件。 基本上我有一些包含字段的 json 文件。 “Field1”是一个常规的 StructType,但是当它

回答 1 投票 0

.databrickscfg 不包含帐户配置文件

我正在尝试生成与 databricks CLI 和 Posit Workbench 的集成,但是当我运行时: databricks 帐户自定义应用程序集成 \ create --json '{"name":"posit-workbench&qu...

回答 1 投票 0

考虑空值,为整行生成唯一的哈希值

我在 PySpark 中有一个示例数据集和代码片段,我试图为 DataFrame 中的每一行生成哈希值。这是我正在使用的代码: 从 pyspark.sql.functions 导入 col,conc...

回答 1 投票 0

与开源数据集上的 SQL 查询相比,PySpark 查询结果存在差异

我在位于“/databricks-datasets/learning-spark-v2/sf-fire/sf-fire-calls.csv”的开源数据集上运行的 PySpark 查询遇到问题。 该查询的目的是

回答 1 投票 0

如何使用databricks高级工作区中的duckdb连接到fabric lakhouse?

如何使用duckdb从databricks访问fabric datalake的数据?我正在使用 databricks 高级工作区,可以使用 Spark 进行读取和写入。但是当尝试通过 duck db 连接时,我...

回答 1 投票 0

有没有办法使用 COPY INTO Databricks 命令将所有文件从 Azure Blob 复制到 Delta 表中?

我使用 Databricks 使用 COPY INTO 命令从 Azure Blob 容器(CSV 文件)读取数据,并将其复制到 Databricks Delta 表中。这是我使用的代码: f"""C...

回答 1 投票 0

使用databricks api(SQL或pyspark)将groupby聚合应用于原始表

在pandas中发现了这个问题的老问题: 我想做一些在电子表格中看起来很简单的事情,但我无法理解 pandas 中的语法。我有一个可以分组的数据集。我是...

回答 1 投票 0

在 PySpark 中使用 For 循环将 CSV 文件读取到 Spark DataFrame 中

我正在尝试使用 for 循环将保存在 Azure 数据容器中的 csv 文件导入到 Spark 数据帧中。我正在 Azure Databricks 上运行此代码。 for 循环运行没有任何错误。然而我是

回答 1 投票 0

Databricks 作业 Webhook 通知 ID

我想使用 Jobs API 为作业设置 Webhook 通知。 根据文档,我需要通知 ID,但我从哪里获取它? 这本质上就是 webhook

回答 2 投票 0

如何在Azure数据块中使用gz文件创建数据框?

我想在Azure Data bricks环境中使用gz文件创建一个数据框。 帮助我如何创建数据框 我的文件如下所示:test_20240423.gz df = Spark.read.format("镶木地板").load(&

回答 1 投票 0

如何读取 inferschema 为 true 的数据帧

我有一个数据框 df1,所有列都在字符串中(100+列),现在我想使用 inferschema 将其转换为适当的类型 例如,如果我们有一个 csv 文件并且我们想要

回答 1 投票 0

从 postgres 输出将 .csv 文件加载到 databricks 时出现问题

我从 postgres 数据库中的两个表中提取了一些数据作为 .csv 文件。当我尝试将数据加载到数据块中时,它说它无法确定架构。然后我创建架构和 loa...

回答 1 投票 0

使用 Azure 服务主体和 MSAL 通过 PySPark JDBC 驱动程序从 DataBricks Python 笔记本连接到 MS SQL Server 时出现令牌(访问)错误

使用 Azure/DataBricks 服务主体和 MSAL 通过 PySPark JDBC 驱动程序从 DataBricks Python 笔记本连接到 MS SQL Server 时,如何解决令牌(Active Directory 访问)错误 (

回答 1 投票 0

如何在 Databricks 集群上安装“ODBC Driver 17 for SQL Server”?

我正在尝试使用 pyodbc Python 库从 Azure Databricks 笔记本连接到 SQL Server。当我运行查询时,遇到以下错误: 错误:('01000',“[01000] [

回答 1 投票 0

© www.soinside.com 2019 - 2024. All rights reserved.