databricks 相关问题

有关Databricks统一分析平台的问题

如何在 PyCharm 中使用 databricks utils 函数?我找不到合适的 pip 包

PyCharm IDE。我想在模块中使用 dbutils.widgets.get() ,而不是将此模块导入到 databricks 中。我已经尝试过 pip install databricks-client pip install databricks-utils 和 pip in...

回答 1 投票 0

在 Databricks 中打印秘密值

尽管秘密是用来掩盖机密信息的,但我需要查看秘密在 Databricks 之外使用它的价值。 当我简单地打印秘密时,它会显示[已编辑]。 打印(dbutils。

回答 2 投票 0

如何在Databricks SQL中查找具有相同(相似)名称的所有表

是否有一个sql查询可用于查找Databricks实例中给定名称的所有表?就像是 select * from information_schema.tables where lower(table_name) like 'org%...

回答 2 投票 0

具有用户分配托管身份的访问连接器的 Terraform Databricks 存储凭据

我有一个数据块访问连接器,我创建它是为了访问外部位置。创建的访问连接器具有用户定义的托管标识(不是系统分配的标识)。 现在当我尝试

回答 1 投票 0

如何使用 Pandas 将一行文本添加到平面文件的第一行和最后一行?

我有一些平面文件,需要添加“页眉”和“页脚”。问题是页眉和页脚仅用于处理,因此它们没有相同的麻木......

回答 1 投票 0

将 Spark DF 写入 parquet 时出错(Parquet 列无法转换。列:[word_c],预期:StringType,发现:INT64

我有几个 parquet 文件分布在不同的文件夹中,我使用以下命令将它们读入 Databricks 上的 Spark DF: df = Spark.read.option("mergeSchema", "true&

回答 2 投票 0

Databricks - 工作区导入文件api导致文件已存在异常

我正在开发 Databricks API,它通过以下 api 调用从本地上传笔记本文件 在正常情况下,这段代码工作得很好。在某些情况下,如果 test.py 已经在工作中...

回答 1 投票 0

将栅格数据存储在数据湖中

在我们的组织中,我们的大部分数据都存储在 Azure 基础设施中的 Delta Lake 表中,并集成了 Databricks。我希望能够使用栅格数据(例如卫星图像......

回答 1 投票 0

尝试加载模型时出现 Databricks 错误

我正在尝试使用 mlflow 和 roberta 变压器在 databricks 中训练模型。我可以注册模型,但是当我调用它进行测试时,出现以下错误: OSError:我们无法连接...

回答 2 投票 0

我无法使用 terraform 从我的笔记本中获取源代码

问候 我正在使用 terraform cloud 创建一个 databricks 笔记本。当笔记本代码与tf位于同一目录中时没有问题,它会立即找到它。但要组织存储库...

回答 1 投票 0

如何查看Databricks中的所有数据库和表

我想列出 Azure Databricks 中每个数据库中的所有表。 所以我希望输出看起来像这样: 数据库|表名 数据库1 |表格1 数据库1 |表_2 数据库1 |表3

回答 3 投票 0

未找到 Databricks 文件路径

我是 Databricks 世界的新人,也是 Python 世界的新人。我在笔记本中遇到问题,我的脚本尝试查找文件路径和给定的文件路径确实存在,但返回错误文件 [输入图像描述...

回答 1 投票 0

Databricks 光子与催化剂优化器

我正在阅读由光子驱动的 Delta 引擎的新数据块功能。从我阅读的理解来看,我有一种感觉,它类似于催化剂优化器。会

回答 3 投票 0

如何获取整个数据帧的哈希值?

我很难找到涵盖此内容的任何内容。 这个答案是类似的 - 每次为 Pandas DataFrame 获取相同的哈希值。我正在寻找返回 sha256 重复的相同逻辑...

回答 1 投票 0

在 %run Databricks 中传递变量?

我正在尝试将变量 v 传递到我正在运行的笔记本中,该笔记本有一个名为 name 的小部件。我想使用类似以下的东西: %运行/路径/到/笔记本$名称= v 显然这段代码不...

回答 1 投票 0

将 Pickle 文件记录为 Mlflow 运行的一部分

我正在运行 MLflow 实验作为其中的一部分,我想将一些工件记录为 python pickle。 例如:尝试不同的分类编码器,所以想将编码器对象记录为 pi...

回答 2 投票 0

Azure Databricks 上的合并优化

我正在尝试优化 Databricks 中合并的性能(DBR 12.2 - 启用低随机合并)。目标表有约 700m 行,增量有 100-200k 行。这个操作好像...

回答 1 投票 0

如何从驱动程序节点控制databricks自动缩放

我正在将数据块用于特定的工作负载。此工作负载涉及读取和写入存储位置的大约 10 到 200 个数据帧。此工作负载可以受益于并行性。 ...

回答 2 投票 0

Databricks 相对路径、Git 和 Workspace 源以及库函数

我们倾向于将笔记本用于库函数并使用以下模式“导入”它们: %运行../../common/email_functions 在这个 email_functions 笔记本(python,顺便说一句)中,我们可能会玩得很开心......

回答 1 投票 0

无法在databricks上安装pyomo求解器ipopt

使用以下命令在databricks上成功安装pyomo - pip install 'pyomo[可选]' 输出 - 成功安装 algopy-0.5.7 casadi-3.5.5 dill-0.3.5.1 et-xmlfile-1.1.0 mpmat...

回答 2 投票 0

最新问题
© www.soinside.com 2019 - 2025. All rights reserved.