databricks 相关问题

有关Databricks统一分析平台的问题

如何在 PyCharm 中使用 databricks utils 函数？我找不到合适的 pip 包

PyCharm IDE。我想在模块中使用 dbutils.widgets.get() ，而不是将此模块导入到 databricks 中。我已经尝试过 pip install databricks-client pip install databricks-utils 和 pip in...

python apache-spark pyspark pycharm databricks

回答 1 投票 0

在 Databricks 中打印秘密值

尽管秘密是用来掩盖机密信息的，但我需要查看秘密在 Databricks 之外使用它的价值。当我简单地打印秘密时，它会显示[已编辑]。打印（dbutils。

amazon-web-services apache-spark pyspark databricks azure-databricks

回答 2 投票 0

如何在Databricks SQL中查找具有相同（相似）名称的所有表

是否有一个sql查询可用于查找Databricks实例中给定名称的所有表？就像是 select * from information_schema.tables where lower(table_name) like 'org%...

apache-spark-sql databricks databricks-sql

回答 2 投票 0

具有用户分配托管身份的访问连接器的 Terraform Databricks 存储凭据

我有一个数据块访问连接器，我创建它是为了访问外部位置。创建的访问连接器具有用户定义的托管标识（不是系统分配的标识）。现在当我尝试

terraform databricks azure-databricks terraform-provider-azure

回答 1 投票 0

如何使用 Pandas 将一行文本添加到平面文件的第一行和最后一行？

我有一些平面文件，需要添加“页眉”和“页脚”。问题是页眉和页脚仅用于处理，因此它们没有相同的麻木......

pandas dataframe apache-spark automation databricks

回答 1 投票 0

将 Spark DF 写入 parquet 时出错（Parquet 列无法转换。列：[word_c]，预期：StringType，发现：INT64

我有几个 parquet 文件分布在不同的文件夹中，我使用以下命令将它们读入 Databricks 上的 Spark DF： df = Spark.read.option("mergeSchema", "true&

dataframe apache-spark pyspark databricks azure-data-lake

回答 2 投票 0

Databricks - 工作区导入文件api导致文件已存在异常

我正在开发 Databricks API，它通过以下 api 调用从本地上传笔记本文件在正常情况下，这段代码工作得很好。在某些情况下，如果 test.py 已经在工作中...

databricks azure-databricks databricks-rest-api

回答 1 投票 0

将栅格数据存储在数据湖中

在我们的组织中，我们的大部分数据都存储在 Azure 基础设施中的 Delta Lake 表中，并集成了 Databricks。我希望能够使用栅格数据（例如卫星图像......

databricks gis geospatial raster delta-lake

回答 1 投票 0

尝试加载模型时出现 Databricks 错误

我正在尝试使用 mlflow 和 roberta 变压器在 databricks 中训练模型。我可以注册模型，但是当我调用它进行测试时，出现以下错误： OSError：我们无法连接...

databricks huggingface-transformers mlflow

回答 2 投票 0

我无法使用 terraform 从我的笔记本中获取源代码

问候我正在使用 terraform cloud 创建一个 databricks 笔记本。当笔记本代码与tf位于同一目录中时没有问题，它会立即找到它。但要组织存储库...

terraform cloud task databricks databricks-notebook

回答 1 投票 0

如何查看Databricks中的所有数据库和表

我想列出 Azure Databricks 中每个数据库中的所有表。所以我希望输出看起来像这样：数据库|表名数据库1 |表格1 数据库1 |表_2 数据库1 |表3

python azure pyspark databricks azure-databricks

回答 3 投票 0

未找到 Databricks 文件路径

我是 Databricks 世界的新人，也是 Python 世界的新人。我在笔记本中遇到问题，我的脚本尝试查找文件路径和给定的文件路径确实存在，但返回错误文件 [输入图像描述...

python databricks

回答 1 投票 0

Databricks 光子与催化剂优化器

我正在阅读由光子驱动的 Delta 引擎的新数据块功能。从我阅读的理解来看，我有一种感觉，它类似于催化剂优化器。会

apache-spark databricks

回答 3 投票 0

如何获取整个数据帧的哈希值？

我很难找到涵盖此内容的任何内容。这个答案是类似的 - 每次为 Pandas DataFrame 获取相同的哈希值。我正在寻找返回 sha256 重复的相同逻辑...

apache-spark pyspark databricks

回答 1 投票 0

在 %run Databricks 中传递变量？

我正在尝试将变量 v 传递到我正在运行的笔记本中，该笔记本有一个名为 name 的小部件。我想使用类似以下的东西：％运行/路径/到/笔记本$名称= v 显然这段代码不...

databricks

回答 1 投票 0

将 Pickle 文件记录为 Mlflow 运行的一部分

我正在运行 MLflow 实验作为其中的一部分，我想将一些工件记录为 python pickle。例如：尝试不同的分类编码器，所以想将编码器对象记录为 pi...

python databricks azure-databricks mlflow

回答 2 投票 0

Azure Databricks 上的合并优化

我正在尝试优化 Databricks 中合并的性能（DBR 12.2 - 启用低随机合并）。目标表有约 700m 行，增量有 100-200k 行。这个操作好像...

apache-spark pyspark databricks azure-databricks

回答 1 投票 0

如何从驱动程序节点控制databricks自动缩放

我正在将数据块用于特定的工作负载。此工作负载涉及读取和写入存储位置的大约 10 到 200 个数据帧。此工作负载可以受益于并行性。 ...

amazon-web-services apache-spark pyspark databricks aws-databricks

回答 2 投票 0

Databricks 相对路径、Git 和 Workspace 源以及库函数

我们倾向于将笔记本用于库函数并使用以下模式“导入”它们：％运行../../common/email_functions 在这个 email_functions 笔记本（python，顺便说一句）中，我们可能会玩得很开心......

databricks azure-databricks

回答 1 投票 0

无法在databricks上安装pyomo求解器ipopt

使用以下命令在databricks上成功安装pyomo - pip install 'pyomo[可选]' 输出 - 成功安装 algopy-0.5.7 casadi-3.5.5 dill-0.3.5.1 et-xmlfile-1.1.0 mpmat...

python-3.x azure ubuntu databricks pyomo

回答 2 投票 0

databricks 相关问题

最新问题