databricks 相关问题

有关Databricks统一分析平台的问题

Databricks 自动加载器写入列名称中包含无效字符的数据

尝试使用databricks的自动加载器写入数据时，嵌套列包含无效字符在 " ,;{}() 中发现无效字符 = 在您的方案的列名称中...

pyspark databricks databricks-autoloader

回答 1 投票 0

cloudFiles.backfillInterval 每次 Autoloader 运行时都会重新处理源中的每个文件吗？

我正在努力了解如何控制自动加载器中的回填过程： https://docs.databricks.com/en/ingestion/cloud-object-storage/auto-loader/development.html#trigger-regular-back...

databricks autoload databricks-autoloader

回答 1 投票 0

在 PySpark 笔记本中读取多个 Parquet 文件

将多个镶木地板文件读入数据帧时，似乎会在之后对每个镶木地板文件进行评估以进行后续转换，而此时它应该对数据帧进行评估。我...

apache-spark pyspark databricks parquet microsoft-fabric

回答 1 投票 0

如何在 AWS Databricks 中的数百列上使用 ntile() 窗口函数或类似函数

我有一个包含 2000 万行和 400 多列的表。除了第一列之外，我需要将所有其他列更改为均匀分布的十分位数，独立于其他列。我的数据驻留在 AWS

python pyspark databricks

回答 1 投票 0

如何在 Databricks 中重命名或编辑用户

创建用户后，是否可以在 Databricks（在 Azure 中）中重命名或编辑用户？当我第一次获得 Databricks 的访问权限时，管理员错误地拼写了我的姓氏。从那时起...

databricks azure-databricks

回答 1 投票 0

在 Databricks 上提供 MMCV/MMDet - 未找到 GLIBC_2.32

我正在尝试在 Databricks Serving（在 Azure 上）上托管 MMDetection 模型。该模型在 15.4 LTS ML 上进行训练。然而，在服务端点更新期间，它抱怨 GLIBC_2.32：发生错误...

python databricks azure-databricks openmmlab

回答 1 投票 0

DataBricks API 不适用于创建或更新

我有这个问题 { “错误代码”：“BAD_REQUEST”， "message": "未找到远程存储库。请确保： 1. 您的远程 Git 存储库 URL 有效。 2. 你的

azure-devops databricks azure-databricks azure-devops-rest-api

回答 1 投票 0

寻找增量表索引作为我的主键

我对数据块是全新的，Detla 表向我展示了 4 个主要功能（QRPG）质量通过 ACID 事务实现可靠具有索引的性能使用表进行治理...

performance databricks delta-lake databricks-sql

回答 2 投票 0

按一列过滤并按另一列排序时数据块查询速度慢

我们有一个巨大的表，用于存储有关区块链区块的信息，我们特别感兴趣的是区块号及其时间戳。假设我们需要将时间戳映射到区块号来解决任务&

databricks databricks-sql

回答 1 投票 0

使用自动加载器数据块过滤目录

我有一个具有这种结构的数据湖。不幸的是，正如您在第二张图片中看到的那样，数据中存在错误，因此我的未来和过去的岁月毫无意义，而且他们有虚拟......

apache-spark pyspark databricks spark-streaming spark-structured-streaming

回答 1 投票 0

Databricks 社区版中未保留多接收器处理

我只是尝试将 Rate 与结构化流结合使用，以便每个 MicroBatch 写入多个表名称。 IE。只是在 pyspark 中刷新多个接收器逻辑以准备一些认证......

apache-spark pyspark databricks

回答 1 投票 0

获取（[Errno -2] 名称或服务未知）")) - 从 Azure MLS Jupyter 笔记本连接到 Databricks SQL 仓库时

我尝试使用 Databricks-SQL-Connector 通过 Azure 机器学习笔记本从 Databricks SQL 仓库中提取数据，并在 Jupyter Notebook 中收到以下错误。我正在使用

python databricks azure-machine-learning-service urllib3 databricks-sql

回答 1 投票 0

使用 python 在运行时版本 > 11.3 中访问 Databricks 工作区中的文件

我有一个问题，是否可以使用 python 访问（读取和写入）Databricks 中公共工作区中的文件？我知道根据文档“在 Databricks Runtime 11.3 LTS 及以上...

python databricks

回答 1 投票 0

将 AWS DMS 加载到 Azure Databricks

我想将一组表提取并创建到 Databricks 中的架构中。我已经在 Databricks 中创建了数百个表的完整架构，现在我只需要导入初始数据...

amazon-web-services databricks azure-databricks aws-dms

回答 1 投票 0

多次创建临时视图或尝试捕获视图是否存在并通过

我们必须将 SQL 分解成更小的块，然后将它们调用到 python 函数中以进行测试。这让我们不得不多次为某些 SQL 创建临时视图以获得不同的乐趣...

sql pyspark databricks

回答 1 投票 0

Databricks sql生成层次结构并找到第一个祖先记录

希望生成层次结构并使用 databricks SQL 查询连接两个表来查找第一个祖先记录。如果一个订单依赖于两个订单，那么基准订单将是...

sql mysql apache-spark-sql databricks databricks-sql

回答 1 投票 0

使用 PEM 密钥从 databricks azure unity 目录连接到 Snowflake

我正在 azure 上使用 databricks UI 连接到 Snowflake。我们正在尝试使用 PEM 密钥选项，但出现以下错误摘要：IllegalArgumentException：输入 PEM 私钥是 inv...

snowflake-cloud-data-platform databricks azure-databricks databricks-unity-catalog

回答 1 投票 0

我怎样才能在使用prefect-databricks的完美流程中打印一些东西？

我是工作流编排方面的新手。我正在探索它的 databricks 集成，并在此处使用了它的教程示例。我能够连接到 datarbricks 实例并且可以打印作业

python databricks orchestration prefect

回答 1 投票 0

在databricks代码中需要更长的时间将数据数据帧加载到ssms表中

df_CorpBond=spark.read.format("parquet").option("header","true").load(f"/mnt/{container_name}/raw_data/dfl.corporate.parquet") df_CorpBond.repartition(100)...

azure pyspark databricks azure-databricks databricks-sql

回答 1 投票 0

为什么 schemaEvolution 在 databricks 自动加载器中不起作用？

我正在读取 csv 文件并每天处理它们，以便我可以使用 autolader 将数据附加到 databricks 中的青铜层。代码如下所示： def run_autoloader(表名, checkpoint_pa...

databricks database-schema autoload

回答 1 投票 0

最新问题

© www.soinside.com 2019 - 2025. All rights reserved.