aws-databricks 相关问题


Databricks CLI 版本 0.209 - 重置 API v2.1 中的现有作业

如何使用 cli v 0.209 重置 databricks 中的现有作业。 已经参考了下面讨论旧版本 databricks-cli 的论坛 Azure Databricks CLI:更新工作流/作业定义...


无法在Azure databricks中实例化EventHubsSourceProvider

我尝试使用以下代码从 Azure Databricks 的事件中心读取数据。 从 pyspark.sql.functions 导入 * 从 pyspark.sql.types 导入 * NAMESPACE_NAME =“*myEventHub*&...


Databricks Spark:java.lang.OutOfMemoryError:GC 开销超出限制 i

我正在 Databricks 集群中执行 Spark 作业。我通过 Azure 数据工厂管道触发作业,它以 15 分钟的间隔执行,因此在成功执行三到四次之后...


将 Databricks SQL 查询转换为 DAX

我有以下 databricks sql 查询,我需要帮助通过查找转换为 DAX。 选择不同的 P.ProgramId ,P.程序名 ,DU.内部电子邮件地址 来自 gold.programid P INNER 加入黄金。


更新DataBricks中String列类型的JSON数据中的特定值

我在databricks目录中有一个列类型为字符串的表。它包含 JSON,我想从中更新特定值,例如“key1”。我已经使用 from_json 将其转换为 json...


我们如何获取 DataBricks 工作区 URL 和访问令牌

我正在尝试在 CI/CD 集成中进行 Databricks 的端到端实现 例如:使用 Rest API 创建集群、安装库和其他内容 所以为此我们需要 Domain(Worksp...


禁用 Databricks 笔记本中的命令框

我有一个 Databricks 笔记本。我的笔记本有几个命令。其中一些只是为了我的测试,我不想在生产中运行它们。 有什么办法可以禁用命令。我不想


在 Databricks 中使用 AutoLoader 时是否可以不合并镶木地板?

在 Databricks 中使用 AutoLoader 时是否可以不合并镶木地板? 问题是,我想将数据从 S3 存储桶直接复制到 Azure Blob 存储,而不合并它。只需 1:1 复制...


通过全局初始化脚本启用 Databricks 集群日志

我想通过全局初始化脚本为工作区中的所有集群(新的或旧的)设置集群日志传送。 我尝试通过自定义 Spark conf 添加底层 Spark 属性 - /databricks/dri...


将 pyspark 数据帧转换为代码/语法

假设我在 Databricks 中有以下 pyspark 数据框: 一些其他列 价格_历史记录 测试1 [{“日期”:“2021-03-21T01:20:33Z”,“price_tag”:“N”,...


pyspark 中没有发生小数点后 2 舍入

我正在databricks中进行以下计算,并四舍五入到小数点后两位。 结果 = ( 圆形的( 合并( 当(col('col')!= 0,col('col')), 当(col('col')!...


Datadog 中的 AWS Cloudwatch 警报

查看 Datadog AWS 集成文档,我发现提到 AWS 警报可以流式传输到 Datadog 中。据说您可以选择两种不同的方法发送AWS CloudWatch ...


使用 Nodejs18 运行时将 `@aws-sdk/client-bedrock-runtime` 导入 AWS Lambda 函数

我正在尝试使用 NodeJs18 运行时将 @aws-sdk/client-bedrock-runtime 导入到 AWS Lambda 函数中。 该软件包应该可用,因为根据 AWS 文档,“对于 Node.js 版本......


Databricks 合并到 - 添加插入另一个表的条件

我有一个名为“结果”的增量表,我有一个需要按顺序对结果执行的操作列表。 给定操作列表:['op_1', 'op_2', 'op_3'] op_1 修改 va...


是否可以广播字典并将其用作 pyspark 中的查找?

我正在azure databricks中运行以下代码。 使用 erp_bu 创建查找字典,erp_bu 是具有两列“erp_code”和“bu”的行对象列表 广播查找字典


除了 kotlin 中的 AWS cognito 之外,还有其他类似 cognito 的 AWS 方法可以用来登录吗?

我正在使用AWS appsync,我还将使用AWS进行登录。顺便说一下,我对AWS不是很熟悉,如果我用错了术语,请原谅我。有一种用于用户登录和认知的 AWS 认知方法


Sharepoint 文件修改时触发 Synapse Pipeline 的方法

我正在寻找一种在文件被修改时触发 Synapse 管道(运行 Databricks 笔记本和 Web 活动来刷新 PowerBI)的方法。 假设我的 Sharepoint 网站上有一个 data.xlsx


安装“ODBC 驱动程序驱动器和 Databricks 集群”

我的集群上的 init 脚本指向 DBFS 路径。错误显示不再支持 DBFS,我必须移动它的工作区或使用 ABFSS 路径。我搬到工作区 pyodbs.sh 看起来像


使用 @aws-sdk/client-sqs npm 包从 EKS 集群 pod 推送到 AWS SQS 时出错

我在 AWS EKS 集群中使用 @aws/client-sqs npm 包将消息推送到标准 SQS 队列并收到以下错误: CredentialsProviderError:169.254.170.23 不是有效的容器我...


Databricks 上的托管身份 - DefaultAzureCredential 无法从包含的凭据中检索令牌

我正在尝试向天蓝色的服务总线发送消息。 但我收到以下错误: ServiceBusError:处理程序失败:DefaultAzureCredential 失败 从包含的凭证中检索令牌...


如何使用C#在AWS Lambda和API Gateway上部署Prince 13.5?

我一直按照本文 (https://medium.com/@bruce_39084/setting-up-prince-on-aws-lambda-and-api-gateway-4d524dcb035b) 中概述的步骤部署 Prince 13.5在 AWS Lambda 和 API Gat...


尝试在 Azure Databricks 上导入已安装的 Python Wheel 包时出现操作系统错误

我有一个名为 my_sdk.whl 的轮子包,是我在本地开发和构建的。 我还在虚拟环境中使用 pip install my_sdk.whl 测试了这个包,并尝试在...


将 localstack 与 Spring Cloud AWS 2.3 一起使用时出现未知主机

“ResourceLoader”与 AWS S3 可以很好地处理这些属性: 云: 亚马逊: s3: 端点:s3.amazonaws.com <-- custom endpoint added in spring cloud aws 2.3 creden...


AWS sts 在一个命令中承担角色

要在 CLI 中承担 AWS 角色,我执行以下命令: aws sts 假设角色 --role-arn arn:aws:iam::123456789123:role/myAwesomeRole --role-session-name test --region eu-central-1 这给...


AWS EMR 集群中元数据的 AWS 粘合数据目录

我们计划使用AWS EMR集群来处理json和parquet文件。我有一个基本问题,我们真的需要 aws 数据目录来处理存储在 S3 中的 json 和 parquet 文件...


将架构从一个 AWS RDS 移动到另一个

我需要将架构及其对象从一个 AWS RDS 移动到另一个 AWS RDS 数据库。 我过去曾使用过 AWS 架构转换工具 (SCT)。 有没有更好的方法或者我正在做的事情...


将 AWS Glue 连接到本地 MySQL 时出现问题,是 AWS VPC 吗?

我在 AWS 外部托管的私有 Ubuntu 实例上运行 MySQL。我的 S3 存储桶中有几个 CSV 文件,我想使用 AWS Glue ETL 将其加载到我的 MySQL 数据库中。 我其实在关注...


AWS Glue 缺少权限

我正在尝试使用 cloudformation 在 AWS Glue/Athena 中创建表。但是,我在 Cloudformation Events 面板中遇到以下错误:


有 aws dynamodb 的开源替代品吗?

我想从aws迁移到私有IDC。 aws dynamodb 服务应替换为一些数据库。 我希望 dynamodb 替代方案可以与当前代码兼容或者只是做一些...


AWS Lambda 测试时出现关键错误。 API网关POST方法显示未找到消息

我正在尝试使用 AWS Lambda、AWS API Gateway、Amazon SNS 和 AWS Dynamodb 构建无服务器联系表单。我有一个网页,将姓名、电子邮件和电话号码作为表单输入。我是...


无法验证我的 ECR 的 AWS 凭证

我已经安装了最新版本的 aws-cli-2 和 docker,并运行了“aws configure”并输入了我的访问密钥和秘密密钥。我还验证了 aws.config 是正确的并且


liip_imagine 使用 aws s3 生成错误的缓存 url(liip_imagine、vich_uploader、flysystem)

我目前在 liip_imagine 的配置上遇到问题。 我的设置: 交响乐6.4 vichuploader 2.3 利匹马嗪 2.12 联赛/飞行系统 aws/aws-sdk-php 我首先用fly安装了vichuploader...


将 Node.js 后端连接到 AWS RDS MySQL 数据库时出现问题

你好吗? 我在将 Node.js 后端连接到 AWS RDS MySQL 数据库时遇到问题。我从 Digital Ocean 迁移到 AWS,它在 Digital Ocean 中运行得很好。然而,mig之后...


在 aws ec2 Linux 实例中更新到最新的 dart 版本

我正在使用 Serverpod 和 terraform 脚本上传到 aws 服务器。 在我的 pubspec.yaml 文件中,我必须有 dart SDK 版本 3.5.0(最新版本)。 但是部署到 aws ec2 linux 后,我得到...


从托管商将子域添加到 AWS Route 53

我的托管商中有一个工作域,我想在 AWS amplify 中部署 React 应用程序,所以我不想将整个域指向 AWS,而是想从托管中指向像 app.domain.com 这样的子域...


将 OpenAI Python 依赖项导入 AWS Lambda 失败

我正在尝试将 OpenAI Python 库添加到我的 AWS Lambda 函数中。我尝试按照本指南中所述通过 AWS Lambda Layers 添加它们。然而,当执行我的代码时,添加了这个l...


使用单个 API 调用检查 aws s3 存储桶中是否存在 10 个对象

我正在使用 javascript AWS SDK 限制条件: 我不需要这 10 个对象的内容,只想知道它们是否存在 我想为 AWS S3 创建一个 API


如何在单个 AWS 账户中使用 Terraform 创建两个独立的环境(开发环境和生产环境)来部署 AWS 资源

如何在单个 AWS 账户中使用 Terraform 创建两个独立的环境(开发环境和生产环境)来部署 AWS 资源,以及管理多个数据管道的最佳方法是什么?...


HttpMediaTypeNotSupportedException:从 AWS Lambda 运行 SpringBoot REST 应用程序时不支持内容类型“application/octet-stream”

我正在尝试在 AWS Lambda 中运行 Spring Boot 应用程序(例如,各种示例使用与 https://www.baeldung.com/spring-boot-aws-lambda 基本相同的方法 - 只需复制代码和...


AWS 证书管理器无法在 godaddy 域中工作

这是一种了解 aws 域如何工作的实验 AWS证书管理器看起来不错,但没有显示https, 请注意,我没有更改 godaddy 中的名称服务器,或者我没有碰过


AWS SNS:“未配置 RegionEndpoint 或 ServiceURL”

我目前正在尝试在.NET 6中集成AWS SNS的短信服务。我有 awssdk.simplenotificationservice .7.300.32\ 包作为依赖项。这是我的 StartupExtension.cs 中的代码 ...


有什么方法可以过滤掉AWS Sqs中的信息吗?

在获取到应用程序之前,有什么方法可以从AWS Sqs中过滤掉信息(基于某些条件)。


AWS JS SDK S3 HeadObject 命令抛出错误“检查您是否已显式安装“@aws-sdk/signature-v4-crt”包”

我正在通过CDK部署lambda函数。该函数使用适用于 Nodejs 的 aws-sdk 将 HeadObject 请求发送到多区域接入点 (MRAP)。 当我发送这个 HeadObject 请求时,sdk


AWS Amplify #current-cloud-backend 重复文件

在我的AWS amplify项目中,包含已签出环境资源的当前云状态的#current-cloud-backend文件夹继续添加重复文件,例如backend-config 2....


使用 Jenkins 时 AWS CLI 无法加载凭证

我有 EC2,我已使用 xxxjenkins 用户安装了 AWS CLI。以下是我安装 awscli 所遵循的步骤: 卷曲“https://awscli.amazonaws.com/awscli-exe-linux-x86_64.zip”-o“awscliv2.z...


是否可以使用黑名单而不是白名单方法启动AWS SCP

我正在学习 AWS SCP 的工作原理,我从正在学习的课程中听到的解释是这样的:您从


将现有的 AWS Lambda 和 API Gateway 导出到 Cloudformation 模板

如何将现有配置和测试的基础设施(包括AWS Lambda函数、API网关、ElastiCache集群、Cloudwatch规则)导出到Cloudformation模板? 我了解Cloudfo...


EventBridge 未触发 AWS SageMaker Pipelines

我使用 AWS Python SDK 创建了一个新的 SageMaker 管道,一切正常,我可以触发我的管道,并且使用 SDK 和以下简单命令可以完美运行: 管道.upsert(


AWS Glue 错误 ModuleNotFoundError:没有名为“pyodbc”的模块

我想使用 python 脚本连接到 Microsoft SQL Server,该脚本将在 AWS Glue 上执行。我在安全配置->脚本库->作业参数(可选)中添加了作业参数...


刷新 AWS ECR 注册表的令牌

我有一个用于部署docker镜像的helm图表。我使用以下命令将秘密配置到 kubernetes 中: apt-get 安装 docker sudo apt-get install python python3-pip aws ecr get-login-password --region us-...


© www.soinside.com 2019 - 2024. All rights reserved.