aws-databricks 相关问题


Databricks CLI 版本 0.209 - 重置 API v2.1 中的现有作业

如何使用 cli v 0.209 重置 databricks 中的现有作业。 已经参考了下面讨论旧版本 databricks-cli 的论坛 Azure Databricks CLI:更新工作流/作业定义...


无法在Azure databricks中实例化EventHubsSourceProvider

我尝试使用以下代码从 Azure Databricks 的事件中心读取数据。 从 pyspark.sql.functions 导入 * 从 pyspark.sql.types 导入 * NAMESPACE_NAME =“*myEventHub*&...


Databricks Spark:java.lang.OutOfMemoryError:GC 开销超出限制 i

我正在 Databricks 集群中执行 Spark 作业。我通过 Azure 数据工厂管道触发作业,它以 15 分钟的间隔执行,因此在成功执行三到四次之后...


将 Databricks SQL 查询转换为 DAX

我有以下 databricks sql 查询,我需要帮助通过查找转换为 DAX。 选择不同的 P.ProgramId ,P.程序名 ,DU.内部电子邮件地址 来自 gold.programid P INNER 加入黄金。


更新DataBricks中String列类型的JSON数据中的特定值

我在databricks目录中有一个列类型为字符串的表。它包含 JSON,我想从中更新特定值,例如“key1”。我已经使用 from_json 将其转换为 json...


我们如何获取 DataBricks 工作区 URL 和访问令牌

我正在尝试在 CI/CD 集成中进行 Databricks 的端到端实现 例如:使用 Rest API 创建集群、安装库和其他内容 所以为此我们需要 Domain(Worksp...


禁用 Databricks 笔记本中的命令框

我有一个 Databricks 笔记本。我的笔记本有几个命令。其中一些只是为了我的测试,我不想在生产中运行它们。 有什么办法可以禁用命令。我不想


在 Databricks 中使用 AutoLoader 时是否可以不合并镶木地板?

在 Databricks 中使用 AutoLoader 时是否可以不合并镶木地板? 问题是,我想将数据从 S3 存储桶直接复制到 Azure Blob 存储,而不合并它。只需 1:1 复制...


通过全局初始化脚本启用 Databricks 集群日志

我想通过全局初始化脚本为工作区中的所有集群(新的或旧的)设置集群日志传送。 我尝试通过自定义 Spark conf 添加底层 Spark 属性 - /databricks/dri...


将 pyspark 数据帧转换为代码/语法

假设我在 Databricks 中有以下 pyspark 数据框: 一些其他列 价格_历史记录 测试1 [{“日期”:“2021-03-21T01:20:33Z”,“price_tag”:“N”,...


pyspark 中没有发生小数点后 2 舍入

我正在databricks中进行以下计算,并四舍五入到小数点后两位。 结果 = ( 圆形的( 合并( 当(col('col')!= 0,col('col')), 当(col('col')!...


Datadog 中的 AWS Cloudwatch 警报

查看 Datadog AWS 集成文档,我发现提到 AWS 警报可以流式传输到 Datadog 中。据说您可以选择两种不同的方法发送AWS CloudWatch ...


使用 Nodejs18 运行时将 `@aws-sdk/client-bedrock-runtime` 导入 AWS Lambda 函数

我正在尝试使用 NodeJs18 运行时将 @aws-sdk/client-bedrock-runtime 导入到 AWS Lambda 函数中。 该软件包应该可用,因为根据 AWS 文档,“对于 Node.js 版本......


Databricks 合并到 - 添加插入另一个表的条件

我有一个名为“结果”的增量表,我有一个需要按顺序对结果执行的操作列表。 给定操作列表:['op_1', 'op_2', 'op_3'] op_1 修改 va...


是否可以广播字典并将其用作 pyspark 中的查找?

我正在azure databricks中运行以下代码。 使用 erp_bu 创建查找字典,erp_bu 是具有两列“erp_code”和“bu”的行对象列表 广播查找字典


Sharepoint 文件修改时触发 Synapse Pipeline 的方法

我正在寻找一种在文件被修改时触发 Synapse 管道(运行 Databricks 笔记本和 Web 活动来刷新 PowerBI)的方法。 假设我的 Sharepoint 网站上有一个 data.xlsx


除了 kotlin 中的 AWS cognito 之外,还有其他类似 cognito 的 AWS 方法可以用来登录吗?

我正在使用AWS appsync,我还将使用AWS进行登录。顺便说一下,我对AWS不是很熟悉,如果我用错了术语,请原谅我。有一种用于用户登录和认知的 AWS 认知方法


安装“ODBC 驱动程序驱动器和 Databricks 集群”

我的集群上的 init 脚本指向 DBFS 路径。错误显示不再支持 DBFS,我必须移动它的工作区或使用 ABFSS 路径。我搬到工作区 pyodbs.sh 看起来像


使用 @aws-sdk/client-sqs npm 包从 EKS 集群 pod 推送到 AWS SQS 时出错

我在 AWS EKS 集群中使用 @aws/client-sqs npm 包将消息推送到标准 SQS 队列并收到以下错误: CredentialsProviderError:169.254.170.23 不是有效的容器我...


Databricks 上的托管身份 - DefaultAzureCredential 无法从包含的凭据中检索令牌

我正在尝试向天蓝色的服务总线发送消息。 但我收到以下错误: ServiceBusError:处理程序失败:DefaultAzureCredential 失败 从包含的凭证中检索令牌...


尝试在 Azure Databricks 上导入已安装的 Python Wheel 包时出现操作系统错误

我有一个名为 my_sdk.whl 的轮子包,是我在本地开发和构建的。 我还在虚拟环境中使用 pip install my_sdk.whl 测试了这个包,并尝试在...


如何使用C#在AWS Lambda和API Gateway上部署Prince 13.5?

我一直按照本文 (https://medium.com/@bruce_39084/setting-up-prince-on-aws-lambda-and-api-gateway-4d524dcb035b) 中概述的步骤部署 Prince 13.5在 AWS Lambda 和 API Gat...


将 localstack 与 Spring Cloud AWS 2.3 一起使用时出现未知主机

“ResourceLoader”与 AWS S3 可以很好地处理这些属性: 云: 亚马逊: s3: 端点:s3.amazonaws.com <-- custom endpoint added in spring cloud aws 2.3 creden...


AWS sts 在一个命令中承担角色

要在 CLI 中承担 AWS 角色,我执行以下命令: aws sts 假设角色 --role-arn arn:aws:iam::123456789123:role/myAwesomeRole --role-session-name test --region eu-central-1 这给...


AWS EMR 集群中元数据的 AWS 粘合数据目录

我们计划使用AWS EMR集群来处理json和parquet文件。我有一个基本问题,我们真的需要 aws 数据目录来处理存储在 S3 中的 json 和 parquet 文件...


将架构从一个 AWS RDS 移动到另一个

我需要将架构及其对象从一个 AWS RDS 移动到另一个 AWS RDS 数据库。 我过去曾使用过 AWS 架构转换工具 (SCT)。 有没有更好的方法或者我正在做的事情...


将 AWS Glue 连接到本地 MySQL 时出现问题,是 AWS VPC 吗?

我在 AWS 外部托管的私有 Ubuntu 实例上运行 MySQL。我的 S3 存储桶中有几个 CSV 文件,我想使用 AWS Glue ETL 将其加载到我的 MySQL 数据库中。 我其实在关注...


AWS Glue 缺少权限

我正在尝试使用 cloudformation 在 AWS Glue/Athena 中创建表。但是,我在 Cloudformation Events 面板中遇到以下错误:


有 aws dynamodb 的开源替代品吗?

我想从aws迁移到私有IDC。 aws dynamodb 服务应替换为一些数据库。 我希望 dynamodb 替代方案可以与当前代码兼容或者只是做一些...


AWS Lambda 测试时出现关键错误。 API网关POST方法显示未找到消息

我正在尝试使用 AWS Lambda、AWS API Gateway、Amazon SNS 和 AWS Dynamodb 构建无服务器联系表单。我有一个网页,将姓名、电子邮件和电话号码作为表单输入。我是...


无法验证我的 ECR 的 AWS 凭证

我已经安装了最新版本的 aws-cli-2 和 docker,并运行了“aws configure”并输入了我的访问密钥和秘密密钥。我还验证了 aws.config 是正确的并且


liip_imagine 使用 aws s3 生成错误的缓存 url(liip_imagine、vich_uploader、flysystem)

我目前在 liip_imagine 的配置上遇到问题。 我的设置: 交响乐6.4 vichuploader 2.3 利匹马嗪 2.12 联赛/飞行系统 aws/aws-sdk-php 我首先用fly安装了vichuploader...


将 Node.js 后端连接到 AWS RDS MySQL 数据库时出现问题

你好吗? 我在将 Node.js 后端连接到 AWS RDS MySQL 数据库时遇到问题。我从 Digital Ocean 迁移到 AWS,它在 Digital Ocean 中运行得很好。然而,mig之后...


在 aws ec2 Linux 实例中更新到最新的 dart 版本

我正在使用 Serverpod 和 terraform 脚本上传到 aws 服务器。 在我的 pubspec.yaml 文件中,我必须有 dart SDK 版本 3.5.0(最新版本)。 但是部署到 aws ec2 linux 后,我得到...


从托管商将子域添加到 AWS Route 53

我的托管商中有一个工作域,我想在 AWS amplify 中部署 React 应用程序,所以我不想将整个域指向 AWS,而是想从托管中指向像 app.domain.com 这样的子域...


将 OpenAI Python 依赖项导入 AWS Lambda 失败

我正在尝试将 OpenAI Python 库添加到我的 AWS Lambda 函数中。我尝试按照本指南中所述通过 AWS Lambda Layers 添加它们。然而,当执行我的代码时,添加了这个l...


使用单个 API 调用检查 aws s3 存储桶中是否存在 10 个对象

我正在使用 javascript AWS SDK 限制条件: 我不需要这 10 个对象的内容,只想知道它们是否存在 我想为 AWS S3 创建一个 API


如何在单个 AWS 账户中使用 Terraform 创建两个独立的环境(开发环境和生产环境)来部署 AWS 资源

如何在单个 AWS 账户中使用 Terraform 创建两个独立的环境(开发环境和生产环境)来部署 AWS 资源,以及管理多个数据管道的最佳方法是什么?...


HttpMediaTypeNotSupportedException:从 AWS Lambda 运行 SpringBoot REST 应用程序时不支持内容类型“application/octet-stream”

我正在尝试在 AWS Lambda 中运行 Spring Boot 应用程序(例如,各种示例使用与 https://www.baeldung.com/spring-boot-aws-lambda 基本相同的方法 - 只需复制代码和...


AWS 证书管理器无法在 godaddy 域中工作

这是一种了解 aws 域如何工作的实验 AWS证书管理器看起来不错,但没有显示https, 请注意,我没有更改 godaddy 中的名称服务器,或者我没有碰过


AWS SNS:“未配置 RegionEndpoint 或 ServiceURL”

我目前正在尝试在.NET 6中集成AWS SNS的短信服务。我有 awssdk.simplenotificationservice .7.300.32\ 包作为依赖项。这是我的 StartupExtension.cs 中的代码 ...


在 AWS DMS 中使用 babelfish 作为目标终端节点时,用户没有创建表权限

我正在尝试使用 babelfish 功能将一些数据从 SQL Server 迁移到 AWS Aurora (Postgres)。它最近被添加为 AWS DMS 服务中的目标。然而,连接测试失败...


有什么方法可以过滤掉AWS Sqs中的信息吗?

在获取到应用程序之前,有什么方法可以从AWS Sqs中过滤掉信息(基于某些条件)。


AWS JS SDK S3 HeadObject 命令抛出错误“检查您是否已显式安装“@aws-sdk/signature-v4-crt”包”

我正在通过CDK部署lambda函数。该函数使用适用于 Nodejs 的 aws-sdk 将 HeadObject 请求发送到多区域接入点 (MRAP)。 当我发送这个 HeadObject 请求时,sdk


AWS Amplify #current-cloud-backend 重复文件

在我的AWS amplify项目中,包含已签出环境资源的当前云状态的#current-cloud-backend文件夹继续添加重复文件,例如backend-config 2....


使用 Jenkins 时 AWS CLI 无法加载凭证

我有 EC2,我已使用 xxxjenkins 用户安装了 AWS CLI。以下是我安装 awscli 所遵循的步骤: 卷曲“https://awscli.amazonaws.com/awscli-exe-linux-x86_64.zip”-o“awscliv2.z...


是否可以使用黑名单而不是白名单方法启动AWS SCP

我正在学习 AWS SCP 的工作原理,我从正在学习的课程中听到的解释是这样的:您从


将现有的 AWS Lambda 和 API Gateway 导出到 Cloudformation 模板

如何将现有配置和测试的基础设施(包括AWS Lambda函数、API网关、ElastiCache集群、Cloudwatch规则)导出到Cloudformation模板? 我了解Cloudfo...


EventBridge 未触发 AWS SageMaker Pipelines

我使用 AWS Python SDK 创建了一个新的 SageMaker 管道,一切正常,我可以触发我的管道,并且使用 SDK 和以下简单命令可以完美运行: 管道.upsert(


AWS Glue 错误 ModuleNotFoundError:没有名为“pyodbc”的模块

我想使用 python 脚本连接到 Microsoft SQL Server,该脚本将在 AWS Glue 上执行。我在安全配置->脚本库->作业参数(可选)中添加了作业参数...


© www.soinside.com 2019 - 2024. All rights reserved.