etl 相关问题

ETL是Extract,Transform和Load的首字母缩写。它指的是从源系统提取数据,以某种方式转换数据(操纵它,过滤它,将其与其他源组合),最后将转换后的数据加载到目标系统的过程。

AWS Glue 请验证角色的 TrustPolicy

我正在实习,需要使用 AWS Glue 来使用和实施 ETL。我成功地与包含数据的 RDS Aurora 数据库建立了 JDBC 连接,但是当我尝试创建

回答 1 投票 0

SSIS OLE DB 目标编辑器 - 创建新表不是一个选项?

我正在尝试通过 SSIS 将 CSV 文件上传到我的 SQL Server。以前(比如几个月前),我可以在目标编辑器上单击“新建”以根据导入的数据创建通用表

回答 2 投票 0

如何利用airflow进行实时数据处理

我有一个场景,我想处理 csv 文件并加载到其他数据库: 案例 pic csv 文件并加载到与 csv 同名的 mysql 然后使用 py 对加载的行进行一些修改...

回答 2 投票 0

Pentaho ETL 工具即将消亡吗?

我在寻找有用的 pentaho ETL 工具信息时遇到问题,这个工具快要死了吗? 有哪些替代工具/平台>

回答 2 投票 0

参数化雪花任务

我在雪花中创建了 10 个商店过程。为此,我们必须创建 10 个任务来安排。无论如何,我们只能创建 1 个任务并参数化该任务内 store proc 的调用。所以...

回答 1 投票 0

ADF 使用带有 GET 请求的延续令牌复制数据活动分页

我正在 ADF 服务中构建 ETL 管道以从 API 加载数据,但我在使用延续令牌实现分页规则时遇到困难。 我知道,根据 Azure 文档,它

回答 1 投票 0

使用 Nifi JoltTransformJson 转换数组中的 JSON 对象

我在Nifi中使用JOLTTransformJson处理器。 我的Json输入格式有以下4种: [ { “一”:“1” } ] 或者 [ { “一”:“1”, &

回答 1 投票 0

Airbyte Oracle 连接状态代码:08006;错误代码:17002;消息:IO 错误

我试图了解Airbyte并与Oracle建立联系。 我安装了 SQL*Plus 并创建了一个名为 airbyte 的用户,并授予了所有权限。 然后尝试在

回答 1 投票 0

使用 SSIS 将递归层次结构展平为维度

我在关系数据库中有一个递归层次结构,这反映了团队及其在层次结构中的位置。 我希望将这个层次结构扁平化为数据仓库的一个维度,它是一个 SQL

回答 3 投票 0

使用 SSIS 加载列数不断变化的 Excel 文件

我需要使用SSIS加载一个Excel文件,其格式与此类似: 恩普ID 2024年08月 09.2024 12 100 350 并将其逆旋转为如下所示: 恩普ID 日期 价值 12 2024年08月 100 12 09.2024 350 ...

回答 1 投票 0

AWS Glue ETL MongoDB 连接字符串错误

使用 MongoDb 与 AWSglue 的问题 - 我创建了一个到数据库的连接(使用 MongoDb 连接选项)并针对它运行一个爬虫,一切正常,但是当我尝试使用它时...

回答 1 投票 0

出现错误:AttributeError:'MySchemaClassName'对象在使用 apache_beam to_dataframe 模块时没有属性“..type '”

你好,我正在学习 apache_beam。下面是我编写的脚本的一部分,旨在从 pub/sub 订阅中选取流数据,对其进行转换并将最终结果写入

回答 1 投票 0

pip install Snowflake-connector-python 无法构建轮子

构建“snowflake.connector.nanoarrow_arrow_iterator”扩展 错误:需要 Microsoft Visual C++ 14.0 或更高版本。使用“Microsoft C++ 构建工具”获取它:https://visualstudio。

回答 1 投票 0

无法从 Talend 中的 tKafkaInput 获取特定分区数据

我们有一个分布在 3 个分区的 Kafka 主题,我需要在一个作业中从分区 1 和另一作业中从分区 2 获取/读取数据。我尝试过在

回答 1 投票 0

Azure 数据工厂'值不能为空。参数名称:输入'

我正在尝试运行从 API 到 Azure SQL 数据库的复制数据活动。管道活动出现错误 错误代码=InvalidParameter,'类型=Microsoft.DataTransfer.Common.Shared。

回答 1 投票 0

AWS 胶水提取 id 引用的 json

我在 s3 上有一个像这样结构的 json 数据文件,每个对象的 id 用作键 { "id_01": {"name": "朱莉", "city": "巴黎"}, “身份证...

回答 1 投票 0

使用 Apache Nifi 进行具有关系的 ETL 多个表

我想使用 Apache Nifi 将数据从 Oracle 数据库 ETL 到 MS SQL Server 数据库。 目标数据库,有 2 个表(有关系)和一个 1-n 基数(n 值很大,这样...

回答 1 投票 0

仅在本地运行数据库时 SQL Server 才会出现死锁

当尝试在本地测试应用程序(Java、Spring boot、hibernate、SQl 服务器作为数据库)时,我注意到大量死锁,应用程序和数据库正在我的计算机上运行...

回答 1 投票 0

值无法转换为时间戳(Nifi 中的错误)

我有一个列类型为日期时间的mysql目标表。 我的nifi流程就像convertJsontoSQL -> putsql(到这个目标表中)。 putsql 的操作是删除。 转换后

回答 2 投票 0

如何向 DataFrame 添加新的 Struct 列

我目前正在尝试从 MongoDB 中提取数据库,并使用 Spark 将 geo_points 摄取到 ElasticSearch 中。 Mongo 数据库有纬度和经度值,但 ElasticSearch 需要...

回答 3 投票 0

© www.soinside.com 2019 - 2024. All rights reserved.