etl 相关问题

ETL是Extract,Transform和Load的首字母缩写。它指的是从源系统提取数据,以某种方式转换数据(操纵它,过滤它,将其与其他源组合),最后将转换后的数据加载到目标系统的过程。

AWS Glue Python 作业 VS AWS Glue Spark 作业

我有一个用例,我必须创建一个 AWS Glue ETL 作业以将 S3 对象中存储的数据更新到 DDB 中的现有表。需要考虑的几个属性是: 目前数据集约为 40...

回答 1 投票 0

ETL中截断加载和满载一样吗?

截断加载和完全加载对于目标表中的数据加载有什么区别?

回答 1 投票 0

从 Azure 数据工厂中的整个文件读取非结构化文本

我有一个文件,在 ADLS 中以非结构化 txt 形式存在。我想以文本形式读取整个文件内容并将其传递到 Azure 数据工厂中的存储过程。这可以通过 Azure 来完成吗...

回答 1 投票 0

如何根据文件夹 F2 中是否存在其内容来复制文件夹 F1 中的 XML 文件(忽略文件名)

我们已经为我们运行的其他进程准备了一个 Azure 数据工厂,因此正在尝试使用它来解决以下问题: 我们已经拥有的: ADF 已部署并运行,我们只需创建一个...

回答 1 投票 0

SSIS 输出和 SSMS 输出中的数据大小差异

我有一个 SSIS 包,它使用 SQL 命令从数据库中提取数据,然后生成 1452kb 的分隔文本文件 我在 SSMS 上运行相同的查询并生成文本文件 1499...

回答 2 投票 0

在SSIS中如何访问运行OLE DB命令的结果?

我在 Visual Studio 2010 中使用 SSIS。我的包如下所示: OLE DB 源 -> 多播 -> 7 个 OLE DB 命令 上述七个 OLE DB 命令中的第六个包含: 选择 r.Device...

回答 4 投票 0

从 Snowflake 内部连接到本地数据库

可以直接从 Snowflake 建立与本地数据库(例如 Sybase)的连接,还是需要在 Snowflake 外部建立连接?例如,我知道我可以在某些 AWS 合作伙伴中连接到我的数据库...

回答 1 投票 0

使用 ETL 工具 (Fivetran/Hevo)、dbt 和反向 ETL 工具 (Hightouch) 创建顺序工作流程

我在一家初创公司工作,正在从头开始建立我们的分析技术堆栈。由于资源有限,我们专注于使用第三方工具而不是构建自定义管道。 我们的

回答 4 投票 0

SSIS 从 csv 中删除 $ 格式

我有一个 csv 文件,其中包含多个格式为货币的列,删除格式但保留值的最佳方法是什么。如果可能的话,我希望使该过程自动化。 我...

回答 1 投票 0

元数据驱动的 ADF 管道从多个源获取数据

我正在设计 ADF 解决方案以从 DataLake 原始层读取多个源文件夹,我需要构建一个配置文件,在其中可以动态管理要加载的文件/文件夹以及要加载的日期范围 我....

回答 1 投票 0

如何将连接管理器嵌入到 SSIS 脚本组件的 C# 代码中?

当我打开脚本组件时,我可以从下拉列表中选择连接管理器: 这个连接管理器拥有一切,如果我将它作为 C# 代码中的对象,我就不需要编写一个 har...

回答 4 投票 0

如何在 C# 代码中嵌入可为脚本组件选择的连接管理器?

我应该如何在 SSIS 数据流任务的“脚本组件”中使用连接管理器。我尝试使用带有 OLEDB 提供程序和 SQL 的连接管理器,但失败了。什么是正确的方法...

回答 4 投票 0

生成ETL过程的数据流图

我想为 ETL 流程生成类似数据流程图的内容。 我想要实现的是拥有(最小的示例)两个表 - 源表和目标表 - 两个表都带有

回答 1 投票 0

Pentaho PDI || Windows 当前用户

PDI版本:9.3 环境:Windows服务器 我正在尝试检索执行转换的当前用户的用户名,目的是基于该用户创建动态文件路径

回答 1 投票 0

AWS Glue Crawler 在读取空文件时创建多个表

我正在编写一个 Glue Crawler 作为 ETL 的一部分,我有一个非常烦人的问题 - 我正在爬取的 S3 存储桶包含许多不同的 JSON 文件,所有文件都具有相同的架构。当爬行桶时...

回答 1 投票 0

AWS Glue 工作室将 Pyspark 字符串列转换为日期返回 null

我有来自 S3 存储桶的数据,并且想要将日期列从字符串转换为日期。当前日期列的格式为 7/1/2022 12:0:15 AM。 我在 AWS Glue Studio 中使用的当前代码...

回答 3 投票 0

我如何在 Gathr 中请求连接器

我是 ETL 开发人员,正在寻找 Gathr 中不可用的数据源连接器,并且我不知道如何请求新的连接器。现在,由于

回答 1 投票 0

Gathr 企业版如何将管道从开发环境导出到生产环境?

我是生产新手,正在尝试导入开发团队提供的管道。 我还没试过。如果有类似的问题,我希望首先在在线平台上得到答案

etl
回答 1 投票 0

我正在使用 Gathr 构建我的 ETL,我想在将源数据存储到目标中之前更改源数据的列名称。有没有办法实现这个目标?

我正在使用 Gathr 构建我的 ETL 流程,我想在将源数据存储到目标中之前更改源数据的列名称。有办法实现这一点吗? 我不知道如何更改列 n...

etl
回答 1 投票 0

SSIS 包执行在完成之前停止

今天遇到一个bug,分享给大家。 当尝试在 Visual Studio(2015 和 2017)中执行 SSIS 包时,可能会发生以下情况(请注意此包已执行

回答 5 投票 0

© www.soinside.com 2019 - 2024. All rights reserved.