etl 相关问题

ETL是Extract,Transform和Load的首字母缩写。它指的是从源系统提取数据,以某种方式转换数据(操纵它,过滤它,将其与其他源组合),最后将转换后的数据加载到目标系统的过程。

如何检查特定键是否存在于json字符串中

我有以下json字符串数据作为输入:字符串json =“{” - 1“:0,”78“:6,”79“:6,”80“:2,”81“:16777215,”82“: 16777215, “83”:1, “84”:0, “85”:0, “86”: “2023年5月7日”, “87”:0, “88”:0, “89”:1, “90”:1, “124”:1, “16”:5,...

回答 1 投票 1

AWS Glue并更新重复数据

我正在使用AWS Glue将多个文件从S3移动到RDS实例。每天我都会在S3中获得一个新文件,其中可能包含新数据,但也可以包含我已保存的记录以及一些更新...

回答 3 投票 1

从.xlsm文件中删除工作表

我试图从.xlsm文件中删除一个命名的工作表。我按照这里发布的示例,但它不适合我。当我打开.xlsm文件以检查工作表是否已被删除时,...

回答 1 投票 1

aws Glue:是否可以从数据库中仅提取特定数据?

我需要用aws Glue转换一个相当大的数据库表到csv。但是我只有过去24小时内的最新表格行。有一列指定行的创建日期。是......

回答 2 投票 0

如何为ssis中的oledb目标中的列分配常量值

我有一个OLE DB目的地,其目的列如TrackDateTime,OperationTypeID和TrxID .He TrxID我将从输入列获取一个值。但我的要求是......

回答 1 投票 2

AWS胶水ETL作业在批次的S3事件上触发

我有一个S3存储桶,其中包含许多文件(1000条记录/分钟)。我想在批量删除的文件上触发Glue ETL作业。我已经看过使用Firehose来聚合批次......

回答 1 投票 0

如何在ssis中检查列结构?

我的sql server中有一个表客户。列Distributer_Code Cust_code cust_name cust_add zip tel dl_number gstin我们每月从分销商处收到客户文件。所以......

回答 1 投票 3

如何在SSIS中配置foreach循环容器以获取定义的开始和结束日期并在其间运行每个日期?

我想在我的SSIS包中定义start_date和end_date参数,并有一个foreach容器,它运行在这两个(包括)之间的每个日期,它执行一个SQL查询,接受...

回答 3 投票 3

SSIS·如果满足条件,则停止数据流

如果错误输出有任何行,我需要停止数据流和包。在该示例中,可以不处理正确的流行(5983)。

回答 1 投票 2

如何将json数据转换为表

我有以下api调用返回JSON中的数据:https://xama-was-service.herokuapp.com/api/socialone/databoards/10042?1 = 2019-02-01T00:00:00.000Z&2 = test返回数据如下:[[...

回答 1 投票 1

如何在Pyspark中实现有效的时间长度转换速度?

一台机器提供数千个传感器的数据。机器在第一时间展开金属条纹。在下一次加热金属带时,第三次冷却金属带。通过......

回答 1 投票 2

为管理员解锁Netsuite记录

我正在使用ETL管道将Netsuite中的事务数据读入我的数据仓库。我尝试加载数据时收到以下消息:RCRD_LOCKED_BY_WF:此记录已被...锁定

回答 1 投票 0

部署时SSIS脚本组件无法正常工作。抱怨ComponentVersionMismatchError

在部署到SQL Server 2016时,在SSDT(Visual Studio 2017)上运行正常的脚本组件的程序包不会运行。它会抛出ComponentVersionMismatchException。所以,其他包工作......

回答 4 投票 3

带变量的数据流问题中的OLE DB源

尝试在OLE DB源任务中调用proc时,我遇到了令人沮丧的问题。我正在使用来自可变数据访问模式的SQL命令,但我可以看到它没有评估我的变量...

回答 3 投票 2

如何使用AWS Glue支持CDC

我们正在将AWS Glue的变更数据捕获(CDC)功能与SnapLogic和Informatica进行比较。 AWS Glue能够检测数据结构中的变化。我正在寻找具体的......

回答 1 投票 0

Postgresql:在插入带有时间条件的新记录时更新旧记录

所以,我有一个postgresql表,不断追加新的记录与不同的项目期间成本cost_diff ------------------------------- -------------------------- ......

回答 1 投票 0

如何通过SSIS中的主包在TFS上运行包?

我正在构建一个主程序包来启动符合所需条件的程序包。但是,我们现在拥有的所有软件包都在TFS上,似乎我无法称之为...

回答 1 投票 2

Python中最好的ETL包

我有2个用例:从Oracle / PostgreSQL / Redshift / S3 / CSV中提取,转换和加载到我自己的Redshift集群安排工作每天/每周运行(INSERT + TABLE或INSERT + NONE ...

回答 2 投票 1

如何使用where子句是来自另一个数据库的子查询在数据流中创建sourceOLEDB

我在数据库中有一些订单ID。我希望在另一个数据库中选择这些命令的le行。为了实现我的目标,我创建了一个sql任务来获取变量(对象)中的所有订单id和每个...

回答 3 投票 1

记录通过SSIS执行任务更新的行

我有一个连接到SourceDB1并执行更新DestDB2的更新语句的包。现在我有很多这样的源DB和目标DB具有相似的结构。为此,我有......

回答 3 投票 1

最新问题
© www.soinside.com 2019 - 2025. All rights reserved.