etl 相关问题

ETL是Extract,Transform和Load的首字母缩写。它指的是从源系统提取数据,以某种方式转换数据(操纵它,过滤它,将其与其他源组合),最后将转换后的数据加载到目标系统的过程。

AWS Quicksight:如何控制对某些 DynamoDB 表的访问

因此,在尝试将 Athena 与 DynamoDB 连接时,我尝试使用 AWS 提供的 Lambda 连接器。问题是它获取所有 DynamoDB 表,我只想显示生产表(其中...

回答 1 投票 0

为什么我的 Visual Studio 2019 社区中的 SSIS 工具箱是空的?

我安装了Visual Studio 2019 Community,然后安装了数据工具。我可以打开 Integration Services 项目,但当我查看 SSIS 工具箱时,它是空的。 我该如何解决这个问题?

回答 8 投票 0

尝试在数据阶段 11.7 中写入镶木地板文件时出错(File_Connector_20,0:java.lang.NoClassDefFoundError:org.apache.hadoop.fs.FileSystem)

我们最近在 Server AIX 7.1 上将 DataStage 从 9.1 升级到 11.7。 我正在尝试使用新的连接器“文件连接器”在镶木地板文件上写入。我创建了简单的工作需要...

回答 3 投票 0

如何使用 C# 仅从文件名中提取日期

我遇到一种情况,我需要从一般模式为 [XXXX_BBBB]_YYYY-MM-DD[.fileExtension] 示例 Sales_person_2019-05-03.xlsx 的文件名中提取日期。 我在 SSIS 中使用 c#

回答 2 投票 0

如何计算数据阶段中两个日期之间的月数

我需要计算两个日期之间的月数,我曾经在Teradata中使用months_ Between函数来计算,但目前我需要在datastage中使用类似的函数或代码。 我...

回答 2 投票 0

SQL Server 连接读取超时

我正在尝试使用 Talend 从 SQL Server 2012 加载到 Azure SQL Server。作业将从源数据库读取所有数据并加载到目标数据库。所有作业都在进行截断和加载。很多

回答 2 投票 0

如何在使用 Python 时使用本地 csv 文件中的数据更新 BigQuery 表?

每天,我都会将数据从 MySQL 数据库迁移到 BigQuery。对于大多数进程,我将 LoadJobConfig().writedisposition 与 WRITE_APPEND 一起使用。但是,对于我的 raw_stock 表,使用 WRITE_APPEND 不会...

回答 1 投票 0

尝试在 BigQuery 中将数据从一个表迁移到另一个表时出错

我在尝试在 BigQuery 表之间迁移数据时遇到问题,我有一个旧表,其属性嵌套为 Float64,我想将数据从这个旧表迁移到另一个表...

回答 1 投票 0

如何使用pentaho水壶从行集中查找唯一值?

我有一个非标准化表。我想从该表的一个特定列中选择所有值,并仅将该列中的唯一值加载到单独的表中。 如何使用 Pentaho 来做到这一点

回答 2 投票 0

如何仅导入数据仓库中使用 ETL 过程更改的新数据和新记录?

我有一个 ETL 流程,允许我将数据从一个数据库加载到另一个数据库,并一路应用转换。当前,该过程首先从所有表中删除所有记录,然后

回答 1 投票 0

在Postgres中提取json数组

我的 Postgres 数据库包含 json 对象列表作为记录。 我试图从记录中提取一个数组,Postgres 似乎不喜欢我的提议。 这是一个 reco 的例子...

回答 1 投票 0

Azure 数据工厂 - 将行规范化为单独的记录

所以我在 SQL Server 数据库中将此表作为源表: 顾客 ID 姓名 地址 城市 状态 压缩 帐单地址 比林城 帐单状态 帐单邮编 1 客户A 123海洋大道 迈阿密 FL ...

回答 1 投票 0

如何在 Azure 数据工厂中进行此数据转换?

所以我在 SQL Server 数据库中将此表作为源表: 顾客 ID 姓名 地址 城市 状态 压缩 帐单地址 比林城 帐单状态 帐单邮编 1 客户A 123海洋大道 迈阿密 FL ...

回答 1 投票 0

使用spark向现有sql数据库表添加列的好方法是什么?

我有一个现有的 Postgres SQL 表,具有一些功能。 我想用 Spark 来: 阅读该表 创建一些附加列 将这些列添加到表中。 有什么办法可以制作火花广告...

回答 1 投票 0

无法在同一作业上同时使用 SQL Server 和 Postgres 连接 - Talend

为了进行测试,我创建了这个简单的 Talend 作业: tRowGenerator 生成具有 int 列的行,并暂存到 Postgres 中的临时数据库。 每当我运行作业时就会出现此问题。 tDBOU...

回答 1 投票 0

JOLT 移位转换以过滤数组中的值

我想使用 JOLT 变换来做两件事: 过滤名为 myarray 的数组中的元素,以便仅保留具有“v_518”属性的元素 过滤掉所有属性...

回答 3 投票 0

Salesforce API - 此会话对于与 REST API 一起使用无效 - 会话 ID 无效

一年多以来,我一直使用 simple_salesforce 包连接到 Salesforce,以便从各种对象中提取一些数据并将其加载到数据湖中。 我已经使用了认证方式...

回答 2 投票 0

连接到数据库服务器

当我尝试在本地计算机上使用 Visual Studio for SSIS 项目时,遇到严重问题,并且我想配置与在虚拟上运行的数据库服务器的 OLE DB 源连接

回答 1 投票 0

在函数执行时删除消息 - Spark

我正在尝试为我的ETL管道运行一些函数并将它们记录在进程中,问题是当我调用我的函数时我的日志消息会立即显示,我想在执行过程中显示它...

回答 1 投票 0

如何从自己的MediaWiki加载数据?

我对 MediaWiki 完全陌生,希望对带有附件的所有页面执行初始获取,然后对更改的页面和附件进行部分获取。 不幸的是,我...

回答 1 投票 0

© www.soinside.com 2019 - 2024. All rights reserved.