蔚蓝。 StorageAccounts、Azure 数据工厂 (ADF)。文件夹和子文件夹的组织

问题描述 投票:0回答:1

我想知道我和我的团队存储文件的方式是否是最佳实践,如果不是,或者是否无关紧要。

我正在通过 PowerBI (PBI) 和 Azure 数据工厂 (ADF) 读取存储帐户容器中的一个文件夹。在该文件夹中有很多文件,但也有一些子文件夹也有很多文件。当我只想读取此文件夹中的文件而不读取子文件夹中的文件时,ADF 默认情况下会读取所有内容,无论它是在该文件夹中还是在子文件夹中。在 PBI 中我无法读取子文件夹中的文件,但在 ADF 中我还无法读取......

我们是否应该改变这种存储数据的方式,或者这并不是真正重要的事情?什么可以被视为最佳实践?如何使用 ADF 只读取文件夹文件而不读取子文件夹?

欢迎任何帮助,谢谢

azure cloud azure-data-factory subdirectory azure-storage-account
1个回答
0
投票

为了避免从子文件夹复制文件,您需要取消选中复制活动源中的Recursively选项。

示例演示:

源容器:

enter image description here

给出所需文件夹的路径。在这里,我已经给出了源容器。

enter image description here

同时给出目标位置。

enter image description here

在源代码中取消选中 Recursively 选项。

enter image description here

执行管道,仅复制所需主文件夹中的文件。

enter image description here

在这里,我使用了二进制数据集,但对于任何类型的数据集,该过程都是相同的。

© www.soinside.com 2019 - 2024. All rights reserved.