azure-data-lake 相关问题

Azure Data Lake Analytics是Microsoft Azure中的三大数据服务套件:HDInsight,Data Lake Store和Data Lake Analytics。这些完全托管的服务使得易于上手和轻松扩展以Hive,Pig,Spark,Storm和U-SQL编写的大数据作业。要了解更多信息,请访问:https://azure.microsoft.com/en-us/solutions/data-lake/

Azure Data Lake Gen 2 和 Python 在 Data Lake 文件夹中复制文件

使用此处证明的示例:https://learn.microsoft.com/en-us/azure/storage/blobs/data-lake-storage-directory-file-acl-python?tabs=account-key。我已经能够连接到我的 Azure Data Lake

回答 1 投票 0

是否可以使用 DBeaver 和 DuckDB 连接器直接从 Azure Datalake 存储读取 parquet 文件?

我使用 DBeaver 和 DuckDB 数据库连接(Path = :memeory:)来读取本地 .parquet 文件。 SELECT * FROM "C: old\myfile.parquet" 是否可以直接读取 .parquet 文件...

回答 1 投票 0

根据通配符在源处复制文件名,以便使用 Azure 数据工厂传输到接收器中的单独文件夹

我希望配置 ADF 作业以使用复制功能从源容器传输 .txt 文件,并将它们传输到各自文件夹中的 ADLS 接收器容器。 例如: 所以...

回答 1 投票 0

在 Azure 数据工厂中解压缩

我有一个大小为32GB的zip文件。我需要将其导入数据湖存储服务帐户。我正在尝试解压文件并通过 Azure 数据工厂移动该文件。 Zip 文件已上传...

回答 2 投票 0

使用 delta-rs Python API 连接到 Azure Data Lake Storage Gen 2 上的 Delta Lake 并进行身份验证

我正在尝试使用 Delta-rs Python API 连接并验证 Azure Data Lake Storage Gen 2 中的现有 Delta 表。我从这个 StackOverflow 问题中找到了 Delta-rs 库:Delta

回答 2 投票 0

如何在Synapse(托管专用端点)中读取excel文件?

使用 Azure Synapse,我有一个笔记本,可以在其中读取位于 Azure Data Lake 中的 excel 文件。 通常它是有效的,改变的是现在我使用托管专用端点。 当笔记本电脑启动时,我...

回答 1 投票 0

无法在 azure AD 中添加雪花存储帐户的角色分配

我已经使用azure云提供商创建了一个雪花,并尝试将数据从数据湖加载到雪花中的外部阶段 为此,我按照以下步骤操作: 在 azure 和

回答 2 投票 0

天蓝色数据块中的安装点

我想使用以下代码在azure databricks上使用安装点: dbutils.fs.ls('/mnt/dz/') 但我有这个错误 Shadowd.databricks.org.apache.hadoop.fs.azure.AzureException:java.util。

回答 1 投票 0

Azure 数据工厂获取嵌套 json 对象的文件路径

我在Azure数据工厂中遇到以下问题: 容器/../../year=2023/m=1/d=01/h=01/m=5/file.json 20年每5分钟、每小时、每天、每月都有一个json文件...

回答 1 投票 0

为特定于租户的容器实施 Azure Data Lake 存储生命周期规则

我正在使用 Azure Data Lake Storage (ADLS),并拥有多租户设置,其中每个租户都有一个单独的容器。每个租户容器内的文件夹结构都是标准化的,并包括...

回答 1 投票 0

如何使用 Azure 数据工厂将 Azure 分析服务中的数据存储到 Azure Datalake 中?

如何使用Azure数据工厂将数据从Azure分析服务存储到Azure Datalake中? 我在 Azure 分析服务中有两个表,我需要将这些数据复制并存储到 Azure Datalake 中...

回答 1 投票 0

如何动态加载包含不同sheet名称的不同Excel文件到SQL

*这是通用上下文:尝试将数据从 Azure Data Lake 中托管的 Excel 文件复制到 Azure SQL 数据库 * 这是我目前的情况:我正在使用Microsoft Azure云,实际上我有一个

回答 1 投票 0

如何将“设置变量”活动的字符串输出转换为 Azure 数据工厂中的 .csv 或 .txt 文件

我想获取字符串格式的“设置变量”活动的输出,并将其转换为 .csv 或 .txt 格式。 [设置变量输出: { “名称”:“数据_字符串”, ...

回答 1 投票 0

如何使用 Synapse 从 ADLS gen2 读取 python 中的 pdf 或 pptx 或 docx 文件?

我希望在 Synapse 笔记本中使用 python 读取不同格式的文件。其中包括 .pdf、.pptx、.docx、.msg 和 .eml。我希望能够读取文件然后解析并

回答 1 投票 0

如何使用 Azure 数据工厂创建 Json 文件并将其保存到存储帐户

我是 Azure 数据工厂的新手,有一个听起来很简单的要求,但我无法弄清楚。 我有一个 Json 文件保存在存储帐户容器中,我需要从中读取...

回答 1 投票 0

Camel Kafka接收器连接器配置和依赖项

我正在尝试使用“camel-azure-storage-datalake-kafka-connector”从 Kafka 连接到 Azure ADLS Gen2 我有一个运行 Docker 的 Linux 机器,其中包含 debezium/zookeeper、debezium/kafka 和 debe...

回答 1 投票 0

如何在 Power BI 桌面中仅加载选定文件

Power BI Desktop 支持从 ADLS 加载单个镶木地板文件, 现在,我们的进程会将多个镶木地板文件转储到一个文件夹中。该文件夹将包含包含其他文件的子文件夹...

回答 2 投票 0

如何计算某个时间范围内Azure Data Lake中的数据大小。需要根据 ADLS 中的修改时间访问该范围内的文件

我的数据位于 Azure Data Lake 内的文件夹和子文件夹中。每条数据都带有一个文件名,在ADLS中,我们可以查看修改时间。现在,我正在计算...

回答 1 投票 0

Tableau 和 ADLS2 之间的连接器问题

我在将 ADLS2 环境连接到 Tableau 时遇到问题。 我可以使用“ADLS Gen2 > 文件 URL”连接类型连接到 ADLS,但不能使用“ADLS Gen2 > 浏览”连接类型....

回答 1 投票 0

将 Apache Spark 连接到 Azure 数据湖(第 2 代)

我正在虚拟机中工作,在其中设置了整个 Spark 工作区并将其连接到 Jupyter Notebook。这个问题不是关于如何连接Databricks中的数据湖。我只是在工作...

回答 1 投票 0

最新问题
© www.soinside.com 2019 - 2024. All rights reserved.