对子目录中的 xml 文件使用 spark.read.from("xml").option("recursiveFileLookup", "true")

问题描述投票：0回答：0

我想递归地将所有 xml 格式的文件加载到我的数据框中，该目录位于具有其他子目录的目录中。对于其他文件格式（txt、parquet、..），代码似乎有效。

df = (
    spark.read
    .format("xml")
    .option("rowTag", "library")
    .option("wholetext", "true")
    .option("recursiveFileLookup","true")
    .option("pathGlobFilter", "*.xml")
    .load("path/to/dir")
)

我用不同的文件格式测试了这段代码，但是没有找到 xml 文件。

xml apache-spark pyspark databricks

最新问题

flutter 使用带有 bloc 的基本状态管理
有什么方法可以通过reactjs点击按钮将Antd表数据导出到Excel表中
训练 IP-Adapter plus 模型后出现推理错误
从字典中的键返回值的函数 - python
如何更改 Azure 应用服务以显示不同的时区？
Next.js 应用程序的 Firebase 应用程序托管和云功能部署中的依赖关系问题
将二维数组的行按两列分组，并覆盖每组中无值的关联元素
如何正确访问地图值？
Android 模拟器无法信任 Charles 代理证书
使用空手道1.5时不会生成Karate.log文件
简单矩阵乘法 - 替换长度错误[关闭]
为什么空手道场景和场景大纲在名称前生成括号？
按日期列对二维数组的行进行分组，并覆盖每组中无值的关联元素
SFSpeechRecognizer 的冗余问题
信号值改变后调用函数
flutter中sqflite的OnUpgrade并在没有该值时设置默认值
如何在拖动过程中使视图保持在用户手指的中心
旧的和奇异的 JVM 上 java.io.BufferedInputStream 的默认缓冲区大小是多少？
C# 字符串前的“@”[重复]
在 MYSQL 中继续获取表和视图

对子目录中的 xml 文件使用 spark.read.from("xml").option("recursiveFileLookup", "true")

问题描述 投票：0回答：0

最新问题

问题描述投票：0回答：0