在Python 3.6中提取xlsx工作簿文件元数据/属性

问题描述 投票:0回答:3

如何使用 Python 读取 xlsx 文件中存储的属性/元数据,例如标题、作者、主题、上次修改时间和关键字?我使用过 xlrd 库,但是没有这样的属性来提取这些实体。 任何帮助表示赞赏

python metadata openpyxl xlsx
3个回答
19
投票

您可能对openpyxl感兴趣:

帮助您开始的事情可能如下所示:

from openpyxl import load_workbook
wb = load_workbook('yourfile.xlsx')
wb.properties

这是示例输出:

<openpyxl.packaging.core.DocumentProperties object>
Parameters:
creator=u'User', title=None, description=None, subject=None, identifier=None,
language=None, created=datetime.datetime(2018, 12, 11, 9, 55, 2),
modified=datetime.datetime(2018, 12, 11, 10, 30, 38), lastModifiedBy=u'User',
category=None, contentStatus=None, version=None, revision=None, keywords=None,
lastPrinted=None

这是你可以使用的东西吗?


3
投票

您应该查看

os
库:https://docs.python.org/3/library/os.html,因为元数据存储在文件级别内容之上。
示例:
os.path.getmtime
获取最后修改时间。


0
投票

(#19) 有效(如果添加了 print(wb.properties)),但是有没有办法让它返回文件名? 然后它在批量扫描 xls 文件时变得有用。

© www.soinside.com 2019 - 2024. All rights reserved.