如何使用 Python 读取 xlsx 文件中存储的属性/元数据,例如标题、作者、主题、上次修改时间和关键字?我使用过 xlrd 库,但是没有这样的属性来提取这些实体。 任何帮助表示赞赏
您可能对openpyxl感兴趣:
帮助您开始的事情可能如下所示:
from openpyxl import load_workbook
wb = load_workbook('yourfile.xlsx')
wb.properties
这是示例输出:
<openpyxl.packaging.core.DocumentProperties object>
Parameters:
creator=u'User', title=None, description=None, subject=None, identifier=None,
language=None, created=datetime.datetime(2018, 12, 11, 9, 55, 2),
modified=datetime.datetime(2018, 12, 11, 10, 30, 38), lastModifiedBy=u'User',
category=None, contentStatus=None, version=None, revision=None, keywords=None,
lastPrinted=None
这是你可以使用的东西吗?
您应该查看
os
库:https://docs.python.org/3/library/os.html,因为元数据存储在文件级别内容之上。os.path.getmtime
获取最后修改时间。
(#19) 有效(如果添加了 print(wb.properties)),但是有没有办法让它返回文件名? 然后它在批量扫描 xls 文件时变得有用。