Windows从PDF文件本身的信息中自动命名

问题描述 投票:0回答:1

我正在尝试寻找一种方法,将扫描的pdf自动命名为“ 397009900”之类的内容到PDF本身内的某个字符串。就我而言,这是一个工程图名称,我正尝试从PDF中提取名称以重命名文件,即“ ISO-4024-4301”。

是否有一种方法可以使用内部的信息自动重命名PDF文件?

非常感谢。

python batch-file pdf batch-rename
1个回答
0
投票

这可以通过python完成。

import PyPDF2
with open('path_to_file\Test doc.pdf', 'rb') as p:
    pdfReader = PyPDF2.PdfFileReader(p)
    pageObj = pdfReader.getPage(0)
    info=pageObj.extractText()
    print(info)

您可以指定要提取信息的页码。从要提取的0处更改页码。

pageObj = pdfReader.getPage(0)

提取的文本将存储在变量info中,然后您可以执行任何操作来选择要重命名为所需的文本。

import os
os.rename(r'old_file_path_and_name_with_extension',r'new_file_path_and_name_with_extension')

使用OS模块,您可以轻松地重命名文件!

最新问题
© www.soinside.com 2019 - 2025. All rights reserved.