我正在尝试寻找一种方法,将扫描的pdf自动命名为“ 397009900”之类的内容到PDF本身内的某个字符串。就我而言,这是一个工程图名称,我正尝试从PDF中提取名称以重命名文件,即“ ISO-4024-4301”。
是否有一种方法可以使用内部的信息自动重命名PDF文件?
非常感谢。
这可以通过python完成。
import PyPDF2
with open('path_to_file\Test doc.pdf', 'rb') as p:
pdfReader = PyPDF2.PdfFileReader(p)
pageObj = pdfReader.getPage(0)
info=pageObj.extractText()
print(info)
您可以指定要提取信息的页码。从要提取的0处更改页码。
pageObj = pdfReader.getPage(0)
提取的文本将存储在变量info
中,然后您可以执行任何操作来选择要重命名为所需的文本。
import os
os.rename(r'old_file_path_and_name_with_extension',r'new_file_path_and_name_with_extension')
使用OS模块,您可以轻松地重命名文件!