是否有在Microsoft Word(docx
)文件中添加页眉和页脚的解决方法?
在python-docx
之前的0.8.8
版本中没有实现这些。
更具体地说,我想补充一下:
理想的代码如下:
from docx import Document
document = Document()
# Add header and footer on all pages
document.save("demo.docx")
这样的事情(感谢艾略特K)
from docx import Document
import win32com.client as win32
import os.path
import tempfile
tempdir = tempfile.gettempdir()
msword = win32.gencache.EnsureDispatch('Word.Application')
tempfile = os.path.join(tempdir, "temp.doc")
document = Document()
document.save(tempfile)
doc = msword.Documents.Open(tempfile)
doc.Sections(1).Footers(1).Range.Text = r'Text to be included'
doc.Sections(1).Footers(1).PageNumbers.Add()
doc.SaveAs(tempfile, FileFormat = 0)
document = Document(tempfile)
也许不是最优雅的方法,但应该做你需要的。也许在代码的尘土飞扬的某个地方的某个函数中隔离丑陋的保存/加载代码;-)
同样,确实需要安装了Microsoft Office的Windows机器。
祝好运!
模板方法有效,其主要优点是它是一个真正的跨平台解决方案。但是,它要求在文档中已经应用了一次样式。
让我们来看看python-docx
documentation page的玩具示例的(简化)版本。
第一步涉及创建模板文档:
from docx import Document
document = Document()
document.add_heading('Document Title', 0)
p = document.add_paragraph('A plain paragraph having some ')
p.add_run('bold').bold = True
p.add_run(' and some ')
p.add_run('italic.').italic = True
document.add_heading('Heading, level 1', level=1)
document.add_paragraph('Intense quote', style='IntenseQuote')
document.add_paragraph(
'first item in unordered list', style='ListBullet'
)
document.add_paragraph(
'first item in ordered list', style='ListNumber'
)
document.save('demo.docx')
(请注意,您也可以在第一步中手动应用样式,而不使用python-docx
,即Word中的样式。)
接下来,在Microsoft Word中打开此demo.docx
,您可以在其中:
完成上述操作后,您只需删除demo.docx
文档的主要内容(但不删除页眉和页脚的内容!)并再次保存文件。
在第二步中,使用demo.docx
调用python-docx
进行所需的更改:
from docx import Document
document = Document('demo.docx')
document.add_heading('A New Title for my Document', 0)
p = document.add_paragraph('A new paragraph having some plain ')
p.add_run('bold').bold = True
p.add_run(' and some ')
p.add_run('italic.').italic = True
document.add_heading('New Heading, level 1', level=1)
document.add_paragraph('Intense quote', style='IntenseQuote')
document.add_paragraph(
'first new item in unordered list', style='ListBullet'
)
document.add_paragraph(
'first new item in ordered list', style='ListNumber'
)
document.save('demo.docx')
您甚至可以进一步添加内容,例如具有现有表格样式的表格:
from docx import Document
document = Document('demo.docx')
document.add_page_break()
recordset = [ [1, "101", "Spam"], [2, "42", "Eggs"], [3, "631", "Spam, spam, eggs, and spam"]]
table = document.add_table(rows=1, cols=3)
hdr_cells = table.rows[0].cells
hdr_cells[0].text = 'Qty'
hdr_cells[1].text = 'Id'
hdr_cells[2].text = 'Desc'
for item in recordset:
row_cells = table.add_row().cells
row_cells[0].text = str(item[0])
row_cells[1].text = str(item[1])
row_cells[2].text = item[2]
table.style = 'ColorfulShading'
document.save('demo.docx')
当然,可以避免copying the customized file一直重复第一步,然后在那里进行必要的更改(例如demo_copy.docx
)而不影响模板:
import shutil
shutil.copyfile('demo.docx', 'demo_copy.docx')
最后,值得一提的是,您还可以使用自定义样式!有关如何使用python-docx
和表格样式see here执行此操作的示例。
它不是最优雅的(它需要您在VBA和Python之间导航),但您可以使用win32com库来使用MS Word功能。这当然需要安装了MS Office的Windows机器。
import win32com.client as win32
msword = win32.gencache.EnsureDispatch('Word.Application')
doc = msword.Documents.Add
doc.Sections(1).Footers(1).Range.Text = r'Text to be included'
doc.Sections(1).Footers(1).PageNumbers.Add()
您可以使用的解决方法之一是使用在Word中创建的模板文档。创建一个空白文档,添加包含所需文本的标题和页脚编号的页脚并保存文档。然后使用:
from docx import Document
document = Document("template.docx")
# Do your editing
document.save("demo.docx")
...并且您应该能够在保留页眉和页脚的同时编辑其他所有内容。
最终,我认为这个解决方案对于页码问题非常有用。如果你需要每个文档的唯一标题文本,事情可能会有点棘手。如果是这种情况,您可能希望尝试直接编辑docx文件的XML。您可以在终端中使用它:
unzip template.docx
...将docx XML文件吐出到目录中。您还可以使用zipfile在python中执行此操作:
import zipfile
document = zipfile.ZipFile("template.docx")
for xml in document.filelist:
if "header" in xml.filename:
read = document.read(xml.filename)
print(read.decode())
print语句将打印整个XML文件,但您应该能够找到这个小知识:
<w:r><w:t>ThisIsMyHeader</w:t></w:r>
这将是标题中的文字。您所要做的就是编辑XML文件,将文件重新组合在一起,然后将文件类型更改回docx。
这显然是一个超级黑客的解决方法,不幸的是我无法让它完全发挥作用,但如果你绝对需要,它至少会朝着正确的方向迈出一大步。
祝好运!
我一直在用它来工作
from docx import Document
document = Document()
header = document.sections[0].header
header.add_paragraph('Test Header')
header = document.sections[0].footer
header.add_paragraph('Test Footers')
https://python-docx.readthedocs.io/en/latest/dev/analysis/features/header.html