来自 HTML 的 PDF 中的元数据

问题描述 投票:0回答:1

我需要携带一些元数据(可能只是一个 ID),从源 HTML 到使用 WeasyPrint 的 PDF,最终以某种方式在

pdf.js
(更具体地说,
react-pdf
)渲染的 HTML 中进行寻址。

例如,如果我的源 HTML 中有此元素:

<p class="x00-chapter-title---toc-level" id="my-id">Contents</p>

使用

qpdf
,我能够生成生成的 PDF 的文本可读版本,并高兴地发现了这个:

<<
  /Names <<
    /Dests <<
      /Names [
        (my-id)
        [
          25 0 R
          /XYZ
          67.25
          810.889736
          0
        ]
      ]
    >>
  >>
>>

...这给了我希望!

但现在我不知道如何使用

pdf.js
来访问这些详细信息,甚至不知道如何告诉我它们的含义。大概是页面上的坐标。

我该怎么做?

pdf pdf.js react-pdf weasyprint qpdf
1个回答
0
投票

所以我得到了它,给了我我需要的一切:

  const page = await pdf.getPage(pageNum);
  const pageRef = page.ref; // This contains the object reference for the page
  const objectNumber = pageRef.num;
  const generationNumber = pageRef.gen;

  // Get all named destinations
  const destinations = await pdf.getDestinations();
© www.soinside.com 2019 - 2024. All rights reserved.