如何从Python中的PDF文件中提取检查项目? 我正在从事一个项目,我需要从PDF文件中提取检查项目。以下是我正在使用的PDF文件的屏幕截图: 我需要识别并仅从此P中提取检查项目...

问题描述 投票:0回答:1

我需要从此PDF识别和提取检查项目。谁能使用Python或任何其他相关工具来指导我如何实现这一目标? 我已经研究了诸如PYPDF2和PDFMiner之类的库,但我不确定如何专门针对和提取检查项目。 Quirtements:

在PDF中识别检查项目

提取与这些检查项目关联的文本。

使用

pymupdf
    .
  • 安装
  • pip install -U pip pip install -U pymupdf
import fitz path_pdf = # add your path with fitz.open(path_pdf) as doc: for page in doc: print(f"Page number {page.number}") w = page.first_widget while w: if w.field_type_string == "CheckBox": print(f"{w.field_name}: {w.field_value}") w = w.next
python pdf
1个回答
0
投票
最新问题
© www.soinside.com 2019 - 2025. All rights reserved.