text-extraction 相关问题

文本提取是从非结构化和/或半结构化机器可读文档（文本）中自动提取结构化信息的任务。

PHP - 如何从包含杂项数据行的输入中识别电子邮件地址

提前为另一个电子邮件模式匹配查询道歉。这是我到目前为止所拥有的： $text = strtolower($intext); $lines = preg_split("/[\s]*[ ][\s]*/", $text); $pattern = '/[A-Za-z0-...

php email text-extraction

回答 1 投票 0

如何在Python中阅读pdf？ [重复]

如何在Python中阅读pdf？我知道一种将其转换为文本的方法，但我想直接从pdf中阅读内容。谁能解释一下 python 中的哪个模块最适合 pdf 提取

python python-2.7 pdf text-extraction

回答 2 投票 0

从 PDF 中提取阿拉伯语文本并向后获取文本

我制作了一个Python脚本，它可以获取带有短语的pdf并将它们提取到anki甲板中。该脚本对于非闪族语言效果很好，但是当有人要求我用 Ar 制作类似的套牌时......

python arabic pypdf text-extraction anki

回答 2 投票 0

提取以‘+’点缀的数字

我的表中有一个字符串格式的列，其中包含不同类型的折扣：整数小数复合折扣，即整数中间散布着 + 符号（例如 10+3，...

sql sql-server string text-extraction

回答 1 投票 0

从文本中获取单词和引用的短语作为数组

我想在 php 中使用正则表达式将单词和短语从字符串中分离出来。这些短语将用双引号和单引号分隔。正则表达式还必须包含

php regex quotes cpu-word text-extraction

回答 3 投票 0

如何从Document AI自定义提取器的JSON输出中提取有价值的信息？

我正在 Document AI 中使用一个简单的自定义提取器，它尝试在上传的任何 pdf 中查找以下字段：国家名字地址国家邮件地址城市我正在使用以下...

python google-cloud-platform ocr text-extraction google-cloud-document-ai

回答 1 投票 0

从逗号分隔的字符串中获取不带括号后缀的值

我如何分割下面的内容，以便所有“东西”都存储在一个数组中？ $string =“这里有东西（9），这里有东西2（20），东西3（30）”; 期望的结果： $something_a...

php text-extraction delimited

回答 2 投票 0

pdftotext 获取字体信息（字体系列、样式、大小）

我正在使用“pdftotext -bbox file.pdf”将 pdf 文件转换为 HTML。以下是输出的示例行：富我正在使用“pdftotext -bbox file.pdf”将 pdf 文件转换为 HTML。这是输出的示例行： <word xMin="351.852025" yMin="42.548936" xMax="365.689478" yMax="47.681498">foo</word> 有没有办法获取每个单词的字体信息，例如：字体系列，例如韦尔达纳样式，即无、粗体、斜体尺寸，例如字体大小9 我有兴趣知道 pdftotext 的 poppler 或 xpdf 版本是否可以做到这一点。您可以使用 pdffonts 中的 poppler-utils 实用程序从 PDF（嵌入字体）中提取字体信息 - $ pdffonts textstr-05.pdf name type encoding emb sub uni object ID ------------------------------------ ----------------- ---------------- --- --- --- --------- LBLHZX+Roboto-Medium CID TrueType Identity-H yes yes yes 7 0 EDWRKS+Roboto-Medium TrueType WinAnsi yes yes yes 8 0 这里是如何检查哪个包在基于 RPM 的发行版上提供 poppler-utils 的示例： $ rpm -q --whatprovides /usr/bin/pdffonts poppler-utils-24.08.0-1.fc41.x86_64

text-extraction pdftotext poppler pdf-scraping xpdf

回答 1 投票 0

计算机视觉

我是计算机视觉新手。我正在尝试从视频帧和图像中提取文本。 github上提供的大部分代码都兼容python <3 versions. Any idea on how to proceed and...

computer-vision text-extraction

回答 3 投票 0

使用 iText 从 pdf 文件中提取文本列

我需要使用 iText 从 pdf 文件中提取文本。问题是：一些 pdf 文件包含 2 列，当我提取文本时，我得到一个文本文件，其中各列被合并为结果（即来自...的文本）

java pdf itext text-extraction

回答 6 投票 0

与文档智能 - Azure 认知服务相关

我在文档智能工作室（以前称为表单识别器）中构建了一个组合模型。它旨在从具有不同模式的不同类型文档中提取不同字段。 T...

azure-functions ocr text-extraction azure-form-recognizer azure-ai

回答 1 投票 0

通过 REGEX 从 Google Sheets 中提取包含混合字符的 UTM 值

我有多行这样的行，我需要提取与 utm_campaign 字段关联的值。如您所见，该值由数字、字母和字符（例如“-”）组成呃...

regex google-sheets text-extraction utm

回答 1 投票 0

在Python中使用PDFMiner从PDF文件中提取文本？

我正在寻找有关如何使用 PDFMiner 和 Python 从 PDF 文件中提取文本的文档或示例。看起来 PDFMiner 更新了他们的 API 以及我找到的所有相关示例...

python python-2.7 text-extraction pdfminer

回答 6 投票 0

如何使用 Selenium 自动滚动到 DOM 中的特定部分？

我正在尝试使用 Selenium 滚动到网页上的特定部分并从该部分检索文本。语境：我正在使用一个网页，该网页通过 CSS 属性禁用文本突出显示...

python css selenium-webdriver webdriver text-extraction

回答 1 投票 0

从处理后的图像中提取文本

我正在尝试从任何欧盟车牌的裁剪图像中提取文本。我尝试过使用 easyocr 但结果对我来说不准确。我训练了一个YOLOV8模型来检测许可证...

python machine-learning computer-vision text-extraction

回答 1 投票 0

从 LayoutLM 获取全文

我正在使用 LayoutLM 读取收据并从发票中获取文本。我正在使用 HuggingFace“philschmid/lilt-en-funsd”中的模型。下面给出的是代码片段： def run_inference(

python deep-learning ocr huggingface-transformers text-extraction

回答 1 投票 0

解析花括号短代码并返回指定属性的值

我正在从我正在使用的旧 CMS 转换一些短代码信息。在某些文章正文中，我需要从一些预先存在的标注中获取 ID {图像 id="27411" shape="landscape"align="rig...

php regex shortcode text-extraction

回答 2 投票 0

从较大的字符串中获取数字及其尾随文本（公制单位）

我需要从两个不同的字符串中提取数字和数字后面的单位..有些字符串在数字和单位之间有空格，例如 150 g，而其他字符串则没有 150g $text = 'Rexona Ap Deo

php regex text-extraction

回答 2 投票 0

如何与文本进行比较并仅将差异文本提取到另一个单元格中

A 栏 B栏 C栏我今年18岁我今年17岁 7 特蕾莎女孩有女孩是，s 我需要与单元格进行比较，然后仅提取与第三个单元格的差异。我想要重新...

excel-formula text office365 text-extraction

回答 1 投票 0

使用 Kendo UI Angular 11 将 Textract JSON 数据绘制到图像

我有一个 JSON 对象，该对象是使用 AWS Textract 从图像中提取的，之后我尝试使用此文本数据绘制相同的图像。我正在尝试为此使用 Kendo Angular Drawing API 并且...

html angular canvas text-extraction kendo-angular-ui

回答 2 投票 0

最新问题

© www.soinside.com 2019 - 2024. All rights reserved.