text-parsing 相关问题

文本解析是解析的一种变体,它指的是将文本流分解为不同组件并捕获这些组件之间关系的操作。

Java DateTimeFormatter 不适用于模式“ddMyyyy”

考虑以下日期: 字符串日期=“2391995”; 字符串帕特=“ddMyyyy”; 使用提供的模式,我们可以看到该日期代表 1995 年 9 月 23 日。 但请考虑一下

回答 0 投票 0

为什么 gcov (gcc 12) 输出行摘要两次?

我有一个项目,我用 gcc 工具链版本 10.2.0(Rev6,由 MSYS2 项目构建)构建并使用 gcov 分析测试覆盖率: C: est>gcov.exe "C: est\Appl.c.gcda" 文件...

回答 1 投票 0

解析平面数组的元素并对相关数据集进行分组

我需要从平面字符串数组中提取 Title、Album 和 Artist 的重复值集。 请注意,file: 前缀元素表示一组新数据的开始。 萨...

回答 1 投票 0

正则表达式以识别缺少前导 $

我正在尝试匹配某些缺少前导美元符号的 PHP 代码中的变量,以此作为修复代码的方法。 示例输入: foo = “酒吧” $酒吧=富 富() $foo = 酒吧; 酒吧=富(...

回答 2 投票 0

按不同的定界字符序列拆分字符串

我有以下字符串,带有格式国家:暨名称,额外信息。 亚洲:亚洲杯 - 附加赛 亚洲:亚洲杯 亚洲:世界杯 - 资格赛 - 第一阶段 澳大利亚:甲级联赛

回答 4 投票 0

使用 REGEXEXTRACT 是 Google Spreadsheet 来解析另一个单元格中的条目

我正在尝试找到一种方法来使用 ARRAYFORMULA 和 REGEXEXMATCH 来解析从网球联赛网站下载到 Google 电子表格中的列中的条目。 通常,与 Fred Budd...

回答 1 投票 0

按页而不是段落提取word文档的文本(R)

我目前在(数百个).pdf 和 .docx 文件中有(大量)文本数据。我想在稍后的分析中提取每页的文本,页码变得相关。 对于 pdf f...

回答 1 投票 0

解析带有 2 个分隔符的格式化文本以生成两个数组 [重复]

我有一个小问题需要解决。我想删除字符串的一部分或拆分它。 我最终想要做的是分成 2 个变量,其中我有“一、二、三”和 &

回答 3 投票 0

如何使用 sed 在同一脚本中写入/读取临时文件

我正在使用 sed 更正两列 PDF(使用 pdftotext 3.03)转换问题。转换器有时会正常工作(首先打印左栏文本,然后打印右栏文本)。

回答 0 投票 0

在 C# 中检测特殊字符并将其替换为空白的最佳方法

这是notepad++的截图,你可以看到文件中有一些特殊字符。它显示为一个正方形。 删除它的最佳方法是什么?你认为通过...阅读每个角色吗

回答 0 投票 0

用 post 解析 html 库

问题的本质:我在一个文本文件中有一个自动标识,我将其附加到链接 https://elibrary.ru/defaultx.asp?,但是当我无法在网站上获得授权令牌时提交我的

回答 0 投票 0

解析NLTK Chart图解

我正在尝试使用返回多个解析树的上下文无关语法进行解析。 我可以使用下面的代码将这些解析树一一可视化: grammar = nltk.CFG.fromstring("...

回答 0 投票 0

用 Python 抓取文本文件

我有多个文本文件,其中的文本格式完全相同,名为 st.txt 组合:3 元组数:3 请求类型:ADD 防火墙类型:JP 防火墙策略名称:STI-CEP31 规则类型:允许 请求值...

回答 1 投票 0

如何创建正则表达式来解析我的 SQL 语句

我要提取 FROM 代码 WHERE FieldName='ContactMethod' and IsNull(Deactived,'') != 'T' 从 从代码中选择 FieldDescription、FieldValue WHERE FieldName='ContactMethod' 和 IsNull(Deacti...

回答 4 投票 0

Word 如何能够在其他人失败的情况下如此出色地检测 PDF 结构?有没有图书馆可以做到这一点?

我对解析 PDF 感兴趣已有一段时间,并取得了不同程度的成功。然而,对于 PDF,有用的数据通常包含在文本中,即在表格之外等。如果您要获取数据...

回答 0 投票 0

需要通过读取一些控制字符将头文件连接到数据文件

我正在尝试从遗留系统中读取数据。我有一个没有标题的 .dat 文件,其中包含没有特定分隔符(如逗号或制表符)的数据。它有一个宽度/长度碱基消除系统。

回答 0 投票 0

用Regex查找引号内的所有p标签,不含其他文字。

我想编辑一本翻译得不好的书。我的文字里有很多不必要的p标签。我想找到所有引号内的p标签,如这篇:"......嗯。是......那个,真的是这样......吗?"还有......。

回答 2 投票 0

如何为地理查询程序解析自然语言问题?

我找到了地理查询程序,可以回答一些简单的问题,但我找不到任何演示或说明如何处理问题。所以我的问题是如何才能得到这个。[what,is,the,... ] 。

回答 2 投票 0


从.txt(文本)文件中解析表格

我有一些来自 python 剖析器的剖析结果,如下所示。

回答 1 投票 0

© www.soinside.com 2019 - 2024. All rights reserved.