text-parsing 相关问题

文本解析是解析的一种变体,它指的是将文本流分解为不同组件并捕获这些组件之间关系的操作。

删除或隐藏从网址中抓取的文本

跟进我的上一个问题@stackoverflow.com/questions/7049245/ 我得到了一些我正在寻找的完美正则表达式代码的答案。但现在我遇到了新问题,我似乎无法理解...

回答 2 投票 0

从包含指定单词并以两个指定文件扩展名之一结尾的源代码文本中获取 URL

我的正则表达式需要一些帮助。 Haystack 是整个页面的源代码。我正在搜索末尾有 jpg 和 jpeg 且中间有 pdp-zoom 的链接。 像...

回答 3 投票 0

任何重复 0 次或多次的字符的正则表达式,除非被一个特定字符打断

我试图使用replaceAll()来删除由“[”和“]”括起来的任意数量的字符,除非这两个字符之间还有另一个“[”。例如...

回答 1 投票 0

从可能包含无效 HTML 的字符串中提取 <img> src 值

我在 PHP 中有一个如下所示的变量。 $content = 'abc def end'; 我必须使用正则表达式删除除 img 标签的 src 之外的所有内容

回答 3 投票 0

解析方括号占位符并获取特定属性的值

一些链接如下: [链接 url='http://www.google.com.hk' title='Google' image='']google[/links] [链接 url='http://hk.yahoo.com' title='yahoo' image='']yahoo[/links] 如何使用 PHP 正则

回答 2 投票 0

解析字符串中方括号占位符的 URL 组件

我有这个模式(我使用的是php): '/\[链接\=((https?:\/\/)?([\da-z\.-]+)\.([a-z\.]{2,6})([\/\w \。-]*)*\/?)\]/我' 当我搜索这个字符串时:http://phpquest.zapto.org/users/register.php

回答 2 投票 0

用可预测的组件解析烤肉串句子

示例字符串: 准确度为 5 准确度为 5 或 15 准确度为 5 或 15 或 20 封装为dip-8-或-dip-4-或-dip-16 我当前的正则表达式: /^([a-z0-9\-]+)\-is\-([a-z0-9\.\-]*[a-z0-9])(?:\-or\-([ a-z0-9...

回答 3 投票 0

将浮点值和日期表达式与字符串分开,不带分隔符

我刚刚开始学习正则表达式,我有一个像这样的例子 23.0003NOV14DIX。我想提取 23.00 和 03NOV14DIX。 我试过这个: preg_match("/(?P[0-9]\.[0-9]{2}+)\s+...

回答 6 投票 0

从方括号占位符中提取数据

我想形成一个模式来匹配以下字符串中的单词“Jason”: [最后用户=杰森;22]

回答 2 投票 0

从可能少于 5 位数字的浮点值的各个数字填充 5 元素数组

我有一个小数(5,2),我试图将其分成一个数组。 那么如果数字是.. 123.45 = 数组([0] => 1 [1] => 2 [2] => 3 [3] => 4 [4] => 5 ) 23.45 = 数组([0] => 0 [1] =...

回答 3 投票 0

解析带有名称和属性声明的大括号占位符

我需要在 PHP 中使用正则表达式解析这样的字符串:“{data type="subject"}。 我有这个模式: $template = '/{([\w]+)\s([\w]+)="([\w]+)"}/'; 但什么也没有

回答 2 投票 0

解析值中包含冒号的不带引号的 JSON 对象

所以我有以下字符串: {family:Open Sans,名称:Open Sans,import_family:Open+Sans:300,300italic,常规,斜体,600,600italic,700,700italic,800,800italic,classname:opensans} 我愿意“

回答 2 投票 0

将主题标签转换为超链接[重复]

我正在寻找一个正则表达式,它可以识别字符串中的#后跟数字并使其可点击。仅当它是 # 和像 ex: #758 这样的数字并且使 I 可点击时。不是 #758。Youtube 有这个

回答 1 投票 0

将多行联系人卡片解析为单个变量

我想获取以此格式输入的数据: 约翰·史密斯 假街123号 假城,55555 http://website.com 并将值存储在变量中,如下所示: $name = '约翰·史密斯'; $地址 = '123 假字符串...

回答 3 投票 0

解析 BBCode 样式标签以访问标签名称和包含的文本

我正在尝试解析一些文本,例如: $text = "Blah blah [a]findme[/a] 和 [b]findmetoo[b],也许还有 [z]me[/z]。"; 我现在拥有的是: preg_match_all("/[*?](.*?)[\/*?]/", $text, $matches);

回答 7 投票 0

将方括号简码的参数解析为平面数组

所以我有这个正则表达式 - regex101: \[简码 ([^ ]*)(?:[ ]?([^ ]*)="([^"]*)")*\] 尝试匹配该字符串 [简码联系人 param1="test 2" param2="test1"] 现在,正则表达式匹配...

回答 3 投票 0

用不在括号内的逗号分割字符串

两天前,我开始研究代码解析器,但我陷入了困境。 如何用不在括号内的逗号分隔字符串?让我告诉你我的意思。 我有这个字符串要解析: 一、二、t...

回答 9 投票 0

将表示数组数据的格式化字符串转换为数组

我有一个数组存储在数据库中,所以首先要将该数组转换为字符串。那么如何将我转成字符串形式的数组返回呢? 这是我的数组,带有

回答 1 投票 0

在 R 中解析文件:在没有时间戳的情况下跟踪一段时间内的事件

我有一个txt文件,我在R中解析它以从中获取一些统计信息。它看起来像这样: **新会话** 事件A 事件B 事件B 事件C 事件A 事件C ... **新会话** ... **新

回答 2 投票 0

解析 var_export 输出文本以填充关联数组

不久前,我通过一些 API 获取了大量数据,并将其保存到一个平面文件中,执行简单的 var_dump 或 print_r。现在我正在处理数据,每行看起来像: ” '

回答 4 投票 0

© www.soinside.com 2019 - 2024. All rights reserved.