RegEx捕获字符串，其换行符为（一组）字符的第一个实例

Question

我试图在以下源字符串中获取字符串的第一个实例

输入字符串

 ><text color="#FFFF00" creationdate="D:20180307100631+04'00'" flags="print,nozoom,norotate" date="D:20180307100652+04'00'" name="a60915a3-1c23-4f6d-b8d4-fbe0dd4890e9" icon="Comment" page="7" rect="351.308000,135.732000,371.308000,153.732000" subject="Sticky Note" title="saddia"
><contents-richtext
><body xmlns="http://www.w3.org/1999/xhtml" xmlns:xfa="http://www.xfa.org/schema/xfa-data/1.0/" xfa:APIVersion="Acrobat:9.0.0" xfa:spec="2.0.2"
><p dir="ltr"
><span dir="ltr" style="font-size:10.0pt;text-align:left;color:#000000;font-weight:normal;font-style:normal"
>As agreed with WPO that any unspecific area use GEN</span
><span dir="ltr" style="font-size:11.0pt;text-align:left;color:#1D477B;font-weight:normal;font-style:normal"
>&#xD;</span
><span dir="ltr" style="font-size:11.0pt;text-align:left;color:#000000;font-weight:normal;font-style:normal"
>&#xD;</span

我正在尝试检索输出如下

page="7" rect="351.308000,135.732000,371.308000,153.732000" subject="Sticky Note" title="saddia"
><contents-richtext
><body xmlns="http://www.w3.org/1999/xhtml" xmlns:xfa="http://www.xfa.org/schema/xfa-data/1.0/" xfa:APIVersion="Acrobat:9.0.0" xfa:spec="2.0.2"
><p dir="ltr"
><span dir="ltr" style="font-size:10.0pt;text-align:left;color:#000000;font-weight:normal;font-style:normal"
>As agreed with WPO that any unspecific area use GEN</span

这是</span的第一个例子。

我的RegExp如下所示，它选择了最后一次出现的所需结束字符组：

page="[0-9]+".+subject="(Text Box|Sticky Note)".+((\s+.+)+);<\/span

我对RegEx知之甚少，所以请耐心等待。

该片段输出XFDF（pdf注释导出），但它的格式很奇怪，所以我使用了html标记来格式化。

Answer 1

在下面的正则表达式中，我做的主要更改是使点变得懒惰，这意味着它在点之后的第一个模式处停止。这是为了防止图案在整个文本上仅梳理一次。

page="[0-9]+".+?subject="(?:Text Box|Sticky Note)".+?<\/span

Demo

请注意，为了使上述模式起作用，必须在DOT ALL模式下完成正则表达式，这意味着该点也可以跨换行符进行匹配。

在VBA中，没有正式的DOT ALL模式，我们可以使用[\s\S]来模拟它：

page="[0-9]+"[\s\S]+?subject="(?:Text Box|Sticky Note)"[\s\S]+?<\/span

RegEx捕获字符串，其换行符为（一组）字符的第一个实例

问题描述投票：1回答：1

1个回答

Demo

最新问题

RegEx捕获字符串，其换行符为（一组）字符的第一个实例

问题描述 投票：1回答：1

1个回答

Demo

最新问题

问题描述投票：1回答：1