Power Automate Desktop 中的正则表达式/设置文本解析

问题描述 投票:0回答:1

enter image description hereenter image description hereenter image description here

我正在使用从 Power Automate Desktop 中的收据内容 OCR 中提取的列表,并希望筛选特定的数字组(价格)。问题是

00-00
日期格式的数字不断被捕获。我尝试过以下方法:

1.正则表达式:

[+-]?\b\d{1,3}(?:,\d{3})+\b(.*?)

适用于较大的数字,但无法捕获较小的数字,例如 -2。

2.设置文本解析起始位置: 这是行不通的;它总是从头开始。 例如,我尝试将动态计算的起始位置设置为变量(在所附屏幕截图的情况下为 47),但它没有按预期工作。

附加信息:

目标数字组始终出现在计算为

textVariable.length * 4 + 7
的索引处 日期格式始终为
00-00
,而价格可能以
+ or -, may include thousands separators, and can contain decimal places.

开头

由于处理时间较长,我宁愿避免

For Each
。 感谢任何指导!

regex ocr text-parsing power-automate-desktop
1个回答
0
投票

试试这个:
^([\d]|[+-])?(\b\d{1,3}(?:,\d{3})*\b)\s

正则表达式链接:https://regexr.com/87i21

说明:

^([\d]|[+-])
必须匹配 0-9、+ 或 -

\s
将其放在末尾可确保结束字符是空格,匹配整个单词

© www.soinside.com 2019 - 2024. All rights reserved.