Power Automate Desktop 中的正则表达式/设置文本解析

Question

我正在使用从 Power Automate Desktop 中的收据内容 OCR 中提取的列表，并希望筛选特定的数字组（价格）。问题是

00-00

日期格式的数字不断被捕获。我尝试过以下方法：

1.正则表达式：

[+-]?\b\d{1,3}(?:,\d{3})+\b(.*?)

适用于较大的数字，但无法捕获较小的数字，例如 -2。

2.设置文本解析起始位置：这是行不通的；它总是从头开始。例如，我尝试将动态计算的起始位置设置为变量（在所附屏幕截图的情况下为 47），但它没有按预期工作。

附加信息：

目标数字组始终出现在计算为

textVariable.length * 4 + 7

的索引处日期格式始终为

00-00

，而价格可能以

+ or -, may include thousands separators, and can contain decimal places.

开头

由于处理时间较长，我宁愿避免

For Each

。感谢任何指导！

Answer 1

试试这个：

^([\d]|[+-])?(\b\d{1,3}(?:,\d{3})*\b)\s

说明：

^([\d]|[+-])

必须匹配 0-9、+ 或 -

\s

将其放在末尾可确保结束字符是空格，匹配整个单词