我正在使用从 Power Automate Desktop 中的收据内容 OCR 中提取的列表,并希望筛选特定的数字组(价格)。问题是
00-00
日期格式的数字不断被捕获。我尝试过以下方法:
1.正则表达式:
[+-]?\b\d{1,3}(?:,\d{3})+\b(.*?)
适用于较大的数字,但无法捕获较小的数字,例如 -2。
2.设置文本解析起始位置: 这是行不通的;它总是从头开始。 例如,我尝试将动态计算的起始位置设置为变量(在所附屏幕截图的情况下为 47),但它没有按预期工作。
附加信息:
目标数字组始终出现在计算为
textVariable.length * 4 + 7
的索引处
日期格式始终为 00-00
,而价格可能以 + or -, may include thousands separators, and can contain decimal places.
开头
由于处理时间较长,我宁愿避免
For Each
。
感谢任何指导!
^([\d]|[+-])?(\b\d{1,3}(?:,\d{3})*\b)\s
正则表达式链接:https://regexr.com/87i21
说明:
^([\d]|[+-])
必须匹配 0-9、+ 或 -
\s
将其放在末尾可确保结束字符是空格,匹配整个单词