我正在从以下文本示例中提取信息:
“(系列602图片91)”要么“系列号89和图像号34”要么“系列#4,图片#14”并希望提取数字分别作为值和系列标签以及图片标签。
我目前的尝试:([(,]series *{\}d+?[,/ ]* *image* {\}d+(/{\}d+)?[),]) *? on_img
([(,]series *{\}d+?[,/ ]* *image* {\}d+(/{\}d+)?[),]) *? on_img
使用
/series.*?([0-9]+).*?image.*?([0-9]+)/i
请参见proof。 .*?模式将匹配您的单词之间的任何字符,但应尽可能少,因此捕获的数字将最接近那些单词。
.*?