Python regex:re.search()找不到字符串

问题描述 投票:0回答:1

我在使用re.search()方法时遇到麻烦。我正在尝试从以下明确的字符串中提取图像链接:

div class="beitragstext">\n\t\t\t\t<p>Es gibt derzeit keine Gründe mehr NICHT auf 1.1.3 zu springen!</p>\n<p><a href="http://www.flickr.com/photos/factoryjoe/372948722/"><img src="https://www.iphoneblog.de/wp-content/uploads/2008/02/372948722-6ec4028a80.jpg" alt="372948722_6ec4028a80.jpg" border="0" width="430" height="466" /></a></p>\n<p>Photo: <a href="http://www.flickr.com/photos/factoryjoe">factoryjoe</a>

我只减去第一张图像的URL,并且仅URL。

这是我的代码:imageURLObject = re.search(r'http(?!.*http).*?\.(jpg|png|JPG|PNG)', match)

结果应为https://www.iphoneblog.de/wp-content/uploads/2008/02/372948722-6ec4028a80.jpg

相反,方法返回为None。但是,如果使用此正则表达式re.search(r'http.*?\.(jpg|png|JPG|PNG)', match),而不使用`*(?!。http],则第一个http匹配将一直匹配,直到。(jpg | png | JPG | PNG)和这将是返回:

http://www.flickr.com/photos/factoryjoe/372948722/"><img src="https://www.iphoneblog.de/wp-content/uploads/2008/02/372948722-6ec4028a80.jpg

有人可以帮我吗? :-)

python regex string search no-match
1个回答
0
投票
使用美丽的汤进行HTML解析。
© www.soinside.com 2019 - 2024. All rights reserved.