我有一个网站的代码,我想从网站上找到并获取图片的路径,我是指从 src
在 img
标签。核心问题是标签之间的图片路径。wphimage
而随着 .jpg
分机。
下面的代码。
<p>
<wphimage data="{'Copyright':'John Smith','Alignment':'left','ImageVersion':'conductorportraitlong'}">
<span style="display:block; float:left;" class="DIV_imageWrapper">
<a data-lightview-title="John Smith" class="lightview" href="//path/to/image/web.jpg"">
<img src="//path/to/image/web.jpg" alt="Name">
</a>
<a class="A_copyright" href="javascript:;">© <span>Terry Linke</span></a>
<a href="javascript:;">≡ <span>John Smith</span></a>|
<a class="A_zoom lightview" href="//path/to/image/web.jpg" data-lightview-title="Dietfried Gürtler" data-lightview-caption="Terry Linke">+ </a>
</span>
</wphimage>
Text here...
</p>
我试着用:
wphimage = re.findall(r'\S+\.jpg', text)
但我也得到了另一个值,来自不同的标签,然后是 <img>
.
你可以尝试
wphimage = re.findall(r'<img.*src=\"(\S*|\w*)\"', txt)
产出
['//path/to/image/web.jpg']
这个regex可以获取img标签src值中任何非空格和""之间的文字字符。