使用regex查找,并从属于另一个标签的img标签中获取值。

问题描述 投票:0回答:1

我有一个网站的代码,我想从网站上找到并获取图片的路径,我是指从 srcimg 标签。核心问题是标签之间的图片路径。wphimage 而随着 .jpg 分机。

下面的代码。

<p>
    <wphimage data="{'Copyright':'John Smith','Alignment':'left','ImageVersion':'conductorportraitlong'}">
    <span style="display:block; float:left;" class="DIV_imageWrapper">
        <a data-lightview-title="John Smith"  class="lightview" href="//path/to/image/web.jpg"">
            <img src="//path/to/image/web.jpg" alt="Name">
        </a>
        <a class="A_copyright" href="javascript:;">©&nbsp; <span>Terry Linke</span></a>
        <a href="javascript:;">≡ <span>John Smith</span></a>| 
        <a class="A_zoom lightview" href="//path/to/image/web.jpg" data-lightview-title="Dietfried Gürtler" data-lightview-caption="Terry Linke">+ </a>
    </span>
    </wphimage>

    Text here...
</p>

我试着用:

wphimage = re.findall(r'\S+\.jpg', text)

但我也得到了另一个值,来自不同的标签,然后是 <img>.

python html regex tags
1个回答
0
投票

你可以尝试

wphimage = re.findall(r'<img.*src=\"(\S*|\w*)\"', txt)

产出

['//path/to/image/web.jpg']

这个regex可以获取img标签src值中任何非空格和""之间的文字字符。

© www.soinside.com 2019 - 2024. All rights reserved.