我正在使用python和beautifulsoup来解析对象,我正在尝试使用re.findall提取url
<a class="btn btn-danger btn-sm" href="javascript: void(0);"
onclick="if (confirm('Delete link
http://gorillavid.in/8538jm5bptgd')) { removeLink(71603335); }"><i
class="fa fa-trash "></i></a>
我正在尝试提取url https://gorillavid.in/97ylvj76qjeh
。
我正在尝试这个表达式:
re.search("Delete link\s* (.*?)',", data).group(1)
re.findall(r'(https?://[^\s]+)', link)
它给了我错误,它不是一个字符串。
如果要使用findall查找URL,可以使用捕获组:
说明
\s+
(?=
'
)