从纯文本中解析 URL

问题描述 投票:0回答:2

如何从任何给定的纯文本中解析 URL(不限于标签中的 href 属性)?

任何 Python 代码示例将不胜感激。

python url parsing
2个回答
2
投票

您可以使用正则表达式来解析字符串。

查看之前提出的问题: 使用 Python 从字符串中提取 URL 的最简洁方法是什么?


1
投票

参见 Jan Goyvaerts 的博客

Python 代码示例可能如下所示

result = re.findall(r"\b(?:(?:https?|ftp|file)://|www\.|ftp\.)[-A-Z0-9+&@#/%=~_|$?!:,.]*[A-Z0-9+&@#/%=~_|$]", subject)
© www.soinside.com 2019 - 2024. All rights reserved.