Python找到的URL无效

Question

嗨，我有以下问题：

[我使用Python从.txt文件中提取了网址列表：

 import re

with open('html.txt') as f:
    urls = f.read()
    links = re.findall('"((http)s?://.*?)"', urls)
for url in links:
    print(url[0])

并且输出包含以下某些文件：

https://url.com/?download_file=259&#038;order=wc_order_xDxDxD&#038;email=testmail%40gmail.com&#038;key=1234-1234-1234-1234-8c368abd9c22

问题是：

如您所见，它打印出“＃038;”我在想将其转换为“＆”，但是前面已经有一个“＆”，如果我按照Link无效。

但是如果我删除所有的“＃038;”，链接工作正常。

如何打印它们，使我没有“＃038;”里面的链接有效吗？

非常感谢

Answer 1

好像是url编码问题。因为您仅在打印，所以可以使用字符串替换功能。

for url in links:
    url[0].replace("#038","")

Answer 2

0
投票

您几乎在那里＆＃038 =＆