Python找到的URL无效

问题描述 投票:0回答:2

嗨,我有以下问题:

[我使用Python从.txt文件中提取了网址列表:

 import re

with open('html.txt') as f:
    urls = f.read()
    links = re.findall('"((http)s?://.*?)"', urls)
for url in links:
    print(url[0])

并且输出包含以下某些文件:

https://url.com/?download_file=259&order=wc_order_xDxDxD&email=testmail%40gmail.com&key=1234-1234-1234-1234-8c368abd9c22

问题是:

如您所见,它打印出“#038;”我在想将其转换为“&”,但是前面已经有一个“&”,如果我按照Link无效。

但是如果我删除所有的“#038;”,链接工作正常。

如何打印它们,使我没有“#038;”里面的链接有效吗?

非常感谢

python url
2个回答
0
投票

好像是url编码问题。因为您仅在打印,所以可以使用字符串替换功能。

for url in links:
    url[0].replace("#038","") 

0
投票

您几乎在那里&#038 =&

HTML ACIIcharacters

© www.soinside.com 2019 - 2024. All rights reserved.