嗨,我有以下问题:
[我使用Python从.txt文件中提取了网址列表:
import re
with open('html.txt') as f:
urls = f.read()
links = re.findall('"((http)s?://.*?)"', urls)
for url in links:
print(url[0])
并且输出包含以下某些文件:
https://url.com/?download_file=259&order=wc_order_xDxDxD&email=testmail%40gmail.com&key=1234-1234-1234-1234-8c368abd9c22
问题是:
如您所见,它打印出“#038;”我在想将其转换为“&”,但是前面已经有一个“&”,如果我按照Link无效。
但是如果我删除所有的“#038;”,链接工作正常。
如何打印它们,使我没有“#038;”里面的链接有效吗?
非常感谢
好像是url编码问题。因为您仅在打印,所以可以使用字符串替换功能。
for url in links:
url[0].replace("#038","")
您几乎在那里&#038 =&