我正在尝试更改xml文件中的符号<
和>
:
<divclass="specific_info_group">
<divclass="specific_info_title">model</div>
<divclass="specific_info_txt">
我试图用re代替它:
re.sub('<','<',desc)
re.sub('>','>', desc)
代码没有任何改变,我仍然得到那些符号。另外,我试图与此一起工作:
desc.replace('<','<')
desc.replace('>', '<')
但仍然无法在输出XML文件中获取html格式
任何解决方案?
因为它是转义的html,所以应该使用html解析器进行转义。
desc = """
<divclass="specific_info_group">
<divclass="specific_info_title">model</div>
<divclass="specific_info_txt">
"""
import html.parser
parser = html.parser.HTMLParser()
bla = parser.unescape(desc)
print(bla)
# <divclass="specific_info_group">
# <divclass="specific_info_title">model</div>
# <divclass="specific_info_txt">