我正在使用漂白剂来净化用户输入。但我使用 Markdown,这意味着我需要块引用
>
符号才能通过,而不会被转义为 & gt;
,这样我就可以将它传递给 Misaka 进行渲染。
文档说默认情况下它会转义 html 标记,但没有说明如何为
>
符号关闭它。我仍然希望它能够转义实际的 html 标签。
http://bleach.readthedocs.org/en/latest/clean.html
任何其他在保持使用 Markdown 能力的同时清理输入的想法将不胜感激。
您是否需要删除所有标签,但保留 > 不变?
第2步的简单方法:
输出.replace('>', '>')
更专业
import HTMLParser
h = HTMLParser.HTMLParser()
s = h.unescape(sanitized user input)