我遇到了一些(标准)问题,因为 Microsoft Office 在通过 Outlook 转发电子邮件后将其令人讨厌的标记注入到某些 html 中。
我有兴趣知道:
<o:p>
元素 的实际用途 注意:在某些时候它已经改变了,例如在 Word 365 中,生成的 HTML 不再包含此类元素。但是,答案对于较旧的 Word 版本仍然有效。
找不到任何官方文档(这并不奇怪),但根据这篇有趣的文章,注入这些元素是为了使 Word 能够将 HTML 转换回完全兼容的 Word 文档,并保留所有内容。
相关段落:
微软在 Word 的 HTML 中添加了特殊标签,着眼于向后兼容。 Microsoft 希望您能够以 HTML 格式保存文件,并包含传统 DOC 文件中的所有跟踪、注释、格式设置和其他特殊 Word 功能。如果您以 HTML 格式保存文件,然后在 Word 中重新加载它,理论上您根本不会丢失任何内容。
这很有道理。
对于您的具体问题..
o
中的<o:p>
表示“Office命名空间”,因此标签中o:
后面的任何内容都表示“我是Office命名空间的一部分” - 如果是<o:p>
,它只是表示段落,相当于普通的<p>
标签。
我假设每个 HTML 标签都有其 Office“等效项”,而且还有更多。