我正在与一家第三方公司合作,并且我试图/希望在提请他们之前确定字符编码问题的原因。
[该公司有一个自定义的拖放编辑器,用于在其平台上设计与我进行Beta测试的网站。在编辑器中,他们有一个Raw HTML
小部件,我也可以拖动它并添加自己的内容。问题是,当我使用检查器工具从某人的旧网站复制HTML并将其粘贴到他们的此小部件中时,所有撇号和双引号都替换为“乱码”。当我尝试将内容粘贴到记事本,notepad ++,崇高编辑器中,然后将其粘贴到其Raw HTML
编辑器中时,我也遇到同样的问题。
以下是该问题的记录和一些示例:https://streamable.com/phwn2
这里是已知的要替换的字符以及它们要替换的内容
’变成â™
“变成âœ
”变成â
+变成(空格)
Å变成Ã…
“保持为”
'保留为'
有人看到带有这些字符的图案,还是知道替换这些字符的原因是什么?我觉得这是某种编码问题,但是当我之前向他们提出时,他们提到“这就是它的工作方式”。我知道这不是真的,因为WordPress拖放编辑器永远不会发生这种情况。我怎样才能说服他们这是一个可以解决的问题,而不是每次复制和粘贴一些text / html时都不必手动替换这些字符?
该网站可能使用UTF-8编码,而该公司的编辑器可能正在使用Windows-1252编码。在第一个示例中,右单引号具有UTF-8编码e2 8099。当使用Windows-1252的程序读取这些字节中的每个字节时,您将获得“带抑扬符的小拉丁字母a”(e2),[未定义] 80和“商标”(99)。我还没有检查其他转换。如果这是问题所在,那么您可以采取一种解决方法,先将复制的字符转换为带有iconv的目标编码,然后再粘贴到公司的编辑器中。