我有一个文本文件,我尝试在 Mac 上使用 Sublime Text 打开它。当我刚刚打开文件时,我看到这样的数据......
efbf bdef bfbd 5300 4b00 5500 0900 4900
4d00 4100 4700 4500 5500 5200 4c00 0900
如果我尝试使用 UTF LE 16 编码重新打开,我明白了..
뿯붿SKU
您能帮我确定该文件的格式和/或编码吗?
如果我用 Excel 或 Mac 的 TextEdit 打开文件,我也会在 Sublime 上看到与 UTF LE 16 编码相同的内容。
那么如果文件是 UTF LE 16 编码的,那么那些特殊字符是什么?
EF BF BD 是以 UTF-8 编码的替换字符 �。这可能意味着该数据采用 UTF-8 以外的某种格式(例如 ISO-8859-1),但在某个时刻由 UTF-8 系统解析,该系统用替换字符替换了非法字节。
如果没有更多关于如何获得此文件的背景信息,很难推测确切的原因。甚至有可能是 Sublime Text 正在执行此替换,并且文件本身采用其他编码(并且尚未修改)。
我会确保这些确实是文件中的字节,而不仅仅是 Sublime Text 以有趣的方式显示它。使用像
xxd
这样的更简单的工具将内容转储为十六进制字节,并确保这确实是其中的内容。