使用 Java 删除 BOM 字符[重复]

问题描述 投票:0回答:2

使用 Java 的字符串需要发生什么才能相当于

vi
s

:set nobomb

假设

BOM
来自我正在阅读的文件。

java vi byte-order-mark
2个回答
76
投票

Java 不能正确处理 BOM。事实上,Java 像处理其他字符一样处理 BOM。

发现这个:

http://www.rgagnon.com/javadetails/java-handle-utf8-file-with-bom.html

public static final String UTF8_BOM = "\uFEFF";

private static String removeUTF8BOM(String s) {
    if (s.startsWith(UTF8_BOM)) {
        s = s.substring(1);
    }
    return s;
}

也许我会使用 apache IO 来代替:

http://commons.apache.org/proper/commons-io/apidocs/org/apache/commons/io/input/BOMInputStream.html


15
投票

对于 UTF-8,BOM 是三个字节的序列:0xEF、0xBB、0xBF

最新问题
© www.soinside.com 2019 - 2024. All rights reserved.