我有一个tsv文件,它包含像“PärLagerkvist获得诺贝尔物理学奖”这样的Unicode数据。但是在用Java阅读时,我收到的输出就像“P LrLagerkvist获得了诺贝尔物理学奖”。
我正在使用以下代码进行文件读取
BufferedReader br = new BufferedReader(new InputStreamReader(new FileInputStream(fileName), "UTF-8"));
while ((st = br.readLine()) != null) {
System.out.println(st);
}
我假设您正在使用Intellij Idea。这种情况下,设置控制台编码
-Dfile.encoding=UTF-8
在Windows上,编辑idea.exe.vmoptions
文件并添加上面的行。
有关详细信息,请参阅this。