我正在使用 Runtime.exec() 执行一些外部命令,并且我使用包含 非英文字符的参数。我只是想运行这样的东西:
python test.py шалом
直接在cmd中工作正常,但通过
Runtime.exec.getRuntime()("python test.py шалом")
处理错误
在 Windows 上,我的外部程序由于传递给它的未知符号而失败。
我记得 2010 年代初期的类似问题(!) - JDK-4947220,但我认为自 Java core 1.6 以来它已经得到修复。
操作系统:名称 Microsoft Windows 10 Pro(版本 10.0.18362 Build 18362)
Java:jdk1.8.0_221
要理解这个问题 - 最好的方法是使用下面列出的代码片段:
import java.io.BufferedReader;
import java.io.InputStreamReader;
public class MainClass {
private static void foo(String filename) {
try {
BufferedReader input = new BufferedReader(
new InputStreamReader(
Runtime.getRuntime().exec(filename).getInputStream()));
String line;
while ((line = input.readLine()) != null) {
System.out.println(line);
}
input.close();
} catch (Exception e) { /* ... */ }
}
public static void main(String[] args) {
foo("你好.bat 你好"); // ??
foo("привет.bat привет"); // ??????
foo("hi.bat hi"); // hi
}
}
其中.bat文件仅包含简单的
@echo %1
输出将是:
??
??????
hi
PS
System.out.println("привет")
- 工作正常并正确打印所有内容
1) 此问题与 Utf-8 utf-16 格式有关吗?
2)如何解决这个问题?我不喜欢这个答案,因为它看起来是一个非常危险且丑陋的解决方法。
3)有谁知道为什么批处理文件的文件名没有损坏并且可以找到该文件,但参数却损坏了?可能是
@echo
的问题?
是的,问题与 UTF 有关。理论上,执行 bat 文件的
cmd
设置 65001 代码页应该可以解决问题(以及在 Java 端将 UTF-8 字符集设置为默认值)
不幸的是,这里提到的 Windows 中存在一个错误 Java、Unicode、UTF-8 和 Windows 命令提示符
所以没有简单且完整的解决方案。可以做的是为
java
和 cmd
设置相同的默认语言特定编码,例如 cp1251 西里尔字母。并非所有语言都能很好地反映在 Windows 编码中,例如中文就是其中之一。
如果 Windows 系统存在一些非技术限制,将所有
cmd
进程的默认编码更改为特定于语言的编码,则 java 代码将会更加复杂。在开始时,必须创建新的 cmd 进程,并且应将来自不同线程的 UTF-16LE 读取器(对于“cmd /U”进程)附加到其 stdin/stdout 流,并使用 CP1251 写入器。从 java 发送到标准输入的第一个命令应该是“chcp 1251”,第二个是 bat 文件的名称及其参数。
完整的解决方案仍然可以使用UTF-16LE来读取cmd输出,但要传递文本,应该使用其他通用编码,例如base64,这再次导致复杂性增加