请注意,我的问题是JVM解释器,而不是JIT编译器。 JIT编译器将java字节码转换为本机机器码。因此,这必须意味着JVM中的解释器不会将字节码转换为机器码。因此,问题是:解释者在本质上做了什么?如果有人可以帮助我用一个相当于1 + 1 = 2的字节码的简单例子来回答这个问题,那么解释器在执行这个添加操作方面做了什么? (我的隐含问题是,如果解释器没有转换为CPU然后执行ADD操作的机器代码,那么如何执行此操作?执行哪些机器代码以支持此ADD操作?)
表达式1+1
将编译为以下字节码:
iconst_1
iconst_1
add
(实际上,它只会编译到iconst_2
,因为Java编译器执行常量折叠,但为了这个答案的目的,让我们忽略它。)
因此,要准确找出解释器对这些指令的作用,我们应该看看its source code。 const_1
和add
的相关部分分别从line 983和line 1221开始,让我们来看看:
#define OPC_CONST_n(opcode, const_type, value) \
CASE(opcode): \
SET_STACK_ ## const_type(value, 0); \
UPDATE_PC_AND_TOS_AND_CONTINUE(1, 1);
OPC_CONST_n(_iconst_m1, INT, -1);
OPC_CONST_n(_iconst_0, INT, 0);
OPC_CONST_n(_iconst_1, INT, 1);
// goes on for several other constants
//...
#define OPC_INT_BINARY(opcname, opname, test) \
CASE(_i##opcname): \
if (test && (STACK_INT(-1) == 0)) { \
VM_JAVA_ERROR(vmSymbols::java_lang_ArithmeticException(), \
"/ by zero", note_div0Check_trap); \
} \
SET_STACK_INT(VMint##opname(STACK_INT(-2), \
STACK_INT(-1)), \
-2); \
UPDATE_PC_AND_TOS_AND_CONTINUE(1, -1); \
// and then the same thing for longs instead of ints
OPC_INT_BINARY(add, Add, 0);
// other operators
整个事情都在switch语句中,它检查当前指令的操作码。
如果我们扩展宏魔法,用极端简化的模板替换周围的代码并做一些简化的假设(例如堆栈只包含int
s),我们最终会得到这样的结果:
enum OpCode {
_iconst_1, _iadd
};
// ...
int* stack = new int[calculate_maximum_stack_size()];
size_t top_of_stack = 0;
size_t program_counter = 0;
while(program_counter < program_size) {
switch(opcodes[pc]) {
case _iconst_1:
// SET_STACK_INT(1, 0);
stack[top_of_stack] = 1;
// UPDATE_PC_AND_TOS_AND_CONTINUE(1, 1);
program_counter += 1;
top_of_stack += 1;
break;
case _iadd:
// SET_STACK_INT(VMintAdd(STACK_INT(-2), STACK_INT(-1)), -2);
stack[top_of_stack - 2] = stack[top_of_stack - 1] + stack[top_of_stack - 2];
// UPDATE_PC_AND_TOS_AND_CONTINUE(1, -1);
program_counter += 1;
top_of_stack += -1;
break;
}
所以对于1+1
来说,操作的顺序是:
stack[0] = 1;
stack[1] = 1;
stack[0] = stack[1] + stack[0];
并且top_of_stack
将为1,因此我们以包含值2
作为其唯一元素的堆栈结束。