我一直在使用
dis
库来反汇编一些 Python 源代码,但我发现这不会递归到函数或类中:
import dis
source_py = "test.py"
with open(source_py) as f_source:
source_code = f_source.read()
byte_code = compile(source_code, source_py, "exec")
dis.dis(byte_code)
我看到的都是诸如以下的条目:
54 456 LOAD_CONST 63 (<code object foo at 022C9458, file "test.py", line 54>)
459 MAKE_FUNCTION 0
462 STORE_NAME 20 (foo)
如果源文件有一个函数
foo()
,我显然可以在源文件中添加如下内容:
dis.dis(foo)
如果不更改源文件并执行它,我无法弄清楚如何做到这一点。我希望能够从编译的
byte_code
中提取相关字节并将它们传递给 dis.dis()
。
def sub_byte_code(byte_code, function_or_class_name):
sub_byte_code = xxxxxx
dis.dis(sub_byte_code)
我考虑过包装源代码并按如下方式执行
dis.dis()
,但我不想执行脚本:
source_code_dis = "import dis\n%s\ndis.dis(foo)\n" % (source_code)
exec(source_code_dis)
调用它有什么技巧吗?例如
dis.dis(byte_code, recurse=True)
将文件作为模块导入,并在该
module上调用
dis.dis()
(而不是单个函数)。
import dis
import test
dis.dis(test)
您也可以从命令行执行此操作:
python -m dis test.py
dis.dis
的文档:
对于一个模块来说,它拆解了所有的功能。
编辑:从 python 3.7 开始,
dis.dis
是递归的。
回复晚了,但我很高兴在需要时找到它。如果您想完全反汇编具有函数的脚本而不导入它,则必须实现问题中提到的 sub_byte_code 函数。这是通过扫描 byte_code.co_consts 以查找 types.CodeType 文字来完成的。
以下内容完成了问题的脚本:
import dis
import types
source_py = "test.py"
with open(source_py) as f_source:
source_code = f_source.read()
byte_code = compile(source_code, source_py, "exec")
dis.dis(byte_code)
for x in byte_code.co_consts:
if isinstance(x, types.CodeType):
sub_byte_code = x
func_name = sub_byte_code.co_name
print('\nDisassembly of %s:' % func_name)
dis.dis(sub_byte_code)
结果会是这样的:
1 0 LOAD_CONST 0 (<code object foo at 0x02CB99C0, file "test.py", line 1>)
2 LOAD_CONST 1 ('foo')
4 MAKE_FUNCTION 0
6 STORE_NAME 0 (foo)
4 8 LOAD_NAME 0 (foo)
10 LOAD_CONST 2 (42)
12 CALL_FUNCTION 1
14 STORE_NAME 1 (x)
16 LOAD_CONST 3 (None)
18 RETURN_VALUE
Disassembly of foo:
2 0 LOAD_FAST 0 (n)
2 UNARY_NEGATIVE
4 RETURN_VALUE
编辑:从 python 3.7 开始,dis.dis 反汇编函数并递归地执行此操作。 dis.dis 有一个
depth
附加参数来控制要反汇编的函数定义的深度。