少量下划线:
我得到了什么;从R0.X中减去C6.X,并将其存储在R1.x中。类似地与ADD R1.x, R0.x, -C6.x
ADD R4.x, R1.x, R2.w, R4.x
通常我的乘法变成MUL __, PV16.x, C1.x
。但是有时候我看到
MUL a, b, c
。这也发生在MUL_e a, b, c
,SQRT_e
和RSQ_e
魔术:我只是不明白这些说明。
RCP_e
开始循环。但是什么是参数?
LOOP_DX10 i0 FAIL_JUMP_ADDR(10) VALID_PIX
不知道
ALU_BREAK: ADDR(48) CNT(3)
我的循环有我
SETGT_INT R0.y, 350, R3.y
也许我将我设置为0?但是为什么浮点0?
PREDNE_INT __, R0.y, 0.0f
ALU_PUSH_BEFORE: ADDR(51) CNT(34)
PREDGT __, R0.x, R3.x
无条件跳跃,但是什么是pop_cnt?
JUMP POP_CNT(1) ADDR(8) VALID_PIX
哇< 350, but what're the others?
ALU: ADDR(85) CNT(1)
BREAK ADDR(9)
POP (1) ADDR(8)
ENDLOOP i0 PASS_JUMP_ADDR(2)
有人请解释一下吗?我找不到前两个文档,也不了解最后一个文档。不幸的是,我以前从未参加过任何集会。
库,并描述了汇编语言,该语言解释了您在集会中发现的一些助记符。在此级别,组件非常特定于硬件。由于您使用了AMD工具,因此我想寻找AMD设备文档。如果NVIDIA使用其他指令集,我不会感到惊讶。
vertex和