理解GPU拆卸

Question

少量下划线：

我得到了什么；从R0.X中减去C6.X，并将其存储在R1.x中。类似地与

ADD R1.x, R0.x, -C6.x

;乘以R1.X和R2.W，添加R4.X，然后存储在R4.x中。但是有时候我会接到诸如

ADD R4.x, R1.x, R2.w, R4.x

之类的电话，而我无法弄清楚下强项的含义。 trailing“ e” s：
通常我的乘法变成MUL __, PV16.x, C1.x。但是有时候我看到
```
MUL a, b, c
```
。这也发生在
```
MUL_e a, b, c
```
，
```
SQRT_e
```
和
RSQ_e
魔术：我只是不明白这些说明。
RCP_e
```
开始循环。但是什么是参数？
```
LOOP_DX10 i0 FAIL_JUMP_ADDR(10) VALID_PIX
```
不知道
```
```
ALU_BREAK: ADDR(48) CNT(3)
```
我的循环有我
SETGT_INT R0.y, 350, R3.y
也许我将我设置为0？但是为什么浮点0？ PREDNE_INT __, R0.y, 0.0f
推动让我想到堆栈？
ALU_PUSH_BEFORE: ADDR(51) CNT(34)
```
PREDGT  __,  R0.x,  R3.x
```
无条件跳跃，但是什么是pop_cnt？
JUMP POP_CNT(1) ADDR(8) VALID_PIX
```
哇
```
< 350, but what're the others?

ALU: ADDR(85) CNT(1)

BREAK ADDR(9)

POP (1) ADDR(8)

ENDLOOP i0 PASS_JUMP_ADDR(2)

x = q？ A：B，但我不知道哪个变量是哪个。
有人请解释一下吗？我找不到前两个文档，也不了解最后一个文档。不幸的是，我以前从未参加过任何集会。
我发现了这个
```
库，并描述了汇编语言，该语言解释了您在集会中发现的一些助记符。
```
在此级别，组件非常特定于硬件。由于您使用了AMD工具，因此我想寻找AMD设备文档。如果NVIDIA使用其他指令集，我不会感到惊讶。
如果您仍然想要可移植性，并且您非常勇敢地编写GPU组装，则可以使用ARB组件（
```
vertex
```
和
）来实现程序，但是我从未尝试过（您现在给了我一个很好的灵感来开始另一个旅程）。
```
	
```