求平方根时,我们执行number**0.5,但是0.5之前的-号是什么意思
我在看一个代码(我是专门看ViT代码的,这里为了缩放,他们补充说:
self.scale = self.head_dim ** -0.5
请帮我理解它的意思。我在我的终端上做了一些实验,但不明白发生了什么:
>>> a = 4 >>> a**0.5 2.0 >>> >>> a**-0.5 0.5
互惠。
x**-n == 1/(x**n)