我需要问几个关于单词嵌入的问题.....可能是基本的。
[0 0 0 1 0]
)转换为嵌入向量E = [0.2, 0.4, 0.2, 0.2]
....对于结果单词向量中的每个索引是否有任何重要性?例如E[1]
是0.2 ....特别是E[1]
定义的(虽然我知道它基本上是转换到另一个空间)....或者单词矢量共同定义上下文但不单独...提前致谢
1:嵌入向量中的每个元素(或一组元素)都有一些含义,但对于人类来说大多是未知的。根据您使用的算法,单词嵌入向量可能具有不同的含义,但通常很有用。例如,Glove,类似的单词'frog','toad'在向量空间中彼此靠近。 King - man导致矢量类似于Queen。
其中第一行是嵌入狗的矢量,第二行是cat,然后是等等然后,你使用索引(0,4,5,1)查找后会变成一个矩阵[[0.1,0.1,0] [... ] [...] [0.2,0.5,0.1]]
更新:单热矢量不包含任何信息。您可以认为单热矢量是词汇表中该矢量的索引。例如,Dog => [1,0,0,0,0,0]和cat => [0,1,0,0,0,0]。 one-hot vs index之间有一些不同:
“它的意思是查找表只是嵌入向量的矩阵(已经通过word2vec或......单独训练)对于词汇表中的每个单词。而在神经网络的过程中,我们可以使用嵌入层,或者我们可以只是在查找表中引用针对特定单热矢量的特定嵌入向量的嵌入向量。“
使用“INDEX”在查找表中查找。将狗变为0,将cat变为1.单热矢量和索引包含相同的信息,但是一次性热量需要更多存储空间。此外,许多deeplearning框架接受索引作为嵌入层的输入(其中,输出是该索引中的单词的向量表示。)
“。我们如何得到这个嵌入向量...”