我有包含48000行作为输入文本和答案的数据集。有89个唯一的答案值。我如何从文本答案中标注答案,例如1个唯一值等于answer1,第二个等于answer2,依此类推,直到答案89。
> x y
> hello please push button 1
> what's up please push button 1
> be cool please push button 1
>smth please push button 1
>write num please push button 1
>hello please push button 1
>what's up please push button 1
>be cool sure
>smth sure
>write num sure
>hello sure
> what's up perfect
> be cool perfect
>smth call me
>write num call me
================================================ ========================>
我想更改“请按按钮1”将成为答案1,“确定”将成为答案2。我有89个唯一值,所以我需要所有这些值都进行更改,以使y_values成为仅包含answer1-answer89的列。
我有包含48000行作为输入文本和答案的数据集。有89个唯一的答案值。我如何从文本答案中得到标签答案,例如1个唯一值等于answer1,...
我有点困惑,您是否只想将重新编码的列附加到您的数据框中,以将您的'y'列值标记为answer1-answer89?