我是Python初学者。我有一个包含变量的数据集,我想使用 Z 分数方法对其进行标准化,以便执行一些机器学习算法。 我写了这段代码:
from sklearn.preprocessing import StandardScaler
import pandas as pd
data = pd.read_csv(r"C:\Users\....csv")
data.head()
scaler = StandardScaler()
scaled = scaler.fit_transform(data)
如何创建包含标准化列的 csv 文件,以便检查一切是否正确?或者我怎样才能像使用“data.head()”那样做一些事情,但使用标准化数据集以便我可以检查?这段代码正确吗?
您可以简单地创建另一列包含缩放值
data[scaled] = scaled
它将创建新列,然后您可以简单地比较值