如何根据列值将规范化分为两部分？

Question

我在大熊猫中有一个列数据，其分布非常偏向：

我根据截止值1000将数据分成两部分，这是两组的分布。

现在，我想用0-1之间的值进行标准化。我想执行“差分”归一化，左边面板值在0-0.5之间归一化，右面板归一化为0.5到1，所有内容都在同一列中。我该怎么做？

Answer 1

它不漂亮，但有效。

df = pd.DataFrame({'dataExample': [0,1,2,1001,1002,1003]})

less1000 = df.loc[df['dataExample'] <= 1000]
df.loc[df['dataExample'] <= 1000, 'datanorm'] =  less1000['dataExample'] / (less1000['dataExample'].max() * 2)

high1000 = df.loc[df['dataExample'] > 1000]
df.loc[df['dataExample'] > 1000, 'datanorm'] =  ((high1000['dataExample'] - high1000['dataExample'].min()) / ((high1000['dataExample'].max() - high1000['dataExample'].min()) * 2) + 0.5)

output:
    dataExample datanorm
0   0   0.00
1   1   0.25
2   2   0.50
3   1001    0.50
4   1002    0.75
5   1003    1.00

Answer 2

假设您的数据帧名为df，保存数据的列称为data，保存计数的列称为counts。然后你可以做这样的事情：

df['data_norm'] = df['data'].loc[df['counts']<=1000] / 1000 / 2
df['data_norm'] = df['data'].loc[df['counts']>1000] / df['counts'].max() + 0.5

......假设我理解正确。但我认为我既不正确理解你的问题，也不能解决你的问题。

如何根据列值将规范化分为两部分？

问题描述投票：0回答：2

2个回答

最新问题

如何根据列值将规范化分为两部分？

问题描述 投票：0回答：2

2个回答

最新问题

问题描述投票：0回答：2