使用熊猫通过某些关键字删除空值:NaN值或字符串以进行浮点转换问题?

问题描述 投票:0回答:1

我担心的是使用熊猫删除其中包含“未知”关键字的空值。当我上载.csv文件时,此特定数据集恰好具有该关键字的所有NaN空值。

图片:Data head: 121 values, 8 columns有关数据集本身的信息如下:

<class 'pandas.core.frame.DataFrame'>
Index: 119 entries, ROMANIA to CZECH REPUBLIC
Data columns (total 7 columns):
authority               119 non-null object
date                    119 non-null object
fine                    119 non-null object
controller/processor    119 non-null object
quoted article          119 non-null object
type                    119 non-null object
infos                   119 non-null object
dtypes: object(7)
memory usage: 9.9+ KB

我已经使用gdpr_fines.isnull().sum()gdpr_fines.dropna()gdpr_fines = gdpr_fines.drop_duplicates()功能清除数据,但没有成功。

当我尝试专门过滤'fine'列(fines = gdpr_fines['fine'])并尝试使用float(fines)函数将其从字符串转换为float时出现此问题,但出现以下错误:

TypeError:无法将序列转换为

我不是100%肯定的问题是,熊猫根本无法将罚款金额识别为数字,或者由于该列中有一些“未知” NaN值单元格而导致出现错误。

我担心的是使用熊猫删除其中包含“未知”关键字的空值。当我上载...

python pandas dataframe nan
1个回答
0
投票

如果将所有值'Unknown'替换为np.nan,则可以在数据帧上执行.dropna()

© www.soinside.com 2019 - 2024. All rights reserved.