在python中删除带有条件的行

问题描述 投票:0回答:2

我有一个多标签分类问题。

我想在数据框的所有35列中删除除了值(0)的行,除了['Doc']列。

数据帧的示例

Doc   Big    Small    Int    Bor   Drama
j2     0       0        0      0     0
i9     1       0        1      1     0
ui8    0       0        0      1     0
po4    0       1        0      0     0
po9    0       0        0      0     0

这是预期的结果

Doc   Big    Small    Int    Bor   Drama
i9     1       0        1      1     0
ui8    0       0        0      1     0
po4    0       1        0      0     0

这些是我想要删除的行:

 j2     0       0        0      0     0
 po9    0       0        0      0     0

这是我如何计算它们:

rowSums = df.iloc[:,2:].sum(axis=1)
no_labelled = (rowSums==0).sum(axis=0)
print("no.docs with no label =", no_labelled)

no.docs没有标签= 60

如何从数据框中删除这60行?

谢谢

python pandas conditional delete-row
2个回答
0
投票

您只需提取所需的数据帧并将其分配给旧变量,而不是显式调用del

df =  df.loc[df.iloc[:, 1:].sum(axis=1) > 0, :]
print(df)

0
投票

如果列总和(除了第一个)为0,您可以删除行。您可以尝试这样做

df2.drop(df2[df2.loc[:,1:].sum(axis=1) == 0].index)
© www.soinside.com 2019 - 2024. All rights reserved.