Pandas Dataframes,如何摆脱每个特定列或索引的NaN和Dublicates?

问题描述 投票:0回答:1

第一个问题。

我有一个df:

        165  232  237
KKI-11  NaN    T  NaN
KKI-12  NaN    A  NaN
KKI-5     S    T    G
KKI-12    G    A    A
KKI-5     S  NaN    G
KKI-11    G  NaN    A
KKI-5   NaN  NaN  NaN
KKI-11  NaN  NaN  NaN
KKI-12  NaN  NaN  NaN

or like this:

        232  237  232  165  237  165
KKI-11    T  NaN  NaN  NaN    A    G
KKI-12    A    A    A    G  NaN  NaN
KKI-5   NaN    G    T    S    G    S

如您所见,对于每个索引和列(案例1的多个相等索引,案例2的列,表示以虚构简化形式的每个单元都有一个值。我该如何操纵其中一个数据框看起来像:

            165     232     237

KKI-5       S       T        G

KKI-11      G       T        A

KKI-12      G       A        A

希望您可以帮助我以这种特定方式删除所有NaN和重复项。谢谢

python pandas dataframe nan
1个回答
1
投票

关于它的一种方法是对索引进行排序(使相似的值彼此相邻),对排序的索引进行分组,向后/向上填充,删除空值和删除重复项

© www.soinside.com 2019 - 2024. All rights reserved.