Pandas Dataframes，如何摆脱每个特定列或索引的NaN和Dublicates？

Question

第一个问题。

我有一个df：

        165  232  237
KKI-11  NaN    T  NaN
KKI-12  NaN    A  NaN
KKI-5     S    T    G
KKI-12    G    A    A
KKI-5     S  NaN    G
KKI-11    G  NaN    A
KKI-5   NaN  NaN  NaN
KKI-11  NaN  NaN  NaN
KKI-12  NaN  NaN  NaN

or like this:

        232  237  232  165  237  165
KKI-11    T  NaN  NaN  NaN    A    G
KKI-12    A    A    A    G  NaN  NaN
KKI-5   NaN    G    T    S    G    S

如您所见，对于每个索引和列（案例1的多个相等索引，案例2的列，表示以虚构简化形式的每个单元都有一个值。我该如何操纵其中一个数据框看起来像：

            165     232     237

KKI-5       S       T        G

KKI-11      G       T        A

KKI-12      G       A        A

希望您可以帮助我以这种特定方式删除所有NaN和重复项。谢谢

Answer 1

关于它的一种方法是对索引进行排序（使相似的值彼此相邻），对排序的索引进行分组，向后/向上填充，删除空值和删除重复项

Pandas Dataframes，如何摆脱每个特定列或索引的NaN和Dublicates？

问题描述投票：0回答：1

1个回答

最新问题

Pandas Dataframes，如何摆脱每个特定列或索引的NaN和Dublicates？

问题描述 投票：0回答：1

1个回答

最新问题

问题描述投票：0回答：1