第一个问题。
我有一个df:
165 232 237
KKI-11 NaN T NaN
KKI-12 NaN A NaN
KKI-5 S T G
KKI-12 G A A
KKI-5 S NaN G
KKI-11 G NaN A
KKI-5 NaN NaN NaN
KKI-11 NaN NaN NaN
KKI-12 NaN NaN NaN
or like this:
232 237 232 165 237 165
KKI-11 T NaN NaN NaN A G
KKI-12 A A A G NaN NaN
KKI-5 NaN G T S G S
如您所见,对于每个索引和列(案例1的多个相等索引,案例2的列,表示以虚构简化形式的每个单元都有一个值。我该如何操纵其中一个数据框看起来像:
165 232 237
KKI-5 S T G
KKI-11 G T A
KKI-12 G A A
希望您可以帮助我以这种特定方式删除所有NaN和重复项。谢谢
关于它的一种方法是对索引进行排序(使相似的值彼此相邻),对排序的索引进行分组,向后/向上填充,删除空值和删除重复项