我具有如下测试数据帧(原始文件为60 x 350)
Speci 45 46 47 48 49 50 51
PP A T A - G G A
JJ G T A - T A G
KK A T - A G - A
LL A C A A G G A
MM G C A A G G G
NN C - G T C C T
基本上,我想做的是通过输入字符串和列名/数字,如下所示
input string: CAAGGA
ColF (Column from): 46
ColT ( Column To ): 51
并精确匹配每个对应的指定列(从到,并按降序输出最佳匹配,如下所示)>
Species Matchs LL 6 MM 5 PP 4
我只用于ggplots和基本文件处理的R / Python语言,不确定如何遍历数据框和进行匹配。
[我的测试数据帧如下(原始文件为60 x 350),规格45 46 47 48 49 50 51 PP ATA-GGA JJ GTA-TAG KK AT-AG-LL ACAAGGA ...