作为一个新手,我正在努力解决大型数据集的以下问题。我想在“ CHROM”列中查找比较两列CLONEID的值(第二列包含重复项)。相应的“ CHROM”值将归因于每个“ CLONEID”,而相同的值将归因于其重复项。我以这个表格为例:
CLONEID | CHROM
976877 | 5B
976952 | 6B
976961 | 3B
976975 | 1A
977084 | 7B
977146 | 6B
977167 | 2A
977171 | 3B
977173 | 3B
977195 | 1B
977228 | 4A
977241 | 3A
我想获得以下输出:
CLONEID | CHROM
976803 |2A
976877 |5B
976952 |6B
976961 |3B
976975 |1A
977084 |7B
977084_1 |7B
977146 |6B
977167 |2A
977171 |3B
977173 |3B
977195 |1B
977195_1 |1B
977228 |4A
977228_1 |4A
977228_2 |4A
977228_3 |4A
977241 |3A
如果您可以使问题更清楚,我们可以帮助您解决。