由于一个数据集中的列较长,合并会附加额外的值吗?

问题描述 投票:1回答:1

我尝试基于标识符列合并两个数据框:

NEI <- merge(data, classification, by = "SCC", ) 

其中数据是具有由“SCC”标识的一些测量的原始数据文件,以及具有“SCC”值的相应名称的分类文件。例如,SCC代码10010203对应于“工业废水”。

但是,SCC代码的分类列表比原始数据文件中的测量/ SCC更广泛。因此,当文件被合并时,在NEI数据帧的末尾,来自分类文件的非重叠SCC代码被附加在对应于测量和相应名称的SCC值的前面(这就是为什么我想合并文件)。

> head(NEI)
   SCC  fips Pollutant Emissions  type year                                               Short.Name
1 10100101 34017  PM25-PRI   898.421 POINT 1999 Ext Comb /Electric Gen /Anthracite Coal /Pulverized Coal

> tail(NEI)
         SCC  fips Pollutant Emissions  type year                                                                 Short.Name
6497646 68510001 47163  PM25-PRI   2.0e-02 POINT 2005                                           Phthalate Plasticizer Production

不应添加位于NEI帧尾端的“6497646”值。正如我之前解释的那样,我认为这是因为两个文件中的两个“SCC”变量合并了文件,并且分类/索引文件中的SCC列表更长。

如何确保只将测量文件中的SCC代码合并到新帧中?

提前致谢!

r merge
1个回答
0
投票

这些数字只是rownames,如果你不想要它们,你可以删除所有的rownames。

rownames(NEI) <- NULL
© www.soinside.com 2019 - 2024. All rights reserved.