这个问题在这里已有答案:
假设我有(90,000 x 17)
的数据集,即(n x p)
,其中n
是number of observations
,p
是number of variables
,我想从我的整个数据集中随机抽取20%
行,如何在R中完成?
在随机抽样后,我将相应地进行聚类分析。
我曾尝试使用其他问题来回答我的问题但是它们没有结果,因为它没有给我我需要的东西。
你可以用sample_frac
的dplyr
来做,这里有一个数据库虹膜的例子
library(dplyr)
#data(iris)
sample20 <- iris %>% sample_frac(0.2)