我正在使用Hadley Wickham的babynames数据集。我试图在1950年使用dplyr绘制一个显示最受欢迎男孩名字的图表。到目前为止,我可以通过以下方式显示顶级名称:
malebabynames1950<-filter(babynames, year==1950, gender=="M")
totalboys1950<-malebabynames1950 %>% group_by(name, gender, year) %>% summarise(count=sum(count))
head(arrange(totalboys1950, desc(count)))
这表现了:
name gender year count
<chr> <chr> <int> <int>
1 James M 1950 86266
2 Robert M 1950 83590
3 John M 1950 79447
4 Michael M 1950 65185
5 David M 1950 60761
6 William M 1950 60722
但我无法弄清楚如何绘制名称和计数。有任何想法吗?谢谢!
将ggplot与geom_bar
一起使用。默认情况下,geom_bar
使用stat="count"
,因此您无需在绘图前进行分组和汇总。如果要使用分组数据框进行绘图,请使用geom_bar(stat="identity")