我正在使用ggplot2创建一个带有负值的堆积条形图,并尝试在每个条形图的顶部添加部分的总和作为标签。对于没有负值的条形码,代码可以正常工作,但是当存在负值时,标签会保留在条形区域内。
例:
test = c("Test1", "Test1", "Test1", "Test2", "Test2", "Test2", "Test3", "Test3", "Test3")
student = c("A", "B", "C", "A", "B", "C", "A", "B", "C")
value = c(5,5,5,3,3,3,-2,6,7)
dummy = data.frame(test, student, value)
g = ggplot(data=dummy, aes(x=student, y=value, fill=test)) +
geom_bar(stat="identity") +
scale_fill_manual(values=c("brown4", "steelblue", "goldenrod3")) +
geom_text(aes(label=value), size =3, position=position_stack(vjust=0.5), colour="white") +
theme_classic() +
theme(text=element_text(family="serif", size=15, colour="black")) +
theme(axis.title=element_text(family="serif", size=15, colour="black")) +
theme(legend.title = element_blank()) +
theme(legend.position = c(0.2, 0.7)) +
stat_summary(fun.y = sum, aes(label = ..y.., group = student), geom = "text", vjust = -1) +
scale_y_continuous(limits = c(-4,20))
g
结果如下图:
没有负值的柱的总和在柱顶上工作正常,但带负值的柱(学生A)的总和位于红色条的中间。
我怎样才能解决这个问题?
您使用fun.y = sum
作为汇总函数,它会在组中添加所有y
值,包括负值。这给出了标签的正确总和,但是位置不好。对于位置计算,我们想要仅计算大于0的值的总和。
stat_summary
让我们指定最多3个函数,fun.y
,fun.ymin
和fun.ymax
。我们将fun.y
(位置)修改为正值之和,我们将添加fun.ymax
作为常规sum
并将其用于标签:
g = ggplot(data=dummy, aes(x=student, y=value, fill=test)) +
geom_bar(stat="identity") +
scale_fill_manual(values=c("brown4", "steelblue", "goldenrod3")) +
geom_text(aes(label=value), size =3, position=position_stack(vjust=0.5), colour="white") +
theme_classic() +
theme(text=element_text(family="serif", size=15, colour="black")) +
theme(axis.title=element_text(family="serif", size=15, colour="black")) +
theme(legend.title = element_blank()) +
theme(legend.position = c(0.2, 0.7)) +
stat_summary(fun.y = function(y) sum(y[y > 0]), fun.ymax = sum,
aes(label = ..ymax.., group = student), geom = "text", vjust = -1) +
scale_y_continuous(limits = c(-4,20))
g