ggplot & values:如果我设置了特定的值,ggplot 从哪里获得这些值?

问题描述 投票:0回答:0

我正在尝试绘制数据集中每个人的工资。在 x 轴上我想要他/她的年龄和 y 轴上的工资数额。

这是我的数据集的样本:

tpens
= 就是工资

eta
= 是年龄

> head(final2, 20)
   nquest nord sex anasc ireg eta staciv studio tpens   PPA pens_real anno_lav retrib
1     173    1   1  1948   18  64      3      5  2500  89.3 27.995521     1971      0
2     375    1   2  1925   16  87      4      2   409  89.3  4.580067     1960      1
3     629    1   1  1939    5  73      4      3  1188 107.2 11.082090     1954      1
4     632    1   1  1950    5  62      1      3  1320 107.2 12.313433     1972      0
5     633    1   2  1934    5  78      4      2   350 107.2  3.264925     1952      1
6    1238    1   1  1937   15  75      4      3  1000  89.3 11.198208     1977      0
7    7886    1   1  1950    9  62      1      5  2000 106.7 18.744142     1973      0
8   11972    2   1  1938   17  74      1      2   750  89.3  8.398656     1962      1
9   20174    1   1  1941    8  71      1      5  2000 107.2 18.656716     1962      1
10  20174    2   2  1942    8  70      1      3   132 107.2  1.231343     1957      1
11  20223    1   2  1938    3  74      1      5   800 109.6  7.299270     1956      1
12  20223    2   1  1939    3  73      1      4   980 109.6  8.941606     1952      1
13  20711    2   1  1944    4  68      1      2  1900 107.2 17.723881     1958      1
14  20837    1   1  1931    8  81      1      4  1600 107.2 14.925373     1949      1
15  20837    2   2  1928    8  84      1      2   430 107.2  4.011194     1944      1
16  21461    1   2  1918    5  94      4      2   600 107.2  5.597015     1929      1
17  22173    1   1  1938   15  74      1      2  1200  89.3 13.437850     1953      1
18  22208    1   2  1935    5  77      4      2   700 107.2  6.529851     1950      1
19  22222    1   1  1927    5  85      4      2  1100 107.2 10.261194     1941      1
20  22276    1   1  1949    8  63      2      5  1170 107.2 10.914179     1968      0

工资的值(变量

tpens
)是这些

> summary(subset(final2$tpens, final$retrib == 1))
   Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
    109     650     970    1028    1276    4700 

这是我正在运行的脚本

final2 %>%
  filter( retrib == 1 ) %>%
  ggplot() + 
  geom_col( aes( x = eta, y = tpens), fill = "red", alpha = 0.5  )+
  theme_classic()+
  scale_x_continuous(breaks = seq(30,120, by=1)) 

它给了我这个

如果我的变量的最大值是 4700,

tpens
的值怎么可能是 200.000 或 150.000?错误在哪里?我使用错误的情节吗?有没有更好的图表类型来可视化这些数据?

r variables ggplot2 plot visualization
© www.soinside.com 2019 - 2024. All rights reserved.