我正在尝试获取 linelist csv 的摘要统计信息,到目前为止,它会读取除一列之外的每一列,但我不明白为什么。它在代码中拼写正确,与其他列没有什么不同,但每次我尝试运行“get_summary_stats”时,它都会给我一条错误消息,表明该列不存在 [[在此处输入图像描述](https://i.sstatic.net/266dNAwM.png)](https://i.sstatic.net/I1xUvgWk.png)
我只是想获取线路列表的摘要统计数据。它将读取除这一列之外的所有其他列。我已经尝试了带有括号和不同逗号之类的不同配置,但它仍然无法读取。我应该尝试不同的列标题顺序吗?
不确定是否相关,但在
View
窗口的图片中,请注意 Cirrhosis_deaths
中的值是左对齐的,表明它们以文本而不是数字的形式读入。
我看到
rstatix::get_summary_stats()
首先选择数字列:
https://github.com/kassambara/rstatix/blob/master/R/get_summary_stats.R
data <- data %>% select_numeric_columns()
因此,您的列将无法供其余功能使用,尽管您看到它存在。我希望这可以通过
解决cirrhosis_linelist$Cirrhosis_deaths = as.numeric(cirrhosis_linelist$Cirrhosis_deaths)
...但是您应该仔细查看加载的数据,因为该列中可能存在某些内容使得
read.csv
假定该列是文本而不是数字。