如何为R中的回归表制作整洁的表格?我在搞什么?

问题描述 投票:0回答:1

我是R的初学者,正在使用它进行回归/检验某些因素的统计显着性/为论文创建图表。我的数据集在此处(如果相关):https://docs.google.com/spreadsheets/d/1-EFYGZp6L2Kp7MCmfTN16k4jWk-eYPJgsEOaBF45RM8/edit?usp=sharing

今天我一直在尝试使用lm函数运行回归,由于某种原因,我无法以一种很好的可读格式来显示它,从而告诉我哪些因素很重要。我以前知道如何做到这一点,它可以使R2和调整后的R2以及其他一些东西放在底部,形成一个非常整洁的回归表,我认为这是摘要功能,但似乎并没有做我所期望的。我在这里做错了什么?

    > setwd("~/Library/Mobile Documents/com~apple~CloudDocs/Thesis/DATA")
install.packages("ggplot2")
library("ggplot2")
install.packages("tidyverse")
library("tidyverse")

Reg1 <- lm(draftthesissheet$`HC Annual Total`~draftthesissheet$Year 
  + draftthesissheet$`state population` 
  + draftthesissheet$`proportion of state senate that is democrat (NEED 2018)`
  + draftthesissheet$`proportion of state house that is democrat (NEED 2018)`
  + draftthesissheet$`real police expenditures in millions of $ (NEED 16-18)`
  + draftthesissheet$`proportion of state that is black`
  + draftthesissheet$`unemployment rate`
  + draftthesissheet$`infant mortality rate`
  + draftthesissheet$`homicide rate`
  + draftthesissheet$`prisoner executions (rate per 1000?)`
  + draftthesissheet$`urbanisation rate`
  + draftthesissheet$`total ethanol consumption per capita (NEED 2018)`
  + draftthesissheet$`Trump Presidency (0=no, 1=yes)`
  + draftthesissheet$`% Republican voters`
  + as.factor(draftthesissheet$State))

summary(Reg1)

编辑:我正在尝试检验特朗普当选总统是否会导致仇恨犯罪的增加(《慧聪年报》)。因此,所有其他这些因素都是我要控制的(我认为是虚拟变量?),我将TP变量设为二进制,因此2016-2018年为1,选举前为0。

r linear-regression
1个回答
0
投票

我建议您在模型中添加因子(分类变量)时要小心。您的变量Trump Presidency (0=no, 1=yes)是二进制的,但被视为连续变量。 R知道0和1是值,但是R不假定它们编码分类数据。我也将Year作为一个因素。我看到您已经将State视为一个因素,但是您需要对每个非连续变量执行此操作。

此外,在这种情况下summary()功能也应起作用。例如参见http://www.learnbymarketing.com/tutorials/explaining-the-lm-summary-in-r/

您是否看到某种错误消息?

编辑:“我正在尝试检验特朗普当选总统是否会导致仇恨犯罪的增加(《 HC年报》(HC Annual Total)”。回归模型可以揭示变量之间的趋势关联,但是只有受控的实验才能证明因果关系。考虑一下冬天冬天霜冻叮咬的速率是如何增加的,热巧克力的消耗量也是如此。这并不意味着热巧克力会引起冻伤!

认为选择仇外候选人会导致仇恨犯罪增加的说法是否合理?绝对。但是统计模型是有限的。您找到的任何连接,还有其他模型无法捕获的连接。

© www.soinside.com 2019 - 2024. All rights reserved.