回归分析是用于基于其他数据建模和预测一个或多个变量的统计技术的集合。
我正在尝试找出影响制作果汁知识的因素。我已确定多项逻辑回归是一种合适的方法。 这是我的原始数据。 我正在关注考试...
我正在寻求帮助来估计三阶多项式项的效果——在自变量 x 的不同值处超出线性项。虽然我可以估计点...
由于异常值,我想使用稳健的回归方法而不是 lm()。 我无法决定是否使用 lm_robust (estimatr 包)或 rlm (MASS 包)。 是否存在数学差异
我正在尝试在包含 1000 多个文档的数据集中查找异常情况。我使用 LIME ML Interpreter 来解释模型(隔离森林)预测。在一个参数“模式”下我...
使用 data.table R 计算新列,给出其他列的趋势/斜率
我在 R 中有一个非常大的表,其中的数字列给出了几年的值。它看起来像这样,但有更多的列和数百万行。 id 年1 年2 年...
这是我用于 3 个回归的 SPSS 和 R 语法。我正在尝试将它们绘制在一个图中。有办法吗? 适合1 <- lm(safety~negpol+pospol, data=data1) fit2 <- lm(belonging~negpol+pospol, data=data1) ...
使用InteractionR函数时出现“replacement has 0 rows”如何解决?
我试图运行一个二元逻辑回归,其具有二元类别的两个变量之间的交互作用。 我的 R 代码如下: md1 <- glm(Diabetes_Cate_3 ~ Age_Years+factor(Gender)+ ...
我正在尝试建立一个电子商务模型,该模型可以预测通过在线营销渠道(例如谷歌购物)获得的单次点击的收入。点击的目标是产品详细信息页面,所以我的
给定一个具有 2 个输入数字特征和一个等级的数字数据集。例如:项目 i 应该比项目 j 表现更好,因此排名为 r_i < r_j (r is the rank). f1 f2 rank a1 b1 1 ...
我的支持向量回归 R2 分数为负。但是当我尝试预测新结果时,它比其他算法具有更好的性能? R2 分数为负值是否不会影响...
我是Python新手,我正在尝试制作一个GUI,在地图上显示半小时时间范围内的预测降水量值。数据位于 txt 文件的文件夹中。每个文件包含测量...
我试图理解以下代码: 将 pandas 导入为 pd 从 sklearn.model_selection 导入 train_test_split 从 sklearn. Linear_model 导入 LinearRegression 来自 sklearn.preprocessing 我...
我有下面的数据和代码,非常感谢您帮助估计 zoib 的 beta 回归模型的 DIC(或 AIC): 图书馆(zoib) 数据(“汽油产量”,包=“zoib”) 重新MD <- zoib...
我正在尝试从头开始执行逻辑回归,但成本并没有降低。成本函数数组为 J_all = [0.6931471785599453, 0.7013523852395079, 1.0799382321159159, 1.4184962890...
我正在 pycaret 中训练和调整模型,例如: 从 pycaret.classification 导入 * clf1 = 设置(数据 = 训练,目标 = '目标',feature_selection = True,test_data = 测试,
我目前有一个已经多重插补的数据集,其结构为: 结构 客户ID <- c(4,4,4,4,4,6,6,6,6,6,7,7,7,7,7,15,15,15,15,15) impID <- c(1,2,3,4,5,1,2,3,4,5,1,2,3,4,5,1,2,3,4...
我正在使用随机森林。我的测试准确率是 70%,而训练准确率是 34% ?该怎么办 ?我该如何解决这个问题。
我们正在尝试寻找四个不同城市(BKI、DAUS、SRINA 和 PALLA)土壤有毒元素与表观遗传年龄加速之间的关联。我们测量了土壤有毒元素...
在我的回归中,我想用 lgrade 检测变量 PastS 并在 R 中运行以下代码: 莫迪夫 <- ivreg(servS ~ horS + size + henley + lpd + tri + turn + rail + enc...
我希望我的问题有意义,我想了解交互项/特征/预测因子等的参考水平是什么。 这是我的代码: 库(gtsummary) 库(sjPlot) 设置。参见...