在http://stats.stackexchange.com上考虑您的问题是否会更好。统计学是使用概率从有限数量的样本或观察中推断人口特征的数学研究。
Python 的 statsmodels 库有 get_rdataset() 方法,可以获取各种数据集。可以获取的数据集列表在哪里?如何使用它来加载数据集? 文档中没有
第一次使用 SAS 用户。 我有一个导入到 SAS 的数据集(植物),其中我将两个变量从数字更改为校准类别。我设法像这样适合我的模型: proc glm 数据=plant_formatted; c...
我一直在运行一段使用 gamlss qEGB2() 函数的代码。但是,它一直在生成以下警告消息: 在 qf(p, 2 * nu, 2 * tau) 中:可能没有完全精度
使用 statsmodel 估计 OLS 时出现“满排名”错误
我有特定地区的农作物产量、年气温和年降水量的历史数据。我的目标是估计以下线性模型: 其中y为农作物年产量,t st...
我必须计算1000m个单元格内的人口。下图中细胞内的总人口为 2306。 在此输入图像描述 在此输入图像描述 绿色是b...
您好 Stack Overflow 社区, 我是一名经济研究员,正在为我在 R 中进行的分析寻求统计建议。我的数据集包括一个独立的时间序列变量 X 和一个大的
我有一个数据集 df,其中包含两个变量:成功 (x) 和试验 (n)。我希望为该数据集中的每一行获取不同
如何创建 Python Lambda lambda 函数来执行此操作?
我有一个具有平均值和标准差的数据框,我想创建一个 lambda 函数或其他方法来包含风险水平的 1% 值。我的标量函数...
我在论文中使用 scipy.stats 模块中的函数 mvn.mvnun() 来计算给定多元正态分布的 CDF。审稿人问我如何估计 CDF,因为......
为什么在 k 倍的情况下需要单独的测试集,而不是在 LOOCV 的情况下?
为什么在 k 折的情况下需要单独的测试集,而在留一交叉验证(LOOCV)的情况下不需要? 怀疑在于交叉验证——我脑子里有某种困惑。当我们这样做时
有没有一种方法可以根据R中的ID和数据帧计算多个移动平均线?
我正在分析数据,想一次计算许多移动平均线。我将在这里举一个我正在尝试做的事情的例子。 表 1:ID 和日期 ID 日期 <- data.frame(ID = c("A",&
我正在尝试编写一个在 R 中运行优惠券收集者问题的函数。我正在尝试创建一个函数,该函数将吐出从样本大小 n 中收集的唯一优惠券的数量,并带有 fi...
我需要帮助计算 2011 年至 2017 年男性/女性和年龄组 1 的单独年龄标准化死亡率(直接标准化死亡率),CI 为 95%。我需要将其显示为折线图...
我正在寻找一种将线性回归与泊松分布结合起来的方法。经过简单的线性回归后,其结果是一个我想在泊松分布中使用的数值,即...
我有一个数据框,如下表所示。我想创建一个名为 Ploss 的新行,它是正态分布函数,使用 Return 作为平均值,使用 Vol 行作为标准差....
如何计算回归预测的置信区间?以及如何在 python 中绘制它
图 7.1,统计学习简介 我目前正在学习一本名为《Introduction to Statistical Learning with applications in R》的书,并将解决方案转换为 python 语言...
我有一个数据框,我想为每列拟合一个 mixR 模型并打印绘图。没有使用函数的代码没有任何问题,但是当在函数中调用它时,就发生了错误。我
我必须从 OLS statsmodel 摘要中提取信息。执行此操作时,汇总的峰度结果与数组方法 kurtosis() 不同。 这是代码: 来自 sklearn.da...
今天我做了一个奇怪的观察 - 我用 3 种不同的方式实现了两个向量的协方差,并得到了 2 个不同的答案。在R中,方法1和2是相同的。方法3应该是数学的...
直接在 Microsort Word 中进行表内的简单百分比计算
对于我的一位客户,我需要不断更新带有统计数据的Word文档。 统计数据非常简单,基本上只是一堆带有频率计数和