在http://stats.stackexchange.com上考虑您的问题是否会更好。统计学是使用概率从有限数量的样本或观察中推断人口特征的数学研究。
分层贝叶斯模型通常用于市场营销、政治学和计量经济学。然而,我所知道的唯一软件包是 bayesm,它实际上是一本书的姊妹篇(贝叶斯统计......
在我们的日志文件中,我们存储请求的响应时间。 计算平均响应时间的最有效方法是什么,“75/90/95% 的请求在不到 N 时间内得到满足”数字 e...
不相关变量的系数表示其中的独特信息对最终变量的影响程度。但是相关变量的系数意味着什么 - 我是谁......
我得到了两组数据,我需要弄清楚它们是否“相同”。每个数据集都包含一个 PDF 和一个 CDF(但不包括底层样本)。 PDF 和 CDF 数据位于...
我正在为我当前的项目使用 Codeigniter。 该项目看起来像一个社交平台,所以我想在用户管理面板上显示用户数据。 我为用户提供以下类型的域。 哈...
我认为下面的两种方法理论上会给出相同的结果,因为它们是等效的。然而,它们在 Python 中略有不同! 从 scipy.stats 导入规范 # 假设我们的 z-
对于一组数据点,我发现平均值为2989.05,偏度为26.67,峰度为1003.29。 这里峰度似乎非常高,我无法理解这意味着什么。有人可以吗
有没有办法对额外列中的所有 p 值应用 p 值调整?通过在某处合并 p.adjust 函数?我假设小插图中的 pvalue 函数是 d...
与我的问题相关的答案没有回答我的问题。 答案是 p 值输出的格式不符合预期。 我的问题与 p 值无关。我关心的是
当交互结果中有 NA 值时,如何使用 multcompLetters2 计算 ggplot2 的 TukeyHSD 字母?
我有一些数据帧形式的数据,我想对其执行方差分析和后续的 TukeyHSD。不幸的是,缺少一些处理之间的组合:品种。我想计算
如何使用 Scipy Mahalanobis 距离实现进行异常值检测?
我有一个 Pandas 数据框中多个个体的不同测量值的数据集,与此随机数据的结构类似: 将 pandas 导入为 pd 将 numpy 导入为 np df = pd.DataFrame(np.random...
我正在测试股票市场的随机性,并想对对数收益进行运行测试。现在,财务回报可以是负数、零或正数。标准运行测试是 ex...
使用 svyglm()$aic 与使用 stats::AIC(model) 时得到不同的 AIC 值。我知道这个话题之前已经讨论过。不过,并没有详细解释
我有这个数据集: > 输出(mdata2) 结构(列表(EE = c(3.3221428469822,3.62699732299098,1.75430154205983, 0.809228977410138、1.24117055233438、2.93403148663873、4.01630566539058、 1.
Windirstat/ Kdirstat/ Disk Inventory X 在文件管理方面堪称革命性的。为什么没有等效的纯文本命令行?我需要它来通过 SSH 管理我的文件...
对于多元高斯,计算给定点的 CDF 或 PDF 是直接的。 rv = scipy.stats.multivariate_normal(mean, cov) 然后 rv.pdf(point) 或 rv.cdf(upper) 但我有价值...
我在使用 plm 包中的 pFtest() 函数时遇到问题。 我正在使用以下三个测试(请参阅下面的代码)。但是,如果您查看输出,您会看到 pFtest ...
下面是使用 mtcars 数据集的示例。有一个值为 33.9 的离群值,但我想要一个函数来查找给定列的所有离群值。 图书馆(dplyr) 库(ggplot2) mtcars %&g...
我有 pandas 数据框 df。我想选择标准差大于 1 的列。这是我尝试过的 df2 = df[df.std() >1] df2 = df.loc[df.std() >1] 两者都生成...
我正在研究一个数据集,它表示某些流程中执行的某些活动的完成时间。只有 6 种类型的活动在整个数据集中重复出现......