在http://stats.stackexchange.com上考虑您的问题是否会更好。统计学是使用概率从有限数量的样本或观察中推断人口特征的数学研究。
假设 $M$ 状态的马尔可夫链,并假设从状态 $X_0$ 开始,我想知道是否有一种方法可以计算在第 n 个状态期间至少访问一次状态 $X_k$ 的概率...
我一直在尝试使用 z 分数来过滤 python 中的奇数值。对于计算,我使用了 scipy 提供的版本,而不是使用 numpy 以及平均值和标准函数自己计算......
我有一篇论文的数据。该测定针对 6 种不同的细胞培养条件(列)和 6 个基因(行)进行。然而,每个基因也进行了 4 次(用于统计 pu...
有一组对象要分为n类。每个类别都有自己的系数。 例如: 等级系数 1 0.5 2 0.7 氮0.4 我安排了
Statsmodels - 通过明确提供要使用的 endog 值,使用训练有素的 arima 模型进行手动点预测
我正在使用 statsmodels 库来提供用于预测时间序列的 ARIMAX 模型。我有一个相当奇怪的问题 - 如何强制经过训练的模型通过 expl 执行完全手动的点预测...
所以我正在做一个大学项目,我试图在一个有 722 行和 9 列的数据集中找到异常值,所以有超过 6000 个变量。 我一直在尝试很多方法: 首先是 Z 分数...
有没有办法降低经典欺诈预测问题中的误报率。目前我正在研究经典的欺诈检测。有50000个带有真实标签的样本(结果是由于
我想从 CDF 1 - e^(-x^2) 的概率分布中抽取样本。 python/scipy/等中有没有方法?使您能够从仅给定 CDF 的概率分布中进行采样?
两个向量的相关性 - numpy.corrcoef 与卷积方法
我有两个 numpy 数组,我想计算它们的相关性。我正在使用 numpy.corrcoef,但我也想通过应用卷积来做到这一点,但我得到了完全不同的结果。我是什么
现在我正在尝试了解python中的pandas包。 但使用重命名功能时,我遇到了一些问题。 蘑菇 = pd.read_csv('./mushroom/agaricus-lepiota.data', header=None) 穆什尔...
注意:这可能更适合交叉验证,如果需要的话我可以将其移到那里,但我想我会先在这里尝试,因为它可能与 r 相关。 我正在比较生长曲线
为什么这个矩阵是奇异的?尝试创建我自己的对比矩阵但不明白错误
我有六个条件。我们可以称它们为A、B、C、D、E、F。 我正在尝试在 R 中创建一个对比矩阵。我将在回归模型中使用这些对比。 #比较A、B、C与D、E、F 对比1 <-...
我正在尝试分析股票回报的季节性(但实际上可以是任何类型的时间序列): 在 x 轴上我们有周数,在 y 轴上我们有历史平均回报...
因此,在制作散点图矩阵时,注意到我的散点图一侧给出了一系列水平线,另一侧给出了垂直线,有没有办法让它看起来像一个块......
我有以下代码,它为我的给定数据提供了最佳拟合曲线。我不知道如何引导它并使用它来找到 95% 置信区间。我的数据附在这里。 这是我的
我在显示包含多种代谢物的条形图上的 t 检验显着性值时遇到问题。我写的代码如下: 我的比较 <- list(c("0", "50&...
假设我有这个输入数据集,其 ID 为:a、b、c 我需要按每个样本 +-100 行的包进行排序,其 Id 分布与输入整个总体相同。 会是什么...
在用于推理统计的线性模型中是否应该使用不平衡变量作为自变量?
嘿嘿, 情况:我正在尝试创建一个线性(混合)模型。我从之前的研究中知道,一个人的性别和疾病严重程度会影响结果变量。我感兴趣的变量是
我试图找出消费者购买的价值的分布情况。它是零膨胀的,因为大多数消费者在给定的时间限制内不会进行任何购买。我用py...