Statsmodels是一个Python模块,允许用户浏览数据,估计统计模型和执行统计测试。
如何通过 PySpark DF 使用 statsmodels 中的seasonal_decompose / 如何将 DataFrame 转换为时间序列数组
我有一个包含两列的spark Dataframe(time_key,日期和数量之间间隔7天),就像这样: 时间键 数量 2023-10-26 10 2023-10-19 12 2023-10-12 14 我正在尝试使用 fu...
我需要将内生变量 Y 回归到外生变量 X 上。Y 如下所示: 编号 0 1 2 ... 22 23 24 日期...
我想获得 scipy 函数 scipy.optimize.curve_fit() 背后的一些直觉。下面,我写了一个简单的版本,试图最小化最小二乘函数之和(权重均为1),
尽管使用频率重新索引,但 ARIMA 模型出现“无法在没有频率的情况下将积分值添加到时间戳”错误
我正在尝试使用 ARIMA 模型对此系列进行时间序列预测: 1960年1月1日 12.7 1961-01-01 12.1 1962年1月1日 12.7 1963年1月1日 12.8 1964年1月1日 12.3 1965-01-01 13.0 196...
如何在Python statsmodels线性混合效应模型中拥有多个组?
我正在尝试使用Python statsmodels线性混合效应模型来拟合具有两个随机截距的模型,例如两组。我不知道如何初始化模型,以便我可以...
我使用 statsmodels 中的 ExponentialSmoothing(版本:0.10.1)来拟合某些数据并对其进行预测。为了在设置配置时方便使用,我编写了一个函数 exp_smoothing_forecast
考虑以下示例: 将 statsmodels.formula.api 导入为 smf 随机导入 将 pandas 导入为 pd df = pd.DataFrame({'y' : [x**2 + random.gauss(2) for x in range(10)], 'x':[...
使用 statsmodels 在 Python 中忽略 KPSS 测试中的警告
当我运行下面的代码时,我收到特定警告 将 numpy 导入为 np 从 statsmodels.tsa.stattools 导入 kpss kpss(np.random.choice(范围(-1000,1000),10000)) 警告信息 :1:
我是 ARIMA 建模新手,想了解 ARIMA 模型的预测工作原理。假设我的训练期将于 2020 年第一季度结束,并希望对 2021 年第一季度至第二季度进行预测...
我有一个关于 Pymer4 中混合效果的问题(与 lme4 相同,但在 python 中)。我的模型在机器学习下拟合以获得预测值(Observed_values = Predicted_values + Total_residu...
下面的代码中有一个%,来自Python中的ARIMA模型。 从 statsmodels.tsa.stattools 导入 adfuller 从 numpy 导入日志 结果 = adfuller(df.value.dropna()) print('ADF 统计...
Python statsmodel 输出和 Excel/Google Sheet 输出不匹配
我有一个小数据集,由于某种原因,输出与Excel的不匹配。 这就是我所做的。我必须专栏: 行驶里程 旅行时间 89 7.0 66 5.4 78 6.6 111 7.4 44 4.8 77 6.4 8...
我有以下代码: 将 numpy 导入为 np 将 matplotlib.pyplot 导入为 plt 从 statsmodels.graphics.factorplots 导入交互图 a = np.array( [ [ 'a1', 'a2', 'a3' ] f...
我正在使用 statsmodels.stats.multitest.multipletests 函数 纠正我存储在数据框中的 p 值: p_value_df = pd.DataFrame({"id": [123456, 456789], "p 值":...
Statsmodels ARMA 训练数据与测试数据进行预测
我正在尝试测试 ARMA 模型,并完成此处提供的示例: http://www.statsmodels.org/dev/examples/notebooks/ generated/tsa_arma_0.html 我不知道是否有直接的...
statsmodels 在 ubuntu18.04 容器主机上安装失败,主机是 redhat linux,有防火墙限制。但错误是运行 cythonize 失败
在 Redhat linux 上托管的 ubuntu18.04 容器上安装 statsmodels 时失败。运行时错误:运行 cythonize 失败 #pip 安装 statsmodels 在带有 ubun 的 docker 容器中...
如何使用 stats.models 将数据转换为混合效应模型的偏态正态分布?
我是建模新手,所以请耐心等待,但我正在使用 statsmodels mixlm,如下所示: 模型 = smf.mixedlm("值 ~ categorical_variable", data, groups=data[year_identifier]) 当我...
考虑这个简单的例子 将 pandas 导入为 pd 从 statsmodels.formula.api 导入 ols url =“https://stats.idre.ucla.edu/stat/data/hsb2.csv” hsb2 = pd.read_table(url, 分隔符=”...
如何在 Python 中测试格兰杰因果关系(Toda 和 Yamamoto 风格)?
我正在尝试实施戴夫·吉尔斯(Dave Giles)这篇博文中概述的格兰杰因果关系测试流程,我知道这是一篇关于对非
Python 中是否有一种优化的方法来执行重复采样,类似于 R/dplyr 中的“rep_sample_n”?
我正在寻找一种在Python中创建采样分布的优化方法,类似于dplyr中的rep_sample_n。目前,我在列表理解中使用 df.sample (pd.concat([df.sample...