分位数是从随机变量的累积分布函数(CDF)定期获取的点。
为什么 qqnorm 的理论分位数与小数据集的手动计算不同?
我正在使用 R 中的 qqnorm 函数从整数数据集中生成理论分位数。我期望由 qqnorm 计算的分位数和使用分位数手动计算的分位数
我有一个变量x,我想将其分为具有相同观察值的三组。然而,由于分位数的关系,使用分位数并不会产生最平等的组,因为分位数截止点可能......
假设我有一列 FICO 分数。我想创建另一列 FICO_DECILE,对 FICO 分数降序排列并分配一个十分位组,即 FICO=850 将具有 FICO_DECILE=1,并且
我有两个一维数组 A 和 B(分别为长度 m 和 n),以及一些数字 n_0 为 0 < n_0 < n. I am looking for the most efficient way to identify the n_0 nearest poin...
当 tbl_summary() 使用 stats::quantiles 函数计算百分位数时,它默认使用类型 7 还是类型 2 算法?
在tbl_summary的参考页面中,它指出: “此外,{p##} 可用于百分位数,其中 ## 是 0 到 100 之间的整数。例如,p25: quantile(probs=0.25, type=2)。” 是否...
我有一个数组 A (大小为 m x n),以及 (0,1) 中的百分比 p。我需要生成一个 m x n 布尔数组 B,如果 A[i,j] 位于列的 p^{th} 分位数中,则 (i,j) 条目中包含“True”...
我想在 ggplot 的箱线图中标记晶须的末端,而不是最小值和最大值,这在我的数据中通常是异常值。 我尝试使用此处找到的代码:annotate boxplot in g...
为什么 xgboost.QuantileDMatrix 使用自定义数据迭代器对数据进行四次传递?
我正在尝试使用此处所示的自定义数据迭代器,因为我的数据集太大。为了测试它是如何工作的,我正在使用示例的子集并运行以下代码。 X 是一个
我正在尝试执行以下操作: 我有一堆每月温度栅格,并据此计算该堆栈的第 90 个分位数。 然后,我想计算每个栅格单元出现的频率
这里使用的数据集是风险(概率),概率很小。 当使用R中的summary函数时,得到以下结果 > 摘要(prob_ann) ## 分钟。 第一曲。
我正在对以中位数评估的分位数回归进行分析。下面是我使用过的代码。我的教育水平是 4 级数据,给我 3 个 p 值。我想要结束...
使用分位数和其他统计数据在data.table中进行汇总统计
我正在尝试使用 R 中的 data.table 来汇总数据。问题是在我的汇总框架中,使用分位数将结果吐出为行而不是列。我有一个简单的...
qcut 未找到分位数(我的 df 中重复了许多 0 和 1)
我的 df 有一列,其中 MAX_PERC 列的范围从 0 到 1。 0 的个数为 103168。 1 的数量为 32364。 小于 1 且大于 0.8 的 obs 数为 2594。 obs 的计数...
我有一个包含多个实例的集群服务,我的 REST 客户端正在通过 Micrometer 的摘要收集请求持续时间(在我的例子中称为 http_rest_call_time_bucket)。 我想知道如何
假设我们有这个 DataFrame: df = pd.DataFrame(列=["值"], 数据=[0, 0, 0, 0, 0, 1, 1, 1, 1, 1, 2, 2, 2, 3, 5, 7, 10 ]) 我想根据值将它们分成 5 个容器
假设我有一个极坐标数据框,其列结果是一些浮点数。 我怎样才能得到该结果的分位数作为数据框,即我想得到类似的东西: |分位数 |价值...
我有以下问题: 给定 k (=10) 个离散独立随机变量 X_i,每个变量具有 n_i (= 5 到 20) 个值。 问题:计算总和 X = X_1+...+X_k 的分布分位数。 哈...
Python 的 stats.norm.ppf(probability) 的 C++ 等价物是什么?是否有内置的 C++ 函数,或者可以从 C++ 调用 python 函数吗? boost是唯一的方法吗?但我很苦恼...
从文档来看,boost 似乎为正态分布和伽马分布提供了分位数函数(逆 cdf 函数),但我不清楚如何实际使用它们。可以...
如何让分位数与 summarise_at 和 group_by (dplyr) 一起使用
当使用 dplyr 创建按变量级别组织的汇总统计表时,我无法弄清楚计算四分位数的语法,而无需重复列名称...