outliers 相关问题

异常值是一种观察结果,与数据集的简单表征相比,似乎不常见或没有很好地描述。

替换大数据中的异常值

我有一个12列600000行的大数据,我想用这个函数替换异常值 替换异常值 <- function(x, na.rm = TRUE, ...) { qnt <- quantile(x, probs=c(.25,....

回答 1 投票 0

在 Postgres 中实现 Sn 和 Qn(Rousseeuw 和 Croux)进行异常值检测

我正在审查和试验异常值标记策略,并不断遇到 Rousseeuw 和 Croux 在《中值绝对偏差的替代方案》中对 Sn 和 Qn 的引用。 http://web...

回答 2 投票 0

用等量值或多个值替换检测到的异常值

我正在分析一个由 R-R 间隔组成的数据集,这些间隔是秒的几分之一,总共等于 240 秒或 4 分钟。 这些数据中经常存在一些异常值,我可以

回答 1 投票 0

如何轻松找到箱线图异常值

下面是使用 mtcars 数据集的示例。有一个值为 33.9 的离群值,但我想要一个函数来查找给定列的所有离群值。 图书馆(dplyr) 库(ggplot2) mtcars %&g...

回答 1 投票 0

当存在异常值时,在 ggplot 箱线图上标记胡须

我想在 ggplot 的箱线图中标记晶须的末端,而不是最小值和最大值,这在我的数据中通常是异常值。 我尝试使用此处找到的代码:annotate boxplot in g...

回答 3 投票 0

在Python中从异常值导入grubbs测试时出现问题

我尝试使用 Python 测试数据的异常值。当我发现有异常值包时,我应该安装 outlier_utils。当我尝试在 Anaconda 中运行“pip install outlier_utils”时

回答 1 投票 0

检测二维空间异常值的快速方法

我有数亿个点云,如下所示: 我想删除异常值 1, 2, 4, 5, 6, 7。最安全的选择是构建一个连接所有点的最小生成树并删除...

回答 1 投票 0

series_outlier方法中离群值的计算

我想在Python中实现series_outlier方法并使用以下代码 将 pandas 导入为 pd 将 numpy 导入为 np 从 scipy.stats 导入规范 # 将数据加载到DataFrame中 数据 = { ...

回答 1 投票 0

从ggplot2中的stat_summary中删除异常值

我有这部分代码可以用我的数据生成箱线图: <- ggplot(meltData, aes(x=variable, y=value)) + geom_boxplot()+ geom_boxplot(outlier.colour="red", outlier.shape=1,outlier.

回答 1 投票 0

对隔离森林感到困惑

比方说,我有包含 10 个观察值(两个特征)的异常检测(无监督学习)数据集。数据集如下: 执行模型后,结果如下(异常

回答 1 投票 0

手动和ggplot计算的箱线图统计/异常值消除之间的差异

我有一些数据集合并在一个数据框中,我想从中消除异常值。 当尝试不同的方法来计算上限和下限阈值时,我发现结果之间存在差异......

回答 1 投票 0

如何在Python中从x-y散点图中删除y-离群值?

我正在绘制一个数据框 df,其中包含散点图中的 x 和 y。显然,在许多情况下,对于每个 x 值,y 值可能是分散的。我想删除每个 x 的 y 异常值。这是不同的...

回答 1 投票 0

在 Gnuplot 的盒须图中渲染异常值

Gnuplot v5.4.2 中的箱线图呈现如下所示。有没有办法将属于同一框的所有异常值“投影”到框上方/下方的相同 x 位置? 画的有点……

回答 1 投票 0

资产价格上涨,ARMA-GARCH 预测强劲

我想复制这篇文章“测试条件高斯 ARMA-GARCH 模型中的跳跃,一种稳健的方法”。 本文用于估计 ARMA-GARCH 模型遵循以下步骤...

回答 1 投票 0

Python 数据过滤以消除密度图周围的异常值

参考下图,我想删除以黑色椭圆形标记的密度区域之外的所有异常值。我可以使用简单的水平过滤器,例如 -4 < data < 4. But

回答 1 投票 0

忽略ggplot2中的箱小提琴图中的异常值

我正在尝试在 ggplot2 中绘制箱小提琴图,但我似乎找不到一种方法来忽略 geom_violin 中的异常值,而在 geom_boxplot 中由 outlier.shape = NA 处理。结果尾巴...

回答 1 投票 0

二维图中的强度异常值(高强度的最大或最小局部峰值)

我想知道使用哪种方法更好地查看二维图 z 值上的异常值。例如,我测量的 x 和 y 值都在 1 到 16 范围内,步长为 1。接下来我计算有多少

回答 1 投票 0

二维图中的强度异常值

我想知道使用哪种方法更好地查看二维图 z 值上的异常值。例如,我测量的 x 和 y 值都在 1 到 16 范围内,步长为 1。接下来我计算有多少

回答 1 投票 0

在小尺寸向量中查找异常值

假设我有一个 n 元素向量,由某些带有需要定位的尖峰的测量值组成(n 很小,比如 5-7)。我的任务是找到向量中“很多

回答 1 投票 0

处理时间序列中的异常值

我正在研究时间序列预测。在实现预测模型之前,我正在做一些数据处理。我有一些异常值。如果我删除包含异常值的行,我的行将不会

回答 1 投票 0

© www.soinside.com 2019 - 2024. All rights reserved.