outliers 相关问题

异常值是一种观察结果,与数据集的简单表征相比,似乎不常见或没有很好地描述。

检测不适合R中对数函数的离群点

我有一个数据集,如下所示: 我的目标是对这些点拟合一条对数线,但忽略低于其余点的点,同时得出其余点的方程。基本...

回答 1 投票 0

matplotlib:绘图时忽略异常值

我正在绘制来自各种测试的一些数据。有时在测试中我碰巧有一个异常值(比如 0.1),而所有其他值都小三个数量级。 使用 matplotlib,我再次绘图...

回答 6 投票 0

识别 python 数据框中的异常值

我试图在集群模型中识别具有标准差的异常值。 # 计算汇总统计数据 rfm_mean、rfm_std = 平均值(rfm)、std(rfm) # 识别异常值 cut_off = rfm_std * 3 更低,

回答 2 投票 0

使用 pandas 识别统计异常值:分组并将行减少到不同的数据帧中

我试图了解如何识别数据帧组中的统计异常值。我需要按条件对行进行分组,然后将这些组减少为一行,然后找到

回答 3 投票 0

Tidyverse 过滤异常值 - 在一根管道中

我想在一根管道中过滤 tidyverseframe 工作中的异常值。 此示例的异常值仅定义为 Q1 - 1.5 * IQR 和 Q3 + 1.5 * IQR。 Q1 是 25%,Q3 是 75%……

回答 1 投票 0

计算有缺失值时的 Mahalanabois 距离

在 R 中,我试图计算马哈拉诺比斯距离来检查我的数据集中是否存在异常值,以测试多元方差分析的假设之一。我的数据集中缺少值。我原本有

回答 2 投票 0

隔离森林中是否可以动态调整污染参数?

我使用隔离森林构建了一个异常检测模型,污染参数默认设置为 (0.1)。它在我当前的数据集上运行得很好,但现在我有不同的文件......

回答 2 投票 0

给定一个大数据集,如何使用 R 的 IQR 方法删除异常值

我们获得了一个大型数据集,并要求我们使用 R 的 IQR 方法删除异常值。 数据有 53 列,其中 17 列是连续的,其余是分类的。怎么...

回答 3 投票 0

Python 按组执行列操作

我正在尝试在组级别删除异常值列(Property1、Property2 等),需要您的帮助。 这是我的示例数据框,包含 2 个组和 4 个属性。 团体 属性1 属性2

回答 1 投票 0

使用 ggplot 更改箱线图中的离群值颜色

我想更改箱线图异常值的颜色,使它们与周期的颜色相对应。我尝试了多种方法,但其中一些方法在图表中添加了另一个图例。谁能帮我...

回答 1 投票 0

在模型比较之外使用 pycaret 的异常值和归一化功能

我非常喜欢使用 pycaret 来处理我分析中的大部分跑腿工作。我在预处理中大量使用 setup() 方法来处理标准化、目标转换和特征

回答 1 投票 0

去除数据中的异常值,保持原始趋势

在我的情节中,你可以看到只有一些噪音。我尝试使用 scipy.signal savgol_filter,但趋势已经改变。我只是想消除这些噪音并使它们符合曲线。谢谢你。

回答 2 投票 0

删除时间序列中异常值的有效方法

我正在寻找有效的方法来删除数据中的异常值。我尝试了在 StackOverflow 和其他地方找到的几种解决方案,但没有一个对我有用(3 个高值 21637,

回答 1 投票 0

Python 中调整的箱线图

对于我的论文,我试图识别数据集中的异常值。该数据集由来自真实过程环境的一个变量的 160000 次构建。然而,在这种环境下,可能会有

回答 2 投票 0

在 Execl 或 R 中识别每个样本具有不同数据点数量的异常值

我正在尝试识别数据集中的异常点,其中每个样本都有不同数量的数据点。 这意味着矩阵长度因样本而异。 由于我正在研究大数据集......

回答 1 投票 0

如何构建用于检测异常值的自定义函数

我正在尝试构建一个自定义函数来检测数据集上的异常值。应返回的输出与 rstatix() 中的函数 recognize_outliers 相同 识别异常值自定义 <-

回答 1 投票 0

检测数据框中的异常值

我有一个如下所示的数据框: oph_single_positive_outlier oph_single_negative_outlier oph_1pos_1neg_outlier oph_multipos_at_once_outlier 桶...

回答 1 投票 0

如何从箱线图异常值中获取数据框?

我想获取数据框中列的极值。为此,我使用箱线图函数。但是,我无法获取数据框中包含异常值和列名称的数据框......

回答 1 投票 0

异常值检测。曲线拟合(即具有置信区间的 LOWESS、LOESS 等)或 MATLAB 中的任何其他适用方法

我正在尝试自动检测 x,y 散点图中的某些数据点。我有数千个,因此我需要实施一种在准确性和灵敏度之间取得良好权衡的方法。

回答 1 投票 0

没有异常值的 Matplotlib 箱线图

在 matplotlib (python) 中绘制箱线图时有什么方法可以隐藏异常值吗? 我正在使用最简单的方法来绘制它: 从 pylab 导入 * 箱线图([1,2,3,4,5,10]) 展示() 这个...

回答 1 投票 0

© www.soinside.com 2019 - 2024. All rights reserved.