异常值是一种观察结果,与数据集的简单表征相比,似乎不常见或没有很好地描述。
我(R)非常陌生,我想知道是否能得到一些帮助。我想知道如何排除每个参与者平均反应时间和每个目标的两个标准差的离群值。...
在数据框df中提供如下所示的数据,需要提取对任何列均具有离群值的行。 text =“ A,B,C,D,E,F,G,93,53,221,314,104,721,179 100,58,218,318,93,718,181 601,61,228,829,106,...
我有一个包含200,000个观测值和23个不同列的数据框。我绘制了数据,发现每列中都有离群值。因此,我想赢得整个数据框架。 ...
[我正在尝试运行一个脚本,该脚本使用加权的KNN离群值来执行离群值检测,但始终出现以下错误:apply(kNNdist(x = dat,k = k),1,mean)中的错误: ...
假设我有一个数据框,导入大熊猫作为pd数据= pd.DataFrame()数据[“名称”] = [“ A”,“ B”,“ C”,“ D”,“ E”,“ F” ,“ G”,“ H”,“ I”,“ J”] data [“ age”] = [22,9,505,39,50,17,26,33,-43,48] data [“ marks”] = [422,59,...
我是统计编程的新手,我目前正在研究信用违约数据集中19个变量的110000个观测值的数据集,并希望创建一些模型,例如逻辑模型...
当我使用OneClassSVM执行异常检测时,为什么会得到[[LibSVM]`
我正在使用Python的Scikit-Learn lib执行异常检测。我正在使用OneClassSVM。我有一个问题,因为每当我运行我的代码时(我没有得到错误),它都会显示[LibSVM]。我不知道为什么...
使用GridSearchCV和OneClassSVM时,`NU`值有错误
我正在使用GridSearchCV为我的模型OneClassSVM查找最佳参数。我在文档中已经读到nu值应该在0到1之间。在我的代码中,我总是遇到错误:ValueError:nu <= ...
在使用Python Scikit-Learn lib的调查中检测异常值
我制作了一个“调查”的虚拟数据集。调查有5个问题,每个问题有5个不同的答案(1、2、3、4、5)。我的目标是确定是否有人在调查中给出随机答案(...
Postgres对于INSERT,DELETE和UPDATE有一个很棒的RETURNING子句,这让我有点贪心。在某些情况下,我想得到的不仅是当前值,还有以前的值:...
我需要用平均值替换大于平均值的2倍或小于列中所有其他数字的平均值的1/2的异常值。例如,我有一个...
我希望删除下图中红线上方和下方的数据,这意味着删除1.2以上和-1.2以下的数据。我使用以下函数:threshold = [-1.2,1.2]; y = rmoutliers(y,'...
将df.where应用于熊猫中的选择性列以删除混合数据类型数据集中的异常值
Python和pandas新手设置了数据清理管道以准备df以进行机器学习。我想识别并删除异常值,并在适当位置替换(例如)算术平均值。 ...
我有一个如下所示的数据框:print(df.head(10))日CO2 1 549.500000 2 663.541667 3 830.416667 4 799.695652 5 813.850000 6 769.583333 7 681.941176 ...
我有一个数据框,我正在尝试在分析之前清除数据。我试图处理异常值,并尝试计算Modified Z得分(中位数1)和IQR,以滤除...
[当我使用Matlab时,我正在使用方法filloutliers。我想知道是否有与C ++类似的东西。换句话说,我想知道是否有某种内置方法...
非线性回归与Keras损失没有减少:异常值和/或数据格式的问题?
我拥有一个数据表和它的两个列产生一个情节,看起来像这样。请注意,Y轴是在日志中。不介意随机汉字。这已经固定我想这可能是一个...
我是数据科学的初学者。在参加黑客马拉松时面对挑战。我有一个火车数据集,在许多列中有很多异常值。与测试数据相同(提供的培训和测试数据......
我正在努力解决回归问题。我有10个自变量。我正在使用SVR。尽管使用网格搜索进行特征选择和调整SVR参数,但我获得了15%的巨大MAPE。所以我 ...