sampling 相关问题

在信号处理中,采样是将连续信号减少为离散信号。在统计学中,抽样是从统计总体中选择一部分个体来估计整个人口的特征。

Python:数据帧中的样本,存储未采样的样本

我有一个熊猫DataFrame。假设我想对每个组的两个人进行抽样,我使用以下代码来获取新的数据框:sample_df = df.groupby(“ category”)。apply(lambda group_df:group_df.sample(2,...

回答 1 投票 2

如何从python中的数组中随机选择元素?

我需要从列表中随机选择元素。当前,我有时会从原始列表中选择太多的元素副本,例如:原始列表:[0,1,2,3,4] 3随机选择...

回答 1 投票 -1

如何在python中随机获取数组中的元素?

我有问题。我知道如何使用random.choices做到这一点。但是问题是:如果我有一个像这样的数组:[1、2、2、3、4、5],并且我要求采用4个值,有时,我会发现[...

回答 1 投票 -1

给定一个现有分布,如何绘制标准差为X的大小为N的样本?

我有一个值的现有分布,我想绘制5号样本,但那5个样本的标准差必须在一定公差内。例如,我需要5个样本的std为10(...

回答 1 投票 2

似然函数与抽样分布

我正在阅读Bishop的模式识别和机器学习,我对以下内容感到困惑。采样分布和似然函数之间有什么区别?对于...

回答 1 投票 0

如何估算大型数据集的准确性?

鉴于我有一个深度学习模型(前同事的交接)。由于某些原因,火车/开发人员设置丢失。在我的情况下,我想将数据集分为100个类别。 ...

回答 1 投票 1

Excel过滤器表数据满足采样要求

我需要在可用于采样的数据表中为每个投诉处理者获得2个随机案例。假设我将不得不使用Handler ID(对每个...的唯一引用...

回答 1 投票 1

Python:按比例对不平衡数据进行分层抽样

这是我的数据帧:df = pd.DataFrame({'var1':[1,2,3,4,5,6,7,8,9,10,11,12,13,14],' var2':['a','a','a','a','b','b','b','b','b','b','b','c ','d','d'],'var3':[...

回答 1 投票 0

如何从多项式分布中采样?

让我们假设我有一组概率[0.1,0.6,0.2,0.1]。我想从这组概率中采样位置。例如当我采样时,我应该比...更多地获得位置1。

回答 1 投票 0

Fortran中的加权采样

在Fortran程序中,我想通过使用权重随机选择特定变量(特别是其索引)。权重将在单独的向量中提供(元素1将包含权重...

回答 1 投票 3

对高度不平衡的数据集进行抽样的正确方法是,该数据集具有较低的特征相关性和较低的类方差?

我有一个数据集,具有23个相关性非常低的特征。这两个类别之间的差异很小。这些类别非常不平衡,就像可用于欺诈检测的数据一样。 ...

回答 1 投票 -1

如何将具有不同频率的时间序列(以千年为单位)组合]]

我有两个数据集(下面),我想作为一个单一的时间序列进行组合,以在R中进行一些多元分析,但是它们具有不同的频率。第一个每3000年测量一次...

回答 1 投票 0

检查seaborn散点图功能是否为采样数据

我已经绘制了一个海洋分布图。我的数据包含5000个数据点。通过查看情节,我肯定看不到5000点。所以我很确定某种采样是通过...

回答 3 投票 2

Seaborn散点图函数如何采样数据?

我已经绘制了一个海洋分布图。我的数据包含5000个数据点。通过查看情节,我显然没有看到5000点。所以我很确定某种采样是通过...

回答 3 投票 1

用于测试和训练的分层分组

我正在使用此数据集,但是我认为分层抽样会更好,因为二进制结果变量由90%== 1和10%== 0组成。所以下面的代码可以工作,但是.. 。

回答 1 投票 0

分层拆分测试组

我使用此数据集,但我认为不是随机抽样,而是分层抽样会更好,因为二进制结果变量由90%== 1和10%== 0组成。所以下面的代码有效,但是它是...

回答 1 投票 0

如何从DataFrame(Python)中的每个组中采样不同数量的行

我有一个带有类别列的数据框。 Df每个类别的行数不同。类别number_of_rows cat1 19189 cat2 13193 cat3 4500 cat4 1914 cat5 568 cat6 ...

回答 1 投票 0


为矩形图像创建重叠的正方形补丁

给出一个矩形图像img和patch。现在,我想用边长为s的正方形补丁覆盖整个图像,以使img中的每个像素都使用最小...

回答 1 投票 0

在AutoML H2O上使用balance_classes会产生错误“ java.lang.IllegalArgumentException:采样期间出错-点数太少?”

在AutoML H2O上使用balance_classes会产生错误“ java.lang.IllegalArgumentException:采样期间出错-点数太少?”我正在尝试使用AutoML H2O模型训练多类问题...

回答 1 投票 1

© www.soinside.com 2019 - 2024. All rights reserved.