在信号处理中,采样是将连续信号减少为离散信号。在统计学中,抽样是从统计总体中选择一部分个体来估计整个人口的特征。
我有一个pandas数据框,名为 ratings_full,形式为: userID nr_votes 123 12 124 14 234 22 346 35 763 45 238 1 127 17 我想对这个数据框进行采样,因为......
我想比较两个数据集,一个属性的分层方式不同。是否可以在一个数据集中做分层随机抽样,但使用另一个数据集的分层?要说明的是,一个 ...
希望根据另一个数据框架的标准,从一个数据框架中按组随机抽取n行。例如:从g数据框中随机抽取n条记录。从ggplot2::mpg数据框中随机抽取基于制造商和......的行。
目前正在使用Kibana处理60亿+文档,并试图根据 "索引"(即收集样本的特定日期)进行抽样。
我的问题很具体。给定一个有平均数和标准差的k维高斯分布,假设我想从这个分布中抽取10个点的样本。但是这10个样本应该是很 ...
我一直在尝试了解Gibbs采样。最近,我看了一段很有意义的视频。 https://www.youtube.com/watch?v=a_08GKWHFWo作者使用Gibbs采样来......>
首先是代码片段:##来自sklearn.svm的程序包从sklearn.model_selection导入SVC,从sklearn.metrics导入train_test_split从imblearn.over_sampling导入...导入fbeta_score ...
我对每个组具有以下概率,并且每个组代表一定范围的值。我的目标是模拟与组和 百分比相对应的1,234行数据:...
我有n个元素的样本。我想从n中对m个唯一的对进行子采样。有没有简单的方法可以在python中做到这一点?例如,如果n = [1,2,3,4,5,6,7]且m = 3,则一个这样的样本...
如何在Python(统计模型或其他模型)中计算可检测的效应大小
我和平常有一个不同的问题。它与Python(或Excel,无论如何)中的功效和样本大小计算有关。在Python中,Statsmodels对于执行此操作很有用。例如,...
我有一个数据集,其中包含分类为109个类别的130万条记录。显然存在类别不平衡,数据中的最高类别为18%,最低类别小于1%现在,我的...
我有100个唯一ID和8个独特星期。我想要抽样,以便我想要一个具有唯一ID和唯一星期的样本。例如,每周对ID 1进行8次采样,对ID 2进行8次采样,因此...
问题:我正在尝试使用R生成随机研究设计,其中一半的参与者被随机分配给“治疗1”,另一半的参与者被分配给“治疗2”。 ...
我在数据集中有506个点。我必须从该数据生成随机样本,例如我必须选择303个点而不进行替换,而剩下的203个点我需要从这303个点中选择...
我正在尝试以群集/阻止的方式对R数据帧进行重新采样。我正在使用下面的代码片段进行此操作,但是它的速度很慢:index_sample
[sklearn.model_selection.ShuffleSplit的等效函数是什么,它可以保证所有折痕都不同?
假设我拥有一家工厂,该工厂每天生产150颗螺钉,错误率为22%。现在,我要估计一年(365天)每天用rbinom(n = 365,大小...
我希望从一个列表中抽样元素,以使该元素中的任何一个都不包含在另一个指定元素列表中。我希望继续生成新的样本,直到不相交的样本是...