在统计学中,样本是单个数据点还是一组数据点?

问题描述 投票:0回答:2

这个问题让我在统计学上很困惑。我认为在统计中,样本是 PDF 中的一组数据点,而不是单个数据点,我是否正确?在日常用语中,如果您取样某物,例如从糖果罐中取样,则意味着只取出一颗糖果。但在统计学中,一个样本似乎总是像重复拿糖果的动作20次(意思是样本大小为20)。我说得对吗?

此外,如何在随机变量上下文中解释该采样?还是以糖果罐为例,我通过重复拿糖果的事件所拿的糖果,每一个都是独立的随机变量吗?

statistics probability probability-distribution
2个回答
0
投票

这是一个具有潜在深远影响的好问题。为了澄清这个问题,我认为最好将这些概念分开。我可以总结的最简单的方法如下:

抽样:它是从总体中选择样本单位子集(样本)以估计整个总体特征的方法和过程的研究领域。

人口:这是我们希望了解相关信息的整个感兴趣群体。示例:(i) 南极洲的所有帝企鹅,(ii) 美国的所有已婚女性,(iii) 世界上所有 10 岁以下的儿童。

注意它会变得多么棘手:你的人口可以是另一个人口的子集 - “美国所有已婚女性”是“世界上所有女性”的子集。秘诀是要记住,群体是在特定情况下“您”感兴趣的整个群体。

人口特征

:这是您想要衡量的人口方面。示例:(i) 南极洲帝企鹅的平均身高,(ii) 美国已婚女性的平均年龄,(iii) 全球 10 岁以下糖尿病儿童的比例。

样本

:由人口子集组成的群体。您可以从所需总体中抽取 1N 个样本单位(见下文)。

样本单位

:必须根据研究的兴趣来定义,可以是个人、家庭、国家等。必须在研究开始时就做出选择。 在你的问题中,我相信我们只需将名词

sample

与动词tosample分开即可使事情变得清晰。 你可以正确地说:

“我正在从罐子里品尝糖果”。
  • “我有一份 1 号糖果样品”。
  • “我有一份尺寸为 25 英寸的糖果样品。
  • “我必须有一个尺寸为 30”的样品。
  • 我相信这里还有一个关于经典统计概念的切线问题超出了问题的范围,即
统计显着性

- 您可能希望有足够大的样本量来推断有关感兴趣人群的信息 - 这可能这是人们相信样本量不等于 1 的原因,但请记住,某些主题涉及对罕见事件的分析,在这种情况下,您的样本量无论如何都会很小。 最后但并非最不重要的一点是,关于在随机变量上下文中进行采样,最准确的答案是:这取决于情况。用你的例子:假设你的糖果罐里只有绿色和红色糖果。我们可以定义一个随机变量

X

,如果采样的糖果是绿色的,则为0,否则为1。但我们也可以定义一个随机变量 Y,它是在每次尝试时总是获取 10 颗糖果的勺子中采样的绿色糖果的总和。对于 XY,我们可以考虑有或没有重新定位的场景,我们可能对变量 Z = g(X,Y) 感兴趣,依此类推 - 样本单位之间的独立性可能会根据您的人口和情况而变化感兴趣的“过程”。


0
投票

© www.soinside.com 2019 - 2024. All rights reserved.