人们总是使用简单的均值和标准差进行游行。我不知道它的正确用语 - 但它涉及减去一个数据集的平均值然后除以其标准偏差,然后添加另一个数据集意味着它并乘以新数据的标准偏差。
这允许一个gaussIan近似另一个的轮廓 - 这是贝叶斯更新的一个例子吗?我的问题是如下 - 其他发行版可以用同样的方式处理。例如泊松分布,只需使用分布形状和速率信息,可以做任何事情来匹配一个数据集配置文件到另一个数据集配置文件吗?
您的正态分布N具有平均值m和标准差s。现在你将N的均值除以m,将其标准差除以s。这产生正态分布,平均值为0(m-m = 0),标准差为1(s / s = 1)。
现在添加一个新值x并乘以新的标准差y。你会得到一个新的分布,平均x(0 + x = x)和标准差y(1 * y = y)。
这可以应用于其他发行版吗?当然是。您只需相应地操纵分布的参数。
例如,泊松分布由速率定义。如果您的分布P具有速率r,则可以将速率除以r并将其乘以z以获得具有速率z的新泊松分布。
目前尚不清楚你想要应用它的确切位置。在上面的示例中,您只为另一个参数交换一个参数 - 可以直接完成。如果这些参数本身就是多个底层基值的聚合,那么这种事情可以派上用场。
假设您有一个泊松分布,其速率参数是数千个单独基值的总和。您可能没有记录当前费率的每个值。但现在,您了解到您估计为x的基值(例如使用旧模型)实际上是y,即使您无法访问组成您的所有其他值,您也可以更新您的费率率。