用于OpenCV的多项式朴素贝叶斯

问题描述 投票:0回答:1

我正在寻找一个用C / C ++编写的用于OpenCV的Multinomial Naive Bayes分类器。

我正在寻找算法(或现成的实现),因为它会更有帮助,因为我试图了解它是如何工作的?

c++ opencv naivebayes pattern-recognition
1个回答
1
投票

朴素贝叶斯分类器是一种众所周知的分类算法。特别是在文本分类领域,所以我会把它作为解释。

假设我们有一些培训文档{d1 , d2 , d3 , ... , dm},其中每个文档可以由一组单词{w1,w2,w3, ... , wn}表示,每个文档属于一些预定义的类集(在这里采用二进制文件(c_0,c_1))我们的任务是将一些新的输入文档d分类为类c_0或类c_1

一种直观的方法是采用最大似然估计:即

output c_0 if P(d | c_0) > P(d | c_1) and vice versa.

所以根据我们对d的定义,我们可以写出标准

P(d | c_0) = P( {w1,w2,w3...,wn}  | c_0)

因为计算这个联合概率给定的类是如此复杂。因此,我们强烈假设单词在课堂上是相互独立的。这导致我们

P(d | c_0) = P({w1,w2,w3...,wn} | c_0) = P(w1|c_0)*P(w2|c_0)*P(w2|c_0)...*P(wn|c_0)

其中每个P(w | c)可以很容易地计算为c类中词w的频率计数。

这个强烈的假设是“Naive”这个名字的原因,因为我们只是天真地为每个单词进行系列乘法。

最后拿answer = argmax P(d | c_0) , P(d | c_1)会结束这个算法

我想在你的域中你所看到的与文本分类类似,除了你需要提取的功能是不同的。

© www.soinside.com 2019 - 2024. All rights reserved.