我们正在尝试实现语义搜索算法,以根据用户的搜索条件提供建议的类别。
目前,我们已经实现了Naive Bayes概率算法,以返回数据中每个类别的概率,然后返回最高的概率。
然而,由于其天真,它有时会导致错误的结果。
没有进入神经网络和其他荒谬复杂的东西,还有另一种我们可以研究的选择吗?
朴素贝叶斯(NB)与Logistic回归没有太大的不同。根据经验,Logistic回归在大多数情况下在预测性能方面优于NB。
此外,如果您有足够的数据并且没有任何丢失的数据,那么您很可能会发现NB的预测性能与更复杂的方法(如贝叶斯网络(BN))非常相似,而贝叶斯网络(BN)则没有协变量之间的'天真'独立假设。
如果你想放松独立性假设而不必完全潜入BN领域,你可以先尝试Tree Augmented Naive Bayes算法。
如果你不认为线性SVM是非常复杂的东西,你可以试试。众所周知,这些任务表现非常好。