基于特征和连续变量值预测类别的分类器 ML 算法

Question

我正在尝试编写一个分类器，我可以训练它来查看问题实例，并根据其特征和特定变量的值来预测问题属于哪一类。我不是在寻找问题的答案，只是寻找一些关于我应该重点学习哪种 ML 算法的指导。

这是一个示例问题。假设我们有一些蛋糕食谱。它们具有以下连续可变的特征：

我们还有一个二进制变量：

蛋糕还通过让一些人吃来进行测试，每个人都给每块蛋糕一个“好吃”指数。这也是一个连续变量，值越高，越多人喜欢那个蛋糕。

我运行了多次，最终得到了一个数据集，其中每个食谱都有两个条目（一个用于燃气，一个用于电力）以及每个食谱各自的“美味指数”。我们会发现，对于每种食谱，人们往往更喜欢用燃气或电烹饪，这反映在口味指数中。

现在，我知道这是不现实的，但这是一个简单的方法来说明我想做的事情。

在训练系统执行此操作后，我现在想让系统采用新的食谱，并根据具有类似（不一定相同）功能的过去食谱以及燃气或电力是否给出，预测是否应该使用燃气或电力烹饪。口味指数最高。

任何关于哪种机器学习算法最适合此任务的建议，我们将不胜感激。如前所述，我只是想缩小我的研究重点，不一定会得到答案。

先谢谢大家了

到目前为止，我已经使用 Scikit-learn 在 Python 中尝试了几种机器学习算法。 KNN 已被证明在基于特征预测类别方面是最准确的，但我不确定如何将“品味指数”反映到其中。此外，这似乎是监督机器学习的一个示例，因为数据被标记为（天然气或电力）。

Answer 1

我读了你的问题，基于此我认为这不是二元分类的情况，而是具有连续目标变量的多特征分类问题的情况。

我是 AI-ML 领域的新学习者，我了解一些基础知识或一些基础知识，基于此，我相信 随机森林分类器、梯度提升分类器、支持向量机 (SVM) 或支持向量分类器可以帮助您很好，不过如果你愿意，也许你可以创建一个 ANN 或神经网络。

对于“美味指数”，您可以创建一个新功能或标签或变量，以捕获每个食谱的燃气和电力之间“美味指数”的差异。

希望这对您有帮助，为了更清楚地了解，您可以与专业人士联系并询问他们，或者只是通过使用互联网即可。

非常感谢您宝贵的时间。 :)