我正在尝试编写一个分类器,我可以训练它来查看问题实例,并根据其特征和特定变量的值来预测问题属于哪一类。我不是在寻找问题的答案,只是寻找一些关于我应该重点学习哪种 ML 算法的指导。
这是一个示例问题。假设我们有一些蛋糕食谱。它们具有以下连续可变的特征:
我们还有一个二进制变量:
蛋糕还通过让一些人吃来进行测试,每个人都给每块蛋糕一个“好吃”指数。这也是一个连续变量,值越高,越多人喜欢那个蛋糕。
我运行了多次,最终得到了一个数据集,其中每个食谱都有两个条目(一个用于燃气,一个用于电力)以及每个食谱各自的“美味指数”。我们会发现,对于每种食谱,人们往往更喜欢用燃气或电烹饪,这反映在口味指数中。
现在,我知道这是不现实的,但这是一个简单的方法来说明我想做的事情。
在训练系统执行此操作后,我现在想让系统采用新的食谱,并根据具有类似(不一定相同)功能的过去食谱以及燃气或电力是否给出,预测是否应该使用燃气或电力烹饪。口味指数最高。
任何关于哪种机器学习算法最适合此任务的建议,我们将不胜感激。如前所述,我只是想缩小我的研究重点,不一定会得到答案。
先谢谢大家了
到目前为止,我已经使用 Scikit-learn 在 Python 中尝试了几种机器学习算法。 KNN 已被证明在基于特征预测类别方面是最准确的,但我不确定如何将“品味指数”反映到其中。此外,这似乎是监督机器学习的一个示例,因为数据被标记为(天然气或电力)。
我读了你的问题,基于此我认为这不是二元分类的情况,而是具有连续目标变量的多特征分类问题的情况。
我是 AI-ML 领域的新学习者,我了解一些基础知识或一些基础知识,基于此,我相信 随机森林分类器、梯度提升分类器、支持向量机 (SVM) 或支持向量分类器可以帮助您很好,不过如果你愿意,也许你可以创建一个 ANN 或神经网络。
对于“美味指数”,您可以创建一个新功能或标签或变量,以捕获每个食谱的燃气和电力之间“美味指数”的差异。
希望这对您有帮助,为了更清楚地了解,您可以与专业人士联系并询问他们,或者只是通过使用互联网即可。
非常感谢您宝贵的时间。 :)