基于特征和连续变量值预测类别的分类器 ML 算法

问题描述 投票:0回答:1

我正在尝试编写一个分类器,我可以训练它来查看问题实例,并根据其特征和特定变量的值来预测问题属于哪一类。我不是在寻找问题的答案,只是寻找一些关于我应该重点学习哪种 ML 算法的指导。

这是一个示例问题。假设我们有一些蛋糕食谱。它们具有以下连续可变的特征:

  • 面粉用量
  • 牛奶量
  • 不。鸡蛋
  • 糖份量

我们还有一个二进制变量:

  • 蛋糕是用燃气烤箱还是电烤箱烤的? (假设 1 代表燃气,0 代表电力)
  • 每个菜谱都煮两次,一次用煤气,一次用电

蛋糕还通过让一些人吃来进行测试,每个人都给每块蛋糕一个“好吃”指数。这也是一个连续变量,值越高,越多人喜欢那个蛋糕。

我运行了多次,最终得到了一个数据集,其中每个食谱都有两个条目(一个用于燃气,一个用于电力)以及每个食谱各自的“美味指数”。我们会发现,对于每种食谱,人们往往更喜欢用燃气或电烹饪,这反映在口味指数中。

现在,我知道这是不现实的,但这是一个简单的方法来说明我想做的事情。

在训练系统执行此操作后,我现在想让系统采用新的食谱,并根据具有类似(不一定相同)功能的过去食谱以及燃气或电力是否给出,预测是否应该使用燃气或电力烹饪。口味指数最高。

任何关于哪种机器学习算法最适合此任务的建议,我们将不胜感激。如前所述,我只是想缩小我的研究重点,不一定会得到答案。

先谢谢大家了

到目前为止,我已经使用 Scikit-learn 在 Python 中尝试了几种机器学习算法。 KNN 已被证明在基于特征预测类别方面是最准确的,但我不确定如何将“品味指数”反映到其中。此外,这似乎是监督机器学习的一个示例,因为数据被标记为(天然气或电力)。

machine-learning scikit-learn artificial-intelligence classification supervised-learning
1个回答
0
投票

我读了你的问题,基于此我认为这不是二元分类的情况,而是具有连续目标变量的多特征分类问题的情况。

我是 AI-ML 领域的新学习者,我了解一些基础知识或一些基础知识,基于此,我相信 随机森林分类器、梯度提升分类器、支持向量机 (SVM) 或支持向量分类器可以帮助您很好,不过如果你愿意,也许你可以创建一个 ANN 或神经网络。

对于“美味指数”,您可以创建一个新功能或标签或变量,以捕获每个食谱的燃气和电力之间“美味指数”的差异。

希望这对您有帮助,为了更清楚地了解,您可以与专业人士联系并询问他们,或者只是通过使用互联网即可。

非常感谢您宝贵的时间。 :)

最新问题
© www.soinside.com 2019 - 2025. All rights reserved.