我正在开发一个项目,我想构建一个模型,根据用户对 100 个单词列表的反应来预测用户是否认识某个单词,这些单词按难度级别分组(每个级别 10 个单词)。我计划收集用户输入,将每个单词标记为“已知”或“未知”,然后使用这些标记数据来训练分类模型。我希望获得有关从何处开始该项目的指导以及针对此预测的适当模型的任何建议
很高兴知道你有这个想法。 我可以建议您使用 RandomForestClassifier 和其他分类模型来测试它们在您的数据集上的表现。
您可以使用 GridSearch 来确定之后应该使用哪个模型)