我正在开发一个机器学习项目,其中我有一个数据集,其中包含数字列和包含数组的列的组合。数字列(例如平均值)包含单个值,而带有数组的列(例如梯度)每行可以具有可变数量的元素。
处理此类输入的最佳实践是什么?我可以在机器学习模型中同时使用数字列和带有数组的列吗?如果是这样,在模型的预处理和训练阶段处理这种数据异质性的最常见策略是什么?
我将非常感谢任何可以帮助我更好地了解如何应对这一挑战的建议或资源。
示例:
模型输入:
意思是 | 渐变 |
---|---|
0.5 | [1,2,3,45,0.2] |
1 | [2,5,1.2,5,0] |
抱歉,在机器学习模型中同时使用数字和数组输入是绝对不可能的。