我拥有可对 50,000 多个不同类别进行分类的图像数据。我正在研究处理如此大的语义空间的最佳方法。这在计算上会很昂贵,但有中间立场吗?
我正在考虑适合这种规模的架构,并在迁移学习和模型蒸馏之间进行辩论。在继续之前,我有几个问题:
哪些架构已被证明可以有效处理此类大型分类空间,尤其是在图像数据的背景下?
迁移学习是一种可行的方法吗?是否有针对此规模推荐的特定模型或预训练网络?
模型蒸馏在大规模分类任务的计算效率和有效性方面如何比较?
我感谢您提供的任何指导或建议,并很乐意在需要时提供更多详细信息。预先感谢您。
您可以找到多个类别来合并某些类别。例如,也许您可以将数据分为 100 个类。
此外,您可以尝试分层分类。但我不建议这样做,因为你必须训练多个模型。所以当你想要预测一个标签时,你必须加载多个模型,而且效率不高。无论如何,您可以搜索层次分类以获取更多信息。