WEKA:如何一次使用新的观察集(批量更新)重新训练现有模型,而不是在 java 中一次使用单个实例?

问题描述 投票:0回答:2

我有 600 万大小的数据集,我考虑将 500 万作为训练数据集,100 万作为测试数据集。

我想再次将该训练集分成五到一百万个数据集。 最初我想用前一百万个数据集构建我的模型,最重要的是我想用剩余的四组训练数据重新训练我的模型。简而言之,我想以分段方式训练我的模型,而不是一次提供整个训练数据集。是否可以?如果可能的话我必须使用什么API 我怎样才能使用 weka 库做到这一点?

以下是我想在代码中使用的 API。

我将使用 buildClassifier(Instances intances) 进行初始模型构建。 那么我可以一次又一次地调用 buildClassifier() 来获取剩余的四组数据吗?是重新训练我的模型吗?或者每次用新数据集构建新模型?如果可能的话我该如何编码?

如果上述情况无法使用 buildClassifier() 实现,我想使用 updateClassifier(Instance instance) ,它一次获取一个实例,但我不想以顺序方式重新训练我的模型。我想以小批量模式重新训练(一次给出一组实例)。我如何使用 weka 做到这一点?或者是否有其他 java API 需要一组实例来更新 weka 库中的分类器?

java weka
2个回答
0
投票

buildClassifier
构建一个新的分类器,它不会更新当前的分类器。


0
投票

您对此有任何解决方案吗?我也需要做同样的事情。

© www.soinside.com 2019 - 2024. All rights reserved.