是否可以使用AutoML(来自H2O)仅使用Word2Vec算法并尝试不同的参数值,以找出哪些参数设置为我的数据集提供了最准确的向量?所以我不希望AutoML将算法DeepLearning,GBM等应用于我的数据集。只有Word2Vec算法...我该怎么做?
到目前为止,我只设法使用H2O构建word2vec模型。
我想用AutoML测试Word2Vec超参数的不同设置,以评估哪些设置是最佳的......
Word2Vec算法是一种数据转换算法(将文本行转换为矩阵),而不是监督机器学习算法(这是AutoML及其内部的所有算法)。
使用Word2Vec的典型方法是将Word2Vec应用于文本数据,以便您的数据可用于训练受监督的ML算法。从这里你可以在这个转换的数据集上运行任何监督算法(GLM,随机森林,GBM等) - 或者我的建议是将转换后的数据传递给AutoML,这样它就可以找到最适合你的算法。
您需要手动尝试不同的Word2Vec设置并查看它们的效果,给出一些您希望应用于您的问题的特定监督学习算法。希望能够消除困惑。