如何将导出的sklearn训练树应用到测试数据

Question

from sklearn.tree import DecisionTreeRegressor, export_text

cols_X = ['f1', 'f2']
df_train = pd.DataFrame([[1, 3, 4], [2, 5, 1], [7, 8, 7]], columns=['f1', 'f2', 'label'])
df_test = pd.DataFrame([[2, 5], [3, 1]], columns=cols_X)

tree = DecisionTreeRegressor()
tree.fit(df_train[['f1', 'f2']], df_train['label'])

file = open(path + "myTree.txt", "w") 
file.write(export_text(tree, feature_names=cols_X)) 
file.write("\n") 
file.close()

input_tree = pd.read_csv(path + "myTree.txt") #not sure if should read as csv

sklearn

回归树已被训练并导出为

txt

文件。那么我如何导入它并应用到测试数据上以做出

.predict()

的预测？由于我完全不熟悉txt文件中的数据结构，甚至不确定是否应该将其读为“txt”。

Answer 1

要保存模型，您可以查看这篇文章，它使用 pickling 来执行此操作。这样就可以加载原来的拟合模型，使用

.predict()

等方法了。这种方法允许您以与预期相同的方式使用它，而无需在中间保存它。

如何将导出的sklearn训练树应用到测试数据

问题描述投票：0回答：1

1个回答

最新问题

如何将导出的sklearn训练树应用到测试数据

问题描述 投票：0回答：1

1个回答

最新问题

问题描述投票：0回答：1