如何将导出的sklearn训练树应用到测试数据

问题描述 投票:0回答:1
from sklearn.tree import DecisionTreeRegressor, export_text

cols_X = ['f1', 'f2']
df_train = pd.DataFrame([[1, 3, 4], [2, 5, 1], [7, 8, 7]], columns=['f1', 'f2', 'label'])
df_test = pd.DataFrame([[2, 5], [3, 1]], columns=cols_X)

tree = DecisionTreeRegressor()
tree.fit(df_train[['f1', 'f2']], df_train['label'])

file = open(path + "myTree.txt", "w") 
file.write(export_text(tree, feature_names=cols_X)) 
file.write("\n") 
file.close()

input_tree = pd.read_csv(path + "myTree.txt") #not sure if should read as csv

sklearn
回归树已被训练并导出为
txt
文件。那么我如何导入它并应用到测试数据上以做出
.predict()
的预测?由于我完全不熟悉txt文件中的数据结构,甚至不确定是否应该将其读为“txt”。

scikit-learn tree
1个回答
0
投票

要保存模型,您可以查看这篇文章,它使用 pickling 来执行此操作。这样就可以加载原来的拟合模型,使用

.predict()
等方法了。这种方法允许您以与预期相同的方式使用它,而无需在中间保存它。

© www.soinside.com 2019 - 2024. All rights reserved.