from sklearn.tree import DecisionTreeRegressor, export_text
cols_X = ['f1', 'f2']
df_train = pd.DataFrame([[1, 3, 4], [2, 5, 1], [7, 8, 7]], columns=['f1', 'f2', 'label'])
df_test = pd.DataFrame([[2, 5], [3, 1]], columns=cols_X)
tree = DecisionTreeRegressor()
tree.fit(df_train[['f1', 'f2']], df_train['label'])
file = open(path + "myTree.txt", "w")
file.write(export_text(tree, feature_names=cols_X))
file.write("\n")
file.close()
input_tree = pd.read_csv(path + "myTree.txt") #not sure if should read as csv
sklearn
回归树已被训练并导出为 txt
文件。那么我如何导入它并应用到测试数据上以做出.predict()
的预测?由于我完全不熟悉txt文件中的数据结构,甚至不确定是否应该将其读为“txt”。
要保存模型,您可以查看这篇文章,它使用 pickling 来执行此操作。这样就可以加载原来的拟合模型,使用
.predict()
等方法了。这种方法允许您以与预期相同的方式使用它,而无需在中间保存它。