决策树是一种决策支持工具,它使用树状图或决策模型及其可能的后果,包括机会事件结果,资源成本和效用。这是显示算法的一种方法。
我正在学习如何在 R 中构建单个决策树和随机森林。我知道在构建随机森林之前需要 set.seed() 以确保结果的可重复性,例如如果是...
Pyinstaller 创建的 exe 文件无法使用 joblib 加载决策树模型
我使用以下命令创建了大型 python 脚本的 exe 文件 - pyinstaller gui_final.py --onefile --hidden-import=sklearn --hidden-import=ipaddress --hidden-import=PIL --hidden-import=
绘制 scikit-learn 树时(以虹膜数据为例),如以下代码所示: 从 sklearn.datasets 导入 load_iris 从 sklearn 导入树 虹膜 = load_iris() X, y = iris.data, iris.target...
我使用 RPart 来构建决策树。没有问题,我正在这样做。但是,我需要了解(或计算)树被分割了多少次?我的意思是,有多少规则(if-else 语句)...
使用默认参数从 X_train 集和 Y_train 标签构建决策树回归器模型。将模型命名为 dt_reg。 评估训练数据集上的模型准确性并打印其分数。
ValueError:无法将字符串转换为浮点数:'?'与 MSE 合作时
我正在使用 auto-mpg 数据集。我给出了下面数据集的链接: https://www.kaggle.com/datasets/uciml/autompg-dataset 我给出下面的代码: df = pd.read_csv('数据/auto-mpg.csv') ...
我目前正在研究一个模型来预测一个人感染冠状病毒后的死亡概率。 我正在使用带有分类变量的荷兰数据集:感染日期、致命......
有没有办法将单个LightGBM决策树(决策规则)转换为Python代码(条件语句)?
我正在尝试将单个 LightGBM 决策树(即 num_boost_round = 1 和 num_leaves = 16)转换为 Python 条件语句。有办法做到这一点吗?我在 stackoverflow 上找到了一篇关于
我使用 rpart 构建了一个带有代理分割的决策树。现在,在主题专家检查树之后,树需要一些小的手动调整(添加额外的分支)。
我正在从 R 迁移到 PySpark。我有一个创建回归树的过程,该树当前是使用 R 的 rpart 算法构建的。 在 PySpark 中配置此功能时,我看不到
一些回归器(例如 DecisionTreeRegressor)具有参数 min_impurity_decrease,但我找不到任何有关杂质含义的文档。杂质和标准一样吗...
我有一个像这样构建的 Pandas 数据框: 水果 颜色 吃过? 食用日期 苹果 红色的 是的 2024 年 3 月 14 日 苹果 绿色的 不 2024 年 3 月 14 日 苹果 黄色的 是的 香蕉 红色的 香蕉 黄色的 是的 2024 年 3 月 14 日 我很...
我想在我的DecisionTreeClassifier实现中创建predict和predict_proba方法,但它给出了错误 回溯(最近一次调用最后一次): 文件“c:\Users\Nijat\project.py”,
rpart()决策树无法生成分裂(只有一个节点(根节点)的决策树)
我正在尝试创建一个决策树来预测给定的贷款申请人是否会违约或偿还债务。 我正在使用以下数据集 图书馆(读者) 图书馆(dplyr) 库(r部分) 图书馆(
我正在开发这个项目,我想从 JSON 动态生成多维决策树。 JSON 具有嵌套的决策规则,每个规则作为节点都应该进行转换。孩子...
XGBClassifier.fit() 收到意外的关键字参数“early_stopping_rounds”
我的代码如下: 从 sklearn.model_selection 导入 train_test_split 从 xgboost 导入 XGBClassifier 将 pandas 导入为 pd RANDOM_STATE = 55 ## 您将把它传递给每个 sklearn 调用,所以我们...
当我使用 XGBoost 时,出现以下错误(XGBClassifier.fit() 获得意外的关键字参数 'early_stopping_rounds' )。我该如何解决?
我的代码如下: 从 sklearn.model_selection 导入 train_test_split 从 xgboost 导入 XGBClassifier 将 pandas 导入为 pd RANDOM_STATE = 55 ## 您将把它传递给每个 sklearn 调用,所以我们...
我有一个数据集用于训练和测试,另一个数据集作为测试集。 我已经使用训练数据集获得了最佳模型,并希望将该模型应用于测试集以制作
我正在使用多种机器学习模型进行 AQI 预测。数据为日格式,共有1850条记录。我的火车 R2 分数约为 99,测试分数约为 91。这是差距吗...
在我观看的有关回归树算法的视频结束时,我留下了一个小问题:当数据集的某些特征具有平方和值较低的阈值时