我有一个 CSV 文件,其中包含大约 10,000 个条目。 CSV 文件包含有关在特定酒店预订假期的个人的数据。 CSV 文件包含以下列
1:country_origin(作为名义变量) 2:month_booking(作为名义变量) 3:is_cancelled(作为二进制变量)
我正在尝试使用 WEKA 来确定哪些国家/地区与取消频率最高相关。
我不太确定如何去做这件事 - 我考虑使用树(J48)分类器,但我不太明白结果意味着什么,所以我无法解释它们是否正确。
这就是我所做的
然后我得到了如下所示的输出(非详尽)。这是什么意思?
Weka wiki 解释了 J48 输出: