我无法在weka中打开这个数据集文件 https://www.kaggle.com/datasets/parisrohan/credit-score-classification?resource=download 因为我收到此错误:索引 28 超出长度 28 的范围 在线遇到问题:378
尝试使用数据集文件和weka转换器的清理版本,但它不起作用
Weka 的 CSVLoader 不喜欢连续的双引号。其他电子表格应用程序(例如 LibreOffice Calc 或 MS Excel)会在单元格内加双引号以转义它们(请参阅RFC4180,第 2.6 节)。
使其与 Weka 配合使用的最快方法是手动将这些双引号 (
""
) 替换为单引号 ('
):
"""
替换为 "'
**""
替换为 '
** 理论上,您需要区分单元格开头 (
,"""
-> ,"'
) 和结尾 (""",
-> '",
) 的三引号。但单元格末尾似乎没有任何三引号,因此上述方法可以工作。
我有同样的问题,但是当我手动检查CSV文件时没有“”