我有一个由100个txt文件组成的数据集,所有这些文件都包含在一个名为“Z”的文件夹中,我希望将它们转换为ARFF格式。我正在使用Weka工具。
我已经通过两种方式完成了这项工作,但在两种方式中我都得到了一个空的ARFF文件。
第一种方式:通过使用下面的weka中包含的简单CLI:
java weka.core.converters.TextDirectoryLoader -dir D:\ Z> D:\ ss.arff
第二种方式:通过尝试使用相同的上述转换器加载文件来通过GUI。
==========================注意:文件格式为“.txt”,但它们实际上包含的数字不是字符
谢谢和致以诚挚的问候,穆罕默德
我遇到了同样的问题。我使用命令执行CLI转换:java weka.core.converters.TextDirectoryLoader -dir A:\ train> A:\ train。我得到了空的.arff文件。我在.txt文件中准备了内容。我将.txt文件中的内容复制到.arff文件并保存。它对我有用。
检查github存储库
https://github.com/jeroenjanssens/data-science-at-the-command-line
并使用csv2arff
工具。
例:
< /home/knut/R/x86_64-pc-linux-gnu-library/3.1/knitr/misc/tweak_bib.csv
csv2arff
> tweak_bib.csv.arff
csv2arff
是一个非常简单的bash脚本。我建议检查存储库,因为您还应该将csv2arff
与本书/ repo随附的加载脚本data-science-at-the-command-line/tools/weka
结合使用。然后脚本加载weka.jar
。
上次我检查时,csv2arff
,或者更确切地说类core.converters.CSVLoader
与weka 3.7无法正常工作。
....
只是检查
....
好。它适用于weka 3.8。
您应该将环境变量WEKAPATH设置为包含weka.jar的目录。