weka中有许多实现数据格式转换的工具,都包含在weka.core.converters包中。
其中的DataSource和DataSink最值一提。
原来我们这样写:
BufferedReader reader = new BufferedReader(new FileReader(trainsetfile));
ArffReader arff = new ArffReader(reader);
Instances dataFiltered = arff.getData();
其实可以这样写:
Instances dataFiltered=DataSource.read("dataFiltered.arff");
输出arff文件:
DataSink.write("dataWritten.arff", dataFiltered);
weka.core.converters可以实现下列文件之间的转换:
• ARFF files (ArffLoader, ArffSaver)
• C4.5 files (C45Loader, C45Saver)
• CSV files (CSVLoader, CSVSaver)
• files containing serialized instances (SerializedInstancesLoader, Serial-
izedInstancesSaver)
• JDBC databases (DatabaseLoader, DatabaseSaver)
• libsvm files (LibSVMLoader, LibSVMSaver)
• XRFF files (XRFFLoader, XRFFSaver)
• text directories for text mining (TextDirectoryLoader)
https://blog.sciencenet.cn/blog-713110-574332.html
上一篇:
使用独立测试集对分类模型进行评估下一篇:
WEKA的分类模型文件model中包含哪些内容