run_clustering_experiment#
- run_clustering_experiment(trainX, clusterer, results_path, trainY=None, testX=None, testY=None, cls_name=None, dataset_name=None, resample_id=0, overwrite=True)[source]#
运行聚类实验并将结果保存到文件。
一种运行基本实验并将结果写入文件的方法,文件名为 testFold<resampleID>.csv,如果需要还有 trainFold<resampleID>.csv。此版本根据路径从文件加载数据。聚类器始终在所需的输入数据 trainX 上进行训练。输出到 trainResample<resampleID>.csv 将是 trainX 的预测聚类结果。如果 trainY 也被传入,则这些也会写入文件。如果聚类器进行概率预测,这些也会写入文件。关于输出的更多信息,请参阅 write_results_to_uea_format。请注意,此方法总是会覆盖现有结果,调用前请检查或改用 load_and_run_clustering_experiment。
- 参数:
- trainXpd.DataFrame 或 np.array
要进行聚类的数据。
- clustererBaseClusterer
聚类对象
- results_pathstr
结果写入路径
- trainYnp.array, 默认为 None
训练数据的真实类别标签,仅用于文件写入,聚类器忽略此参数
- testXpd.DataFrame 或 np.array, 默认为 None
测试属性数据,如果存在则用于预测 testY
- testYnp.array, 默认为 None
测试数据的真实类别标签,仅用于文件写入,聚类器忽略此参数
- cls_namestr, 默认为 None
聚类器的名称,写入结果文件,如果为 None 则忽略
- dataset_namestr, 默认为 None
数据集的名称,写入结果文件,如果为 None 则忽略
- resample_idint, 默认为 0
重采样标识符,默认为 0