run_clustering_experiment#

run_clustering_experiment(trainX, clusterer, results_path, trainY=None, testX=None, testY=None, cls_name=None, dataset_name=None, resample_id=0, overwrite=True)[source]#

运行聚类实验并将结果保存到文件。

一种运行基本实验并将结果写入文件的方法,文件名为 testFold<resampleID>.csv,如果需要还有 trainFold<resampleID>.csv。此版本根据路径从文件加载数据。聚类器始终在所需的输入数据 trainX 上进行训练。输出到 trainResample<resampleID>.csv 将是 trainX 的预测聚类结果。如果 trainY 也被传入,则这些也会写入文件。如果聚类器进行概率预测,这些也会写入文件。关于输出的更多信息,请参阅 write_results_to_uea_format。请注意,此方法总是会覆盖现有结果,调用前请检查或改用 load_and_run_clustering_experiment。

参数:
trainXpd.DataFrame 或 np.array

要进行聚类的数据。

clustererBaseClusterer

聚类对象

results_pathstr

结果写入路径

trainYnp.array, 默认为 None

训练数据的真实类别标签,仅用于文件写入,聚类器忽略此参数

testXpd.DataFrame 或 np.array, 默认为 None

测试属性数据,如果存在则用于预测 testY

testYnp.array, 默认为 None

测试数据的真实类别标签,仅用于文件写入,聚类器忽略此参数

cls_namestr, 默认为 None

聚类器的名称,写入结果文件,如果为 None 则忽略

dataset_namestr, 默认为 None

数据集的名称,写入结果文件,如果为 None 则忽略

resample_idint, 默认为 0

重采样标识符,默认为 0