load_and_run_clustering_experiment#

load_and_run_clustering_experiment(problem_path, results_path, dataset, clusterer, resample_id=0, cls_name=None, overwrite=False, format='.ts', train_file=False)[source]#

运行聚类实验。

运行基本实验并将结果写入名为 testFold<resampleID>.csv 的文件,如果需要,还会写入 trainFold<resampleID>.csv。此版本根据路径从文件加载数据。聚类器始终在

参数:
problem_pathstr

问题文件的位置,完整路径。

results_pathstr

结果写入的位置。将创建所有必需的目录

datasetstr

问题的名称。文件必须是 <problem_path>/<dataset>/<dataset>+ “_TRAIN”+格式,以及对应的 “_TEST” 文件。

clusterer聚类器
cls_namestr, 默认值 =None

确定写入目录的名称。如果为 None,则设置为 type(clusterer).__name__

resample_idint, 默认值 = 0

重新采样种子。如果设置为 0,则使用文件中的默认训练/测试分割。也用于输出文件名。

overwriteboolean, 默认值 = False

如果为 False,则仅在结果文件尚不存在时构建结果。如果为 True,则会覆盖已有的任何内容。

format: string, 默认值 = “.ts”

有效格式包括 “.ts”, “.arff”, “.tsv” 和 “.long”。有关格式的更多信息,请参阅 examples/loading_data.ipynb

train_file: boolean, 默认值 = False

是否生成训练文件。如果为 True,则对训练数据执行 10 折交叉验证并保存