load_and_run_clustering_experiment#

load_and_run_clustering_experiment(problem_path, results_path, dataset, clusterer, resample_id=0, cls_name=None, overwrite=False, format='.ts', train_file=False)[source]#

运行聚类实验。

运行基本实验并将结果写入名为 testFold<resampleID>.csv 的文件，如果需要，还会写入 trainFold<resampleID>.csv。此版本根据路径从文件加载数据。聚类器始终在

参数:

problem_pathstr: 问题文件的位置，完整路径。
results_pathstr: 结果写入的位置。将创建所有必需的目录
datasetstr: 问题的名称。文件必须是 <problem_path>/<dataset>/<dataset>+ “_TRAIN”+格式，以及对应的 “_TEST” 文件。
clusterer聚类器
cls_namestr, 默认值 =None: 确定写入目录的名称。如果为 None，则设置为 type(clusterer).__name__
resample_idint, 默认值 = 0: 重新采样种子。如果设置为 0，则使用文件中的默认训练/测试分割。也用于输出文件名。
overwriteboolean, 默认值 = False: 如果为 False，则仅在结果文件尚不存在时构建结果。如果为 True，则会覆盖已有的任何内容。
format: string, 默认值 = “.ts”: 有效格式包括 “.ts”, “.arff”, “.tsv” 和 “.long”。有关格式的更多信息，请参阅 examples/loading_data.ipynb
train_file: boolean, 默认值 = False: 是否生成训练文件。如果为 True，则对训练数据执行 10 折交叉验证并保存