run_classification_experiment#

run_classification_experiment(X_train, y_train, X_test, y_test, classifier, results_path, cls_name='', dataset='', resample_id=0, train_file=False, test_file=True)[源]#

运行一个分类实验并将结果保存到文件。

运行基本实验并将结果写入名为 testFold<resampleID>.csv 的文件,如果需要,还会写入 trainFold<resampleID>.csv 文件的方法。

参数:
X_trainpd.DataFrame 或 np.array

用于训练分类器的数据。

y_trainnp.array,默认值 = None

训练数据类别标签。

X_testpd.DataFrame 或 np.array,默认值 = None

用于测试训练好的分类器的数据。

y_testnp.array,默认值 = None

测试数据类别标签。

classifierBaseClassifier

实验中使用的分类器。

results_pathstr

结果写入位置。将创建所有必需的目录。

cls_namestr,默认值=””

分类器的名称。

datasetstr,默认值=””

问题的名称。

resample_idint,默认值=0

重采样种子。如果设置为 0,则使用文件中的默认训练/测试分割。也用于输出文件名。

train_filebool,默认值=False

是否生成训练文件。如果为 true,则对训练数据执行 10 折交叉验证并保存。如果分类器可以生成自己的估计值,则使用这些估计值。

test_filebool,默认值=True:

是否生成测试文件。如果分类器可以生成自己的训练概率,则将构建分类器但不输出文件。