load_from_arff_to_dataframe#

load_from_arff_to_dataframe(full_file_path_and_name, has_class_labels=True, return_separate_X_and_y=True, replace_missing_vals_with='NaN')[source]#

将数据从 .arff 文件加载到 Pandas DataFrame 中。

参数:
full_file_path_and_name: str

.arff 文件的完整路径和名称。

has_class_labels: bool

若为 true,则行包含分隔字符串,类值包含分隔字符串列表;若为 false,则检查‘return_separate_X_and_y’。

return_separate_X_and_y: bool

若为 true,则 X 和 Y 值将作为单独的 DataFrame (X) 和 numpy 数组 (y) 返回;若为 false,则不以这种方式返回。这仅与数据相关。

replace_missing_vals_with: str

在解析之前,文本文件中缺失值应替换为何值。

返回值:
DataFrame, ndarray

如果 return_separate_X_and_y 为 true,则返回一个元组,包含一个 DataFrame(相关时间序列)和一个 numpy 数组(相应的类值)。

DataFrame

如果 return_separate_X_and_y 为 false,则返回一个包含所有时间序列的单个 DataFrame,以及(如果相关)一个名为“class_vals”的列,其中包含关联的类值。