load_from_arff_to_dataframe#

load_from_arff_to_dataframe(full_file_path_and_name, has_class_labels=True, return_separate_X_and_y=True, replace_missing_vals_with='NaN')[source]#

将数据从 .arff 文件加载到 Pandas DataFrame 中。

参数:

full_file_path_and_name: str: .arff 文件的完整路径和名称。
has_class_labels: bool: 若为 true，则行包含分隔字符串，类值包含分隔字符串列表；若为 false，则检查‘return_separate_X_and_y’。
return_separate_X_and_y: bool: 若为 true，则 X 和 Y 值将作为单独的 DataFrame (X) 和 numpy 数组 (y) 返回；若为 false，则不以这种方式返回。这仅与数据相关。
replace_missing_vals_with: str: 在解析之前，文本文件中缺失值应替换为何值。

返回值:

DataFrame, ndarray: 如果 return_separate_X_and_y 为 true，则返回一个元组，包含一个 DataFrame（相关时间序列）和一个 numpy 数组（相应的类值）。
DataFrame: 如果 return_separate_X_and_y 为 false，则返回一个包含所有时间序列的单个 DataFrame，以及（如果相关）一个名为“class_vals”的列，其中包含关联的类值。