load_from_arff_to_dataframe#
- load_from_arff_to_dataframe(full_file_path_and_name, has_class_labels=True, return_separate_X_and_y=True, replace_missing_vals_with='NaN')[source]#
将数据从 .arff 文件加载到 Pandas DataFrame 中。
- 参数:
- full_file_path_and_name: str
.arff 文件的完整路径和名称。
- has_class_labels: bool
若为 true,则行包含分隔字符串,类值包含分隔字符串列表;若为 false,则检查‘return_separate_X_and_y’。
- return_separate_X_and_y: bool
若为 true,则 X 和 Y 值将作为单独的 DataFrame (X) 和 numpy 数组 (y) 返回;若为 false,则不以这种方式返回。这仅与数据相关。
- replace_missing_vals_with: str
在解析之前,文本文件中缺失值应替换为何值。
- 返回值:
- DataFrame, ndarray
如果 return_separate_X_and_y 为 true,则返回一个元组,包含一个 DataFrame(相关时间序列)和一个 numpy 数组(相应的类值)。
- DataFrame
如果 return_separate_X_and_y 为 false,则返回一个包含所有时间序列的单个 DataFrame,以及(如果相关)一个名为“class_vals”的列,其中包含关联的类值。