load_from_tsfile#

load_from_tsfile(full_file_path_and_name, replace_missing_vals_with='NaN', return_y=True, return_data_type='nested_univ', encoding='utf-8', y_dtype='str')[source]#

将时间序列 .ts 文件加载到 X 和(可选)y 中。

从 .ts 文件加载的数据将被加载到一个嵌套的 pd.DataFrame 中,或者如果需要,可以选择加载到一个 2d np.ndarray(等长、单变量问题)或 3d np.ndarray(等长、多变量问题)中。如果存在,y 将被加载到一个 1d np.ndarray 中。

参数:
full_file_path_and_namestr

.ts 文件的完整路径名和文件名,用于读取。

replace_missing_vals_withstr, 默认 NaN

在解析之前,文本文件中的缺失值应被替换成的值。

return_y布尔值, 默认 True

是否返回 y 变量(如果存在)。

return_data_typestr, 可选, 默认 = “nested_univ”

返回 X 的内存数据格式规范。str 可以是任何其他支持的 Panel mtype

mtype 列表请参阅 datatypes.SCITYPE_REGISTER 获取规范,示例请参阅 examples/AA_datatypes_and_datasets.ipynb

常用的规范

“nested_univ: 嵌套 pd.DataFrame,单元格中为 pd.Series “numpy3D”/”numpy3d”/”np3D”: 3D np.ndarray (实例, 变量, 时间索引) “numpy2d”/”np2d”/”numpyflat”: 2D np.ndarray (实例, 时间索引) “pd-multiindex”: 带有 2 级 (实例, 时间) MultiIndex 的 pd.DataFrame

如果数据无法存储在请求的类型中,则会引发异常。

encoding: str

encoding 是使用 open 函数读取文件时使用的编码名称。

y_dtypestr, 可选, 默认 ‘float’

在返回之前将 y 强制转换为此 dtype,接受的参数是 ‘str’、‘int’ 和 ‘float’。

返回值:
Xsktime 兼容的 mtype return_data_type 内存容器

mtype 列表请参阅 datatypes.SCITYPE_REGISTER 获取规范,示例请参阅 examples/AA_datatypes_and_datasets.ipynb

y仅在 return_y=True 时返回, np.ndarray
引发:
如果请求的文件不存在,则引发 IOError
如果输入序列尺寸不完全相同(不支持),则引发 IOError
如果请求了类别标签但在文件中不存在,则引发 IOError
如果输入文件中没有实例,则引发 IOError
如果 return_data_type = numpy3d 但数据是不等长序列,则引发 ValueError
如果 return_data_type = numpy2d 但数据是多变量和/或
不等长序列,则引发 ValueError