SingleSplit#
- class SingleSplit(test_size=0.25, train_size=None, random_state=None, shuffle=True, stratify=None)[源]#
用于编排的辅助类,使用单个拆分进行训练和测试。
sklearn.model_selection.train_test_split 的包装器
- 参数:
- *arrays具有相同长度/shape[0]的可索引序列
允许的输入包括列表、numpy 数组、scipy 稀疏矩阵或 pandas 数据框。
- test_size浮点数、整数或 None,可选(默认值 0.25)
如果为浮点数,则应在 0.0 到 1.0 之间,表示包含在测试拆分中的数据集比例。如果为整数,则表示测试样本的绝对数量。如果为 None,则该值设置为训练大小的补数。默认情况下,该值设置为 0.25。默认值将在 0.21 版本中更改。仅当未指定
train_size
时,它才会保持 0.25,否则它将补充指定的train_size
。- train_size浮点数、整数或 None,(默认值 None)
如果为浮点数,则应在 0.0 到 1.0 之间,表示包含在训练拆分中的数据集比例。如果为整数,则表示训练样本的绝对数量。如果为 None,则该值会自动设置为测试大小的补数。
- random_state整数、RandomState 实例或 None,可选(默认值 None)
如果为整数,random_state 是随机数生成器使用的种子;如果为 RandomState 实例,random_state 是随机数生成器;如果为 None,则随机数生成器是 np.random 使用的 RandomState 实例。
- shuffle布尔值,可选(默认值 True)
是否在拆分之前对数据进行洗牌。如果 shuffle=False,则 stratify 必须为 None。
- stratify类数组或 None(默认值 None)
如果不是 None,则使用此类标签对数据进行分层拆分。
方法
返回拆分数量 (1)。
split
(data[, y, groups])将数据拆分为训练数据和测试数据。