train_split_test
- 没有交叉验证,仅对数据进行一次切分
- 参数test_size决定测试集的大小,如果test_size为0~1的值,则表示切分后的测试集的大小占数据集的比重,如果是整数,则表示切分后的测试集样本的数量
- 如果是非平衡数据,stratify参数等于标签列,可以让数据按标签划分,避免训练集和测试集在标签分布上不均匀
sklearn.model_selection.train_test_split(*arrays, test_size=None, train_size=None, random_state=None, shuffle=True, stratify=None)
sklearn.model_selection.train_split_test
cross_validate
- 可以输出与切分后的训练集和测试集有关的结果,比如时间、准确率等
sklearn.model_selection.cross_validate(estimator, X, y=None, *, groups=None, scoring=None, cv=N