下面对于训练集(training set)、测试集(test set)和确认集(validation set)的说法,哪一个是正确的?
A. 测试集是训练集的一部分
B. 测试集不能比训练集大
C. 测试集可用于确定模型参数
D. 确认集可以用于决策树归纳剪枝
下面哪种汇总统计不是刻画位置的特征?
A. 均值
B. 中位数
C. 标准差
D. 百分位数
以下模型性能评估的方法中,哪一种方法采用有放回的随机抽样?
A. 保持方法
B. 留一法
C. 随机二次抽样
D. 自助法
下面离散化的方法中哪种不是非监督的?
A. 等宽离散化
B. 等频离散化
C. 基于熵的离散化
D. K均值离散化