以下活动属于聚类任务的是?
A. 根据姓名对学生进行分组
B. 根据地区将电话号码分组
C. 根据半年期间每天的股票价格升降信息对股票分组
D. 根据入学总成绩对学生分等级
下面对于训练集(training set)、测试集(test set)和确认集(validation set)的说法,哪一个是正确的?
A. 测试集是训练集的一部分
B. 测试集不能比训练集大
C. 测试集可用于确定模型参数
D. 确认集可以用于决策树归纳剪枝
下面哪种汇总统计不是刻画位置的特征?
A. 均值
B. 中位数
C. 标准差
D. 百分位数
以下模型性能评估的方法中,哪一种方法采用有放回的随机抽样?
A. 保持方法
B. 留一法
C. 随机二次抽样
D. 自助法