在基于决策树的分类方法中,三种不纯性的度量分别是Gini指标、熵和误分率。以下对它们的描述中,哪一个是错误的?
A. 对于二类问题,Gini指标和误分率的最大值相等
B. 熵的值不会超过1
C. Gini指标、熵和误分率的最小值都是0
D. 误分率的值不会超过1
下面对于训练集、检验集和确认集的说法,不正确的是?
A. 检验集可用于决策树归纳剪枝
B. 确认集和检验集不相交
C. 确认集可用于设定模型参数
D. 确认集是从训练集划分出来的
属于监督的离散化方法是?
A. 基于聚类的离散化方法
B. 基于熵的离散化方法
C. 等频离散化方法
D. 等宽离散化方法
关于特征子集选择的作用,下面说法不正确的是?
A. 提高后续算法的时间效率
B. 去除冗余特征和不相关特征
C. 使模型表示更简洁
D. 降低分类模型的训练误差