ID3算法中采用的不纯性度量是?
A. 熵
B. 信息增益
C. Gini指标
D. 误分率
在基于决策树的分类方法中,三种不纯性的度量分别是Gini指标、熵和误分率。以下对它们的描述中,哪一个是错误的?
A. 对于二类问题,Gini指标和误分率的最大值相等
B. 熵的值不会超过1
C. Gini指标、熵和误分率的最小值都是0
D. 误分率的值不会超过1
下面对于训练集、检验集和确认集的说法,不正确的是?
A. 检验集可用于决策树归纳剪枝
B. 确认集和检验集不相交
C. 确认集可用于设定模型参数
D. 确认集是从训练集划分出来的
属于监督的离散化方法是?
A. 基于聚类的离散化方法
B. 基于熵的离散化方法
C. 等频离散化方法
D. 等宽离散化方法