题目内容

C4.5算法中采用的不纯性度量是?

A. 熵
B. 信息增益
C. Gini指标
D. 误分率

查看答案
更多问题

以下模型性能评估的方法中,哪一种方法恰好对每个训练样本检验一次?

A. 保持方法
B. 留一法
C. 随机二次抽样
D. 自助法

下面对于训练集、测试集和确认集的说法,哪一个是正确的?

A. 测试集是训练集的一部分
B. 测试集不能比训练集大
C. 测试集可用于设定模型参数
D. 确认集可以用于决策树归纳剪枝

以下活动属于数据挖掘任务的是?

A. 根据性别划分公司的顾客
B. 按学号对学生数据库排序
C. 使用历史记录预测某公司未来的股票价格
D. 预测掷一对骰子的结果

下面哪种数据特征不适用于连续属性?

A. 中位数
B. 方差
C. 众数
D. 百分位数

答案查题题库