彩票号码难以预测的原因在于:
A. 数据样本不够大
B. 号码的纯随机性
C. 现有模型不够复杂
D. 特征维度太高
假设某数据集的原始熵值为0.7, 已知某属性的信息增益为0.2,那么利用该属性进行划分后数据集的熵值为:
A. 0.9
B. 0.7
C. 0.5
D. 0.2
关于Bootstrap采样正确的说法是:
A. 有放回的采样
B. 无放回的采样
C. 样本大小必须与原样本相同
D. 应尽可能保证各原始数据都出现
以下哪些措施有助于提高基础分类的多样性:
A. 采用不同的训练集
B. 采用不同类型的算法
C. 采用强的基础分类器
D. 采用不同的训练参数
E. 采用不同的数据特征