题目内容

机器学习(深度学习)系统中通常将数据集划分为训练集和测试集,其中被用来学习得到系统的参数取值的是

A. 训练集(training set)
B. 测试集(testing set)
C. 训练集(training set)和测试集(testing set)
D. 其它选项都不对

查看答案
更多问题

测试集(testing set)用于最终报告模型的评价结果,因此在训练阶段测试集中的数据一般是否可以出现在训练集中?

A. 不可以
B. 可以

K折交叉验证通常将数据集随机分为k个子集。下列关于K折交叉验证说法错误的是

A. 每次将其中一个子集作为测试集,剩下k-1个子集作为训练集进行训练
B. 每次将其中一个子集作为训练集,剩下k-1个子集作为测试集进行测试
C. 划分时有多种方法,例如对非平衡数据可以用分层采样,就是在每一份子集中都保持和原始数据集相同的类别比例
D. 留一法即k=1的k折交叉验证。留一法计算最繁琐,但样本利用率最高。适合于小样本的情况

已知如下定义:True positives(TP): 被正确地划分为正例的个数,即实际为正例且被分类器划分为正例的实例数(样本数);False negatives(FN):被错误地划分为负例的个数,即实际为正例但被分类器划分为负例的实例数;False positives(FP): 被错误地划分为正例的个数,即实际为负例但被分类器划分为正例的实例数;True negatives(TN): 被正确地划分为负例的个数,即实际为负例且被分类器划分为负例的实例数。 则下面定义正确的是:

A. 分类准确率 Accuracy=(TP+TN)/(P+N)
B. 精确率 Precision=TP/(TP+FP)
C. 召回率 Recall=TP/P
D. 以上都不对

F值的公式为Fβ=[(1+β2)*Precision*Recall]/(β2*Precision+Recall),即其为准确率和召回率的调和平均。如果二者(即准确率和召回率)同等重要,则为

A. F1
B. F2
C. F0.5
D. F3

答案查题题库