K折交叉验证通常将数据集随机分为k个子集。下列关于K折交叉验证说法错误的是
A. 每次将其中一个子集作为测试集,剩下k-1个子集作为训练集进行训练
B. 每次将其中一个子集作为训练集,剩下k-1个子集作为测试集进行测试
C. 划分时有多种方法,例如对非平衡数据可以用分层采样,就是在每一份子集中都保持和原始数据集相同的类别比例
D. 留一法即k=1的k折交叉验证。留一法计算最繁琐,但样本利用率最高。适合于小样本的情况
查看答案
已知如下定义:True positives(TP): 被正确地划分为正例的个数,即实际为正例且被分类器划分为正例的实例数(样本数);False negatives(FN):被错误地划分为负例的个数,即实际为正例但被分类器划分为负例的实例数;False positives(FP): 被错误地划分为正例的个数,即实际为负例但被分类器划分为正例的实例数;True negatives(TN): 被正确地划分为负例的个数,即实际为负例且被分类器划分为负例的实例数。 则下面定义正确的是:
A. 分类准确率 Accuracy=(TP+TN)/(P+N)
B. 精确率 Precision=TP/(TP+FP)
C. 召回率 Recall=TP/P
D. 以上都不对
F值的公式为Fβ=[(1+β2)*Precision*Recall]/(β2*Precision+Recall),即其为准确率和召回率的调和平均。如果二者(即准确率和召回率)同等重要,则为
A. F1
B. F2
C. F0.5
D. F3
ROC (受试者工作特征曲线, receiver operating characteristic curve)描绘了分类器在 fp rate (错误的正例,横轴) 和tp rate(真正正例,纵轴) 间的trade-off(权衡)。下面说法正确的是:
A. (纵轴)敏感性高=漏诊率低, 而(横轴)特异性低=误诊率高
B. (纵轴)敏感性高=漏诊率高, 而(横轴)特异性低=误诊率高
C. (纵轴)敏感性高=漏诊率高, 而(横轴)特异性低=误诊率低
D. (纵轴)敏感性高=漏诊率低, 而(横轴)特异性低=误诊率低
关于ROC (受试者工作特征曲线, receiver operating characteristic curve)中AUC(Area Under Curve)说法正确的是
A. 定义为ROC曲线下的面积
B. AUC值提供了分类器的一个整体数值。通常AUC越大,分类器更好
C. 取值范围为[0,1]
D. 其它都不对