题目内容

关于数据统计与数据挖掘,以下说法正确的是( )

A. 数据挖掘就是从大量的、不完全的、有噪声的、模糊的、随机的实际应用数据中,提取隐藏在其中但又潜在有价值的信息和知识的过程
B. 数据挖掘的原始数据必须是结构化数据或半结构化数据,,不可以使用非结构化数据
C. 聚类分析与分类分析相似,都需要依赖预先定义的类,即训练集
D. 数据挖掘的算法包括K-Means算法、KNN算法、DFS算法

查看答案

搜索结果不匹配？点我反馈

更多问题

数据挖掘算法中,( )算法的关键在于“计算新增数据的特征与已有样本特征之间的相似度”,广泛应用于相似性推荐。

A. K-Means算法
B. KNN算法
C. ID3算法
D. Apriori算法

KNN算法,首先计算已知类别数据集中的点与当前点之间的 ,然后,按距离递增次序 ,选取与当前点距离最小的k个点,统计前k个点所在的类别出现的__ ,返回前k个点出现频率最高的类别作为当前点的预测分类。

分类过程实际上是对未分类数据进行属性预测的过程。( )

数据分析中的聚类分析指将数据集聚集成几个簇,使得同一个聚类中的数据集之间最大程度地相似,而不同聚类中的数据集最大程度地不同,利用分布规律从数据集中发现有用的规律。()