题目内容

Corr可以采用的方法有两种:pearson、kendall。pearson叫皮尔森相关性系数,kendall叫肯德尔相关性系数

查看答案
更多问题

关于特征重复值的处理,针对数值型,可以利用corr计算特征间的相似度,将两个相似度为一的特征会去除一个;二针对类别型,使用DataFrame.equals的方法进行特征去重

重复数据分成两种记录重复和特征重复两种,其中后者是指对列而言,多个特征虽然名称不一样,但是其的数据完全相同,这种情况就属于特征重复

不属于数据转换的方法是

A. 利用函数或映射
B. 计算哑变量来处理类别型的数据转换。
C. 离散化
D. 回归法

Python中,不属于异常值的处理方式的是

A. 直接把含有异常的记录给删掉。
B. 将异常值变成缺省值,按照缺省值的处理方法来处理
C. 推理法
D.把异常值都用某个值,如平均值来进行修正

答案查题题库