pandas可以用dropna和fillna来处理缺省值的函数,前者删除缺省值的行或者列。后者fillna是填充缺省值
pandas一般是使用整型的值,叫NAN,就是not a number的缩写来表示缺失数据,所以这种缺失数据也叫做哨兵值,它可以非常方便的被检测出来
连续型特征的离散化具体的就是在数据的取值范围内,设定若干个离散的划分点,然后将这些取值范围划分为一些离散化的区间,每一个范围就是一个区间,最后用不同的符号或者整数值,去代表落在每个区间中的数据
-98的原码______ ,反码______ ,补吗______