下面的一段python程序的目的是使用主成分分析法(principal component analysis) 对iris数据集进行特征降维,以便于数据的二维平面可视化。则其中空格处应该填充的数字为? import matplotlib.pyplot as pltfrom sklearn.decomposition import PCAfrom sklearn.datasets import load_irisdata = load_iris()X = data.datay = data.targetpca = PCA(n_components= )reduced_X = pca.fit_transform(X)
查看答案
下面的一段python程序的目的是使用区间缩放法对矩阵的列数据进行量纲缩放,则两处空格应该分别填入什么? from sklearn.preprocessing import MinMaxScalerdata = [[0, 0], [0, 78], [80, 1], [100, 89]] scaler = MinMaxScaler()scaler. (data)results=scaler. (data)print (results)
A. fit, fit
B. transform, transform
C. transform, fit
D. fit, transform
下面的一段python程序的目的什么?import scipy.sparse as spfrom sklearn.preprocessing import Imputerx = sp.csc_matrix([ [1, 2], [0, 3], [7, 6]])imp = Imputer(missing_values=0, strategy='mean', verbose=0)imp.fit(x)x_test = sp.csc_matrix([ [0, 2], [6, 0], [7, 6]])
A. 样本特征矩阵的量纲的缩放
B. 缺失值补齐,将0视为缺失值
C. 样本特征矩阵的归一化
D. 多项式特征的生成
关于下面的python程序的描述错误的是?from sklearn.feature_extraction.text import CountVectorizercorpus = ['Jobs was the chairman of Apple Inc., and he was very famous','I like to use apple computer','And I also like to eat apple'] vectorizer =CountVectorizer(ngram_range=(1,2))print("N-gram mode: ",vectorizer.fit_transform(corpus).todense()) print("N-gram mode: ",vectorizer.vocabulary_)
A. 采用n-gram模式进行文档向量化
B. vocabulary_中既包括unigram,也包括bigram
CountVectorizer没有考虑到IDF,即倒排文档频率
D. vocabulary_中只包括bi-gram
为了使用主成分分析法(principal component analysis) 对iris数据集进行特征降维,以便于数据的二维平面可视化。 则下面哪一条import语句不是必须的?
A. import matplotlib.pyplot as plt
B. from sklearn.decomposition import PCA
C. from sklearn.datasets import load_iris
D. from sklearn.feature_extraction.text import CountVectorizer