关于下面的python程序的描述错误的是?from sklearn.feature_extraction.text import CountVectorizercorpus = ['Jobs was the chairman of Apple Inc., and he was very famous','I like to use apple computer','And I also like to eat apple'] vectorizer =CountVectorizer(ngram_range=(1,2))print("N-gram mode: ",vectorizer.fit_transform(corpus).todense()) print("N-gram mode: ",vectorizer.vocabulary_)
A. 采用n-gram模式进行文档向量化
B. vocabulary_中既包括unigram,也包括bigram
CountVectorizer没有考虑到IDF,即倒排文档频率
D. vocabulary_中只包括bi-gram
查看答案
为了使用主成分分析法(principal component analysis) 对iris数据集进行特征降维,以便于数据的二维平面可视化。 则下面哪一条import语句不是必须的?
A. import matplotlib.pyplot as plt
B. from sklearn.decomposition import PCA
C. from sklearn.datasets import load_iris
D. from sklearn.feature_extraction.text import CountVectorizer
下面哪一条语句是用于导入nltk中的英文词性标注的模块?
A. from nltk import word_tokenize
B. from nltk.stem import PorterStemmer
C. from nltk import pos_tag
D. from nltk.corpus import treebank
下列哪些是常见的非线性回归模型?
A. 2次以上的多项式
B. 双曲线模型
C. 幂函数模型
D. 指数函数模型
下面的一段python程序,其目的是显示下面的哪一种函数的图形? import numpy as npimport matplotlib.pyplot as pltplt.figure()plt.axis([-6, 6, 0, 1])plt.grid(True)X = np.arange(-6,6,0.1)y = 1 / (1 + np.e ** (-X))plt.plot(X, y, 'b-')plt.show()
A. tanh
B. ELU
C. sigmoid
D. ReLU