下面是小编为大家整理的Python数据分析与应用题库,供大家参考。
Python数据分析与应用题库
下列nltk模块中,可以对句子实现分词操作的是()。 [单选题] *
A、nltk.corpus
B、nltk.tokenize(正确答案)
C、nltk.stem
D、nltk.tag
答案解析:暂无解析
下列函数中,用于打开NLTK下载器的是()。 [单选题] *
A、download()(正确答案)
B、load()
C、open()
D、install()
答案解析:暂无解析
下列选项中,NLTK用来标记形容词的是()。 [单选题] *
A、JJ(正确答案)
B、RB
C、CC
D、DT
答案解析:暂无解析
关于词性归一化的说法中,下列描述正确的是()。 [单选题] * A、词干提取和词形还原最终都会得到词根
B、词干提取能够捕捉基于词根的规范单词形式
C、词形还原需要删除不影响词性的词缀得到词干
D、词形还原能够捕捉基于词根的规范单词形式(正确答案)
答案解析:暂无解析
下列选项中,用于控制jieba.cut()分词模式的是()。 [单选题] *
A、data
B、HMM
C、is_all
D、cut_all(正确答案)
答案解析:jieba.cut()函数共接收三个参数,其中第一个为需要分词的字符串,cut_all参数用来控制是否采用全模式,HMM 参数用来控制是否使用 HMM 模型。
下列方法中,用于返回出现相对较频繁的单词的是()。 [单选题] *
A、word_tokenize()
B、pos_tag()
C、most_common()(正确答案)
D、cosine_distance()
答案解析:word_tokenize()函数基于空格或标点对文本进行分词;pos_tag()函数用于给单词标注词性;cosine_distance()函数用于求两个向量的夹角余弦值。
下列选项中,用于标注词语词性的模块是()。 [单选题] *
A、nltk.corpus
B、nltk.tokenize
C、nltk.stem
D、nltk.tag(正确答案)
答案解析:暂无解析
下列分词模式中,可以将句子中所有成词词语都扫描出来的是()。 [单选题] *
A、精确模式
B、全模式(正确答案)
C、搜索引擎模式
D、模糊搜索模式
答案解析:暂无解析
如果希望还原单词的基本形式,则需要使用import语句导入哪个模块?() [单选题] *
A、nltk.corpus
B、nltk.tokenize
C、nltk.stem(正确答案)
D、nltk.tag
答案解析:暂无解析
关于文本预处理的过程,下列描述错误的是()。 [单选题] *
A、文本分词是预处理过程中必不可少的一个操作
B、词干提取是一个很粗略的去除单词两端词缀的过程
C、词形还原是一个去除曲折的词缀且返回词典中包含的词的过程
D、文本中的每个单词都能够表明文本的特征(正确答案)
答案解析:文本中包含一些停用词,这些词是无法表明文本特征的。
通过date_range()函数创建DatetimeIndex对象时,如果只是传入了开始日期,则还需要用()参数指定产生多少个时间戳。 [单选题] *
A、freq
B、end
C、periods(正确答案)
D、start
答案解析:暂无解析
请阅读下面一段程序: [单选题] *
运行上述程序,它最终输出的结果为(A)。(正确答案)
A、2015
B、2014
C、2013
D、2012
答案解析:暂无解析
下列方法中,能够转换时期频率的是()。 [单选题] *
A、shift()
B、rolling()
C、asfreq()(正确答案)
D、resample()
答案解析:shift()方法用于沿着时间轴方向将数据进行前移或后移;rolling()方法用于滑动窗口;resample()是一个对常规时间序列数据重新采样和频率转换的便捷的方法。
下列方法中,用来创建一个滑动窗口的是()。 [单选题] *
A、shift()
B、rolling()(正确答案)
C、asfreq()
D、resample()
答案解析:暂无解析
请阅读下面一段程序:运行程序,它最终执行的结果为()。 [单选题] *
A、4
B、3(正确答案)
C、2
D、1
答案解析:暂无解析
创建一个DatetimeIndex对象的代码如下:pd.date_range("2018/08/10", "2018/08/15") [单选题] *
默认情况下,该对象中时间戳的频率为(B)。(正确答案)
A、H
B、D
C、S
D、T
答案解析:暂无解析
下列选项中,用来表示时间序列中的频率为每周六的是(), [单选题] *
A、WOM-2MON
B、W-FRI
C、W-SUN
D、W-SAT(正确答案)
答案解析:暂无解析
下列选项中,用来表示Pandas中的时期的是()。 [单选题] *
A、Period(正确答案)
B、Timestamp
C、Interval
D、Series
答案解析:暂无解析
通过date_range()函数创建DatetimeIndex对象时,可以设置哪个参数指定终止日期?() [单选题] *
A、freq
B、periods
C、end(正确答案)
D、start
答案解析:在date_range()函数中,freq参数用来指定计时单位;periods参数表示产生多少个时间戳索引值;end表示终止日期;start表示起始日期。
创建DatetimeIndex对象的代码如下:pd.date_range(start="2018/2/1", end="2018/2/28", freq=________)如果希望生成的时间戳为每周日,则下列选项中可以填写到横线处的是()。 [单选题] *
A、WOM-2MON
B、W-FRI
C、W-SUN(正确答案)
D、W-SAT
答案解析:暂无解析
通过date_range()函数创建DatetimeIndex对象时,可以设置哪个参数来改变计时单位?() [单选题] *
A、freq(正确答案)
B、periods
C、end
D、start
答案解析:在date_range()函数中,freq参数用来指定计时单位;periods参数表示产生多少个时间戳索引值;end表示终止日期;start表示起始日期。
请阅读下面一段程序:运行上述程序,它最终执行的结果为()。 [单选题] *
A、Timestamp("2018-11-08 00:00:00")(正确答案)
B、Timestamp("2018-10-08 00:00:00")
C、Timestamp("2018-11-08")
D、Timestamp("2018-10-08")
答案解析:DatetimeIndex对象是由一组时间戳构成的索引,它里面的每个标量值都是一个Timestamp对象。
当使用resample()方法重新采样时,下列哪个参数可以确定采样的闭合区间?()[单选题] *
A、label
B、fill_method
C、how
D、closed(正确答案)
答案解析:暂无解析
关于降采样的说法中,下列描述错误的是()。 [单选题] *
A、降采样是将高频率数据聚合到低频率数据
B、降采样的时间颗粒会变大
C、降采样的数据量是增加的(正确答案)
D、降采样就相当于另外一种形式的分组聚合操作
答案解析:暂无解析
下列方法中,能够对常规时间序列数据重新采样的是()。 [单选题] *
A、shift()
B、rolling()
C、asfreq()
D、resample()(正确答案)
答案解析:暂无解析
通过date_range()函数创建DatetimeIndex对象时,可以设置哪个参数指定产生多少个时间戳索引值?() [单选题] *
A、freq
B、periods(正确答案)
C、end
D、start
答案解析:在date_range()函数中,freq参数用来指定计时单位;periods参数表示产生多少个时间戳索引值;end表示终止日期;start表示起始日期。
通过date_range()函数创建DatetimeIndex对象时,可以设置()参数来规范时间戳。 [单选题] *
A、normalize(正确答案)
B、periods
C、end
D、freq
答案解析:在date_range()函数中,(6) normalize参数用来规范时间戳;periods参数表示产生多少个时间戳索引值;end表示终止日期;start表示起始日期。
通过date_range()函数创建DatetimeIndex对象时,可以设置哪个参数指定起始日期?() [单选题] *
A、freq
B、periods
C、end
D、start(正确答案)
答案解析:在date_range()函数中,freq参数用来指定计时单位;periods参数表示产生多少个时间戳索引值;end表示终止日期;start表示起始日期。
关于时间序列的移动,下列说法错误的是()。 [单选题] *
A、移动是指沿着时间轴方向将数据进行前移或后移
B、时间序列移动后,索引也会发生变化(正确答案)
C、数据移动后会出现边界情况
D、无论时间序列的数据怎么移动,索引是不会发生任何变化的
答案解析:暂无解析
请阅读下面一段程序:运行上述程序,它最终输出的结果为()。 [单选题] *
A、17
B、-17(正确答案)
C、-18
D、18
答案解析:暂无解析
下列图表中,能够识别异常值的是()。 [单选题] *
A、箱形图(正确答案)
B、折线图
C、饼图
D、散点图
答案解析:暂无解析
下列选项中,用于绘制单变量分布的函数是()。 [单选题] *
A、displot()(正确答案)
B、.joinplot()
C、.pairplot()
D、.boxplot()
答案解析:暂无解析
下列关于Bokeh库描述不正确的是()。 [单选题] *
A、针对浏览器使用的交互式可视化库
B、.提供优雅、简洁的通用图形构建
C、.不适用于大量的数据集(正确答案)
D、.能够快速地、轻松地创建交互图
答案解析:暂无解析
下列关于常见图表说法正确的是()。 [单选题] *
A、散点图不能在子图中绘制
B、.散点的x轴刻度必须为数值
C、.折线图可以用作查看特征间的趋势关系(正确答案)
D、.箱形图可以用来查看特征间的相关关系
答案解析:暂无解析
下列选项中,用于绘制双变量分布的函数是() [单选题] *
A、displot()
B、.joinplot()(正确答案)
C、.pairplot()
D、.boxplot()
答案解析:暂无解析
下列代码中,绘制散点图的是()。 [单选题] *
A、plt.scatter(x,y)(正确答案)
B、.plt.plot(x,y)
C、.plt.legend("upper left")
D、.plt.xlabel("散点图")
答案解析:暂无解析
下列函数中,可以设置当前图形x轴范围的是()。 [单选题] *
A、xlabel()
B、xlim()(正确答案)
C、title()
D、legend()
答案解析:暂无解析
下列选项中不属于Seaborn中分类数据可视化库的是()。 [单选题] *
A、分类数据散点图
B、.分类数据的分布图
C、.分类数据的统计估算图
D、.分类数据的直方图(正确答案)
答案解析:暂无解析
下列函数中,可以为图表设置标题的是()。 [单选题] *
A、xlim()
B、xlabel()
C、title()(正确答案)
D、legend()
答案解析:暂无解析
下列函数中,可以为图表设置图例的是()。 [单选题] *
A、legend()(正确答案)
B、xlabel()
C、title()
D、xlim()
答案解析:暂无解析
在创建Figure对象时,可以指定哪个参数来给画布添加背景颜色?() [单选题] *
A、num
B、dpi
C、figsize
D、facecolor(正确答案)
答案解析:暂无解析
下列选项中,可以一次性创建多个子图的是()。 [单选题] *
A、figure()(正确答案)
B、subplot()
C、add_subplot()
D、subplots()
答案解析:暂无解析
下列pyplot模块的函数中,可以绘制散点图的是()。 [单选题] *
A、bar()
B、hist()
C、pie()
D、scatter()(正确答案)
答案解析:暂无解析
下列图表中,可以清晰地反映出各数据系列的百分比情况的是()。 [单选题] *
A、直方图
B、折线图
C、饼图(正确答案)
D、散点图
答案解析:饼图可以显示一个数据序列(图表中绘制的相关数据点)中各项的大小与各项总和的比例,每个数据序列具有唯一的颜色或图形,并且与图例中的颜色是相对应的。
下列图表中,适用于比较跨类别数据的是()。 [单选题] *
A、直方图
B、折线图
C、饼图
D、散点图(正确答案)
答案解析:暂无解析
下列pyplot模块的函数中,可以绘制直方图的是()。 [单选题] *
A、bar()
B、hist()(正确答案)
C、pie()
D、scatter()
答案解析:暂无解析
下列参数中,调整后显示中文的是()。 [单选题] *
A、lines.kinestyle
B、.lines.linewidth
C、.font.sans-serif(正确答案)
D、.axes.unicode_minus
答案解析:暂无解析
下列pyplot模块的函数中,可以绘制饼图的是()。 [单选题] *
A、bar()
B、hist()
C、pie()(正确答案)
D、scatter()
答案解析:暂无解析
关于Matplotlib的说法中,下列描述正确的是()。 [单选题] *
A、Matplotlib是一个Python 3D绘图库
B、它使用简单,仅用几行代码就能生成各种图表(正确答案)
C、仅仅适用于IPython平台
D、只能输出PNG或PDF格式
答案解析:Matplotlib是一个Python 2D绘图库,作图风格接近MATLAB,它已经成为Python中公认的数据可视化工具,适用于各种平台上。
在创建Figure对象时,可以指定哪个参数来设置画布的尺寸?() [单选题] *
A、num
B、dpi
C、figsize(正确答案)
D、facecolor
答案解析:暂无解析
关于分组聚合过程的说法中,下列描述不正确的是()。 [单选题] *
A、拆分是指将数据集按照一些标准拆分为若干个组
B、应用是指将某个函数或方法应用到每个分组
C、合并是指将产生的新值整合到结果对象中
D、只能对纵轴方向上的数据进行分组(正确答案)
答案解析:拆分操作是在指定轴上进行的,既可以对横轴方向上的数据进行分组,也可以对纵轴方向上的数据进行分组。
关于agg()方法的使用中,下列描述错误的是()。 [单选题] *
A、 agg()方法中func参数只能传入一个函数(正确答案)
B、. agg()方法中func参数可以传入多个函数
C、. agg()方法中func参数可以传入自定义函数
D、. agg()方法不能对产生的标量值进行广播
答案解析:暂无解析
下列关于groupby()方法的说法中,描述正确的是()。 [单选题] *
A、用于将数据集实现分组与聚合操作
B、调用groupby()方法返回一个DataFrameBy对象
C、调用groupby()方法返回一个GroupBy对象(正确答案)
D、groupby()方法只能将数据集按照纵轴方向进行分组
答案解析:在Pandas中,可以通过groupby()方法将数据集按照某些标准划分成若干个组。通过groupby()方法执行分组操作,会返回一个GroupBy对象,该对象实际上并没有进行任何计算,只是包含一些关于分组键的中间数据而已。
关于agg()方法的用法中,下列描述错误的是()。 [单选题] *
A、可以对每列数据应用同一个函数
B、.可以对一列数据应用不同的函数
C、.每列的数据只能使用相同的函数(正确答案)
D、.可以对不同的列使用不同的函数
答案解析:暂无解析
下列选项中,不属于groupby()方法分组方式的是()。 [单选题] *
A、列表或数组
B、DataFrame中某列的名称
C、字典或Series
D、集合(正确答案)
答案解析:暂无解析
关于transform()方法的说法中,下列描述错误的是()。 [单选题] *
A、transform()方法可以使用广播
B、.使用transform()方法可以返回一个与分组大小相等的数组
C、.transform()方法只能使用内置方法对数据进行转换操作(正确答案)
D、.transform()方法对DataFrame和Series都适用
答案解析:暂无解析
请阅读下面一段程序:
执行上述程序后,最终输出的结果为()。 [单选题] *
A、 A B0 3 21 3 22 3 2
B、. A B0 2 31 2 32 2 3
C、. A B0 3 41 3 42 3 4
D、. A B0 4 31 4 32 4 3(正确答案)
答案解析:暂无解析
关于apply()方法的功能,下列选项中说法正确的是()。 [单选题] *
A、apply()方法是对DataFrame(正确答案)
B、.apply()方法能够实现所有agg方法的功能
C、.apply()方法和map方法都能够进聚合操作
D、.apply()方法只能够对行列进行操作
答案解析:暂无解析
关于groupby()方法的返回值,下列说法错误的是()。 [单选题] *
A、groupby()方法返回的是一个GroupBy对象
B、返回的GroupBy对象采用的是惰性计算
C、使用for循环可以遍历该对象中的分组信息
D、groupby()方法没有返回值(正确答案)
答案解析:暂无解析
关于apply()方法的说法中,下列描述正确的是()。 [单选题] *
A、apply()方法是对DataFrame(正确答案)
B、apply()方法能够实现所有agg方法的功能
C、apply()方法和map方法都能够进聚合操作
D、apply()方法只能够对行列进行操作
答案解析:暂无解析
请阅读下面一段程序:
执行上述程序后,最终输出的结果为()。 [单选题] *
A、程序出现异常
B、. data2key1 A 4.0B 7.0(正确答案)
C、. data1 data2key1 A 3.0 4.0B 6.5 7.0
D、. data1 data2key1 B 6.5 7.0
答案解析:暂无解析
下列选项中,用于删除缺失值的方法是()。 [单选题] *
A、isnull()
B、delete()
C、dropna()(正确答案)
D、fillna()
答案解析:isnull方法用于检测,当返回结果中有True时,表示有重复的数据;fillna方法用于填充缺失数据。
关于预处理的说法中,下列选项中描述不正确是()。 [单选题] *
A、 concat()函数可以沿着一条轴将多个对象进行堆叠
B、 merge()函数可以根据一个或多个键将不同的DataFrame进行合并
C、可以使用rename()方法对索引进行重命名操作
D、 unstack()方法可以将列索引旋转为行索引(正确答案)
答案解析:unstack()方法可以将行索引旋转为列索引。
下列选项中,关于fillna()方法描述正确的是()。 [单选题] *
A、fillna()方法只能填充替换值为NaN的数据
B、只支持前向填充方式
C、默认可支持填充的最大数量为1
D、fillna()方法可以填充替换值为NaN和None的数据(正确答案)
答案解析:暂无解析
关于数据重塑的说法中,下列选项描述错误的是()。 [单选题] *
A、数据重塑可以将DataFrame转换为Series
B、stack()方法可以将列索引转换为行索引
C、对一个DataFrame使用stack()方法后返回的一定是一个Series(正确答案)
D、.unstack()方法可以将行索引转换为列索引
答案解析:当一个DataFrame具有层次索引时,使用stack()方法会返回一个DataFrame对象。
请阅读下面的程序:执行上述程序后,最终输出的结果为()。 [单选题] *
A、0 False1 False2 True(正确答案)
B、.0 True1 True2 False
C、.0 False1 False2 False
D、.0 True1 True2 True
答案解析:暂无解析
下列选项中,关于drop_duplicates()方法描述错误的是()。 [单选题] *
A、仅支持单一特征数据的去重(正确答案)
B、.仅对Series和DataFrame对象有效
C、数据去重时默认保留第一个数据
D、该方法不会改变原始数据排列
答案解析:暂无解析
关于异常值的说法,下列选项中描述错误的是()。 [单选题] *
A、异常值是指样本中明显偏离其余观测值的个别值(正确答案)
B、可以使用3σ原则检测异常值
C、可以使用Pandas中的箱线图检测异常值
D、异常值可以使用其它的值来替换
答案解析:异常数据并不一定是数据错误,所以会根据实际情况下选择删除或保留。
下列选项中,关于dropna()方法描述正确的是()。 [单选题] *
A、dropna()方法只会删除值为NaN的数据
B、dropna()方法不会删除值为None的数据
C、dropna()方法会删除值为None和NaN的数据(正确答案)
D、dropna()方法只会检测缺失数据和空值
答案解析:dropna()默认删除None或NaN,但是可以指定参数,对轴进行删除。
关于哑变量的说法中,下列选项描述错误的是()。 [单选题] *
A、哑变量是人为虚设的变量
B、哑变量在转换成指标矩阵后,其值通常为0或1
C、Pnadas中get_dummies()函数可以对类别进行哑变量处理
D、哑变量的使用没有实际意义(正确答案)
答案解析:暂无解析
下列关于数据预处理的说法中,描述不正确的是()。 [单选题] *
A、数据清洗的目的是为了提高数据质量
B、异常值不一定要删除
C、通过drop_duplicates()方法可以删除重复数据
D、 concat()函数可以根据一个或多个键将不同的DataFrame进行合并(正确答案)答案解析:concat()函数可以沿着一条轴将多个对象进行堆叠。
下列选项中,关于duplicated()方法描述正确的是()。 [单选题] *
A、duplicate()方法用于删除重复值
B、duplicate()方法用于标记重复值(正确答案)
C、duplicate()方法会改变原始数据
D、duplicate()方法会将重复的数据标记为False
答案解析:暂无解析
关于Series结构,下列描述正确的是()。 [单选题] *
A、Series是一个类似于二维数组的对象
B、Series由一组数据和与之相关的索引两部分构成(正确答案)
C、Series只能保存整数和字符串类型的数据
D、Series的索引默认是从1开始
答案解析:暂无解析
Pandas在执行算术运算时,没有对齐的位置会使用()进行补齐。 [单选题] *
A、Null
B、0(正确答案)
C、NaN
D、null_values
答案解析:暂无解析
下列关于Pandas库的说法中正确的是()。 [单选题] *
A、Pandas中只有两种数据结构
B、Pandas不支持读取文本数据
C、Pandas是在NumPy基础上建立的新程序库(正确答案)
D、.Pandas中Series和DataFrame可以解决数据分析中一切的问题
答案解析:除了书中介绍的两种常见数据结构,Pandas中还有另一种数据结构Panel
在进行算术运算时,如果希望一次性输出多个统计指标可以使用()方法。 [单选题] *
A、statistics()
B、describe()(正确答案)
C、all()
D、results()
答案解析:暂无解析
下列方法中,可以将元组转换为MultiIndex对象的是()。 [单选题] *
A、from_tuples()(正确答案)
B、.from_arrays()
C、.from_product()
D、.from_list()
答案解析:from_tuples()是将元组列表转换为MultiIndex对象;from_arrays()是将数组列表转换为MultiIndex对象;from_product()是从多个集合笛卡尔积中创建一个MultiIndex对象
请阅读下面一段程序: 执行上述程序后,最终输出的结果为()。 [单选题] *
A、 0 1 2 30 4 -1 -3 01 2 6 -1 -72 8 6 -5 1
B、. 0 1 2 30 4 -1 -3 01 2 6 -1 -72 8 6 -5 1(正确答案)
C、. 0 1 2 32 8 6 -5 11 2 6 -1 -70 4 -1 -3 0
D、. 3 2 1 00 0 -3 -1 41 -7 -1 6 22 1 -5 6 8
答案解析:暂无解析
关于Pandas中数据排序,下列说法正确的是()。 [单选题] *
A、即可以按照行索引排序,也可以按照列索引排序(正确答案)
B、.sort_index()方法表示按照值进行排序
C、.sort_values()方法表示按照索引进行排序
D、默认情况下,sort_index()方法按照降序排列
答案解析:暂无解析
关于Pandas层次化索引,下列说法错误的是()。 [单选题] *
A、层次化索引是指Pandas对象在一个轴方向上具有多层索引
B、层次化索引至多只能有两层索引(正确答案)
C、可以使用swaplevel()方法对层次化索引的位置交换顺序
D、使用sort_index()可以对索引进行排序
答案解析:Pandas层次化索引没有具体的层数限制
请阅读下面一段程序:执行上述程序后,最终输出的结果为()。 [单选题] *
A、a 3.0d 2.0c 1.0b NaN
B、.a 3.0b NaNc 1.0d 2.0(正确答案)
C、.程序出现异常
D、.c 1d 2a 3
答案解析:暂无解析
下列关于DataFrame说法正确的是()。 [单选题] *
A、DataFrame结构是由索引和数据组成(正确答案)
B、DataFrame的行索引位于最右侧
C、创建一个DataFrame对象时需要指定索引
D、DataFrame每列的数据类型必须是相同的
答案解析:暂无解析
请阅读下面一段程序执行上述程序后,最终输出的结果是()。 [单选题] *
A、5 13 20 34 42 5
B、.0 32 53 24 45 1(正确答案)
C、.5 14 43 22 50 3
D、.2 54 40 33 25 1
答案解析:暂无解析
下列选项中,不属于ndarray对象属性的是()。 [单选题] *
A、shape
B、.dtype
C、.ndim
D、.map(正确答案)
答案解析:暂无解析
请看如下代码:对代码中的NumPy数组执行sort()方法结果正确的是()。 [单选题] *
A、[[2 6 7] [2 3 6]](正确答案)
B、.[[2 6 7] [6 3 2]]
C、.[[7 6 2] [6 3 2]]
D、.[[7 6 2] [2 3 6]]
答案解析:暂无解析
下列关于ndarray对象描述正确的是()。 [单选题] *
A、ndarray对象中可以存储不同类型的元素
B、.ndarray对象中存储元素的类型必须是相同的(正确答案)
C、. ndarray对象不支持广播操作
D、.ndarray对象不具备矢量运算能力
答案解析:根据ndarry的特点可知,该对象中元素的类型必须是相同的
下列选项中,用来表示矢量化三元表达式的是()。 [单选题] *
A、where()(正确答案)
B、.cumsum()
C、.sort()
D、.unique()
答案解析:暂无解析
请阅读下列一段示例程序:运行上述程序,那么最终输出的结果为()。 [单选题] *
A、(3, 2)(正确答案)
B、.(2, 3)
C、.(3, 0)
D、.(2, 0)
答案解析:暂无解析
在NumPy通用函数中,用于计算元素级最大值的函数是()。 [单选题] *
A、max
B、.maximum(正确答案)
C、.min
D、.maximal
答案解析:暂无解析
在创建ndarray对象时,可以使用()参数来指定元素类型。 [单选题] *
A、dtype(正确答案)
B、.dtypes
C、.type
D、.types
答案解析:暂无解析
关于创建ndarray对象。下列描述错误的是()。 [单选题] *
A、使用list()函数可以创建一个ndarray对象(正确答案)
B、.通过ones()函数创建元素值都为1的数组
C、.ndarray对象可以使用array()函数创建
D、.通过zeros()函数创建元素值都是0的数组
答案解析:list()函数不可以创建一个ndarry对象,不过可以将一个列表做为参数传入array()函数中创建一个ndarray对象
在NumPy模块中表示生成随机种子的函数是()。 [单选题] *
A、seed()(正确答案)
B、rand()
C、beta()
D、randint()
答案解析:暂无解析
要想创建一个3 * 4的数组,下列选项正确的是()。 [单选题] *
A、np.arange(12).reshape(4, 3)(正确答案)
B、.np.arange(12).reshape(3, 4)
C、.np.arange(7).reshape(4, 3)
D、.np.arange(7).reshape(3, 4)
答案解析:暂无解析
下列关于数据分析概念的描述错误的是()。 [单选题] *
A、使用适当的统计分析方法对收集来的大量数据进行分析
B、.数据分析可以从数据中提炼出有用的信息并形成结论
C、.数据分析可以对数据进行更深层的研究
D、.数据分析不能够在杂乱无章的数据中提取有用的数据(正确答案)
下列选项中,用于搭接数据仓库和保证数据质量的是()。 [单选题] *
A、数据收集
B、. 数据处理(正确答案)
C、. 数据分析
D、. 数据展现
关于数据分析的说法,下列描述错误的是()。 [单选题] *
A、数据分析可以通过计算机工具和数学知识处理数据
B、.可以做出具有针对性的决策
C、.数据分析没有实际的使用意义(正确答案)
D、.在大数据环境下,数据分析能够挖掘出更有价值的信息
关于Anaconda的组件中,可以编辑文档且展示数据分析过程的是()。 [单选题] *
A、 Anaconda Navigator
B、. Anaconda Prompt
C、. Spyder
D、. Jupyter Notebook(正确答案)
答案解析:Jupyter Notebook可以重现整个分析过程,并将说明文字、代码、图表、公式和结论都整合在一个文档中
数据分析的一般流程为()。 [单选题] *
A、明确目的和思路、数据收集、数据处理、数据分析、数据展现(正确答案)
B、.明确目的和思路、数据收集、数据分析、数据展现
C、.数据收集、数据处理、数据分析、数据展现
D、.明确目的和思路、数据处理、数据分析、数据展现
文本分词是预处理过程中必不可少的一个操作。 [判断题] *
对(正确答案)
错
答案解析:暂无解析
余弦相似度与向量的幅值无关,只与向量的方向相关。 [判断题] *
对(正确答案)
错
答案解析:暂无解析
Anaconda中默认已经安装了NLTK库,可以用import导入使用。 [判断题] *
对(正确答案)
错
答案解析:暂无解析
词干提取能够捕捉基于词根的规范单词形式。 [判断题] *
对
错(正确答案)
答案解析:暂无解析
若某个词在这些文本中出现的次数最多,则表示这个单词比较具有代表性。 [判断题] *
对(正确答案)
错
答案解析:暂无解析
如果将cut()函数的cut_all参数设为False,则表示的是按照精确模式进行分词,[判断题] *
对(正确答案)
错
答案解析:暂无解析
nltk.classify是一个用于类别标签标记的模块。 [判断题] *
对(正确答案)
错
答案解析:暂无解析
文本数据可以直接用来分析,不需要做任何处理。 [判断题] *
对
错(正确答案)
答案解析:文本数据并不能直接被用来分析,而是要进行一系列的预处理操作,主要包括分词、词形统一化、删除停用词等。
中文并没有一个形式上的分界符。 [判断题] *
对(正确答案)
错
答案解析:暂无解析
我们可以直接使用pip命令安装jieba库。 [判断题] *
对(正确答案)
错
答案解析:暂无解析
如果两个向量的夹角越小,则表示它们越不相似。 [判断题] *
对
错(正确答案)
答案解析:暂无解析
如果将cut()函数的cut_all参数设为False,则表示按照全模式进行分词。 [判断题] *
对
错(正确答案)
答案解析:暂无解析
NLTK是一套基于Python的自然语言处理工具包。 [判断题] *
对(正确答案)
错
答案解析:暂无解析
NLP主要是实现人与计算机之间用英文进行有效沟通。 [判断题] *
对
错(正确答案)
答案解析:暂无解析
在NLTK中,如果希望给单词标注词性,则需要先确保已经下载了
averaged_perceptron_tagger模块。 [判断题] *
对(正确答案)
错
答案解析:暂无解析
最基本的时间序列就是以时间戳为索引的Series对象。 [判断题] *
对(正确答案)
错
答案解析:暂无解析
若调用shift()方法时传入一个正数,则表明时间序列中的数据会沿着纵轴方向移动一次。 [判断题] *
对(正确答案)
错
答案解析:暂无解析
如果把年份字符串作为索引使用,则可以获取到属于这一年的所有数据。 [判断题] *
对(正确答案)
错
答案解析:暂无解析
时间序列的基础频率后面还可以跟着一个日期偏移量。 [判断题] *
对(正确答案)
错
答案解析:暂无解析
在使用date_range()函数创建DatetimeIndex对象时,必须要保证同时指定start、end、periods、freq中至少三个参数。 [判断题] *
对(正确答案)
错
答案解析:暂无解析
降采样的时间颗粒会变大。 [判断题] *
对(正确答案)
错
答案解析:暂无解析
通过date_range()函数创建DatetimeIndex对象时,如果只是传入了开始日期或结束日期,则还需要用periods参数指定产生多少个时间戳。 [判断题] *
对(正确答案)
错
答案解析:暂无解析
如果是将低频率数据转换到高频率数据,则称为降采样。 [判断题] *
对
错(正确答案)
答案解析:暂无解析
在时间序列中,默认生成的时间戳是按天计算的。 [判断题] *
对(正确答案)
错
答案解析:暂无解析
若调用shift()方法时传入一个正数,则表明时间序列中的数据会沿着纵轴反方向移动一次。 [判断题] *
对
错(正确答案)
答案解析:暂无解析
如果Period对象加上或者减去一个整数,则会根据具体的时间单位进行位移操作[判断题] *
对(正确答案)
错
答案解析:暂无解析
Period对象不支持参与数学运算。 [判断题] *
对
错(正确答案)
答案解析:Period对象能够参与数学运算。如果Period对象加上或者减去一个整数,则会根据具体的时间单位进行位移操作。
在降采样时,时间序列的数据量是增加的。 [判断题] *
对
错(正确答案)
答案解析:暂无解析
在操作时间戳索引时,可以直接使用任何日期字符串来选取子集。 [判断题] *
对
错(正确答案)
答案解析:在操作时间戳索引时,可以直接使用一个日期字符串(符合可以被解析的格式)进行获取。
时间序列的移动是指沿着纵轴方向将数据进行前移或后移。 [判断题] *
对
错(正确答案)
答案解析:暂无解析
PeriodIndex是用来指代一系列时间段的索引结构。 [判断题] *
对(正确答案)
错
答案解析:暂无解析
起始日期与结束日期定义了时间序列索引的严格边界。 [判断题] *
对(正确答案)
错
答案解析:暂无解析
时间序列分析没有任何硬性的要求。 [判断题] *
对
错(正确答案)
答案解析:暂无解析
升采样的时间颗粒是变小的。 [判断题] *
对(正确答案)
错
答案解析:暂无解析
时间序列是不能使用位置索引来获取数据。 [判断题] *
对
错(正确答案)
答案解析:最简单的选取时间序列子集的方式,是直接使用位置索引来获取具体的数据。
位于左上角的子图编号为1。 [判断题] *
对(正确答案)
错
答案解析:暂无解析
每调用一次add_subplot()方法会规划画布划分子图,且只会添加一个子图。 [判断题] *
对(正确答案)
错
答案解析:暂无解析
Figure对象允许划分为多个绘图区域。 [判断题] *
对(正确答案)
错
答案解析:Figure对象允许划分为多个绘图区域,每个绘图区域都是一个Axes对象,它拥有属于自己的坐标系统,被称为子图。
subplot(323)和subplot(3,2,3)是等价的。 [判断题] *
对(正确答案)
错
答案解析:暂无解析
散点图包含的数据点越少,比较的效果就会越好。 [判断题] *
对
错(正确答案)
答案解析:散点图是指数据点在直角坐标系平面上的分布图,通常用于比较跨类别的数据。散点图包含的数据点越多,比较的效果就会越好。
如果希望一次性创建一组子图,则可以通过subplot()函数进行实现。 [判断题] *
对
错(正确答案)
答案解析:暂无解析
直方图可以利用方块的高度来反映数据的差异。 [判断题] *
对(正确答案)
错
答案解析:暂无解析
Figure对象可以理解为一张空白的画布,用于容纳图表的各种组件。 [判断题] *
对(正确答案)
错
答案解析:暂无解析
我们可以调用new()函数构建一张新的空白画布。 [判断题] *
对
错(正确答案)
答案解析:如果不希望在默认的画布上绘制图形,则可以调用figure()函数构建一张新的空白画布。
pyplot模块中默认拥有一个Figure对象。 [判断题] *
对(正确答案)
错
答案解析:暂无解析
agg()方法可以使用用户自定义的函数。 [判断题] *
对(正确答案)
错
答案解析:通过agg()方法进行聚合时,func参数既可以接收Pandas中的内置方法,也可以接收自定义的函数,同时,这些方法与函数可以作用于每一列,也可以将多个函数或方法作用于同一列,还可以将不同函数或方法作用于不同的列。
使用agg()方法进行聚合运算会对产生的标量值进行广播。 [判断题] *
对
错(正确答案)
答案解析:暂无解析
通过agg()方法进行聚合时只能接收单个函数。 [判断题] *
对
错(正确答案)
答案解析:通过agg()方法进行聚合时,func参数既可以接收Pandas中的内置方法,也可以接收自定义的函数,同时,这些方法与函数可以作用于每一列,也可以将多个函数或方法作用于同一列,还可以将不同函数或方法作用于不同的列。
groupby()方法不能使用函数做为分组键。 [判断题] *
对
错(正确答案)
答案解析:暂无解析
使用Series对象做为分组键时,必须保证Series对象的长度与被分组数组的长度相等。 [判断题] *
对
错(正确答案)
答案解析:如果S如果Series对象的索引长度与Pandas对象的索引长度不相同时,则只会将部分(具有相同索引长度)数据进行分组,而不会将全部的数据进行分组。eries对象的索引长度与Pandas对象的索引长度不相同时,则只会将部分(具有相同索引长度)数据进行分组,而不会将全部的数据进行分组。
使用字典做为分组键时,字典的键必须和数据中的列名相映射。 [判断题] *
对(正确答案)
错
答案解析:暂无解析
只要使用groupby()方法分组,就会产生一个DataFrameGroupby对象 [判断题] *
对
错(正确答案)
答案解析:一般,使用Series调用groupby()方法返回的是SeriesGroupBy对象,而使用DataFrame调用groupby()方法返回的是DataFrameBy对象。
使用transform()方法进行聚合运算,所得对象的行索引与被分组对象的行索引大小一定相等。 [判断题] *
对(正确答案)
错
答案解析:暂无解析
apply()方法可以将某个函数应用到DataFrame对象的每个数据。 [判断题] *
对
错(正确答案)
答案解析:暂无解析
groupby()方法可以将DataFrame中的某个列名做为分组键。 [判断题] *
对(正确答案)
错
答案解析:暂无解析
在箱形图中超出上界和下界的值称为异常值。 [判断题] *
对(正确答案)
错
答案解析:暂无解析
具有多层索引的DataFrame对象经过stack()重塑后,返回的是一个Series对象。[判断题] *
对
错(正确答案)
答案解析:暂无解析
使用merge()函数进行数据合并时,不需要指定合并键。 [判断题] *
对
错(正确答案)
答案解析:暂无解析
fillna()方法处理缺失数据时可以使用Series对象填充,但不可以使用DataFrame对象填充。 [判断题] *
对
错(正确答案)
答案解析:暂无解析
dropna()方法可以删除数据中所有的缺失值。 [判断题] *
对(正确答案)
错
答案解析:暂无解析
drop_duplicated()方法可以删除重复值。 [判断题] *
对
错(正确答案)
答案解析:暂无解析
rename()方法可以重命名索引名。 [判断题] *
对(正确答案)
错
答案解析:暂无解析
缺失数据是人为有意造成的。 [判断题] *
对
错(正确答案)
答案解析:暂无解析
通过merge()函数合并数据时可以指定多个键。 [判断题] *
对(正确答案)
错
答案解析:暂无解析
join()方法可以使用左连接和右连接两种方式连接数据。 [判断题] *对(正确答案)
错
答案解析:暂无解析
read_html()函数可以读取网页中所有的数据。 [判断题] *
对
错(正确答案)
答案解析:read_html()方法只能读取网页中table标签中的数据Series是一个类似于一维数组的对象。 [判断题] *
对(正确答案)
错
答案解析:暂无解析
Series和DataFrame都支持切片操作。 [判断题] *
对(正确答案)
错
答案解析:暂无解析
describe()方法可以一次性输出多个统计指标。 [判断题] *
对(正确答案)
错
答案解析:暂无解析
层次化索引可以交换分层顺序。 [判断题] *
对(正确答案)
错
答案解析:暂无解析
在操作DataFrame对象时,可以通过指定索引名的方式获取数据。 [判断题] *对(正确答案)
错
答案解析:暂无解析
Pandas只有Series和DataFrame两种数据结构。 [判断题] *
对
错(正确答案)
答案解析:Pandas有Series、DataFrame、Panel三种数据结构
DataFrame的结构是由索引和数据组成的。 [判断题] *
对(正确答案)
错
答案解析:暂无解析
Pandas既可以按照索引排序也可以按照数据排序。 [判断题] *
对(正确答案)
错
答案解析:暂无解析
通过from_arrays()方法可以将元组列表转换为MultiIndex对象。 [判断题] *
对
错(正确答案)
答案解析:暂无解析
ndarray对象的数据类型可以通过type()方法进行转换。 [判断题] *
对
错(正确答案)
答案解析:ndarray对象的数据类型可以通astype()方法进行转换
如果两个数组的形状不同,则它们是无法执行算术运算的。 [判断题] *
对
错(正确答案)
答案解析:当数组满足某一维度等长或满足其中一个数组为一维数组时,便可以通过广播机制进行运算。
ndarray对象中的swapaxes()方法可以将两个轴进行转换。 [判断题] *
对(正确答案)
错
答案解析:暂无解析
假设当前有一个3行3列的ndarray数组,如果想要获取第3行第2列的元素,可以使用ndarray[3,2]。 [判断题] *
对
错(正确答案)
答案解析:索引从0开始计数
NumPy支持比Python更多的数据类型。 [判断题] *
对(正确答案)
错
答案解析:暂无解析
NumPy数组不需要循环遍历,即可对每个元素执行批量的算术运算操作。[判断题] *
对(正确答案)
错
答案解析:暂无解析
通过empty()函数创建的数组中所有元素值都是NaN。 [判断题] *
对
错(正确答案)
答案解析:暂无解析
通用函数会对数组中的每一个元素都进行操作。 [判断题] *
对
错(正确答案)
答案解析:暂无解析
如果希望创建一个数组,则只能用array()函数实现。 [判断题] *
对
错(正确答案)
答案解析:暂无解析
sort()方法可以对任何轴上的数据进行排序 [判断题] *
对(正确答案)
错
答案解析:暂无解析
Seaborn是Python中基于Matplotlib的数据可视化工具,它提供了很多高层封装的函数。 [判断题] *
对(正确答案)
错
数据分析是一个有目的地收集和整合数据的过程。 [判断题] *
对
错(正确答案)
答案解析:数据分析的目的在于,将隐藏在一大批看似杂乱无章的数据信息集中提炼出来有用的数据,以找出所研究对象的内在规律,并非只对数据进行收集和整理。
NLTK库适用于处理文本分析。 [判断题] *
对(正确答案)
错
如果要卸载指定环境中的包,则直接使用remove命令移除即可。 [判断题] *
对(正确答案)
错
Jupyter Notebook的优点是可以重现整个分析过程,并将说明文字、代码、图表、公式和结论都整合在一个文档中。 [判断题] *
对(正确答案)
错
使用pip命令也可以查看Anconda安装的包。 [判断题] *
对(正确答案)
错
Anconda是完全免费的。 [判断题] *
对(正确答案)
错
conda是一个在Windows、Mac OS、和Linux上运行的开源软件包管理系统和环境管理系统。 [判断题] *
对(正确答案)
错
Pandas是一个基于NumPy的数据分析包,它是为了解决数据分析任务而创建的。[判断题] *
对(正确答案)
错
Jupyter Notebook可以将文件保存为ipynb格式。 [判断题] *
对(正确答案)
错
下列选项中,关于分组聚合描述正确的是()。 *
A、拆分是将数据集按照一些标准拆分为若干个组(正确答案)
B、.应用是将某个函数或方法(内置和自定义均可)应用到每个分组(正确答案)
C、.合并是将产生的新值整合到结果对象中(正确答案)
D、.应用函数时只能使用pandas内置的函数
答案解析:暂无解析
下列关于apply()方法说法不正确的是()。 *
A、apply()方法是对DataFrame每一个元素应用某个函数(正确答案)
B、.apply()方法可以实现transform()方法所有的功能(正确答案)
C、.apply()方法只能够对行列进行操作
D、.对不同列数据应用不同函数(正确答案)
答案解析:暂无解析
关于GroupBy对象,下列描述正确的是() *
A、DataFrame经过分组后得到了一个DataFrameGroupBy对象(正确答案)
B、.Series经过分组后得到了一个SeriesGroupBy对象(正确答案)
C、.能够直接查看结果
D、.采用惰性计算(正确答案)
答案解析:暂无解析
下列关于groupby()方法的使用,描述不正确的是() *
A、分组键可以是一个Series对象
B、.使用字典做为分组键时,对字典中的数据没有任何要求(正确答案)
C、.函数不可以做为分组键(正确答案)
D、.返回的结构能够直接查看
答案解析:暂无解析
下列选项中,关于transform()方法描述不正确的是()。 *
A、会对标量值产生广播操作
B、.返回的数据可以与被分组数据形状相等(正确答案)
C、.可以对每一列数据应用不同的函数
D、.可以对不同的数据应用不同的函数(正确答案)
答案解析:暂无解析
下列选项中,属于agg()方法使用方式的是()。 *
A、对每一列数据应用同一个函数(正确答案)
B、.对某列数据应用不同的数据(正确答案)
C、.对不同列数据应用不同函数(正确答案)
D、.对结果进行广播操作
答案解析:暂无解析
下列有关agg()方法描述正确的是()。 *
A、可以对每一列数据应用不同的函数(正确答案)
B、.只能接收一个函数
C、.会对结果进行广播操作
D、.可以对不同的数据应用不同的函数(正确答案)
答案解析:暂无解析
当使用groupby()方法分组时,下列选项中可以作为分组方式的是()。 *
A、列表或数组(正确答案)
B、.DataFrame中某列的名称(正确答案)
C、.字典或Series(正确答案)
D、.集合
答案解析:暂无解析
下列函数中,可以对数据进行的合并的是()。 *
A、concat()(正确答案)
B、.join()(正确答案)
C、.merge()l(正确答案)
D、.combine_first()(正确答案)
答案解析:暂无解析
下列选项中,关于数据预处理说法错误的是()。 *
A、数据清洗包含了数据标准化、数据合并和缺失值处理(正确答案)
B、数据合并按照合并轴的方向主要分为左连接、右连接、内连接和外连接(正确答案)
C、数据分析的预处理过程包括数据清洗、数据合并、数据标准化和数据转换,它们之间存在交叉,没有严格的先后关系
D、.数据标准化的主要对象是类别型特征(正确答案)
答案解析:暂无解析
下列方法中,可以修改数据类型的是()。 *
A、astype()(正确答案)
B、to_numberic()(正确答案)
C、dim()
D、type()
答案解析:暂无解析
检测出异常值之后,通常会采用哪些方式处理它们?() *
A、直接将含有异常值的记录删除(正确答案)
B、用具体的值来进行替换,可用前后两个观测值的平均值修正该异常值(正确答案)
C、不处理,直接在具有异常值的数据集上进行统计分析(正确答案)
D、视为缺失值,利用缺失值的处理方法修正该异常值(正确答案)
答案解析:暂无解析
下列关于重复值处理的说法中,正确的是()。 *
A、duplicated()方法可以标记重复数据
B、drop_duplicates()方法用于删除重复数据(正确答案)
C、重复数据的判断标准是两个数据中所有条目的值都相等(正确答案)
D、duplicated()方法支持从前向后和从后向前两种查找模式(正确答案)
答案解析:duplicated()方法用于标记重复数据。
关于Pandas中的数据重塑,下列说法正确的是()。 *
A、stack()方法可以将列索引转换为行索引(正确答案)
B、unstack()方法可以将列索引转换为行索引
C、当一个DataFrame通过pivot()方法经过轴向旋转后返回一个新的DataFrame(正确答案)
D、pivot()方法可以将列索引转换为行索引
答案解析:暂无解析
关于预处理中的数据合并,下列说法中错误的是()。 *
A、concat()函数是最常用的主键合并函数,可以通过内连接和外连接的方式堆叠合并数据(正确答案)
B、merge()函数是最常用的主键合并的函数,但不能够通过左连接和右连接的方式合并数据(正确答案)
C、join()方法是最常用的主键合并方法之一,但不能够通过左连接和右连接的方式合并数据(正确答案)
D、combine_first()方法只适用于DataFrame对象(正确答案)
答案解析:暂无解析
下列关于异常值检测的说法中正确的是()。 *
A、在使用3σ原则检测异常值时需要保证数据遵守正态分布(正确答案)
B、检测出的异常值不一定会被删除(正确答案)
C、.检测出的异常值一定会被删除
D、Pandas中可以使用boxplot()方法绘制箱形图,以实现对数据中的异常值进行检测(正确答案)
答案解析:异常值会根据实际情况选择删除还是保留。
关于空值和缺失值,下列说法中正确的是()。 *
A、NaN和None是完全一样的
B、.使用isnull()可以检测数据中是否存在空值或缺失值(正确答案)
C、notnull()与isnull()方法都可以判断数据中是否存在空值或缺失值(正确答案)
D、dropna()方法可以删除空值和缺失值(正确答案)
答案解析:暂无解析
Pandas的数据结构有()。 *
A、Series(正确答案)
B、.DataFrame(正确答案)
C、C.Panel(正确答案)
D、D.Vector
答案解析:暂无解析
对于Pandas索引操作,下列说法错误的是()。 *
A、可通过指定索引名的方式进行选取(正确答案)
B、swaplevel()方法可以将层次索引的位置进行交换(正确答案)
C、sort_index()方法会对层次索引进行排序(正确答案)
D、在使用sort_index()方法排序时,会优先选择按内层索引进行排序
答案解析:暂无解析
下列关于Pandas层次化索引说法正确的是()。 *
A、层次化索引是指Pandas对象在一个轴方向上具有多层索引(正确答案)
B、使用from_tuples()方法可以将列表转换为MultiIndex对象(正确答案)
C、使用from_arrays()方法可以将数组列表转换为MultiIndex(正确答案)
D、层次化索引不可以排序
答案解析:层次化索引可以使用sort_index对索引进行排序
关于读写excel文件的说法中,下列描述正确的是()。 *
A、to_excel()方法表示将结构化数据写入到Excel文件中(正确答案)
B、.to_excel()方法表示将结构化数据读取到DataFrame中
C、.read_excel()函数表示将结构化数据读取到DataFrame中(正确答案)
D、.read_excel()函数表示将结构化数据写入到DataFrame中
答案解析:暂无解析
下列关于Pandas的索引说法正确的是()。 *
A、Pandas中的索引都是Index类对象(正确答案)
B、索引对象是可修改的
C、索引对象是不可修改的(正确答案)
D、Index对象是可以共享的(正确答案)
答案解析:索引对象是不可以修改的
关于读取网页表格数据的说法中,下列描述正确的是()。 *
A、使用read_html()函数可以读取网页表格数据(正确答案)
B、read_html()函数返回一个DataFrame对象
C、read_html()函数返回一个DataFrame列表对象(正确答案)
D、read_html()函数只能对网页中的table标签进行读取(正确答案)
答案解析:read_html()方法返回的是一个DataFrame列表
下列方法中可以读取数据库数据的是()。 *
A、read_sql()(正确答案)
B、read_table()(正确答案)
C、read_sql_query()(正确答案)
D、read_query()
答案解析:在读取数据库数据中没有read_query()方法
下列关于Series说法正确的是()。 *
A、Series是一个类似一维数组的对象(正确答案)
B、Series可以保存任何类型的数据(正确答案)
C、Series由数据和索引构成(正确答案)
D、Series结构的数据位于索引的左侧(正确答案)
答案解析:暂无解析
下列Pandas方法中,用于求最大值和最小值的是()。 *
A、sum
B、mean
C、max(正确答案)
D、min(正确答案)
答案解析:暂无解析
下列函数中,可以创建NumPy数组的是()。 *
A、array()(正确答案)
B、.zeros()(正确答案)
C、C.empty()(正确答案)
D、D.ones()(正确答案)
答案解析:暂无解析
关于数组排序 *
A、当数组使用sort()方法后,数组默认从小到大进行排序(正确答案)
B、.当数组使用sort()方法后,数组默认从大到小进行排序
C、.sort()方法可以对任何一个轴上的元素进行排序(正确答案)
D、.sort()方法排序不会修改数组本身
答案解析:暂无解析
NumPy数组的转置可以通过()实现。 *
A、transpose()(正确答案)
B、.reshape()
C、.T(正确答案)
D、.transform()。
答案解析:Numpy数组的转置可通过transpose()和T属性实现
下列关于随机数模块描述正确的是()。 *
A、NumPy的random模块具有更多的随机数功能(正确答案)
B、.random模块中包括生成服从多种概率分布随机数的函数(正确答案)
C、.numpy.random模块中有用于生成大量样本值的函数(正确答案)
D、.rand()函数隶属于numpy.random模块(正确答案)
答案解析:暂无解析
已知有如下一个数组:arr = np.array([-101])下列选项中,哪个执行后的结果为True?() *
A、np.any(arr > 0)(正确答案)
B、.np.any(arr (正确答案)
C、.np.all(arr == 0)
D、.np.all(arr > 0)
答案解析:暂无解析
关于数组广播的说法中,下列描述错误的是()。 *
A、两个数组的某一维度等长。(正确答案)
B、.数组的某一维度为1。(正确答案)
C、.数组广播机制可以对任意两个数组进行扩展(正确答案)
D、.广播机制优先扩展维度小的数组
答案解析:暂无解析
下列关于通用函数的说法中正确的是()。 *
A、通用函数是一种针对ndarray中的数据执行元素级运算的函数(正确答案)
B、.通用函数会返回一个新的数组(正确答案)
C、.通用函数只可以接收一个参数
D、.通用函数分为一元通用函数与二元通用函数(正确答案)
答案解析:暂无解析
下列关于ndarray索引说法正确的是()。 *
A、可以使用整数进行索引(正确答案)
B、.可以使用整数数组进行索引(正确答案)
C、.可以使用元组进行索引
D、.可以使用布尔数组进行索引(正确答案)
答案解析:ndarray支持使用整数、整数数组、布尔数组进行索引
下列关于多维数组切片的描述正确的是()。 *
A、在选取元素时可以传入一个切片(正确答案)
B、.在选取元素时可以传入多个切片(正确答案)
C、.在选取元素时可以将切片与整数索引混合使用(正确答案)
D、.在选取元素时不可以传入一个切片
答案解析:暂无解析
关于数组统计运算,下列说法中正确的是()。 *
A、sum()方法表示对数组中全部或某个轴向的元素求和(正确答案)
B、.mean()方法表示计算平均值(正确答案)
C、.argmin()方法表示计算数组中的最小值
D、.argmax()方法表示计算数组中的最大值
答案解析:暂无解析
在统计学领域中,数据分析可以划分为()。 *
A、描述性数据分析(正确答案)
B、.操作性数据分析
C、探索性数据分析(正确答案)
D、验证性数据分析(正确答案)
答案解析:在统计学领域中,数据分析可以划分为描述性分析、探索性分析、验证性数据分析
Jupyter Notebook可以将文件保存为哪些格式?() *
A、html(正确答案)
B、.ipynb(正确答案)
C、.pdf(正确答案)
D、.py(正确答案)
答案解析:Jupyter Notebook默认保存的格式为ipynb,但是可以导出html、pdf、py等格式文件。
下列选项中,属于数据处理的目的是()。 *
A、使数据更加适用于分析(正确答案)
B、.对无意义的数据进行清洗(正确答案)
C、.整合数据(正确答案)
D、.提高数据质量(正确答案)
答案解析:暂无解析
关于Pandas特点的描述中,下列描述正确的是()。 *
A、智能数据对齐和缺失数据的集成处理(正确答案)
B、.基于标签的切片、花式索引和大数据集的子集(正确答案)
C、.按数据分组进行聚合和转换(正确答案)
D、.具有时间序列功能(正确答案)
答案解析:暂无解析
关于Anconda的特点,下列描述正确的是()。 *
A、完全开源和免费(正确答案)
B、.仅支持Linnux、windows系统
C、.包含了众多流行的科学、数学、工程和数据分析的Python库(正确答案)
D、.Anconda支持Python3.x以上的版本
答案解析:Anaconda发行版本具有以下的特点:(1) 包含了众多流行的科学、数学、工程和数据分析的Python库。(2) 完全开源和免费。(3) 额外的加速和优化是收费的,但对于学术用途,可以申请免费的License。(4) 全平台支持Linux、Windows、Mac OS X,支持Python 2.6、2.7、3.4、3.5、3.6,可以自由切换。
下列关于Matplotlib库描述正确的是()。 *
A、Matplotlib是一个用在 Python 中绘制数组的2D 图形库(正确答案)
B、.Matplotlib主要用纯Python语言进行编写(正确答案)
C、.Matplotlib起源于模仿MATLAB图形命令(正确答案)
D、.Matplotlib主要用纯Java语言进行编写
答案解析:暂无解析
下列选项中,属于描述性数据分析的方法有()。 *
A、对比分析法(正确答案)
B、.平均分析法(正确答案)
C、.交叉分析法(正确答案)
D、.因子分析法
答案解析:在描述性分析中常见的方法有对比分析法、平均分析法、交叉分析法。
下列工具中,能够用于数据分析的是()。 *
A、NumPy(正确答案)
B、.Pandas(正确答案)
C、.Matplotlib(正确答案)
D、.Seaborn(正确答案)
答案解析:常见的数据分析库有NumPy、Pandas、Matplotlib、Seaborn、NLTK等Anconda支持哪些操作系统?() *
A、Windows(正确答案)
B、.Mac OS(正确答案)
C、.Linux(正确答案)
D、.Android
答案解析:根据Anconda发行版本可知,支持Linux、Windows、Mac系统
下列选项中属于NumPy功能的是()。 *
A、快速高效的多维数据对象ndarray(正确答案)
B、.高性能科学计算和数据分析的基础包(正确答案)
C、.多维数组(矩阵)具有矢量运算能力,快速、节省空间(正确答案)
D、.线性代数、随机数生成以及傅里叶变换功能(正确答案)
答案解析:Numpy是大部分Python科学计算的基础,它具有以下功能:(1) 快速高效的多维数据对象ndarray。(2) 高性能科学计算和数据分析的基础包。(3) 多维数组(矩阵)具有矢量运算能力,快速、节省空间。(4) 矩阵运算。无需循环,可完成类似Matlab中的矢量运算。(5) 线性代数、随机数生成以及傅里叶变换功能。
推荐访问:python数据分析报告总结 题库 分析 数据