Python数据分析与应用题库

发布时间: 2022-06-29 17:05:03 来源：网友投稿

下面是小编为大家整理的Python数据分析与应用题库,供大家参考。

Python数据分析与应用题库

下列nltk模块中，可以对句子实现分词操作的是（）。 [单选题] *

A、nltk.corpus

B、nltk.tokenize(正确答案)

C、nltk.stem

D、nltk.tag

答案解析：暂无解析

下列函数中，用于打开NLTK下载器的是（）。 [单选题] *

A、download()(正确答案)

B、load()

C、open()

D、install()

答案解析：暂无解析

下列选项中，NLTK用来标记形容词的是（）。 [单选题] *

A、JJ(正确答案)

B、RB

C、CC

D、DT

答案解析：暂无解析

关于词性归一化的说法中，下列描述正确的是（）。 [单选题] * A、词干提取和词形还原最终都会得到词根

B、词干提取能够捕捉基于词根的规范单词形式

C、词形还原需要删除不影响词性的词缀得到词干

D、词形还原能够捕捉基于词根的规范单词形式(正确答案)

答案解析：暂无解析

下列选项中，用于控制jieba.cut()分词模式的是（）。 [单选题] *

A、data

B、HMM

C、is_all

D、cut_all(正确答案)

答案解析：jieba.cut()函数共接收三个参数，其中第一个为需要分词的字符串，cut_all参数用来控制是否采用全模式，HMM 参数用来控制是否使用 HMM 模型。

下列方法中，用于返回出现相对较频繁的单词的是（）。 [单选题] *

A、word_tokenize()

B、pos_tag()

C、most_common()(正确答案)

D、cosine_distance()

答案解析：word_tokenize()函数基于空格或标点对文本进行分词；pos_tag()函数用于给单词标注词性；cosine_distance()函数用于求两个向量的夹角余弦值。

下列选项中，用于标注词语词性的模块是（）。 [单选题] *

A、nltk.corpus

B、nltk.tokenize

C、nltk.stem

D、nltk.tag(正确答案)

答案解析：暂无解析

下列分词模式中，可以将句子中所有成词词语都扫描出来的是（）。 [单选题] *

A、精确模式

B、全模式(正确答案)

C、搜索引擎模式

D、模糊搜索模式

答案解析：暂无解析

如果希望还原单词的基本形式，则需要使用import语句导入哪个模块？（） [单选题] *

A、nltk.corpus

B、nltk.tokenize

C、nltk.stem(正确答案)

D、nltk.tag

答案解析：暂无解析

关于文本预处理的过程，下列描述错误的是（）。 [单选题] *

A、文本分词是预处理过程中必不可少的一个操作

B、词干提取是一个很粗略的去除单词两端词缀的过程

C、词形还原是一个去除曲折的词缀且返回词典中包含的词的过程

D、文本中的每个单词都能够表明文本的特征(正确答案)

答案解析：文本中包含一些停用词，这些词是无法表明文本特征的。

通过date_range()函数创建DatetimeIndex对象时，如果只是传入了开始日期，则还需要用（）参数指定产生多少个时间戳。 [单选题] *

A、freq

B、end

C、periods(正确答案)

D、start

答案解析：暂无解析

请阅读下面一段程序： [单选题] *

运行上述程序，它最终输出的结果为（A）。(正确答案)

A、2015

B、2014

C、2013

D、2012

答案解析：暂无解析

下列方法中，能够转换时期频率的是（）。 [单选题] *

A、shift()

B、rolling()

C、asfreq()(正确答案)

D、resample()

答案解析：shift()方法用于沿着时间轴方向将数据进行前移或后移；rolling()方法用于滑动窗口；resample()是一个对常规时间序列数据重新采样和频率转换的便捷的方法。

下列方法中，用来创建一个滑动窗口的是（）。 [单选题] *

A、shift()

B、rolling()(正确答案)

C、asfreq()

D、resample()

答案解析：暂无解析

请阅读下面一段程序：运行程序，它最终执行的结果为（）。 [单选题] *

A、4

B、3(正确答案)

C、2

D、1

答案解析：暂无解析

创建一个DatetimeIndex对象的代码如下：pd.date_range("2018/08/10", "2018/08/15") [单选题] *

默认情况下，该对象中时间戳的频率为（B）。(正确答案)

A、H

B、D

C、S

D、T

答案解析：暂无解析

下列选项中，用来表示时间序列中的频率为每周六的是（）， [单选题] *

A、WOM-2MON

B、W-FRI

C、W-SUN

D、W-SAT(正确答案)

答案解析：暂无解析

下列选项中，用来表示Pandas中的时期的是（）。 [单选题] *

A、Period(正确答案)

B、Timestamp

C、Interval

D、Series

答案解析：暂无解析

通过date_range()函数创建DatetimeIndex对象时，可以设置哪个参数指定终止日期？（） [单选题] *

A、freq

B、periods

C、end(正确答案)

D、start

答案解析：在date_range()函数中，freq参数用来指定计时单位；periods参数表示产生多少个时间戳索引值；end表示终止日期；start表示起始日期。

创建DatetimeIndex对象的代码如下：pd.date_range(start="2018/2/1", end="2018/2/28", freq=________)如果希望生成的时间戳为每周日，则下列选项中可以填写到横线处的是（）。 [单选题] *

A、WOM-2MON

B、W-FRI

C、W-SUN(正确答案)

D、W-SAT

答案解析：暂无解析

通过date_range()函数创建DatetimeIndex对象时，可以设置哪个参数来改变计时单位？（） [单选题] *

A、freq(正确答案)

B、periods

C、end

D、start

答案解析：在date_range()函数中，freq参数用来指定计时单位；periods参数表示产生多少个时间戳索引值；end表示终止日期；start表示起始日期。

请阅读下面一段程序：运行上述程序，它最终执行的结果为（）。 [单选题] *

A、Timestamp("2018-11-08 00:00:00")(正确答案)

B、Timestamp("2018-10-08 00:00:00")

C、Timestamp("2018-11-08")

D、Timestamp("2018-10-08")

答案解析：DatetimeIndex对象是由一组时间戳构成的索引，它里面的每个标量值都是一个Timestamp对象。

当使用resample()方法重新采样时，下列哪个参数可以确定采样的闭合区间？（）[单选题] *

A、label

B、fill_method

C、how

D、closed(正确答案)

答案解析：暂无解析

关于降采样的说法中，下列描述错误的是（）。 [单选题] *

A、降采样是将高频率数据聚合到低频率数据

B、降采样的时间颗粒会变大

C、降采样的数据量是增加的(正确答案)

D、降采样就相当于另外一种形式的分组聚合操作

答案解析：暂无解析

下列方法中，能够对常规时间序列数据重新采样的是（）。 [单选题] *

A、shift()

B、rolling()

C、asfreq()

D、resample()(正确答案)

答案解析：暂无解析

通过date_range()函数创建DatetimeIndex对象时，可以设置哪个参数指定产生多少个时间戳索引值？（） [单选题] *

A、freq

B、periods(正确答案)

C、end

D、start

答案解析：在date_range()函数中，freq参数用来指定计时单位；periods参数表示产生多少个时间戳索引值；end表示终止日期；start表示起始日期。

通过date_range()函数创建DatetimeIndex对象时，可以设置（）参数来规范时间戳。 [单选题] *

A、normalize(正确答案)

B、periods

C、end

D、freq

答案解析：在date_range()函数中，(6) normalize参数用来规范时间戳；periods参数表示产生多少个时间戳索引值；end表示终止日期；start表示起始日期。

通过date_range()函数创建DatetimeIndex对象时，可以设置哪个参数指定起始日期？（） [单选题] *

A、freq

B、periods

C、end

D、start(正确答案)

答案解析：在date_range()函数中，freq参数用来指定计时单位；periods参数表示产生多少个时间戳索引值；end表示终止日期；start表示起始日期。

关于时间序列的移动，下列说法错误的是（）。 [单选题] *

A、移动是指沿着时间轴方向将数据进行前移或后移

B、时间序列移动后，索引也会发生变化(正确答案)

C、数据移动后会出现边界情况

D、无论时间序列的数据怎么移动，索引是不会发生任何变化的

答案解析：暂无解析

请阅读下面一段程序：运行上述程序，它最终输出的结果为（）。 [单选题] *

A、17

B、-17(正确答案)

C、-18

D、18

答案解析：暂无解析

下列图表中，能够识别异常值的是（）。 [单选题] *

A、箱形图(正确答案)

B、折线图

C、饼图

D、散点图

答案解析：暂无解析

下列选项中，用于绘制单变量分布的函数是（）。 [单选题] *

A、displot()(正确答案)

B、.joinplot()

C、.pairplot()

D、.boxplot()

答案解析：暂无解析

下列关于Bokeh库描述不正确的是（）。 [单选题] *

A、针对浏览器使用的交互式可视化库

B、.提供优雅、简洁的通用图形构建

C、.不适用于大量的数据集(正确答案)

D、.能够快速地、轻松地创建交互图

答案解析：暂无解析

下列关于常见图表说法正确的是（）。 [单选题] *

A、散点图不能在子图中绘制

B、.散点的x轴刻度必须为数值

C、.折线图可以用作查看特征间的趋势关系(正确答案)

D、.箱形图可以用来查看特征间的相关关系

答案解析：暂无解析

下列选项中，用于绘制双变量分布的函数是（） [单选题] *

A、displot()

B、.joinplot()(正确答案)

C、.pairplot()

D、.boxplot()

答案解析：暂无解析

下列代码中，绘制散点图的是（）。 [单选题] *

A、plt.scatter(x,y)(正确答案)

B、.plt.plot(x,y)

C、.plt.legend("upper left")

D、.plt.xlabel("散点图")

答案解析：暂无解析

下列函数中，可以设置当前图形x轴范围的是（）。 [单选题] *

A、xlabel()

B、xlim()(正确答案)

C、title()

D、legend()

答案解析：暂无解析

下列选项中不属于Seaborn中分类数据可视化库的是（）。 [单选题] *

A、分类数据散点图

B、.分类数据的分布图

C、.分类数据的统计估算图

D、.分类数据的直方图(正确答案)

答案解析：暂无解析

下列函数中，可以为图表设置标题的是（）。 [单选题] *

A、xlim()

B、xlabel()

C、title()(正确答案)

D、legend()

答案解析：暂无解析

下列函数中，可以为图表设置图例的是（）。 [单选题] *

A、legend()(正确答案)

B、xlabel()

C、title()

D、xlim()

答案解析：暂无解析

在创建Figure对象时，可以指定哪个参数来给画布添加背景颜色？（） [单选题] *

A、num

B、dpi

C、figsize

D、facecolor(正确答案)

答案解析：暂无解析

下列选项中，可以一次性创建多个子图的是（）。 [单选题] *

A、figure()(正确答案)

B、subplot()

C、add_subplot()

D、subplots()

答案解析：暂无解析

下列pyplot模块的函数中，可以绘制散点图的是（）。 [单选题] *

A、bar()

B、hist()

C、pie()

D、scatter()(正确答案)

答案解析：暂无解析

下列图表中，可以清晰地反映出各数据系列的百分比情况的是（）。 [单选题] *

A、直方图

B、折线图

C、饼图(正确答案)

D、散点图

答案解析：饼图可以显示一个数据序列（图表中绘制的相关数据点）中各项的大小与各项总和的比例，每个数据序列具有唯一的颜色或图形，并且与图例中的颜色是相对应的。

下列图表中，适用于比较跨类别数据的是（）。 [单选题] *

A、直方图

B、折线图

C、饼图

D、散点图(正确答案)

答案解析：暂无解析

下列pyplot模块的函数中，可以绘制直方图的是（）。 [单选题] *

A、bar()

B、hist()(正确答案)

C、pie()

D、scatter()

答案解析：暂无解析

下列参数中，调整后显示中文的是（）。 [单选题] *

A、lines.kinestyle

B、.lines.linewidth

C、.font.sans-serif(正确答案)

D、.axes.unicode_minus

答案解析：暂无解析

下列pyplot模块的函数中，可以绘制饼图的是（）。 [单选题] *

A、bar()

B、hist()

C、pie()(正确答案)

D、scatter()

答案解析：暂无解析

关于Matplotlib的说法中，下列描述正确的是（）。 [单选题] *

A、Matplotlib是一个Python 3D绘图库

B、它使用简单，仅用几行代码就能生成各种图表(正确答案)

C、仅仅适用于IPython平台

D、只能输出PNG或PDF格式

答案解析：Matplotlib是一个Python 2D绘图库，作图风格接近MATLAB，它已经成为Python中公认的数据可视化工具，适用于各种平台上。

在创建Figure对象时，可以指定哪个参数来设置画布的尺寸？（） [单选题] *

A、num

B、dpi

C、figsize(正确答案)

D、facecolor

答案解析：暂无解析

关于分组聚合过程的说法中，下列描述不正确的是（）。 [单选题] *

A、拆分是指将数据集按照一些标准拆分为若干个组

B、应用是指将某个函数或方法应用到每个分组

C、合并是指将产生的新值整合到结果对象中

D、只能对纵轴方向上的数据进行分组(正确答案)

答案解析：拆分操作是在指定轴上进行的，既可以对横轴方向上的数据进行分组，也可以对纵轴方向上的数据进行分组。

关于agg()方法的使用中，下列描述错误的是（）。 [单选题] *

A、 agg()方法中func参数只能传入一个函数(正确答案)

B、. agg()方法中func参数可以传入多个函数

C、. agg()方法中func参数可以传入自定义函数

D、. agg()方法不能对产生的标量值进行广播

答案解析：暂无解析

下列关于groupby()方法的说法中，描述正确的是（）。 [单选题] *

A、用于将数据集实现分组与聚合操作

B、调用groupby()方法返回一个DataFrameBy对象

C、调用groupby()方法返回一个GroupBy对象(正确答案)

D、groupby()方法只能将数据集按照纵轴方向进行分组

答案解析：在Pandas中，可以通过groupby()方法将数据集按照某些标准划分成若干个组。通过groupby()方法执行分组操作，会返回一个GroupBy对象，该对象实际上并没有进行任何计算，只是包含一些关于分组键的中间数据而已。

关于agg()方法的用法中，下列描述错误的是（）。 [单选题] *

A、可以对每列数据应用同一个函数

B、.可以对一列数据应用不同的函数

C、.每列的数据只能使用相同的函数(正确答案)

D、.可以对不同的列使用不同的函数

答案解析：暂无解析

下列选项中，不属于groupby()方法分组方式的是（）。 [单选题] *

A、列表或数组

B、DataFrame中某列的名称

C、字典或Series

D、集合(正确答案)

答案解析：暂无解析

关于transform(）方法的说法中，下列描述错误的是（）。 [单选题] *

A、transform()方法可以使用广播

B、.使用transform()方法可以返回一个与分组大小相等的数组

C、.transform()方法只能使用内置方法对数据进行转换操作(正确答案)

D、.transform()方法对DataFrame和Series都适用

答案解析：暂无解析

请阅读下面一段程序：

执行上述程序后，最终输出的结果为（）。 [单选题] *

A、 A B0 3 21 3 22 3 2

B、. A B0 2 31 2 32 2 3

C、. A B0 3 41 3 42 3 4

D、. A B0 4 31 4 32 4 3(正确答案)

答案解析：暂无解析

关于apply()方法的功能，下列选项中说法正确的是（）。 [单选题] *

A、apply()方法是对DataFrame(正确答案)

B、.apply()方法能够实现所有agg方法的功能

C、.apply()方法和map方法都能够进聚合操作

D、.apply()方法只能够对行列进行操作

答案解析：暂无解析

关于groupby(）方法的返回值，下列说法错误的是（）。 [单选题] *

A、groupby(）方法返回的是一个GroupBy对象

B、返回的GroupBy对象采用的是惰性计算

C、使用for循环可以遍历该对象中的分组信息

D、groupby(）方法没有返回值(正确答案)

答案解析：暂无解析

关于apply()方法的说法中，下列描述正确的是（）。 [单选题] *

A、apply()方法是对DataFrame(正确答案)

B、apply()方法能够实现所有agg方法的功能

C、apply()方法和map方法都能够进聚合操作

D、apply()方法只能够对行列进行操作

答案解析：暂无解析

请阅读下面一段程序：

执行上述程序后，最终输出的结果为（）。 [单选题] *

A、程序出现异常

B、. data2key1 A 4.0B 7.0(正确答案)

C、. data1 data2key1 A 3.0 4.0B 6.5 7.0

D、. data1 data2key1 B 6.5 7.0

答案解析：暂无解析

下列选项中，用于删除缺失值的方法是（）。 [单选题] *

A、isnull()

B、delete()

C、dropna()(正确答案)

D、fillna()

答案解析：isnull方法用于检测，当返回结果中有True时，表示有重复的数据；fillna方法用于填充缺失数据。

关于预处理的说法中，下列选项中描述不正确是（）。 [单选题] *

A、 concat()函数可以沿着一条轴将多个对象进行堆叠

B、 merge()函数可以根据一个或多个键将不同的DataFrame进行合并

C、可以使用rename()方法对索引进行重命名操作

D、 unstack()方法可以将列索引旋转为行索引(正确答案)

答案解析：unstack()方法可以将行索引旋转为列索引。

下列选项中，关于fillna()方法描述正确的是（）。 [单选题] *

A、fillna()方法只能填充替换值为NaN的数据

B、只支持前向填充方式

C、默认可支持填充的最大数量为1

D、fillna()方法可以填充替换值为NaN和None的数据(正确答案)

答案解析：暂无解析

关于数据重塑的说法中，下列选项描述错误的是（）。 [单选题] *

A、数据重塑可以将DataFrame转换为Series

B、stack()方法可以将列索引转换为行索引

C、对一个DataFrame使用stack()方法后返回的一定是一个Series(正确答案)

D、.unstack()方法可以将行索引转换为列索引

答案解析：当一个DataFrame具有层次索引时，使用stack()方法会返回一个DataFrame对象。

请阅读下面的程序：执行上述程序后，最终输出的结果为（）。 [单选题] *

A、0 False1 False2 True(正确答案)

B、.0 True1 True2 False

C、.0 False1 False2 False

D、.0 True1 True2 True

答案解析：暂无解析

下列选项中，关于drop_duplicates()方法描述错误的是（）。 [单选题] *

A、仅支持单一特征数据的去重(正确答案)

B、.仅对Series和DataFrame对象有效

C、数据去重时默认保留第一个数据

D、该方法不会改变原始数据排列

答案解析：暂无解析

关于异常值的说法，下列选项中描述错误的是（）。 [单选题] *

A、异常值是指样本中明显偏离其余观测值的个别值(正确答案)

B、可以使用3σ原则检测异常值

C、可以使用Pandas中的箱线图检测异常值

D、异常值可以使用其它的值来替换

答案解析：异常数据并不一定是数据错误，所以会根据实际情况下选择删除或保留。

下列选项中，关于dropna()方法描述正确的是（）。 [单选题] *

A、dropna()方法只会删除值为NaN的数据

B、dropna()方法不会删除值为None的数据

C、dropna()方法会删除值为None和NaN的数据(正确答案)

D、dropna()方法只会检测缺失数据和空值

答案解析：dropna()默认删除None或NaN，但是可以指定参数，对轴进行删除。

关于哑变量的说法中，下列选项描述错误的是（）。 [单选题] *

A、哑变量是人为虚设的变量

B、哑变量在转换成指标矩阵后，其值通常为0或1

C、Pnadas中get_dummies()函数可以对类别进行哑变量处理

D、哑变量的使用没有实际意义(正确答案)

答案解析：暂无解析

下列关于数据预处理的说法中，描述不正确的是（）。 [单选题] *

A、数据清洗的目的是为了提高数据质量

B、异常值不一定要删除

C、通过drop_duplicates()方法可以删除重复数据

D、 concat()函数可以根据一个或多个键将不同的DataFrame进行合并(正确答案)答案解析：concat()函数可以沿着一条轴将多个对象进行堆叠。

下列选项中，关于duplicated()方法描述正确的是（）。 [单选题] *

A、duplicate()方法用于删除重复值

B、duplicate()方法用于标记重复值(正确答案)

C、duplicate()方法会改变原始数据

D、duplicate()方法会将重复的数据标记为False

答案解析：暂无解析

关于Series结构，下列描述正确的是（）。 [单选题] *

A、Series是一个类似于二维数组的对象

B、Series由一组数据和与之相关的索引两部分构成(正确答案)

C、Series只能保存整数和字符串类型的数据

D、Series的索引默认是从1开始

答案解析：暂无解析

Pandas在执行算术运算时，没有对齐的位置会使用（）进行补齐。 [单选题] *

A、Null

B、0(正确答案)

C、NaN

D、null_values

答案解析：暂无解析

下列关于Pandas库的说法中正确的是（）。 [单选题] *

A、Pandas中只有两种数据结构

B、Pandas不支持读取文本数据

C、Pandas是在NumPy基础上建立的新程序库(正确答案)

D、.Pandas中Series和DataFrame可以解决数据分析中一切的问题

答案解析：除了书中介绍的两种常见数据结构，Pandas中还有另一种数据结构Panel

在进行算术运算时，如果希望一次性输出多个统计指标可以使用（）方法。 [单选题] *

A、statistics()

B、describe()(正确答案)

C、all()

D、results()

答案解析：暂无解析

下列方法中，可以将元组转换为MultiIndex对象的是（）。 [单选题] *

A、from_tuples()(正确答案)

B、.from_arrays()

C、.from_product()

D、.from_list()

答案解析：from_tuples()是将元组列表转换为MultiIndex对象；from_arrays()是将数组列表转换为MultiIndex对象；from_product()是从多个集合笛卡尔积中创建一个MultiIndex对象

请阅读下面一段程序: 执行上述程序后，最终输出的结果为（）。 [单选题] *

A、 0 1 2 30 4 -1 -3 01 2 6 -1 -72 8 6 -5 1

B、. 0 1 2 30 4 -1 -3 01 2 6 -1 -72 8 6 -5 1(正确答案)

C、. 0 1 2 32 8 6 -5 11 2 6 -1 -70 4 -1 -3 0

D、. 3 2 1 00 0 -3 -1 41 -7 -1 6 22 1 -5 6 8

答案解析：暂无解析

关于Pandas中数据排序，下列说法正确的是（）。 [单选题] *

A、即可以按照行索引排序，也可以按照列索引排序(正确答案)

B、.sort_index()方法表示按照值进行排序

C、.sort_values()方法表示按照索引进行排序

D、默认情况下，sort_index()方法按照降序排列

答案解析：暂无解析

关于Pandas层次化索引，下列说法错误的是（）。 [单选题] *

A、层次化索引是指Pandas对象在一个轴方向上具有多层索引

B、层次化索引至多只能有两层索引(正确答案)

C、可以使用swaplevel()方法对层次化索引的位置交换顺序

D、使用sort_index()可以对索引进行排序

答案解析：Pandas层次化索引没有具体的层数限制

请阅读下面一段程序：执行上述程序后，最终输出的结果为（）。 [单选题] *

A、a 3.0d 2.0c 1.0b NaN

B、.a 3.0b NaNc 1.0d 2.0(正确答案)

C、.程序出现异常

D、.c 1d 2a 3

答案解析：暂无解析

下列关于DataFrame说法正确的是（）。 [单选题] *

A、DataFrame结构是由索引和数据组成(正确答案)

B、DataFrame的行索引位于最右侧

C、创建一个DataFrame对象时需要指定索引

D、DataFrame每列的数据类型必须是相同的

答案解析：暂无解析

请阅读下面一段程序执行上述程序后，最终输出的结果是（）。 [单选题] *

A、5 13 20 34 42 5

B、.0 32 53 24 45 1(正确答案)

C、.5 14 43 22 50 3

D、.2 54 40 33 25 1

答案解析：暂无解析

下列选项中，不属于ndarray对象属性的是（）。 [单选题] *

A、shape

B、.dtype

C、.ndim

D、.map(正确答案)

答案解析：暂无解析

请看如下代码：对代码中的NumPy数组执行sort()方法结果正确的是（）。 [单选题] *

A、[[2 6 7] [2 3 6]](正确答案)

B、.[[2 6 7] [6 3 2]]

C、.[[7 6 2] [6 3 2]]

D、.[[7 6 2] [2 3 6]]

答案解析：暂无解析

下列关于ndarray对象描述正确的是（）。 [单选题] *

A、ndarray对象中可以存储不同类型的元素

B、.ndarray对象中存储元素的类型必须是相同的(正确答案)

C、. ndarray对象不支持广播操作

D、.ndarray对象不具备矢量运算能力

答案解析：根据ndarry的特点可知，该对象中元素的类型必须是相同的

下列选项中，用来表示矢量化三元表达式的是（）。 [单选题] *

A、where()(正确答案)

B、.cumsum()

C、.sort()

D、.unique()

答案解析：暂无解析

请阅读下列一段示例程序：运行上述程序，那么最终输出的结果为（）。 [单选题] *

A、(3, 2)(正确答案)

B、.(2, 3)

C、.(3, 0)

D、.(2, 0)

答案解析：暂无解析

在NumPy通用函数中，用于计算元素级最大值的函数是（）。 [单选题] *

A、max

B、.maximum(正确答案)

C、.min

D、.maximal

答案解析：暂无解析

在创建ndarray对象时，可以使用（）参数来指定元素类型。 [单选题] *

A、dtype(正确答案)

B、.dtypes

C、.type

D、.types

答案解析：暂无解析

关于创建ndarray对象。下列描述错误的是（）。 [单选题] *

A、使用list()函数可以创建一个ndarray对象(正确答案)

B、.通过ones()函数创建元素值都为1的数组

C、.ndarray对象可以使用array()函数创建

D、.通过zeros()函数创建元素值都是0的数组

答案解析：list()函数不可以创建一个ndarry对象，不过可以将一个列表做为参数传入array()函数中创建一个ndarray对象

在NumPy模块中表示生成随机种子的函数是（）。 [单选题] *

A、seed()(正确答案)

B、rand()

C、beta()

D、randint()

答案解析：暂无解析

要想创建一个3 * 4的数组，下列选项正确的是（）。 [单选题] *

A、np.arange(12).reshape(4, 3)(正确答案)

B、.np.arange(12).reshape(3, 4)

C、.np.arange(7).reshape(4, 3)

D、.np.arange(7).reshape(3, 4)

答案解析：暂无解析

下列关于数据分析概念的描述错误的是（）。 [单选题] *

A、使用适当的统计分析方法对收集来的大量数据进行分析

B、.数据分析可以从数据中提炼出有用的信息并形成结论

C、.数据分析可以对数据进行更深层的研究

D、.数据分析不能够在杂乱无章的数据中提取有用的数据(正确答案)

下列选项中，用于搭接数据仓库和保证数据质量的是（）。 [单选题] *

A、数据收集

B、. 数据处理(正确答案)

C、. 数据分析

D、. 数据展现

关于数据分析的说法，下列描述错误的是（）。 [单选题] *

A、数据分析可以通过计算机工具和数学知识处理数据

B、.可以做出具有针对性的决策

C、.数据分析没有实际的使用意义(正确答案)

D、.在大数据环境下，数据分析能够挖掘出更有价值的信息

关于Anaconda的组件中，可以编辑文档且展示数据分析过程的是（）。 [单选题] *

A、 Anaconda Navigator

B、. Anaconda Prompt

C、. Spyder

D、. Jupyter Notebook(正确答案)

答案解析：Jupyter Notebook可以重现整个分析过程，并将说明文字、代码、图表、公式和结论都整合在一个文档中

数据分析的一般流程为（）。 [单选题] *

A、明确目的和思路、数据收集、数据处理、数据分析、数据展现(正确答案)

B、.明确目的和思路、数据收集、数据分析、数据展现

C、.数据收集、数据处理、数据分析、数据展现

D、.明确目的和思路、数据处理、数据分析、数据展现

文本分词是预处理过程中必不可少的一个操作。 [判断题] *

对(正确答案)

错

答案解析：暂无解析

余弦相似度与向量的幅值无关，只与向量的方向相关。 [判断题] *

对(正确答案)

错

答案解析：暂无解析

Anaconda中默认已经安装了NLTK库，可以用import导入使用。 [判断题] *

对(正确答案)

错

答案解析：暂无解析

词干提取能够捕捉基于词根的规范单词形式。 [判断题] *

对

错(正确答案)

答案解析：暂无解析

若某个词在这些文本中出现的次数最多，则表示这个单词比较具有代表性。 [判断题] *

对(正确答案)

错

答案解析：暂无解析

如果将cut()函数的cut_all参数设为False，则表示的是按照精确模式进行分词，[判断题] *

对(正确答案)

错

答案解析：暂无解析

nltk.classify是一个用于类别标签标记的模块。 [判断题] *

对(正确答案)

错

答案解析：暂无解析

文本数据可以直接用来分析，不需要做任何处理。 [判断题] *

对

错(正确答案)

答案解析：文本数据并不能直接被用来分析，而是要进行一系列的预处理操作，主要包括分词、词形统一化、删除停用词等。

中文并没有一个形式上的分界符。 [判断题] *

对(正确答案)

错

答案解析：暂无解析

我们可以直接使用pip命令安装jieba库。 [判断题] *

对(正确答案)

错

答案解析：暂无解析

如果两个向量的夹角越小，则表示它们越不相似。 [判断题] *

对

错(正确答案)

答案解析：暂无解析

如果将cut()函数的cut_all参数设为False，则表示按照全模式进行分词。 [判断题] *

对

错(正确答案)

答案解析：暂无解析

NLTK是一套基于Python的自然语言处理工具包。 [判断题] *

对(正确答案)

错

答案解析：暂无解析

NLP主要是实现人与计算机之间用英文进行有效沟通。 [判断题] *

对

错(正确答案)

答案解析：暂无解析

在NLTK中，如果希望给单词标注词性，则需要先确保已经下载了

averaged_perceptron_tagger模块。 [判断题] *

对(正确答案)

错

答案解析：暂无解析

最基本的时间序列就是以时间戳为索引的Series对象。 [判断题] *

对(正确答案)

错

答案解析：暂无解析

若调用shift()方法时传入一个正数，则表明时间序列中的数据会沿着纵轴方向移动一次。 [判断题] *

对(正确答案)

错

答案解析：暂无解析

如果把年份字符串作为索引使用，则可以获取到属于这一年的所有数据。 [判断题] *

对(正确答案)

错

答案解析：暂无解析

时间序列的基础频率后面还可以跟着一个日期偏移量。 [判断题] *

对(正确答案)

错

答案解析：暂无解析

在使用date_range()函数创建DatetimeIndex对象时，必须要保证同时指定start、end、periods、freq中至少三个参数。 [判断题] *

对(正确答案)

错

答案解析：暂无解析

降采样的时间颗粒会变大。 [判断题] *

对(正确答案)

错

答案解析：暂无解析

通过date_range()函数创建DatetimeIndex对象时，如果只是传入了开始日期或结束日期，则还需要用periods参数指定产生多少个时间戳。 [判断题] *

对(正确答案)

错

答案解析：暂无解析

如果是将低频率数据转换到高频率数据，则称为降采样。 [判断题] *

对

错(正确答案)

答案解析：暂无解析

在时间序列中，默认生成的时间戳是按天计算的。 [判断题] *

对(正确答案)

错

答案解析：暂无解析

若调用shift()方法时传入一个正数，则表明时间序列中的数据会沿着纵轴反方向移动一次。 [判断题] *

对

错(正确答案)

答案解析：暂无解析

如果Period对象加上或者减去一个整数，则会根据具体的时间单位进行位移操作[判断题] *

对(正确答案)

错

答案解析：暂无解析

Period对象不支持参与数学运算。 [判断题] *

对

错(正确答案)

答案解析：Period对象能够参与数学运算。如果Period对象加上或者减去一个整数，则会根据具体的时间单位进行位移操作。

在降采样时，时间序列的数据量是增加的。 [判断题] *

对

错(正确答案)

答案解析：暂无解析

在操作时间戳索引时，可以直接使用任何日期字符串来选取子集。 [判断题] *

对

错(正确答案)

答案解析：在操作时间戳索引时，可以直接使用一个日期字符串（符合可以被解析的格式）进行获取。

时间序列的移动是指沿着纵轴方向将数据进行前移或后移。 [判断题] *

对

错(正确答案)

答案解析：暂无解析

PeriodIndex是用来指代一系列时间段的索引结构。 [判断题] *

对(正确答案)

错

答案解析：暂无解析

起始日期与结束日期定义了时间序列索引的严格边界。 [判断题] *

对(正确答案)

错

答案解析：暂无解析

时间序列分析没有任何硬性的要求。 [判断题] *

对

错(正确答案)

答案解析：暂无解析

升采样的时间颗粒是变小的。 [判断题] *

对(正确答案)

错

答案解析：暂无解析

时间序列是不能使用位置索引来获取数据。 [判断题] *

对

错(正确答案)

答案解析：最简单的选取时间序列子集的方式，是直接使用位置索引来获取具体的数据。

位于左上角的子图编号为1。 [判断题] *

对(正确答案)

错

答案解析：暂无解析

每调用一次add_subplot()方法会规划画布划分子图，且只会添加一个子图。 [判断题] *

对(正确答案)

错

答案解析：暂无解析

Figure对象允许划分为多个绘图区域。 [判断题] *

对(正确答案)

错

答案解析：Figure对象允许划分为多个绘图区域，每个绘图区域都是一个Axes对象，它拥有属于自己的坐标系统，被称为子图。

subplot(323)和subplot(3,2,3)是等价的。 [判断题] *

对(正确答案)

错

答案解析：暂无解析

散点图包含的数据点越少，比较的效果就会越好。 [判断题] *

对

错(正确答案)

答案解析：散点图是指数据点在直角坐标系平面上的分布图，通常用于比较跨类别的数据。散点图包含的数据点越多，比较的效果就会越好。

如果希望一次性创建一组子图，则可以通过subplot()函数进行实现。 [判断题] *

对

错(正确答案)

答案解析：暂无解析

直方图可以利用方块的高度来反映数据的差异。 [判断题] *

对(正确答案)

错

答案解析：暂无解析

Figure对象可以理解为一张空白的画布，用于容纳图表的各种组件。 [判断题] *

对(正确答案)

错

答案解析：暂无解析

我们可以调用new()函数构建一张新的空白画布。 [判断题] *

对

错(正确答案)

答案解析：如果不希望在默认的画布上绘制图形，则可以调用figure()函数构建一张新的空白画布。

pyplot模块中默认拥有一个Figure对象。 [判断题] *

对(正确答案)

错

答案解析：暂无解析

agg()方法可以使用用户自定义的函数。 [判断题] *

对(正确答案)

错

答案解析：通过agg()方法进行聚合时，func参数既可以接收Pandas中的内置方法，也可以接收自定义的函数，同时，这些方法与函数可以作用于每一列，也可以将多个函数或方法作用于同一列，还可以将不同函数或方法作用于不同的列。

使用agg()方法进行聚合运算会对产生的标量值进行广播。 [判断题] *

对

错(正确答案)

答案解析：暂无解析

通过agg()方法进行聚合时只能接收单个函数。 [判断题] *

对

错(正确答案)

groupby()方法不能使用函数做为分组键。 [判断题] *

对

错(正确答案)

答案解析：暂无解析

使用Series对象做为分组键时，必须保证Series对象的长度与被分组数组的长度相等。 [判断题] *

对

错(正确答案)

答案解析：如果S如果Series对象的索引长度与Pandas对象的索引长度不相同时，则只会将部分（具有相同索引长度）数据进行分组，而不会将全部的数据进行分组。eries对象的索引长度与Pandas对象的索引长度不相同时，则只会将部分（具有相同索引长度）数据进行分组，而不会将全部的数据进行分组。

使用字典做为分组键时，字典的键必须和数据中的列名相映射。 [判断题] *

对(正确答案)

错

答案解析：暂无解析

只要使用groupby()方法分组，就会产生一个DataFrameGroupby对象 [判断题] *

对

错(正确答案)

答案解析：一般，使用Series调用groupby()方法返回的是SeriesGroupBy对象，而使用DataFrame调用groupby()方法返回的是DataFrameBy对象。

使用transform()方法进行聚合运算，所得对象的行索引与被分组对象的行索引大小一定相等。 [判断题] *

对(正确答案)

错

答案解析：暂无解析

apply()方法可以将某个函数应用到DataFrame对象的每个数据。 [判断题] *

对

错(正确答案)

答案解析：暂无解析

groupby()方法可以将DataFrame中的某个列名做为分组键。 [判断题] *

对(正确答案)

错

答案解析：暂无解析

在箱形图中超出上界和下界的值称为异常值。 [判断题] *

对(正确答案)

错

答案解析：暂无解析

具有多层索引的DataFrame对象经过stack()重塑后，返回的是一个Series对象。[判断题] *

对

错(正确答案)

答案解析：暂无解析

使用merge()函数进行数据合并时，不需要指定合并键。 [判断题] *

对

错(正确答案)

答案解析：暂无解析

fillna()方法处理缺失数据时可以使用Series对象填充，但不可以使用DataFrame对象填充。 [判断题] *

对

错(正确答案)

答案解析：暂无解析

dropna()方法可以删除数据中所有的缺失值。 [判断题] *

对(正确答案)

错

答案解析：暂无解析

drop_duplicated()方法可以删除重复值。 [判断题] *

对

错(正确答案)

答案解析：暂无解析

rename()方法可以重命名索引名。 [判断题] *

对(正确答案)

错

答案解析：暂无解析

缺失数据是人为有意造成的。 [判断题] *

对

错(正确答案)

答案解析：暂无解析

通过merge()函数合并数据时可以指定多个键。 [判断题] *

对(正确答案)

错

答案解析：暂无解析

join()方法可以使用左连接和右连接两种方式连接数据。 [判断题] *对(正确答案)

错

答案解析：暂无解析

read_html()函数可以读取网页中所有的数据。 [判断题] *

对

错(正确答案)

答案解析：read_html()方法只能读取网页中table标签中的数据Series是一个类似于一维数组的对象。 [判断题] *

对(正确答案)

错

答案解析：暂无解析

Series和DataFrame都支持切片操作。 [判断题] *

对(正确答案)

错

答案解析：暂无解析

describe()方法可以一次性输出多个统计指标。 [判断题] *

对(正确答案)

错

答案解析：暂无解析

层次化索引可以交换分层顺序。 [判断题] *

对(正确答案)

错

答案解析：暂无解析

在操作DataFrame对象时，可以通过指定索引名的方式获取数据。 [判断题] *对(正确答案)

错

答案解析：暂无解析

Pandas只有Series和DataFrame两种数据结构。 [判断题] *

对

错(正确答案)

答案解析：Pandas有Series、DataFrame、Panel三种数据结构

DataFrame的结构是由索引和数据组成的。 [判断题] *

对(正确答案)

错

答案解析：暂无解析

Pandas既可以按照索引排序也可以按照数据排序。 [判断题] *

对(正确答案)

错

答案解析：暂无解析

通过from_arrays()方法可以将元组列表转换为MultiIndex对象。 [判断题] *

对

错(正确答案)

答案解析：暂无解析

ndarray对象的数据类型可以通过type()方法进行转换。 [判断题] *

对

错(正确答案)

答案解析：ndarray对象的数据类型可以通astype()方法进行转换

如果两个数组的形状不同，则它们是无法执行算术运算的。 [判断题] *

对

错(正确答案)

答案解析：当数组满足某一维度等长或满足其中一个数组为一维数组时，便可以通过广播机制进行运算。

ndarray对象中的swapaxes()方法可以将两个轴进行转换。 [判断题] *

对(正确答案)

错

答案解析：暂无解析

假设当前有一个3行3列的ndarray数组，如果想要获取第3行第2列的元素，可以使用ndarray[3,2]。 [判断题] *

对

错(正确答案)

答案解析：索引从0开始计数

NumPy支持比Python更多的数据类型。 [判断题] *

对(正确答案)

错

答案解析：暂无解析

NumPy数组不需要循环遍历，即可对每个元素执行批量的算术运算操作。[判断题] *

对(正确答案)

错

答案解析：暂无解析

通过empty()函数创建的数组中所有元素值都是NaN。 [判断题] *

对

错(正确答案)

答案解析：暂无解析

通用函数会对数组中的每一个元素都进行操作。 [判断题] *

对

错(正确答案)

答案解析：暂无解析

如果希望创建一个数组，则只能用array()函数实现。 [判断题] *

对

错(正确答案)

答案解析：暂无解析

sort()方法可以对任何轴上的数据进行排序 [判断题] *

对(正确答案)

错

答案解析：暂无解析

Seaborn是Python中基于Matplotlib的数据可视化工具，它提供了很多高层封装的函数。 [判断题] *

对(正确答案)

错

数据分析是一个有目的地收集和整合数据的过程。 [判断题] *

对

错(正确答案)

答案解析：数据分析的目的在于，将隐藏在一大批看似杂乱无章的数据信息集中提炼出来有用的数据，以找出所研究对象的内在规律，并非只对数据进行收集和整理。

NLTK库适用于处理文本分析。 [判断题] *

对(正确答案)

错

如果要卸载指定环境中的包，则直接使用remove命令移除即可。 [判断题] *

对(正确答案)

错

Jupyter Notebook的优点是可以重现整个分析过程，并将说明文字、代码、图表、公式和结论都整合在一个文档中。 [判断题] *

对(正确答案)

错

使用pip命令也可以查看Anconda安装的包。 [判断题] *

对(正确答案)

错

Anconda是完全免费的。 [判断题] *

对(正确答案)

错

conda是一个在Windows、Mac OS、和Linux上运行的开源软件包管理系统和环境管理系统。 [判断题] *

对(正确答案)

错

Pandas是一个基于NumPy的数据分析包，它是为了解决数据分析任务而创建的。[判断题] *

对(正确答案)

错

Jupyter Notebook可以将文件保存为ipynb格式。 [判断题] *

对(正确答案)

错

下列选项中，关于分组聚合描述正确的是（）。 *

A、拆分是将数据集按照一些标准拆分为若干个组(正确答案)

B、.应用是将某个函数或方法（内置和自定义均可）应用到每个分组(正确答案)

C、.合并是将产生的新值整合到结果对象中(正确答案)

D、.应用函数时只能使用pandas内置的函数

答案解析：暂无解析

下列关于apply()方法说法不正确的是（）。 *

A、apply()方法是对DataFrame每一个元素应用某个函数(正确答案)

B、.apply()方法可以实现transform()方法所有的功能(正确答案)

C、.apply()方法只能够对行列进行操作

D、.对不同列数据应用不同函数(正确答案)

答案解析：暂无解析

关于GroupBy对象，下列描述正确的是（） *

A、DataFrame经过分组后得到了一个DataFrameGroupBy对象(正确答案)

B、.Series经过分组后得到了一个SeriesGroupBy对象(正确答案)

C、.能够直接查看结果

D、.采用惰性计算(正确答案)

答案解析：暂无解析

下列关于groupby()方法的使用，描述不正确的是（） *

A、分组键可以是一个Series对象

B、.使用字典做为分组键时，对字典中的数据没有任何要求(正确答案)

C、.函数不可以做为分组键(正确答案)

D、.返回的结构能够直接查看

答案解析：暂无解析

下列选项中，关于transform()方法描述不正确的是（）。 *

A、会对标量值产生广播操作

B、.返回的数据可以与被分组数据形状相等(正确答案)

C、.可以对每一列数据应用不同的函数

D、.可以对不同的数据应用不同的函数(正确答案)

答案解析：暂无解析

下列选项中，属于agg()方法使用方式的是（）。 *

A、对每一列数据应用同一个函数(正确答案)

B、.对某列数据应用不同的数据(正确答案)

C、.对不同列数据应用不同函数(正确答案)

D、.对结果进行广播操作

答案解析：暂无解析

下列有关agg()方法描述正确的是（）。 *

A、可以对每一列数据应用不同的函数(正确答案)

B、.只能接收一个函数

C、.会对结果进行广播操作

D、.可以对不同的数据应用不同的函数(正确答案)

答案解析：暂无解析

当使用groupby()方法分组时，下列选项中可以作为分组方式的是（）。 *

A、列表或数组(正确答案)

B、.DataFrame中某列的名称(正确答案)

C、.字典或Series(正确答案)

D、.集合

答案解析：暂无解析

下列函数中，可以对数据进行的合并的是（）。 *

A、concat()(正确答案)

B、.join()(正确答案)

C、.merge()l(正确答案)

D、.combine_first()(正确答案)

答案解析：暂无解析

下列选项中，关于数据预处理说法错误的是（）。 *

A、数据清洗包含了数据标准化、数据合并和缺失值处理(正确答案)

B、数据合并按照合并轴的方向主要分为左连接、右连接、内连接和外连接(正确答案)

C、数据分析的预处理过程包括数据清洗、数据合并、数据标准化和数据转换，它们之间存在交叉，没有严格的先后关系

D、.数据标准化的主要对象是类别型特征(正确答案)

答案解析：暂无解析

下列方法中，可以修改数据类型的是（）。 *

A、astype()(正确答案)

B、to_numberic()(正确答案)

C、dim()

D、type()

答案解析：暂无解析

检测出异常值之后，通常会采用哪些方式处理它们？（） *

A、直接将含有异常值的记录删除(正确答案)

B、用具体的值来进行替换，可用前后两个观测值的平均值修正该异常值(正确答案)

C、不处理，直接在具有异常值的数据集上进行统计分析(正确答案)

D、视为缺失值，利用缺失值的处理方法修正该异常值(正确答案)

答案解析：暂无解析

下列关于重复值处理的说法中，正确的是（）。 *

A、duplicated()方法可以标记重复数据

B、drop_duplicates()方法用于删除重复数据(正确答案)

C、重复数据的判断标准是两个数据中所有条目的值都相等(正确答案)

D、duplicated()方法支持从前向后和从后向前两种查找模式(正确答案)

答案解析：duplicated()方法用于标记重复数据。

关于Pandas中的数据重塑，下列说法正确的是（）。 *

A、stack()方法可以将列索引转换为行索引(正确答案)

B、unstack()方法可以将列索引转换为行索引

C、当一个DataFrame通过pivot()方法经过轴向旋转后返回一个新的DataFrame(正确答案)

D、pivot()方法可以将列索引转换为行索引

答案解析：暂无解析

关于预处理中的数据合并，下列说法中错误的是（）。 *

A、concat()函数是最常用的主键合并函数，可以通过内连接和外连接的方式堆叠合并数据(正确答案)

B、merge()函数是最常用的主键合并的函数，但不能够通过左连接和右连接的方式合并数据(正确答案)

C、join()方法是最常用的主键合并方法之一，但不能够通过左连接和右连接的方式合并数据(正确答案)

D、combine_first()方法只适用于DataFrame对象(正确答案)

答案解析：暂无解析

下列关于异常值检测的说法中正确的是（）。 *

A、在使用3σ原则检测异常值时需要保证数据遵守正态分布(正确答案)

B、检测出的异常值不一定会被删除(正确答案)

C、.检测出的异常值一定会被删除

D、Pandas中可以使用boxplot()方法绘制箱形图，以实现对数据中的异常值进行检测(正确答案)

答案解析：异常值会根据实际情况选择删除还是保留。

关于空值和缺失值，下列说法中正确的是（）。 *

A、NaN和None是完全一样的

B、.使用isnull()可以检测数据中是否存在空值或缺失值(正确答案)

C、notnull()与isnull()方法都可以判断数据中是否存在空值或缺失值(正确答案)

D、dropna()方法可以删除空值和缺失值(正确答案)

答案解析：暂无解析

Pandas的数据结构有（）。 *

A、Series(正确答案)

B、.DataFrame(正确答案)

C、C.Panel(正确答案)

D、D.Vector

答案解析：暂无解析

对于Pandas索引操作，下列说法错误的是（）。 *

A、可通过指定索引名的方式进行选取(正确答案)

B、swaplevel()方法可以将层次索引的位置进行交换(正确答案)

C、sort_index()方法会对层次索引进行排序(正确答案)

D、在使用sort_index()方法排序时，会优先选择按内层索引进行排序

答案解析：暂无解析

下列关于Pandas层次化索引说法正确的是（）。 *

A、层次化索引是指Pandas对象在一个轴方向上具有多层索引(正确答案)

B、使用from_tuples()方法可以将列表转换为MultiIndex对象(正确答案)

C、使用from_arrays()方法可以将数组列表转换为MultiIndex(正确答案)

D、层次化索引不可以排序

答案解析：层次化索引可以使用sort_index对索引进行排序

关于读写excel文件的说法中，下列描述正确的是（）。 *

A、to_excel()方法表示将结构化数据写入到Excel文件中(正确答案)

B、.to_excel()方法表示将结构化数据读取到DataFrame中

C、.read_excel()函数表示将结构化数据读取到DataFrame中(正确答案)

D、.read_excel()函数表示将结构化数据写入到DataFrame中

答案解析：暂无解析

下列关于Pandas的索引说法正确的是（）。 *

A、Pandas中的索引都是Index类对象(正确答案)

B、索引对象是可修改的

C、索引对象是不可修改的(正确答案)

D、Index对象是可以共享的(正确答案)

答案解析：索引对象是不可以修改的

关于读取网页表格数据的说法中，下列描述正确的是（）。 *

A、使用read_html()函数可以读取网页表格数据(正确答案)

B、read_html()函数返回一个DataFrame对象

C、read_html()函数返回一个DataFrame列表对象(正确答案)

D、read_html()函数只能对网页中的table标签进行读取(正确答案)

答案解析：read_html()方法返回的是一个DataFrame列表

下列方法中可以读取数据库数据的是（）。 *

A、read_sql()(正确答案)

B、read_table()(正确答案)

C、read_sql_query()(正确答案)

D、read_query()

答案解析：在读取数据库数据中没有read_query()方法

下列关于Series说法正确的是（）。 *

A、Series是一个类似一维数组的对象(正确答案)

B、Series可以保存任何类型的数据(正确答案)

C、Series由数据和索引构成(正确答案)

D、Series结构的数据位于索引的左侧(正确答案)

答案解析：暂无解析

下列Pandas方法中，用于求最大值和最小值的是（）。 *

A、sum

B、mean

C、max(正确答案)

D、min(正确答案)

答案解析：暂无解析

下列函数中，可以创建NumPy数组的是（）。 *

A、array()(正确答案)

B、.zeros()(正确答案)

C、C.empty()(正确答案)

D、D.ones()(正确答案)

答案解析：暂无解析

关于数组排序 *

A、当数组使用sort()方法后，数组默认从小到大进行排序(正确答案)

B、.当数组使用sort()方法后，数组默认从大到小进行排序

C、.sort()方法可以对任何一个轴上的元素进行排序(正确答案)

D、.sort()方法排序不会修改数组本身

答案解析：暂无解析

NumPy数组的转置可以通过（）实现。 *

A、transpose()(正确答案)

B、.reshape()

C、.T(正确答案)

D、.transform()。

答案解析：Numpy数组的转置可通过transpose()和T属性实现

下列关于随机数模块描述正确的是（）。 *

A、NumPy的random模块具有更多的随机数功能(正确答案)

B、.random模块中包括生成服从多种概率分布随机数的函数(正确答案)

C、.numpy.random模块中有用于生成大量样本值的函数(正确答案)

D、.rand()函数隶属于numpy.random模块(正确答案)

答案解析：暂无解析

已知有如下一个数组：arr = np.array([-101])下列选项中，哪个执行后的结果为True？（） *

A、np.any(arr > 0)(正确答案)

B、.np.any(arr (正确答案)

C、.np.all(arr == 0)

D、.np.all(arr > 0)

答案解析：暂无解析

关于数组广播的说法中，下列描述错误的是（）。 *

A、两个数组的某一维度等长。(正确答案)

B、.数组的某一维度为1。(正确答案)

C、.数组广播机制可以对任意两个数组进行扩展(正确答案)

D、.广播机制优先扩展维度小的数组

答案解析：暂无解析

下列关于通用函数的说法中正确的是（）。 *

A、通用函数是一种针对ndarray中的数据执行元素级运算的函数(正确答案)

B、.通用函数会返回一个新的数组(正确答案)

C、.通用函数只可以接收一个参数

D、.通用函数分为一元通用函数与二元通用函数(正确答案)

答案解析：暂无解析

下列关于ndarray索引说法正确的是（）。 *

A、可以使用整数进行索引(正确答案)

B、.可以使用整数数组进行索引(正确答案)

C、.可以使用元组进行索引

D、.可以使用布尔数组进行索引(正确答案)

答案解析：ndarray支持使用整数、整数数组、布尔数组进行索引

下列关于多维数组切片的描述正确的是（）。 *

A、在选取元素时可以传入一个切片(正确答案)

B、.在选取元素时可以传入多个切片(正确答案)

C、.在选取元素时可以将切片与整数索引混合使用(正确答案)

D、.在选取元素时不可以传入一个切片

答案解析：暂无解析

关于数组统计运算，下列说法中正确的是（）。 *

A、sum()方法表示对数组中全部或某个轴向的元素求和(正确答案)

B、.mean()方法表示计算平均值(正确答案)

C、.argmin()方法表示计算数组中的最小值

D、.argmax()方法表示计算数组中的最大值

答案解析：暂无解析

在统计学领域中，数据分析可以划分为（）。 *

A、描述性数据分析(正确答案)

B、.操作性数据分析

C、探索性数据分析(正确答案)

D、验证性数据分析(正确答案)

答案解析：在统计学领域中，数据分析可以划分为描述性分析、探索性分析、验证性数据分析

Jupyter Notebook可以将文件保存为哪些格式？（） *

A、html(正确答案)

B、.ipynb(正确答案)

C、.pdf(正确答案)

D、.py(正确答案)

答案解析：Jupyter Notebook默认保存的格式为ipynb，但是可以导出html、pdf、py等格式文件。

下列选项中，属于数据处理的目的是（）。 *

A、使数据更加适用于分析(正确答案)

B、.对无意义的数据进行清洗(正确答案)

C、.整合数据(正确答案)

D、.提高数据质量(正确答案)

答案解析：暂无解析

关于Pandas特点的描述中，下列描述正确的是（）。 *

A、智能数据对齐和缺失数据的集成处理(正确答案)

B、.基于标签的切片、花式索引和大数据集的子集(正确答案)

C、.按数据分组进行聚合和转换(正确答案)

D、.具有时间序列功能(正确答案)

答案解析：暂无解析

关于Anconda的特点，下列描述正确的是（）。 *

A、完全开源和免费(正确答案)

B、.仅支持Linnux、windows系统

C、.包含了众多流行的科学、数学、工程和数据分析的Python库(正确答案)

D、.Anconda支持Python3.x以上的版本

答案解析：Anaconda发行版本具有以下的特点：(1) 包含了众多流行的科学、数学、工程和数据分析的Python库。(2) 完全开源和免费。(3) 额外的加速和优化是收费的，但对于学术用途，可以申请免费的License。(4) 全平台支持Linux、Windows、Mac OS X，支持Python 2.6、2.7、3.4、3.5、3.6，可以自由切换。

下列关于Matplotlib库描述正确的是（）。 *

A、Matplotlib是一个用在 Python 中绘制数组的2D 图形库(正确答案)

B、.Matplotlib主要用纯Python语言进行编写(正确答案)

C、.Matplotlib起源于模仿MATLAB图形命令(正确答案)

D、.Matplotlib主要用纯Java语言进行编写

答案解析：暂无解析

下列选项中，属于描述性数据分析的方法有（）。 *

A、对比分析法(正确答案)

B、.平均分析法(正确答案)

C、.交叉分析法(正确答案)

D、.因子分析法

答案解析：在描述性分析中常见的方法有对比分析法、平均分析法、交叉分析法。

下列工具中，能够用于数据分析的是（）。 *

A、NumPy(正确答案)

B、.Pandas(正确答案)

C、.Matplotlib(正确答案)

D、.Seaborn(正确答案)

答案解析：常见的数据分析库有NumPy、Pandas、Matplotlib、Seaborn、NLTK等Anconda支持哪些操作系统？（） *

A、Windows(正确答案)

B、.Mac OS(正确答案)

C、.Linux(正确答案)

D、.Android

答案解析：根据Anconda发行版本可知，支持Linux、Windows、Mac系统

下列选项中属于NumPy功能的是（）。 *

A、快速高效的多维数据对象ndarray(正确答案)

B、.高性能科学计算和数据分析的基础包(正确答案)

C、.多维数组（矩阵）具有矢量运算能力，快速、节省空间(正确答案)

D、.线性代数、随机数生成以及傅里叶变换功能(正确答案)

答案解析：Numpy是大部分Python科学计算的基础，它具有以下功能：(1) 快速高效的多维数据对象ndarray。(2) 高性能科学计算和数据分析的基础包。(3) 多维数组（矩阵）具有矢量运算能力，快速、节省空间。(4) 矩阵运算。无需循环，可完成类似Matlab中的矢量运算。(5) 线性代数、随机数生成以及傅里叶变换功能。

推荐访问:python数据分析报告总结题库分析数据