国开《大数据技术概论》考试复习题-字母排序.pdf

国开《大数据技术概论》考试复习题-字母排序.pdf

  1. 1、本文档共5页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多

字母排序

一、单项选择题

假设散点图中的观测点分布较为分散,没有任何规律,说明两个变量之间的关系为

()。A.完全线性相关B.线性相关C.非线性相关D.不相关

2.假设散点图中的观测点恰好落在一条直线上,说明两个变量之间的关系为()。A.

完全线性相关B.线性相关C.非线性相关D.不相关

3.可以用来查看数值型变量的分布的可视化方法是()。A.箱线图B.直方图C.小提琴

图D.以上方法均可以

4.如果要反映某学生在6个学期中每学期平均成绩的变化情况,采用()可视化方法

较为合适。A.饼图B.折线图C.散点图D.直方图

5.如果只是研究两个数值变量之间的关系,最常见的可视化方法是()。A.直方图B.

散点图C.饼图D.折线图

6.数据异常值的处理方法不包括()。A.极小值替换B.删除C.忽略D.视为缺失值进行

填补

7.为表示一组数据的分布特征,反映数据分布是否对称时,常用的可视化方法是()。

A.箱线图B.气泡图C.折线图D.散点图

8.下列各项不能用于描述数据集中趋势的是()。A.方差B.平均数C.中位数D.峰值

9.下列各项不属于Hadoop的特点是()。A.存储迅速B.成本高C.计算能力强D.灵活

性强

10.下列各项不属于大数据特征的是()。A.体量大B.种类多C.真实性D.数据生成慢

11.下列各项不属于批处理系统的特点的是()。A.可以实现实时的分析报告或自动响

应B.可以实现无缝扩展以处理峰值数据量或数据请求C.支持数据在不同系统之间进

行交换D.支持作业执行状态的监控

12.下列各项不属于批处理系统的特点的是()。A.为开发者提供了一个简单、快捷的

支持各种数据格式的处理C.支持数据在不同系统之间进行交换可以实

现实时的分析报告或自动响应

13.下列各项不属于数据的是()。A.文本B.图像C.视频D.印象

14.下列各项关于分类的描述中,错误的是()。A.可以借助分类方法根据电子邮件的

标题判断其是否为垃圾邮件B.在进行建模之前就要有明确的分组预测目标C.k近邻

算法是一种简单但强大的分类算法D.用来建立分类模型的输入数据称为测试集

15.下列各项关于聚类的描述中,错误的是()。A.可以借助聚类方法进行异常检测B.

在进行建模之前就要有明确的分组预测目标C.可以利用聚类分析发现具有相似功

能的基因组D.根据数据本身的自然结构对数据进行分组

16.下列各项属于非结构化数据的是()。A.图像B.二维数据表C.HTML文档D.以上均

17.下列各项属于合规数据的是()。A.非法收集隐私信息数据B.取得使用者同意的个

人资料数据C.泄露的隐私信息数据D.垄断数据

18.下列各项属于结构化数据的是()。A.图像B.二维数据表C.声音D.文本

19.下列各项属于数据仓库的特点的是()。A.数据以主题为导向,提供决策支持B.数

据源单一C.数据质量低D.不支持历史数据分析

20.下列关于缺失值的描述中,错误的是()。A.缺失值是指数据集中有些变量的一个

或多个取值无法获得B.数据缺失的现象大量存在C.回归插补的方法不会改变数据

分布D.当缺失数据的记录所占比例在数据集中少于10%时,可以将缺失值直接删除

21.下列关于异常值的描述中,错误的是()。A.可以使用箱线图检测异常值B.当异常

值的数量不是很多时,可以直接将含有异常值的观测记录删除C.可以将异常值视为

缺失值,按处理缺失值的方法处理异常值D.异常值的存在不属于数据质量问题,不

会影响模型的预测能力

22.下列属于图数据的主要特性的是()。A.数据驱动计算B.不规则问题C.高数据访问

以上均是

23.下面不是研究数据方法的是()。A.统计学B.机器学习C.心理分析D.数据挖掘

24.下面不属于大数据的处理过程的是()。A.数据获取B.数据清洗C.数据分析D.数据

安全

25.下面不属于大数据计算模式的类型的是()。A.批量计算B.手动计算C.流式计算D.

交互式计算

26.在Hadoop生态系统中,主要负责节点集群的任务调度和资源分配,将存储

您可能关注的文档

文档评论(0)

各类考试卷精编 + 关注
官方认证
内容提供者

各类考试卷、真题卷

认证主体社旗县兴中文具店(个体工商户)
IP属地河南
统一社会信用代码/组织机构代码
92411327MAD627N96D

1亿VIP精品文档

相关文档