数据科学数据存储数据分析试题库案例.docx

数据科学数据存储数据分析试题库案例.docx

  1. 1、本文档共26页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多

默认试卷名称

共:【6大题】【满分424.0分】考试时间:【60分钟】

一、单选题(共79题,共158.0分)

1、数据挖掘的目的是发现数据中蕴藏的()(2.0分)

A、信息

B、知识

C、规则

D、模式

答案:B

解析:无解析

2、根据时间序列型数据,由历史和当前数据去推测未来的知识是()(2.0分)

A、预测型知识

B、偏差型知识

C、关联知识

D、分类知识

答案:A

解析:无解析

3、KDD是指()(2.0分)

A、领域知识发现

B、文档知识发现

C、数据库知识发现

D、动态知识发现

答案:C

解析:无解析

4、使用交互式和可视化技术,对数据进行探索属于数据挖掘的()任务(2.0分)

A、探索性数据分析

B、建模描述

C、预测建模

D、寻找模式和规则

答案:A

解析:无解析

5、最常用的挖掘关联规则频繁项目集的算法是()(2.0分)

A、FP-树频集算法

B、基于划分的算法

C、Apriori算法

D、聚类算法

答案:C

解析:无解析

6、MapReduce框架中,在Map和Reduce之间的combiner的作用是()(2.0分)

A、对Map的输出结果排序

B、对中间过程的输出进行本地的汇集,提高效率

C、对中间结果进行混洗

D、对中间格式进行压缩

答案:B

解析:无解析

7、DataNode上有一系列的线程,其中用于确认节点是否死掉的是()(2.0分)

A、hbthread

B、lmthread

C、smmthread

D、replthread

答案:A

解析:无解析

8、以块的概念来说,HDFS的默认大小是()(2.0分)

A、8MB

B、16MB

C、32MB

D、64MB

答案:D

解析:无解析

9、RAID5级别的RAID组的磁盘利用率(N:镜像盘个数)为()(2.0分)

A、1/N

B、100%

C、(N-1)/N

D、1/2

答案:C

解析:无解析

10、iSCSI和SAN适用的协议分别为()(2.0分)

A、TCP/IP,SMTP

B、TCP/IP,FC

C、UDP,SMTP

D、UDP,FC

答案:B

解析:无解析

11、基于SMB共享存储虚拟机的优点是()(2.0分)

A、易于设置和管理

B、较高灵活性,较低成本

C、管理门槛低

D、以上都对

答案:D

解析:无解析

12、Google的分布式数据库为()(2.0分)

A、GFS

B、MapReduce

C、Chubby

D、Bigtable

答案:D

解析:无解析

13、大数据技术应用繁多,应用最广泛的大数据平台级软件是()(2.0分)

A、MongoDB

B、OracleBig-DataAppliance(BDA)

C、MPP

D、Hadoop

答案:D

解析:无解析

14、某公司传统业务数据存放在MySQL数据库中,近期公司将数据迁移到大数据平台分布式文件系统,最适合的工具是()(2.0分)

A、ApacheSpark

B、ApacheFlume

C、ApacheSqoop

D、没有合适的工具

答案:C

解析:无解析

15、大数据的数据库(NoSQL)与关系型数据库的区别是()(2.0分)

A、水平扩展与垂直扩展

B、是否支持事务的ACID

C、应用中两种数据库互相补充

D、以上都是

答案:D

解析:无解析

16、大数据并不都是全新的技术,如文件系统(如Ext4),数据库(如Oracle),一直到大数据的文件系统(HDFS),分布式数据库(NoSQL系列)在数据管理方面都秉承一个思路是()(2.0分)

A、需要对显示中的数据进行抽象

B、数据与元数据分开管理

C、都需要数据模型(Datamodel)的支撑

D、以上都是

答案:B

解析:无解析

17、传统OLTP数据管理平台(如Oracle)数据达到()量级时,就失去性能优化的空间(2.0分)

A、10+TB级别

B、100+TB级别

C、PB级别

D、100+GB级别

答案:B

解析:无解析

18、与开源云计算系统HadoopHDFS相对应的商用云计算软件系统是()(2.0分)

A、GoogleGFS

B、GoogleMapReduce

C、GoogleBigtable

D、GoogleChubby

答案:A

解析:无解析

19、Google文件系统(GFS)分块默认的块大小是()(2.0分)

A、32MB

B、64MB

C、128MB

D、16MB

答案:B

解析:无解析

20、Google文件系统(GFS)分成固定大小的块,每个块都有一个对应的()(2.0分)

A、代理

B、结点

C、

文档评论(0)

专注计算机课程领域的教学多年,各种文章定制。

1亿VIP精品文档

相关文档