《大数据基础与应用》期末试卷及答案2套.docxVIP

《大数据基础与应用》期末试卷及答案2套.docx

  1. 1、本文档共7页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
期末试卷秘密 《大数据基础》(课程代码:) 中It得分 中 It 得分 评卷人 单项选择题(每题2分,共20分) 1、当前大数据技术的基础是由()首先提出的。。 A:微软B:百度C:谷歌D:阿里巴巴2、大数据的起源是()。 A:金融B:电信C:互联网D:公共管理3、大数据的最显著特征是()。 A:数据规模大B:数据类型多样 C:数据处理速度快D:数据价值密度高4、美国海军军官莫里通过对前人航海日志的分析,绘制了新的航海路线图,标明了大风与洋 流可能发生的地点。这表达了大数据分析理念中的()。 A:在数据基础上倾向于全体数据而不是抽样数据 B:在分析方法上更注重相关分析而不是因果分析 C:在分析效果上更追究效率而不是绝对精确 D:在数据规模上强调相对数据而不是绝对数据 5、以下关于舍恩伯格对大数据特点的说法中,错误的选项是()o A:数据规模大 B:数据类型多样 C:数据处理速度快D:数据价值密度高6 6、 7、 8、 6、7、8、当前社会中,最为突出的大数据环境是()。A:互联网 6、 7、 8、 当前社会中,最为突出的大数据环境是()。 A:互联网 B:物联网 在数据生命周期管理实践中,() A:数据存储和备份规范 C:数据价值觉察和利用 以下国家的大数据开展行动中, C:综合国力 I):自然资源 是执行方法。 B:数据管理和维护 D:数据应用开发和管理 集中表达“重视基础、首都先行”的国家是( A:美国 B:日本 C:中国 D:韩国 9、以下关于大数据的分析理念的说法中,错误的选项是()。 A:在数据基础上倾向于全体数据而不是抽样数据 B:在分析方法上更注重相关分析而不是因果分析 C:在分析效果上更追究效率而不是绝对精确 I):在数据规模上强调相对数据而不是绝对数据 10、万维网之父是(). A:彼得?德鲁克 B:舍恩伯格 C:蒂姆?伯纳斯-李D:斯科特?布朗得分 得分 评卷人 得分评卷人填空题(每空2分,共10分)1、IBM公司用3 得分 评卷人 填空题(每空2分,共10分) 2、大数据环境下的隐私担忧,主要表现为。 3、当前大数据技术的基础包括、、. 4、数据仓库的最终目的是 5、按照涉及自变量的多少,可以将回归分析分为评卷人 评卷人 评卷人判断题(每题 评卷人 判断题(每题2分,共20分) 1、在噪声数据中,波动数据比离群点数据偏离整体水平更大。() 2、对于大数据而言,最基本、最重要的要求就是减少错误、保证质量。因此,大数据提供的 信息量要尽量精确。() 3、一般而言,分布式数据库是指物理上分散在不同地点,但在逻辑上是统一的数据库。因此 分布式数据库具有物理上的独立性、逻辑上的一体性、性能上的可扩展性等特点。() 4、具备很强的报告撰写能力,可以把分析结果通过文字、图表、可视化等多种方式清晰地展 现出来,能够清楚地论述分析结果及可能产生的影响,从而说服决策者信服并采纳其建议,是 数据分析能力对大数据人才的基本要求。() 5、谷歌流感趋势充分表达了数据重组和扩展对数据价值的重要意义。() 6、决策树是一种基于树形结构的预测模型,每一个树形分叉代表一个分类条件,叶子节点代 表最终的分类结果,其优点在于易于实现,决策时间短,并卜L适合处理非数值型数据。() 7、信息生命周期管理是据生命周期管理的来源,最早由英国企业提出。() 8、简单随机抽样,是从总体N个对象中任意抽取n个对象作为样本,最终以这些样本作为调查 对象。在抽取样本时,总体中每个对象被抽中为调有样本的概率可能会有差异。() 9、啤酒与尿布的经典案例,充分表达了实验思维在大数据分析理念中的重要性。() 10、对于企业来说,给用户进行各种促销或者实施运营策略的时机也比拟重要,而且对不同 兴趣偏好的用户最好集中处理。()评卷人 评卷人 评卷人四、简答题(每题 评卷人 四、简答题(每题10分,共40分) 1、搜索引擎的产生和开展经历了哪几个阶段?试简述各阶段的特点。 2、大数据时代数据的存储与管理与传统数据存储方式有何区别? 3、常用的数据整理技术有哪些? 4、简述大数据存储的概念。 (共4页) 秘密期末试卷 秘密 得分评卷人单项选择题(每题2分,共20分) 得分 评卷人 单项选择题(每题2分,共20分) 行分 评卷入 七、 判断题(每题2分,共20分) I、搜索引擎中用户查询所得的信息是()<> A.直接在互联网中获取的 B.存储在网络数据库中的 C.来自某个网站的 D.与网页连接显示的2、对于搜索引擎蜘蛛(Google称之为机器人)程序来讲有三种页面非常重要,以下哪种页面 不属于其中?() A.从未抓取过的新页面 B.页面内容之前被采集过但有所改动的页面 C.已被删除掉的之前被采集过的页面 D.搜索引擎蜘蛛的起始页面3、以下不属于搜索引擎评价指标的是()。 A.

文档评论(0)

suzhiju + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

认证主体舒**

1亿VIP精品文档

相关文档

相关课程推荐