搜索
您的当前位置:首页正文

大数据导论期末考试试卷

来源:小奈知识网
大数据导论期末考试试卷

大数据导论期末考试试卷题量: 27 满分:100.0 截止日期:2020-06-25 16:00

一、单选题

1.分布式系统比较常见的数据分布方式有() A、哈希方式 B、按数据范围分布 C、按数据量分布 D、一致性哈希 E、以上都是 我的答案:E

2.以下选项不属于可视化基本特征的是() A、易懂性 B、全面性 C、必然性 D、专业性 我的答案:B

3.数据清洗的方法有() A、填充缺失值 B、修改错误值 C、消除重复记录 D、以上都是 我的答案:D

4.以下不属于云计算的服务模式的选项是() A、IaaS B、PaaS C、SaaP D、SaaS 我的答案:C

5.哪一年是中国的微博元年? A、2008 B、2009 C、2010 D、2011 我的答案:C

6._是大数据的前沿技术。 A、数据处理 B、数据分析 C、数据定义 D、数据结构 我的答案:B

7.大数据赖以生存的土壤是_。 A、互联网 B、物联网 C、网络信息 D、前沿技术 我的答案:A 二、多选题

1.以下是大数据存储面临的挑战的选项是() A、系统问题 B、数据问题 C、应用问题 D、管理问题 我的答案:ACD

2.目前来说,以下选项是解决数据集成的主要难题的是。 A、异构性 B、 分布性 C、自治性

我的答案:AB

3.数据挖掘常用算法有() A、分类 B、聚类 C、特征分析 D、决策树归纳法 我的答案:ABCD

4.大数据的采集方法有() A、系统日志采集方法 B、网络数据采集方法 C、数据库采集 D、以上都不正确 我的答案:AB

5.以下属于云计算的特点的是() A、资源池弹性可扩张 B、虚拟化 C、以人为中心 D、高可靠和安全性 我的答案:ABD 三、判断题

1.大数据分析是大公司或是科技大厂的专利。 我的答案:×

2.数据预处理是指在主要的处理后对数据进行的一些处理。我的答案:×

3.只要有数据,就必然存在安全与隐私的问题。

4.在数据处理方面,有一个著名的“一秒定律”,即要在秒级时间范围内给出分析结果,超出这个时间,数据就失去价值。

我的答案:√

5.与Oracle性能关系最大的是SGA。 我的答案:√

四、填空题

1.存储系统的类别有()、()、() 我的答案: 第一空:块存储 第二空:文件存储 第三空:对象存储

2.NoSQL数据库是()的缩写。 我的答案:

第一空:Not Only SQL

3.()是大数据分析和应用的基础,()和()是数据分析的第一步。

我的答案: 第一空:数据 第二空:数据采集 第三空:预处理

4.大数据的4V特征分别是(),(),(),() 我的答案:

第一空:容量大(Volume) 第二空:多样性(Variety) 第三空:价值高(Value) 第四空:速度快(Velocity) 5.Hadoop核心模块包括()和() 我的答案: 第一空:HDFS 第二空:MapReduce 五、简答题

1.列举常用的大数据可视化软件与工具。 我的答案: Excel Processing

ECharts

2.数据集市与数据仓库的区别。 我的答案:

数据仓库向各个数据集市提供数据。前者是企业级,规模较大,后者是部门级,相对规模较小。

若干个部门的数据集市组成一个数据仓库。数据集市开发周期短、速度快,数据仓库开发周期长、速度慢。

从其数据特征进行分析,数据仓库中数据结构采用规范化模式,数据集市中的数据结构采用星型模式。通常数据仓库中的数据粒度比数据集市中的粒度要细。

3.述数据仓库的构建步骤。 我的答案:

数据抽取、数据转换、数据装载、元数据管理 4.请回答大数据的4V特征? 我的答案: 容量大(Volume) 多样性(Variety) 价值高(Value) 速度快(Velocity) 5.简述什么是数据采集? 我的答案:

是大数据生命周期中的第一个环节,通过RFID射频数据、传感器数据、社交网络数据、移动互联网数据等方式获得各种类型的结构化、半结构化、即非结构化的海量数据。

因篇幅问题不能全部显示,请点此查看更多更全内容

Top