300字范文,内容丰富有趣,生活中的好帮手!
300字范文 > 大数据技术原理与应用第10讲:Spark

大数据技术原理与应用第10讲:Spark

时间:2020-02-22 20:43:32

相关推荐

大数据技术原理与应用第10讲:Spark

Spark单元测验

1单选(2分)

Spark SQL目前暂时不支持下列哪种语言

A.Python

B.Java

C.Matlab

D.Scala

2单选(2分)

RDD操作分为转换(Transformation)和动作(Action)两种类型,下列属于动作(Action)类型的操作的是

A.map

B.count

C.groupBy

D.filter

3单选(2分)

下列说法错误的是

A.RDD提供的转换接口既适用filter等粗粒度的转换,也适合某一数据项的细粒度转换

B.Spark支持三种类型的部署方式:Standalone,Spark on Mesos,Spark on YARN

C.在选择Spark Streaming和Storm时,对实时性要求高(比如要求毫秒级响应)的企业更倾向于选择流计算框架Storm

D.RDD采用惰性调用,遇到“转换(Transformation)”类型的操作时,只会记录RDD生成的轨迹,只有遇到“动作(Action)”类型的操作时才会触发真正的计算

4单选(2分)

下列关于常见的动作(Action)和转换(Transformation)操作的API解释错误的是

A.count():返回数据集中的元素个数

B.filter(func):筛选出满足函数func的元素,并返回一个新的数据集

C.take(n):返回数据集中的第n个元素

(应该是前n个)

D.map(func):将每个元素传递到函数func中,并将结果返回为一个新的数据集

5单选(2分)

下列大数据类型与其对应的软件框架不适应的是

A.复杂的批量数据处理:MapReduce

B.基于实时数据流的数据处理:Storm

C.图结构数据的计算:Hive

D.基于历史数据的交互式查询:Impala

6多选(3分)

Apache软件基金会最重要的三大分布式计算系统开源项目包括

A.Storm

B.Hadoop

C.MapReduce

D.Spark

7多选(3分)

Spark的主要特点包括

A.运行模式多样

B.运行速度快

C.通用性

D.容易使用

8多选(3分)

下列关于Scala的说法正确的是

A.Scala是一种多范式编程语言

B.Scala运行于Java平台,兼容现有的Java程序

C.Scala具备强大的并发性,支持函数式编程

D.Scala是Spark的主要编程语言,但Spark还支持Java、Python、R作为编程语言

9多选(3分)

Spark的运行架构包括

A.集群资源管理器 Cluster Manager

B.每个工作节点上负责具体任务的执行进程 Executor

C.运行作业任务的工作节点 Worker Node

D.每个应用的任务控制节点 Driver

10填空(2分)

RDD,中文全称是弹性分布式数据集,是分布式内存的一个抽象概念,提供了一种高度受限的共享内存模型。

本内容不代表本网观点和政治立场,如有侵犯你的权益请联系我们处理。
网友评论
网友评论仅供其表达个人看法,并不表明网站立场。