联通研究院《Spark计算框架应用与实践》测试题
关于
1年前
更新
1
频次
30
题目数
分享

有问题?问问AI帮你修改 改主题:如咖啡问卷改为奶茶问卷
感谢您能抽出几分钟时间来参加本次答题,现在我们就马上开始吧!
Q1:姓名
Q2:单位部门
Q3:手机号码
:一、单选题(每题4分,共80分)
Q4:以下哪一个不是Spark的组件?
Q5:大数据研究的核心问题是?
Q6:搭建一个数据仓库可能需要使用哪些技术?
Q7:启动HDFS的命令是?
Q8:Spark 的四大组件下面哪个不是_____
Q9:Spark Core的核心数据模型是________
Q10:Spark SQL的核心数据模型是________
Q11:Spark Stream的核心数据模型是________
Q12:Spark SQL默认支持分析语句是________
Q13:park SQL默认的数据源是________
Q14:下面哪个端口是Spark Web服务的端口( )
Q15:下面哪个不是 RDD 的特点 ( )
Q16:Spark 支持的分布式部署方式中哪个是错误的 ( )
Q17:下面哪个操作是宽依赖 ( )
Q18:下面哪个操作肯定是窄依赖 ( )
Q19:下面哪个操作肯定是窄依赖 ( )
Q20:生产上Spark HA应使用哪种模式? ( )
Q21:列哪个不是 RDD 的缓存方法 ( )
Q22:DataFrame 和 RDD 最大的区别 ( )
Q23:Spark体系架构的组成的部分不包括:
:二、判断题(每题4分,共20分)
Q24:由于Spark和Flink是基于内存进行计算,所以数据不会发生落地的情况。
Q25:Spark与Flink类似,在执行流式计算的时候都支持状态的管理。
Q26:在设置Spark任务的并行度时,一般不超过该节点CPU的核数。
Q27:Spark和Flink都支持流式计算,并且都是真正的流式处理引擎。
Q28:Spark是一种分布式计算引擎。
联系我们
问卷网公众号