航天信息大数据面试题
航天信息
文章插图
1.写出Spark经典算法wordcount伪代码(java scala python均可)(5分)
一、数据库部分(共10分)
1、设学生表和课科表的结构分别为(学号 , 姓名)和(学号 , 课程号 , 成绩).如果希望查询出“成绩大于90分的学生姓名” 。 则对应的SOL请句是( ) 。 (2分)
A、SELECT姓名FROM学生表WHERE学生表.学号一课程表.学号AND课程表.成绩>90
B、SELECT姓名FROM课程表WHERE学生表.学号=课程表.学号AND课程表.成绩>90
C.SELECT姓名FROM学生表 , 课程表WHERE学生表.学号=课程表.学号OR课程表.成绩>90
D.SELECT姓名FROM学生表 , 课程表WHERE学生表.学号=课程表.学号AND课程表.成绩>90
2、执行数据库查询时 , 如果查询的数据很多 , 下面喝线办法是提高在询效率( )(4分)
A 采用连接池 , 增加数据库执行线程
B 反复使用PreparedStatement.减少查询次数
C 增加数据库缓冲区 , 提高数据库I/O方面性能
D 建立索引
3.有一下每门课程都大于80的学生姓名:学生表stulent 分数长grade(4分)
二、简答题(40分)
(1)现有集合A(集合学段为 Jxfp _id , gf_ nsr_ key , je , se) , B(集合字段为jxfp_id, gf_nsr_key, wpmc).两个集合的关联字段为jxfp_id , 请计算集合C(C-A-B)(5分)
(2)请完成下面的方法 , 该方法的目的是采用递规的方式计算结果 (5分)
public static double recursive(int i){
}
(3)简述HDFS的主要功能节点及其作用(0分)
(4)解释一下工厂模式(5分)
【航天信息大数据面试题】(5)简述MapReduce框架的三大主要功能节点及其作用?(10分)
推荐阅读
- 西部数据在CES 2021推出多款4TB容量的旗舰级SSD
- WhatsApp收集用户数据新政惹众怒,“删除WhatsApp”在土耳其上热搜
- vivo一款新机现身跑分网!运存和系统信息通通曝光
- 未来想进入AI领域,该学习Python还是Java大数据开发
- 黑客窃取250万个人数据 意大利运营商提醒用户尽快更换SIM卡
- 虾米音乐一个月后关停 我的听歌记录和个人信息怎么办?
- 阳狮报告:4成受访者认为自己的数据比免费服务更有价值
- 中消协点名大数据网络杀熟 反对利用消费者个人数据画像
- 学习大数据是否需要学习JavaEE
- 意大利运营商Ho Mobile被曝数据泄露