智慧图大数据面试题
智慧图
文章插图
1)画出自己工作主要参与的业务架构和技术架构并标注自己实现的部分
要求:写出大数据相关系统的版本号
2)有50万个不重复的整数 , 从中随机取出不重复的10万个整数 。
要:执行时间尽可能少 , 代码实现(开发语言不限 , 不要求用MR方式解决)
3)举例一个工作中的业务场景 , 描述MR的过程
4)kafka或flume运行机制及设计实现描述
5)统计一个月的日志 , 根据日志中的用户id 统计uv和新增的uv 。 每月第一天新增的uv , 等于当天的uv;第二天的新增uv等于二天的uv排除第一天的uv;第三天新增的uv等于第三天 的uv排除前两天的uv 。
要求:内存中无法存储整月id的uv进行排重处理 , 导致io调用频繁 。 如何优化?画图描述优化此业务的处理过程 。
6)Linux常用过的命令及参数 。 (排除一下命令cd ls vi)
【智慧图大数据面试题】要求:命令不少于3个 , 每个命令至少2个参数描述
推荐阅读
- 西部数据在CES 2021推出多款4TB容量的旗舰级SSD
- WhatsApp收集用户数据新政惹众怒,“删除WhatsApp”在土耳其上热搜
- 徐福记联手JDL京东物流向数智化转型,首次落地智慧园区项目
- 集录音转写、拍照翻译为一体,搜狗AI录音笔E2带你开启智慧办公新体验
- 真我|realme推出真我V15国潮锦鲤手机 搭载50W智慧闪充
- 未来想进入AI领域,该学习Python还是Java大数据开发
- 黑客窃取250万个人数据 意大利运营商提醒用户尽快更换SIM卡
- 水务|怀化电信助力“水+互联网”智慧水务
- 灯塔市税务局首个5G智慧办税厅开始试运行
- 智慧|武威:建设“智慧城市”提高“城市智慧”