作业帮受邀参加TOP100全球案例研究峰会

近期 , TOP100全球案例研究峰会于北京国际会议中心召开 。 作业帮作为在线教育领域的典型案例成功入选 , 作业帮产研中台组测试负责人王俊星出席会议 , 并于工具链建设分会场向与会嘉宾展示了作业帮百万级QPS常态化链路压测诊断平台 。
作业帮受邀参加TOP100全球案例研究峰会文章插图
据了解 , TOP100全球案例研究峰会是由msup公司主办的全球顶级技术峰会 , 至今已成功举办9届 。 本届TOP100全球案例研究峰会邀请到Amazon、LinkedIn、IBM、百度、阿里、腾讯、字节跳动等130位一线技术大咖和业界专家 , 并由18位垂直专题领域的业界专家担当联席主席 , 负责专题案例评审、甄选 , 最终形成120件案例和18个专题 。
王俊星表示 , 一直以来作业帮以全链路压测模型的迭代升级赋能多样化场景 , 保证线上千万级并发直播上课的稳定性 。 未来 , 作业帮将继续融通各项技术及团队能力 , 深耕压测平台架构优化等基础建设 , 保证作业帮线上服务稳定性达到99.99% 。
千万学生学习场景存在解构风险 , 压测成必由之路
今年年初 , 在“停课不停学”的号召下 , 教育部鼓励老师和学生“在家上学” 。 随之而来的是通过互联网音视频与知识建立连接的方式在全国范围内迅速普及 , 在线教育用户规模呈井喷式增长 , 2020年被称为“在线教育爆发之年” 。
作为在线教育企业独角兽之一 , 作业帮超级APP聚集效应在今年持续增强 。 易观3月数据显示 , 作业帮是中国唯一月活过亿的教育类APP , 随着用户规模不断增长 , 保证系统稳定性、有效破解千万学生学习场景的解构风险成为作业帮面临的首要任务 。
作业帮受邀参加TOP100全球案例研究峰会文章插图
作业帮受邀参加TOP100全球案例研究峰会文章插图
王俊星在会上表示 , 教育是容不得半点马虎与妥协的 , 为满足所有学生和家长对于从在线获取知识的期待 , 我们必须保证系统的稳定性 。 因此 , 作业帮开始发力系统稳定性评估路径的探索 。 在调研业界各大公司的稳定性方案和开源压测框架后 , 作业帮基于自身业务场景 , 选择了自研全链路压测模型的解决方案 。 据了解 , 该模型必须与作业帮业务场景高度契合才能有效保证系统的正常运行 , 既涵盖双师角色、学生交互复杂场景的复用、切换 , 同时必须将服务架构、私有协议的特殊性纳入考量范围 。
然而 , 扣住在线教育的脉搏并非一朝之间 。 尽管参与人数众多 , 每项操作均为精心设置 , 整个团队视熬夜为常态 , 但早期压测仍未取得预期效果 。 “压测结果与现实存在巨大偏差 , 团队的心情只能用一句歌词形容:多么痛的领悟 , 别再为压测受苦 。 ”对于初次尝试的失败 , 王俊星回忆道 。
不同于传统线下行业可以模拟出一个对等的生产环境 , 互联网行业的压测难以实现同级别的服务集群 。 数据构造不真实、场景臆想正是压测架构脆弱的关键所在 。 此外 , 压测工具缺乏安全性、人力投入成本大等问题亦亟待解决 。 因此 , 对于在市场赛道完美承受高压检验 , 作业帮还有更长的路要走 。
安全先行、场景还原 , 作业帮推出自研压测平台
对于作业帮人来说 , 压力测试不仅是关乎业绩和增长的技术命题 , 更是与跨城乡、跨地域的全中国中小学生相关的教育供给命题 。 为此 , 作业帮解锁了自研压测平台的进阶关卡 。
首先 , 产研团队在压测的探索上达成了安全先行的共识 , 将“服务与数据隔离”设定为核心思想 , 研发、测试、运维共同建设将方案落地 。 具体而言 , 依托于日志服务 , 对数据进行清洗和脱敏 , 数据经过压测平台后产生压测标记 , 在业务网关分发到各业务集群 , 业务模块根据压测标记 , 进行基础业务服务和数据的隔离 。


推荐阅读