作业帮受邀参加TOP100全球案例研究峰会( 二 )


对于场景模拟和数据构造的真实性 , 团队目前已从最初的捉襟见肘转向能够游刃有余地发挥技术优势的阶段 。 随着平台投入使用后 , 对大家的衍生使用需求 , 如数据预热需求、高压下的持续稳定性测试等 , 进行了优化支持 , 以满足压测多样化需求 。
而在模拟场景的塑造上 , 作业帮则分为两大板块 , 生成不同的设计思路 。 一方面 , 对大型售卖活动 , 采取了多场景链路压测叠加参数化的方式进行梯度发压 , 并基于漏斗型用户行为模型 , 达成预期的成果;另一方面 , 对复杂教学场景的支持 , 复杂性主要体现在技术复杂性(涉及到私有技术架构、长连接和流媒体协议) , 数据和交互的复杂性即双师教学的业务形态(每个学生都是一个独立的个体 , 有各自的行为序列;主讲与辅导老师各司其职并实时同步学生状态 , 使主讲及时调整教学内容 , 保证学生的课堂收获) 。 因此作业帮自研了学生节点、主讲节点、辅导老师节点模型 , 依托真实的日志将不同角色的行为序列化 , 最后注入模型 , 实现教学场景的仿真 。
作业帮受邀参加TOP100全球案例研究峰会文章插图
王俊星表示:“作业帮是做教育的 , 因此对直播课场景倾注了更多心血 。 我们必须严格把控视频流的同步性、互动的实时性及到达率 , 保证教学质量与学生的体验 , 而场景还原是做足攻防和破坏性演练的基础 。 当翻山越岭跨过这道坎之后 , 作业帮仍要继续寻求压测技术的向上突破 。 ”
高效的常态化平台体系加持 , 作业帮稳定输出教育价值
对于在线教育技术团队而言 , 每次活动或开课节点都是一场硬仗 , 平台服务层面的“风平浪静”一般源自于底层技术团队压测的无数次“惊心动魄” 。 为缓解人员运维压力 , 提高效率 , 作业帮团队从压测平台的发压阶段切入 , 切实提高重大事件的平台承受能力 。
作业帮受邀参加TOP100全球案例研究峰会文章插图
王俊星介绍道 , 作业帮对于发压侧进行了结构性调整优化 , 基于2PC思想和流水线形式处理链路 , 大大提升单节点发压能力 , 减少了设备投入和运维成本 。 发压的安全上也会进一步优化 , 很快我们就会与业务支撑系统打通 , 触发阈值熔断并与自动化平台联动以达到服务探索的目的 , 使压测风险进一步降低 。
同时 , 为了解决高并发数据结果统计瓶颈 , 作业帮还会对计算引擎进行优化 , 通过分级计算、分布式部署 , 解决数据汇总压力 , 提升集群水平扩展性 。
效率的提高除了对源头进行管控 , 也离不开中间层面的调度程序优化 。 对此 , 作业帮丰富节点管理 , 增加节点属性 , 并针对特殊压测场景 , 独立申请压测节点 , 使节点分配更加高效合理 , 避免互相影响 。
目前 , 集安全、拟真、效率于一体的百万级QPS常态化链路压测诊断平台已初步具备了抗风险能力 , 对千万孩子的教育资源流通产生强大的辐射作用 。 未来 , 作业帮还将聚焦系统薄弱环节预判板块 , 持续建设内置学习模型 , 全面打造自动化赋能平台 。
【作业帮受邀参加TOP100全球案例研究峰会】谈及压测平台的研发心得 , 王俊星表示 , “用技术完美承接瞬时流量也许能无差别地让每一位工程师产生成就感 , 而用科技落实教育理念则是作业帮人的独有标签 。 对我们而言 , 我们必须保证每一位学生的体验和课堂收获 , 让优质教育触手可及 。 今后 , 我们将继续投入优质教育资源的稳定供给之中 , 辐射千万孩子的学习征程 , 践行教育使命和愿景 。 ”


推荐阅读