|饿了么4年,阿里2年:我的总结与思考
本文基于作者在饿了么 4 年和阿里巴巴 2 年研发经历 , 从技术、业务、管理和架构四个层面总结的一些经验 。
本文插图
图片来自 Pexels
我是在 2014 年入职饿了么 , 从前端和 PHP 一直做到后端架构和团队 , 从 2014 年到 2017 年陆续负责过公司客服、销售、代理商、支付、清结算、订单这些业务的产研与团队 。
2018 年从业务研发团队抽身 , 6 个人组起一个小组投身机器学习 , 试图结合实际的业务场景通过技术改造业务 。
2019 年回归到平台(中台)研发 , 负责交易、金融、营销三个中台的研发和团队工作 。
基于我在饿了么 4 年和阿里巴巴 2 年研发经历 , 下面我将以下四层面分享一些我的思考:
- 技术
- 业务
- 管理
- 架构
对开发同学而言 , 技术是立身之本 , 虽然往往面试造火箭入职拧螺丝 , 但不可否认的是 , 技术就是你从业的的基石 。
不管是基本的动手能力还是问题分析能力 , 包括你的思维逻辑乃至对事物认知的能力 , 技术思维都会时刻影响你 。
最明显的影响就是当你面对无数个问题的钉子时 , 技术是不是你最顺手的那把锤子 。
技术上我比较关注的几个层面:
基本功(语言、编码这个层面 , 主要是动手能力)
大型分布式系统的实战经验(RPC、SOA、MySQL、Redis、MQ)
项目( DB 设计、API 契约、DDD 抽象、链路设计、项目风险把控)
稳定性(可用&资损)
稳定性
稳定性是一个先有意识再有能力的事儿 。 记得在 2015 年年初 , 张雪峰加入饿了么担任 CTO 之后 , 从他嘴里最常听到的一句话就是“研发要对生产环境有敬畏” 。
2014 年下半年 , 各方人马开始杀入外卖市场 , 饿了么启动百城计划进行业务扩张 , 短时间内从 10+ 城市覆盖到 100+ 城市 , 日订单量也很快从 10 万上涨到 100 万 。
业务井喷的同时 , 技术还没有做好足够的准备 。 我印象中 , 2014 年下半年几乎每天中午交易量都有新高 , 但同时也伴随着系统宕机、限流扩容、紧急调优、客服爆线、技术加班熬夜的问题 。
我曾在新乡的客服中心看到有的客服同学突然崩溃 , 耳机直接摔下来离开工位 , 因为每天会接收到大量用户的来电责问 。
就在那一刻 , 你才会清晰且直观的感受到:你在编辑器的每一行代码 , 你在服务器的每一次发布 , 会对现实世界很多活生生的人有直接的影响 , 你会突然意识到你的工作比你之前以为的要重要且有意义 。
所谓研发要对生产环境有敬畏 , 就是你知道你的作品会对别人产生不好的影响 , 你会为不好的结果感到惭愧与内疚 , 这就产生了敬畏 。
应急处理有一个基本原则:“以业务影响最小为主 , 优先恢复为核心目的 , 不要纠结手段和根因 。 ”
本文插图
别把你的懊悔、决心、对稳定性的思考、各种奇妙的 idea 以及执行力体现在事故复盘会上 , 系统的安全生产和火灾一样 , 事前才有意义 。
链路设计
大部分产研缺少全链路的视角 , 往往看到的是自己负责的点 , 但是对于一条线乃至整个面是看不到的 , 也没有机会去思考这些 , 而对于一些大项目和长链路系统而言 , 这是致命的 。
我的建议是 , 对你所负责的系统 , 它关键的上下游、核心业务的链路一定要熟悉 , 包括数据、接口(调用、功能、逻辑)、各种异常的处理和特殊的设计 。
能帮你达成这一目的的最简单的办法就是画图、画图、画图!重要的结论说三遍 , 一定要自己能把系统的大图画出来 , 然后做到可以根据大图随意放大和缩小 。
推荐阅读
- 大健康|又一行业“爆发”,规模将超8万亿,阿里、万达、京东争相进入
- 阿里巴巴|阿里巴巴:取消强制周报、无谓的加班只会增加负担
- 互联网|阿里为啥不用 ZooKeeper 做服务发现?
- 互联网|阿里加码家装领域,正式启用tangping.com
- 云计算|红岭云与阿里云签署框架合作协议
- 青年|被阿里巴巴和红杉资本看上 这家SaaS企业再获超亿元融资
- IT之家|阿里健康辟谣阿里巴巴减持1.54亿股股份:假的,请厘清基础事实
- 中年|阿里投了50亿,华为投了100亿,而京东砸了300亿,为何是这座城?
- 时代印记|软银从阿里套现千亿!被大家都看好的阿里,为何遭到如此抛售呢?
- 行业互联网,阿里巴巴|深耕12年后,UC“惜别”印度