文章插图
▍小米大模型:轻量化、本地部署
通用大模型需要海量数据,和巨大的算力,使用成本也很高 。面对这种情况,小米如何突围?
小米的机会在设备端 。截至2023年一季度,小米AIoT平台已连接设备(不包括智能手机、平板及笔记本电脑)达6.18亿台,是全球规模领先的消费级物联网平台 。设备多样,使用场景也各不相同,一个大模型难以兼顾 。而我们判断在大多数场景和垂域,可能并不需要那么大的模型 。在一个较小的基座模型上,使用业务数据进行深入定制,就应该能达到用户的需求 。更进一步,如果把一部分大模型能力下放到端侧,不仅能更好地保护用户隐私、而且有机会在本地实现千人千面的个性化定制 。
不盲目追求模型参数规模,而是综合考虑效果、效率与使用成本的均衡,软硬结合,生态连结,这是大模型技术与小米生态结合的最优方案,也是小米为用户提供独特体验的根本保证 。因此,“轻量化、本地部署”是小米大模型技术的主力突破方向 。
文章插图
目前,我们自研的13亿参数的端侧模型已经在手机端跑通,部分场景效果媲美60亿模型在云端的运算结果 。与早些时候市场上放出的手机端大模型的方案相比,小米会调整模型结构和参数大小,适配各种芯片在内存和算力上的特点,达到功耗、推理速度和生成效果的最佳平衡 。
文章插图
03
布局人工智能
全力突破大模型
▍自有数据更懂小米
数据上,我们自己挖掘整理的训练数据占比达到了80%,其中小米自有的产品和业务数据量达到3TB 。因此我们的大模型最懂小米的产品,最懂小米的业务 。
▍效率和效果的最佳平衡结构上,我们根据对Transformer结构的理解,融合了自身的实践经验进行改良;并且充分考虑设备端芯片的特色要求,合理设置模型的宽度和深度,以达到效率和效果的最佳均衡 。
▍更多策略更少浪费
训练策略上,采用小米提出的ScaledAdam优化器和Eden学习率调度器,显著提升收敛速度的同时减少了优化器中显存的浪费 。由于模型的知识容量有限,需要更精巧地安排训练数据的顺序,使得模型尽可能多地掌握知识点和技能,减少参数的浪费,以此实现“轻量化” 。
▍为用户隐私安全保驾护航模型部署到端侧后,信息不用上传到云端,所有计算都在本地进行,可以从根本上保证用户隐私不被泄露 。即使在端云结合的服务框架下,隐私信息会存储在端侧,涉及它们的计算也尽可能在端侧完成 。即使偶尔需要使用云端的能力,信息也会经过处理和加密 。
04
仰望技术星空
脚踏体验实地
截至2023年8月10日,小米自研的大规模预训练语言模型MiLM-6B,参数规模为64亿,在权威中文评测榜单C-EVAL和CMMLU中位列同等参数规模大模型第一 。
在C-Eval评估中,MiLM-6B 的平均分为60.2,总榜单排名第10、同参数量级排名第1 。
“C-Eval”是由上海交通大学、清华大学、爱丁堡大学共同构建的一个针对基础模型的综合中文评估套件 。它由 13948 道多项选择题组成,涵盖 52 个不同学科和四个难度级别,覆盖人文、社科、理工,及其他专业四个大方向,用以帮助中文社区研发大模型 。
在CMMLU评估中,MiLM-6B在Five-shot和Zero-shot 测试中的平均分分别为57.17和60.37,均位列中文向模型第1 。
“CMMLU”是一个综合性的中文大模型评估基准,涵盖了从基础学科到高级专业水平的67个主题,涉及自然科学、社会科学、人文、以及常识等,专门用于评估语言模型在中文语境下的知识和推理能力 。
通过打榜,验证了我们对特定垂域进行定向增强的技术能够达到怎样的效果,这也是用轻量化模型进行业务定制的必备能力 。虽然小米大模型取得了优异的成绩,但我们不会把榜单排名与用户体验画上等号 。好成绩的背后,更重要的还是打磨技术、沉淀方法论,将它们运用到产品,提升用户体验才是我们的终极目标 。
—
科技应着眼于解决问题,以需求与应用为落点 。小米大模型采用“轻量化、本地部署”的方案,能够更好地解决多场景、个性化的用户需求 。一方面,大模型本地运行无需担心“弱网、无网”情况,且响应速度快,使用稳定;另一方面,在提供更加个性化服务的同时,也能够更好地保护用户隐私,让技术真正改善用户体验,让成绩真正落地有效 。
推荐阅读
- Java Socket通信与HTTP协议解析
- 一文带您了解线性回归:多个变量之间的最佳拟合线的算法
- Oracle数据库初始化参数解析:优化系统配置的终极指南!
- 主动离职,还能收获失业补助金?你不知的“隐藏”福利,一文解析!
- Excel变天!微软把Python「塞」进去了,直接可搞机器学习
- 36岁TVB「软饭王」入行17年终弹起做男一!
- Linux NFSD软件架构与代码解析
- 亚马逊云怎么解析域名?
- 你每天用来打卡的钉钉,居然藏着「ChatGPT」「Midjourney」和「Notion」
- 《经济学人》:生成式AI冲击搜索业务,「登月」不顺,谷歌难寻增长点