大模型2.0时代的优化与突破 _大模型

文章插图
图片来源@视觉中国

文 | 贝克街探案官，作者 | 车行运

今年6月份，各大厂商纷纷升级自家的类ChatGPT产品。6月9日，讯飞推出星火认知大模型升级版；6月13日，360在发布类ChatGPT产品之后，再次举行360智脑大模型应用发布会。
与2月左右发布的大模型不同，近期各家公司发布的升级版产品，更偏向应用层目的是更容易走向千家万户。
从目前发布的情况来看，360智脑已初步具备跨模态?成能?，除了可以完成文字生成文字、表格、图片；图片生成文字、图片，以及视频生成文本，文本剪视频等基础创作之外，还重新定义“数字人”，给用户一种“有灵魂、有?设、有记忆”可定制的专属“人工智能” 。

文章插图
目前360智脑与用户距离最近的应用场景，是360现有的全家桶，周鸿祎在发布会表示，“360智脑4.0”会接入360安全卫?、360浏览器、360搜索等，试图重塑人机协作。
在发布会上，周鸿祎更改了此前观点，“我曾经说过，国产大模型与ChatGPT之间的差距是两年，现在我想收回这句话。”随后补充最新观点，认为目前国产大模型的水平与GPT3.5大打平，照此速度发展，追赶甚至超过GPT4将在转瞬之间。
从发布初始版本至正式发布360智脑的四个月内，周鸿祎看到了会有如此巨大的转变？
01 科技大厂围猎大模型
在2023中关村论坛上发布的《中国人工智能大模型地图研究报告》显示，当前，中国人工智能大模型正呈现蓬勃发展态势。据不完全统计，截至目前，参数在10亿规模以上的大模型全国已发布了79个。
而科技大厂的大模型参数量较大：阿里通义千问大模型参数在10万亿级以上、腾讯混元大模型和华为盘古大模型参数量均在万亿级以上、百度文心一言大模型参数量在2千亿级以上、京东言犀大模型的参数量为千亿级；垂直行业科技企业已经上线的参数量普遍在千亿级以上；而科研院校大模型的参数量在千亿级及以下。
从大模型的布局体系来看，科技大厂在算力层、平台层、模型层、应用层进行了四位一体的全面布局。百度、阿里、华为三家均从芯片到应用进行自主研发的全面布局，如百度的“昆仑芯+飞桨平台+文心大模型+行业应用”、阿里的“含光800芯片+M6-OFA底座+通义大模型+行业应用”、华为的“昇腾芯片+MindSpore框架+盘古大模型+行业应用” 。
此外金山办公5月31日还发布了wps AI，目前，WPSAI已接入金山办公旗下办公组件轻文档、文字、表格、演示、PDF，未来将锚定AIGC、阅读理解和问答、人机交互三个战略方向发展，并接入金山办公全线产品。
各家大厂迅速涌入这个赛道，主要是因为监管层迅速跟进出台措施规范行业发展，有顶层架构保驾护航，各家大厂自然可以放心投入研发，并推出产品。
自今年3月大模型批量上线以来，AI监管政策逐渐明晰，这也给行业应用指明了方向。
回顾整个行业发展历程，4月11日，《生成式人工智能服务管理方法》征求意见稿发布；5 月 30 日，信通院正在联合编制“纸鸢”开放人工智能模型许可证，下一步将发布《纸鸢开放人工智能模型许可证（征求意见稿）》。
随后，一线城市配合发布了《北京市加快建设具有全球影响力的人工智能创新策源地实施方案（2023-2025 年）》；《深圳市加快推动人工智能高质量发展高水平应用行动方案（2023-2024 年）》。
在此背景下，周鸿祎认为国产大模型将会迅速缩小和ChatGPT的差距，似乎也好理解了。
03 360智脑有何不同
按照周鸿祎的规划，360大模型将在持续升级大模型的基础上，兼顾场景化、产品化、平?化、垂直化。
这种发展战略下，360智脑可以实现对消费者（?户个?AI助理）、中?微企业（SaaS化垂直应?）、企业/政府/城市（私有化部署?模型）、?业（?业垂直?模型）等四个主要应用场景的覆盖。
上述四种不同场景的应用，主要通过其他公司在360大模型API基础上，结合不同行业需求推出特定产品。现阶段，很多部门、企业内部拥有大量独占性IP，如果将其统统放到一个公开大模型中，就会重现三星因GPT泄露芯片机密的事件，这就凸显了专有类GPT产品的重要性。