大模型2.0时代的优化与突破


大模型2.0时代的优化与突破

文章插图
图片来源@视觉中国
文 | 贝克街探案官,作者 | 车行运
今年6月份,各大厂商纷纷升级自家的类ChatGPT产品 。6月9日,讯飞推出星火认知大模型升级版;6月13日,360在发布类ChatGPT产品之后,再次举行360智脑大模型应用发布会 。
与2月左右发布的大模型不同,近期各家公司发布的升级版产品,更偏向应用层目的是更容易走向千家万户 。
从目前发布的情况来看,360智脑已初步具备跨模态?成能?,除了可以完成文字生成文字、表格、图片;图片生成文字、图片,以及视频生成文本,文本剪视频等基础创作之外,还重新定义“数字人”,给用户一种“有灵魂、有?设、有记忆”可定制的专属“人工智能” 。
大模型2.0时代的优化与突破

文章插图
目前360智脑与用户距离最近的应用场景,是360现有的全家桶,周鸿祎在发布会表示,“360智脑4.0”会接入360安全卫?、360浏览器、360搜索等,试图重塑人机协作 。
在发布会上,周鸿祎更改了此前观点,“我曾经说过,国产大模型与ChatGPT之间的差距是两年,现在我想收回这句话 。”随后补充最新观点,认为目前国产大模型的水平与GPT3.5大打平,照此速度发展,追赶甚至超过GPT4将在转瞬之间 。
从发布初始版本至正式发布360智脑的四个月内,周鸿祎看到了会有如此巨大的转变?
01 科技大厂围猎大模型
在2023中关村论坛上发布的《中国人工智能大模型地图研究报告》显示,当前,中国人工智能大模型正呈现蓬勃发展态势 。据不完全统计,截至目前,参数在10亿规模以上的大模型全国已发布了79个 。
而科技大厂的大模型参数量较大:阿里通义千问大模型参数在10万亿级以上、腾讯混元大模型和华为盘古大模型参数量均在万亿级以上、百度文心一言大模型参数量在2千亿级以上、京东言犀大模型的参数量为千亿级;垂直行业科技企业已经上线的参数量普遍在千亿级以上;而科研院校大模型的参数量在千亿级及以下 。
从大模型的布局体系来看,科技大厂在算力层、平台层、模型层、应用层进行了四位一体的全面布局 。百度、阿里、华为三家均从芯片到应用进行自主研发的全面布局,如百度的“昆仑芯+飞桨平台+文心大模型+行业应用”、阿里的“含光800芯片+M6-OFA底座+通义大模型+行业应用”、华为的“昇腾芯片+MindSpore框架+盘古大模型+行业应用” 。
此外金山办公5月31日还发布了wps AI,目前,WPSAI已接入金山办公旗下办公组件轻文档、文字、表格、演示、PDF,未来将锚定AIGC、阅读理解和问答、人机交互三个战略方向发展,并接入金山办公全线产品 。
各家大厂迅速涌入这个赛道,主要是因为监管层迅速跟进出台措施规范行业发展,有顶层架构保驾护航,各家大厂自然可以放心投入研发,并推出产品 。
自今年3月大模型批量上线以来,AI监管政策逐渐明晰,这也给行业应用指明了方向 。
回顾整个行业发展历程,4月11日,《生成式人工智能服务管理方法》征求意见稿发布;5 月 30 日,信通院正在联合编制“纸鸢”开放人工智能模型许可证,下一步将发布《纸鸢开放人工智能模型许可证(征求意见稿)》 。
随后,一线城市配合发布了《北京市加快建设具有全球影响力的人工智能创新策源地实施方案(2023-2025 年)》;《深圳市加快推动人工智能高质量发展高水平应用行动方案(2023-2024 年)》 。
在此背景下,周鸿祎认为国产大模型将会迅速缩小和ChatGPT的差距,似乎也好理解了 。
03 360智脑有何不同
按照周鸿祎的规划,360大模型将在持续升级大模型的基础上,兼顾场景化、产品化、平?化、垂直化 。
这种发展战略下,360智脑可以实现对消费者(?户个?AI助理)、中?微企业(SaaS化垂直应?)、企业/政府/城市(私有化部署?模型)、?业(?业垂直?模型)等四个主要应用场景的覆盖 。
上述四种不同场景的应用,主要通过其他公司在360大模型API基础上,结合不同行业需求推出特定产品 。现阶段,很多部门、企业内部拥有大量独占性IP,如果将其统统放到一个公开大模型中,就会重现三星因GPT泄露芯片机密的事件,这就凸显了专有类GPT产品的重要性 。
大模型2.0时代的优化与突破

文章插图


推荐阅读