随后 , 朱啸虎又解释到 , 自己并非否定大模型领域创业机会 , 而是提醒创业者不要迷信通用大模型 。“对于大部分创业者 , 场景优先 , 数据为王 。”
这种观点基本已成为当下国内投资圈的共识 。郭涛认为 , 通用大模型将会形成一定垄断局面 , 创业者和“小厂”布局通用大模型 , 在资金、技术、数据和生态上均处于劣势地位 。
“通用大模型护城河非常高 , 它的网络效应也很强 , 用户反馈会让它越来越聪明 , 先做出来的企业会有先发优势 。”程浩也认为 , 创业公司做通用大模型机会不大 , 只有大厂能玩得起 。
同时 , 他认为 , 未来通用基座模型也不需要那么多公司 。“可能全世界未来真正能够用到的闭源和开源加起来的通用大模型不超过10家 , 这还是往多了说 。”
但不少创业者并不认同 。“很多创业公司已推出大模型 , 证明这件事不是太大问题 。如果要达到GPT-4的水平 , 头部大厂同样很困难 , 想要垄断现在看来也不大可能 。”李维表示 。
他认为 , 创业公司做大模型虽然在硬件资源和工程力量上无法与大厂相比 , 但优势是更接地气 , 有总体的落地路径或产品需求 , 不是为了大模型而大模型 。
“基础大模型也并非铁板一块 , 有一定的伸缩余地 , 创业公司可以从十亿、百亿的模型练起 , 然后根据自身需求和后续资源来决定是否继续研发千亿级别的模型 。”李维表示 。
不少创业公司做大模型正是遵循这样的路线 。比如百川智能先推出70亿参数模型 , 并还在训练500亿参数模型 , 基本没有创业公司选择去做千亿参数的大模型 。
在李维看来 , 模型大小不是唯一的指征 , 应用场景也是重要的参考维度 。“对于大多数应用 , 超大规模模型就像是大炮打蚊子 , 不仅推理时间长 , 费用大 , 而且很难应用部署 , 在实际效果上并没有什么意义 。”
因此 , 李维认为 , 盲目竞争求大求全 , 不应该是大模型研发创新的主流 , 推动大模型轻量化、垂域化是更有意义的良性竞赛 , 这对推动大模型尽快落地和产生价值至关重要 。
程浩认为 , 未来很多中小企业会有自己的垂直模型 , 而创业公司更多的机会是在垂直赛道上做应用或工具链 。“大部分投资机构还都是看垂直行业的赛道 , 像王小川、王慧文这种 , 很大程度上是在赌人 , 并不是赌做通用大模型这件事 。”
不过 , 选择垂直赛道的技术路线也面临不少挑战 。李维就坦言 , 大模型在垂直领域的规模化落地会比想象的要艰难 。
他认为 , 目前的挑战之一是变化太快 , 让人眼花缭乱 , 创业公司与大模型供应方的对接和互选产生困难 , 多数大模型还未出现可以应用的成熟服务 , 上下游存在无法无缝对接和匹配的问题 。
同时 , 目前还存在技术同质化、商业互卷等问题 。“鼓励技术竞争和模型差异化发展 , 协调商业合作、减少商业互卷是技术公司和社区应该共同努力的方向 。”李维呼吁到 。
推荐阅读
- “千模大战”热潮下的AI冷思考
- C++ 正在向 C 发起“进攻”!TIOBE 7 月榜单发布
- “五年内人类程序员将消失”预言引争议,AI真的那么强大了吗?
- “连体夫妇”走红后,无腿丈夫抛妻弃子另寻他欢,现状令人唏嘘
- “鱼骨线”怎么走?
- 看上去很美的全景天幕 竟成了电动车主夏天“最大的痛”
- 今天才知道!电动车“每日充”和“骑完充”,到底哪种更伤电池?
- 7月起,电动车多地新情况,上路注意“2限1罚”管理,避免被处罚
- “避暑、研学、康养”领跑暑期文旅市场
- 避暑地被高温“攻击”,今夏旅游避暑的正确“打开方式”