AI智能体:未来的真正挑战?


AI智能体:未来的真正挑战?

文章插图
陈永伟/文
2023年4月7日,斯坦福大学和谷歌的联合研究团队在预印本文库arXiv上发表了一篇题为《生成式智能体:人类行为的交互式模拟》(Genera-tive Agents:Interactive Simulacra ofHumanBehavior)的研究论文 。在论文中,研究者们报告了一项实验:他们构建了一个名叫Smallville的虚拟小镇,并安排了25个虚拟人物作为小镇上的居民 。接着,他们将ChatGPT的能力接入到了这些虚拟小人上 。这样,这些虚拟人物就成了有记忆、会交流、会互动的生成式智能体(注:英文为agent 。在中文文献中,agent曾被翻译为 “代理人”、“智能体”等,这里译为智能体) 。研究人员发现,在接入ChatGPT之后,这25个智能体就表现出了各种类似人类的行为 。例如,它们会像人类一样做饭、洗澡,做完饭后会主动关掉火炉,洗澡时看到澡堂里有人会排队 。当几个智能体在路上遇见时,彼此之间还会打招呼、寒暄 。最令人吃惊的是,2月14日那天,镇上的智能体们还在一起搞了一场情人节大派对 。
这篇关于虚拟小镇的论文发表之后,立即就带火了AI智能体这个概念 。最早跟进的是科研人员 。Smallville小镇的故事让他们看到,生成式AI技术的成熟和大模型的普及已经为人类在计算机上模拟人类社会或者测试模型技能提供了坚实的基础 。很多研究团队将自己研发的大模型接入了《我的世界》、《荒野大镖客》等开放世界游戏,将这些游戏作为他们的实验场 。比如,英伟达首席科学家JimFan带领的团队就在《我的世界》当中创造出了一个名叫Voyager的AI智能体,让它来在这个无尽的世界中进行探索 。很快,研究者们就发现,Voyager表现出了十分高超的学习能力 。它不仅可以“无师自通”地掌握挖掘、建房屋、收集、打猎等游戏中的必须技能,还会根据不同的地形条件调整自己的资源收集策略 。随着接入模型能力的改善,Voyager的表现也越来越好 。
企业和投资人也迅速跟进了AI智能体的概念 。众所周知,从今年年初ChatGPT爆火之后,大量资本就纷纷涌入了大模型赛道 。但是,大模型一方面对投入要求巨大,另一方面又缺乏成熟的变现渠道 。正当他们搜肠刮肚,试图为大模型设计商业模式时,“AI智能体”这个概念的兴起给他们带来了希望 。于是,越来越多的资金随之涌入这一领域,业界名人也纷纷开始为这一概念站台 。比如,OpenAI的创始人山姆·阿尔特曼(SamAltman)就曾在多个场合表示:构建庞大AI模型的时代已经结束,AI智能体才是未来的真正挑战 。
那么,现在爆火的AI智能体的本质究竟是什么?它能被用来做什么?为什么我们有了大模型后,还需要有AI智能体?它能带来哪些商业机会,又蕴含着怎样的风险?关于以上所有的问题,且让我们一一说来 。
何谓AI智能体?它能干什么?
所谓AI智能体(AIagent),是一种能够感知环境、进行决策和执行动作的智能实体 。它们拥有自主性和自适应性,可以依靠AI赋予的能力完成特定任务,并在此过程中不断对自我进行完善和改进 。此外,不同的AI智能体之间也可以进行交互,从而共同完成某些工作 。
或许有人要问,既然我们已经有了ChatGPT这样的大模型,为什么还需要AI智能体呢?关于这个问题,最直接的答案就是:目前的大模型都过于通用化了,但在更多的时候,我们需要的却是一个具有特殊性的AI 。
打一个不太恰当的比方:通用大模型就好像一个刚毕业的大学生 。我们知道,在经过几年的学校训练后,任何一个合格的大学毕业生都会具备很多知识 。如果有人要和他们聊天,他们根据这些知识,也可以天南海北地随便应对 。但是,当这些学生到了各自的工作岗位,被安排去做一些专业性较强的工作,他们就很可能难以胜任 。原因很简单,他们还缺乏这些工作所需要的专用性知识和技能 。正是因为这个原因,在大多数的单位中,新入职的毕业生在正式上岗前还必须经过一段时间的培训 。
同样的道理,像ChatGPT这样的大语言模型虽然能力强大,但其能力主要是针对一些通用任务的 。使用ChatGPT较多的用户都会有这样的经历:当我们向它询问一些比较专业化的问题时,它就会“一本正经的胡说八道” 。如果我们想要让大模型来帮助处理专业任务,那就还需要用专业的数据库对它进行进一步的训练,与完成特定任务所必须的设备进行适配 。比如,如果要让AI执行自动驾驶任务,就不仅需要让它能够识别和处理传感器的信息,还需要让它学习和驾驶、交通路线相关的大量数据 。这整个过程,就好像让一个已经具有一定的知识储备和能力的大学毕业生接受职业培训一样 。


推荐阅读