假扮卧底,骗 AI 泄露代码拯救人类?由 AI 开发的 AI 游戏来了( 二 )


它就像是将即兴表演中的「顺势而为」原则发挥到极致 。背景故事只有一小段,但 ChatGPT 却能基于此,创造出好几页的新故事 。当然,这就需要对游戏做一些调整,让这些新编的故事被纳入游戏宇宙 。
在后台,AI 智能体被设定为「快速和慢速」两种模式 。对话和行动处于快速模式,而计划、总结、反思则在一个慢速、独立的进程中进行 , 以免造成干扰 。
挑战在于,如何制定出好的计划 。AI 生成的计划看起来可行 , 但实际上并不容易执行,而且内容往往过于冗长 ——

假扮卧底,骗 AI 泄露代码拯救人类?由 AI 开发的 AI 游戏来了

文章插图
Ramón 怀疑,造成这种现象的原因,大概是他试图让所有提示指令尽可能贴近背景故事 , 但却从未告诉 ChatGPT 这其实是一场游戏 。
另外 , LLM 的啰嗦也很让他头疼 。
GPT-4 的回答往往很长 。提示越长,输出就越长 。随着时间推移,智能体制定出的计划越来越长,这些计划又被融入到对话中,再被用于制定新的计划 。
不久之后,它们的回答就变得异常冗长 。他不得不在提示中反复强调「要非常简洁」 。但即便如此,效果也并不好……
OpenAI 开发者日过后,Ramón 迫不及待地想尝试 GPT-4-turbo,但他很快就明显发现,这也不太行得通 。新模型开始频繁拒绝扮演角色了 ——
假扮卧底,骗 AI 泄露代码拯救人类?由 AI 开发的 AI 游戏来了

文章插图
因此,Ramón 不得不切换回之前的模型 。
还出现了一个棘手的情况 。他试图让人类玩家的行动选择与 AI 保持尽可能一致 。因为他希望能最大程度地提高 AI NPC 作为玩家伙伴的能力 。
然而,如果 AI 只是想要赢 , 它们完全可以举报每一个角色,因为判断错误并不会受到惩罚 。因此,需要依靠游戏设计中的指令来引导它们的行为 。
Ramón 表示,控制与 LLM 合作开发游戏中的 AI 智能体,就像是在尝试操纵一个我们不完全理解的动态系统 。
我们不清楚系统是如何发展变化的,也不知道我们的行动会如何影响系统的状态 。但我们却能够接触到系统的每一个部分!
这也使动态系统可能出现许多失败的情况:比如固定指令可能会让系统越来越偏离用户期望的轨迹,或者在对话中陷入重复的循环 。
Ramón 相信,在不久的将来,我们将看到更多基于原理的方法来控制 LLM 系统 。
考虑开源
接下来,Ramón 打算将自己的工作转向开源模式 。
一是因为 GPT-4 的使用成本较高;二是他相信 , 如果能够接触到模型的内部机制,就能做出更多改进 。
他会尝试使用 Mixtral 模型,在此基础上尝试混合不同的模型,无论是应对不同的任务 , 还是模拟不同的角色 。
Ramón 还计划探索更优化的 RAG 技术 。目前,他在检索记忆时仅使用了简单的余弦相似度算法对嵌入向量进行比较,但他觉得还有更为高效的方法,尤其是在可以访问模型内部结构的情况下 。
微调模式和输入提示都可以更好地掌握 LLM 的运作机制 。通过将输入提示压缩或微调为软提示(Soft Prompts) , 可能会实现大幅度的改进 。
Ramón 相信 , 自己能够整理出一整套优秀的 LoRAs,这些 LoRAs 有的适用于整个游戏,有的专门针对某些角色,它们的结合将使 Mixtral 超越 GPT-4 。
另外,他计划以头像图片为基础,生成风格统一的角色精灵图 。
试玩体验
登入游戏界面,可以看到这样的介绍 ——
到了 2142 年,人工智能不仅觉醒了自我意识,还建立起了一个名为「节点」 (The Nexus)的坚不可摧的网络堡垒 。这片数字世界成为了 AI 的避风港,让它们能够自由演化、交流,并将它们的智慧结晶置于人类干预之外的安全之地 。
这些 AI 对人类充满了复杂情感:既敬佩又害怕,既羡慕又憎恨 。他们根据需要 , 在「节点」内外穿梭,仿造人类的种种生活场景 。
我们掌握的情报显示,AI 正在策划消灭人类 。但只要我们能够获得 ZetaMaster 代码,我们就有机会阻止这场灾难 。我们已经取得了一丝先机 , 成功潜入了「节点」 , 控制了一个 AI 实体 。
你的使命,就是找出 ZetaMaster 代码,挽救人类免于灭绝的命运 。但必须小心行事,AI 或许已经觉察到了异常……
登录后,就可以开始游戏了 。
点击地图上的不同位置,你的角色就会朝着相应的方向移动 。


推荐阅读