谷歌又炫技:派个AI,帮科幻大师刘宇昆把小说写了


谷歌又炫技:派个AI,帮科幻大师刘宇昆把小说写了

文章插图
Jeff Dean 表示:“更多的进展即将到来 。”欢迎关注“新浪科技”的微信订阅号:techsina 
文/杜晨
来源:硅星人(ID:guixingren123)
近几年科技行业疯狂加注超大规模语言模型,一个最主要的成果就是“人工智能创造内容”(AIGC) 技术突飞猛进 。两年前 OpenAI 通过 GPT-3 模型展示了大语言模型的多样化实力 。而最近各种 AI 基于文字提示生成图片的产品,更是数不胜数 。
有趣的是,今年以来 AIGC 的风头基本都被Stable Diffusion、Craiyon、Midjourney等“小玩家”给抢了——像谷歌这样的 AI 巨头,反而没怎么见动静 。
但其实谷歌并没有“躺平” 。
临近年底,在11月2日早上,谷歌终于放出了大招 。这家在 AI 研究上最久负盛名的硅谷巨头,居然一鼓作气发布了四项最新的 AIGC 技术成果,能够根据文本提示生成:
高分辨率长视频
3D模型
音乐
代码
以及可控文本生成技术 。
谷歌又炫技:派个AI,帮科幻大师刘宇昆把小说写了

文章插图
图片来源:google Research“用 AI 赋能的生成式模型,具有释放创造力的潜能 。通过这些技术,来自不同文化背景的人们都可以更方便地使用图像、视频和设计来表达自己,这在以前是无法做到的,”谷歌 AI 负责人 Jeff Dean 说道 。
他表示,经过谷歌研究人员的不懈努力,现在公司不仅拥有在生成质量方面在行业领先的模型,还在这些模型基础上取得了进一步创新 。
谷歌又炫技:派个AI,帮科幻大师刘宇昆把小说写了

文章插图
Jeff Dean   图片来源:谷歌这些创新,包括“超分辨率的视频序列扩散模型”——也即将AI“文生图”扩展到“文生视频”,并且仍然确保超高清晰度 。
以及 AudioLM,一个无需文字和音乐符号训练,仅通过聆听音频样本,就可以继续生成填补乐曲的音频模型 。
从生成文字,到生成代码、音频、图片、视频和3D模型,谷歌似乎正在证明 AIGC 技术的能力还远未达到边界,并且大有用武之地 。
接下来,一起好好看看谷歌这次都放了哪些大招 。
| AI 写作助手,深受刘宇昆喜爱?
说实话,看到谷歌做了一款 AI 写作工具的时候,硅星人是略微有点担心失业的……
但是了解了关于这款工具更多的情况之后,这种心情更多地转化成了欣慰 。
我们一直在强调AI背后的“大语言模型”技术背景 。而谷歌推出的 LaMDA wordcraft,就是这样一款将语言模型核心功能发挥到极致的技术
LaMDA Wordcraft 是在 LaMDA 大语言模型的基础上开发了一个写作协助工具,是谷歌大脑团队、PAIR(People + AI Research)团队,以及 Magenta 音频生成项目组的合作结晶 。
它的作用,是在创作者写作的过程当中,根据现有的文本产生新的想法,或者帮助重写已有文句,从而帮助创作者突破“创作瓶颈” (writer‘s block) 。
谷歌又炫技:派个AI,帮科幻大师刘宇昆把小说写了

文章插图
Wordcraft 用户界面    图片来源:Google ResearchLaMDA 本身的设计功能很简单:给定一个单词,预测下一个最有可能的单词是什么,也可以理解成完形填空或者句子补完 。
但是有趣的是,因为 LaMDA 的模型规模和训练数据量实在是太大了(来自于整个互联网的文本),以至于它获得了一种“潜意识”的能力,可以从语言中学习很多更高层次的概念——而正是这些高层次概念,对于创作者的工作流程能够带来非常大的帮助 。
谷歌在 Wordcraft 用户界面中设计了多种不同的功能,能够让创作者自己调整生成文本的风格 。“我们喜欢把 Wordcraft 比喻成‘魔法文字编辑器’,它有着熟悉的网页编辑器的样子,背后却集成了一系列 LaMDA 驱动的强大功能,”谷歌网页如是写道 。
你可以用 Wordcraft 重写语句,也可以让他把调节你的原始文本从而“更有趣”(to be funnier) 或者“更忧郁” (to be more melancholy) 一点 。
在过去一年时间里,谷歌举行了一个“Wordcraft 作家研讨会”的合作项目,找来了13位专业作家和文字创作者进行了长期深入的合作,让他们在自己的创作过程中借助 Wordcraft 编辑器来创作短篇小说 。
谷歌又炫技:派个AI,帮科幻大师刘宇昆把小说写了

文章插图


推荐阅读