DeepTech深科技这些令人不安的照片,表明AI越来越聪明了!它正在学习根据文字生成图片( 二 )


虽然模型最终生成的图像并不完全真实 , 但这不是重点 。 重要的是这预示着模型已经包含了正确的高级视觉概念 , 即 AI 一定程度上具备了儿童的根据文本画图的能力 。
DeepTech深科技这些令人不安的照片,表明AI越来越聪明了!它正在学习根据文字生成图片
本文插图
图 | AI2 模型根据文本生成的图像示例(来源:MIT TR)
视觉语言模型获得此类图像生成的能力代表了 AI 研究的重要一步 , 这表明该模型实际上具有一定程度的抽象能力 , 而这是理解世界的基本技能 。
未来 , 这项技术很可能对机器人领域产生极大影响 。 机器人可以使用语言进行交流 , 当它们对视觉信息的理解越好 , 就越能够执行复杂的任务 。
Hajishirzi 说 , 从短期来看 , 这种可视化还可以帮助技术人员更好地理解 AI 模型的学习过程 。 之后 , AI2 团队计划展开更多实验 , 以提高图像生成的质量 , 并拓宽模型的视觉和语言 。
PS.
1. 复制链接亲自尝试一下输入文本生成图像
https://vision-explorer.allenai.org/text_to_image_generation
2. 留言猜猜封面图是根据哪个关键词(一个英文单词)生成的?
参考:
【DeepTech深科技这些令人不安的照片,表明AI越来越聪明了!它正在学习根据文字生成图片】https://www.technologyreview.com/2020/09/25/1008921/ai-allen-institute-generates-images-from-captions/


推荐阅读