DeepTech深科技这些令人不安的照片,表明AI越来越聪明了!它正在学习根据文字生成图片( 二 )
虽然模型最终生成的图像并不完全真实 , 但这不是重点 。 重要的是这预示着模型已经包含了正确的高级视觉概念 , 即 AI 一定程度上具备了儿童的根据文本画图的能力 。
本文插图
图 | AI2 模型根据文本生成的图像示例(来源:MIT TR)
视觉语言模型获得此类图像生成的能力代表了 AI 研究的重要一步 , 这表明该模型实际上具有一定程度的抽象能力 , 而这是理解世界的基本技能 。
未来 , 这项技术很可能对机器人领域产生极大影响 。 机器人可以使用语言进行交流 , 当它们对视觉信息的理解越好 , 就越能够执行复杂的任务 。
Hajishirzi 说 , 从短期来看 , 这种可视化还可以帮助技术人员更好地理解 AI 模型的学习过程 。 之后 , AI2 团队计划展开更多实验 , 以提高图像生成的质量 , 并拓宽模型的视觉和语言 。
PS.
1. 复制链接亲自尝试一下输入文本生成图像
https://vision-explorer.allenai.org/text_to_image_generation
2. 留言猜猜封面图是根据哪个关键词(一个英文单词)生成的?
参考:
【DeepTech深科技这些令人不安的照片,表明AI越来越聪明了!它正在学习根据文字生成图片】https://www.technologyreview.com/2020/09/25/1008921/ai-allen-institute-generates-images-from-captions/
推荐阅读
- 游研社|虎牙斗鱼合并,游戏直播赛道还有这些低调玩家
- 科技日报|塑料微粒影响几何?人类认知仍不足
- 公安机关|这些人,速速投案!
- 七号人称说科技|华为始料未及?台积电又成了“炮灰”?新风暴说来就来
- 大众新闻|众安科技荣获“今日·保险中介榜”年度Insurtech独角兽
- 雷科技|朋友圈都在秀的“互联网勋章”到底是什么?
- 快科技|小米10至尊纪念版妙享功能升级:手机与Windows电脑合体
- 七号人称说科技|再给华为一颗糖?美国到底在打什么“算盘”?,先给华为一巴掌
- 量子科技,爆发!有项关键技术中国已领先世界
- 锦州|寻味辽宁醉经典|“烧鸽子”“炒河蟹”……这些锦州烧烤吃起来别有一番风味!