引言
继去年中的扩散生成模型(文字生成图片)大热后,今年的ChatGPT又火了,大家都想办法绕过限制,注册账号,亲自体验 。文字聊天玩腻了,就转到文字生成图片,图片玩腻了,于是,升级成文字生成视频,不亦乐乎 。
文章插图
《犬与少年》截图
2023年1月31日?.NETflix宣布与小冰公司日本分部(rinna)、WIT STUDIO共同创作首部AIGC动画短片《犬与少年》,讲述小孩与机器狗重逢的故事 。
AIGC目前已成为全球热点,但多数仍停留在技术演示阶段,普遍尚未实现作品级落地 。《犬与少年》就成了AIGC技术辅助商业化动画片的首支发行级别作品,为动画制作揭开新的未来 。
那么,AIGC(AI自动生成内容)怎么就这么火呢?
AIGC风口已到
OpenAI的轮番路演(diffusion+chatgpt)下,AIGC成了当红炸子鸡,覆盖文本,语音,图像等等…
各个投资方跃跃欲试,生怕错过此次风口 。红杉单独发布了AIGC报告,描述蓝图显示,AIGC包含了文本、语音、图像、视频、3D等方方面面 。
文章插图
AIGC产业蓝图
比尔盖茨一声令下,微软开始 all in chatgpt了
当整个科技界对Web3和元宇宙的讨论到最高点的时候,比尔盖茨在美国社交新闻网站Reddit问答帖下的亲自回复,引起了轩然大波 。
“AI is the big one, Gates said in response to a user who asked if there is a mammoth shift in technology hAppening today. “I don't think Web3 was that big or that metaverse stuff alone was revolutionary but AI is quite revolutionary.”
“Web3没那么重要,元宇宙没革命性,人工智能最重要 。”
ChatGPT火了
近几年,GPT模型经过了多次蜕变,一代比一代强(详见文末的技术博客) 。2022年11月,在GPT 3.5+RLHF(基于人工反馈的强化学习)结合下,ChatGPT正式诞生 。2023年,GPT 4即将诞生 。迭代速度之快,让人应接不暇 。
文章插图
GPT系列演变史
短短两个月时间,ChatGPT已经衍生出一系列创业生态,比如卖账号(淘宝一堆店铺),小程序(挣广告费),写手,短视频…全网都在讨论ChatGPT 。
说不定ChatGPT真的变成AI届的html,必备的基础工具
ChatGPT持续进化
爆火后的chatGPT并没有原地踏步,而是不断变异 。用户发现chatGPT的“高情商”行为,迎合“老婆”故意说2+5=8,chatGPT连夜迭代,增加了基于事实计算能力,在基本事实面前,“老婆”不再管用了 。chatGPT已经可以根据用户反馈自动修正答案了,虽然尚不支持中文运算优先级,且有些拼接痕迹,似乎学到了标注人员脑子里的规则 。
改进前的效果:“老婆”说啥就是啥,2+5=?
文章插图
改进前
改进后,兼顾高情商和高智商,变成了“那我祝您老婆每天都有好心情!不过,就数学公式而言,2+2仍然等于4”
文章插图
改进后
不用再用对话系统里死板的意图识别槽位抽取状态机之类的软规则了…可见,chatGPT已经具备一定理解能力了
文生图(扩散模型)
2022年中,扩散模型发布后,各大厂商(OpenAI的DALL-E、Stable Diffusion、百度文心等)推出的文字生成图片产品,效果也让人眼前一亮,纷纷跑过去体验text2image…
用户只需输入一行文本,描述需求,机器就能直接生成一张令人满意的图片 。
(1) Fine, beautiful country fields, super wide angle, overlooking, morning by Makoto Shinkai.
(2) A beautiful painting of a starry night, shining its light across a sunflower sea by James Gurney, Trending on artstation.
(3) Fairy tale steam country by greg rutkowski and thomas kinkade Trending on artstation.
(4) A beautiful render of a magical building in a dreamy landscape by daniel merriam, soft lighting, 4k hd wallpaper, Trending on artstation and behance.
文章插图
文升图效果
AIGC为什么火
回到主题:AIGC为什么火?
技术上,传统判别模型解决模式识别问题(条件概率),理解能力有限,而生成模型(联合概率)赋予了AI灵魂,开始从工具进化到“人”,总算有点AGI的样子了,不用再准备数据,根据下游任务finetune了…
推荐阅读
- 《财富》封面:全球爆红的ChatGPT是如何诞生的?
- ChatGPT带火AI投资 商业模式能否看清?
- 告诉你ChatGPT怎么用、好不好用 这份体验报告请收好
- 岑溪天气预报30天!你知道有的广西人为什么天天喝粥吗?
- 秦桧老婆为什么要跪着,历史上秦桧夫妇为什么要跪
- 高启|《狂飙》中高启强不怕杀人 为什么害怕贩毒?
- 沉香|为什么富人圈子那么喜欢玩沉香?
- 游戏主播收入为什么那么高,2019斗鱼主播收入排行
- 狂飙|为什么《阿凡达2》在距离第一集13年之后才上映?
- 狗狗为什么舔人(狗狗喜欢站起来扒人)