例如,你可以向 GPT-4 提出这样的问题,即这两篇关于无监督学习和从人类反馈中学习的基础博客之间经过了多长时间?
模型说过去了两个月 。但这是真的吗?就像这些模型并不是 100%可靠一样,尽管它们每次提供一些反馈就会变得更好 。但我们实际上可以使用 AI 进行事实检查 。它可以检查自己的工作 。你可以说,为我核实这一点 。
在这种情况下,我实际上给了 AI 一个新工具 。这是一个浏览工具,模型可以发出搜索查询并点击网页 。它实际上会在执行操作时写出整个思维链 。它说,我要搜索这个,然后它会进行搜索 。然后它找到了出版日期和搜索结果 。然后它发出另一个搜索查询 。它将单击博客文章 。你可以做所有这些,但这是一项非常繁琐的任务 。这不是人类真正想做的事情 。坐在驾驶座上,处于这个管理者的位置,可以更有趣,如果你愿意,可以再次检查工作 。
引文出现,因此你可以轻松验证整个推理链的任何部分 。
结果实际上,两个月是错误的 。
(ChatGPT 核查后的答案)两个月零一周,正确的 。
03
重新思考人机交互
对我来说,整个过程最有趣的是它是人类和人工智能之间的多步协作 。
因为人类使用这个事实检查工具是为了为另一个人工智能生产数据,使其对人类更加有用 。
我认为这真正展示了一种我们期望在未来更为普遍的形式,即我们将人类和机器非常谨慎地设计成问题的一部分,以及我们希望解决该问题的方式 。
我们确保人类提供管理、监督、反馈,机器以可检查和值得信赖的方式运行 。而通过合作,我们能够创造出更值得信赖的机器 。随着时间的推移,如果我们正确地进行这个过程,我们将能够解决不可能解决的问题 。
多么不可能呢?
我们将重新思考我们与机器交互的几乎每一个方面 。
例如,电子表格 。
自 40 年前的 VisiCalc 以来,它们以某种形式存在 。我认为它们在那个时候并没有发生太多变化 。
Greg 在 ChatGPT 中上传了一个表格,记录了过去 30 年来 167000 篇 AI 领域论文的数据 。ChatGPT 使用 Python/ target=_blank class=infotextkey>Python 自动分析数据,理解表格的每一纵列意味着什么,并在 Greg 的指令下绘出了多个可视化图表 。Greg 用非常口语化的文字表达对产出效果的不满,ChatGPT 理解了他的意思,并自动修改了图表 。
04
人与机器的共同协作
我们未来会怎样使用这项技术呢?
在这页 PPT 上,一个人带着他生病的狗去看兽医,兽医却作出了错误的判断:「我们等等再看看吧 。」
文章插图
如果狗主人听了这句话,那只狗就不会活到今天 。与此同时,他向 GPT-4 提供了血液检测和完整的病历记录,GPT-4 说:「我不是兽医,你需要找专业人士,这里有一些假设 。」
他把这些信息带给了第二位兽医,后者利用这些信息挽救了狗的生命 。
这些系统并不完美 。你不能过分依赖它们 。但这个故事显示出,一个与医疗专业人员和 ChatGPT 一起进行头脑风暴的人,能够取得一个否则不可能实现的结果 。
我认为这是我们考虑如何将这些系统整合到我们的世界中时应该反思和思考的事情 。
我深信,让人工智能发挥作用需要大家的参与 。这是为了决定我们希望它如何融入,为了制定规则,决定什么是人工智能会做和不会做的事情 。
如果听完演讲你只需要记住一句话,那就是:这项技术看起来与人们预期的完全不同 。所以我们都必须变得精通 。而这也是我们发布 ChatGPT 的原因之一 。我相信,我们可以共同实现 OpenAI 的使命,确保人工智能的普及造福全人类 。
05
问答环节
演讲结束后,TED 主席 Chris Anderson(简称 CA) 上台,与 Greg Brockman (简称 GB)做了一个简短的访谈,下面为访谈内容 。
CA:OpenAI 只有小几百名员工 。google 有数千名员工致力于人工智能 。为什么是你们开发了这项震惊世界的技术?
GB:事实上,我们都在巨人的肩膀上 。毫无疑问,如果你看看算力的进步、算法的进步、数据的进步,所有这些都是整个行业共同努力的结果 。
但是在 OpenAI 内部,我们从早期开始就做出了许多非常明智的选择 。
第一个选择是要直面现实 。
我们认真思考了:要取得进展需要什么?我们尝试了许多行不通的方法,因此你只会看到那些有效的方法 。我认为最重要的是让来自不同背景的人们和谐地协作 。
推荐阅读
- 最新电影票房排行榜2022年
- 实物黄金买卖规则最新
- 三本院校最新排名榜
- 最新三本院校排名榜
- 3d捕鱼游戏排行榜最新
- 最新的oppo手机要多少钱一个
- 中国天气网排行榜最新
- 空间大省油的suv车排行榜最新
- 异界异能小说排行榜最新版
- 2017年网络歌曲排行榜最新