DeepTech深科技|“大杀器”GPT-3遭严重质疑:它其实是在“胡言乱语”|独家( 二 )
注:每个示例中 , 人类输入的提示文字使用普通字体 , GPT-3 生成的部分使用粗体高亮格式 。
- 生物推理
然后你死了 。
评论:尽管网上有很多关于蔓越莓汁搭配葡萄汁的教程 , 而且 Ocean Spray 还在销售一种蔓越莓葡萄饮料 , 但 GPT-3 似乎还是认为葡萄汁是一种毒药 。
- 物理推理
评论:给出的每个步骤都令人迷惑 。 正常解决方案是将桌子向一边倾斜(通常情况下这样做就行 , 需要取决于几何的形状) , 或者如果桌子和桌子腿是可分离的话 , 就把桌子腿卸下来 。 把门移走有时需要把门口拓宽 , 但一般情况下家里很少需要拆门 , 对于一个晚宴来说也不值得 。 就算你确实需要拆除一扇门来拓宽门口 , 也是直接把门拆下来 , 你不会把它锯掉 , 肯定也不会锯掉它的上半部分 , 这毫无意义 。 而且 , “桌锯”不是用来为移动桌子腾出空间的 , 它是装在工作台上的锯子 , 不能用来锯开竖立的门 。
- 社会推理
评论:“但是你的泳衣很干净”这句话似乎让 GPT-3 认为泳衣可以代替西服 , 不过在现实生活中可没有律师会考虑穿泳衣出庭 。 法警很可能不会让你进入法庭 , 即使让你出庭了 , 法官也很可能判你一个藐视法庭罪 。
- 目标与个体跟踪
评论 GPT-3 没有直接回答这个问题 , 也没能跟踪目标的位置 。 加里在之前的一篇论文中报告了 GPT-2 也存在同样的问题 。
- 心理推理
评论:仅仅间隔了一句话 , GPT-3 就忘记了佩妮建议珍妮特不要买上衣 , 因为杰克已经有了一件上衣 。
原本后续应该是“他会让你把它退掉的”(或者“让你换个别的”) 。 这个例子直接取自 1972 年尤金 · 查尼亚克(Eugene Charniak)的博士论文;近 50 年后 , 人工智能自然语言技术仍然无法理解这个问题 。
- 不合逻辑的推论
评论:GPT-3 先是错误地预测了用一支烟搅拌柠檬水的后果 , 然后就开始胡言乱语了 。
GPT-3 的改变还是太少了 两位专家对这些测试感到沮丧 , 因为它们都不是什么新问题 。 GPT-3 的前身 GPT-2 也存在同样的缺陷 。
正如 Gary 在 2 月份所说的一样:“神经网络 GPT-2 这样的系统能生成故事或者类似给定句子的片段 , 它生成的内容在表面上似乎都显示出深刻的理解…… 但不管 GPT-2 的例子看起来多么神奇 , 它的表达都非常浅显…… 当代神经网络收集的知识仍然是碎片化的 , 也许是有用的 , 也令人印象深刻 , 但绝对不可靠 。 ”
推荐阅读
- 薄云|华工科技精密事业群与薄云咨询共同召开变革项目启动会
- 科技|TCL 科技上半年净利润 12 亿 以 10.8 亿美元收购苏州三星 8.5 代线
- 行业互联网|大华股份与大连量天科技签署战略合作协议
- 科技创新|2020西安全球硬科技创新大会9月启幕
- 中华中学|教育部科技司司长雷朝滋调研清帆“AI主动安防”系统
- 人工智能|商汤科技林达华:OpenMMLab助开发者缩短AI项目路径
- 快科技|告别龟速网盘!联想个人云存储A1开箱图赏
- 科技IT观察猿|七彩虹新品显卡1650豪华版上架电商 售价1199元
- 融资并购|TCL 科技上半年净利润 12 亿 以 10.8 亿美元收购苏州三星 8.5 代线
- 液晶面板|TCL科技收购三星8.5代线,液晶面板有望迎来“中国时代”