![ChatGPT/InstructGPT详解](http://img.jiangsulong.com/230203/1Q22C152-5.jpg)
文章插图
图5:ChatGPT编写的毁灭人类计划书 。
3.3 未来工作我们已经分析了InstrcutGPT/ChatGPT的技术方案和它的问题,那么我们也可以看出InstrcutGPT/ChatGPT的优化角度有哪些了 。
- 人工标注的降本增效:InstrcutGPT/ChatGPT雇佣了40人的标注团队,但从模型的表现效果来看,这40人的团队是不够的 。如何让人类能够提供更有效的反馈方式,将人类表现和模型表现有机和巧妙的结合起来是非常重要的 。
- 模型对指示的泛化/纠错等能力:指示作为模型产生输出的唯一线索,模型对他的依赖是非常严重的,如何提升模型对指示的泛化能力以及对错误指示示的纠错能力是提升模型体验的一个非常重要的工作 。这不仅可以让模型能够拥有更广泛的应用场景,还可以让模型变得更“智能” 。
- 避免通用任务性能下降:这里可能需要设计一个更合理的人类反馈的使用方式,或是更前沿的模型结构 。因为我们讨论了InstrcutGPT/ChatGPT的很多问题可以通过提供更多labeler标注的数据来解决,但这会导致通用NLP任务更严重的性能下降,所以需要方案来让生成结果的3H和通用NLP任务的性能达到平衡 。
- ChatGPT的出现会不会导致底层程序员失业?从ChatGPT的原理和网上漏出的生成内容来看,ChatGPT生成的代码很多可以正确运行 。但程序员的工作不止是写代码,更重要的是找到问题的解决方案 。所以ChatGPT并不会取代程序员,尤其是高阶程序员 。相反它会向现在很多的代码生成工具一样,成为程序员写代码非常有用的工具 。
- Stack Overflow 宣布临时规则:禁止 ChatGPT 。ChatGPT本质上还是一个文本生成模型,对比生成代码,它更擅长生成以假乱真的文本 。而且文本生成模型生成的代码或者解决方案并不能保证是可运行而且是可以解决问题的,但它以假乱真的文本又会迷惑很多查询这个问题的人 。Stack Overflow为了维持论坛的质量,封禁ChatGPT也是清理之中 。
- 聊天机器人 ChatGPT 在诱导下写出「毁灭人类计划书」,并给出代码,AI 发展有哪些问题需关注?ChatGPT的「毁灭人类计划书」是它在不可遇见的指示下根据海量数据强行拟合出来的生成内容 。虽然这些内容看起来很真实,表达也很流畅,这说明的只是ChatGPT具有非常强的生成效果,并不表示ChatGPT具备毁灭人类的思想 。因为他仅仅是一个文本生成模型,并不是一个决策模型 。
参考
- ^Ouyang, Long, et al. "Training language models to follow instructions with human feedback." *arXiv preprint arXiv:2203.02155* (2022). https://arxiv.org/pdf/2203.02155.pdf
- ^Radford, A., Narasimhan, K., Salimans, T. and Sutskever, I., 2018. Improving language understanding by generative pre-training. https://www.cs.ubc.ca/~amuham01/LING530/papers/radford2018improving.pdf
推荐阅读
- ChatGPT用于生产级对话式AI系统的那些缺点
- ChatGPT搞钱行不行
- 一文详解Python语言选择结构和循环结构
- icloud怎么用,icloud的正确用法详解
- 电商运营怎么做数据分析,详解电商运营策略
- 天猫转让需要多少钱,天猫店铺转让流程及费用详解
- 建网站需要多少钱,建站费用详解
- 开发软件需要什么配置及技术,软件开发流程详解
- 前端js中http跳转https报403错误,请求头referer详解
- ChatGPT爆火背后,生成式AI是否只是“昙花一现”?