CSDN|可以“作为医生”的 GPT-3,究竟是炒作还是名副其实?( 三 )


温度参数 在不同的温度参数设定下 , 对于同一个问题 , 我们得到了两个截然相反的答案 。 如下是当温度参数T = 0.9时得出的答案 。
CSDN|可以“作为医生”的 GPT-3,究竟是炒作还是名副其实?
本文插图
相比之下 , 在温度参数极低的情况下(T = 0) , 相似种子永远会给出完全相同且非常直接的答案 。
CSDN|可以“作为医生”的 GPT-3,究竟是炒作还是名副其实?
本文插图
频率惩罚参数与存在惩罚参数
此外 , 我们还应注意频率惩罚参数与存在惩罚参数 , 二者既能防止单词重复又能防止主题重复 。 在医学上 , 直观地来讲我们应尽可能降低这两个参数 , 因为过于生硬的主题切换可能引发混乱 , 而且重复实际上相当有用 。 然而 , 通过比较人类两次提出的同一个问题 , 我们可以清楚地看到 , 具有重复惩罚的模型更富有同情心且更友好 , 而另一种设定则看起来比较冷漠且对于人类来说重复过多 。 下面是一个没有惩罚的例子 。
CSDN|可以“作为医生”的 GPT-3,究竟是炒作还是名副其实?
本文插图
而下面则是一个惩罚满格的例子:
CSDN|可以“作为医生”的 GPT-3,究竟是炒作还是名副其实?
本文插图

总结
正如OpenAI所警告的那样 , 距离GPT-3真正在医疗保健领域大展拳脚 , 我们还有很长一段的路要走 。 由于GPT-3的训练方式 , 它缺乏科学和医学领域的专业知识 , 因此尚不能胜任医学文献记录、诊断支持、给出治疗建议或回答医生问题等工作 。 虽然GPT-3可能给出正确的答案 , 但也很有可能给出非常错误的答案 , 这种不一致在医疗保健领域中是站不住脚的 。 即使对于翻译或总结医学术语等管理任务 , GPT-3的发展前景虽然良好 , 但距离真正为医生提供支持还需要付出很大的努力 。 在目前这个阶段 , 与采用一种雄心勃勃的通用模型相比 , 采用多个经过专项任务训练的监管模型更为有效 。
话虽如此 , GPT-3的聊天模块似乎已做好准备鞠躬尽瘁 , 为医生减轻重担 。 在结束了一天的忙碌之后 , 坐下来与私人医疗助手开怀畅谈 , 可以为你洗去一天的尘埃 , 抛去一天的劳累 。
此外 , 毫无疑问 , 从整体上来看语言模型也将得到快速改善 , 这不仅会对上述用例产生积极的影响 , 而且也会影响到其他重大问题 , 例如信息结构与规范化或自动咨询汇总等 。
原文:https://www.nabla.com/blog/gpt-3/
本文为 CSDN 翻译 , 转载请注明来源出处 。
更多精彩推荐? 图灵奖得主 John E. Hopcroft 等 300 余位 AI 学者“穿越”回宋代开国际 AI 大会 , 这场面你见过吗?
? 蚂蚁上市员工人均一套大 House , 阿里程序员身价和这匹配吗?
? Robust.ai 获得 1500 万美元融资 , 嘴炮 Gary Marcus 也难逃真香定律
点点赞点在看


推荐阅读