科学批评者称谷歌乳腺癌预测AI研究如果不透明就没有用处 |谷歌|

早在1月份，谷歌旗下专注于健康相关研究、临床工具和医疗服务合作的分支Google Health就发布了一个在9万多张乳房X光照片上训练的人工智能模型，该公司称其取得了比人类放射科医生更好的效果。谷歌宣称，与之前的工作相比，该算法可以识别出更多的假阴性，即那种看起来正常但含有乳腺癌的图像，但一些临床医生、数据科学家和工程师对这一说法表示质疑。
在今天发表在《自然》杂志上的一篇反驳文章中，隶属于麦吉尔大学、纽约市立大学（CUNY）、哈佛大学和斯坦福大学的超过19位共同作者表示，谷歌的研究缺乏详细的方法和代码，损害了其科学价值。一般来说，科学都存在可重复性问题， 2016年对1500名科学家进行的一项调查报告显示，其中70%的科学家至少尝试过复制其他科学家的实验，但失败了。
在人工智能领域，这个问题尤为严重。在2019年的ICML大会上，有30%的作者未能在会议开始前将自己的代码与论文一起提交。研究经常提供基准结果来代替源代码，当基准的彻底性受到质疑时，就会出现问题。最近的一份报告发现，自然语言处理模型给出的60%到70%的答案都嵌入了基准训练集的某个地方，这表明模型往往只是在记忆答案。
他们表示，谷歌的乳腺癌模型研究缺乏细节，包括对模型开发以及所使用的数据处理和训练管道的描述。谷歌省略了模型架构的几个超参数的定义，也没有披露用于增强模型训练的数据集的变量。这可能会显著影响其性能， Nature的共同作者声称，例如，谷歌使用的其中一个数据增强有可能导致同一患者的多个实例，从而使最终结果出现偏差。
谷歌方面表示，用于训练该模型的代码对内部工具、基础设施和硬件有许多依赖性，使其发布不可行。该公司在决定不发布这两个训练数据集时，还提到了这两个训练数据集的专有性和患者健康数据的敏感性。但Nature的共同作者指出，原始数据的共享在生物医学文献中已经变得越来越普遍，从2000年代初的不足1%增加到现在的20% ，而且模型预测和数据标签本来可以在不泄露个人信息的情况下发布。
【科学批评者称谷歌乳腺癌预测AI研究如果不透明就没有用处】

本文插图

科学批评者称谷歌乳腺癌预测AI研究如果不透明就没有用处

推荐阅读

十分父母|网友评论打得好，这种教育方式你怎么看，包贝尔当众怒扇女儿耳光

萱草|限量！Alibaba首发“Java成长笔记”，差距不止一点点

高效实用的养蚕方法蚕宝宝怎么养

车宇无际|都比较经济实用，十来万就能拿下，这3款高品质SUV

丽水58同城丽水生活网

网络营销之软文营销

中国新闻网客户端|一线战“疫”日记：防护服上的“生日祝福”

中国新闻网|山西吕梁：消防员热传“90岁老兵拄拐重温入党誓词”照片

太极拳健身需防膝关节损伤

历史的长河故事|纪传体三国评传：《晋书笔记·帝纪第一》全十七篇

分手后，你看到的男人VS男人内心的自己

汪小菲|汪小菲妈妈自曝确诊新冠，带病坚持直播心态豁达，感染途径曝光

win10字体库在哪里

凇清幕雨泡泡袖显小女人，气质顿时温柔了，当张雨绮穿上淡黄色裙子

Blues蓝调时尚|细腰长腿的个性穿搭，最符合夏天，超适合亚洲人的欧美性感风

新民晚报|十日谈 | 记忆的旅行灵魂的栖居

【】香港特区维护国家安全委员会举行首次会议

李荣浩|李荣浩被传出轨吉克隽逸，妻子杨丞琳回应

家庭|【文明榜样】喜讯！云浮2户家庭获评2020年广东省五好家庭

新华网|管好用好人民群众的“救命钱”——解读医保基金监管制度体系改革的指导意见