科学|批评者称谷歌乳腺癌预测AI研究如果不透明就没有用处 |谷歌|

早在1月份，谷歌旗下专注于健康相关研究、临床工具和医疗服务合作的分支Google Health就发布了一个在9万多张乳房X光照片上训练的人工智能模型，该公司称其取得了比人类放射科医生更好的效果。谷歌宣称，与之前的工作相比，该算法可以识别出更多的假阴性，即那种看起来正常但含有乳腺癌的图像，但一些临床医生、数据科学家和工程师对这一说法表示质疑。
在今天发表在《自然》杂志上的一篇反驳文章中，隶属于麦吉尔大学、纽约市立大学（CUNY）、哈佛大学和斯坦福大学的超过19位共同作者表示，谷歌的研究缺乏详细的方法和代码，损害了其科学价值。一般来说，科学都存在可重复性问题， 2016年对1500名科学家进行的一项调查报告显示，其中70%的科学家至少尝试过复制其他科学家的实验，但失败了。
在人工智能领域，这个问题尤为严重。在2019年的ICML大会上，有30%的作者未能在会议开始前将自己的代码与论文一起提交。研究经常提供基准结果来代替源代码，当基准的彻底性受到质疑时，就会出现问题。最近的一份报告发现，自然语言处理模型给出的60%到70%的答案都嵌入了基准训练集的某个地方，这表明模型往往只是在记忆答案。
他们表示，谷歌的乳腺癌模型研究缺乏细节，包括对模型开发以及所使用的数据处理和训练管道的描述。谷歌省略了模型架构的几个超参数的定义，也没有披露用于增强模型训练的数据集的变量。这可能会显著影响其性能， Nature的共同作者声称，例如，谷歌使用的其中一个数据增强有可能导致同一患者的多个实例，从而使最终结果出现偏差。
谷歌方面表示，用于训练该模型的代码对内部工具、基础设施和硬件有许多依赖性，使其发布不可行。该公司在决定不发布这两个训练数据集时，还提到了这两个训练数据集的专有性和患者健康数据的敏感性。但Nature的共同作者指出，原始数据的共享在生物医学文献中已经变得越来越普遍，从2000年代初的不足1%增加到现在的20% ，而且模型预测和数据标签本来可以在不泄露个人信息的情况下发布。

本文插图
【科学|批评者称谷歌乳腺癌预测AI研究如果不透明就没有用处】

科学|批评者称谷歌乳腺癌预测AI研究如果不透明就没有用处

推荐阅读

如歌岁月|任正非谈汽车自主创新：我不反对李书福！网友：发动机不重要吗？

小米手环4|8天出货量100万支！小米手环4成全球最畅销手环

上观新闻|收到“老板”指令转账汇款？要当心了！冒充老板骗局再次卷土重来

李小璐送闺蜜1599朵玫瑰|患难见真情!李小璐送闺蜜1599朵玫瑰 1599朵的寓意了解下

游戏小怪兽|王者荣耀：手残意识好？那就选择这些英雄上分吧

领导打压下属，最常用这五种手段，一招比一招毒

结局|中国古代唯一女状元，才貌双全官居丞相，却成他人点心，结局悲惨

ChristteCYChua典雅太|杨幂很挑食，吴彦祖接地气，看到吴京：要不，当明星们在片场吃饭

青岩梦罢|丁当节目接长发，本以为效果一般，看清效果后，粉丝都快认不出了

[绿豆]男人想要长寿，5件“耗阳”的事要“舍弃”，一些人表示很难做到

红茶是煮还是泡,岩茶也是普洱茶可以煮

纵相新闻|西媒高呼"中国市场很神奇"，哈萨克斯坦称中国进博会代表了稳定和吸引力 | 外媒看进博

#星座听语#痴情眷恋，难以舍弃，3星座不再退缩，挽回旧爱再相守，5月下旬

Intel|12代酷睿升级LGA1700插槽网友实际数了一遍：真是1700个针脚

潮流尚拍精选|还是穿得“简约风”些更帅气，男生衬衫

晴晴侃游戏|再也不怕刚枪，和平精英：主副武器怎么选？最实用的搭配

多特体育|宏远打“野球”狂胜150分！国家队欺负青年队，杜锋真不给面子

「十渡车神」平行进口车经历生死大考

「」张杰的一首歌, 竟成高考神曲, 网友: 点燃无数高考学生的激情

江苏卫视|北京卫视和江苏卫视联播，本以为这剧会火，结果收视表现出乎意料