Science:AI领域那么多引人注目的「进展」,竟是无用功( 二 )

Kolter 表示 , 研究人员更愿意开发新算法并进行微调 , 使之超越原有的 SOTA 结果 。 原有的方法看起来没那么新颖 , 因此「更难据此写出论文」 。
Guttag 认为 , 即使算法的发明者也很难全面地对比自己的工作与其他方法 , 因为万一其突破并不像他们以为的那样呢 。 「太认真地对比会有风险」 , 而且实现难度颇大:AI 研究者使用不同的数据集、调试方法、性能度量指标和基线 。 「要做到一一对应的比较很不现实 。 」
一些夸大的性能表述可能要归因于该领域的爆炸式发展 , 论文数量比有经验的评审还要多 。 「其中大量论文读起来是种煎熬 , 」Blalock 说道 。 他敦促审稿人使用更多的对比方法来进行评判 , 并表示更好的工具或许能起到一定的帮助 。 今年初 , Blalock 的共同作者、MIT 研究人员 Jose Gonzalez Ortiz 推出了一款名为 ShrinkBench 的软件 , 可以更便捷地比较剪枝算法 。

Science:AI领域那么多引人注目的「进展」,竟是无用功
本文插图
研究人员指出 , 即使新方法本质上不如旧方法好 , 但它们实现的调整说不定也可以用到之前的方法上 。 偶尔也会出现真正突破性的新算法 。 「这很像是一个风险投资组合 , 」Blalock 说道 。 「即使一些投资不赚钱 , 但总有能够获得回报的 。 」
原文链接:https://science.sciencemag.org/content/368/6494/927


推荐阅读