新冠|27岁华裔小伙一战成名!搞出最准新冠预测模型,一人干翻专业机构

金磊 晓查 发自 凹非寺量子位 报道 | 公众号 QbitAI
年仅27岁的他 , 被彭博评价为“新冠病毒数据超级明星” 。
为什么?
凭一己之力 , 仅用一周时间打造的新冠预测模型 , 准确度方面碾压那些数十亿美元、数十年经验加持的专业机构 。
新冠|27岁华裔小伙一战成名!搞出最准新冠预测模型,一人干翻专业机构
文章插图

他就是Youyang Gu , 拥有 MIT 电气工程和计算机科学硕士学位 , 以及数学学位 。
但值得注意的是 , 他在医学和流行病学等方面却是一个小白 。
他的模型 , 甚至被著名数据科学家、fast.ai创始人Jeremy Howard高度评价道:
唯一看起来合理的模型 。
他是唯一一个真正查看数据 , 并且做得正确的人 。
不仅如此 , 他的模型还被美国疾控中心采用 。
到底是个怎样的预测模型?
时间点要追溯到去年年初 。
当时疫情已然在全球蔓延开来 , 于是公众试图用建模的方式 , 来预测接下来疫情会带来的影响 。
大多数的目光都将希望投向了2家专业机构打造的预测系统——伦敦帝国理工学院、总部位于西雅图的健康指标与评估研究所(IHME) 。
但2家机构给出的预测结果却是天差地别:
伦敦帝国理工学院:到夏天 , 美国因新冠病毒而死亡的人数将达到200万 。
IHME:预计到8月 , 死亡人数将达到6万 。
(后来的事实证明 , 死亡人数是16万 。 )
2家专业机构给出的预测数据 , 差距为何能够如此之大?
这就让当时年仅26岁的Youyang Gu引起了注意 。
新冠|27岁华裔小伙一战成名!搞出最准新冠预测模型,一人干翻专业机构
文章插图

△ Youyang Gu
虽然他没有任何医学或流行病方面的经验 , 但他坚信 , 数据预测在此时会派上大用场 。
于是 , 大约在4月中旬 , Youyang Gu便在家里仅花了一周时间 , 打造出了自己的预测器 , 以及一个可以显示相关信息的网站 。
新冠|27岁华裔小伙一战成名!搞出最准新冠预测模型,一人干翻专业机构
文章插图

△Youyang Gu创建的网站
但Gu在这个过程中所用到的方法 , 并不是说有多么的高级 , 相反 , 恰恰是比较简单的那种 。
他首先考虑的是新冠病毒检测数、住院人数和其他因素之间的关系 , 但在这个过程中 , Gu却发现各个州和联邦政府所提供的数据是存在不一致的现象 。
此时 , 问题就来了——什么样的数据才是靠谱的?
Gu认为 , 最靠谱的数据 , 似乎就是每天的死亡人数:
其他的模型用到了很多数据源 , 但我决定用过去的死亡人数 , 来预测未来的死亡人数 。
至于这样做的原因 , Gu给出的解释是“将它作为唯一的输入 , 有助于在噪音中过滤信号” 。
那么 , 预测结果如何?
可以说是相当的精准了 。
在模型刚刚完成时 , 他预测在5月9日 , 美国将有8万人死亡 , 当天的实际死亡人数为79926 。
而同样来自IHME的预测数据却是“2020年一整年的死亡人数将不超过8万” 。
Gu还预测在5月18日 , 死亡人数将达到9万;5月27日 , 死亡人数将达到10万 。
事实证明 , 他的这两次预测再次“押中”!
除了精准数字的预测外 , Gu基于许多州从封锁状态逐步转变开放状态 , 预测将出现第二波大规模感染和死亡 。
而在Gu发出这样的预测当天 , 特朗普所发表的言论却是“IHME所预测的6万死亡人数表明 , 疫情很快将结束”……
或许正是因为Gu的模型预测之精准 , 越来越多人开始关注他的作品 。
在Twitter上 , Gu不仅@了各路采访人员 , 还给流行病学专家发邮件 , 让他们核实自己的数据 。
新冠|27岁华裔小伙一战成名!搞出最准新冠预测模型,一人干翻专业机构
文章插图

去年4月底 , 华盛顿大学著名生物学家Carl Bergstrom便在Twitter上发布了Gu的模型 。
新冠|27岁华裔小伙一战成名!搞出最准新冠预测模型,一人干翻专业机构
文章插图

不久之后 , 美国疾病控制和预防中心 , 也在其新冠预测网站上发布了Gu的数据 。
不仅如此 , 随着疫情的发展 , 身为中国移民的Gu , 还参与了由美国专家团队组织的定期会议 , 每个人都想更好的改善他的模型 。
他的网站访问量也呈现出爆炸式增长 , 每天都有数百万人来看他的数据 。
通常情况下 , Gu的模型所预测的数据 , 基本在几周后便会达到 , 与实际的死亡人数非常接近 。
随着类似的预测模型逐渐增多 , 阿默斯特马萨诸塞大学生物统计学和流行病学系的副教授Nicholas Reich , 便统计了50个这样的模型:
Gu的模型一直位居前列 。
但到了去年11月 , Gu却做出了令人意外的一个决定——结束他的预测任务 。
对此 , Reich这样评价道:
Youyang Gu是一个非常谦卑的人 , 他看到其他人的模型也做得很好 , 便觉得自己的工作已经完成了 。
而在Gu决定停止项目的前一个月 , 他预测11月1日死亡人数将达到231000人 , 而实际人数为230995人 。
但IHME的Chris Murray认为:
Gu使用的机器学习方法 , 在短期预测方面的效果比较良好 , 但不太理解“大局中发生了什么” 。
对此 , Gu没有针对模型的评价做出回应 , 相反 , 他这样表态:
我非常感谢 Chris Murray 医生和他的团队所做的工作;没有他们 , 我就不会有今天的成就 。
在休息了一段时间之后 , Gu重新投入到了这份事业当中 。
新冠|27岁华裔小伙一战成名!搞出最准新冠预测模型,一人干翻专业机构
文章插图

这一次 , 他要做的预测是“美国有多少人感染了新冠病毒”、“疫苗推出的速度有多快”、“美国可能何时(如果可能的话)达到群体免疫”等 。
他的预测表明 , 到今年6月 , 大约61%的美国人口应该获得某种形式的免疫力——无论是疫苗还是因过去的感染 。
……
Gu一直希望能够找到一份能对社会产生巨大影响的工作 , 同时避免政治、偏见以及大型机构有时会带来的负担 。 他认为:
在这个领域 , 有很多缺点可以通过我这种背景的人来改善 。
谁是Youyang Gu?
Youyang Gu出身于美国华裔移民家庭 , 在伊利诺伊州和加州长大 。
Gu从小喜欢数学和科学 , 直到高中毕业时 , 才真正接触计算机科学 。 而他能够进入这个行业得益于他的父亲 , 因为他的父亲是一名计算机从业者 。
新冠|27岁华裔小伙一战成名!搞出最准新冠预测模型,一人干翻专业机构
文章插图

△正在做化学实验的Gu Youyang(图片来自2010年克拉克奖学金项目)
Gu本科和硕士都在MIT就读 , 在那里他获得了计算机科学与数学双学士学位 , 以及计算机科学的硕士学位 。
毕业后他继续在MIT著名的CSAIL实验室的NLP组进行了一年的研究 , 同年在EMNLP 2016上发表了论文 。
新冠|27岁华裔小伙一战成名!搞出最准新冠预测模型,一人干翻专业机构
文章插图

这也是他第一次接触大数据 , 并由此建立统计模型对数据进行预测 。
不过他没有因此继续学术研究 , 而是进入产业界 。 从MIT离开后 , 他加入了金融行业 , 为高频交易系统编写算法 。
在那里 , 他的数据建模能力得到了进一步磨练 , 因为在金融交易中 , 数据必须非常定量并尽可能地准确 。
之后 , 他又进入了体育界 , 继续进行大数据方面的研究 。 这也为他提供了丰富的跨学科经验 , 使他能够成功应对新地领域 , 懂得如何更加准确地建模 。
新冠|27岁华裔小伙一战成名!搞出最准新冠预测模型,一人干翻专业机构
文章插图

用他自己的话来说 , 他的专长是使用机器学习来理解数据 , 将信号与噪声分离并做出准确的预测 。
在建立新冠死亡模型时 , 他起初考虑了确诊数量、住院数量和其他因素之间的关系 。 然后他发现各州和联邦政府报告的数据不一致 , 最可靠的数字是每天的死亡人数 。
Gu认为 , 如果输入数据质量很低 , 那么数据越多 , 输出的性能就越差 。
在一周的时间里 , 他就根据死亡数据便建立了一个简单模型 , 并将预测网站上线 。
从去年4月以来 , Gu已经自愿在这个项目中投入了几千个小时 , 而且是无偿的 。
在接受医学网站Medscape主编Eric Topol采访时 , Gu表示自己现在全职投入到新冠预测网站上 , 没有兼职、没有收入 , 他靠着过去的积蓄生活 。
新冠|27岁华裔小伙一战成名!搞出最准新冠预测模型,一人干翻专业机构
文章插图

△ Gu Youyang接受Medscape主编Eric Topol视频采访
然而就是这样一个公益的项目却遭到了一些Twitter网友非议 , 但是他还是坚持了下来 。
【新冠|27岁华裔小伙一战成名!搞出最准新冠预测模型,一人干翻专业机构】从12月开始 , covid19-projections.com接受网友的捐赠帮助 , 现在已经完成了5万美元的筹款目标 。
新冠|27岁华裔小伙一战成名!搞出最准新冠预测模型,一人干翻专业机构
文章插图

除了感染人数外 , Gu的新冠网站又有了一个新的功能 。 从去年12月起 , covid19-projections.com开始跟踪和模拟疫苗接种情况以及群体免疫的途径 。
这个月 , Gu又将“群体免疫”改成了“恢复常态” , 因为他的模型预测表明 , 美国不太可能在2021年达到理论上的群体免疫 。
新冠|27岁华裔小伙一战成名!搞出最准新冠预测模型,一人干翻专业机构
文章插图

未来的路怎么走?疫情结束后 , Gu的职业规划如何?
他说现在还为时过早 , 虽然他现在的工作是预测疫情发展 , 但是他很难预测自己3个月或1年后要做什么 。
因为这项工作 , 世界各地的高校和企业已经向他抛出了橄榄枝 。


    推荐阅读