模范爸爸|未来5到10年内,AI能否成为下一个风口?

原创声明
本公众号所有文章均原创 , 未经许可不得转载(本公众号已与维权骑士签约) 。 为了容易理解和记忆 , 文章以图解为主、代码为辅 。 如果您感兴趣 , 欢迎关注!
文:吴潇/Java高级工程师
模范爸爸|未来5到10年内,AI能否成为下一个风口?自从大四学了“人工智能导论”这门课之后 , 就对人工智能(后文简称AI)非常感兴趣 , 也一直非常关注这个领域 , 因为让计算机像人一样的确很酷 。 到了研究生阶段 , 几乎每个研究生同学的研究方向都或多或少的与“智能”有关 。 最近一两年 , 深度学习技术异常火爆 , 加上各种媒体炒作 , 感觉似乎人工智能的时代马上就要来了 。 真的是这样吗?
在各大媒体炒作人工智能的时候(有的甚至夸张到要让AI去参加高考) , 让我感到困惑的问题是 , 我们连自己的大脑是如何工作的都没有弄明白 , 就能先设计出AI吗?深度学习背后的最本质的原理——大数定律 , 真的能解决AI中的一切问题吗?我感觉不是那么回事 。 所以 , 在深度学习异常火爆的那段时间 , 我没有盲目从众 , 去买《深度学习》、《机器学习》、甚至《统计学习方法》之类的“大作”来啃 , 我在冷静地思考AI时代马上是否就要到来 。
然而 , 讽刺的是 , 在我想清楚这个问题之前 , AI技术已然冷静下来 。 近期 , 又在我们公司内网读了一遍分析“AI的挑战和现状”的文章 。 边读边思考 , 结合我研究生阶段的那一点论文经验 , 我觉得在接下来的5-10年内 , AI技术不会成为风口 。 思考和分析如下 。
1) 深度学习相对于机器学习而言 , 没有理论突破深度学习其实就是一种神经网络 , 而神经网络其实就是机器学习方法中的一种模型而已 。 跟其他像贝叶斯、决策树、支持向量机之类的模型一样 , 深度学习最底层的理论依然是统计学大数定律 。 什么是大数定律?只要数据量足够大、只要样本可区分 , 那么概率模型就能无限接近真实模型 。 怎么使用大数定律?给定输入输出和一个模型 , 让一个这个模型的目标函数达到最大 。
深度学习方法 , 不过是用分层思想设计出了一个统计学模型 , 让模型与样本数据足够匹配 , 在我看来 , 只不过是一种复杂的统计方法而已 , 并不是真正意义上的“智能” 。 虽然它在效果上产生了“智能识别”的神奇之处 , 但是它是以巨大的计算量、巨大的数据量为代价的 , 而且无法扩展 , 我们不明白模型内部各参数的含义 , 只有一个好的效果而已 。
统计机器学习相对于机器学习来说 , 是一种理论创新;但是 , 深度学习相对于神经网络、甚至相对于整个统计机器学习领域而言 , 只是一种小幅优化 , 虽然这种小幅优化产生了强大的实验效果 。 它的整体框架:模型、训练、测试等步骤跟之前的任何一种机器学习方式完全一样 。 所以 , 在一段时间内绽放光芒 , 之后迅速冷却是必然的 。
2) 与其说“AI还面临哪些问题” , 倒不如说“AI已解决哪些问题”AI经过七十多年发展 , 历经3个阶段 , 能解决的问题还是很有限的 。 目前AI可以解决下棋的问题 , 识别图像和声音 , 甚至能合成以假乱真的图片和视频 。 但是 , 这一切成果都是建立在一个不可扩展的黑盒模型 , 巨大的数据量、运算量的基础之上的 。 再往前一步就非常困难了 。 试想 , 训练计算机识别出一只猫都需要这么大的数据量和计算量 , 那么让计算机去做再复杂一些的事情 , 所需的计算量和数据岂不是要爆表 。
AI还有大量问题未解决 , 目前只是运用海量数据和计算资源解决了“智能”中很底层的识别问题 , 高级一些的推理问题完全还没有找到正确方向 , 深度学习因为其先天缺基本上已经无法再进一步发挥潜能 , 短期内的理论突破不大可能出现 , 所以AI离成为风口还有很长时间 。


推荐阅读