江湖车侠|| 万字长文,统计学家范剑青:把 AI 学习金融,变为现实( 二 )


ThomasJ.Sargent:人工智能其实是统计学 , 只不过用了一个华丽辞藻 。
我认为人工智能是机器学习的平方 , 让机器自动学习机器算法、是机器学习的理想境界 。 目前内容包括图像识别、语音识别、机器学习、机器人、专家系统、计算机视觉、自然语言处理等 。
是大数据 。
我个人认为数据科学以应用为背景 , 包括数据的获取、存储、数据分析、科学计算 。 数据科学的目的是想把大数据解决成智慧数据 。
我把它总结为:大数据=系统+分析+应用 。
何谓机器学习?
ArthurLSamuel在1959年的“跳棋游戏”论文中创造了“机器学习”这个术语:让机器从数据中学习并做决策 , 它是可扩展的统计算法 , 充分融合统计建模思想和计算优化方法 。 使这些数据分析的思想能在大数据环境下得到有效的实现 。
我个人认为机器学习是:统计+优化+实现环境 。
为了有可操作的代码 , 我们需有优化的目标(Optimizationobjects) , 为了有优化的目标 , 我们需有统计模型(StatisticalModeling)和经济效用(EconomicUtility) 。
现在最常见的是深度学习 。
深度学习的概念是很常见的 , 是数学的函数逼近 , 它用的是两种方法 , 信号源的线性组合 , 再做非线性的选择 , 重复的过程构成很复杂的函数逼近方法 。
为何今天深度学习这么成功?
另外90年代 , 我们就参与建设了这方面的工作 , 为什么学术界和工业界现在才大谈深度学习?
主要是因为大数据的到来 , 大数据的到来大大减少统计的方差 , 样本量变大 , 方差自然变小 。
现在计算技术使得大规模优化成为现实 , 使得我们可以在大数据上实现深度神经网络逼近函数 。
简而言之是非参数统计思想在高维海量数据环境下的实现 。
【江湖车侠|| 万字长文,统计学家范剑青:把 AI 学习金融,变为现实】具体成功案例是图像识别、机器翻译、语音处理等等 。
我们今天要谈的主要是机器学习的挑战 。
对于经济金融、生物医学、管理决策和人文社会 , 机器学习有很多挑战和机遇 , 第一是个体差异大 , 第二是数据集未知 。


推荐阅读