|金钱能让人更快乐吗？手把手教你用机器学习找到答案

导读：本文通过“金钱能让人更快乐吗？”等实操案例带你了解基于实例的学习和基于模型的学习。
作者：Aurélien Géron
来源：华章科技

本文插图

一种对机器学习系统进行分类的方法是看它们如何泛化。大多数机器学习任务是要做出预测。这意味着系统需要通过给定的训练示例，在它此前并未见过的示例上进行预测（泛化）。在训练数据上实现良好的性能指标固然重要，但是还不够充分。真正的目的是要在新的对象实例上表现出色。
泛化的主要方法有两种：基于实例的学习和基于模型的学习。
01 基于实例的学习
我们最司空见惯的学习方法就是简单地死记硬背。如果以这种方式创建一个垃圾邮件过滤器，那么它可能只会标记那些与已被用户标记为垃圾邮件完全相同的邮件—这虽然不是最差的解决方案，但肯定也不是最好的。
除了完全相同的，你还可以通过编程让系统标记与已知的垃圾邮件非常相似的邮件。这里需要两封邮件之间的相似度度量。一种（基本的）相似度度量方式是计算它们之间相同的单词数目。如果一封新邮件与一封已知的垃圾邮件有许多单词相同，系统就可以将其标记为垃圾邮件。
这被称为基于实例的学习：系统用心学习这些示例，然后通过使用相似度度量来比较新实例和已经学习的实例（或它们的子集），从而泛化新实例。例如，图1-15中的新实例会归为三角形，因为大多数最相似的实例属于那一类。

本文插图

▲图1-15：基于实例的学习
02 基于模型的学习
从一组示例集中实现泛化的另一种方法是构建这些示例的模型，然后使用该模型进行预测。这称为基于模型的学习（见图1-16）。
【|金钱能让人更快乐吗？手把手教你用机器学习找到答案】

本文插图

▲图1-16：基于模型的学习
举例来说，假设你想知道金钱是否让人感到快乐，你可以从经合组织（OECD）的网站上下载“幸福指数”的数据，再从国际货币基金组织（IMF）的网站上找到人均GDP的统计数据，将数据并入表格，按照人均GDP排序，你会得到如表1-1所示的摘要。

本文插图

表1-1：金钱能让人更快乐吗？
让我们绘制这些国家的数据（见图1-17）。

本文插图

▲图1-17：趋势图
这里似乎有一个趋势！虽然数据包含噪声（即部分随机），但是仍然可以看出随着该国人均GDP的增加，生活满意度或多或少呈线性上升的趋势。所以你可以把生活满意度建模成一个关于人均GDP的线性函数。这个过程叫作模型选择。你为生活满意度选择了一个线性模型，该模型只有一个属性，就是人均GDP（见公式1-1）。
公式1-1：一个简单的线性模型
生活满意度= θ0 + θ1×人均GDP
这个模型有两个模型参数：θ0和θ1 。通过调整这两个参数，可以用这个模型来代表任意线性函数，如图1-18所示。

本文插图

▲图1-18：一些可能的线性模型
在使用模型之前，需要先定义参数θ0和θ1的值。怎么才能知道什么值可以使模型表现最佳呢？要回答这个问题，需要先确定怎么衡量模型的性能表现。要么定义一个效用函数（或适应度函数）来衡量模型有多好，要么定义一个成本函数来衡量模型有多差。

|金钱能让人更快乐吗？手把手教你用机器学习找到答案

推荐阅读

冬天火锅这样做，炖肉涮菜两不误，60元钱成本，两口子直呼过瘾

女人梦见狗是什么预兆，小狗下崽子是什么意？

盈利|恒大中期业绩预告出炉核心净利约193亿

直播吧|有望加盟北控，国内媒体人：刘志轩即将离开辽篮

天天科技范|有电源，还有外设，酷冷至尊618优惠精选：有机箱

特朗普指责民主党人为苏莱曼尼之死辩护：精神错乱

朱棣迁都北京的原因明朝朱棣为什么迁都北京

梦见缺水挑水寓意是什么意思梦见缺水挑水寓意是什么

小车模大成绩，CTE中国玩具展展商多美一年卖出1500万辆

在草原生活是怎么样的一种体验\n

女性腰间盘突出的原因

农村拆迁，家门口种植的树木也能得到赔偿？青苗补偿费了解一下！

熬中药水放多了怎么办

潜规则@拍一部戏要傍一位导演，有了“潜规则”女王之称，如今这个地步

健康零距离|失眠吃什么药立马见效

青海电视台经视法案TB|跑到派出所求助，却没想到被警方控制拘留，男子银行卡被冻结

过年有车厘子卖吗,春节车厘子是哪里来的

历史|高达70多公分！三星堆最大青铜尊露真容

物流管理|高考成绩将出炉，这4大专业不能错过，含金量高，就业面广

青年|网友调侃RNG和EDG“猪狗大战”：我已经开始研究今晚的外卖了