Python迁移学习:机器学习算法( 二 )


除了类标签以外,每一层的其他属性都会用于表示每个数据点是否可接受 。图1.3所示描述了目前的二元分类问题 。分类算法以训练样本为输入来生成一个监督模型,然后利用该模型为一个新的数据点预测评估标签 。

Python迁移学习:机器学习算法

文章插图
 
图1.3
在分类问题中,由于输出标签是离散类,因此如果只有两个可能的输出类,任务则被称为二元分类问题,否则被称为多类分类问题 。例如预测明天是否下雨是一个二元分类问题(其输出为是或否);从扫描的手写图像中预测一个数字则是一个包含10个标签(可能的输出标签为0~9)的多类分类问题 。
2.回归模型这类监督学习算法能帮助我们回答“数量是多少”这样的量化问题 。从形式上来说,回归模型的关键目标是估值 。在这类问题中,输出标签本质上是连续值(而不是分类问题中的离散输出) 。
在回归问题中,输入数据点被称为自变量或解释变量,而输出被称为因变量 。回归模型还会使用由输入(或自变量)数据点和输出(或因变量)信号组成的训练数据样本进行训练 。线性回归、多元回归、回归树等算法都是监督回归算法 。
回归模型可以基于其对因变量和自变量之间关系的模型进一步分类 。
简单线性回归模型适用于包含单个自变量和单个因变量的问题 。普通最小二乘(Ordinary Least Square,OLS)回归是一种流行的线性回归模型 。多元回归或多变量回归是指只有一个因变量,而每个观测值是由多个解释变量组成的向量的问题 。
多项式回归模型是多元回归的一种特殊形式 。该模型使用自变量的


推荐阅读