· 所需的计算能力更少
· 精度更高
· 降低噪音
一些著名的降维算法是:
· 主成分分析
· 线性判别分析
· 局部线性嵌入
· 多维缩放
1. 主成分分析
主成分分析是ML的无监督算法之一,主要用于通过使用特征消除或特征提取来缩小特征空间的维数 。
它也是探索性数据分析和建立预测模型的工具 。需要标准化的数据,PCA可以作为帮助:
· 图像处理
· 电影推荐系统
· 计算数据协方差矩阵
· 对协方差矩阵执行特征值分解
· 优化多个通信通道中的功率分配
文章插图
主成分分析法
PCA旨在减少数据集中的冗余,使其更简单而又不影响准确性 。它通常部署在图像处理和风险管理领域 。
1. 随机森林
随机森林通过实现决策树使用多种算法来解决分类,回归和其他类似问题 。
它的工作方式是,创建带有随机数据集的决策树堆,并在其上反复训练模型以获得接近准确的结果 。
最后,将来自这些决策树的所有结果组合在一起,以识别出最常出现在输出中的最合适的结果 。
文章插图
随机森林
可以在以下领域找到"随机森林"应用程序:
1. 银行账户,信用卡欺诈检测
1. 检测并预测药物的药物敏感性
1. 通过分析患者的病历来识别患者的疾病
1. 预测购买特定股票时的估计损失或利润
1. 梯度增强和Ada增强
增强是一种用于集成ML算法的技术,可将弱学习者转换为强学习者 。当数据丰富时,需要使用增强算法,并且我们试图减少监督学习中的偏差和方差 。以下是两种流行的增强算法 。
· 梯度增强
通常以迭代方式(例如决策树)构建预测模型,将梯度增强算法用于分类和回归问题 。通过对强者的错误进行培训,从而提高了弱者的学习能力,从而获得了一个比较准确的学习者 。
· Ada增强
AdaBoost是Adaptive Boosting的缩写,当弱学习者失败时,它会改进模型 。它通过修改附加到样本中实例的权重以将精力更多地集中在困难实例上来实现,然后,弱学习者的输出将被合并以形成加权总和,并被视为最终的提升后的输出 。
结论:机器学习算法对于数据科学家来说至关重要,因为它们在现实世界中的应用日益广泛 。使用上述各种算法,您可以找到最适合解决问题的算法 。尽管这些算法有有监督也有无监督,但它们可以处理各种任务,并且能够与其他算法同步工作 。
作者:Claire D.
deephub翻译组:孟翔杰
【流行的机器学习算法总结,帮助你开启机器学习算法学习之旅】
推荐阅读
- 2020必读的12本机器学习书籍
- 机器学习模型的黑盒公平性测试
- 淘宝店如何获得流量 淘宝店铺老店新开怎么获取流量
- 淘宝获取流量的方法有哪些 淘宝如何获取流量
- 黑洞内部有什么?物理学家使用量子计算、机器学习来找出答案
- 手把手教你乘坐国内航班流程,乘坐飞机不迷路
- 网上代销怎么做流程 网上开店代理怎么做
- 淘宝新店没有流量没有访客怎么办 为什么淘宝新店一点流量没有
- 都匀毛尖制作工序流程,都匀毛尖简介
- 手淘消息中心是什么流量 手淘推荐的流量是哪里来的