机器学习:有监督和无监督之间有什么区别( 二 )


随着数据中功能数量的增加,您还将需要更大的样本集来训练准确的机器学习模型 。您可能没有足够的样本来训练 100 列模型 。太多的功能也增加了过度拟合的机会,这实际上意味着您的AI模型在训练数据上表现良好,而在其他数据上表现不佳 。
无监督的机器学习算法可以分析数据并找到不相关的特征,可以将其删除以简化模型而不会失去宝贵的见解 。例如,对于我们的客户表,通过降维算法运行它之后,我们可能会发现与客户的年龄和家庭住址相关的功能几乎没有关联,因此可以将其删除 。
主成分分析(PCA)是一种流行的降维机器学习算法 。一些安全分析师还使用无监督的机器学习进行异常检测,以识别组织网络中的恶意活动 。
无监督学习的好处之一是,它不需要监督学习必须经历的费力的数据标记过程 。但是,要权衡的是,评估其性能的有效性也非常困难 。相反,通过将监督学习算法的输出与测试数据的实际标签进行比较,可以很容易地衡量监督学习算法的准确性 。
原文链接:
https://ai.51cto.com/art/202006/617921.htm
来源:51cto

【机器学习:有监督和无监督之间有什么区别】


推荐阅读