随着数据中功能数量的增加,您还将需要更大的样本集来训练准确的机器学习模型 。您可能没有足够的样本来训练 100 列模型 。太多的功能也增加了过度拟合的机会,这实际上意味着您的AI模型在训练数据上表现良好,而在其他数据上表现不佳 。
无监督的机器学习算法可以分析数据并找到不相关的特征,可以将其删除以简化模型而不会失去宝贵的见解 。例如,对于我们的客户表,通过降维算法运行它之后,我们可能会发现与客户的年龄和家庭住址相关的功能几乎没有关联,因此可以将其删除 。
主成分分析(PCA)是一种流行的降维机器学习算法 。一些安全分析师还使用无监督的机器学习进行异常检测,以识别组织网络中的恶意活动 。
无监督学习的好处之一是,它不需要监督学习必须经历的费力的数据标记过程 。但是,要权衡的是,评估其性能的有效性也非常困难 。相反,通过将监督学习算法的输出与测试数据的实际标签进行比较,可以很容易地衡量监督学习算法的准确性 。
原文链接:
https://ai.51cto.com/art/202006/617921.htm
来源:51cto
【机器学习:有监督和无监督之间有什么区别】
推荐阅读
- 孩子三个月没有胎心
- 胎儿两个月没有胎心
- 隐性流产会有什么感觉呢
- 网店有订单怎么处理 淘宝店铺有流量没有成交怎么办
- 面试淘宝模特要交钱拍照法律 做网店模特有什么要求
- 茶宠的不同寓意,养茶宠也大有讲究
- 代代花的有什么好处,喝玫瑰花有什么好处
- 淘宝开店不经营会有什么后果 开了淘宝店怎么运营起来
- 淘宝直通车怎么开才有效果 淘宝开直通车技巧集锦
- 神舟|有爱一幕:王亚平第一时间给女儿“星星” 翟志刚接受献花与儿子拥抱