数据挖掘需要学什么(数据挖掘与应用学什么)( 二 )


预测是数据挖掘的一个非常强大的方面,也是分析的四个分支之一 。预测使用当前或历史数据中的模式将它们扩展到未来 。通过这种方式,它使组织能够洞察未来数据的发展趋势 。有几种不同的方法可以使用预测分析,其中一些方法更高级,涉及机器学习和人工智能 。
10.决策图表
决策树是一种特定类型的预测模型,它使组织能够有效地提取数据 。从技术上讲,决策树是机器学习的一部分,但由于其极其简单的性质,被称为“白盒”机器学习技术 。决策树允许用户清楚地了解数据输入如何影响结果 。当多个决策树模型组合在一起时,它们会创建一个称为随机森林的预测分析模型 。
1.神经网络
神经网络是一种特定类型的机器学习模型,通常用于人工智能和深度学习 。它们被称为神经网络是因为它们有不同的层,类似于人类大脑神经元的功能 。神经网络是当今使用的最准确的机器学习模型之一 。
12.形象化
数据可视化是数据挖掘的另一个重要部分 。它们为用户提供基于人们可以看到的感官感知的数据视图 。今天的数据可视化是动态的,对于实时数据流非常有用 。它的特点是用不同的颜色显示数据的不同趋势和模式 。
Dashboard是一种使用数据可视化来揭示数据操作信息的强大方法 。组织可以基于不同的指标构建仪表板,并使用可视化来突出数据中的模式,而不是简单地在统计模型中使用数字结果 。
13.统计技术
统计是数据挖掘中大多数分析的核心 。不同的分析模型是基于统计概念的,统计概念产生适合特定业务目标的数值 。例如,神经网络使用基于不同权重和度量的复杂统计数据来确定图像识别系统中的图像是狗还是猫 。
14.长期记忆加工
长期记忆处理指的是长时间分析数据的能力 。存储在数据仓库中的历史数据对此非常有用 。当一个组织可以长时间分析时,它可以识别出太细微而无法检测到的模式 。
15.数据库
数据仓库是数据挖掘的重要组成部分 。传统上,数据存储是将结构化数据存储在相关的数据库管理系统中,以便分析其商业智能、报表和基本仪表板 。今天,有基于云的数据仓库和半结构化和非结构化的数据仓库,如Hadoop 。
16.机器学习和人工智能
机器学习和人工智能代表了数据挖掘领域的一些最新发展 。深度学习等先进的机器学习可以在处理大规模数据时提供高度准确的预测 。因此,它们可以用于人工智能实现中的数据处理,例如计算机视觉、语音识别或使用自然语言处理的复杂文本分析 。这些数据挖掘技术有助于确定半结构化和非结构化数据的价值 。
【数据挖掘需要学什么(数据挖掘与应用学什么)】


推荐阅读