终于有人把数据科学、机器学习和人工智能讲明白了( 三 )


无监督学习最常见的应用是聚类和异常检测 , 一般来说 , 无监督学习主要聚焦在模式识别 。 其他应用包括主成份分析(PCA)和奇异值分解(SVD)的降维(减少数据变量的数量 , 简化模型的复杂性) 。
尽管基础数据无标签 , 但是当标签、特征或配置通过无监督学习过程本身以外的过程应用于集群(分组)发现时 , 无监督学习技术就可以应用到有用的预测中 。
无监督学习的挑战之一是没有特别好的方法来确定无监督学习生成模型的性能 。 输出全凭您对它的理解 , 没有正确或错误 。 这是因为数据中没有标签或目标变量 , 因此没有可用于比较模型结果的数据 。 尽管存在这种局限性 , 无监督学习仍然非常强大 , 并且有许多实际应用 。
当无标签数据很丰富 , 而有标签数据不多时 , 半监督学习可以是一种非常有用的方法 。
在涉及有标签和无标签数据的机器学习任务中 , 该过程接受数据输入并将其映射到某种类型的输出 。 大多数机器学习模型的输出非常简单 , 要么是一个数字(连续的或离散的 , 例如3.1415) , 要么是一个或多个类别(即类;例如“垃圾邮件” , “热狗”) , 要么是概率(例如35%的可能性) 。
在更高级的人工智能案例中 , 输出可能是结构化的预测(即一组预测值而非单个值) , 预测的一系列字符和单词(例如短语、句子) , 或最近芝加哥小熊队比赛的人工生成简要报道(加油小熊!)
终于有人把数据科学、机器学习和人工智能讲明白了
本文插图

04 人工智能的定义和概念
前面给出了人工智能的简单定义 , 即机器展示的智能 , 其中包括机器学习和诸如深度学习之类的特定技术子集 。 在进一步明确人工智能的定义之前 , 我们先定义普通智能的概念 。 智能的定义是:
学习、理解和应用所学的知识来实现一个或多个目标 。
因此 , 智能基本上是利用所学知识实现目标和执行任务的过程(对人类来说 , 例子包括决策、交谈和做事) 。 现在已经定义了普通智能 , 很容易看出人工智能只是机器展示的智能 。
更具体地说 , 人工智能描述的是:当一台机器能够从信息(数据)中学习 , 产生某种程度的理解 , 然后利用所学知识去做一些事情 。
人工智能领域涉及并从一些科学中吸取经验 , 包括神经科学、心理学、哲学、数学、统计学、计算机科学、计算机程序设计等 。 因为人工智能的基础及其与认知关系 , 它有时也被称为机器智能或认知计算;也就是说与形成知识和理解有关的心理过程 。
更具体地说 , 认知和更广泛的认知科学领域是用来描述大脑的过程、功能和其他机制的术语 , 这些机制使收集、处理、存储和使用信息生成智能和驱动行为成为可能 。 认知过程包括注意力、知觉、记忆、推理、理解、思考、语言、记忆等等 。 其他相关的、更深层次的哲学概念包括思想、感觉、感受和意识 。
那么是什么力量推动智能呢?对于人工智能应用 , 答案是以数据形式提供的信息 。 对于人类和动物来说 , 通过五官从经验和周围环境中不断收集新信息 。 然后把这些信息传递给大脑的认知过程和功能 。
令人惊讶的是 , 人类还可以通过运用已有的信息和知识来理解和形成有关其他事物的知识 , 以及形成人们对新话题的想法和看法 , 例如 , 从大脑中学习已有的信息和知识 。 有多少次思考过一些已经理解了的信息 , 然后一个“啊哈!”导致对其他事物有了全新理解的时刻?
经验因素也严重影响人工智能 。 人工智能是通过利用给定任务的相关数据进行训练和优化过程实现的 。 随着新数据的出现 , 人工智能应用可以不断地更新和改进 , 这是人工智能从经验中学习的一面 。
能够不断地从新数据中学习很重要 , 其原因很多 。 首先 , 世界及人类在不断地变化 。 新技术潮来潮往 , 创新不断出现 , 旧产业被颠覆 。


推荐阅读