AI人工智能认知智能,AI 的下一个十年 | AI Procon 2020( 二 )


另外 , 从去年年底到今年初 , 自监督学习技术也有了最新的进展 。 即无需标记样本 , 即可学习图形表示 。 事实上 , 这一研究在几年前就已展开 , 譬如 , 让计算机通过大量的数据 , 就可以自动识别出猫 。 彼时环境下 , 很多人并不理解这件事的具体含义与技术 , 或许更多人认为这是一个很简单的问题 , 从机器学习角度来看 , 如果有一点点的标记样本 , 计算机就能识别这是一只猫 。
AI人工智能认知智能,AI 的下一个十年 | AI Procon 2020
本文插图
那么 , 如果没有标记样本 , 计算机该如何识别出猫?
这就是自监督学习的魅力所在 。 它会通过数据本身的分析 , 比如给定一个图片 XQ , 在大量的数据中自动找到 XQ 相关的图片 , 可以将这些图片作为正例 , 把其他随机找到另外一些图片作为负例 , 基于此 , 我们可以自动学习出哪些是一个正例 , 哪些是一个负例 。 在此过程中 , 或许有人提问 , 如果这里图片标注错误会怎么办?
事实上 , 在机器学习与人工智能的时代 , 大数据是基础 , 这就需要大量的数据为支撑 。 回归现下的自监督学习 , 在很多效果上 , 其甚至超过了有监督学习 。
举例说明 , 我们研发了一个面向图数据的自监督学习 。 从下图中 , 如何让图数据划分正例和负例 。 首先 , 可以将蓝色的点视为正例 。 在图数据中 , 正例除了与自身属性有关 , 也与周围邻居节点相关 。 因此在海量数据中 , 任选一节点 , 随机生成一张子图 XQ , 对于随机的子图 , 可能没有正例 。
这可以再基于蓝色的点 , 随机生成另外的子图XK0 , 然后当做 XQ 的正例 。 同时从另外大量海量的图中 , 随机找一个点 , 如下图 , 再随机生成子图 , 即XK1 , XK2 , 其中将 XK1 和 XK2 看做 XQ 的副例 , 把XK0看作 XQ 的正例 , 于是通过这样的方法 , 就能够自动构建了一个正例数据集和一个负例数据集 , 由此在超大规模的图数据上进行训练 , 最终发现效果可以超过有监督学习 , 因此 , 无监督学习也将必然是机器学习下一个重要的方向
基于此 , 我们研发了一个面向图数据的自监督学习 。 从下图中 , 如何让图数据划分正例与负例 。 举例说明 , 首先 , 将蓝色的点视为正例 。 在图数据中 , 正例除了与自身属性有关 , 也与周围邻居节点相关 。 因此从任一节点 , 随机生成一张子图 。
AI人工智能认知智能,AI 的下一个十年 | AI Procon 2020
本文插图
那当然了 , 我今天要探讨的不是机器学习的一个无监督 , 而更加要探讨的是人工智能的下一代 , 人工智能今天这个符号AI , 也经历了感知AI , 那下一个AI是什么呢?
人工智能的未来
2016 年 , 张钹院士提出第三代人工智能雏形 。 DARPA 在 2018 年也发布了AI Next的一个计划 , 核心的思路是推进统计与知识推理融合 , 包括机器学习和脑认知的融合 。
其实 , 想要实现认知智能 , 目前最缺乏两个方面:
高质量超大规模知识图谱 , 这是AI的基础设施 。
对知识的理解能力 , 即面向认知的深度学习算法 。 相较于当下更像黑盒子的深度学习算法 , 我们更需要可解释、鲁棒、具有理解能力的机器学习方法 , 亦或者叫做推理算法 。
AI人工智能认知智能,AI 的下一个十年 | AI Procon 2020
本文插图
未来 , 人工智能必是超越深度学习的存在 。 如图所示 , 左边的 Symbolic 即符号 AI 。 右边为深度学习 , 时下深度学习和机器学习处于交融的状态 , 业界很多人评价道 , 深度学习是机器学习的一小块 , 很多人有认为它超越了机器学习 。 事实上 , 想要超越深度学习 , 我们需要结合符号 AI , 也就是最终的 Symbolic Neural Net 。


推荐阅读