认知图谱——人工智能的下一个瑰宝 _人工智能

人工智能的发展经历了从表示、计算到感知的阶段，下一个阶段的核心是认知。如何将深度学习与大规模常识知识结合起来，实现认知推理与逻辑表达，还面临着很大挑战。本期专题介绍了一部分具有代表性的专家在认知图谱和知识图谱方面开展的工作。

文章插图

人工智能发展的阶段
大规模常识知识库与基于认知的逻辑推理是人工智能发展面临的瓶颈问题。1968年，ACM图灵奖获得者爱德华·费根鲍姆(Edward Feigenbaum)研发出世界首个专家系统DENDRAL，并随后在第五届国际人工智能会议上提出，将知识融入计算机系统才能解决只有特定领域专家才能完成的复杂问题；1999年，万维网之父、ACM图灵奖获得者蒂姆·伯纳斯-李(Tim Berners-Lee)爵士提出了语义网(Semantic Web)的概念，其核心理念是用知识表示互联网，建立常识知识库；2019年，ACM图灵奖获得者约书亚·本吉奥(Yoshua Bengio)在NeurIPS大会上的主题报告中指出，深度学习应该以感知为主向，向基于认知的逻辑推理和知识表达的方向发展，这个思想和清华大学张钹院士近期提出的第三代人工智能思路不谋而合。总的来说，人工智能的发展经历了从表示、计算到感知两个阶段，下一个阶段的核心是认知（见图1）。近期，另一位ACM图灵奖获得者曼纽尔·布卢姆(Manuel Blum)夫妇提出了意识AI（意识智能）的思想，这是一个既经典又全新的概念和思路，核心理念就是构造一个新型的可用数学建模、可计算的机器认知/意识模型。

文章插图

图1 人工智能发展的几个阶段
近年来，虽然人工智能已经取得了快速发展，但如何将深度学习与大规模常识知识结合起来，实现认知推理与逻辑表达，还面临着很大挑战。首先，大数据环境下数据的分布、异构、动态、碎片化和低质等特征给知识工程和知识服务提出了新挑战。既需要从感知角度学习数据的分布表示，又需要从认知角度解释数据的语义。因此，构建新一代开放常识知识图谱和研发以认知推理为核心的技术成为突破下一代人工智能技术的关键。其次，基于深度学习与逻辑推理相结合的大规模多粒度知识推理，基于本体、规则与深度学习相结合的大规模知识推理，以及实现亿级三元组和万级规则的快速推理是另一方面的挑战。最后，基于时空特性的知识演化模型和推理规则的自学习，研制知识、推理、逻辑的演化系统，能够根据外界反馈对知识进行实时更新，从而实现推理规则的自学习和逻辑表达的自学习，同样也是我们面临的挑战。
【认知图谱——人工智能的下一个瑰宝】认知图谱的诞生
我们将这个方向重定义为认知图谱，核心是以实现知识驱动和数据驱动相结合的知识表示和推理的认知引擎为目标，研究支持鲁棒可解释人工智能的大规模知识的表示、获取、推理与计算的基础理论和方法；建设包含语言知识、常识知识、世界知识、认知知识的大规模知识图谱以及典型行业的知识库，建成知识计算服务平台。
认知图谱的主要内容包括以下四个方面：
1. 融合表示学习与符号逻辑的知识表示。传统知识表示方案面临着数据复杂、结构隐含或语义难以解释的问题，需要研究融合表示学习与符号逻辑的知识表示理论。因其既具备显式的语义定义和时空特性，又支持大数据环境下高效的知识计算与推理，从而为实现从大数据向大知识的转化提供基础理论和计算框架。
2. 多源、动态、异质碎片化知识的在线获取和动态融合。传统的基于符号表示的知识表示方法适合在领域定义明确的环境中进行知识的获取与融合，而基于表示学习的数值化知识表示方法则更适合在数据源数量庞大、领域边界不明确、数据类型复杂的环境中工作。因此，将上述两种方法结合，研究多源、动态、异质、高噪声的数据处理方法，研究多源、动态、异构环境中的碎片化知识获取方法，以及研究碎片化知识的动态融合方法，是一种有效的知识获取和融合途径。
3. 基于时空特性的知识演化和多粒度知识推理。研究基于深度学习与逻辑推理相互约束的大规模多粒度知识推理模型与方法，研制基于本体、规则与深度学习相结合的大规模知识推理系统，使其能够对包含十亿级资源描述框架(Resource Description Framework，RDF)三元组的知识库和万级规则进行推理，平均响应时间在秒级，并具有良好的可伸缩性。在此基础上，研究基于时空特性的知识演化模型与预测方法，研制知识演化系统，使其能够实时对知识库进行更新，平均响应时间在秒级。