图谱|明略科技HAO图谱Open API:开放企业级知识图谱构建能力
_原题为 明略科技HAO图谱Open API:开放企业级知识图谱构建能力
机器之心报道
机器之心编辑部
首个语音实时生成图谱的企业级知识图谱开发工具包 。由深度学习掀起的这波 AI 浪潮极度依赖数据 , 经过 10 年的发展 , 深度学习在一些场景应用上已经面临瓶颈 。 业内有一种声音得到了大量认同:人工智能的进一步发展与突破 , 需要从感知智能向认知智能的突破 , 知识图谱能有效从数据中挖掘出知识 , 以更具可解释性的 AI 指导人类在更多复杂场景中的智能决策和行动 。
7 月 11 日 , 在 2020 WAIC 世界人工智能大会上 , 明略科技 HAO 图谱 , 作为目前世界上第一个语音实时生成图谱的企业级知识图谱开发工具包 , 首次公开亮相 , 成功入围了大会最高奖项 SAIL 奖(Super AI Leader)TOP30 的项目及 2020 年度 SAIL 榜单 。
明略科技首席科学家、明略科学院院长吴信东在开发者日:开发 · 开源 · 社区主题论坛上正式宣布 HAO 图谱依托国家新一代人工智能开放创新平台开放 Text2KG API 接口 , 赋能开发者和企业级用户 。
负责 HAO 图谱具体研发工作的是明略科学院知识工程实验室 , 我们与实验室主任张杰博士进行了交流 , 他向我们介绍了明略科技的 HAO 图谱技术及应用落地 。
HAO 图谱 , 源自于 2018 年明略科技提出的 HAO 智能理论框架 。 HAO 智能旨在集成人类智能(HI)、人工智能(AI)和组织智能(OI) , 打通感知、认知和行动系统 , 帮助企业和组织实现智能化发展 。 其中 , HAO 图谱属于认知系统的范畴 。
HAO 图谱 , 可以独立运行 , 也可交付给企业技术团队进行二次开发 , 核心模块包括语音流监听 , 语音转文本 , 标点预测 , 口语顺滑 , 文本补全 , 实体关系抽取 , 实体对齐 , 以及图谱话题切换 。
文章图片
具体来说 , HAO 图谱的输入为一维的文字序列或语音流 , 系统工作时分为如下几步:
逐句翻译 , 形成大图:首先将输入序列逐句的做实体识别和关系抽取 , 绘制成图结构 , 每新增一句 , 就在原有的图结构上增加新节点和新边;
篇章摘要 , 找到重点:当整段文本或语音输入结束后 , 再在篇章级大图谱上 , 根据节点的语义、图结构、位置等特征识别出重点节点和边;
关联背景知识:将重点节点和关系映射到后台的领域知识图谱上 , 利用领域知识图谱扩展其语义信息 。 领域图谱包括:由大量实例组成的数据图谱、由因果关系组成的因果图谱、由领域本体结构和领域词表组成的语义工具;
图谱增强的应用:针对领域内的特定场景需求 , 基于图谱做可视化交互、分类、检索、推荐、文本生成等特定任务 。
目前 HAO 图谱开放的 Text2KG API 接口 , 提供了文本转图谱的能力 , 但后台还做了一些面对 PDF、PPT、word 等半结构化文档的信息抽取接口 。
知识图谱技术在产业界正经历着应用的高速增长 , 学术领域前沿成果与实际落地应用场景间依然存在着巨大的鸿沟 , 设计、开发、部署一套知识图谱系统 , 会面临数据标注、模型训练调优、高并发高可用等一系列问题 。 「目前业内仍缺少一个工业级的稳定工具 , HAO 图谱是第一个语音实时生成图谱的企业级知识图谱开发工具包 。 」张杰表示 。
在实际的知识图谱构建流程中 , 标注数据、训练模型需要花费大量时间 。 而 HAO 图谱很大程度上解决了上述问题 , 让数据分析师或者是建模人员集中精力在业务层 , 而底层的收集数据、标注数据、训练模型、数据抽取以及与后台关联可以通过调用 HAO 图谱 Text2KG API 完成 , 避免了大量的重复工作 。 「根据实际的企业用户使用情况来看 , 可以帮助开发者节约 60% 左右的时间 。 」张杰介绍 。
HAO 图谱所提供的模型 , 既包含通用模型 , 也包含特定领域的模型 , 如汽车、奶粉、美妆等 。 通过 API 接口 , 使用已经训练好的开放域模型和特定领域模型 , 开发者可以集中精力在使用知识图谱解决实际的业务问题上 。
知识图谱的应用涉及可视化、分类、检索、推荐和生成 。 目前 , HAO 图谱已经被广泛应用在社交舆情分析、销售技能培训、金融交易反欺诈、案情研判、设备维护、城市及园区管理等不同场景 。
在推荐领域 , 将领域知识有效融入算法 , 提高推断准确率一直是研究的难点之一 。 知识图谱 , 可将人类专家经验和规则 , 以及大量来自互联网、各个产业生产中获得的数据 , 有机结合 , 通过对不同实体(节点)之间关系的进行分析 , 获得洞察 。 「知识图谱蕴含一定的可解释性 , 因果关系相对比较明确 , 这一特点让它在金融、轨交、电力、公共安全等行业中得以较快落地 。 」
在社交媒体舆情分析场景中 , 基于知识图谱 , 可以把用户产生的评论 , 与后台已有的品牌数据结合 , 对产品特性进行观察 , 分析特定维度的用户舆情走势 , 随后把这些结果整合到 BI 系统 , 为运营人员提供用户需求洞察 。 在此基础之上 , 实现千人千面的个性化广告 。
推荐阅读
- 【新浪科技综合】7月底挂牌上市 理想汽车:不予置评新浪科技综合2020-07-20 19:27:350阅
- 新浪科技■神州租车:已向港交所申请7月21日上午九时起复牌新浪科技2020-07-20 19:25:400阅
- #新浪科技#独家|井贤栋内部信:上市意味着更大的责任 对蚂蚁人提出三点要求新浪科技2020-07-20 19:25:330阅
- 新浪科技综合■10000亿大消息:支付宝母公司要上市了 两大交易所回应新浪科技综合2020-07-20 19:25:000阅
- #新浪科技#蚂蚁集团据悉选择多家银行安排规模100亿美元香港IPO事宜新浪科技2020-07-20 19:08:220阅
- #新浪科技综合#别了创业板“第一大忽悠” 乐视1600亿市值“灰飞烟灭”新浪科技综合2020-07-20 19:07:470阅
- 数据|金融科技时代:品高全栈云的国产化演进
- 「新浪科技综合」传滴滴出行启动IPO 目标估值800亿美元新浪科技综合2020-07-20 18:32:290阅
- 新浪科技综合■蚂蚁集团:IPO具体信息最终将取决于市场因素新浪科技综合2020-07-20 18:31:170阅
- [新浪科技综合]阿联酋首个火星探测任务分析新浪科技综合2020-07-20 18:13:200阅