对话式AI新方法:对话即数据流( 三 )
文章插图
在这里 , 第一次事件搜索的条件(包含Megan的名为coffee的事件)被替换为新的条件(指定名为company retreat的事件) 。
查看论文了解更多细节:。
4. 事情会出错在任何复杂的对话中 , 事情的发生都有许多意想不到的方式 。 与 Megan 预约会议的请求可能会失败 , 因为用户的联系人列表中没有叫 Megan 的人;因为有许多人都叫 Megan;因为没有空开会;甚或因为网络已断开 , 对话代理无法与服务器取得联系 。 每种情况都需要不同的响应 , 而现有的对话系统通常使用复杂的硬编码逻辑来从错误中恢复 。
我们通过从数据流图的某个节点抛出异常来处理所有这些故障 。 我们的对话代理会响应这个失败的“结果” , 为用户生成一个适当的警告或问题 。 用户可以随意响应 , 也许是通过纠正问题;例如 , 在这个上下文中 , “我指的是 Megan Bowen”将被解释为改进原始请求的修订 。 这种方法允许系统和用户在出现错误时根据上下文灵活地、模块化地、协作地处理错误 。
5. 语言生成依赖于对话语境要成为一名有用的团队合作伙伴 , 对话 AI 系统需要能够生成语言 , 而不仅仅是解释它 。 大多数现有的对话方法要么是硬编码生成规则(导致输出听起来像机器人 , 不会因上下文不同而改变) , 要么是非结构化的神经语言模型(有时不说实话!)在我们的方法中 , 语言生成被建模为一个神经引导的合成程序转换过程 , 在这个过程中 , 代理会轮流扩展数据流图 。 代理可以讨论图表中出现的任何内容 , 而不仅仅是它计算得出的最后结果 。 它甚至可以向图中添加新的计算和结果 , 用户可以在以后的对话中随意引用:
文章插图
代码、数据和新一轮竞争我们相信 , 这种方法是迈向新一代自动对话代理的第一步 , 它可以像人与人之间那样与人交互 。 然而 , 解决这个问题需要整个社会的共同努力 。 为了促进基于数据流的对话代理的开放研究 , 我们发布了迄今为止最大、最复杂的面向任务的对话数据集 SMCalFlow。 该数据集具有 41517 个标注了数据流程序的对话 。 这个数据集来自于人类之间探讨日历、天气、人和地点的开放式对话 。 与现有的对话数据集相比 , 我们收集对话不是基于预先指定的脚本 , 参与者不受限制 , 他们什么都可以问 , 他们可以按自己的方式完成他们的任务 。 因此 , SMCalFlow 与现有的对话数据集有本质上的不同 , 它有关于代理能力、多轮错误恢复和复杂目标的具体论述 。
数据集、代码和排行榜都可以在我们的 GitHub 页面上找到 。 我们期待看到自然语言处理社区如何使用这个新资源 。
英文原文:
关注我并转发此篇文章 , 私信我“领取资料” , 即可免费获得InfoQ价值4999元迷你书 , 点击文末「了解更多」 , 即可移步InfoQ官网 , 获取最新资讯~
推荐阅读
- 对话今年爆火的外骨骼机器人创始人,从民房起步连续创业的追梦者
- 挺进云端AI训练&推理双赛道!独家对话燧原科技COO张亚林:揭秘超高效率背后的“内功”
- 对话Graphcore中国高管:新IPU性能大幅超NV A100,中短期内冲市场第二
- 对话惠普范子军:立足用户需求 助力年轻人实现自我价值
- 中马青年以“数据新时代,携手创未来”为主题举行云端对话
- 对话五位英伟达技术专家:解析GTC China大会不容错过的技术干货
- 南财对话丨专访闵万里:人工智能,离无所不能还有多远?
- 罗振宇对话罗永浩:如果锤子倒闭了你会加入谁
- 对话|蜂巢能源即将量产无钴电池,杨红新:靠降维打击超越对手
- 对话戴尔科技集团刘志洪 聊一聊非结构化数据存储的那些事儿