机器翻译@钢铁侠的AI助理贾维斯,我们还要多久才能拥有?( 二 )


2001年 , 研究人员开始提倡基于语法的机器翻译(翻译语法单位而非单词) 。2003年至2005年 , 研究建立了基于短语的机器翻译 , 这也在2006年推动了Google翻译 。Bing和Yandex于2009年和2011年推出了自己的翻译器 。
Google为机器翻译悄悄研究了十年循环神经网络 , 之后Google翻译运用了经庞大的数据集训练的神经网络 , 迎来了商业规模翻译领域的质变飞跃 。
Google翻译的引擎 , 被称为Google神经机器翻译系统(GNMT) , 在2016年就可以轻松翻译10,000组语言 。
自NMT出现以来 , 人们一直在尝试混合翻译方法 , 利用短语或基于规则的机器翻译来弥补NMT的不足 。
机器翻译@钢铁侠的AI助理贾维斯,我们还要多久才能拥有?
文章图片

文章图片

这是垃圾邮件吗?
被广泛使用的电子邮件作为当前一种数字通信形式 , 常伴随着垃圾邮件的问题 。最初 , 人们使用IP黑名单和邮件标题检查来识别垃圾邮件 , 但是这些方法在单独部署时很容易被绕开 。
因此 , 对电子邮件内容以及非文本元素进行分析的需求随之提高 , 这意味着NLP进入了垃圾邮件领域 。1998年 , 有人提出使用Bayesian方法来过滤垃圾邮件 。2002年 , 同一战线的保罗·格雷厄姆提出了一项商业上可行的垃圾邮件处理计划 。
Bayesian方法是统计NLP的最早方法之一 , 与通常的基于文本的过滤器不同 , 它可以自动从可能为垃圾邮件的内容中学习新词 , 并使用其不断扩大的词汇量更好地对邮件进行分类 。
Bayesian过滤器通过仔细检查邮件标题内容、词组和短语 , 降低了误报率 , 并提高了识别垃圾邮件的准确性 , 运用于许多现代电子邮件客户端 。
为了进一步减少垃圾邮件的数量 , Google在2015年宣布要在垃圾邮件过滤器中运用神经网络 , 使垃圾邮件率降到0.1% 。
机器翻译@钢铁侠的AI助理贾维斯,我们还要多久才能拥有?
文章图片

文章图片

嗨 , Siri , 今天天气怎么样?
NLP领域的重要运动有1962年IBM的Shoebox以及20世纪70年代的Harpy , 它们代表数字语音识别的前身 。直到20世纪80年代中期 , HiddenMarkov被认为是语音建模中的高效方法 。
IBM开发的Watson在问答节目Jeopardy!中取得了胜利 。2011年 , 智能虚拟助手势头强劲 , 苹果在同年的iPhone4S上推出Siri 。
2014年 , Amazon在智能扬声器Echo中引入了Alexa 。GoogleAssistant(最初称为GoogleNow)和Microsoft的Cortana也紧随其后 。
AI语音助手迅速入驻应用程序和设备(例如GoogleHome) 。截止2019年1月 , Amazon销售了超过1亿台配备Alexa的设备 。
机器翻译@钢铁侠的AI助理贾维斯,我们还要多久才能拥有?
文章图片

文章图片

聊天机器人的降临
虚拟助手有了一个近亲——聊天机器人 , 由AI驱动 , 可以通过通讯App和在线聊天来进行近似人类的对话 。
ELIZA(1966)、PARRY(1972)和试图讲笑话的Jabberwacky(1988)之类的聊天机器人 , 提出了人机对话的概念 。随着计算机语言和自然语言处理技术的进步 , AI聊天机器人现在可以通过了解用户意图、提供相关输入来与用户进行顺畅的对话 。
因AI聊天机器人能够提供全天候服务 , 解决客户投诉等简单问题 , 客户服务得到了极大的提高 。到2021年 , 由NLP支持的AI聊天机器人可以完成全球15%的客户交互服务 。
机器翻译@钢铁侠的AI助理贾维斯,我们还要多久才能拥有?


推荐阅读