苹果|人类已经阻止不了苹果翻译了？( 二 ) 阻止不了|Seq|模

Google 翻译用到的是 Seq2Seq (Sequence to Sequence) 模型， Seq2Seq 由两个循环神经网络模型协力组成，一个用于对输入序列进行编码，一个用于对输出序列进行解码。
当输入中文“知识就是力量”时，编码模型把每个字都标上一个矢量，其中每个矢量代表到目前为止已读取的所有字的含义。在整个句子编码结束后，解码器即会开始生成对应的英语句子。

文章图片

通过分析大量的语料数据，模型能自动从中学习出相应的语法规则，也就是说，工程师教给模型什么，模型就学会什么。因此，苹果的工程师可能为苹果翻译 feed 了太多网络平行语料，导致苹果翻译被网络用语“污染” ，而识别不出文本原来的含义。
苹果翻译出现失误的另一个可能性是，苹果翻译引入了知识图谱。
知识图谱是 Google 于 2012 年提出的概念，本质上是一种基于图的数据结构。在知识图谱中，每个名词（又叫实体）都是一个节点，每个节点间又有逻辑关系线相连。通过这种知识图谱，神经网络能更好地理解上下文之间的关联。

文章图片

▲ 一种知识图谱示意图
也许在苹果翻译构建的知识图谱中， “五五开”被链接到“卢本伟”这个实体，而这个实体又可以被翻译为“Lu Benwei” ，同理， “滚筒洗衣机”也可能被链接到了“工藤新一”这个实体。
因为网络平行语料和知识图谱的存在，翻译模型在面对独立的名词时很容易翻车。比如说“瓜皮” ，苹果直接按方言理解，翻译成“笨蛋” 。

文章图片

▲ "方言本当上手"
不过，根据我们对它原理的判断，想要更准确的翻译，解决方法之一就是在苹果翻译出现错误时，我们可以尝试为文本添加上下文，来帮助模型更好地理解。
比如把“瓜皮”改成“我不吃瓜皮” ，把“滚筒洗衣机”改成“滚筒洗衣机多少钱” 。

文章图片

苹果的这些翻译确实带来了很多乐趣，但当人们真的需要用它来完成跨语言沟通时，又不由得捏一把汗。
现在问题来了，这样的苹果翻译你喜欢吗？
_原题为 《人类已经阻止不了苹果翻译了》
阅读原文

苹果|人类已经阻止不了苹果翻译了？( 二 )

推荐阅读

孔蒂|迪马济奥：若孔蒂今夏离开国米阿莱格里将成新帅

#笑笑君#你好淡定啊，为啥你就与众不同呢！，搞笑GIF趣图:大妈

任嘉伦|请君22集封神！任嘉伦为一场哭戏酝酿整整三个月，不惧怕古偶标签

崂山贡红茶,崂山红茶怎么冲泡方法

晓萌美食|巧克力饼干、蔓越莓奶酥、黄瓜凉糕、黑米糕、南瓜糕的美味做法

思丝如针|但给我生了一儿一女，还照顾我妈，我很感恩，老婆虽然脾气差

#成都商报红星新闻#54岁妇科女专家转型科普：“守护她们，就是守护千万个家庭”

微信|微信这波更新！终于可以屏蔽群聊了

暴龙眼镜真假辨别

植物|好养的垂吊花，挂着养长得更好，开花多成了绿窗帘

吱呀|阴阳师笼目鸟皮肤获取及上线时间介绍面灵气笼目鸟皮肤怎么样

在XX大学读法律硕士是种啥体验

博弈论|斯蒂芬·金的“戒烟公司”

怀孕初期可以抱小孩吗

漂亮的女人和会持家的女人，男人会选择哪种？

江西进贤发生一起持刀伤害致死命案，警方：五名嫌疑人已被控制

「包献华」科技部：目前尚未发现复阳患者导致疾病传播案例

网络用语kp是什么意思？

电子税务局电子税务局登录时密码错误无法登录，如何处理？你知道吗？

【】欧盟以网络攻击为由制裁中方有关个人和实体驻欧盟使团回应