IOS系统|人类已经阻止不了苹果翻译了( 二 )


IOS系统|人类已经阻止不了苹果翻译了
文章图片

文章图片

▲虽然从某种程度来讲并没有翻译错
至此 , 苹果翻译给人的感觉已经从“能精准翻译出晦涩中文梗的精髓”变成了“这是不是有点太随意 , 要耽误真正想要翻译的人的正事?”的疑惑了 。
而且 , 在另一些时候 , 苹果翻译表现得更是好像沉迷于玩烂梗的小鬼 。
明明只是普通的一句“一袋米要扛几楼” , 都硬要翻译成“感受痛苦吧” 。(因为后者的日文读音 , 听起来就像是中文的一袋米要扛几楼 , 诸君可以打开苹果翻译一试......)
IOS系统|人类已经阻止不了苹果翻译了
文章图片

文章图片

▲也可以输入“辛辣天塞”试试
类似的翻车时刻越来越多 , 大家就开始觉得苹果的“随心所欲二次元”浓度也未免太高了 。
被“污染”的语料
“把玩”至此 , 我们实在是好奇 , 是谁“教坏了”苹果呢?
虽然苹果一向对自家的技术三缄其口 , 这次也一样没有说明 iOS14 到底用到了什么模型 , 但我们可以参考苹果翻译的老前辈 Google 翻译 。
Google 翻译用到的是 Seq2Seq (Sequence to Sequence) 模型 , Seq2Seq 由两个循环神经网络模型协力组成 , 一个用于对输入序列进行编码 , 一个用于对输出序列进行解码 。
当输入中文“知识就是力量”时 , 编码模型把每个字都标上一个矢量 , 其中每个矢量代表到目前为止已读取的所有字的含义 。在整个句子编码结束后 , 解码器即会开始生成对应的英语句子 。
IOS系统|人类已经阻止不了苹果翻译了
文章图片

文章图片

通过分析大量的语料数据 , 模型能自动从中学习出相应的语法规则 , 也就是说 , 工程师教给模型什么 , 模型就学会什么 。因此 , 苹果的工程师可能为苹果翻译 feed 了太多网络平行语料 , 导致苹果翻译被网络用语“污染” , 而识别不出文本原来的含义 。
苹果翻译出现失误的另一个可能性是 , 苹果翻译引入了知识图谱 。
知识图谱是 Google 于 2012 年提出的概念 , 本质上是一种基于图的数据结构 。在知识图谱中 , 每个名词(又叫实体)都是一个节点 , 每个节点间又有逻辑关系线相连 。通过这种知识图谱 , 神经网络能更好地理解上下文之间的关联 。
IOS系统|人类已经阻止不了苹果翻译了
文章图片

文章图片

▲一种知识图谱示意图
也许在苹果翻译构建的知识图谱中 , “五五开”被链接到“卢本伟”这个实体 , 而这个实体又可以被翻译为“Lu Benwei” , 同理 , “滚筒洗衣机”也可能被链接到了“工藤新一”这个实体 。
因为网络平行语料和知识图谱的存在 , 翻译模型在面对独立的名词时很容易翻车 。比如说“瓜皮” , 苹果直接按方言理解 , 翻译成“笨蛋” 。
IOS系统|人类已经阻止不了苹果翻译了
文章图片

文章图片

▲ "方言本当上手"
不过 , 根据我们对它原理的判断 , 想要更准确的翻译 , 解决方法之一就是在苹果翻译出现错误时 , 我们可以尝试为文本添加上下文 , 来帮助模型更好地理解 。
比如把“瓜皮”改成“我不吃瓜皮” , 把“滚筒洗衣机”改成“滚筒洗衣机多少钱” 。
IOS系统|人类已经阻止不了苹果翻译了


推荐阅读