IOS系统|人类已经阻止不了苹果翻译了( 二 ) IOS系统

文章图片

文章图片

▲虽然从某种程度来讲并没有翻译错
至此，苹果翻译给人的感觉已经从“能精准翻译出晦涩中文梗的精髓”变成了“这是不是有点太随意，要耽误真正想要翻译的人的正事？”的疑惑了。
而且，在另一些时候，苹果翻译表现得更是好像沉迷于玩烂梗的小鬼。
明明只是普通的一句“一袋米要扛几楼” ，都硬要翻译成“感受痛苦吧” 。（因为后者的日文读音，听起来就像是中文的一袋米要扛几楼，诸君可以打开苹果翻译一试......）

文章图片

文章图片

▲也可以输入“辛辣天塞”试试
类似的翻车时刻越来越多，大家就开始觉得苹果的“随心所欲二次元”浓度也未免太高了。
被“污染”的语料
“把玩”至此，我们实在是好奇，是谁“教坏了”苹果呢？
虽然苹果一向对自家的技术三缄其口，这次也一样没有说明 iOS14 到底用到了什么模型，但我们可以参考苹果翻译的老前辈 Google 翻译。
Google 翻译用到的是 Seq2Seq (Sequence to Sequence) 模型， Seq2Seq 由两个循环神经网络模型协力组成，一个用于对输入序列进行编码，一个用于对输出序列进行解码。
当输入中文“知识就是力量”时，编码模型把每个字都标上一个矢量，其中每个矢量代表到目前为止已读取的所有字的含义。在整个句子编码结束后，解码器即会开始生成对应的英语句子。

文章图片

文章图片

通过分析大量的语料数据，模型能自动从中学习出相应的语法规则，也就是说，工程师教给模型什么，模型就学会什么。因此，苹果的工程师可能为苹果翻译 feed 了太多网络平行语料，导致苹果翻译被网络用语“污染” ，而识别不出文本原来的含义。
苹果翻译出现失误的另一个可能性是，苹果翻译引入了知识图谱。
知识图谱是 Google 于 2012 年提出的概念，本质上是一种基于图的数据结构。在知识图谱中，每个名词（又叫实体）都是一个节点，每个节点间又有逻辑关系线相连。通过这种知识图谱，神经网络能更好地理解上下文之间的关联。

文章图片

文章图片

▲一种知识图谱示意图
也许在苹果翻译构建的知识图谱中， “五五开”被链接到“卢本伟”这个实体，而这个实体又可以被翻译为“Lu Benwei” ，同理， “滚筒洗衣机”也可能被链接到了“工藤新一”这个实体。
因为网络平行语料和知识图谱的存在，翻译模型在面对独立的名词时很容易翻车。比如说“瓜皮” ，苹果直接按方言理解，翻译成“笨蛋” 。

文章图片

文章图片

▲ "方言本当上手"
不过，根据我们对它原理的判断，想要更准确的翻译，解决方法之一就是在苹果翻译出现错误时，我们可以尝试为文本添加上下文，来帮助模型更好地理解。
比如把“瓜皮”改成“我不吃瓜皮” ，把“滚筒洗衣机”改成“滚筒洗衣机多少钱” 。

IOS系统|人类已经阻止不了苹果翻译了( 二 )

推荐阅读

『精灵故事』排毒养颜的——自制蜂蜜菠萝酵素汁

时间在撒谎|史上罕见，被传为佳话！，古代这位皇帝用一生专宠一个女子

北京昌平|日晕、七彩云罕见同框，速看！

【汽扯扒谈|巨型双肾隐约可见，6月正式发布，全新宝马4系官方预告流出】

诡异的血月传说血月可怕传说

为啥其他动物固定季节发情，人类随时都可以

冷冻毛豆怎么煮好吃

「全省工商界人士」携手治污攻坚共建美丽广东

广州番禺一民房起火消防员救出15名群众

茶籽渣可以做肥料吗茶籽渣怎么做肥料

四川一精神病人电梯内砍死8岁男童-遂宁8岁男童电梯内被砍死

黑枣和红枣的区别在哪里黑枣和红枣的区别在哪里中药

嗜酸性粒细胞比率高有哪些原因

|昆明电子竞技公开赛决出两“王者”

科学家在南极发现“外星”尘埃

黎彼得|黎彼得封笔23年重返词坛！期望与许冠杰再合作，曾创造多首经典

汽车|美股三大指数集体收跌小鹏汽车逆市大涨逾33%

「不占用村」继禁止私搭乱建后，墙外种菜或将被禁，农民不解，为啥不让种！

二等分打印纸尺寸设置送货单!电脑打印纸三种等分是什么尺寸?

青年|女网红的化妆台，薇娅周扬青挺好，看到程晓玥：这么不讲究？