海外发行本地化,该怎么避免“翻译不像人话”?

怎么让老外理解我说他“凡尔赛”不是法国的那个凡尔赛?
怎么让队友理解机器翻译过去的“不讲武德”?
近几年出海已经不再是需要讨论的话题,国内厂商早已纷纷开始尝试拓展更多市场。
而游戏出海发行过程中,本地化环节里一个棘手的问题也随之而来:在全球各地区的市场,使用人口超过4500万人的语言有34种,实时在线的多语言翻译需求也应运而生。
01 让译文“说人话”的重要性
那么翻译不精准这件事的影响有多大呢?
典型的常规机器翻译,和学习到大量训练数据、翻译模型经过优化之后的翻译有哪些区别?像这些针对非标准口语化内容的翻译,就很能说明问题:
例句1:今天就聊到这吧
常规机器翻译:Let’s talk about it today
深度训练、优化后的机器翻译:That’s all for today
例句2:爷青回
常规机器翻译:Ye Qing Hui
深度训练、优化后的机器翻译:My youth is making a comeback
例句3:小心眼
常规机器翻译:be careful
深度训练、优化后的机器翻译:narrow-minded
例句4:扯犊子
常规机器翻译:Pull the calf
深度训练、优化后的机器翻译:Bullshit
例句5:这就有点凡尔赛了
常规机器翻译:It’s kind of Versailles.
深度训练、优化后的机器翻译:This is a bit humblebragging
例句6:年轻人不讲武德,我劝你耗子尾汁
常规机器翻译:Young people don’t talk about martial arts, I advise you to use mouse tail juice
深度训练、优化后的机器翻译:Young people don’t play by the rules, I advise you to behave yourself
例句7:any r4? kickout inactives plzzzz
常规机器翻译:有r4吗?踢出无效plzzzz
深度训练、优化后的机器翻译:有r4吗?请踢出不活跃的玩家
例句8:Pass me a ball, like alley-oop in basketball
常规机器翻译:传给我一个球,就像篮球比赛中的小巷
深度训练、优化后的机器翻译:递给我一个球,就像篮球中的空中接力
例句9:;p thanks bro ima send the mail soon, lmk if it needs anything please
常规机器翻译:; p谢谢bro ima尽快发送邮件,如果需要,请发送lmk
深度训练、优化后的机器翻译:;p 谢谢兄弟,我很快就会发邮件的,如果需要什么请告诉我
例句10:And u gimme urs
常规机器翻译:你给我你
深度训练、优化后的机器翻译:你把你的给我
可以看出,这些常见口语例句,深度训练、优化后的机器翻译,综合表现优于同类产品。而这些口语,正是在游戏内、直播互动等场景频繁出现的,译文的优劣对于用户的产品体验直观而鲜明。
02 202X年代,出海业务互动翻译需求陡升
在不少地区,受疫情等因素的影响,线下活动受到抑制,世界各个角落的人们在游戏、短视频以及线上聊天等多个场景中交流、分享、合作、竞技。
data.ai最新发布的《泛娱乐应用现状报告》指出,泛娱乐是一个快速发展的赛道,而泛娱乐应用将持续成为消费者关注的主要战场。《报告》数据显示,2021年全球OTT(娱乐)应用下载量超过22亿次,用户支出突破63亿美元,且泛娱乐应用各个子类别的收入和用户支出都实现两位数的增长。
全球庞大的用户群体,带来一个最基础的问题,除了一些简单的通用语(英语、汉语等),如何让人们跨越语言壁垒,顺畅交流,甚至是实时语音互动(智能同声传译)。
权威语言服务行业研究机构CSA Research的2021年度行业报告显示:2021年语言服务行业市值在516至529亿美元之间,预计2022年将进一步增长。
翻译市场正在经历着重大变化。机器翻译正在扮演愈来愈重要的角色,让翻译不再只限于学术与研究,能够像水和电一样,成为交流的基础设施。
03 如何选对适合游戏行业的机器翻译?
随着计算机性能的提升、海量数据的积累,机器翻译的表现与日俱进,如今机器翻译已经能很好地解决书面用语的翻译问题。
然而,当我们把目光转向线上日常交流时,像是游戏竞技、直播互动、视频聊天等场景,非标准的口语化内容占据了相当大的比重。几家大厂在机器翻译技术上虽然建树颇多,但仍然很难满足出海企业对于这些场景的翻译需求。
显然,市场需要一家专注于这一领域的公司来提供机器翻译服务。与趣加、紫龙游戏、三七互娱、盖娅互娱、绿洲游戏等有密切合作的“云上曲率”就是这样一家多语言互动技术服务商。
据云上曲率介绍,他们的机器翻译模型结合业务实践积累了海量的语料,已经能支持30余种语言,覆盖欧洲、日韩、东南亚、中东地区等主要出海市场。基于深度学习,以最新的NMT-神经网络机器翻译技术为基础架构。专业的语言工程师团队,能保证机器翻译模型学习到优质的训练数据,让机器翻译模型与时俱进。
而针对出海厂商头痛的——同时也是游戏当中并不少见的非标准口语化场景,云上曲率也凭借口语化等语言内容的能力经验,针对网络用户以及不规范文本(例如缩略语、重叠词或字母重复、断句不清晰、表情符号等)积累了完整的纠错模型与出色的处理能力。
常见于游戏场景的陌生术语,比如“Blizzard Cannon”被DOTA汉化组翻译为“暴雪弩炮”,中国玩家通俗地将其称为“大炮”。对于这类数据,几乎所有机器翻译模型都难以获得优质训练数据,云上曲率通过定制翻译能力,则可以充分满足业务方的定制翻译需求。
2022年5月,云上曲率根据泛娱乐场景真实数据(全球同服游戏聊天、线上直播与社交App互动数据),随机抽选数千个例句,请多个职业译者对各家翻译服务给出的候选译文进行盲测评价,下图展示了各家翻译服务给出的候选译文获得最高评价的频率。
在语言种类上,除了最常见的中英互译,其他主流语言同样值得关注。以近年来移动互联网飞速发展的东南亚、中东地区为例,其中印尼语、越南语、泰语、阿拉伯语等语言总人口超过5亿,机器翻译在东南亚与中东地区主流语言的进步,影响这些地区互联网生态的繁荣程度。翻译服务的质量,将直接或间接影响出海游戏与社交产品的用户体验和品牌忠诚度。
在不远的将来,机器翻译从书面用语走向普通人的社交场景,以及机器翻译和语音识别、语音合成等人工智能技术的整合,会大大提高多语言实时互动效率,改善交流体验。
文中我们列举了一些典型的翻译实例对比,如果对怎样优化翻译内容感兴趣,也可以点击下方链接前往云上曲率官网实时翻译体验专区,实测翻译效果。