AI 配音,一个对大多数人来说并不遥远的词汇。
从北上广深,到你的快乐老家,似乎每个地方都能听到一个熟悉的声音在你耳边嗡嗡作响:“注意看,这个男人叫小帅”。
现在,这个把无数网友折磨到 PTSD 的技术,已经杀进了游戏行业。
前几天,正在开发中的《The Finals》开始了公测,这是一款多人竞技射击游戏,由前战地团队亲手打造。
开发团队的老大 Patrick Söderlund ,前 EA 和 DICE 的高层,同时也是负责开发寒霜引擎的技术大佬。
2018 年的时候,不知道是不是察觉到战地 5 要翻车,所以在游戏推出前提桶跑路了。
后来他跑到了另一家工作室 Embark Studios ,鼓捣出了现在大家看到的《The Finals》。
游戏简单来说像是战地、APEX、TF2等游戏的缝合体,UI、玩法这些一眼看上去就很熟悉。
别的不说,游戏热度倒是挺高。根据 steamdb 数据显示, The Finals 最高同时在线人数超过了 26 万,在 steam 最热玩游戏榜上排第 6 ,仅次于 CS2、 dota2 那几个万年高人气怪物。
不过人红是非多,最近这游戏就捅出了一个大篓子——用 AI 配音被人发现了。
就在 10月 29 号,给暗邪西部、原神等游戏配音的配音演员 Gianni Matragrano 在 X 上表示,游戏里面人物说话, AI 味挠挠的。
对我这个非英语母语的人来说,配音流畅度没什么问题,但语句感情可以说很平淡了,和国内营销号爱用的 AI 配音如出一辙,听下来没什么波动,有种得道高僧诵读大悲咒的感觉,不悲不喜,波澜不惊。
很快, Gianni Matragrano 分享了一条游戏开发团队的播客,实锤了这个问题。
播客中开发团队的音频设计师表示,除了呼吸声这种特殊内容由真人配音外,大部分配音都是 AI 完成的。原因嘛,他们说是“可以用更少的钱获得更专业的配音”。
虽然他们认为使用 AI 配音可以提高生产力,但 Gianni Matragrano 却不太赞同,因为他的帖子被限流了,留言、转发、点赞直接来了个对半砍。
不知道是开发商的盘外招,还是马斯克看不过眼了,总之装都没装。
右侧帖子被调整后的数据
随着这条帖子在网络上的发酵,《The Finals》不出意料地被围攻了。
参与这一场大型抗议的,有 Bungie 的高级声音设计师、 Gearbox 的叙事总监、给原神和消逝的光芒配过音的 Kit Harrison 等,这些游戏圈的人,有不少都是玩家的老朋友了。
玩家、媒体、配音演员、游戏设计师表示,任你解释千万遍,质量还是稀巴烂。就算游戏内容再好, AI 配音这个缺点,最后会比腰间盘还突出。
面对各界的跳脸输出,开发团队坐不住了。
在 10月 31 日,他们赶紧站了出来搞危机公关。在给到 IGN 的一份澄清中,开发团队表示游戏的 AI 配音方式,其实是根据上下文,在游戏中使用录好的语音和通过 TTS 工具(即 Text to Speech ,文本转语音)生成的音频。
用更通俗的话说,那就是“别骂了别骂了,我们的人工配音还是蛮多的。”
他们不得不服软。在这码事上,游戏开发团队犯了两个忌讳。
第一,AI 配音确实烂,这个洗都没法洗。第二,也是最关键的一点,AI 配音替代了相关从业者的工作,直接损害了一大批人的利益。
你想想,大中午大家正吃着饭,突然进来一个人,把大伙的饭碗给砸了,顺便掀了桌子,让你们从这里滚蛋,你能忍?
而且好巧不巧,最近美国 SAG-AFTRA 演员工会在闹罢工,他们以压倒性多数投票赞成授权进行视频游戏罢工。重点针对的内容之一,就有人工智能这个问题。
在英国, Union Equity 这个表演艺术和娱乐工会也在支持参与者在人工智能面前,维护他们的合法权利,还呼吁政府采取紧急行动。
可以说,《The Finals》这是撞枪口了,它不死谁死。
《The Finals》属实是倒大霉,它压根就不是第一个搞 AI 配音的,但它一定是搞 AI 配音的游戏里最惨的。
远了不说,就说刚发售没多久的赛博朋克 2077 DLC 《往日之影》,通关的朋友如果有耐心看最后的演员名单,应该会发现,给义体医生维克托,以及巫师 3 中维瑟米尔配音的老爷子 Miłogost Reczek ,在 2021 年去世了。
老爷子的家人决定允许 CDPR 使用 AI 还原他的声音,最后 CDPR 聘请了另一位配音演员给维克托配音,然后使用 AI 软件把对话还原成 Reczek 的音色。
这样和直接使用 AI 配音的《The Finals》相比,能感觉出十分明显的感情波动。而且社会各方也没话说,毕竟成品优秀,也有配音演员参与。
对玩家们来说,他们抵触 AI 配音的原因可能只有一个,那就是质量真的太太太差了。和专业配音演员相比,差的不是一星半点。
赛博朋克 2077、无主之地 3 这些优秀的中文本地化大作就不用多说了,暴雪曾经的一些中配,也让人十分难忘。
2012 年魔兽世界熊猫人之谜的开场 CG ,可以说是游戏史上的中配巅峰之作。
就这几句翻译,放到现在依旧能打,国产游戏都得给跪下,说声(曾经的)暴雪牛逼确实不亏。
但对于 AI 配音的抵制,应该不可能会取胜。
最后大概率会像当年的 AI 换脸技术一样,在全球的一场场抗议潮中,没成压箱底的老古董,反而逐渐变强。
原先我还能看得出 AI 换脸在边缘部分的不协调,现在我已经分不清芜湖大司马到底是不是肌肉金轮了。
在 B 站,也出现了伦敦腔赵本山、西海岸郭德纲等 AI 配音的视频,和最开始流行的 AI 孙燕姿相比,技术的进步十分明显。
AI 配音好吗?掌握它的人,就像是拥有手枪的婴儿,可以造成无差别的攻击。没有人能猜到自己的声音会出现在什么地方,被用来做什么事。
AI 配音不好吗?可它又能还原逝者的声音,带给人们最真实的感动。它也许不适用于强调对话感情色彩的 3A 游戏,但在一些多人竞技游戏中,表现尚可。
关于 AI 配音的问题,不是简简单单的抗议否定,或者大加引入就能解决的。
一个 AI 技术被压下去,千万个 AI 站起来。
怎么给技术套上缰绳,可能才是问题的终点。
图片、资料来源:
https://gamerant.com/the-finals-beta-criticized-ai-voices-voice-acting/