作者:董子博
编辑:岑峰
2009年,一位ID名叫“IceFrog”的游戏开发者收到了一封邮件,而没人能想到,如同一只蝴蝶在太平洋上扇动翅膀,这封邮件竟然也和12年后发生在人工智能领域的浪潮有关。
当时的IceFrog是电子游戏 Dota: Allstars(下简称Dota)的主要开发者。作为主创团队里唯一技术科班出身的人,他的加入,让原先Bug泛滥、体验破碎的Dota变得稳定,从而名噪一时。
尽管作为当时世界最爆红游戏之一的主创,IceFrog却一直为人低调,从不公开自己的个人信息,也不接受采访。他与外界的连通渠道,只有他公开在游戏加载界面的邮箱,用来收集玩家反馈。
每一天,IceFrog的邮箱,都会被几百封邮件填满,而他本人也尽量单独做出回复。而上面提到的,那封与计算机历史发展有些千丝万缕联系的邮件也混杂在其中。
这封邮件的发件人,正是当时凭借着《半条命》、《反恐精英》而广为玩家所知的游戏厂商——Valve。而邮件的内容,也简单明快:希望IceFrog可以来到Valve,主导自研游戏Dota的开发。
彼时,IceFrog正深陷“私自出售游戏创意”的风波。而Valve发来的邮件却让IceFrog感受到,对方也是Dota的忠实粉丝,和他有着相同的游戏哲学。
最重要的是,在Valve可以让IceFrog独领大权,执掌游戏的开发。于是他与Valve一拍即合,组建团队完成了游戏《Dota2》的开发,而这款游戏至今仍然是全世界同时在线人数最多的游戏之一。
游戏《Dota2》
几乎可以肯定的是,IceFrog曾不止一次坐在办公室里,想象着这个自己开发的项目能够成为全世界最叫好又叫座的游戏;
但他的确想不到,这款名叫《Dota2》的游戏,竟成为了10年后全球最前沿人工智能——GPT——的重要奠基,从而让AGI(通用人工智能)的梦想距离人类又近了一步。
"在OpenAI,我们完成的第一个真正的大型项目,是制作了一个实时战略游戏……而这个游戏名叫《Dota2》。”OpenAI的主创Ilya Sutskever在与英伟达创始人黄仁勋对话时如是说道。
2016年开始开发,历经三年时间,OpenAI Five就将Ti冠军OG战队以2:0的战绩斩落马下,不仅收获不少鲜花和掌声,更让OpenAI在强化学习的领域开疆拓土,并且把这种经验带到了GPT的开发当中,也间接促进了RLHF(人类反馈强化学习)技术的发展。
“你们(OpenAI)在前期做的许多工作,有些看起来像是走了弯路,”黄仁勋在对话中回应Ilya道,“但事实上,这些看起来像是弯路的工作,都导向了我们现在讨论的重要的事情——比如ChatGPT。”
游戏对于AI,为何能够如此重要?而AI又能以怎样的方式,让游戏产生新的可能?
事实上,早在《Dota2》之前,游戏就是人工智能科学家们关注、研究的对象。甚至,最早的游戏就与人工智能紧密地结合在了一起。
上个世纪50年代,当时计算机刚刚诞生不久,英国剑桥大学专研计算机的一名博士——桑迪·道格拉斯,就在琢磨着如何让人能在计算机中玩上“井字棋”。
井字棋
而当时,互联网概念还要几十年才会诞生,两人面对面用计算机玩井字棋,又难免有点“舍近求远”。于是,桑迪不仅开发了井字棋的游戏,还在游戏中植入了人工智能的概念,让玩家可以和电脑对局——这可能是AI在游戏中的初次登场。
而后世,Deep Blue(深蓝)颇具争议地击败国际象棋世界冠军卡斯帕罗夫;十年后,AlphaGo左右出击,分别击败韩国与中国的两位国手,又让人们对AI的发展产生了注意与兴趣。
游戏与AI,这两个几乎诞生于同一个时代的计算机科学门类,就如同两个结伴而行的舞者,从未离开对方左右。
利用游戏提供娱乐,这是人们对于计算机近乎本能的需求和想象;而既然玩家要与计算机交互,为了提供“旗鼓相当的对手”,计算机的智能——也就是AI——其重要性也就不言而喻。
但对于游戏,AI科学家看得更深,也更远。他们不只把游戏看成单纯的娱乐方式;相反,他们看到了游戏技术的发展能够给AI带来的巨大裨益。
在中国科学院虚拟经济与数据科学研究中心,和中国科学院大数据挖掘与知识管理重点实验室联合出局的报告《探寻AI创新之路》(下称《报告》)中,研究者表示:“游戏科技与科学探索在一开始就形成了一种双螺旋结构,共同推动了人工智能的发展。”
而事实上,游戏产业对于AI产业的拉动也体现在营收数据的相关性上。
研究发现,游戏产业的规模每进行1%的增长,人工智能上市企业的合计营业收入就有约1.42亿元的提升。
而在未来,游戏产业对AI的拉动作用,“预计将从 2023 年的 315.76 亿元上 升至 2030 年的 1038.1 亿元,年均增长率约达 16%。”
中科院虚拟经济与数据科学研究中心研究组成员,《报告》的联合作者之一刘锋博士对雷峰网(公众号:雷峰网)表示,游戏之所以能够赋能AI,是因为虚拟世界给了不少人工智能产品一个绝好的训练场。
“在游戏中,特别多AI能力,比如多智能体博弈、强化学习、图像识别等,利用游戏场景来进行训练,都很合适。”刘锋如是说道。
为什么,游戏能够成为AI训练的最佳场景?原因或许有以下几个:
第一,大多数的游戏,玩法都离不开博弈和对抗,而在这种对抗和博弈的过程中,AI的决策能力能够得到相当完善的锻炼;
第二,游戏模拟了真实世界,但在虚拟世界中,无论怎样的行为都不会造成现实世界的损失和伤害——这能让AI可以在一个稳定的环境里低成本地完成训练,并且这个过程可以重复;
第三,在虚拟世界中,研究者能主动地改变、调整训练环境,以更低成本模拟极端状况,获得一般难以获得的训练数据。
举例来说,由日本游戏大厂索尼所开发的竞速游戏系列《GT赛车》,自发售以来就凭借高精度的数字世界建模、高度还原空气动力学、摩擦、汽车结构等要素,被不少玩家冠以“最真实”赛车游戏的名号。
也正是依托于对现实的还原,索尼的AI专家研发的人工智能体——GT Sophy,几乎“打遍天下无敌手”,更有望在游戏中积累的技术和数据应用到自动驾驶领域,让未来的座驾更加智能、更加安全。
无独有偶,在美国公司Rockstar开发的大型沙盒游戏《GTA 5》中,也有人开源了一个自动驾驶的项目,利用深度神经网络和监督学习来训练游戏中的车辆完成“无人驾驶”。
除了自动驾驶领域,游戏更是在多个AI领域“开花结果”:2015年,DeepMind利用在游戏《Breakout》(打砖块)和《蒙特祖玛的复仇》中对AI神经网络训练经验,将数据中心的PUE(能源使用效率)提升了15%。
雅达利开发的游戏《Breakout》
而法国游戏公司育碧,则利用他们在游戏《刺客信条》中高度逼真写实的游戏人物和场景,来完成AI图像识别和3D角色动画匹配。
游戏技术对AI的助力也得到了国内厂商的关注。今年5月15日,鹅厂在SPARK 2023 腾讯游戏发布会上,公布了他们利用游戏技术训练机器人AI的最新进展。
为了让机器狗Robotic X Max的动作更真实流畅、决策更智能及时,腾讯游戏学堂联合 START 团队、 Robotics X 实验室,将多智能体AI引入游戏场景,使AI在具备大约10的20000次方操作可能性的复杂环境中,学会像人一样感知、分析、推理和行动。目前经过CPU优化后,单个机器人的训练效率提升了20倍。
腾讯机器狗Robotics X Max
而更进一步,这些在游戏中训练获得的AI能力,将在未来提高多机器人协作、精密控制、适应复杂的环境等等能力,让AI机器人能够成为下个时代每一个家庭的标配。
游戏给了人工智能领域巨大的发展机会,而从另一个角度上来看,AI也是游戏向未来迈进的重要推动力。
发展数十年,游戏经历过不少高光时刻,但整个产业却正面临着增长的又一个瓶颈:
玩家对游戏质量日益增长的需求,让精品游戏的制作成本——无论是时间成本还是金钱成本都水涨船高。
一位投资人对雷峰网表示,在当下越来越“卷”的游戏市场,100万的投资,只能给开发者买到一张“进场券”,如果投入少于1000万,那么就很难能够做得出足称“精品”的游戏。
如果项目成功,开发者则必须考虑活跃度、付费等等指标,才可能负担成本;而如果项目失败,那么几年间大量的投入都如同被付之一炬,再不见回报。
而上文《报告》则指出,造成这种现象的,归根结底是游戏产业内容生产力的逐渐匮乏:对玩法、故事、画面愈发细致的打磨,让大量的人力被卷入其中,造成了游戏开发的成本不断扩张,项目风险也难以把控。
而在生成式AI的技术赋能下,生产力的问题也就不再是无解的难题。
一方面,游戏的美术资源,可以利用当下成熟的AIGC文生图技术,来完成快速的创意迭代,生成参考图、概念图等等;
另一方面,利用生成式AI,游戏的策划则可以利用大模型来获取玩法参考、调整数值平衡、生成故事梗概,辅助创意工作;
而在程序侧,利用大模型生成、检查代码,对开发的效率有着巨大的提升,这也让AI辅助逐渐成为了实际开发中越来越多人的选择。
AIGC与游戏开发的距离,比很多人想象中要更近。利用一个名为MarioGPT大语言模型,国外的一群研究者研发完成了一个“文本生成关卡”的功能,并将其应用到了《超级马里奥》当中。
论文中的演示画面
而在游戏《微软模拟飞行》中,AI也辅助了游戏中的场景生成,这其中包括超过15亿栋的高写实建筑物。当玩家驾驶着飞机,从香港、洛杉矶、伦敦的上空飞过时,在机身下方栩栩如生的建筑物群,都是由AI从2D卫星图像中生成的,如果要以人力完成这项工作,那么成本则难以想象。
在不少游戏中,性格各异、特色迥然的游戏角色是游戏剧情设计的亮点,也是最能反映游戏编剧创意的一个部分;但如果要为一个庞大游戏中,数以百计的NPC一一撰写对话和台词,这些大量的重复性工作恐怕称得上是煎熬。
在当下,将大模型API接入游戏角色,让对话完全由AI驱动,可能还并不现实:大模型对于对话的反应速度相对比较迟缓,而如果还要根据语义适配NPC合适的表情和手势,那么反应速度还会更慢。
而事实是,玩家在游戏中大多需要获得即时的反馈。玩家说一句话,NPC如果要用几十秒才能给玩家回应,许多玩家恐怕都接受不了。
就在今年,法国游戏厂商育碧发布了一个名叫Ghostwriter的AI工具,主打利用AIGC,帮助剧情策划完成玩家与NPC互动时的台词,甚至还能利用算法,快速勾勒出这个NPC的一生。同样的工作,可能会花费一个资深策划数个小时,甚至大半天的工作时间。
生成式AI的路径不断被验证,让游戏开发中,少了很多让人绞尽脑汁的“创意内耗”,也少了很多重复性的机械劳动。游戏厂商不再把更多精力放在“降本”上,也就有了更多余裕去思考如何“增效”,为玩家带来更多更好的体验,游戏产业也能够因此获得健康、可持续的长足发展。
2022年末,ChatGPT将全球的目光引向生成式AI,并以颇具想象力的愿景,让人们看到了AI进入社会生活方方面面的未来——游戏当然也是其中之一。
而游戏之于AI,作用仍然不可小觑。
游戏和AI,这两个脱胎于计算机技术的孪生双子,一直以来,就互为增长要素,以自身发展驱动对方增长,形成了一个绝佳的飞轮。
一方面,游戏技术在图形、模拟等领域上的提升,让游戏能够更好地为AI训练提供条件;一方面,AI技术的不断发展,也带给了游戏创新和体验升级更多的可能性。
有学者表示,如果没有游戏,那么这一波AI 2.0的大潮可能会迟来十年以上。
正是因为玩家对于游戏画面越来越高的追求,才催生了GPU的诞生和发展。而AI能发展至今,GPU居功至伟——在深度学习领域,GPU的训练速度相较CPU,有100倍以上的领先优势。
而如果没有游戏推动GPU出现,按照半导体的“摩尔定律”,CPU用10年发展,算力才能提升64倍。即使如此,CPU也还是很难赶上GPU在当下训练AI的效率。
在游戏发布会上,腾讯高级副总裁马晓轶表示:“生发于游戏产业的游戏科技,不仅在不断革新游戏产品形态与研发方式,而且也有望为更多生产、生活领域带来新可能。随着各种游戏技术的跨界应用越来越多地涌现,游戏将有望突破既有产业范畴,迎来全新的‘第三次扩容’。”
在今天,游戏和AI这朵“双生花”的故事,尽管已然十分精彩、渐入佳境,但仍然远未走到终点。
或许如同《Dota 2》之于OpenAI,在20年后,不知哪款游戏也会成为人工智能向着通用人工智能迈进的一块重要基石,被浓墨重彩地写进人类信息技术发展的历史当中。