玩家投诉的机器人，竟然都是真人？｜对话超参数科技|动作|游戏|量子|npc|top

分享至

视点发自凹非寺
量子位｜公众号 QbitAI

一个理想的GAME Agent是什么样的？

让你分不出来跟你互动的是真人还是AI。

这是带领腾讯AI Lab开发出「绝悟AI」、「绝艺AI」的刘永升的回答，他现在的身份是超参数科技创始人、CEO。

在这家专注游戏AI和GAME Agent的公司的观察里，现在游戏里的NPC已经能做到以假乱真。

而AI NPC只是GAME Agent的可能性之一——

GAME Agent能够参与到整个游戏管线中，将「智能」带入游戏设计，进一步推动AI原生游戏的诞生。

在量子位「365行AI落地方案」中，刘永升和超参数科技将GAME Agent的发展划分为了四个维度，现在的超参数已经抵达了AI Agent3.0阶段。

我们将这次的直播对话进行了梳理，更多关于GAME Agent、AI原生游戏、AI NPC的内容，让我们一起来看看吧。

对话亮点

我们目前算是从GAME Agent的2.0走到了3.0：2.0主打一个拟人性，3.0的互动性、自主性、多样性都会更强。
我们之前发现一个挺有趣的点，玩家很多时候会投诉说自己跟很多机器人在玩，但真正去查的话，会发现这些他怀疑的机器人都是真人
Agent要体现出有生命的话，主要是要满足两方面：一方面是autonomous（自主性），另一方面是interactivity（可交互）
我们现在更关心的是“智能”这个维度，短期记忆或长期记忆、对环境的感知、做哪些动作去改变环境等等，这些东西会成为管线的一部分。
并不是单纯的技术进步给某个行业带来milestone，而是要和“人”，也就是有想法的团队发生化学反应，才能带来真正不一样的变化。
未来一定会有越来越多Agent走进人的生活。

用AI来模拟玩家的心流和手感

量子位：第一个问题想先从您的经历开始，在2019年这个时间点，您是看到并且抓住了什么样的机会选择了创办超参数科技，来为各大游戏公司提供解决方案的？

刘永升：坦白讲，我们并不是看到了什么机会才创业。19年那会，AI还没现在那么火。那时候大家鼓吹“AI寒冬论”，当时比较主流的AI赛道集中在图像处理的安防、自动驾驶领域。当时我们在腾讯做的game方向，算比较小众的领域，但是做出了一点成绩，也就是围棋AI“绝艺”、王者荣耀AI“绝悟”。

正是做这两个项目的过程中，我感觉游戏赛道虽然小众，但比较有意思，能够直接地看到算法的优化、工程技术的优化让AI变得更加活灵活现，有递进式的能力的上升。对于我们做AI的人来说，及时的feedback是非常吸引人的。

我们当时也没想过要给游戏厂商去提供解决方案，单纯觉得这个东西挺有趣的。很早之前就在内部提过一个口号，叫做「AGI in Game」。那个时候DeepMind已经在谈AGI的概念了，但提的人很少。我们直观的感受是，AI在游戏里面能够表现得很像真人，「AGI in Game」或许不仅是一个idea，也是一条路，所以那时候我们就说能不能出来做AGI。

这也影响到了我们创业的使命——「打造有生命的AI」，就是想让GAME Agent变得越来越有自主性，更具交互性，我们一直在沿着这个方向在走。

量子位：您刚刚提到，最开始就觉得做这件事情很有兴趣，我们也了解到超参数现在也是在做一些Agent相关的工作，那到今天超参数为游戏公司提供的服务和合作大致都有哪些方面呢？

刘永升：我们出来后发现要考虑柴米油盐，还是需要去做落地。当时比较容易落地的，也比较快被大家接受的，就是给一些大型的PVP游戏去提供类似AI队友或对手的服务。这是我们最早进行商业化、效果也不错的合作。

后面我们发现在PVE中也有不错的应用。PVE中的AI算是一种比较新鲜的东西。以前，大家会觉得PVE跟AI没什么关系，很长一段时间内我们也是这么认为的。后来我们深入到行业里面，发现PVE策划要准备非常多的关卡，特别是一些偏动作类游戏里的boss的走位或者动作等，整个制作的代价是非常大的。

在设计阶段，通过跟AI的结合，让AI训练AI，让它模拟玩家去闯关、打boss，可以很好地评估关卡设计得是否合理，是不是能满足策划要的用户心流体验。用户的心流或者手感，是没办法量化的，但是AI在这方面可以发挥很大的作用。这是我们和深度合作的游戏团队共同探索出来的。

第三，我们还在做一些AI+game相关的探索。目前以一些大型的商业化游戏为主，也在跟一些小体量的Indie Game做探索。比如说把我们的NPC应用上去，做一个偏动态的世界，需求端看起来很吸引人，但实际上供给端要实现，技术挑战挺大的。

量子位：今天超参数其实是算中国最大的第三方AI NPC的供应商了，包括这两年AI NPC这个话题也一直很火，为什么AI NPC的业务能从游戏业务中独立出来？

刘永升：去年3月，我们发布了《活的长安城》demo，里面所呈现的NPC的形态吸引了业内的关注，确实不少人来问我们，但说我们是最大的NPC供应商还不敢当，感谢大家的认可。因为不管是长期的趋势还是我们自己的规划来看，还有一些关键体验处于技术攻坚期。我们目前算是从GAME Agent的2.0走到了3.0：2.0主打一个拟人性，3.0的互动性、自主性、多样性都会更强。

为什么NPC的业务能够独立出来？

主要是两种情况。第一，一些小体量的游戏跟NPC做交互，国内外都有，比如模拟女友交互的，我们内部会把它看成是类似这种斯坦福小镇的变种，体量小的游戏可能在短期内比较容易吸量，但就是后续内容会比较难以为继；第二，大型的平台型游戏，本身体量很大，它会去借助NPC这样一个新的体验，结合运营或活动去做一些偏外围的玩法，给玩家一些不一样的体验。

我们做的介乎这两者之间。我们希望能够往前走一步，但不会一开始就去做一个大体量的游戏，毕竟AI本身有风险。AI的风险会加剧游戏的风险，越是大体量的游戏对风险的管控其实是越严格的，它很难去接受当前AI带来的一些不确定性。我们做NPC还是希望解决一些更中长期的问题，而不是说玩家进来玩了一会就走了这种一波流的东西。

玩家怀疑的机器人，其实是真人

量子位：不同游戏中使用的AI NPC技术会有什么区别吗？

刘永升：这里可能存在一个认知上的gap。我们一直在做GAME Agent，内部没有“不同的游戏品类搞不一样的技术路线”的说法，我们一直沿着GAME Agent进化的主线在推进和打磨我们的技术。核心依据是GAME Agent的主线如何演进。

最早我们的GAME Agent只能去理解简单的2D场景，比如像棋牌或者其他一些更简单的场景；慢慢地发展到复杂2D，比如MOBA；然后再从复杂2D到简单的3D，像现在主流的吃鸡游戏，从环境来看，我们内部会把它归为简单3D。再后来，它能够适配一些更复杂的3D纵深场景，更为复杂。

外界或者客户能够直接感受到的是品类，但我们内部其实是非常清楚坚定地依托GAME Agent进化的主轴在做，但在它不同的阶段，我们会结合商业化场景，做一些规则适配或简单规则的改造，去适配不同品类。

量子位：在您的描述当中，其实这个AI NPC和我们所理解的AI队友或对手，在技术层面上是很像的。那在AI队友或者对手这件事上，游戏公司会追求GAME Agent更像人类的反应，还是像机器人一样更全面、更高手一些的效果？

刘永升：从过去大部分的落地经验来看，特别是2020年到2023年，拟人性是很重要的，游戏场景中GAME Agent要有更拟人的行为、行为模式、反应甚至是强度，它要接近人。

我们之前还做过很多图灵测试，发现一个挺有趣的点，玩家很多时候会投诉说自己跟很多机器人在玩，但真正去查的话，会发现这些他怀疑的机器人都是真人。

尤其是2024年之后AI发展非常快，玩家对AI会有更高的要求。以前你感觉AI就是机器人，行为呆板，模式也比较简单。后来拟人性的AI出来，玩家感受到了AI的进步，那2024年之后玩家或游戏方会有更高的要求，会希望AI能够带来不一样的体验，不是简单的拟人，而是希望AI有更强的互动性，支持多模态交流，有更丰富的行为。

量子位：在技术上，是怎么实现让一个AI Bot或者是一个GAME Agent更像人类的？

刘永升：Agent要体现出有生命的话，主要是要满足两方面：一方面是autonomous（自主性），Agent能根据实际情况和环境做决策，另一方面是interactivity（可交互），它能够跟玩家、跟其他Agent、跟环境有互动的能力。我觉得得从这两个维度不断提升。

现在大多数Agent在autonomous方面挺强的，能够在比较复杂的场景下做出非常好的决策。但现在的AI在可交互性方面还是偏弱，一些Agent只是把简单的语音或视频作为input放进去，这些还不够。GAME Agent在交互方面还有非常多的东西要去推进。

量子位：在您的设想当中，未来的Agent有没有具体一个形象？

刘永升：如果有一天你分不出来跟你互动的是真人还是AI，这可能是一个比较终极的目标吧！其实这个是比较难的，比单纯的对话难，对话现在某种程度上来讲，可以认为是已经通过图灵测试的，但是把互动性考虑进去的话，很多维度的输出以及多种维度输出之间的一致性，挑战很大。

量子位：最终如果所有的NPC或者是Bot他们都变成很优秀的Agent，那我们的在线游戏是不是就会变成了AI伙伴和人类在虚拟世界中见面？

刘永升：后面会怎么演进，现在还比较难看到终点。我个人，包括跟一些游戏界的一些朋友去聊，觉得大趋势是这样的：现在生活中，手机智能了，汽车智能了，家具也变智能了，什么东西都越来越智能，现在游戏作为一个用户花比较多时间去体验的一个东西，那他也会希望游戏里面的角色或者是一些NPC也“智能”。这是一个自然而然的诉求。

这样的话，未来游戏角色跟玩家产生羁绊，就不像之前是通过他的人物设定、精美的建模、吸引人的剧情，而是“智能”这个新维度。因为Agent有记忆、能推理，会让玩家的游戏体验完全不一样。这是底层的变化。底层基础能力的增加，上层会迭代出什么样的机制，现在比较难想象，但值得期待。

量子位：AI NPC中的每一个NPC都需要特别定制吗？

刘永升：NPC本质就是GAME Agent。NPC游戏落地的时候，相当于Agent智能去分不同的level，可以简单理解为NPC的数量很多，但是不需要每一个的智能level都很高。否则，实验成本或是延时各方面很难去支撑。这个是理论和实践之间必然要克服的。

NPC会分类别、分层级，层级最低的NPC是不需要特别花时间的，批量生成就可以，可能会改一些它的设定。重要性高的NPC可能就要定制。

量子位：定制化的NPC通常会定制它的哪些要素？

刘永升：比如说像人设，交互，这些东西都要有的，我们还会有一些比较独特的东西，比如关系链。我们会重点实现一些high level的NPC跟其他成员的关系，谁是谁的师傅，是谁的老婆，关系走向……这些会影响到AI未来的决策，这些是要去定制的。

未来一定有越来越多Agent走进人的生活

量子位：您觉得我们现在推崇的「AI-native Game」和「游戏+AI」之间的区别是什么？

刘永升：这个定义很难，AI原生游戏是不是成立，我没办法去给定义和标准。但至少有一个点是可以去探讨，AI人员是不是深度融入到整个管线里。

以前，AI同学跟游戏管线没什么介入，游戏项目的PM就按照游戏各个模块把时间各方面都安排出来，向前推进，只是到了某个阶段，他把一些需求提出来，让外部的AI同学去实现，把这个认为是一个游戏AI。

但是AI游戏的话，可能是PM先拆分需求。有些需求，需要AI同学交付东西，AI的交付会限制到下游的安排。我们现在也这么干的，但这样干代价很大，因为AI有很多不确定性的东西，给现有的游戏管线和项目管理带来很大挑战。

量子位：您之前有提到说这个AI游戏必须要从底层架构来开始发挥作用，制作AI-native Game的过程当中，从底层架构开始的第一步是什么？

刘永升：以设计角色为例，传统的那一套是考虑它的小传、建模、交互、动作、特效或者剧情。我们现在更关心的是“智能”这个维度，短期记忆或长期记忆、对环境的感知、做哪些动作去改变环境等等，这些东西会成为管线的一部分。角色越智能，用户越有可能获得更生动、更丰富的体验。

量子位：您认为游戏中是否需要不断提高NPC的地位或者说权重呢，应该在哪些方面提高，以及这些方面对于AI-native Game来说意味着什么？

刘永升：我觉得这个事情不急，也不见得说就是提高NPC的权重。现在很多人会把AI游戏跟让NPC变得更智能等同起来，但我对这种想法或者概念等同持保留意见。AI技术出现，让新的玩法或者新的机制出来，这个概率是比较低的，但我认为AI跟游戏的结合确实能够带来新的体验。

AI跟游戏的结合，不是说简单提高了NPC的地位。智能的NPC是一个元素，好比煮菜，以前可能只有四个原材料，你做出的菜就是这样，现在多了一个原材料，至于你能炒出什么样的菜，那要看厨师的天赋了。

量子位：现在的游戏都是由制作者把控游戏的设计方向。那么如果一个游戏完全由AI来生成、主导剧情的话，它是否会提供一些大量的无关信息，使得我们感受这个作品的时候会觉得有点冗杂呢？

刘永升：你这个问题问的非常好。以前很多人问我：“现在不是有很多武侠小说的文本，未来能不能有一个AI技术，只要输入武侠小说的文本，就能够把整个武侠的东西演绎出来。”

我们内部就讨论了这个问题，以《射雕英雄传》为例，很好看，很精彩，情节也非常引人入胜，但是如果用AI去模拟仿真出来，天天看到郭靖跟黄蓉做一些很琐碎的事情，这是你想要的射雕英雄传吗？极端一点，洗脸刷牙这种日常琐碎的东西也要吗？很多人去畅想智能NPC带来的比较大的变化，就是产生更多的内容。

我们希望从底层能够涌现出有意义的东西。大多数人的想法是top-down这样一个结构。top-down做起来挺累的，资源消耗大，特别是它内容体量做的比较大的时候，维护成本很高，改动或是更新都挺难的。而完全bottom-up，也基本上不可能带来好看又无穷无尽的内容。完全让AI随机模拟仿真的话，它涌现出来内容一定是极其枯燥无聊的。

智能NPC要让整个游戏的体验不一样，一定是需要top-down跟bottom-up更好地结合起来。上层需要策划文案，把握主要的故事情节；关键节点肯定要制定出来。底层有智能的AI，上层有相对确定的故事框架，AI可以更好地去演绎。

你不能只给它一个起点，如果只有一个起点，其他所有的东西都乱动的话，其实它完全是无序的。你给他若干个节点，从A到B到C到D到E到F，那至于A跟B之间、B跟C之间，让AI去涌现一些随机性，是比较可行的。ABCDEF条线是否精彩或者引人入胜，还是需要人去保证；在这个过程当中，AI会起到一定的帮助。

量子位：相当于这样又能够保证游戏可玩，又能通过AI提供丰富的内容。

刘永升：上层还是要人参与。如果未来底层的NPC能力越来越强的话，相当于他能够去给到上层更大的自由度，上层就能够创造出更复杂的剧情，让跌宕起伏的剧情有了技术支撑。

为什么现在的剧情游戏制作起来很吃力？因为最顶层到最底层都要写得清清楚楚，它都是脚本驱动的。脚本驱动很复杂，机制也很庞大，但当内容叠加很多的时候，它的灵活性就没了。而智能NPC能够提供一个大力度的可控的东西。

量子位：让我们回到一个行业的视角，您为什么会觉得游戏会是受生成式AI改变最大的行业，AI在游戏行业的重要性和其他行业相比有什么不同？

刘永升：其他行业我也不懂，到现在为止做GAME Agent可以较好地让像我们这样的小团队不断迭代。GAME Agent在游戏场景落地，能不断收集到用户交互反馈，这对我们来说是非常宝贵的，feedback可以让AI不断提升它的可交互性和自主性。我们的周期比较短，而且相对可控，这可以让我们的注意力更加集中在Agent本身。

量子位：很多说法是在强调说游戏这个场景里面数据的多样性，数据又多、质量又高，比较适合去训练这种模型。

刘永升：游戏场景确实复杂，我们在实战中就发现在一些复杂场景中Agent的应对和表现让人叹为观止，非常了不起，很多东西可能我作为一个人都做不到。这可能也是AI技术给游戏和游戏代表的数字世界带来的惊喜吧。

量子位：您在游戏行业这么多年以来，是否有见过或者期待出现什么样的技术，能够在游戏行业中有里程碑一样的效应，让人印象深刻的感觉？

刘永升：虽然我们现在成天跟游戏团队合作，但我们本质上是一家AI公司，游戏是我们Agent落地的主要场景。回过来说AI技术的发展，并不是单纯的技术进步给某个行业带来milestone，而是要和“人”，也就是有想法的团队发生化学反应，才能带来真正不一样的变化。

颠覆式创新和技术革命出现的概率是比较低的，我们能做到的就是确保实验样本多，这样一来，即使乘以一个比较小的成功概率，好的创新也是有机会出来的。现在还是要前往深水区去做更多探索，之前一些小体量的、简单的尝试，更多是运营向的尝试，后面要往内容和体验这些更为深度的方向去尝试。

量子位：大模型出现以后，搜索行业几乎被彻底改变了。那么您觉得大模型这轮技术的发展，对游戏行业有达到这样巨大的影响吗？

刘永升：首先我不是特别同意大模型彻底改变了搜索这件事，的确很多人会用基于大模型的搜索，但像Google这种工具还是能够满足大多数人的大多数日常需求的。

至于大模型对于游戏行业的影响，个人觉得还是要找到结合点慢慢推进吧。AI对游戏影响的传导也是有一个链路的，首先可能是在一些成功的大体量的商业化游戏中融入一些AI特色和调性的东西，用户反馈好以后，有AI特色的大体量游戏多了，会逐渐传导到PC Game、Steam Game。

量子位：今天最后的一个问题，想请您来分享一下站在当下这个节点，您认为未来的Agent、AI是朝着什么样的方向发展的，超参数现在是用什么样的方式在这条道路上走的？

刘永升：我们的想法其实一直没变，未来一定会有越来越多Agent走进人的生活，就像《星球大战》一样，有各种各样的生物，人形的、机器的、动物的等等和谐共存。现在已经有越来越多的机器狗，未来还会有越来越多的C端机器人，GAME Agent也会走出虚拟环境进入现实世界。

实现的层面，是有一个过程的，我们内部是划分了4个阶段，AI Agent1.0到AI Agent4.0。

2020 年之前，还是AI Agent1.0，Agent主要应用于竞技领域，具备一定的智能水平来参与游戏竞技，但能力相对较为基础和单一。2020到2023年是AI Agent2.0，AI的竞技能力和适应性不断提升，并且开始向拟人化方向发展，在游戏中的行为和表现更加接近人类玩家，实现了从2.5D到3D再到3.5D游戏环境的跨越。3.0就是我们现在这个阶段，拟人性往多样性发展，持续提升自主性和互动性，让Agent可以带来差异化、人性化、个性化的体验。

AI Agent4.0阶段的话，Agent会是一个虚实结合的状态，GAME Agent有很大概率从游戏走进现实，最终实现我们一直描绘的10亿人跟100亿AI共同生活的世界。

—完—

特别声明：以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布，本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.