AI热点 5小时前 117 阅读 0 评论

前米哈游大佬创业,做了一款AI驱动的CRPG

作者头像
AI中国

AI技术专栏作家 | 发布了 246 篇文章


上周,一款由AI驱动的CRPG游戏《印格》(Engram)在ChinaJoy上亮相。


《印格》由上海柚衣科技研发,其创始人丁盛豪曾在米哈游担任重要部门技术负责人,2023年离职和同事一起创业,并继续在米哈游大楼附近办公。他们在成立的同一年开始开发由AI驱动的新一代游戏工作流,并在此基础上推出了《印格》。



在成立不到两年的时间里,柚衣科技先后获得了私募基金Genkirakira L.P.和红杉中国的天使轮投资。其中上市公司掌趣科技通过其全资子公司投资并作为Genkirakira L.P. 的合伙人之一,长期围绕AI+游戏场景展开布局,至今已和多家AI公司达成产品和技术合作。对柚衣科技的间接投资是掌趣科技在AI领域的再一步落子,将进一步丰富其AI游戏生态。


柚衣科技之所以在成立早期便受到资本青睐,也和公司对AI技术的态度有关。



《印格》采用了注重叙事的CRPG(Computer Role-Playing Game)玩法。CRPG向来注重叙事驱动和自由的角色扮演,也因此像《神界:原罪》《博德之门》等系列作品吸引了不少玩家。


在《印格》中,玩家带着患病的妹妹米亚进行冒险,NPC则会基于玩家的行动、谈话而做出不同的反应,玩家的一举一动都会影响到后续的剧情发展。换句话说,不同玩家在游戏中很可能会体验到截然不同的故事进展。


《印格》的特点在于,玩家在刚上手的时候不太容易感知到AI技术的运用。故事的发展也不会像AI跑团那样无止境地发散,以至于会导致剧情进展的崩坏。相较于市面上的AI游戏,《印格》看起来显得更为「务实」一些。


游戏新知在ChinaJoy期间造访了柚衣科技,并和开发团队聊了聊他们的创作理念——《印格》想要让玩家感受到的体验是在「玩游戏」,而不是「玩AI」。这或许也是当下许多AI游戏最容易忽略的一点。


以下为对话内容,内容经整理和调整:


我真的知道怎么拿AI做一个游戏


游戏新知:当初为什么会从米哈游出来创业?


柚衣:我之前是在米哈游做云游戏业务,里面多数的技术难题都是我这边在攻克的。


到了2022、2023年那个节骨眼的时候,我们已经做到行业里最好的了,包括延迟、画面优化、成本等。我们有很大的成本优势,到这个地步都是靠技术优化来实现的。


但是后面业务平稳了,而我想人永远要做点有挑战的事情。另外一方面,因为我最早是在开源社区做编译器的,当时觉得在AI技术出来之后还是有很多优化空间的,但是又感觉没有太多人在做这件事情。


那时候看到了一些AI游戏DEMO,让我觉得太虚无缥缈、太「DEMO」了,于是就想着能不能自己做一个。


当然这个中间过程有纠结过。最初想着在米哈游内部立个项,后来还是决定要自己出来做。首先这是个机会,其次我们团队也有能力去做,而且我真的知道该怎么拿AI做一个游戏。


游戏新知:为什么《印格》会选择CRPG这个玩法?


柚衣:我们从一开始就想用AI的一些特性来结合游戏做一些设计。但是考虑到AI的特点,如果说单纯地把AI用来辅助美术或者其他,那么它其实更像是一个工具,因为它没有改变游戏的内容或者游戏的体验。


所以我们就再倒过来想,有没有什么类型的传统电子游戏能够以全新的体验角度来切入。


当时就想到,TRPG中有非常多即兴的内容变成了游戏玩法的一部分。包括像《博德之门》这些大多数的CRPG都脱胎自传统的TRPG,但这些CPRG会更多地着重在战斗方面,因为剧本的产能有限。于是我们就想到能不能使用AI来做。


现在已经有AI跑团之类的玩法,但尝试了之后就会发现有很明显的问题。比如说AI在跑团里扮演DM(主持人)的时候,塑造的故事是非常发散的,很容易就把模组带飞了,导致它不像是一个完整的故事。但是前几年调研时也发现,有一些玩家非常喜欢跟AI跑团,原因在于他会觉得AI扮演的队友会让他有更好的沉浸感。



AI跑团中故事无限制发散的问题很常见


于是我们就在想AI能不能改善和利用这两点。


第一点是可以用AI把游戏中的角色扮演玩法变得更自然。尤其当玩家在前面的对话中有一点点的选项或输入的差异,立马会导致下一句话或后面的对话出现差异时,这对玩家来说会是很强的反馈。


第二点是,如果AI扮演DM会很容易发散的话,我们可以试着解决这个问题。比如能不能和现有的剧本相结合,让它有确定性地输出?我们围绕这个问题写了一个非常复杂的技术方案。


在这个技术方案里,编剧可以把故事写死,也保证了AI在输出时是有限制的。而不像是传统的LLM(大语言模型)一样,哪怕你给它4个选项,它还是有可能会乱输出。最后还发现这样能保证它的输出变得相当快,而且也可以驱动一个故事了。


游戏新知:为了解决AI跑团的叙事比较发散的问题,会不会又引发人为的影响让故事出现收缩的新问题?


柚衣:我们纠结过这个问题。后来发现如果一个剧本是好玩的,首先它还是有剧情结构的,包括像起承转合这样的大结构、一些精巧的矛盾,其实是人想的会比AI会好一点。我们想在保留这些内容的情况下,尽可能让它稍微发散一些。所以《印格》的剧情结构中有一些连接是相对自主的,一些是比较严格的,实际上是「收-放-收」的关系。


我们在调研的时候也翻到了一些做交互式虚构作品方面的理论研究。最传统的剧情结构是树状结构,故事一旦有分支,这个分支就是个死路。这种传统的故事结果非常吃人力的产能。


而且有个很严重的问题——甚至人和人之间都很难协作,因为它的故事节点很可能是非常依赖上一个节点的。像是在一些二次元游戏里你会明显感觉到有一个倾向,大版本之间1、3、5是一个感觉,2、4、6是另一个感觉,那是因为他们有两组人在做。



Gauntlet


如果想让它变得更复杂一点,包括像《博德之门3》这样子的,它更倾向于这种叫Quest的形式,故事在发散之后很快就收回来。我们在这基础上也在思考能不能把它放得更大一点。



Quest


早期在上世纪60、70年代的计算机游戏里,有一些实验性作品就想做成所谓的Time Cave,当中每一个玩家做出的选项完全是发散的。但是为了让游戏能够好玩,编剧就必须对每一个分支都做非常细的调整。比如说故事有10个分支,那么2的10次方也得写1024种,这对人力来说实在是太难了。



Time Cave


比如《80 Days》这个游戏就做成了一个非常复杂的网状叙事。它的游戏流程是让玩家扮演福格的助理并带他在80天内环游地球,这个过程中唯一的约束就是玩家只能自西向东走。过程中每当地图上的点稍微发生了一些事情之后,都会对后面的流程造成很大的变化。



这款游戏引出了一个叫Storylet(故事块)概念,一个Storylet是由3个部分组成的:


1.它在什么条件下会被触发;


2.故事内的台词因为一些别的条件而受到影响,它要记录这些影响;


3.根据玩家在游戏内选择会产生哪些新的条件。


为此他们发明了一种新的编程语言来专门制作这款游戏。


这种方式写出来的东西有一个问题,就是写完之后根本没法测试,因为对于人力来说故事的边界情况太多了。《80 Days》的内容量虽然很大,但如果只玩一轮的话也就15到20分钟,玩家需要玩多周目才能感受到内容量之大,而这对他们来说已经写崩溃了。


包括受此启发的《Sunless Sea(无光之海)》,也有几十万英文单词,这些游戏也都没有官方中文翻译,因为文本量太大了。


而这个系列的最后一作《Mask of The Rose》已经是这个游戏类型的剧本量巅峰,他们发现怎么写都写不出比这个量更大的剧本了。这个游戏甚至彻底连地图探索都没有了,变成了一个纯对话游戏,玩法变得非常单一,也是系列中卖得最差的一作。



但我们受此启发很深,这个做法还是有一些好的地方。


第一点是如果以「条件-输出」的形式来做约束的话,那么我只要搞明白这两个东西,编剧就可以很发散地工作。因为哪怕编剧先把「输出」的部分都写了,未来再来想我哪些内容要用到这些条件就好。


第二点是这样写出来的内容反而比较容易工程化。我们发现如果故事内容是可以被条件描述的,那么其实可以使用计算机辅助证明的方法来为其作证。我就可以告诉编剧出现几种情况。


比如说编剧刚刚写了一些内容并放出了一些条件,但是没有利用起来,那就可以想办法让故事更加丰富。或者编剧在某些地方检验了条件,但是编剧从来没有发出来过。最常见的原因是编剧以为他写了,但实际上那部分故事一定发生在这段故事的后面,这样的情况也能被检查出来。第三种是编剧写了A和B两段故事,但是我可以知道A和B永远不可能同时发生。


这巧妙地让AI生成变简单了。因为有了非常严肃的逻辑系统去做到两件事,一个是在AI生成prompt的时候可以知道哪些东西是与我有关的、哪些东西是与我无关的。另一方面,它还可以倒过来去做一些约束。比如现在故事结局只有3种情况,我可以让AI最后生成的结局一定是三种结局中的某一个。


最后我们做到了两个目标。第一个是故事可以做得相对有确定性,在主线上编剧会限定得比较死。而且支线上又有大量发散的内容,故事和故事之间有大量的连接,包括每一句话都能稍微影响到后面的故事。第二个是让编剧写到已经崩溃了的时候,还有系统可以帮他不停地完善并让他继续往下写。


游戏新知:目前的故事框架算是网状结构,还是说你们有自己的定义?


柚衣:它比网状叙事更复杂一点。玩家在游戏中的感受更偏向于网状叙事,但它实际上是一个动态构建的网状结构。


传统的网状叙事有一些限制,故事和故事之间不是完全连接的,更像是一块故事节点的互相连接稍微紧密一些,而块和块之间的连接是相对稀疏的。


从静态的来看,《印格》中的故事连接比传统网状叙事更紧密,但紧到这种程度也会发现故事很难发展下去。所以在玩家做了某些事情导致某个分支无法进行下去的时候,我们会动态地把某一块剪掉,就形成了一个动态的网状结构。



玩家之所以觉得网状叙事好,是因为在里面所做的任何一点小的行为都会像蝴蝶效应一样影响到别的情节中。既然如此,我们就在想为什么不把故事节点做得更紧密一些。就像在DnD中有个概念叫做「激励骰」,DM会因为玩家做出了剧本之外的行为而临时编一段剧情,甚至给出激励骰作为奖励。这种事情在计算机的RPG游戏里是非常难做到的,我们虽然也做不到那么完美,但也是在尝试这种可能性。


游戏新知:AI计算资源的消耗对于AI原生来说会不会是一种挑战?


柚衣:我们在引入了现在的复杂工程并为故事提供确定性之后,发现生成成本也是相对可控的。如果AI要花很多token,那么它天然就很慢,因为这是计算资源的兑换。所以选择了什么样的模型、怎么样去控制模型输出,也都决定了能不能优化游戏体验。


游戏新知:不同玩家之间会不会有复用的情况?


柚衣:会做一些提前的运算。包括我们发现有一些玩家的行动是完全相同的,这种情况也会有一些生成会被跳过。


让玩家玩游戏,而不是玩AI


游戏新知:除了文本之外,AI技术还有没有应用在其他方面?


柚衣:有一些比较创新性的应用。比如我们之前会讨论想决定一个画风,结果发现图片的内容往往比画风的影响更大,玩家往往是选那个内容更吸引他的,而不是画风更吸引他的。所以我们做了小的调整,让AI去生成一些内容完全相同、但是画风不一样的图,倒过来用于玩家调研,而没有直接把它用在生产里。


游戏新知:那为什么没有选择直接用AI来制作美术资产?


柚衣:AI生成的完成度不太够,AI的设计能力是很差的,而且玩家现在比较抵触AI生成的美术资产。现在对AI美术的使用有一点像是在完成「夹心工作」。我们会让人做更多的设计,然后让AI稍微出一些草图,之后再由人来做一些完成度比较高的产品。



游戏新知:在音乐、配音方面有没有AI技术的应用?


柚衣:现在还比较少,主要是现在游戏音频的研发进度进度还比较落后。不过我们有在做自己TTS(Text To Speech)模型,这个模型主要有两个比较大的改进是一定要做的。


第一是改善第一个token的延迟,目的是一定要让对话的吐字能够吻合上。现在很多AI生成会先延迟一秒两秒,那我文本都看完了,我还播什么?


第二是我们在通过自己录数据库、修改模型的一些方法,来让AI能够输出情感起伏更大的内容。因为现在TTS的数据集主要是来自于播音、有声书那些内容,但实际上它在角色扮演方面会变得非常弱。所以我们在试图改进这个问题,希望能够在正式版之前把这个问题给追上。


游戏新知:CRPG通常面向比较重度的玩家,《印格》看起来还是相对轻度的。有没有担心找不到合适的游戏受众?


柚衣:像是DnD那种传统CRPG的世界观对很多欧美玩家来说都已经太熟悉了,它的引导也会做得相对比较弱。但计算机上的CRPG天生有一个好处,就是可以做很多引导。所以《印格》也是在做减法,用一个比较简单的方法能够让玩家更快地沉浸进去。


最近进行了好几次测试,发现反响比预想的要好很多。传统的RPG玩家能够比较好地融入到这个游戏当中,我们至少找到一类比较典型的玩家受众,就是会玩跑团,但不一定是重度的、懂DnD规则的玩家,也包括 CoC(Call of Cthulhu)和知道CoJ(Call of Japanese)规则的玩家。


另外一些比较看重剧情的、非典型的游戏玩家也能很快地承接进来,甚至遇到一些音乐游戏的玩家也会因为故事而觉得这个游戏很有意思。


游戏新知:参展的时候有没有让你们印象深刻的一些玩家反馈?


柚衣:在CCG(中国国际动漫游戏博览会)出展那天,有两个女生是从桌游那片逛过来,她们一起玩了一个半小时,把当时游戏设计的所有故事节点全点亮了。你也可以理解为她们完成了全收集。


我们问她们为什么觉得这么好玩。她们说因为一开始觉得阿心(游戏的NPC)是个好护士,后来发现她是一切的幕后黑手,变得很讨厌这个虚伪的女人。所以当她们在玩二周目的时候,我告诉他们,阿心其实是可以提前「退场」的,后来她们就在三周目的时候花了很长时间在研究。


这个游戏支线的生成度很高,所以它也没有太明确的攻略。我只能大概告诉她们可以激怒什么人、讨好什么人,但我也不确定能不能成功。不过因为每个角色都被设定好了性格,所以生成的结果又都挺合理的。



《印格》在CCG展会上的摊位


游戏新知:概括地说,你觉得是什么驱动她们去玩多周目的?


柚衣:我觉得是情绪。


现在一些AI游戏比较烂的地方在于把AI和游戏做成了两个东西。我们为此有意做了设计,比如游戏开始后不那么快地向玩家呈现输入框,就是因为一定要先通过游戏设计的方法让玩家沉浸在这个故事里面,再让他去做选择的时候,玩家才会觉得这个游戏很自由。但如果让玩家一上来就很自由,他就会无所适从。


现在很多AI游戏DEMO都有这个现象,直接给玩家一个对话框或者语音输入,玩家就会感觉「啊?」。


玩家感到无所适从就会去干一些很糟糕的事情,比如说去训AI。先不说你能不能阻止他们,当玩家开始想这件事情的时候,其实就已经是破坏游戏体验的开始。因为他根本没在玩游戏,他是在玩AI。所以我们一上来就花了蛮大精力去让玩家尽量不要做这种事情。



「我们选择去月球不是因为它很简单,恰恰是因为它很难」


游戏新知:目前的游戏开发计划是怎么样的?


柚衣:现在有一个比较完整的DEMO,但是细节上还比较落后。预期是在今年的夏末能够出一个公开的DEMO版本,预计在年底能够做一个比现在剧情内容量翻个3-4倍的Early Access版本。


正式版的话,不确定性还比较强。


游戏新知:现在的玩法还有计划增加其他内容模块吗?


柚衣:目前配置的系统允许比较轻松地插入新玩法。比如说目前游戏里有的解谜玩法,只要有新的想法就可以很快配出来。我们不是特别担心这一块。


游戏新知:有没有具体的例子来说明「很快」是多快?


柚衣:我们公司成立了两年多一点,头两年基本都在写AI的系统,虽然也做了一些游戏内容,但是最后都被推翻了。


现在能玩到的版本是今年年初过完春节之后重写的。第一个剧本架构比较完整,不算细节完善得比较好的,开发时间加起来不到3个月。骰子玩法是我们CCG之后到ChinaJoy这两个星期内加出来的,相当于只要有剧本就立刻可以配进去。


而且刚刚提到的数学证明可以在程序上自动帮我们做自动化测试,如果测试发现有矛盾,它会直接告诉你,你就赶紧去改,所以省了非常大的工作量。


游戏新知:听起来整个流程就加快了很多?


柚衣:对的。但是它的加快是建立在推翻了原来的流程的前提上。所以把它引入到一个成熟的游戏,把它改成AI化是非常难的。


我们计划在游戏完成四分之一内容量的时候就上Early Access,这在今天的Steam环境里是一件非常有挑战的事情。游戏的完成度非常低,大家会觉得你要跑路、你干不完。


但我们想要挑战这个工作流。


就像电视剧的工作流程有差异一样。有的电视剧是全部拍完审完,然后丢到平台上播;有的是拍个3-4集,根据播放后的市场反馈开始一边拍一边改,所以它的收视率会是一个动态呈现的结果。


对《印格》来说,不能动的是美术资产,可以理解为是舞台;能动的是剧情和玩法,这些是能够非常快速迭代的东西。我们想要在以3个月为一个周期,快速根据玩家在前一个段落章节的反馈对后面做出动态的调整设计。


其实这是一个很像手游设计思路的单机游戏设计工作流。


再引用一句肯尼迪的话,「我们选择去月球不是因为它很简单,恰恰是因为它很难」。我们想要实现的是真正能够改变游戏开发流程、改变玩家体验。如果我上来就做一大堆小工具,改善一下美术的上色效率,那三四个月就能得到一个不错的效果,但这根本体现不出来这个时代里AI的能力。


游戏新知:目前这个工作流有没有和其他团队合作的计划?


柚衣:来咨询的还挺多的,也有开展一些试点的合作。但我们的完成度还很低,就不敢铺开给大家合作。还不止游戏行业,我们还有在跟互动影游戏在合作,比如《隐形守护者》导演的新作品。


但他用我们的功能还比较浅,主要是用来验证编剧写的内容有哪些剧情矛盾。当时我有问他为什么找我们合作,他说互动影游即使是纯分支剧情,实际上工作流中的前后逻辑关系远比想象中的要复杂。他们会经常修改剧本,但一旦调整之后往往会出现牵一发而动全身的逻辑变化,所以他们就想要用一个更智能化的剧情处理工具。



游戏新知:他们为什么会关注到你们?


柚衣:因为是好朋友,经常会交流游戏设计。


游戏新知:目前的团队规模和分工是怎么样的?


柚衣:一共加起来是10来个人,开发大约占掉一半。分工没有分那么细,前端也可能写写后端的,后端也可能写写前端的。创意型的工作几乎是每个岗位都只有一个人的状态,如美术、编剧、音频,偶尔会稍微多一两个人来帮忙。


如果我们一上来就有很多人,说AI能改善游戏开发效率的话,到底改善了什么效率呢?有的时候有一些限制,反而能加大大家的创新力度。


游戏新知:团队成员都是以前米哈游的同事吗?


柚衣:也没有,米哈游的同事占一半左右吧。


游戏新知:目前的开发成本可以透露吗?


柚衣:基本上是能覆盖的。


引擎相对来说成本比较高,花了快1000来万的样子,反而游戏的成本会低得多。


我们如果要做一款全新的开发工作流AI工具,那么就会有一个问题——该把它做成什么样?所以必须得有现有的工作流、得真的在做一款游戏,才能为这个游戏去做适合它的AI工作。所以我们从第一天开始就有一个游戏在并行研发,然后被反复推翻、反复重做。


因为工作中的工具和生产方式都是全新的,所以就一定会试错。包括我们做过一个肉鸽弹幕射击的关卡作为《印格》的战斗玩法,在发现效果不够好之后再把它推翻。


这只是战斗的部分,在我们推翻的过程中算是非常小的一件事情。推翻的大的部分可能是整个剧本框架。我们的编剧老师也经常一起跑团,在已经有很多共同认知的情况下,想要去理解一个没有对标的东西依旧是非常困难的。所以我们做了很多具象化的工作,才一点点把引擎和游戏推出来。


游戏新知:所以在试错过程中,引擎和游戏的开发是从2023年就同步推进的?


柚衣:一直是同步开发的。中间引擎和游戏分别推翻了两三次。


常见的推翻原因的是某个工程有设计上的问题。比如设计的流程根本不可能让它在未来再设计出4、500个剧情。


或者是引擎本身存在的限制,有的内容AI是更容易生成、有的怎么生成都容易出错。比如AI很容易在很早期就把一个晚期的内容透露给你,所以我们就不得不围绕具体的内容去大改剧本。


大家可以少一点对AI的焦虑


游戏新知:团队还有探索其他业务的计划吗?有关注到团队里有成员也在自己做一些开源项目


柚衣:我们每个人的开源项目都蛮多的,而且公司也很支持个人做这些项目。而且的创意工作和程序工作都一样,你一定要不停吸收新东西,你才能做出新东西,否则的话你只能每天让自己拧螺丝更熟练一点。


所以虽然是他们的个人项目,但如果说遇到AI的问题之类的,提出来之后大家都会帮他去解决。



游戏新知:这些会和公司的游戏挂钩起来吗?


柚衣:目前还没有,但(未来)难说呢。


游戏新知:现在Steam上越来越多AI制作的游戏,你怎么看这种市场的变化?


柚衣:首先有比没有好,对吧?如果一直没有,就说明AI做不出游戏。其次我觉得大家之间没什么竞争,因为现在还属于早期很野蛮的市场,所以大家各自都能做出来一点东西,对于「AI如何改变游戏产业」这个命题总归是有益的。


一件永远比较重要的事情是,不管外面的发行节奏如何,我们自己的节奏也得控制住。不能够说因为外面产品很多,我们是不是就一定要急着上。归根结底,我们还是有自己的品质要求的,不能因为大家都发了,我就扔一个完全不合格的游戏出去。



Totally Human Media报道Steam上有接近8000款游戏使用了生成式AI


游戏新知:感觉现在玩家对AI原生游戏的接受度怎么样?


柚衣:我一开始会很害怕,后来发现玩家还是比较宽容的。玩家可以接受AI生产的内容有点问题,因为他也知道现在AI也不是那么完美。但玩家还是能从里面发现一些闪光点的,尤其是AI对玩法的影响。


既然如此,我们也应该回应玩家的这种宽容。如果他们对我们宽容的话,我们也不能对自己太宽容,只是给玩家的得是一个相对比较完整的游戏,让大家的钱别白花。


游戏新知:你作为用AI开发游戏的创作者,你对于其他创作者有什么建议吗?


柚衣:「跟上潮流」肯定是真的,AI确实在不停地改变我们的工作流。但是大家可以少焦虑一点。很多时候大家有点太焦虑了,觉得AI明天都要掌管世界了,可是我还没有跟上。


好的内容永远是有人消费的。不管是不是AI,最终玩家看重的是消费内容本身好不好。所以我觉得大家还是要注重精进自己的产品质量,这会比较重要。


文章来自于微信公众号“游戏新知”,作者是“新知君”。


作者头像

AI前线

专注人工智能前沿技术报道,深入解析AI发展趋势与应用场景

246篇文章 1.2M阅读 56.3k粉丝

评论 (128)

用户头像

AI爱好者

2小时前

这个更新太令人期待了!视频分析功能将极大扩展AI的应用场景,特别是在教育和内容创作领域。

用户头像

开发者小明

昨天

有没有人测试过新的API响应速度?我们正在开发一个实时视频分析应用,非常关注性能表现。

作者头像

AI前线 作者

12小时前

我们测试的平均响应时间在300ms左右,比上一代快了很多,适合实时应用场景。

用户头像

科技观察家

3天前

GPT-4的视频处理能力已经接近专业级水平,这可能会对内容审核、视频编辑等行业产生颠覆性影响。期待看到更多创新应用!