还有谁能阻挡微软吗?
在公司成立近 50 年后,老牌巨头微软在近几年强势崛起。2023 年,更是微软的大年,一方面对动视暴雪超过 700 亿美元的惊天收购顺利完成,让公司一句成为全球第三大游戏公司;另一方面,作为 openai 的最大「金主」,借着 chatgpt 东风,微软又一跃成为科技巨头中的「ai 领头羊」。
目前,微软市值已打 2.73 万亿美元,和老对手苹果只差 9000 万美元的差距,反超似乎就在一瞬间。
最近,一单不太受关注的合作,似乎暴露了微软的下一步的目标——将游戏和 ai 结合起来。
不久前,微软和 ai 初创公司 inworld 达成合作,将引入基于 ai 的「角色引擎」及「copilot 助理」,为开发者提供一系列开发工具,以创建更真实、动态的 npc。
对于此次合作,微软称「利用先进的 ai 技术,为游戏中的 npc 注入更多的交互力和生命力,从而提升游戏的沉浸感和体验感。」
所以,inworld 这家初创公司,到底凭什么拿到超过 1 亿美元的融资,并且抱上了微软的大腿?双方的合作,又会让 ai 对游戏产业造成怎样的影响?
01如何打造 ai npc?
三年前,一部好莱坞大片《失控玩家》(free guy)让大家意识到,一个有了自主意识的 npc,可能会把一个游戏「霍霍」成什么样。
但事实是,如果一个游戏里的 npc 真的能有「意识」,可能会帮游戏公司一个大忙。因为 npc 这个东西,开发起来真的太麻烦了。
一款有着复杂剧情大型 rpg 游戏中,需要开发无数个 npc。例如,《荒野大镖客 2》中有超过 1000 个 npc 角色,每个 npc 都有自己的歌手、美术作者和配音演员,分布在 6 个章节的 100 多个任务中,耗时近 8 年、研发成本接近 5 亿美元。
尽管如此,研究显示,52% 的玩家都在抱怨目前的 npc「只会重复对话」,99% 的玩家在期待更智能的 npc,甚至有 81% 的玩家愿意为其支付更多费用。
因此,inworld 希望打造有「灵魂」的 npc,通过用生成式 ai 来驱动 npc 行为,使其动态地响应玩家的操作,从而提升游戏「沉浸感」,同时降低开发成本。
作为游戏界的新秀,目前,inworld 获得的融资总额已超过 1 亿美元,公司估值也已经达到 5 亿美元,更是成为了ai 游戏领域资金最充足的初创公司。
可见,inworld 的差异化竞争优势在于提供「个性化」的 ai 会话功能,而不是像 openai 和 google等老牌厂商,提供由通用的机器学习模型驱动的 ai 对话。
虽然加入 ai 大模型后,npc 有了更多对话可能性,但面部手势、肢体动作、情感语气也要有相应的表现,npc 才能更流畅自然地与玩家对话。
因此,inworld 让文字、声音及图像成为相互训练的数据,并在以 gpt-3 为核心的大语言模型的的基础上,整合了多个大模型、音频模型以及 30 多个机器学习模型,打造了一个多模态开发引擎——「角色引擎」(character engine)。
这些模型专责内容生成、信息处理、情绪感知、关系维护和行为预测等多个方面,从而支持多模式角色表达。
因此,「角色引擎」(character engine)打造出的ai npc 可以模仿人类互动的深刻社会属性,表现出「复杂」而「逼真」的人类行为,可用于任何角色设计,从而帮助开发人员增强游戏性,提高玩家参与度。这也正是 inworld 的强大之处。
事实上,「角色引擎」(character engine)的技术架构着眼于构建一个模拟人脑的复杂系统,由三层组成,分别是角色大脑(character brain)、情境网格(contextual mesh)和实时 ai(real-time ai)。
角色大脑(character brain):这层旨在用 ai 技术赋予 npc 近似于人类的认知、沟通和行为能力,还能让 ai npc 从互动中学习成长,用情商处理人际关系,并具有记忆和回想能力,能够自主发起目标、执行行动并遵循自己的动机,从而推动故事发展,融入更广泛的玩家体验。
情境网格(contextual mesh):这层旨在通过允许开发人员为内容和安全机制、自定义知识和叙事控制设置参数,从而防止可能破坏叙事流程的 ai「幻觉」或违背游戏逻辑的互动,确保了 ai 角色在各种交互场景中的一致性和合理性。
实时 ai(real-time ai):这层针对实时体验进行了优化,可提供可扩展的低延迟交互,实现以更快的推理速度和更低的成本实现高质量互动。
简而言之,「角色引擎」(character engine)的技术架构,不仅模拟了人类大脑的复杂结构,还涉及记忆处理、决策制定和情感演变的深层模拟,大大增加了玩家的「沉浸感」。
为了让用户和开发者快速构建并在游戏或应用中部署 ai 角色,inworld 构建了 ai 虚拟角色的生成平台——inworld studio,还提供了给游戏开发者接入 studio 中 npc 的 sdk(软件开发套件)。
在 inworld studio 创建 npc 非常简单,无需任何代码,输入自然语言就能快速创建。
用户登录后,首先需要用几句话设定好 npc 的身份,并调整角色的个性组合,然后可以通过设置关键词,来决定该 npc 的生活状态、背景认知、目标动机、情绪记忆等等,还可以设置具体问题进行固定对话。
在完成 ai 角色的创建后,可以使用与常用游戏引擎 unity、unreal engine、 roblox 等相适应的 sdk,快速实现角色与游戏场景的集成,大大提升交付速度,实现一次构建,随处部署。
还值得一提的是,inworld 生成的虚拟角色在准备正式进行交互和测试之前,会经历一个「训练」过程,可以选择通过 inworld 的 oculus 配套应用程序在 vr 中进行。
对此,section 32, inf 的执行合伙人 andy harrison 表示,「inworld 的 ai 平台消除了开发智能虚拟角色的复杂性,具有开启各种全新在线体验的潜力。」
目前,inworld 采取了订阅制的商业模式,不同的定价标准取决于集成时间、超时费用、功能多样性以及定制化程度,主要采取了四种不同的标准,分别是免费、10 美元/月,50 美元/月,和定制收费。
free:无限制互动时间(不包括 arcade)、每天 200 分钟集成互动时间、无限次数的角色创造
starter:无限制互动时间(包括 arcade)、每天 1000 分钟集成互动时间、可创建多个 workspace
professional:每天 5000 分钟集成互动时间、超低超时费用、可分享 workspace、具有分析功能和 beta 功能使用权
custom:高级叙事与安全控制、定制化和声音克隆、定制化集成与数据、离线模式、客户服务
inworld 的商业化路径是为小型游戏工作室和个人开发者服务;其次,与大型游戏厂商合作定制化项目,帮助他们建立和整合角色。
尽管如此,inworld 的商业化前景目前还不明朗,在竞争面临着来自游戏引擎、游戏厂商,和其他 chatbot 的三重压力。
02「角色大脑」背后的人
inworld 成立于 2021 年 7 月,总部位于美国硅谷,由 ilya gelfenbeyn,michael ermolenko,kylan gibbs 共同创立,三人分别担任 ceo,cto 和 cpo。
这三位创始人都在 ai 领域有着丰富的工作经验。
ilya gelfenbeyn,michael ermolenko 之前创立了 api.ai。这家公司被 google 收购后更名为 dialogflow,合并到了 google cloud 之中,成为了市场上最受欢迎的对话式 ai 平台。kylan gibbs 曾在 deepmind 领导应用生成语言模型产品的产品总监。
从过去的经验,他们发现语音、文字等单一应用的生成式 ai 市场已被苹果、google 等大企业掌握,但很少有平台能同时做到文字、声音及图像的生成,于是,inworld 尝试填补这个空白。
因此,inworld 团队的目标是开发能够学习、适应并与玩家建立关系的 ai npc,同时提供高质量的性能,并保持游戏的「沉浸感」。
事实上,inworld 创立之初的目标是为凯发app提供自由互动的虚拟人,但元宇宙发展缓慢,而大语言模型迅速崛起,团队看到了 llm 与 npc 结合的机会,便把目标调整为提供虚拟角色的「大脑」,同时希望能将技术应用到整个泛娱乐行业。
正如 inworld 创始人之一,ilya gelfenbeyn 所解释的,「我们提供的是一个工具集,使开发人员能够为世界、不同类型的环境添加大脑并构建这些角色,使这些虚拟世界更加吸引人。」
除了构建 ai npc,复刻现实生活中的「社交关系」,打造虚拟世界「生态」,也成为了 inworld 发展的重心。
因此,inworld 鼓励用户,创建虚拟世界的本地人口、虚拟影响者、以及可以与用户建立关系,并解锁更深入参与的数字人类。
构建真正智能的虚拟角色是复杂的,需要大量的专业化技术支撑,inworld 目前仅自行开发了 npc 的「大脑」,但 npc 创建的生态系统还包括视觉、avatar、硬件、运动等,因此 inworld 建立了与这些系统兼容的产品,目前 3d 角色模型由 ready player me 提供。
凭借独特的「优势」,创立之初,inworld ai 就完成 720 万美元的种子轮融资,该轮融资由 kleiner perkins 和 crv 共同领投,meta 参投。
几个月后,inworld 又受邀加入「迪斯尼孵化计划」(disney accelerator)。迪士尼将为其提供指导、投资资金以及进入迪士尼创意园区共享工作空间的机会,共同打造沉浸式体验的未来。
20022 年 8 月 23 日,inworld 宣布完成 5000 万美元的 a 轮融资,该轮融资由 intel capital 与 section 32 领投,微软风险投资基金 m12 和 ntt docomo ventures 跟投。
新的投资将主要用于研发、人员招聘、基础设施的投资,以及推出开源版本的「角色引擎」(character engine)。
对此,inworld ai 的联合创始人之一,michael ermolenko 表示,「inworld ai 对开源的承诺证明了我们的信念,即合作推动创新。我们将与开源开发者社区合作,推动生成式 ai 的创新,提升整个游戏产业。」
目前,inworld ai 已经为team miaozi(网易游戏旗下)、niantic 8th wall、lg uplus(韩国第三大移动运营商)、alpine electronics、skyrim、stardew valley 以及 grand theft auto v 等提供了 ai 驱动的 npc。
更有开发商大方承认,「玩家的参与度、满意度和留存率都得到了提高。」
如今,inworld ai 已成为开发者值得信赖的资源,开发者纷纷涌向该平台。为包括元宇宙、vr/ar、游戏等在内的沉浸式现实,创建虚拟角色,激发着新形式的游戏和媒体。
03ai 革新游戏行业
一直以来,技术的局限性和可能性都决定了开发者所能创造的游戏世界。大型语言模型和生成式 ai 的出现,为游戏中的故事讲述和角色参与带来了无限的可能性。
inworld ai 的联合创始人之一,kylan gibbs 表示,「ai npc 背后的技术将成为故事讲述、创意表达和创新游戏新时代的催化剂,未来的大部分游戏将是我们尚未想象到的游戏。」「最终,ai 技术的普及,将使游戏开发过程中的普通玩家也能参与到内容创作中来,形成玩家驱动的叙事,强化游戏循环。」
风险投资公司 kleiner perkins 的首席产品官 bing gordon 也表示,「ai 将重塑游戏玩家和游戏设计师的世界,将玩家置于幻想的中心,实现真正身临其境的世界和复杂的叙事。」
这对于游戏公司和游戏开发商来说,这将是一个巨大的机遇。
从脚本对话转向玩家驱动的动态叙事,将提高游戏的沉浸感,从而提高游戏的可玩性、留存率和收入。
对此,英特尔投资公司董事总经理 srini ananth 也公开表示,「对沉浸式内容和体验的需求正在不断上升,这将带来蓬勃发展的创造者经济,并为个人开发者带来机遇。」
事实也的确如此。
财报显示,微软在游戏和 ai 领域的研发投入已连续多年保持增长,与此同时,竞争对手如索尼、任天堂等也在不断加强自身在游戏 ai 技术方面的研发。
2023 年 2 月,网易《逆水寒》手游已官宣实装国内首个「游戏 gpt」,其游戏内的智能 npc 系统完全由 ai 驱动。
完美世界也相继成立了 ai 研发中心,并已将 ai 相关技术应用于游戏中的智能 npc、场景建模、ai 绘画、ai 剧情、ai 配音等方面,《神魔大陆 2》将落地智能 npc 等。
与此同时,unity 也声称正在为游戏创作者构建 ai 游戏开发工具的生态系统,切入 ugc 游戏制作的市场。
不过,ai 大模型想要在游戏领域大规模落地,还需要解决昂贵的算力成本。可以说,在初期,这些巨额成本可能是阻碍智能 npc 普及的重要原因。
除了对游戏公司和开发商的意义外,ai 的普及还将为长期支持游戏行业的芯片公司带来机会。
多年来,功能强大的芯片与游戏之间的互动,一直是 nvidia 成功故事的一部分。
今年 5 月,英伟达更是宣布将提供定制 ai 模型代工服务——avatar cloud engine (ace)for games。开发者可以使用该服务在其软件和游戏中搭建和部署定制化的语音、对话和动画 ai 模型。英伟达称,「该服务通过 ai 驱动的自然语言交互为 npc 带来智能,从而改变游戏。」
最近,英伟达性能技术副总裁 john spitzer 还公开表示,「所有开发人员都对 ai 影响游戏开发过程的方式感兴趣。他将为 npc 的一个关键测试提供硬件支持。」
inworld 的尝试,或许也预示着游戏行业的未来。若将来围绕大语言模型搭建 ai npc 系统的技术路线能够实现并跑通,游戏中的 ai npc 真的能够与环境交互、具有记忆、不断形成社会,那么大型游戏体验,有没有可能不再是巨头的「自留地」,真正实现游戏的「创造平权」?
*头图来源:inworld ai
本文为极客公园原创文章,转载请联系极客君微信 geekparkgo