来源 | 王铮(ID:)

(原文链接)

生成式AI:革命性的游戏技术

要了解生成式人工智能将如何彻底改变游戏,只需看看 的这篇帖子。在这篇文章中,他探索了使用 +(流行的 2D AI 模型)为一个假想的游戏生成魔药图像

这项工作的变革之处不仅在于它节省了时间和金钱,同时还提供了质量——从而打破了经典的”你只能拥有成本,质量和速度”三角形。

艺术家们现在可以在几个小时内创作出高质量的图像,而用手工制作则需要几周的时间。

真正具有变革性的是:

自实时 3D 以来,还没有出现过如此革命性的游戏技术。花一点时间和游戏创作者交谈,那种兴奋和惊奇的感觉是显而易见的。

那么,这项技术将走向何方?它将如何改变游戏?不过,首先,让我们回顾一下什么是生成式人工智能?

生成式AI和游戏

生成式人工智能是机器学习的一个类别,计算机可以根据用户的提示生成原创的新内容。

今天,文本和图像是这项技术最成熟的应用,但实际上,在每一个创意领域,从动画到声音效果,到音乐,甚至创建具有完全充实个性的虚拟人物,都有这项工作正在进行。

当然,AI 在游戏中并不是什么新鲜事。即使是早期的游戏,如雅达利的乒乓,也有电脑控制的对手来挑战玩家。

然而,这些虚拟的敌人并没有像我们今天所知道的那样运行人工智能。它们只是游戏设计师精心设计的脚本程序。他们模拟了一个人工智能的对手,但他们不会学习,他们只和建造他们的程序员一样好。

现在不同的是,由于更快的微处理器和云计算,可用的计算能力更大。有了这种能力,就有可能构建大型神经网络,可以在高度复杂的领域中识别模式和表示。

这篇博文有两个部分:

生成式AI如何变革游戏产业

生成式AI如何影响游戏的几个假设

首先,让我们探讨一下这篇博文其余部分背后的一些假设:

1. 一般人工智能领域的研究将继续增长,创造出更有效的技术。

请看下面这张图,它显示了 arXiv 档案中每个月美国在机器学习或人工智能领域发表的学术论文数量。

如你所见,论文数量呈指数级增长,丝毫没有放缓的迹象。这还只是包括发表的论文——很多研究甚至从来没有发表过,直接进入了开源模型或产品研发;其结果是兴趣和创新的爆发。

2. 在所有娱乐中,游戏将受到生成式人工智能的影响最大。

游戏是最复杂的娱乐形式,涉及的资产类型(2D艺术、3D艺术、音效、音乐、对话等)数量众多。游戏也是最具互动性的,非常强调实时体验。

这为新的游戏开发者创造了一个陡峭的进入壁垒,以及制作一个现代的排行榜冠军游戏的高昂成本。这也为生成式人工智能的颠覆创造了巨大的机会。

考虑像 Red Dead 2 这样的游戏,这是有史以来最昂贵的游戏之一,制作成本近 5 亿美元。

原因很容易理解——它拥有市场上任何游戏中最美丽、最完全实现的虚拟世界之一。它还花了近 8 年的时间来构建,拥有 1000 多个不可玩的角色(每个角色都有自己的个性、艺术作品和配音演员),一个近 30 平方英里大小的世界,分布在 100 个章节中的多个任务,以及由 60 多位音乐家创作的近 100 小时的音乐。关于这个游戏的一切都很大。

现在将 Red Dead 2 与 进行比较,后者不仅大,而且巨大。微软飞行模拟器使玩家能够在整个地球飞行,所有 197. 亿平方英里。

微软是如何打造出如此庞大的游戏的?通过让人工智能来做这件事。微软与 .ai 合作,训练了一个人工智能,从 2D 卫星图像中生成逼真的 3D 世界。

这是一个不使用 AI 就不可能构建的游戏示例,此外,这些模型可以随着时间的推移不断改进这一事实中受益。

例如,他们可以增强“高速公路三叶草立交桥”模型,重新运行整个建造过程,突然整个星球上的所有高速公路立交桥都得到了改善。

3. 游戏制作中涉及的每项资产都将有一个生成式 AI 模型。

到目前为止,像 或 这样的 2D 图像生成器已经抓住了对 AI 的大部分主流兴奋点,因为它们可以生成的图像具有引人注目的性质。

但是,几乎所有涉及游戏的资产都已经有了生成式 AI 模型,从 3D 模型到角色动画,再到对话和音乐。这篇博文的后半部分包括一张产业地图,重点介绍了一些专注于每种类型内容的公司。

4.内容的价格将急剧下降,在某些情况下实际上为零。

当与正在尝试将生成式 AI 集成到其生产流程中的游戏开发人员交谈时,他们最大的兴奋点是时间和成本的大幅减少。

一位开发人员告诉我们,他们为单个图像生成概念图的时间从开始到结束,已经从 3 周减少到 1 个小时:时间花费比例是 120:1。我们相信,在整个生产线上都可以实现类似的节约。

需要明确的是,艺术家没有被取代的危险。

这确实意味着艺术家不再需要自己完成所有工作:他们现在可以设定最初的创作方向,然后将大部分耗时和技术执行交给人工智能。

在这一点上,他们就像早期手绘动画中的画家,其中高技能的“墨水师”绘制动画的轮廓,然后低成本的“画家”大军会做耗时的工作,绘制动画细胞,填充线条。这是游戏创建的“自动完成”。

5.这场革命还处于起步阶段,很多做法还需要完善。

尽管最近很兴奋,但我们仍然只是站在起跑线上。当我们弄清楚如何将这项新技术用于游戏时,还有大量的工作要做,对于迅速进入这个新领域的公司来说,将产生巨大的机会。

游戏产业在生成式AI革命中有哪些颠覆性变化

鉴于这些假设,以下是对游戏行业如何转型的一些预测:

1. 学习如何有效地使用生成式人工智能将成为一项市场化的技能。

我们已经看到一些实验者比其他实验者更有效地使用生成AI。

为了充分利用这项新技术,需要使用各种工具和技术,并知道如何在它们之间切换。我们预测这将成为一种市场化的技能,将艺术家的创意愿景与程序员的技术技能相结合。

克里斯·安德森(Chris )有句名言:“每一次富足都会造成一次新的匮乏。”随着内容变得丰富,我们相信知道如何与人工智能工具进行最协作和最有效的工作的艺术家将是最短缺的。

例如,将生成式 AI 用于制作艺术品会带来特殊的挑战,包括:

2. 降低壁垒将导致更多的冒险和创造性的探索。

我们可能很快就会进入一个新的游戏开发的“黄金时代”,在这个时代,更低的进入门槛会导致更多创新和创造性游戏的爆发。

不仅仅是因为较低的生产成本导致了较低的风险,还因为这些工具释放了为更广泛的受众创造高质量内容的能力。这就引出了下一个预言……

3. 人工智能辅助“微游戏工作室”兴起。

借助 AI 工具和服务,我们将开始看到只有 1 或 2 名员工的小型“微工作室”制作更多可行的商业游戏。

小型独立游戏工作室的想法并不新鲜——热门游戏《我们中间》是由只有 5 名员工的 工作室创建的——但这些小工作室可以创造的游戏的规模和规模将会增长。这将导致……

4. 每年发布的游戏数量增加。

Unity 和 的成功表明,提供强大的创造性工具会导致更多的游戏被构建。

生成式 AI 将进一步降低门槛,创造更多的游戏。该行业已经遭受了发现挑战 – 仅去年一年就有超过 10,000 款游戏被添加到 Steam 中 – 这将给发现带来更大的压力。但是我们也将看到……

5. 创建在生成式 AI 之前不可能实现的新游戏类型。

我们将看到发明的新游戏类型,如果没有生成式 AI,这些游戏类型根本不可能实现。

我们已经讨论过微软的飞行模拟器,但会有全新的流派发明依赖于实时生成新内容的技术。

考虑 ,由 创造:这是一款 RPG 游戏,以 AI 创建的角色为特色,几乎无限的新游戏玩法。

我们还知道另一个游戏开发商正在使用人工智能让玩家创建自己的游戏内头像。以前他们有一组手绘头像图像,玩家可以混合搭配来创建他们的头像——现在他们完全抛弃了这个,只是从玩家的描述中生成头像图像。

让玩家通过 AI 生成内容比让玩家从头开始上传自己的内容更安全,因为可以训练 AI 以避免创建令人反感的内容,同时仍然给玩家更强的主人翁感。

6. 价值将归于行业特定的人工智能工具,而不仅仅是基础模型。

围绕 和 等基础模型的兴奋和热议声正在产生令人瞠目结舌的估值,但新研究的持续涌入确保了随着新技术的完善,新模型将来来去去。

考虑 3 种流行的生成式 AI 模型的网站搜索流量:Dall-E、 和 。每个新模型都会轮到聚光灯下。

另一种方法可能是构建与行业一致的工具套件,这些工具套件专注于特定行业的生成式AI需求,深入了解特定受众,并丰富地集成到现有制作生产线(例如用于游戏的Unity或虚幻引擎)中。

一个很好的例子是 ,它通过视频编辑、绿屏移除、修复和运动跟踪等人工智能辅助工具满足视频创作者的需求。

像这样的工具可以建立给定的受众并从中获利,随着时间的推移添加新的模型。

我们还没有看到像 这样的游戏套件出现,但我们知道这是一个积极开发的领域。

7. 法律挑战即将到来。

所有这些生成式AI模型的共同点是,它们都是使用大量内容数据集进行训练的,这些内容数据集通常是通过抓取互联网本身创建的。

例如, 是在超过 5 亿个图像/标题对上进行训练的,这些图像/标题对是从网络上抓取的。

目前,这些模型声称在“合理使用”版权原则下运作,但这一论点尚未在法庭上得到明确检验。很明显,法律挑战即将到来,这可能会改变生成式人工智能的格局。

大型工作室可能会通过构建基于他们拥有明确权利和所有权的内部内容的专有模型来寻求竞争优势。

例如,微软在这方面的定位尤其有利,目前拥有23家第一方工作室,在收购完成后又有7家。

8. 编程不会像艺术内容那样受到如此深刻的干扰——至少现在不会。

软件工程是游戏开发的另一个主要成本,但正如我们 a16z 团队的同事在他们最近的博客文章中分享的那样,艺术没有死,它只是机器生成的,使用AI模型生成代码需要更多的测试和验证,因此比生成创意资产的生产力提高较小。

像 这样的编码工具可能会为工程师提供适度的性能改进,但不会产生同样的影响;至少在短期如此。

游戏从业者应该立刻行动

基于这些预测,我们提供以下建议:

1. 立即开始探索生成式 AI

要弄清楚如何充分利用即将到来的生成式人工智能革命的力量,还需要一段时间。

现在立即开始的公司以后会有优势。我们知道有几家工作室正在进行内部实验项目,以探索这些技术如何影响制作。

2. 寻找产业地图机会

我们产业地图的某些细分领域已经非常拥挤,例如动画或语音与对话,但其他领域是开放的。

我们鼓励对这一领域感兴趣的企业家将精力集中在尚未开发的领域,例如“游戏跑道”。

生成式AI颠覆游戏产业的路线图

生成式AI游戏产业地图

我们创建了一个生成式 AI 游戏产业地图,以捕获我们在每个类别中确定的公司列表,在这些类别中,我们看到生成式人工智能对游戏的影响。

这篇博文对每个类别进行介绍与详细解释,并重点分析了每个类别中最令人兴奋的公司。

2D图像

从文本提示生成 2D 图像已经是生成 AI 应用最广泛的领域之一。

、 和 Dall-E 2 等工具可以从文本中生成高质量的2D图像,并且已经在游戏生命周期的多个阶段进入游戏制作。

概念艺术

生成式人工智能工具擅长“构思”或帮助非艺术家(如游戏设计师)非常快速地探索概念和想法,以生成概念艺术品,这是制作过程的关键部分。

例如,一家工作室(匿名)正在使用其中几种工具来从根本上加快他们的概念艺术过程,只需一天时间即可创建以前需要长达 3 周的图像。

首先,他们的游戏设计师使用 来探索不同的想法,并生成他们认为鼓舞人心的图像。

这些被交给专业的概念艺术家,他将它们组装在一起并在结果上绘画以创建一个单一的连贯图像 – 然后将其输入稳定扩散以创建一堆变体。

他们讨论这些变化,选择一个,手动进行一些编辑 – 然后重复该过程,直到他们对结果感到满意。

在那个阶段,然后最后一次将此图像传递回稳定扩散以“放大”它以创建最终的艺术品。

2D制作艺术

一些工作室已经在尝试使用相同的工具制作游戏内制作艺术品。例如,可以 关于使用 创建游戏内 2D 资产的精彩教程。

3D艺术品

3D 资产是所有现代游戏以及即将到来的元宇宙的基石。虚拟世界或游戏关卡本质上只是 3D 资产的集合,放置和修改以填充环境。

但是,创建 3D 资产比创建 2D 图像更复杂,并且涉及多个步骤,包括创建 3D 模型以及添加纹理和效果。对于动画角色,它还涉及创建一个内部“骨架”,然后在该骨架上创建动画。

我们看到有几家不同的初创公司在这个3D资产创建过程的每个阶段之后,包括模型创建、角色动画和关卡构建。

然而,这还不是一个解决的问题——还没有一个解决方案准备好完全集成到生产中。

3D资产

试图解决3D模型创建问题的初创公司包括 , 和 。

较大的公司也在关注这个问题,包括 的 Get3D 和 的 。 和 Get3d 专注于图像到 3D; 和 专注于文本到 3D,而 对文本到 3D 搜索以及图像到 3D 感兴趣。

3D纹理

3D 模型看起来仅与应用于网格的纹理或材质一样逼真。决定将哪种苔藓、风化的石头纹理应用于中世纪城堡模型可以完全改变场景的外观和感觉。

纹理包含有关光线如何对材质做出反应(即粗糙度、光泽度等)的元数据。允许艺术家根据文本或图像提示轻松生成纹理对于提高创作过程中的迭代速度将具有巨大的价值。

几个团队正在寻求这个机会,包括 ,Ponzu 和 。

动画

创建出色的动画是游戏创建过程中最耗时、最昂贵且最熟练的部分之一。

降低成本并创建更逼真的动画的一种方法是使用动作捕捉,其中将演员或舞者穿上动作捕捉服,并在特殊仪器的动作捕捉阶段记录他们的移动。

我们现在看到了可以直接从视频中捕获动画的生成式AI模型。这效率要高得多,因为它消除了对昂贵的动作捕捉装备的需求,也因为这意味着您可以从现有视频中捕捉动画。

这些模型的另一个令人兴奋的方面是,它们还可用于将滤镜应用于现有动画,例如使它们看起来醉了,老了,或者快乐。

追求这一领域的公司包括 ,,,Move Ai 和 Plask。

关卡设计与世界构建

游戏创作中最耗时的方面之一是构建游戏世界,生成式 AI 应该非常适合这项任务。

像 ,No Man’s Sky 和 这样的游戏已经以使用程序技术来生成它们的关卡而闻名,其中关卡是随机创建的,每次都不同,但遵循关卡设计师制定的规则。新的虚幻5游戏引擎的一大卖点是它收集了用于开放世界设计的程序工具,例如植物放置。

我们已经看到了该领域的一些举措,如 ,MLXAR 或 Meta 的 Bot,并认为生成技术在很大程度上取代程序技术只是时间问题。

该领域已经有一段时间的学术研究,包括 的生成技术或 Doom 中的关卡设计。

期待用于关卡设计的生成式AI工具的另一个令人信服的理由是能够创建不同风格的关卡和世界。

你可以想象用工具在1920年代的纽约时代生成一个世界,与反乌托邦的银翼杀手式的未来,与托尔金式的幻想世界。

以下概念是由 使用提示生成的,“游戏关卡的风格……”

音频

声音和音乐是游戏体验的重要组成部分。我们开始看到公司使用生成AI来生成音频,以补充图形方面已经发生的工作。

音效

音效是人工智能的一个有吸引力的开放领域。已经有学术论文探讨了使用人工智能在电影中生成“拟音”(例如脚步声)的想法,但游戏中的商业产品还很少。

我们认为这只是时间问题,因为游戏的交互性质使其成为生成AI的明显应用,既可以创建静态声音效果作为制作的一部分(“激光枪声音,以星球大战的风格”),也可以在运行时创建实时交互式声音效果。

考虑一些简单的事情,例如为玩家的角色生成脚步声。大多数游戏通过包含少量预先录制的脚步声来解决这个问题:在草地上行走、在砾石上行走、在草地上跑步、在砾石上跑步等。这些在运行时生成和管理起来很乏味,而且听起来重复且不切实际。

更好的方法是为拟音效果提供实时生成 AI 模型,该模型可以在飞行中生成适当的音效,每次略有不同,这些音效响应游戏中的参数,例如地面、角色重量、步态、鞋类等。

音乐

音乐一直是游戏的挑战。这很重要,因为它可以帮助设定情感基调,就像在电影或电视中一样,但由于游戏可以持续数百甚至数千小时,它很快就会变得重复或烦人。此外,由于游戏的交互性质,音乐很难在任何给定时间精确匹配屏幕上发生的事情。

二十多年来,自适应音乐一直是游戏音频中的一个话题,可以追溯到微软用于创建交互式音乐的 系统。 从未被广泛改编,主要是由于难以以格式作曲。只有少数游戏,如的No One Lives ,创造了真正的互动配乐。

现在我们看到许多公司试图创造人工智能生成的音乐,如,,, Album 和 Aiva。

虽然今天的一些工具,如 Open AI 的点唱机,是高度计算密集型的,不能实时运行,但一旦构建了初始模型,大多数工具都可以实时运行。

语音和对话

有很多公司试图为游戏中的角色创造逼真的声音。考虑到试图通过语音合成为计算机提供声音的悠久历史,这并不奇怪。公司包括 ,Coqui, ,.ai,.ai 等等。

使用生成式 AI 进行语音有很多优势,这部分解释了为什么这个空间如此拥挤。

NPC或玩家角色

许多初创公司正在考虑使用生成式人工智能来创建可以与之互动的可信角色,部分原因是这是一个在游戏之外具有广泛适用性的市场,例如虚拟助手或接待员。

创造可信角色的努力可以追溯到人工智能研究的开始。事实上,人工智能经典的“图灵测试”的定义是,人类应该无法区分与人工智能和人类的聊天对话。

在这一点上,有数百家公司在构建通用聊天机器人,其中许多由 GPT-3 等语言模型提供支持。

少数人专门尝试构建用于娱乐目的的聊天机器人,例如试图建立虚拟朋友的 和 Anima。电影《她》中探讨的与虚拟女友约会的概念可能比你想象的更接近。

我们现在看到了这些聊天机器人平台的下一次迭代,例如 .ai、 或 .ai,旨在为完全渲染的3D角色提供动力,具有情感和代理性,以及允许创作者为这些角色提供目标的工具。如果他们要适应游戏或在推进情节方面具有叙事位置,而不是纯粹的门面装饰,这一点很重要。

一体化平台

最成功的生成式人工智能工具之一是 ,因为它在一个软件包中汇集了广泛的创建者工具套件。

目前没有这样的平台为视频游戏提供服务,我们认为这是一个被忽视的机会。

我们很乐意投资一个具有以下特点的解决方案:

成为游戏创作者的 time到来

这是成为游戏创作者的 time !

部分归功于这篇博文中描述的工具,生成构建游戏所需的内容从未如此简单 – 即使您的游戏与整个星球一样恢宏!

甚至有可能有一天想象一个完整的个性化游戏,只为玩家创建,完全基于玩家想要的世界。

这在科幻小说中已经存在了很长时间——就像《安德的游戏》中的“人工智能智力游戏”,或者《星际迷航》中的全息甲板。

随着这篇博文中描述的工具快速发展,不难想象这一现实即将到来。

END

科技战略 资本品牌