微软演示AI生成的《雷神之锤II》

微软演示AI生成的《雷神之锤II》

微软发布了一款具有突破性但颇具争议的技术演示:由其Muse AI模型驱动的经典第一人称射击游戏《雷神之锤II》的AI生成版本。该实验允许玩家通过网络浏览器与实时AI渲染的游戏环境进行互动,这引发了关于生成式AI在游戏领域潜力与局限性的讨论。

AI生成的《雷神之锤II》演示

Quake's AI tech demo is the new worst way to play id's ...

由AI生成的《雷神之锤II》演示,可通过网络浏览器访问,展示了微软的WHAMM(世界与人类动作MaskGIT模型)技术的能力1。这种创新方法能够实时生成游戏的每一帧画面,并通过键盘或控制器操作响应用户输入。虽然该演示允许玩家移动、射击、跳跃并探索游戏环境的模拟版本,但它也存在一些显著的限制:

  • 帧率徘徊在十几帧的低至中等范围
  • 由于上下文限制,离开屏幕超过0.9秒的物体会被遗忘
  • 敌方角色看起来扭曲或模糊
  • 可玩区域仅限于关卡的一个片段

尽管存在这些限制,该演示在AI生成的游戏体验方面代表了一个重要的飞跃,展示了在保留经典游戏和探索游戏开发新创意方向方面的潜力。

WHAMM模型技术特点

WHAMM模型是微软Muse AI家族的一部分,代表了游戏生成式人工智能的重大进步。其关键技术特点包括:

  • 实时生成超过每秒十帧,相较于早期版本如WHAM-1.6B有了显著提升
  • 仅使用单个《雷神之锤II》关卡一周的游戏数据进行高效训练,而之前的模型需要七年的数据
  • 输出分辨率提高到640 × 360像素,是早期实验的两倍
  • 使用约5亿参数的“骨干”Transformer进行初始图像预测
  • 使用2.5亿参数的较小“优化”模块迭代改进输出
  • 利用MaskGIT策略,允许在多次迭代中并行生成所有图像标记,大幅提升生成速度

这种架构使WHAMM能够完全在AI模型中生成并运行《雷神之锤II》,实时生成可玩的版本,同时所需训练数据比其前代大幅减少。

批评和用户反馈

You can now play a real-time AI-rendered Quake II in your ...

AI生成的《雷神之锤II》演示引发了社交媒体用户和游戏爱好者的强烈负面反应。许多批评者指出了该演示的缺陷,包括:

  • 模糊且扭曲的敌人外观
  • 不可靠的健康指示器
  • 玩家操作与系统响应之间明显的输入延迟
  • 与原版《雷神之锤II》相比割裂的体验

尽管一些人认可该演示背后的技术成就,但总体反响大多是批评性的。The Game Awards制作人Geoff Keighley在X(前身为Twitter)上分享了该演示,收到了大量负面评论。这一体验被形容为“以最糟糕的方式像一场发烧梦”,突显了生成式AI在复制受欢迎的游戏体验方面的当前局限性。

游戏的更广泛影响

AI生成的《雷神之锤II》演示代表了探索AI在游戏保存和开发潜力方面的重要一步。微软将此项目视为更广泛努力的一部分,旨在利用AI保存经典游戏、开发新游戏以及自动化游戏创作的某些方面。Muse AI无需依赖原始引擎即可模拟游戏的能力,为保存游戏历史和探索新的创意途径打开了可能性。然而,演示的褒贬不一以及技术局限性表明,在这种技术能够与传统游戏开发方法竞争或为玩家提供令人满意的游戏体验之前,还需要进行显著的改进。

原创文章,作者:猫爪社区,如若转载,请注明出处:https://www.meowzo.com/microsoft-demos-ai-generated-quake-2/

(0)
上一篇 2025年4月14日 上午8:18
下一篇 2025年4月14日 上午8:28

相关推荐

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注