腾讯AI让游戏圈“惊悚”:一键生成3D世界、可导出3D模型,无缝对接游戏工作流
【GameLook专稿,禁止转载!】
GameLook报道/4月15日,李飞飞与她的联合创始人们共同创立的空间智能公司World Labs,开源了新一代3D高斯泼溅渲染引擎Spark 2.0。
Spark 2.0
这个工具说起来并不复杂:它让任何一部手机或者浏览器,都能流畅渲染超过一亿个高斯点构成的超大规模3D场景,而此前这件事需要专业工作站才能完成。
换句话说,Spark 2.0不是在生成3D世界,而是在解决生成之后”怎么让所有人都能看到”的问题。李飞飞在发布当天评论说,自己”为能为基于网页的3DGS渲染开源生态做贡献感到无比自豪”。
她没有着重强调技术本身,而是把重点放在开源对整个生态的意义上。这个表述耐人寻味。
因为仅仅24小时之后,腾讯混元团队在4月16日发布并开源了混元3D世界模型2.0(HY-World 2.0)。这种”集体冲刺”的节奏,已经不再让GameLook感到惊讶,但依然令人不安。
混元今日表示:“此前主流的世界模型,例如谷歌Genie 3和混元世界模型1.5,仅能生成视频文件,本次发布的混元世界模型2.0的实用性更进一步——它可以直接生成可二次编辑的3D资产文件,并且,这些生成的3D资产可以直接导入到游戏制作或者具身仿真引擎,实现真正可玩、可用。”
这些技术,不是在改进游戏里的某一块贴图,或者加速某一道渲染管线,它们在尝试直接”生成3D游戏世界、且是可编辑的”。
模型已开放申请体验,链接:https://3d.hunyuan.tencent.com/sceneTo3D
HY-World 2.0是什么,它做到了什么
要理解这件事对游戏行业意味着什么,有必要先看清楚这个模型究竟能做什么、做到了什么程度,以及还差在哪里。
HY-World 2.0的官方定位是一个多模态世界模型框架,支持文字、单张图片、多视角图片乃至视频等多种输入,并能够输出可探索的3D高斯泼溅场景(3DGS)、Mesh网格和点云等多种格式,明确兼容现有游戏工作流。
在技术架构上,它采用四阶段生成流程:首先通过HY-Pano 2.0生成全景图,再经由WorldNav进行轨迹规划,接着用WorldStereo 2.0完成世界扩展,最后通过WorldMirror 2.0进行世界合成,完成从视觉生成到3D重建的全流程闭环。
这套流程的核心突破在于它第一次把”生成”和”重建”统一在同一个框架里。
过去,生成类模型擅长从稀疏输入(一句话、一张图)想象出一个场景,但往往无法保证几何一致性;重建类模型则善于从密集多视角输入还原精确的3D结构,但不具备填充未知区域的想象力。
HY-World 2.0将两种能力融合在一个系统中,并在多个开源基准上达到了与闭源商业系统Marble相近的水准。值得一提的是,Marble正是李飞飞World Labs的主力产品,而腾讯选择用开源的方式在性能上直接与之对标,这本身就是一个信号。
技术报告中还特别介绍了WorldLens,这是一个高性能3DGS渲染平台,支持自动光照、碰撞检测以及角色接入,能够让生成的3D场景支持实时交互探索。这意味着从生成到可玩,HY-World 2.0构建了一条相对完整的技术链路。
但”相对完整”和”商用就绪”之间,仍然有一道很宽的鸿沟。
当前生成的3D场景,整体空间构成已经相当可观,但在物件层面的几何精度上仍然粗糙,更关键的是整个场景以统一的3DGS形式输出,缺乏对内部不同物件的语义分割与独立可操作性。
这意味着设计师无法从一个AI生成的森林场景中单独提取一棵树进行调整,更无法为其中一栋建筑单独添加碰撞体积或触发逻辑。游戏引擎需要的是一张可以拆解操作的对象图,而不是一张精美但无从下刀的全景合影。
3DGS在视觉效果上出色,但其底层的高斯椭球表达对精确碰撞检测并不友好,从3DGS到可用Mesh的转换,目前仍然是一个信息损耗严重的步骤。除此之外,当世界模型尝试扩展大范围场景时,边界区域容易出现”幻觉接缝”,即AI在填充未知区域时产生的视觉不一致。
在一个要求逻辑自洽的游戏关卡里,这会造成玩家明显的迷惑与出戏。
简单来说,HY-World 2.0不是一款已经可以一键出图发布的游戏关卡生成器。它是一套强大的3D世界原型生成框架,是一把已经造好的枪,但子弹和瞄准,仍然需要人来完成。
世界模型与大语言模型:一个必要的区分
不过在进一步讨论游戏行业之前,GameLook认为有必要先厘清一个常见的混淆:世界模型究竟是什么?它是GPT这类大语言模型的升级版,还是一种本质上不同的东西?
事实上,两者既有联系,又有根本性的区别,这个区别直接关系到它在游戏行业能做什么、做不到什么。
以GPT、Claude为代表的大语言模型,核心架构是Transformer,即通过海量文本数据的统计学习,捕捉词语之间的概率关联。它们对世界的”理解”,本质上是语言符号的统计关联,而非真实物理规律的建模。
大模型”知道”重力的存在,是因为它在大量文本中读到过”苹果落地””自由落体”等表述,而非真的理解物理定律。这也是为什么大模型在逻辑推理、因果推断和空间关系理解上仍然频繁出错。

而世界模型的目标是对物理世界的空间结构、运动规律和因果关系进行建模。HY-World 2.0生成的3D高斯泼溅场景,并不是在”描述”一个3D世界,而是在构建一个可探索、有内在几何一致性的空间表达,摄像机可以在其中移动,视角可以变换,几何关系在物理层面是自洽的。这种能力依赖的不仅是数据的统计分布,还有深度估计、法线预测、空间轨迹规划等对物理规律的显式建模。
从技术实现来看,HY-World 2.0确实大量使用了Transformer架构和扩散模型,但这并非”换汤不换药”,而更像是在Transformer提供的强大感知与生成能力之上,叠加了对物理空间结构的约束与理解。
技术报告中四阶段生成流程的设计思路,特别是WorldNav的障碍规避轨迹规划和WorldMirror的几何一致性重建,体现的正是”物理规律引导下的生成”逻辑。
这也是为什么当下大语言模型与世界模型的结合,被视作通向AGI的关键路径。
对于游戏行业而言,这也意味着一个真正能够生成”可玩”而非仅仅”可看”世界的系统,需要两种能力的深度整合,这是包括HY-World 2.0在内的所有当前系统都还在追赶的目标。
游戏行业的震颤:从关卡设计到存在之问
而当如今疙瘩团队在世界模型的一步步集中冲刺,也正在让AI生成3D内容对游戏行业的冲击,正在从”概念讨论”演变为”真实部署”。
今年3月在旧金山举行的2026年游戏开发者大会(GDC 2026)是一个标志性的观察窗口:与往届相比,今年大会的AI相关会议展示的已是投入使用并产生可衡量价值的制作系统,而非停留于概念阶段的技术展望。
在GDC数百场会议中,相当多都与AI相关,行业共识已从”是否使用AI”转向”如何有效使用AI”。
在这一背景下,HY-World 2.0这类世界模型对游戏开发流程最直接的价值,体现在概念验证阶段。
一个典型的独立游戏团队,从一个场景概念到可供体验的初步Demo,往往需要数周乃至数月的建模、材质制作和关卡搭建工作。而现在,只需要一段文字描述或一张参考图,就能生成一个具备空间深度、可自由探索的3D场景原型,并直接导出为游戏引擎兼容的格式。
这意味着设计师可以在一天之内迭代十个场景方案,而不再受制于美术资产生产的瓶颈。对于小型独立工作室而言,这是”以小博大”的杠杆;对于需要快速试错、验证市场反应的小游戏和Web游戏赛道,价值尤为突出。
但这并不意味着小游戏赛道就此高枕无忧。围绕3D内容生成,已经形成了一个竞争激烈的工具生态。Meshy3D、Tripo3D等专注于单体3D资产生成的平台,在物件级别的几何精度上有所侧重;HY-World 2.0则聚焦于场景级别的整体空间生成。目前,这些工具生成的内容距离直接商用仍有距离——几何不够精确、物件不可分割、细节粗糙,大量人工后处理依然不可避免。
但技术的成长速度足够快,在一两年内就从”辅助工具”演变为”核心管线组件”,是完全可以预期的事情。
对于游戏从业者而言,这场演变最深远的影响,不在于今天这些工具的能力极限在哪里,而在于它重新定义了团队的分工逻辑。
场景美术、关卡搭建工程师、3D场景建模师,工作内容的重心正在从”生产”迁移到”审核与修正”,从”从零创作”变为”对AI生成内容进行艺术指导与后处理”。这对于有经验、有审美判断力的资深从业者意味着工作方式的升级;但对于刚进入行业、靠大量重复性劳动换取学习机会的初级美术,意味着入行门槛的压缩和职业发展路径的收窄。
简单的勤奋不再足够,审美判断、设计能力、以及驾驭AI工具的工作流素养,正在成为游戏从业者新的核心竞争力。技术美术和AI工具整合工程师,则可能是近期需求增长最快的岗位,他们负责将AI生成内容接入现有游戏流程、构建AI辅助工作流,是人与机器之间不可或缺的衔接者。

甚至于在这场浪潮中,2D游戏的发展路径可能是相对不受影响的。
要知道AI图像生成在2D领域早已成熟,但2D游戏的核心竞争力往往不在资产数量,而在叙事深度、玩法设计与情感共鸣,这些维度,恰恰是当前AI最难胜任的部分。从这个意义上说,2D游戏的”人”的价值反而在相对凸显。
但这同样意味着:无法在AI工具浪潮中找到自己应用方式的2D开发者,很可能在效率竞争中落败于那些已经将AI作为基础设施的团队。
腾讯的算盘:混元战略与版号制度的夹缝
回到国内市场,就在HY-World 2.0发布前一周,摩根大通于4月8日发布了一份研究报告,提出了一个被市场普遍忽视的关键观点:AI对中国游戏行业的影响,在结构上根本不同于对欧美开放市场的影响,而关键变量正是游戏版号制度。
在欧美PC及主机市场,任何开发商均可在Steam等平台自由发布游戏,AI驱动的制作门槛降低直接导致内容供给激增、竞争加剧、利润率承压。
但在中国,每款可以合法变现的游戏均须获得版号,这一审批流程对特定时期内可进入市场的游戏数量构成硬性上限。
数据显示,2025年国产游戏版号审批总量约为1676款,同比增长约19%,但AI进一步压低制作成本后,将有更多游戏达到可提交质量,审批缺口可能进一步扩大。
摩根大通的结论是:版号制度为可合法变现的游戏数量设定了硬性上限,AI压低制作门槛所催生的大量新游戏,无法绕过这一监管瓶颈触达消费者,而已持有版号的大型运营商将不成比例地享受AI带来的效率红利。
换言之,AI时代,版号反而成了中国头部游戏公司的护城河。
腾讯显然对此心知肚明。作为全球规模最大的游戏公司,腾讯的处境比任何人都要复杂:一方面,从《王者荣耀》到《英雄联盟》,从《三角洲行动》到微信小游戏生态,是需要捍卫的存量资产;另一方面,AI对开发效率的颠覆,同时也是削减成本、缩短内容生产周期的利器。
今年GDC 2026上,腾讯一家就出席了多场会议,涵盖AI驱动的渲染、资产生成、反作弊系统及玩家体验工具,全面展示了AI与其整个生产和运营堆栈的深度集成。
在GameLook看来,混元项目正是腾讯面对AI冲击的主动出击。面向游戏行业,腾讯想要的不仅仅是AI辅助的内容工具,它想要一条从场景生成到可编辑世界资产的完整技术链路,一个能够持续用AI刷新和扩展其庞大存量游戏内容的基础设施。
腾讯已公开表示其AI模型训练完全基于经过商业验证的自有资产并采用”数据闭环”,这一策略不仅规避了监管部门可能审核的合规风险,也让其AI系统随着用户数据的积累形成自我强化的飞轮。
而开源HY-World 2.0,则是通过吸引开发者社区贡献来建立技术生态标准,在AI游戏工具链上占据先发位置,开源的代码是桌面上的牌,算力基础设施、私有数据规模与平台生态,才是袖中的底牌。
如果说同行都在担忧AI对游戏行业的冲击,腾讯的姿态则是:既然浪潮不可阻挡,那就比所有人都更积极地成为这股浪潮本身。
结语:
当我们把目光推得更远,当算力足够强大、物理规律的建模足够精确,未来的游戏世界可能不再需要”提前做好”的静态场景资产,游戏引擎可以在运行时动态生成并模拟整个世界,玩家每一次探索都是独一无二的。
当然这种愿景要求两件事:一是真正理解并模拟物理规律的世界模型,而非仅仅擅长”看起来像”的视觉生成;二是足以支撑实时大规模3D场景动态生成的算力基础设施。
目前这两件事都只存在于雏形阶段,但方向已经清晰。
HY-World 2.0的技术报告引用了威廉·布莱克的诗句:”今日之证明,昨日不过是幻想”。这句话放在游戏行业同样成立,几年前,”输入一句话生成一个可探索的3D关卡”是幻想;今天,它是开源代码。
那么,那些今天听起来像幻想的东西,又是什么?或许是没有关卡设计师的游戏公司,用世界模型生成无尽的探索空间,每一个世界都是物理自洽的、视觉精美的、叙事连贯的。或许是一款小游戏,由玩家用自然语言实时扩展自己专属的世界,而不是在开发者预制的盒子里打转。
这一天不会明天到来,但也不再遥远。
游戏行业的从业者、腾讯的员工、独立开发者,都需要在这场技术加速中完成自我定位的重新校准。
不是恐惧,而是诚实:AI正在学习构建世界,而我们正在学习与AI共同构建。谁先完成这一学习,谁就站在下一个起点上。













