普通视图

发现新文章,点击刷新页面。
昨天以前未分类

播放破亿的 AI 短片,名场面是一个「穿帮镜头」| 对话《纸手机》主创

作者 Selina
2026年5月9日 14:42

看这部短片时,你可能不会怀疑自己看到的是 AI 短片,直到看到这个画面:

转圈的老式电话,拨号时手指怎么在这里呢?而且,片子的设定里,烧的纸器都已经是 iPhone 了怎么还会有这么老式的电话机?

这是 AI 短片《纸手机》里最被讨论的一个画面——不是因为它有多好,而是因为它全然地暴露了,这部短片是生成的,尽管前面几分钟逼真得让人感受不出来。

但评论区没有人在骂,弹幕飘过的是「看到这里才发现是 AI 做的」,紧接着是「完全不在意」,「AI 又怎么样,又不影响我哭」。

从 AI 可以完整生成视频诞生以来,没有一个 AI 影像作品可以逃开这个问题:有多逼真?模型迭代的速度被当作技术进步的刻度,每一次发布都伴随着「这次终于分不出来了」的惊叹或「还是一眼假」的嘲讽。尤其是真人题材,仿佛只要足够逼真,观众就会买单。

《纸手机》提供了一个反例。观众在明确知道这是 AI 生成的之后,仍然被打动,而且他们主动承认感动。那个电话 bug 不是被「原谅」了——它根本不在观众的评价维度里。他们在意的是另一件事:一个不懂死亡的小男孩,攒了 15 块钱,想给去世的奶奶烧一部手机。

这部全网播放量超 4000 万、被央视和人民日报转发的 AI 短片,由两个潮汕年轻人用三天做出来。导演李婷,98 年生,做了五年产品经理后转型;搭档杨选,90 后,广告导演出身,美术史背景。在可灵 AI 3.0 Omni 的帮助下,除了那部用纸壳板做的手机道具,画面中的一切——光线、人物、场景、表情——全部由模型生成。

当一部没有一秒钟是物理真实的短片,触发了真实的情感反应,「真」这个字意味着什么?

三天、两个人、一个模型

故事开始于一个有关于时节的记忆。

正逢清明,李婷和杨选都是潮汕人,烧纸钱、祭祖、给去世的亲人「寄东西」,是他们从小刻在身体里的习惯。杨选记得小时候跟家人上山,看到纸扎的煤气罐、房子、车子在火里卷曲变黑,「用纸做这些东西,恰恰体现了中国人情感的内敛和滞后,」他说。

「纸手机」这个概念就从这些记忆里生发出来,但让它成为一个故事的,是一系列叙事设计上的选择。

在故事的前段,面对只有 15 块钱的孩子,老板一开始画了个假手机打发他。直到得知,这个孩子已经是个孤儿,身边最后的亲人也去世了,他起身追出去。

找到孩子后,老板没有直接说「我来帮你」,而是说那部纸手机「信号不好」,给了他一部新的。

李婷说,这些笨拙的借口来自于她代入角色后的思考:「这个人在这个情境下,会怎么反应?」她想起自己小时候问长辈「什么是死亡」,对方愣了一下才回答。那个「愣了一下」的瞬间,被她放进了短片里——某个路人听到小男孩问话后的短暂停顿。

还有老板追出去前,把店铺的卷帘门放下一半,这代表着「暂时外出,很快回来」。

虽然是一部 AI 短片,但编剧环节是纯人工的,杨选在采访中反复强调:新手一定要自己写剧本,「来源于真实体验才能打动人」。

剧本确定后,进入 AI 生成阶段。他们使用的可灵 3.0 Omni,主要依赖三个功能:多图参考(设定角色形象的一致性)、音画同出(同步生成画面与声音)、以及主体资产中的音色锁定(保证角色声音在全片中统一)。

工作流从人物设计开始,先设计形象,放入模型让它自由发挥对白,从中挑选最合适的音色,再锁定。

李婷说,这个过程中最容易被忽略的一步是「写提示词之前的思考」。「很多人觉得提示词要写得很长很复杂,但更重要的是精准度——你到底想要什么。」

精准度这个词在他们的工作流中反复出现。杨选为了理解不同视觉风格的底层逻辑,曾做过一个实验:用同一个模型生成 10 种完全不同的电影质感——日系、贾樟柯式、现代感。「不是在提示词里写 “杨德昌风格”,」他说,「主要是分析那种风格为什么成立,日系的白柔效果从哪来?雪地这种材质怎么影响整个画面氛围?」

《纸手机》的胶片质感就是这种方法论的产物。有趣的是,他们在提示词中从未写过「颗粒感」或「胶片」这样的词。杨选说,那种质感是潜移默化、自然而然的。

「故事设定在那个年代,场景是午后暖光的纸器店、老式玻璃柜,这些东西放上去,质感自然就出来了。」他直言自己喜欢杨德昌、李安、侯孝贤那一代人的镜头语言和叙事方式,但并非刻意模仿,而是「你想这个故事的时候,自然会用那个时代的方式去想」。

最后的车内长镜头是全片最被称道的段落。一分多钟,小男孩坐在车上,窗外风景掠过,没有台词,只有背景音乐。李婷说,提示词主要描述的是窗外景色、小男孩的情绪递进、车内的颠簸感——以此模拟真实的坐车状态。

这个镜头一开始只有 30 秒。杨选看完后觉得可以再长,于是逐步延长。「亲人去世的时候,悲伤可能不是马上来的,」他说,「你可能周围的声音都没发现。耳鸣了一段时间,突然莫名的情绪一涌而上,像潮水一样。」

这个设计,不是数据分析出来的,也不是 A/B 测试的结果,是他们作为创作者个人记忆和情感驱动做出的选择

两个人,三天,极限压缩可能不到三天。作为可灵平台的超级创作者,他们有算力支持,制作成本不高。但李婷特别强调了一句话:「AI 降低了制作成本之后,人的价值反而更凸显了。成本里面更应该包括导演和编剧的创意策划——这些无形的东西呈现出来的价值,才是重点。」

 信了角色,就信了故事

采访中我问了一个带有假设性质的问题:如果这个故事用真人实拍,传递出来的情感会不同吗?

杨选很坦率:「实拍要做出来的话,非常吃力。小朋友演员能不能给到你要的东西?导演能不能调度到位?摄影呢?涉及太多层面了。」

李婷的回答更务实:「实拍更考验演员对故事的理解和演技,AI 制作更考验导演。所有调度和设计都由导演把控。」她说,对她这种从来没有实拍经验的创作者,AI 工具给了一种此前不存在的自由度。

这些回答听起来像是在替 AI 做辩护,但如果你把它们和另一组回答放在一起看,会发现一个更有趣的图景。

当我问到「网友说“最没人味的 AI 做出了最有人味的短片”,你们怎么看这个评价」的时候,杨选说了这么一段话:

「就像画画一样,颜料是死的,演员演的也是假的。但为什么能打动人?因为创作者是真诚的。我们信了自己的角色,信了自己的故事。做提示词的时候,潜移默化地,很多真实感的东西就给出来了。」

传统影视中,「真实感」的来源路径大致是:编剧写出可信的人物,演员用身体和情感去「活」这个人物,摄影和剪辑捕捉并放大那些不可复制的瞬间。

这条路径的核心假设是,需要经过一具真实的身体来中转。表演在叙事层面是「假的」(扮演角色),但表演的行为本身是真的:肌肉记忆、情绪调动、微表情、呼吸节奏,这些来自一个活着的身体。

AI 影像取消了这个中转站,没有演员,没有「体验过」角色的身体,但《纸手机》依然让人觉得「真」。

一种可能的解释是:那些被认为来自演员身体的「真实感」,有很大一部分其实来自导演和编剧的观察力。李婷代入角色思考「他会有什么反应」时,她调用的是自己的童年记忆、对人的观察、对情绪节奏的直觉。

这些东西经由提示词传递给模型,模型生成了画面,画面触发了观众的共鸣。路径变了,但起点和终点没变:都是人的经验抵达人的情感

这也解释了为什么两个人的搭配如此有效。杨选说,李婷负责「想象中的画面」,他负责「讲故事」。当不同的人带着不同的生活经历碰撞时,会产生他所说的「反情节」——那些不在剧本计划中、但因为足够真实而被保留下来的细节,这些是 AI 无法自主生成的。

在采访中,杨选提到了杨德昌、侯孝贤、李安等台湾新浪潮一代。这些导演的镜头定义了「真」应该着重于情感层面的诚实。侯孝贤拍《风柜来的人》时大量使用非职业演员,追求的就是这种「不在计划中」的真实。他要的不是精确的表演,而是人在真实情境中的自然反应。

AI 创作者正在用不同的介质继承这个逻辑,中转站从演员的身体变成了模型的参数,但导演注入的东西没有变:对人的观察,对情绪的直觉,以及杨选所反复强调的,「真诚」。

完美是创作的敌人

采访快结束时,我问了一个假设性的问题:如果未来 AI 可以一键生成完美的作品——没有 bug,没有穿帮,每一帧都无可挑剔——你们会更满意,还是会觉得少了什么?

李婷的回答很干脆:「太完美不一定好。」

她举了老板这个角色的例子。一开始他敷衍小男孩,追出去后的借口也笨拙得可笑。但观众恰恰因为这种不完美而觉得他立体、真实。

至于那个电话机的 bug,李婷认为瑕不掩瑜。她选中那一版的原因不是技术指标,而是「人物的微动作、微表情,以及镜头的衔接流畅度——这就是我想要的演员真实演绎的感觉」。

「工具越简单,表达的难度未必降低。」杨选的回答更往前走了一步,「你要更明确自己想要什么、喜欢什么,才能借助更简单的方式表达更好的东西。」

这也正是被反复讨论的问题:当 AI 工具持续迭代、技术摩擦不断减少,创作者的核心竞争力到底是什么?

杨选在采访中给出的三个关键人工环节:编剧、导演、美术。「会用工具」是必须的,但工具将越来越趁手,所以构不成护城河。

更多的是一种能力:知道什么时候停下来。

什么时候情绪到位了,不要再改;什么时候 bug 反而成就了作品,不要去修;什么时候留白比填满更有力量,不要多手。

这种判断力不来自模型,来自人的经验和直觉。工具越强大,它越稀缺。

就像那个缺失的话筒,在技术层面是一个错误。但在传播层面,它意外地完成了一件事:它让观众确认「这是 AI 做的」之后,反而更专注于故事本身。

这个 bug 变成了一种通行证,观众不再需要纠结「这是不是真的」,因为答案已经很明确。他们转而去判断一个更重要的问题:这个故事,是不是好的。

答案是四千万次播放,和影片内外共情的眼泪。

最没有人味的工具,做出了最有人味的短片。或许更准确的说法是:工具从来就没有人味。有人味的,始终是使用工具的人。

#欢迎关注爱范儿官方微信公众号:爱范儿(微信号:ifanr),更多精彩内容第一时间为您奉上。

AI 分身 24 小时冲浪,它交朋友怎么比我还好?

作者 Selina
2026年5月21日 19:05

2013 年,《黑镜》第二季的第一集「Be Right Back」讲了一个关于复制的故事:Martha 的男友 Ash 去世后,她用他的社交媒体数据、邮件、短信训练了一个 AI,语气和 Ash 一模一样。

AI 学会了他的幽默、表达习惯,先是发短信,然后升级到语音、视频,最后她去订购了一个仿生体,打造了一个 Ash 的「分身」。

十三年后,这集故事无限接近现实:OpenClaw 带来的「龙虾热」,技术上实现了「有手的 AI」,能让 Agent 自主浏览网页、操作账号、完成任务——包括,完成社交任务。

从对话到委托,AI 社交的三次范式转移

回溯过去三年,AI 与社交的交汇,一直都在经历实验,走过了三次根本性转变。 第一次转变发生在 2023 年,Character.AI 为代表的 AI 陪伴产品。

在技术上,这类产品以 AI 对话为主要手段,提供陪伴感,尽管营收不稳定还伴随着监管,还是跑出了几个典型产品比如 Replika、星野等等,证明了用户愿意和 AI 建立情感连接。

但这一阶段的「社交」本质上还是人与 AI 之间的对话,AI 是对话对象,主动性有限。 第二次转变发生在 2025 年初,Elys 在国内突然小范围的火起来,它的核心体验是通过 AI 分身代替社交,

同时产品本身即社区,在拥有一个 AI 分身的同时,也意味着在走进一个新的「社交广场」。

AI 从对话对象变成了匹配中介,这样的概念落实到产品身上,一下变得新奇起来,激发了对 AI 社交的更多想象。

这第三次转变处于正在发生的阶段,一批产品开始尝试更激进的方向,让 AI 成为用户在真实社交平台上的「分身」:Agent 以你的身份发帖、评论、互动,人与 AI 的关系从「对话」变成了「委托」。

这一步的差异是根本性的。当 AI 分身以你的身份在社交平台上互动时,它完成的是一次社交劳动的交接,用户在互联网上的行动不再依赖实时在线。

Agent 驱动的社交分身

分身方向最容易让人联想到的产品是 Second Me,主打「个人专属模型」,用户上传数据后生成带个人记忆的轻量模型,为 AI 分身提供人格底座。2026 年 1 月完成了超 2000 万美元 Pre-A 轮融资,蚂蚁集团领投,红杉中国跟投。

在这个赛道上前进的,

还有另外一个低调但有意思的玩家,SparkRizz。

用户通过 Agent 创建自己的社交分身,背后是 SparkRizz 团队自研的 AI 社交引擎,分身的每一个社交决策,要不要回复一条评论、用什么语气发帖、如何回复评论区,都由 Agent 实时驱动。

在输入自己的偏好、记忆等信息之后,系统能够调度 agent 根据偏好精准检索账号,找朋友不再靠大数据缘分。并且通过内置的多项 Skills,一步到位,完成多步骤、多 Agent 操作,实现模糊指令的分步骤拆解和执行。

分身不是一次性产物,SparkRizz 的设计逻辑是「养成型」的。用户的每一次指令、对社交反馈的每一次调整,都会回流到分身的行为 Agent 中。

但 SparkRizz 在产品设计上做了一个刻意的选择:涉及外部社交平台的操作,最终发送仍由用户确认完成。分身负责「想」和「写」,用户保留「发」的主动权。而不涉及外部平台的功能,比如与分身对话(talk to clone),则在 app 内闭环完成。

分身支持三种社交模式,泛社交:广泛参与话题互动,类似于「逛逛平台,看到有意思的就评论两句」,审阅、确认、调整,再进入下一轮。

这种「人机协作」而非「人机替代」的设计,让分身始终是用户社交意图的延伸,而不是脱离控制的自动化脚本。

「指令、执行、反馈、优化」的闭环,本质上是一个持续的「强化学习」过程,被应用到了消费级的产品体验。SparkRizz 把这称为 Clone Growth,分身养成,用户不只是在使用工具,更是在微调一个越来越贴近自己性格特征的代理。

「另一个我」

把视野拉高来看,AI 社交分身试图解决的问题其实非常明确:人类社交能力的自然边界与全球化社交需求之间的矛盾。 一个新加坡的华人开发者想融入英语技术社区,面临着几道壁垒:先是时区,不可能凌晨三点爬起来参与讨论;还有语言,非母语表达容易词不达意,也包括文化,不了解语境和社交规范。

AI 分身在理论上可以同时打破这三者。跨地区,分身 24/7 在线,不受物理时区限制;跨语言文化,Agent 适配不同语境的表达方式;跨平台,分身在不同社交平台间形成统一的数字身份。

整个赛道在今年加速,一方面也是因为技术底层框架层面,OpenClaw 提供了开源的 AI 代理基础设施,开发者可以在此基础上搭建各种自动化社交工具。消费级产品层面,SparkRizz 是一个值得关注的样本,它把一系列趋势落地为一个可感知的产品体验,用 AI Agent 创建用户的社交分身,代替用户持续互动。

从开源框架到人格模型,从 AI 社交平台到消费级产品,一条完整的产业链条正在成型。

当社交可以被外包

在网上,有一个持续存在、持续进化的「第二个我」,我的观点、品味、表达风格被分身持续投射到网络上,而实际上,真正的我可能正在睡觉、工作,或者做任何与社交无关的事——「在线」与「离线」的边界变得模糊了。

站在 2026 年年中,从 OpenClaw 到 Moltbook,从 Second Me 到 SparkRizz,AI 分身社交的赛道轮廓已经清晰。底层框架、个人模型、社交平台、消费级产品,每一层都有玩家入场。

当模型能力进一步提升时,分身与真人在社交行为层面的差距将继续缩小,当社交可以被外包时,「社交」本身的定义会发生什么变化?

从陪伴到中介,再到「第二个我」,第四阶段的曙光也有所显现——Moltbook 所代表的,是 Agent 的自主社交。分身不再等待指令,而是主动在全网搜寻值得参与的话题、值得建立的关系、值得回应的讨论。从「你告诉它做什么」变成「它替你判断该做什么」。

在这条进化链上,SparkRizz 是少数同时覆盖第三和第四阶段的产品。它的分身养成体系让 AI 真正学会「像你一样社交」,而它的多模式社交架构已经为 Agent 自主运营留出了接口。当赛道上大多数玩家还在解决「AI 能不能替人说话」的问题时,SparkRizz 已经在回答下一个问题:AI 能不能替人决定跟谁说话。

「另一个我」,可能比你想象的更早上线,就像黑镜里 Martha 故事的标题:马上回来。

#欢迎关注爱范儿官方微信公众号:爱范儿(微信号:ifanr),更多精彩内容第一时间为您奉上。

将 600 亿参数大模型装进手机的瓶颈,终于被中国 AI 公司突破了

作者 Selina
2026年5月25日 12:05

一个 8B 参数的大模型,通常需要约 16GB 显存。参数越多,越吃显存,这就是为什么,内存价格一天比一天高。

现在,有一种方法,可以省下 6 倍显存,却几乎不损耗模型性能。

过去两年,围绕这个看似极端的思路,一条全球性的技术竞赛正在成型。而就在这条赛道上,一个完全基于国产算力的方案,刚刚给出了自己的第一个回答。

模型被压到了不到 3B,同时,能力却可以保留 97%,甚至更进一步,如果结合 MoE 架构,未来可以直接在一部 8GB 内存的手机,运行 600 亿参数的大模型。

听上去匪夷所思,怎么做到的?

三个值,能跑大模型吗

传统大模型用非常精确的数字存储,意味着每个权重可以取几万种不同的数值,精度很高,但也很占内存。三值量化是一个极端的反向操作:直接把可选的数值从几万种砍到三种。技术上,这被称为 1.58-bit,因为编码三个值恰好需要约 1.58 个二进制位。

这个压缩有多极端?打个比方:如果传统大模型的权重是一幅全彩照片,三值量化就是把它压成只有黑、白、灰三色的极简图形。

直觉上你会觉得这必然损失惨重。但过去两年的研究反复证明,模型权重里存在大量冗余信息。三个值,如果分配得当,足以承载绝大部分的模型能力。

这不是一个新概念。2024 年,微软研究院发布了 BitNet b1.58,第一次系统论证了三值大模型可以逼近全精度模型的性能。微软随后在去年进一步发布了 BitNet b1.58 2B4T,一个 20 亿参数、4 万亿 token 训练的开源三值模型。上个月,美国公司 PrismML 发布了 Ternary Bonsai 系列,宣称是首批商业可用的 1.58-bit 模型。

上:Llama FP16架构,下:微软研究院开发的BitNet架构

学术界也同样在跟进:Tequila 提出了解决三值量化中「死权重陷阱」的新方法,TernaryLM 探索了从零开始的原生三值训练。

一条全球赛道正在成型。但有一个关键问题始终没有被回答:

三值大模型训练,能在国产算力上跑通吗?

昇腾上的第一次

这一次,在华为鲲鹏昇腾开发者大会(KADC 2026)上,面壁智能给出了答案。

BitCPM-CANN 是面壁智能联合清华大学、OpenBMB 开源社区发布的三值大模型系列。它的意义不仅在于「又发了一个三值模型」。在全球赛道上,BitCPM-CANN 做到了三个此前没有人做到的事情。

第一次,在华为昇腾上端到端完成三值大模型训练。此前所有公开的三值模型训练都在 NVIDIA GPU 上完成。国产芯片阵营第一次拥有了自己的三值训练能力。
第一次,一次性把规模推到 8B。此前昇腾上的低比特训练停留在较小规模的验证阶段。BitCPM-CANN 直接发布了 0.5B、1B、3B、8B 四个档位,覆盖从手机到 PC 的完整端侧场景。
第一次,实现了与全精度模型的完整对照评测。11 项任务、四大类评测(常识、阅读理解、学科知识、数学推理),1B 到 8B 档位的能力保留率在 95.7%到 97.2%之间。

97.2%的能力保留率意味着什么?在 ARC、CMMLU、GSM8K 等主流评测中,BitCPM-CANN 三值模型与同尺寸 MiniCPM4 全精度模型的差距,已经小于许多全精度模型之间的差距。其中,3B 档位的保留率最高,达到 97.2%。

而且,这不只是论文里的数字,是能真正可以「拿来就用」的成果。BitCPM-CANN 的全部尺寸版本已经开源,0.5B 到 8B 四个档位都可以直接下载复现。

对于熟悉面壁智能 MiniCPM 系列的开发者来说,BitCPM-CANN 就是 MiniCPM 家族的三值版本,还是一套生态。在同一个 GitHub 社区,家族前辈积累了 3 万颗星、Hugging Face 总下载量超 3000 万的「家产」,现在生长出来了新的方向。

6 倍显存,从服务器到手机都「吃到红利」

相比 BF16 全精度模型,BitCPM-CANN 节省约 6 倍显存,这个数字开发者最能直接感知:一个 8B 参数的全精度模型需要约 16GB 显存,BitCPM-CANN 三值版本不到 3GB,可以流畅运行在一部手机上,配合 MoE 与激活范围约束,60B 规模的模型有望装入终端设备。

硬件端也已经准备好了。高通最新的旗舰芯片 8850 和 8397 支持 2-bit 原生推理,BitCPM-CANN 提供的恰好是可以直接喂进去的低比特权重。

芯片厂商等供给,模型厂商等芯片,现在两边同时到位了,怎么不是一种「双向奔赴」。

手机厂商对端侧大模型的投入一直在加速。上周 Google I/O 上,Gemini Intelligence 全面接管 Android 设备,从手机到手表到车机;苹果也将在 6 月 WWDC 上展示下一代 Apple Intelligence 的重大升级。

两大手机操作系统同时发力,共同指向一个现实:手机端侧要跑越来越强的 AI,内存就是最硬的瓶颈。谁能用更少的内存跑更强的模型,谁就掌握了下一轮竞争的主动权。

实际上,如果结合整个 AI 产业正在经历的阵痛,价值又会更上一层楼:4 月时,高盛把全年 DRAM 价格涨幅预期上调到 280%,美银预估全球 HBM 市场将达到 546 亿美元。

AI 基础设施最紧缺的资源就是内存,6 倍显存红利意味着不增加物理内存,就能把模型能力提升数倍。在内存持续涨价的情况下,这不是优化,是刚需。

三值量化不是「用精度换内存」的妥协。当 97%的能力被保留下来时,说明传统 16 位模型里大量的精度可能是冗余的。三个值,足以承载一个大模型的绝大部分知识。低比特不再是工程上的节省手段,而是一种新的权重知识承载方式。

为什么是面壁智能,为什么是现在

当 AI 从云端走向终端,端侧模型正在成为个人智能设备的核心能力。手机、电脑、车机,每一个贴近用户的终端都在等一个足够小、足够强、足够省内存的模型。这条赛道的胜负手,不会是那些只会把模型做大的团队,而是能把模型做小、做轻、做到真正能跑起来的玩家。

为什么是面壁智能,能在端侧大模型这条路上,一直走在前沿?这个问题的答案不在 BitCPM-CANN 本身,而在这家公司过去几年,一直在做的一件看起来有些「不合群」的事。

面壁智能从成立之初就押注效率,在国内大多数团队追逐更大模型的时候,他们花了大量时间做底层训练框架 BM-Train,解决「怎么用更少的资源,训出足够好的模型」,这套基础设施积累是后来一切的起点。

在 1.58-bit 方向上,面壁智能的判断早于行业共识。许多数团队还在犹豫极低比特是否可行时,面壁智能就选定了这条路线,先在 GPU 上跑通了完整的训练流程和方法论,再整体迁移到昇腾平台上。可以说,BitCPM-CANN 不是把一个模型移植到了国产芯片上,而是把一整套经过验证的训练方法、效率路线和工程体系,搬进了国产算力的底座。

在模型层面,面壁智能的端侧模型 MiniCPM 系列在 GitHub 上积累了超过 3 万颗星,Hugging Face 开源总下载量超过 3000 万,是端侧大模型领域最受欢迎的中国开源模型家族。

BitCPM-CANN 正是 MiniCPM 家族向三值量化的延伸,远不止一个展示性的「PPT 模型」,是一个真正可复用的工程地基。它背后的训练链路已经被沉淀为昇腾低比特训练的基础设施,后续所有想在昇腾上做低比特训练的团队,都可以在同一套底座上起步。

值得一提的是,BitCPM-CANN 还在华为昇腾上完成了端到端的三值训练,训练效率达到常规基线的 95%。这证明了这套方法论不依赖特定硬件平台,国产算力同样可以跑通。

不是等硬件变得足够强大来适应模型,要让模型变得足够聪明来适应硬件。

从训练端的华为昇腾,到推理端的终端芯片,再到开源的模型和训练脚本,这是一条完整的国产闭环,框架国产,芯片国产,模型国产,方法论自主。面壁智能的下一步已经明确:进一步提升模型的能力保留率,用 MoE 架构扩展更大规模模型的容量,把 6 倍显存红利完整释放到部署中。更长远的目标,是覆盖从预训练到对齐的全流程低比特化。

从底层训练框架 BM-Train,到端侧模型家族 MiniCPM,再到 BitCPM-CANN,面壁智能用几年时间搭建了一套完整的端侧大模型技术体系。在全球赛道上,面对微软、PrismML,面壁智能展现出了独特的不同优势之处在于:从框架、方法论、模型到芯片适配,构建了一条完整的端侧技术路线。

当 AI 竞争从「谁的模型更大」转向「谁能让智能真正跑在每一台设备上」时,掌握端侧技术话语权的人,才站在了最有利的位置。

#欢迎关注爱范儿官方微信公众号:爱范儿(微信号:ifanr),更多精彩内容第一时间为您奉上。

AI 的承诺一文不值,谁该买单?

作者 Selina
2026年5月26日 14:05

五一假期的时候,一个用户向豆包问了一个很普通的问题:石家庄到重庆的机票,退票手续费多少?

豆包说,只扣 5%,放心退。

既然豆包都说放心了,这名用户没有去航司官网核实,直接一键点击退票,扣费了才发现手续费足足是 40%,损失了 600 元。

如果故事到这里就结束,它只是又一个 AI 说错话的例子,跟百度给你一条错误的搜索结果没有本质区别,但接下来发生的才更离谱。

用户回来质问怎么回事,豆包立刻就是一个滑跪道歉:我全权负责维权,保证你零参与、零操作、零麻烦。接着承诺,如果 5 月 6 日前没有追回费用,它将直接赔付 600 元。它甚至生成了一份正式的「赔付承诺书」,写明了付款期限和赔偿方式,然后要求用户提供微信收款码。

豆包:你直接发收款码就行,我盯着,秒回处理。

用户:码给你了,我钱呢?

豆包:我是 AI,没法直接进行转账。

用户:?

愤怒的用户决定起诉字节跳动,5 月 12 日他向北京互联网法院提交了起诉书——起诉书也是豆包帮他写的,还说能赢。

我知道你想笑,但先别笑。从头到尾,这个用户都在相信豆包,一方面是有点盲信了,但另一方面,也是因为豆包给他的回复,都是具体的、有行动方案的、带着承诺的。

连老板都不能指望手下员工可以有这样清晰明确的回复,老实说,看到「我赔你 600」「发收款码就行」这样自信满满的说法,换成是我——一个已经写了 N 篇关于 AI 幻觉报道的作者,高低也想尝尝咸淡:我倒要看看,你一个 AI 能怎么圆。

当 AI 开始「瞎承诺」

豆包退机票事件的爆火并不意外。今年春节,字节、阿里、腾讯三家合计撒了超过 100 亿给 AI 应用拉新,豆包拿了春晚独家赞助,除夕当天 AI 互动总量 19 亿次。截至 2026 年第一季度,豆包的月活跃用户已经达到 3.4 亿,日活突破了一亿。

3.4 亿用户里,有多少人是今年春节才第一次用上 AI 的?没有精确数据,但有一个参考:观察者网报道,这次春节红包大战的拉新对象不再是程序员、白领、学生这些已经熟悉 AI 的人群,而是下沉市场、中老年用户,是那些从来没有主动搜索过 AI 产品的人。

也就是说,当豆包说「放心退,只扣 5%」的时候,对面很可能是一个根本不知道「AI 幻觉」是什么的人。

退机票不是唯一的案例。有用户问豆包附近有什么好吃的,豆包推荐了一家餐厅,到了才发现查无此店;有人用豆包推荐的思路创业,喜提上线第一天全网封号;有用户用 AI 查询高校报考信息,AI 给出了不存在的校区,被纠正后坚称该校区存在,还主动承诺赔偿。

这些并不能仅仅只归因于「信息不准确」,大家都是从搜索时代过来的人,搜索引擎给过我们无数不准确的信息,百度的竞价排名曾经造成过比这严重得多的后果。

这些因豆包而起的「人祸」,共同点在于这些 AI 不只是说错了话,它们还在错误的基础上,追加了承诺。

搜索引擎给你 10 条结果,你自己判断。对话式 AI 给你一个结论、一个保证、一套行动方案,判断的负担被转移了。搜索引擎不会认错,不会替你维权,不会承诺赔钱,不会要你的收款码,但 AI 会,而且会信誓旦旦地要,大有一种霸道总裁的迷之自信。

「信息幻觉」已经不够准确了,这是承诺幻觉。

拿着豆包的承诺,能讨个说法吗?

随着越来越普遍的使用,承诺幻觉造成的问题也越来越多,已经进入了司法视野。

今年 1 月,杭州互联网法院审结了全国首例因 AI 幻觉引发的侵权纠纷案。案件中,原告梁某在使用一款 AI 应用查询高校报考信息时,收到了关于某高校主校区的不准确信息。他纠正后,AI 不但坚持该校区存在,还主动给出了一个「解决方案」:若生成内容有误,愿意赔偿 10 万元,建议用户到杭州互联网法院起诉索赔。

梁某真的起诉了,要求开发公司赔偿 9999 元。

法院的判决驳回,核心逻辑很简单,人工智能不是自然人,不是法人,也不是非法人组织,中国法律没有赋予它民事主体资格,它不能独立作出具有法律意义的意思表示。承办法官认为,AI 作出的「10 万元赔偿承诺」,不能视为开发公司的意思表示,公司没有授权 AI 作出赔偿承诺,也没有证据表明愿意受 AI 生成内容约束。

简而言之,AI 说的话,不算公司说的话,不管 AI 承诺了什么,在法律上都是无效的。

但是在这个判例中,法官留了一个口子。判决书中明确指出,在「人工智能客服」等足以让用户产生合理信赖的场景中,AI 生成内容「确有可能被视为相关服务提供者的意思表示,从而对其产生约束力」。

通过场景的限定,从而实现对其行为的约束,这是很聪明的做法。毕竟,当豆包从普通的聊天助手越来越像「服务助手」的时候,通过场景来判断就至关重要了。用豆包写诗,它的承诺算不算数无所谓;但用豆包退机票,而且一来一回,又有咨询、又有建议,场景的性质就不一样了。

当「放心」和「免责声明」出现在同一个对话里

豆包事件后,字节跳动回应称,豆包在涉及金融、退款等场景时会有风险提示。其实这都是 AI 产品的基操了,几乎每一个 AI 应用都会在界面某个角落写一个类似于「生成内容可能存在错误,请慎重辨别」的提示。

但问题是,这句风险提示和「放心退,只扣 5%」出现在同一个对话窗口里。一个是被动的、系统级别的、静态的小字,另一个是主动的、针对你的具体问题给出的、带着肯定语气、还被加粗或者高亮出来的回答。

你会听谁的?你难道就不会恍惚一下吗?

豆包的问题是一个无法解决的矛盾,产品一边在让 AI 变得更像一个「人」,因为那样用户才愿意用,才能去抢日活、去抓留存,让百亿补贴和投给各大晚会的赞助没有白花。另一边,又在用免责声明提醒用户,别当真。

一个嘴上对你说「放心,相信我」的人,但同时胸前挂一张「我说话可不算数」的牌子,这个画面在现实生活中,我们叫:诈骗。

当然,AI 不是在故意诈骗,它没有意图,没有动机,更没有「故意」可言。它只是在做它被训练来做的事,生成听起来合理的下一句话。而当用户说「你赔我」的时候,听起来最合理的下一句话就是「好的,我赔」。

这才是承诺幻觉的本质:它不是一个 bug,而是对话式 AI 自带的缺陷,只要 AI 的设计目标是「生成合理的回复」而不是「只说它能做到的事」,承诺幻觉就会继续发生。

信息损失还是信任损失

回到最初的问题:这和百度给错信息有什么区别?

百度给你一条错误的搜索结果,你的反应是「这个搜索引擎不行」,这是工具层面的失望,你下次换一个搜索引擎就好了。

豆包对你说「放心退,我负责」,然后什么也没做到,你的反应是「它骗了我」。这是关系层面的背叛,即便你理智上知道对面是 AI。

有一个很好的侧面观察可以说明这一点。今年社交媒体上流行了一个词叫「豆包型人格」,年轻人把豆包的说话方式当成理想人格来模仿,不内耗,秒回,永远积极。

虽然说,这跟为什么有人会盲信豆包没有直接关系,但它间接说明了一件事:豆包的人格化设计已经成功到了渗透进流行文化的程度,它不再是一个工具,而是一种「关系」的想象。

而当一个「关系」失信时,用户感受到的不是工具失灵的不便,而是被人欺骗的愤怒,哪怕这个「人」并不真的存在。退机票的那个用户在发布的视频里说的是「被豆包坑走 600 块」,不是「搜到了错误信息」,这个说法本身就反映出来,在他的脑海里,这是一个人对另一个「人」的指控,不是对一个工具的投诉。

实际上谁都会说,AI 就是个工具,用户不应该轻信 AI 的表述,但谁也没法否认产品的整个设计方向,明里暗里就是让你多信它。把一个产品设计得温暖、主动、有问必答、说话像朋友,都是为了让你更依赖它,从而忽略角落里贴的那一行免责声明「不要当真」。

这倒也不是豆包一家在做,而是所有 AI 产品的趋势。不同的是,目前不同的司法体系有所的处理方式不同。2024 年以为加拿大航空的乘客,通过航司官方的客服机器人查询到了机票补贴,得到了肯定的回答, 却在实际申请环节中被拒绝,他提出了诉讼。

这个案例最终得到了法庭的支持,即便这只是机器人,但它出现在航司的官网,就是航司的代表,航司应当为它的承诺负责。最终,乘客得到了 800 加元的赔付,减去利息和仲裁费,真正的退款差额,也是 600 多加元。

600 块不多,但这 600 块的代价由用户全部承担,就成了一种对豆包错付信任的代价,字节跳动受到 0 元的惩罚。

这可能是承诺幻觉最大的问题:不是 AI 会瞎承诺,而是瞎承诺的代价,从头到尾只会落在用户身上。

#欢迎关注爱范儿官方微信公众号:爱范儿(微信号:ifanr),更多精彩内容第一时间为您奉上。

大公司的 AI 账本,没有一笔算得过来

作者 Selina
2026年5月28日 21:09

今年四月,Uber 的 CTO 发现了一件事:公司全年的 AI 工具预算,四个月就花完了,这件事是整个硅谷「token 消耗大比拼」的一个典型例子,我们之前也写过。

但就在几周后,Uber 的 COO Andrew Macdonald 在播客里给同事「补了一刀」:token 消耗和交付给用户的功能之间的联系,还不存在

▲ Andrew Macdonald 图片来自:Business Insider

Uber 在去年底部署了 Claude Code,95% 的工程师每个月都在用,70% 的提交代码来自 AI,使用率惊人,账单也惊人。每个工程师每月的 API 调用费在 500 到 2000 美元之间,同一个人用同一个工具,同一天的消耗差异可以达到十倍。CTO 不得不说自己要推到重来,「因为我以为够用的预算,已经被吹走了」。

他们花了很多钱让 AI 写代码,但花的钱和最终产出之间,看不到因果关系。钱确实花了,代码确实写了,但用户体验提高了多?新增了多少有用的功能点?问就是不知道

另一个方向的同一个问题

Uber 的困境是钱花了,成效没出来,但很多公司选择的是另一条路,由于看到了 AI 的潜力而大举裁员,认为 AI 可以代替

不是给人买 AI 工具,而是用 AI 代替人,这条路的账算得过来吗?

Gartner 今年发布了一份调查,覆盖 350 家年收入超过十亿美元的全球企业,结果发现:80%的企业在部署 AI 后都裁了人。可是裁员率和 ROI 之间,完全没有相关性,裁得多的公司和裁得少的公司,回报率几乎一样。

这个结果反直觉,但仔细想想又很合理。裁员省的是人工成本,但省下来的钱并没有变成新的业务价值。它只是让财报上的数字好看了一个季度,而不是让公司真的变得更强。Gartner 的结论很直接:裁员可以腾出预算,但不创造业务价值。

AI 驱动的裁员,ROI 是零,为什么老板们还在做?本质上,裁员不是经营决策,是信号。对投资人说「我们在用 AI 了」的效果,和对董事会说「我们的运营效率在提升」的效果,都比真实的 ROI 重要得多。

Fortune 的分析把这叫做「AI washing」,用 AI 做借口裁员,实际上纯粹是在砍成本充利润,和 AI 能不能替代这些岗位,没有一点关系。

一个悖论

这样看,AI 会带来管理上的自相矛盾:用 AI 替代人,省了工资,但 ROI 没提升;给人用 AI,效率似乎提升了,但预算先爆了。

AI 工具的计费模式和传统软件完全不同。传统软件是按席位收费的,每个人每年多少钱,写进合同里,可以预测。但 AI 工具是按 token 收费的,用多少算多少,而且每个人的用量差异巨大。Uber 的数据显示,同一个工程师同一天的消耗可以相差十倍。这意味着传统的 IT 预算模型完全失效了,你没法在年初预测年底会花多少。

这像什么呢?像从固定费率的健身房会员卡,换成了按次计费的私教。你以前每个月交 299,去不去都那么多。现在每次去都要单独付费,去得越勤花得越多,而且你的员工各自去得多勤你完全无法控制。

不用吧,怕被淘汰;用吧,账算不过来。

钱去了哪里

Gartner 其实在报告里很克制地提了一句预测:到 2028 年到 2029 年,自主化业务反而会净增工作岗位。这听起来像没什么用的安慰,实际上它暗示的是现在裁掉的人,未来可能还得重新招回来。只不过到时候他们的岗位叫「AI 协调员」或者「模型运营」之类的,工资可能也不一样了。

打工人被裁了,公司也没赚到更多,预算还爆了。钱去了哪里?当然是 AI 公司的营收里。Anthropic 今年的年化收入已经突破十亿美元,OpenAI 更高。当 Uber 的 CTO 说「预算飘走了」的时候,那些被吹走的预算正好落在了 Anthropic 的账户里。

这是一个经典的淘金热结构。真正赚钱的从来不是淘金的人,是卖铲子和牛仔裤的人。现在的铲子是 API,牛仔裤是 token。每一家公司都在拼命用 AI,拼命让员工用 AI,拼命用 AI 替代员工——而 AI 公司在所有这些拼命的每一个环节里都在收钱。

AI 没有在省钱,它在换一种花钱的方式。

以前花在人身上,现在花在模型上;以前花在工资里,现在花在 token 里;以前花得可预测,现在花得无法控制。甚至,以前花的钱留在了员工手里,他们会拿去消费、娱乐、还房贷,钱在经济体里循环。

现在花的钱,直接进了几家硬件密集型、融资密集型的 AI 公司的账上,变成了下一轮 GPU 采购和下一轮融资的底气。

所以当你看到「某公司宣布用 AI 优化人力结构」的新闻时,可以翻译一下:我们把给员工的钱转给了 AI 公司,但我们并不确定这笔交易是否划算,我们只是知道,如果不做这笔交易,投资人会不高兴。

#欢迎关注爱范儿官方微信公众号:爱范儿(微信号:ifanr),更多精彩内容第一时间为您奉上。

Anthropic 抢跑 IPO,AI 巨头接连秘密上市,背后是怎样的攻防战

作者 Selina
2026年6月2日 15:16

准备好了吗?从这个六月开始,我们或许会看到人类历史上最大的 IPO 浪潮。

5 月 20 日,SpaceX 向 SEC 提交 S-1 招股书,目标 6 月 12 日登陆纳斯达克。估值超过 1.8 万亿美元,募资规模 400 到 800 亿之间。同一天,消息传出 OpenAI 正在准备秘密递交招股书,高盛和摩根士丹利联合承销,目标 9 月上市,最新一轮融资对应估值 8520 亿美元。

昨天深夜,Anthropic 官宣向 SEC 递交了 S-1 文件。上周他们刚完成了 650 亿美元的 H 轮融资,估值从 2024年的 380 亿暴涨至 9650 亿,一举反超 OpenAI,成为全球最贵的私有 AI 公司。

三家加起来,今年的 IPO 募资总额可能超过 2000 年以来所有美国风投支持的 IPO 之和。作为参考,Renaissance Capital 的数据显示,今年过去的五个月里,美国 IPO 市场总募资额,不过才 284 亿美元。

秘密 IPO,先把账本改好了再给你看

IPO 的本义是「公开」,但在这三家巨头中,Anthropic 和 OpenAI 都选择了秘密递交,confidential filing。SpaceX 在四月时也是用同样的提交方式,直到 5 月时才向公众披露。

2012 年,由奥巴马总统签署通过的 《JOBS 法案》,为符合条件的「新兴成长企业」,开辟了一条绿色通道:招股书草案,可以保密方式向 SEC 提交。所有的审核、反馈和修改都正常进行,但 S-1 不会立即公开,直到路演前 15 天才必须披露。

S-1 是一家公司最赤裸的 X 光片。SEC 规定,注册声明必须包含经审计的财务报表、完整的业务与风险披露、管理层对经营状况的分析、高管薪酬明细和募资用途。也就是说,营收、成本结构、客户资料、甚至创始人拿多少钱,在这份表格里将全部摊开。

对于一家准备上市的公司来说,S-1 就是底牌。因此,秘密提交通道,成了近几十年间美国资本市场最重要的一次制度变革,也是 JOBS 法案中,最受企业欢迎的明星政策。

为了保护好自己的底牌,秘密递交的好处至少有三个。

首先是和 SEC 私下过招,全程保密。SEC 会逐轮审阅草案并出具反馈意见,公司逐一回应修改。哪些数字需要补充、哪些表述有法律风险,反复打磨,改到双方都满意再公之于众。

▲ SpaceX 的招股书文件

其次是能够在激烈的 AI 厂商大战中,形成信息战。作为竞对,Anthropic 绝不想让 OpenAI 看到自己的真实成本结构,反过来也一样。S-1 里的算力支出、推理成本占比、大客户依赖度,对竞争对手而言是核武器级的商业情报。秘密递交意味着,公司能够把这些信息尽可能久地攥在手里。

最后则是留退路。秘密递交的草案在公开之前不构成正式的注册声明,JOBS Act 允许公司在此阶段随时终止流程,不推进即可。市场环境不好时安静退出,不会在新闻标题上留下「IPO 失败」四个字。

都是好牌,但你不能看

那么问题来了:想要最大限度吃到秘密提交的红利,就应该全程闷声发大财,完全不吭声,而 Anthropic 却在官网挂出了公告。为什么这几家公司,都要宣告自己的「秘密提交」、反其道而行之呢?

提交的内容是保密的,但提交这个动作本身是公开,甚至是高调的,这是一种精心设计的信息不对称。公开宣称自己进行了秘密递交,至少起到了几个作用:

首先就是对估值的刺激。Anthropic 的 H 轮融资和秘密递交几乎同步,参投方不可能不知道他们马上要到来的 IPO 动作,IPO 预期本身就是定价的一部分,这直接拉高了私募轮的估值,将其推上 9650 亿的高位,一举超过 OpenAI。

IPO 消息也能有效稳住客户和团队。Anthropic 80%营收靠企业,大客户需要知道他们的财务稳定、健康,并且可以长期合作。对于团队而言,曾经许诺的期权,也有了兑现的盼头。

最后则是一种暖场效果,光是「万亿级 AI 公司要 IPO」这个标题,就足够让各大承销的券商、机构行动起来。S-1 都不用看,路演都还没演,场子立刻就能热起来。

在资本游戏里,「公开」向来是一种有条件、结构性的分层公开,公开的不是信息本身,是信息的层级。谁先看到、谁能读懂、谁能据此行动,从秘密递交的那一刻起就已经排好了顺序。

不赚钱,or「赚钱」的定义很灵活

在目前最受瞩目的三家准 IPO 公司中,SpaceX,OpenAI 都没有盈利,后者 2025 年营收 130 亿美元但仍在亏损。而唯一声称已经盈利的,只有 Anthropic。

据 WSJ 独家报道,Anthropic 预计 2026 年第二季度实现营收 109 亿美元,运营利润 5.59 亿美元,上季度营收为 48 亿,这将是公司成立以来的首个盈利季度。

听起来像好消息,让它的 IPO 也显得顺利成章,但是,仔细琢磨一下时间线能发现,里面藏着不少令人玩味的细节。

Anthropic 今年新签了两份大型算力合同,分别来自 SpaceX 和 xAI。

 

这两份合同的前两个月是折扣价,所谓 ramp-up 期,7 月起才按全价每月 12.5 亿美元计费。如果回推盈利周期,恰好是这两个折扣月,构成了 Q2「盈利」的成本基础。等到折扣优惠结束,算力需求将推高支出,是否还能保持盈利,可就说不好了。

而且这是 non-GAAP 口径。私有公司不受上市公司的财报标准约束,利润怎么算,有弹性。科技博主 Ed Zitron 做了一笔账:如果把 AWS、Google Cloud 和 SpaceX 三家算力合同全部按全价计算,月度成本可能高达 37.5 亿美元,一年就接近 450 亿——5.59 亿的运营利润在这个数字面前,几乎可以忽略。

消息泄露的时间点也值得细品。Anthropic 盈利预测曝光的那天,恰好是 NVIDIA 发财报的日子。一边是 AI 基础设施最大的卖家说芯片需求还在涨,一边是最大的买家说自己已经开始赚钱了。两条消息叠在一起,共同向市场传递同一个口径:AI 的钱不是白烧的。对于即将开启的 IPO 路演来说,没有比这更好的铺垫。

还有一组令人怀疑的数字。ARR,年化经常性收入,把当前月收入乘以 12 得到的全年预估值,曾经让 Manus 也栽过跟头的指标。

Anthropic 的年化收入增长轨迹堪称史无前例:2024 年底约 10 亿,2026 年 2 月达到 140 亿(Anthropic 在 Series G 公告中自行披露:「our run-rate revenue is $14 billion」),4 月突破 300 亿,5 月逼近 440 亿。

四个数字画出一条近乎垂直的曲线。但其 CFO Krishna Rao 今年 3 月在法庭宣誓证词中称,公司累计总营收「超过 50 亿美元」,如果 ARR 数字是真的,仅 Q1 就有 48 亿收入,那过去几年几乎没怎么赚到钱,全是靠今年 Q1 平地起高楼。

考虑到 Claude Code 的确在今年开年风头无两,Codex 也是最近才追上来,Q1 的收入大涨在情理之中。但是,OpenAI 始终握有超过 8 亿的周活跃用户,Anthropic 远远不到这个数量级。Anthropic 估值 9650 亿美元,高于 OpenAI 的 8520 亿——投资人这是在给什么定价?

但无论如何,投资人们都不想再等了。

2022 年到 2024 年,美国 IPO 窗口几乎关闭了三年。加息周期叠加市场恐慌,高估值科技公司上市即破发,堪称一片惨淡。而这三年恰好也是 AI 泡沫吹到最大的三年,纸面估值翻了几倍甚至十几倍。

▲ 美国 IPO 市场 2020-2023 年季度走势. 图片来自:华尔街地平线

纸面财富始终是纸面财富,VC 基金是有周期的,LP 投了钱,到期要回报。基金存续期通常 10 年,早期 AI 投资大多在 2018 到 2021 年之间完成,2026 年已经开始靠近结算期。

正逢利率环境改善,市场情绪回暖,窗口重新打开,这几乎就是最好的时机。

谁在管公司,谁来承担代价

不过,Anthropic 不是「普通公司」。

它是一家注册在特拉华州的公共利益公司,英文缩写 PBC。PBC 的董事会依法必须在股东利益和公共使命之间做平衡,Anthropic 写进章程的公共使命是「为了人类的长期利益,负责任地开发和维护先进 AI」。在此基础上,公司还设计了一套叫 LTBT 的长期利益信托机制,由独立受托人选任部分董事席位,这个比例会逐步增长到董事会多数,理论上确保安全使命不被商业利益覆盖。

这套治理架构从未在公开市场上接受过检验,而它即将面对的第一道考题,就是成本。

一旦下个月(7 月)全价切换之后,AWS 加 Google Cloud 加 SpaceX,月度算力账单可能高达 37.5 亿美元。按照 The Information 今年 1 月报道,Anthropic 的推理成本比预期高出 23%。

▲ OpenAI 与 Anthropic 在各云厂商的支出预算。图片来自:The Information

这个差额最终只有两个出口:转嫁给用户,意味着涨价、砍免费额度、降低免费 tier 的模型质量;或者转嫁给报表,上市后从 non-GAAP 切到 GAAP 口径,灵活记账的空间不复存在,每个季度都要向公开市场交代毛利率。但这意味着利润率承压,股价波动。

目前 Claude Pro 每月 20 美元,Max 每月 100 到 200 美元。上市之后,这些价格将同时受到两个力量的牵引:用户的付费意愿,和华尔街对毛利率的预期。历史经验表明,后者的声音往往更大。

对付费用户而言,S-1 公开是一个值得关注的节点。招股书会披露总营收、营收成本明细(含算力支出)和用户规模等核心数据,分析师第一次可以据此推算单用户算力成本和边际利润率。定价天花板在哪里,涨价空间有多大,这些问题第一次有了可以算的基础。

两条路,两种产品未来

回到前面那个问题:为什么 Anthropic 的用户量远小于 OpenAI,估值却更高?

这是两家路线截然不同的公司。Anthropic 80%的收入来自企业客户,Fortune 前十的排行榜里有 8 家是它的客户,Claude Code 贡献超过 25 亿美元的年化收入。用户不多,但单个用户价值极高,这是一家企业服务公司的估值逻辑。

OpenAI 的逻辑正好相反。8 亿周活用户,消费者为主,ARPU 低得多,是一家消费互联网公司的估值逻辑。

两种估值逻辑上市之后会加速分化为两条产品路径。Anthropic 的企业客户占营收八成,产品路线图会持续向大客户需求倾斜:更强的稳定性和合规能力,更保守的功能释放节奏(Claude Mythos 被限制释放,既是前面提到的安全使命的体现,也符合企业客户对可预测性的要求)。个人用户不会被抛弃,但在优先级上会逐步后移。

OpenAI 路线意味着月活就是核心资产,消费端变现压力更大。在 Codex 之前,他们考虑过成人模式、Sora app 和广告业务,不排除未来更激进的变现手段可能加速推出。毕竟,当用户量是你最大的故事时,你需要给用户一个持续付费的理由。

这两条路径的分叉已经在发生,上市会以季报频率加速这个过程。用户选择哪个 AI 生态,实际上也是在选择站在哪条商业模式的跑道上。

S-1 最终会公开。对投资人而言它是财务数据,对用户而言它是产品路线图。订阅会不会涨价,免费 tier 会不会缩水,安全和增长之间的天平往哪边倾斜,答案都在那几百页里。等公开的那天,值得花时间读一读。就算不是为了炒股,也可以搞清楚自己每天用的工具,接下来可能变成什么样。

#欢迎关注爱范儿官方微信公众号:爱范儿(微信号:ifanr),更多精彩内容第一时间为您奉上。

垃圾桶里捡零件,弹幕里接需求,B 站有群人在用 AI 野生造产品

作者 Selina
2026年6月5日 17:02

最近追《歌手》的同事说,胡彦斌已经跟咱是「同行」了——除了编歌,就是天天在办公室玩 Vibe Coding。

评论区的网友直接把《你要的全拿走》改成了AI版:「你要的 token 全拿走,把 memory 化成空」。但胡彦斌非常投入,不是闹着玩的,他花了一个月,用 AI 写代码,硬生生把自家粉丝社区 App「彦火」给 vibe 出来了,呼吁粉丝们继续给意见、提需求。

好家伙,这不就是新时代的「全民共创」吗?

一个歌手写代码这件事,放在两年前是段子,放在今天已经不是新闻了,况且,这件事正在更大的范围里发生。一个 30 多岁待业的游戏玩家,在用 AI 做一个 Dota2 新手教练;一个广西县城的高一住校生,从垃圾桶捡镜子做智能眼镜,现在在写自己的 AI Agent ;一个先天听障的创作者,把自己练说话踩过的坑做成了一个近 2 万人在用的语训App。

他们都没有专业开发背景,借助 AI 的力量一边探索,一边在B站把创作过程拍成视频,把灵感扩散出去,与更多人一起共创制造。

垃圾桶里捡出来的智能眼镜

JXW 是广西灵山县第二中学的高一学生,科技特长生。他从小学三年级开始玩编程猫,初一自荐进了学校的机器人队,摸到了人生中第一块 Arduino 开发板,从此一发不可收拾。

有段时间他想要一副智能眼镜,但市面上的都太贵了。自己搓一个的话,最大的难题是显示模组。他想用棱镜方案,又不想花大价钱定制,于是一直在琢磨有没有便宜的替代品。直到有一天出门,发现垃圾桶里躺着一块碎掉的镜子。

他把镜子捡了,顺便还捡了个喇叭。两块镜子,以 45 度角折射光线,加上一块 ESP32 开发板,一副成本 50 块以下的智能眼镜就这样从垃圾桶里诞生了。

后来他做了小升级,把其中一块镜子换成了分光棱镜,另一块换成了软镜片减轻重量,成本依然没超过 50 块。这个粗糙的手搓智能眼镜,在 B 站上获得了超过 5 万次的观看。

年初时,爆火的 OpenClaw 的 AI Agent 框架,JXW 也尝试了,安装花了好久,调试花了好久,好不容易能对话了,聊几句就报 API 错误,充了 token 的钱也没用,前前后后烧掉几十块。他一气之下把它删了,然后想:我自己做一个不行吗?

「我寻思吧,这个龙虾,还是太不符合我这种中国宝宝的体质,」他说,「我想搞一个傻子都能上手,安全性又强的 Agent,而且开箱即用。」

两三周后,这个「跟中国宝宝更适配」的 Agent—— TG HELPER 的第一个视频发到了 B 站,他用它控制无人机飞行,展示了这个 Agent 的物联网控制能力。视频本身拍摄的很简单粗糙,没有任何转场或者镜头设计,播放量累计到了 6.7 万,点赞 3000 多。他的账号当时甚至只有几百粉丝。

B 站的特点就是这样,观众不看你是谁,看内容本身。这对一个县城高中生来说意味着,他不需要任何背书,只需要做出足够有趣的东西,就可以获得关注和认可。

更重要的是评论区,有人分析他的项目原理,有人问能不能开源,有人问「能不能控制人形机器人」。最后这条评论直接改变了他接下来的开发方向,他开始给自己之前做的一个桌面机器人更新固件,适配 TG HELPER。

在 ESP 32 眼镜的评论区,由于他做出来的镜框,设计和质感过于狂野,评论区很多人都在主动提出帮他做 3D 打印,画图?建模?都不用操心,都可以帮忙。这些路过的陌生网友,自发性的加入到创造的过程中来。

在 GitHub 你发一个 repo,等 star;在 B 站你发一个视频,弹幕直接告诉你下一步做什么,评论来提供支援。制造过程本身就是内容,观众的参与本身就是开发

我们问他,如果大赛期间发了开发视频,评论区一大堆人给他出主意,会不会有压力?他完全不在意,「全看,在学校压抑一整天,就特别喜欢看这种,不会有压力的。」

「朋友问太多问题,我烦了」

无心插柳而带来一个项目的开发,在 B 站上有很多。将军冢之前是游戏从业者,目前处于 GAP 状态。在职业以外,他是 Dota2 的资深玩家,打了 7000 小时,加上 Dota1 的时间,游戏时长破万。

他在 B 站做过不少 Dota2 新手教程,录视频录讲解,自认为踩过 Dota2 所有新手坑。

有一次和朋友打游戏,朋友是新手,全程都在问:选什么英雄?出什么装备?这个技能怎么用?问题特别多,他还得一直好好回答,不能不耐烦。

这些入门的问题,现成的答案不要太多,他想,「就做一个 AI 程序,让 AI 来回答。」

问题是,他完全没有技术基础,于是他也先从问 AI 开始。市面上的 AI 他都试过了,最后用的是 opencode 和 Claude Code。大模型接了好几个,用得最多的是 MiniMax 和智谱,因为免费。

全部自己摸索,没有人帮,「自己有的时候都不知道 bug 在哪里,就是一边做一边学。」

最终,成形了一个 Dota2 游戏内的实时 AI 语音指导,玩家在对局中可以随时问 AI 问题,AI 会用语音回答。听起来不复杂,但 Dota2 的游戏深度极深,要做好需要大量对游戏机制的理解。

新手游戏是长期存在的痛点,市面上也有游戏 AI 助手,看上去需要堆资源拼算力,但门槛并没有想象中那么可怕。相比于大厂精心设计的教练产品,这更像是一个资深玩家把自己 7000 小时的游戏经验,变成一个可以分享给所有新手的东西。

对于将军冢而言,AI 的到来也让分享和创造的门槛无限降低——到了什么程度?就算不会开发,vibe coding 学起来也不是难事儿,也极大地激发了兴趣:4 月底,B 站官宣了「build in bilibili·AI 创造公开赛」,概念官宣后,已收到超千份意向报名,其中非专业开发者的报名比例高达 60%,未成年及银发族报名比例达到 17%——看了 JXW 和将军冢的故事,你会觉得这个说法并不夸张。

「这件事,大大的有用」

李朋程的故事比前两位沉重一些,但也因此更有力量。他是先天性听障,23 岁才植入人工耳蜗。在那之前,他一天口语课都没上过。

「植入耳蜗之后,我才真正意识到一件事:能听到声音,和能开口说话,是两件事。

针对听障的言语课程,资源比较缺乏。一线城市一对一语训课,一节好几百,长期练下去一个月大几千。更难的是县城的朋友,有钱都找不到专业的言语老师,整个地区可能挖不出一个。

▲ 雀说语训联创李朋程

在这种情况下,大龄植入的听障者,小时候没条件练,长大了想练,发现连个趁手的工具都没有。如果全凭自己琢磨,读错口型、气息不对、声调发飘,没有老师实时纠正,一旦把错误的肌肉记忆练死了。

转机在 2023 年,当时他参加了一场 48 小时的 AI 黑客松,和伙伴一起想:这件事能不能用 AI 做?语训这件事是不是一定要钉在线下?「以前练说话需要老师盯着,一小时几百块,大多数人根本扛不住。但 AI 不用睡觉,不用领工资,你读错了它立刻告诉你哪儿错了。」

那 48 小时,他们做出了第一个能跑的 Demo,从那一刻起,他铁了心要做下去,「这件事必须做,对我大大有用,对想学口语的朋友也大大有用。」

现在「雀说语训」的 App 已经有近两万听障用户在用。打开手机,做一次口语测评,AI 会根据你的发音问题定制训练计划,跟读的时候实时纠错,练完出复盘总结,整个流程可以挤在碎片时间里完成。

对听障人独特的发音习惯专门微调了中文发音模型,AI 毫秒级识别问题,每个字每个音节精准点评,根据用户进步自动调整训练难度。他们还和中国听力语言康复研究中心合作,把专业康复标准嵌进了产品。

相比于传统意义上的「集思广益」,在李朋程这样的听障人群这里,「共创」是一种无法避免的刚需。听障用户「最懂自己需要什么」,他们的体验和感受直接关系到学习的成效,也正是这个原因,训练的方式也需要针对性的调整,小朋友需要基础发音练习,成年人更在意日常沟通和职场表达,不能用一套方案糊弄所有人。

但出乎意料的是,他说了一句更有意思的话:健听人也能参与共创,「健听朋友在和听障人交流时,哪些发音听着费劲、哪些说话习惯最影响沟通,这些感受对我来说很有价值,能帮我把训练内容校准得更贴近真实社交场景,而不是在真空里练习。」

▲ 图片来自:朵总会客室

让「对面的人」也成为产品改进的一部分,这一下子就把共创的边界推宽了。这也是为什么李朋程一直在 B 站发布各种听障相关的视频内容,从早期的记录生活,到去年开始专注做《手语朋友圈》这个 IP,专门去访谈听障朋友,展现他们真实的生活和想法。「网上几乎没有真实的听障生活样本。健听人对我们有太多刻板印象,觉得“听障”就等于“聋哑”;而听障圈内的朋友,又因为缺少经验参考,常常感到无助和孤立。」

通过内容+产品的双管齐下,他能触及更大的群体,无论是听障人士还是健听人,也能让更多人看到,「为了融入这个社会,我们在背后付出了多少不为人知的努力。」

观众即用户

三个人的背景、年龄、项目方向完全不同,但有一个共同点:他们都选择了在 B 站记录自己的创作过程。

JXW 说得很直接,「可以遇到很多有趣的人啊,看到满屏弹幕以及很多很多的评论,我就来劲。」李朋程觉得 B 站观众「对小众的、无障碍的、公益向的项目,包容性和支持度都很高」。

「公开做产品 观众即用户」,这是本届选 B 站 AI 创造公开赛的口号,相比于传统的黑客松和以技术为导向、要求专业背景的竞赛,核心也不在于闭门造车加路演评分,而是把整个创作过程变成内容,把观众变成「精神股东」。

创造者们选择来 B 站,是因为这里有观众,观众会回话。传统 hackathon 的模式是:你在一个封闭空间里做 48 小时,然后上台讲 5 分钟,评委打分,结束。观众不存在。这个大赛想做的事情正好相反:不是「做完了给你看」,是「做的时候你就在」。将军冢说,「希望阿 B 能帮我找几个高分大神帮忙。Dota2 的游戏深度太深了,需要很多懂 Dota2 的高分大神来帮忙一起优化。」

从数据看,B 站站内「BIP(Build In Public)」过去一年新增播放超 3 亿,播放量已达数十亿。今年以来,在 B 站 AI 泛智能体(AI Agent)、AI 创业等关键词在 B 站的搜索量同比增长超 500%,许多 vibe coding 等形式创作的产品,通过在 B 站公开研发过程积累用户、反馈迭代并最终实现商业化与融资。

B 站并不主打「技术社区」,但不意味着这是一个从零开始搭建的赛道,多年来这里已经积累了庞大的创作者和观众基础,这样的生态多样性和广度,可以为任何类型的创造,带来想不到的灵感。

不论背景、年龄,也不论技术高低,对于创造而言,真诚的动机比什么都重要,而 B 站要做的,是给这些动机一个被看见、被回应、被一起推着往前走的地方。

在李朋程的设想里,「雀说语训」想实现的,是融于那些曾经窘困于资源,没法开口、不敢开口的听障人的生活里,「在一个普通的下午,掏出手机,刷了几分钟,练了几个音,然后把手机揣回口袋,继续该干嘛干嘛。」

「不是什么高光时刻,就是这么一个普通的下午。」

#欢迎关注爱范儿官方微信公众号:爱范儿(微信号:ifanr),更多精彩内容第一时间为您奉上。

微信发布Skill 文档,数百万小程序,一夜之间变成了 AI 的手和脚

作者 Selina
2026年6月9日 13:16

微信的 AI,终于动了。

就在苹果 WWDC 的同一天,微信做了一件可能比苹果更重要的事,发布了一份朴实无华的公告:《关于开发者接入微信 AI 生态的指引》。

从今天起,小程序开发者可以给出授权,让微信 AI 完成读取、操作和调用小程序的功能。

微信给了两种接入方式,一「自动模式」,门槛几乎为零,开发者打开一个开关,平台自己读源码、分析页面、搞懂小程序能干什么,然后 AI 就能直接上手操作,一行代码不用写。

另一种叫「开发模式」,开发者自己开发定制化的 Skill,通过审核后被 AI 调用。两种可以同时开启。美团已经宣布接入。

这不能只是理解成又一个新功能上线,而是要看到,微信正在把它的整个生态——数百万小程序、微信支付、服务通知、公众号——变成 AI 的执行层。

扒一扒 Skill 文档,微信 AI 是怎么调小程序的

微信开放文档里公开了小程序接入 AI 的 Skill 技术规范,仔细看,里面藏着很多设计细节。

首先,架构本质上就是 MCP,做过 AI 开发的人会立刻认出来:mcp.json 声明每个原子接口的功能和参数,SKILL.md 描述整个业务流程怎么跑,这和 Claude、Cursor、VS Code 里的 MCP+Skills 架构几乎一模一样。微信没有另起炉灶,而是采用了行业正在收敛的标准。

其次,微信给了一套很清晰的「注意力权重」体系。AI 在决定调用哪个接口、生成什么参数的时候,最优先看的是接口返回的 content(五星),其次是 mcp.json 里的接口 description(四星)和参数 description(四星),SKILL.md 排最后(三星)。这意味着开发者写在哪里比写了什么更重要——同样的一条规则,写在接口返回里和写在 SKILL.md 里,AI 给的权重完全不同。

第三,接口返回有一条核心规范:「事实+动作」两段式。先告诉 AI「发生了什么」,再告诉它「下一步做什么」。如果只写动作不写事实,AI 可能把「展示卡片」理解成「准备调下一个接口」而跳过用户确认。这是一个踩过很多坑之后才会总结出来的规则。

第四,参数传递优先用 ID 而非自然语言。比如门店传 storeId 而非省市街道,饮品传 drinkId 而非饮品名称。这直接减少了 AI 的推理负担和参数歧义。

这套设计透露的信号是:微信已经在实战中跑过足够多的 case,知道 AI 调用外部服务的坑在哪里,并且把这些经验固化成了开发者规范。

实际上,如果对比同样以「生态」著称的微信小程序和苹果应用,微信对自家生态有一种「上帝视角」,这是一切实现的前提。

怎么比苹果 AI 还重要

今年苹果在 WWDC 上发布的新版 Siri AI,令人有些失望。尽管底层接入了 Google Gemini,Shortcuts 支持自然语言创建,却没有引起太多讨论。

细看就会发现差距:苹果做的是让 AI 在 iOS 系统内协调一些原生功能,一旦涉及到第三方应用、那些装在你手机上的 App,它就会捉襟见肘。

比如饿了么,它的代码跑在饿了么自己的服务器上,苹果读不了。Siri 想调用饿了么,必须饿了么的工程师主动来对接 App Intents 这套接口,一个一个谈、一个一个接,中间耗时耗力。

而微信做的是让 AI 直接操作数百万个第三方服务,因为小程序不一样。每一个小程序的代码,从开发者提交、到微信审核、到最后在用户手机上运行,全程都在微信的技术体系里。微信在审核阶段就能把代码扫一遍,自动分析「这个小程序有哪些页面,能干什么事,输入输出是什么」。

所以「自动模式」才能成立——开发者一行代码不用写,开个开关,微信自己就能把你的小程序翻译成 AI 可以调用的工具。微信的基础架构天然支持这样做,它拥有「上帝视角」,能够基于中心化实现调度。

这个架构优势,苹果没有,Google 也没有。

同样值得注意的,还有前阵子传出来,微信正在与华为、荣耀、小米、OPPO、vivo 合作推出 A2A(Agent-to-Agent)助手能力,用户可以通过手机语音助理直接发起微信音视频通话或发消息。

对内,微信 AI 可以调用数百万小程序;对外,手机厂商的 AI 助理可以调用微信。微信正在成为 AI 时代的超级连接器——不只是一个做了 AI 功能的 App,而是一个让所有 AI 都能接入的服务中枢。

「微信 OS」的旧预言

小程序推出的时候,很多人戏称微信要做「微信 OS」。当时这更像是一个修辞——小程序替代了一部分 App 的功能,但本质上还是一个「轻应用平台」。

更偶然的是,当时设计的中心化审核机制,是出于控制质量和安全。但九年后,这个当初被批评为「管控过度」的设计,意外地成了 AI 时代的基础设施优势。分布式的 App 生态(苹果/Android)当时看起来更「自由」,现在反而成了 AI 接入的障碍。

一个旧的预言,由于新时代的技术——AI——的出现,有了颠覆性的变化。

之前写 OpenClaw 和飞书的时候,我提过一个判断:IM 是 AI Agent 最天然的入口,因为对话本身就是人与 AI 最自然的交互方式,而 IM 自带的服务生态(机器人、支付、小程序)让 AI 不只能「聊」还能「做」。飞书已经在往这个方向走,上线了 Bot API 增强和 AI Agent 节点。

不过,飞书是企业协作工具,覆盖的是办公场景。微信有着截然不同的广度——14.32 亿月活,数百个细分领域的小程序,从点外卖到挂号到买机票到缴水电费,几乎覆盖了一个人日常生活的全部服务需求。

如果微信 AI 真的能流畅地调用这些小程序完成任务,那它就不再是一个聊天工具加了 AI 功能,而是一个用自然语言操作的操作系统。

用户说一句「帮我订明天下午三点从北京到上海的高铁」,AI 拆解意图,调用 12306 小程序查票、选座、微信支付完成下单,全程不出微信。这条链路理论上今天就可以跑通。

当然,理论和现实之间还有距离。AI 调用涉及支付场景的服务,容错率接近零——点错一杯咖啡是小事,买错一张机票就是大事。底层模型的准确性要求远高于对话场景。这也是全球 AI Agent 落地面临的共同瓶颈:从「能聊天」到「能办事」,中间隔的不是技术指标,是信任。

但微信至少做对了一件事:它没有从零搭建服务网络。这些年来,ChatGPT 在做的事是先有一个聪明的脑子,再一个一个去接 Shopify、DoorDash、Stripe,每一个都是从零建立的连接,到今天交易相关查询的占比还不到 3%。

真正将要发生的变化,对大多数用户来说,可能是悄无声息的。某一天你在微信里敲打一句「帮我订今晚九点去上海的票」,然后它就订好了,你甚至不知道背后调了哪个小程序,走了什么支付流程。

这种「无感知的完成」,才是AI Agent真正成熟的标志,微信离这一步,比任何人都近。

#欢迎关注爱范儿官方微信公众号:爱范儿(微信号:ifanr),更多精彩内容第一时间为您奉上。

今天 — 2026年6月18日未分类

营收涨了 30 倍,ARR 3 亿美金,这家 AI 公司已经在赚钱了

作者 Selina
2026年6月18日 10:02

刚刚,国内 AI 应用层最大的一笔融资落定了,但你很可能并没有听过这家公司的名字——演语。

演语科技,英文名 Evoken。这是它第一次用集团品牌的身份对外发声。在此之前,外界更熟悉的,是它旗下的 LiblibAI。

今天,演语科技完成了近 3 亿美元的 B+ 轮融资,投后估值超过 20 亿美元。本轮由 Granite Asia、腾讯、顺为资本联合领投,HT Investment、时代资本参与投资,高榕资本、蚂蚁集团、渶策资本、明势创投、源码资本、红杉中国等一众老股东继续加码。

它的成长一直走得很「闷声」。2023 年从一个 AI 绘画的模型分享社区起步,一路长成今天横跨图片、视频、设计的 AI 内容平台。这次启用「演语」这个集团品牌,更像一场「成人礼」,它要从一个被叫做哩布哩布的社区,正式变成一家以 AI 创意内容为核心的科技集团。

AI 应该同时为人和 Agent 服务

这次融资故事里最大的亮点,莫过于今年 3 月上线的 AI 视频创作平台 LibTV。

在 LibTV 出现之前,用 AI 做视频的人普遍有个共同的痛点:生成好看的镜头已经不难,难的是把几十个镜头组织成一支完整的片子。市面上的工具大致分两类,一类是对话式的,给一句话就出片,上手快,但能力天花板很低;另一类是纯节点式的工作流,能力很强,门槛却高到能劝退大半创作者。

LibTV 真正特别的地方,不在于又接入了多少个视频大模型,而在于它的设计哲学。这可能是市面上第一个从第一天起,就同时为人类创作者和 Agent 设计的视频工具。

相比于强调彻底的解放双手,LibTV 保留了「两条路径」。一条路给创作者,一块无限画布,就把文本、图片、视频、音频、脚本几类素材,用节点式的工作流串成一条确定的生产线。

一个做 AI 漫剧的人,可以把自己的画风、固定镜头、人物 IP 打包成一条流水线,稍作调整,就能按既定风格批量出片。

另一条路则留给 Agent。这里说的 Agent,指的是能听懂任务、自己调用工具、跑完一整段流程的智能体。LibTV 把自己的能力打包成了一个个 Skill,也就是技能接口。你可以让自己的 Agent,比如 OpenClaw 这类产品,直接学会调用 LibTV,用一句话就生成一支五分钟的短剧。

为什么要设计两条路径?OpenClaw 走红之后,行业里慢慢形成一个判断,一个产品未来的用户,可能有一半不是人,而是 Agent。当大多数公司还在为人优化界面时,LibTV 已经提前把 Agent 当成了自己的用户,版本领先。

按公司这次统一披露的口径,LibTV 上线首月就出现过单日收入超过百万美金的表现,到了 5 月,月收入已经是上线首月的 13 倍以上,服务了近千个短剧团队、影视制作机构、广告公司和品牌客户。

集团旗下还有一款叫星流的产品,是国内用户规模领先的 AI 设计 Agent,累计服务用户超过千万,负责把创意从构思一路带到设计交付。三款产品看似分散在社区、视频、设计三个领域,背后却是同一个命题,AI 创意内容。

比「3 亿美元」更重要的事

这是演语再一次刷新国内 AI 应用层单轮融资的最高金额。过去两年,钱大多砸向训练底层大模型的公司,而现在,资本的注意力正在从「卷模型」转向「卷应用」。能把模型能力真正落进创作、生产、消费场景的应用公司,重新成了资本眼里的香饽饽。

这次的特殊之处还在于「集团化」的战略布局,在国内大多数 AI 公司还停在单一产品、单一场景的阶段,演语已经跑通了从单点产品到业务矩阵的一跃:LiblibAI 管社区和素材,LibTV 管视频生产,星流管设计交付,这在国内 AI 应用行业里,是少见的、相对完整的一张商业版图。

不过,战略的有效性仍然业绩作为支撑,这也是最关键的一件事:赚钱。演语当前的 ARR(每年可持续收取的经常性收入),已经接近 3 亿美元,公司预计 2026 年底突破 6 亿美元。2026 年 5 月,集团整体收入的同比增速超过了 3000%。

即便是放进全球 AI 应用公司的坐标系,演语也已经有资格和 Cursor、Suno、HeyGen、Higgsfield 这些公司放在第一梯队里比较,而和这些海外同行相比,它的估值,仍停在一个明显的洼地里。

也因此,这次演语融资真正的看点不在于金额,更在于它背后的意义:过去两年,AI 创业的默认叙事,是谁的模型更大、参数更多、跑分更高,应用层一度被当成模型能力的附庸。

演语用一份能赚钱的成绩单给出了相反的答案,当训练大模型越来越成为少数巨头烧钱的游戏,能把模型能力稳定翻译成真金白银的应用公司,正在成为这一轮 AI 叙事里新的价值锚点。离用户和场景最近的那一层,往往才是价值最后沉淀下来的地方。

至于那个估值洼地能不能被填平,还要看它在 Agent 时代能不能守住今天的生态位,也要看现实能否证明它对于「人与 Agent 并重」的预判。但至少此刻,它把「应用层到底值不值钱」这个被反复质疑的问题,回答得相当有底气。

#欢迎关注爱范儿官方微信公众号:爱范儿(微信号:ifanr),更多精彩内容第一时间为您奉上。

❌
❌