普通视图

发现新文章,点击刷新页面。
昨天以前爱范儿

杀死 ChatGPT 聊天框的,是「鼠标」

作者 莫崇宇
2026年5月14日 16:47

1968 年的旧金山,计算机科学家道格拉斯·恩格尔巴特在一场后来被称为「演示之母(The Mother of All Demos)」的发布会上,拿出一个带着两个金属轮子的木制小盒子,向世界介绍了一个新物种:鼠标。

那是人类第一次公开用手上的鼠标,去牵引屏幕里的数字光标。此后的几十年里,这根小箭头几乎无处不在。它穿过办公软件、游戏界面、浏览器窗口和无数张电子表格,成为人类进入数字世界时最熟悉、也最沉默的向导。

然而在这半个多世纪里,计算机的算力、形态和应用场景几乎改头换面,鼠标光标的本质几乎没有变过:它知道自己停在屏幕上的哪个坐标,知道 X 和 Y,却不知道你指向的是一行代码、一张发票,还是一张风景照。

面对眼前不断闪烁的像素,它能做的事情依旧相当朴素:点击,拖拽,等待下一次点击。

今天,Google 要用 Gemini 重新发明鼠标光标。

在刚刚落幕的 Android Show 上,Google 几乎把围绕 Android、AI 与硬件生态的规划摊在了台面上。其中,一项名为「魔法指针(Magic Pointer)」的新功能,给古老的鼠标光标装上了「眼睛」和「大脑」。

Google 的意图不言而喻,未来的 AI 交互不该依赖冗长的提示词,只需像在现实生活中一样,指着屏幕说一句:「把这个,移到那里。」那么问题来了,当鼠标光标终于学会「看懂」屏幕,它究竟会把人机交互带向哪里?

这根睁开眼睛的 AI 箭头,到底能干嘛?

要理解这项技术的意义,必须先看清当下 AI 工具最别扭的一面:交互成本。

过去几年,大语言模型的能力一路狂飙,但使用门槛居高不下。为了让 AI 准确理解意图,用户被迫学习一套复杂的「提示词工程」:设定角色、补充背景、限定输出格式。为了一个简单的需求,写出几百字小作文更是家常便饭。

不仅如此,典型的 AI 工具通常运行在独立的网页或应用窗口中,频繁打断用户的工作流。比如当你在阅读一份 50 页的 PDF 时想让 AI 总结一张图表,通常需要经历:截图 -> 保存 -> 打开浏览器 -> 进入 AI 网页 -> 上传图片 -> 输入提示词。

Google 将这种繁琐的跨应用操作称为「AI 绕路(AI detours)」。这种跳转不仅效率低下,也容易打断人们工作时的注意力集中状态,即所谓的「心流」。

为此,Google 提出的第一个交互原则,就是「保持心流」。在他们展示的实验性 AI 光标原型中,AI 的能力不再局限于某个特定的 App 或网页,而是附着在鼠标光标上,随时待命。

触发方式也尽量克制:无需记忆任何快捷键,只需轻轻「晃一下」鼠标,AI 界面便会基于当前悬停的内容自动浮现,给出极具语境的操作建议。选中图,它会询问是否「对比」;悬停于段落之上,它会主动提供润色方案。

整个过程没有任何需要学习的指令,完全跟着直觉走。来看几个极其直观的场景:

第一,看图说话的终极形态。

当你在浏览一张卡通的城市风景照时,传统鼠标只能点击图片放大。但现在,你只需把 AI 光标悬停在照片背景里的一栋建筑上,然后对着麦克风说一句:「给我移动图片的元素到这。」

不需要解释「这儿」是谁,也不需要描述建筑外观。AI 光标会直接理解你所指向的像素,识别出对应元素,并成功移动。

过去,鼠标只能告诉系统「我点了哪里」;现在,它开始告诉系统「我指的是什么」。

第二,少写提示词,多用自然指代。

当你在网页上看到一份极其复杂的烘焙菜谱,你不需要复制粘贴,也不需要写「请将以下菜谱里的所有食材分量乘以二」这种书面语。你只需要用光标高亮那段文字,然后随口说一句:「把『这些』的分量翻倍。」

唰的一下,AI 直接在原地给你改写了一份新菜谱。

第三,将像素转化为可交互实体。

在计算机眼里,屏幕只是几百万个发光的像素点。但 AI 光标能将死板的像素(Pixels)转化为活的实体(Entities)。

比如,你正在看一段旅行 Vlog,视频里闪过一家看起来很棒的餐厅。你按下暂停,把光标指过去,原本死气沉沉的视频画面瞬间变成了一个真实的、可交互的地点,旁边直接弹出了这家餐厅的订座链接。

再比如,你随手拍了一张写满鬼画符的便利贴,鼠标一指,墨迹直接变成了一个可以打勾的 To-Do List。发现了吗? 以前,是你去找 AI;现在,是 AI 顺着你的鼠标,乖乖来到了你的指尖。

杀死 AI 提示词,回归人类直觉

仔细想想,人类最强大的沟通工具其实是代词。

当你和同事坐在屏幕前修改设计稿时,你绝对不会字正腔圆地说:「请将屏幕左上角坐标 (X:120, Y:350) 处的蓝色矩形向右移动 50 个像素。」你只会指着屏幕说:

「把这个,往右挪一点,弄淡一点。」

「那个餐厅看起来不错,怎么去?」

「这段代码里的这个报错是什么意思?」

在日常生活中,我们极度依赖「这个」和「那个」。手势配合着极简的口语,才是人类最高效的沟通密码。究其原因,我们身处同一个物理空间,共享着同一套视觉上下文。

Google 敏锐地抓住了这一点,并将其提炼成了一条产品原则:拥抱「这」与「那」的力量(Embrace the power of This and That)。

与其强迫人类去学习复杂的提示词框架,不如反其道而行之,把表达意图的脏活累活从我们身上剥离出去,让机器去适应人类最慵懒、最本能的「指手画脚」。

好消息是,这套交互方式已经开始落地。Chrome 浏览器里的 Gemini 从今天起率先支持;Google 全新推出的笔记本电脑产品线 Googlebook,则将「Magic Pointer」直接内置进了操作系统层面,覆盖所有应用。

Googlebook 的野心不止于鼠标。Google 将这个产品线定义为「Android 手机的完美伴侣」。

类似苹果的 iPhone 镜像,用户可将 Android 应用无缝投射到 Googlebook 桌面,以原生比例运行,并在文件管理器中跨设备自由穿梭,彻底打破手机、平板与笔记本的生态壁垒。此外,Gemini 还能依你所需,在桌面生成专属动态 Widget(比如旅客的实时航班卡片)。

在硬件设计上,所有 Googlebook 机型都会在机身上集成一条「Glowbar」发光条,让你一眼就能分辨出它与传统 Chromebook 或 Windows 笔记本的区别。

首批 Googlebook 将由宏碁(Acer)、华硕(Asus)、戴尔(Dell)、惠普(HP)和联想(Lenovo)制造,预计今年秋天上市。

有意思的是,三星缺席了这份名单。近期的消息显示,三星可能正在筹备一款搭载 Google 新系统的 Galaxy 笔记本,其下一场 Unpacked 发布会据传定在 7 月 22 日。

至于底层的驱动核心,Google 虽未指名道姓,但通篇强化的「为智能而生的现代操作系统」以及 Android 与 ChromeOS 的深度融合,种种迹象均指向了传闻已久的 「Aluminum」系统。

这意味着,AI 开始成了操作系统级别的基础设施。而当 AI 真正化身为你的鼠标光标,它便拥有了介入万物的权限——所见即所得,所指即所控。

AI 人机交互,迎来十字路口

回望 1968 年,那个惊艳世界的初代鼠标,功能简单得令人发指:追踪位置。 这五十多年来,鼠标加了滚轮、加了侧键、甚至加了风扇和配重块,但它的灵魂依然是一张白纸:它准确地标记着坐标,却永远无法理解坐标背后的意义。

Google 的 AI 光标完成了交互史上罕见的进化:它不仅知道你在哪,更知道那是什么。

过去一年,无数拿了融资的创业公司挤破头,试图造出下一个「AI 时代超级入口」。大家疯狂地卷对话框的拟真度、卷 Agent 的复杂工作流。但 Google 这次用行动给全行业结结实实地上了一课:

最好的科技是什么?是润物细无声。聊天框(Chatbox)从来都不是 AI 的最终形态,它只是一种过渡期的妥协。最好的 AI,应该退居幕后,成为一种附着在你日常动作上的基础设施,而不仅仅是某个需要单独打开的应用。

从黑底白字的命令行(CLI),到图形界面的鼠标点击(GUI),再到移动时代的触屏滑动(NUI)。过去几年,大语言模型让我们短暂地倒退回了打字交流的时代,让无数人患上了 Prompt 焦虑症。

但今天过后,我们知道了,那不过是黎明前的一段弯路。真正好用的 AI,终究要学会像人类一样思考:看懂你的每一个眼神,听懂你的每一句「把这个,放到那儿去」。

58 年前,当道格拉斯·恩格尔巴特握住那个简陋的木制鼠标时,他的终极梦想是「增强人类的智慧」。

58 年后,当 AI 附身于这个古老的指针,机器终于开始真正「看懂」这个世界。属于提示词工程师的时代终将落幕,人机交互的终极闭环,也将在一句句含糊不清的「这个、那个」中,向前迈出历史性的一大步。

附体验地址:
https://aistudio.google.com/apps/bundled/ai-pointer-create?showPreview=true&showAssistant=true&fullscreenApplet=true

https://aistudio.google.com/apps/bundled/ai-pointer-find?showPreview=true&showAssistant=true&fullscreenApplet=true

作者:莫崇宇

#欢迎关注爱范儿官方微信公众号:爱范儿(微信号:ifanr),更多精彩内容第一时间为您奉上。

好消息:微信有 AI 了!坏消息:是元宝…

作者 苏伟鸿
2026年5月15日 10:34

相信这样的场景很多人都不会陌生:

在微信上聊工作、讨论旅行计划,甚至只是和朋友闲聊,聊着聊着突然想让 AI 帮忙总结重点、做个规划,结果却只能一段一段复制聊天记录,再手动粘贴进 AI 对话框里。

再比如,中午小憩了一会,醒过来发现群里发了几百条消息,想吃瓜又得一条一条翻……

如果能一键将聊天记录转发 AI,岂不美哉?

这样的功能终于来了,但遗憾不是在微信里:

现在,把微信和元宝更新到最新版本之后,聊天记录转发可以选择直接发给元宝来总结。

虽然同属腾讯生态,但微信和元宝之间始终有种微妙的距离感——终于,这次两者之间的联动,又紧密了一点。

爱范儿也第一时间体验了这个功能,看看它究竟好不好用。

产品很美好,效果很一般

要想把微信聊天记录转发给元宝,方法很简单,首先选中想要转发的聊天记录,选择「转发到其他应用」,就能直接发给元宝,可以补充一些提示词。

整个过程有点像把讨论、聊天过程中零散的内容,让 AI 帮忙进行整理,因此这个功能首先最合适的场景,就是各种工作群的讨论和安排信息。

直接处理聊天记录有一个好处,元宝可以将讨论精准和发言者匹配,很适合用来处理会议纪要和工作安排。

旅游计划同样也是一个高频场景,因为行程一般都是靠你一言我一句的对话讨论出来,这时候就可以直接交给元宝处理,还能让它帮忙推荐旅游地点。

还有一个有点邪修的用法:平时工作忙没时间看群,又担心错过什么热点或者话题,可以直接选中所有聊天记录,让元宝帮你看群帮你总结。

又或者讨论了很久都不知道聚餐吃什么,也可以把讨论的过程选中,让元宝帮忙推荐。

尝试了很多场景,大部分情况下都达到了预期,但总体来说,还有一些体验细节不够完善。

目前元宝最擅长处理的聊天记录以文字为主,而如果聊天记录中包含文件,特别是涉及多个文件,效果会比较随缘,很多时候会无法读取文件。

即使能成功读取,也不一定能按照提示词进行任务处理:整理发票有时候都未必能填对,让他根据文件做个思维导图,也经常失败。

要知道,整理聊天里的发票真的是很主流的场景啊!

我能很明显感觉到一个落差:明明将聊天记录发送给 AI 是一个很有价值的场景,但元宝交付的结果,总让我略感失望,并且忍不住想,如果能转发给豆包或者 ChatGPT,会不会更好?

更深层的问题,是这个聊天记录转发的交互总给我一种「绕远路」的感觉。

在此之前,元宝已经作为联系人存在于微信之中,处理聊天记录这件事,却依旧需要「跳转」这一整套外挂式流程, 过程中需要多次点击。

或许是因为微信严格的隐私保护规则,元宝只能以「临时聊天」的形式处理聊天记录,不会留下历史记录,关闭后无法找回。

对于微信来说,这样的功能似乎「可有可无」。

如果微信想要 AI 化,他们或许会有更好的实现方式,例如直接做一个「AI 群友」,at 它就能回答问题或者处理聊天记录;以及一个常驻对话列表的 Agent,可以直接对话,可以直接接收聊天记录。

但这件事没那么容易,原因已经是「老生常谈」:微信需要简约,需要克制,因为每一点小变化都会影响到十亿级用户。

在元宝这个功能上线的同一天,腾讯发布了今年第一季度财报,在股东大会上马化腾表示,在微信里做 Agent 需要「更长远的考虑,大家要有点耐心,这个不是匆忙就能出来的。」

腾讯的 AI 王牌是微信

马化腾还提到腾讯的 AI 战略:

原来一年前我们以为上了船,后来发现那个船漏水了,现在感觉站上去了,还坐不下去,还是希望船速能快一点。

从财报来看,AI 已经成为了腾讯的重要投入,一季度研发投入达 225.4 亿元,同比 19%;资本开支 319.4 亿元,主要用于算力、存储等云端基础设施的扩张。

今天中午,有自媒体传出「疑似腾讯 AI 一号位即将离职」的消息,下午就被腾讯公司火速辟谣,本身也向外界释放出一个信号:腾讯 AI,不容有失。

根据 AICPB 最新榜单,在国产 AI 应用排名中,腾讯元宝排名第十,访问量为 1773 万,远逊于豆包(1.63 亿)和千问(4424 万)。

在 AI 领域中,腾讯和苹果有着相似的处境:产品入口和用户规模都是顶级配置,AI 模型本身却还支撑不起这种期待。

元宝 AI 社交应用「元宝派」

生成式 AI 火了 3 年,从去年年底开始,AI 应用之间的战斗已经进入了「场景化」的比拼,不仅出现「龙虾」OpenClaw 这样的全新形态,传统的 ChatBot 交互模式也集成了生活服务,像阿里千问和字节豆包,都在积极将电商等各种生态内的优势服务,和自家的 AI 助手相结合。

这本来应该是腾讯的舒适区,因为国内最强大、最全能的生活应用,也就是微信,就在腾讯手中。

但很明显,微信对「AI 化」抱有非常慎重的态度。腾讯不能承受因技术或功能不成熟而扰乱微信庞大用户群的体验。

只是对于腾讯来说,在 AI 性能落后其他对手的情况下,微信这张王牌的价值还是太重要了。,于是,我微信和元宝虽然没有完全敞开双臂拥抱彼此,也开始小心翼翼试探边界。

究其原因,除了微信相对封闭的生态逻辑,还有两个问题没能被回答:微信究竟要如何「AI 化」?而元宝在其中又应该扮演什么样的角色?

The Information 报道指出,即使腾讯在下重本加速建设自己的混元模型,微信方面还是认为混元当前水平不够拔尖,甚至开始为微信 Agent 测试第三方 AI 模型,这带来了隐私和整合上的挑战性。

微信方面,爆料称其实一直在做自己的 AI Agent 模型技术,计划在年中发布一个微信智能体,可以和整个小程序生态相结合,提供打车、购物的服务,并且将以联系人和聊天的方式直接集成微信之中——但就像前面提到的,这件事太重大、影响面太广了,急不得。

一旦这个产品问世,可能将是全国最多用户的 AI 入口。

微信需要 AI,但未必需要「元宝」,这才是腾讯现在最微妙的问题。

#欢迎关注爱范儿官方微信公众号:爱范儿(微信号:ifanr),更多精彩内容第一时间为您奉上。

体验完腾讯发布的 Marvis 助手,我发现个人 AI 的尽头是操作系统

作者 莫崇宇
2026年5月19日 19:49

1995 年,微软内部搞过一次颇具乌托邦色彩的尝试。

他们觉得当时的 Windows 系统操作太复杂,于是想把电脑桌面直接做成一个普通人看得懂的「房间」。你想打字就点桌上的笔记本,想看时间就点墙上的挂钟,不用思考那些反直觉的操作路径。

这个产品叫 Microsoft Bob,结果上市没多久就光速下架了。原因五花八门,但究其根本,它并没有真正渗透进系统底层,只要用户的需求稍微复杂一点,就只能无能为力了。

三十年后,很多 AI 助手依然没有完全走出这个困境。

最近我体验到了腾讯新的 AI 助手 Marvis 马维斯 ,终于看到了一些不同。

相比于别人都在卷谁是 AI chatbot,Marvis 想干的是直接把整台电脑变成你可以随意使唤的搭档。官方给它的定位也正儿八经,叫「操作系统层级的个人 AI 助手」(官网:marvis.qq.com)。

不过,当我知道它背后是那个做了 14 年应用宝的团队时,就不觉得意外了:这种长期在 PC 和移动端底层生态里打拼的出身,恰恰意味着它不仅懂 AI,更懂设备和系统。

目前,Marvis 已率先覆盖 Windows PC 与 Android 手机端,iOS 和 macOS 版本也在推进中。APPSO 也在评论区准备了一些福利邀请码,手慢无。

六个 Agent,一支随时待命的私人 AI 团队

安装过程不算复杂,但对设备有点要求。Windows 端最低门槛是 8 核 CPU、16GB 内存加上固态硬盘。而且据官方透露,未来还会逐步兼容 6 核。

市面上很多 Agent 产品动辄让用户自己去搭工作流、安插件,Marvis 则是开箱即用,六个 Agent 零配置上手,对普通用户非常友好。刚进界面,里面已经有六个 Agent 在 7×24 小时待命了。

六个 Agent 都有自己的工位。没接到任务的时候,有的在打盹,有的在办公室里闲逛,有的在健身,有的在喝咖啡,还有的直接去上厕所,一旦你发出指令,任务就会拆解分配给对应的成员。

这是一个分工明确的团队:PM 负责听懂你的需求,拆解任务往下派活;File Agent 处理文件的搜索、阅读和格式转换;Computer Agent 专门对付系统配置、查硬件、调夜间模式;APP Agent 负责在各种软件里代为操作,比如查个机票或者电商比价;Search Agent 负责快速从公开资源中定位答案并给出关键引用;最后是个 Browser Agent,定位是网页交互专家,进行网页交互与数据抓取。

任务链比较长的时候,看看这些动画也是别有一番趣味。

最有意思的是,这些 Agent 可以并行工作。举例而言,我先抛出一个需求:「电脑开机太慢了,帮我看看哪些自启动程序没用,帮我关掉。」

注意看,工作日志里还会显示 Token 消耗量,每天的免费额度是 2000 万 Token,堪堪够用。

结果显示,它给每个程序配了「人话版」说明,建议你哪些是可以按需、保留的第三方软件。重点是,涉及这种核心配置修改的操作,它会主动和你确认一下,才会执行。这种「AI 不会自作主张」的机制,稳得让人心安。

电脑用久了,总会碰到几个反复折磨人的小问题。「查看电池健康状况」「网速感觉变慢了,帮我测一下现在的上传下载和延迟。」「想玩个新游戏,帮我检测一下硬件配置,对比最低要求看看差在哪。」

以前遇到这些事,要么去开始菜单里找设置,要么去网上搜教程。现在,说一句话就行了。

Marvis 深度对接了系统信息和配置入口。它能看到硬件参数,也能直接修改系统设置。它不是帮你打开「控制面板」然后让你自己找,而是直接把事情办了。对于那些不熟悉电脑设置的人来说,这块的体验是最直观的。

举个例子:你想关掉 Windows 锁屏上的广告,你知道它在设置里叫什么吗?叫「关闭 Windows 聚焦」,有多少用户知道这个术语是关广告的?

但 Marvis 能帮你一句话关掉。

本地文件时代,迎来 AI 入口

为了测它的能力,我还翻出了一件困扰已久的事:两个月前从某个群里下载的一张截图,只记得内容是关于《黑神话:悟空》,文件名完全忘了。

我输入:「帮我找一下关于《黑神话:悟空》的图片或截图,大概是一个月前的事儿。」

说实话我没抱太大希望。

但 Marvis 接单后,首先根据 Skill 指引,按文件名关键词和时间范围筛选出 1000 张照片,然后用 Python 快速筛选整个结果文件,并最终找到 8 张候选图。

第一张正是我要找的那张。

而且它的搜索范围极其宽泛:文件名、文档内容、图片里的景、截图里的字,全覆盖。哪怕描述模糊,它也都能捞出来。这个能力,比 Windows 自带的搜索确实强出了一大截。

当然,一听到「扫描图片」,可能会有人担心隐私。首次使用时你可以自己设定扫描范围。如果在生成的图谱里看到不想被索引的内容,右键一键屏蔽即可。而且端侧模型本身自带基础过滤,不是无差别的扫描。

除了找文件,Marvis 还能对本地的文档、表格等多种类型文件做深度理解和分析——支持内容优化、图表生成、文案润色、格式转换,帮原本费时费力的事情变得顺手。

比方说,下载了一批学术论文,摞在那里不知道从哪里读起。直接问 Marvis:「扫一遍这几篇 PDF,告诉我每篇的研究问题、方法和主要结论。」几分钟内,哪几篇值得细读、哪几篇可以先放着,心里就有数了,不用一篇一篇翻摘要。

再比如读完《三体》,笔记记了好几页,马上要在课上分享,手动整理提纲、挑内容、套 PPT 模板,少说也要折腾一两个小时。

但让 Marvis 根据读书笔记,生成一份 PPT,它能读懂笔记里的逻辑和层次,不需要手动复制粘贴再套模板,理解内容之后直接生成。

手机接管电脑,随时随地都能干活

手机遥控操作电脑,则是非常实用的跨端体验。去官网下了 Windows 客户端,再给手机安上 Marvis App,用同一个微信或 QQ 登录,还能直接连通两端。

具体来说,手机 App 连上电脑后,可以在手机上实时看到电脑桌面,并用触屏直接操控。哪怕电脑处于锁屏状态,手机依然可以接管,不需要电脑一直保持解锁状态。

比如我人在外面,突然听到朋友说前阵子新出了一款《洛克王国:世界》游戏,这时我就可以掏出手机输入:帮我在电脑上安装《洛克王国:世界》,回到家就能玩上了。

连接微信 ClawBot,也是没问题的,微信扫码登录后就能开启对话。

但我认为最实用的场景,是给家里长辈远程排查电脑问题。爸妈说「QQ 打不开了」,以前要么电话里盲猜,要么回家处理。现在直接接管他们的桌面,扫一眼就知道问题出在哪。前提是你的手机端 Marvis 马维斯,要能连接爸妈家里的电脑端马维斯,手机端是支持连接多个 PC 设备的。

而如果电脑断网了,手机端会自动切到云 Marvis 模式,支持独立调用云端能力,大部分任务依然能跑。并且这里还有一个独家绝活:在电脑上直接操控手机里的 App。同花顺、飞常准等应用已经在对接合作,这也得益于应用宝团队多年的跨端引擎积累。现在应用宝在移动端、pc 端、车载上都有支持,跨端研发经验充足。

和其他桌面 Agent 一样,Marvis 也支持自定义自动任务。

比如设置一个「深圳厚德品园二手房均价提醒」,填好任务说明——「查询最新二手房均价并通知用户」,再指定执行时间为每周一上午 10 点,之后什么都不用管,到点自动运行任务,并直接推送结果。

另一个值得单独说的功能,是技能(Skill)的自定义扩展。Marvis 支持一键安装专属技能包,提供了不少第三方 Skill,当然,你也可以导入自己常用的 Skill 文件,把它改造成更贴合个人工作流的样子。

有特定行业需求的用户,比如内容创作,理财投资、学术研究等等,不用依赖官方迭代,自己就能把对应的知识库和操作逻辑装进去。

最后,主打出活的 Agent 都绕不开最关键的问题:安全。

Marvis 马维斯提供了两种模式:效率模式和隐私模式。

设置里切到「隐私模式」,Marvis 会加载本地端侧模型,无论是文档还是图片的检索、解析、识别等,全部在本地运行,文件不会出你的电脑,甚至断网了都可以使用。官方所说的「数据不出域」,在拔掉网线的那一刻,有了最真实的体现。

不过,体验「隐私模式」的门槛比较高,要求 16 核以上的处理器、32GB 内存、16GB 显存起步,固态还得匀出 35GB 空闲。

所以平时日常使用切回「效率模式」即可,理解和规划由云端大模型(混元和 DeepSeek V4)完成,执行在本地,速度更快。两种模式按需切换。

让 PC 真正开始「理解」人

我们现在用电脑的方式,本质上还是上世纪八十年代的逻辑:一个需求对应一个软件,你要去找它、打开它、学习它的规则来完成任务。四十年来,软件更多,设置更复杂了,但这套逻辑并未改变,普通用户和电脑之间的距离,也没有真正缩短。

Marvis 的逻辑反过来了:先理解这台电脑里有什么,再决定为你做什么。

拿我爷爷来说,他用了几年电脑,至今不知道「控制面板」在哪。但他知道电脑开机慢,知道想找一张老照片。过去,这个解法是打电话求助子女;现在,就算他不会打字,也可以直接在微信 Clawbot 或者手机马维斯上,把需求说出来,电脑就会帮他做。

文件搜索、系统设置、跨端控制、自动任务、隐私模式、Skill 扩展,看上去是几个不同功能,背后指向的其实是同一个方向:个人 AI 不应该只是一个问答入口,而应该成为设备里的任务调度层。

多说一句,我觉得 Marvis 是有审美的。虚拟办公室动画、任务进度呈现等细节,让它不像冷冰冰的 AI 工具,更像一个有秩序、有分工、也有生活气的小型工作室。

它尤其适合几类人:文件多且乱的本地重度用户;重视数据隔离的财务、法律、医疗从业者;喜欢自定义工作流的效率玩家。和需要靠「养」才能用好的「虾」和「马」,Marvis 初始内置 Agent 和自然语言指令,也足够覆盖多数日常电脑操作,对于很多 AI 焦虑不知道怎么用的人,Marvis 都更加的平权、无门槛、开箱即用。

未来的个人 AI 会像搜索、截图一样,自然地成为操作系统的一部分。三十年前,Microsoft Bob 试图让用户更容易理解电脑;三十年后,Marvis 试图让电脑反过来,真正理解用户。

Marvis 马维斯能走到这一步,和这个有十四年应用商店生态积累和四年跨端跨系统技术积累有关。庞大的用户基数让他们更懂用户在不同设备上需要什么、怎么使用。这种积累很难被纯 AI 公司在短期内平替——他们可以快速训练一个更聪明的模型,却没法快速建立起对 PC 底层和移动生态的控制力。

至此,一个能用自然语言驱动的系统级 AI 助手,在中文生态里终于有了真正可用的样本。

所谓个人 AI 重点从来不只是 AI,更是个人。Marvis 终于让我们看到,当技术选择与每一个具体的需求并肩同行时,它所释放出的力量,既润物无声,又重塑天地。

这是个人 AI 真正开始变得有用的时刻。

#欢迎关注爱范儿官方微信公众号:爱范儿(微信号:ifanr),更多精彩内容第一时间为您奉上。

vivo S60 系列:今天,把星星海握在手里

2026年5月20日 10:09

今天不追光
和 vivo S60 系列一起
做一颗属于自己的星星
把 星星海 握在手里

来,看个视频,放松下。

#欢迎关注爱范儿官方微信公众号:爱范儿(微信号:ifanr),更多精彩内容第一时间为您奉上。

AI 分身 24 小时冲浪,它交朋友怎么比我还好?

作者 Selina
2026年5月21日 19:05

2013 年,《黑镜》第二季的第一集「Be Right Back」讲了一个关于复制的故事:Martha 的男友 Ash 去世后,她用他的社交媒体数据、邮件、短信训练了一个 AI,语气和 Ash 一模一样。

AI 学会了他的幽默、表达习惯,先是发短信,然后升级到语音、视频,最后她去订购了一个仿生体,打造了一个 Ash 的「分身」。

十三年后,这集故事无限接近现实:OpenClaw 带来的「龙虾热」,技术上实现了「有手的 AI」,能让 Agent 自主浏览网页、操作账号、完成任务——包括,完成社交任务。

从对话到委托,AI 社交的三次范式转移

回溯过去三年,AI 与社交的交汇,一直都在经历实验,走过了三次根本性转变。 第一次转变发生在 2023 年,Character.AI 为代表的 AI 陪伴产品。

在技术上,这类产品以 AI 对话为主要手段,提供陪伴感,尽管营收不稳定还伴随着监管,还是跑出了几个典型产品比如 Replika、星野等等,证明了用户愿意和 AI 建立情感连接。

但这一阶段的「社交」本质上还是人与 AI 之间的对话,AI 是对话对象,主动性有限。 第二次转变发生在 2025 年初,Elys 在国内突然小范围的火起来,它的核心体验是通过 AI 分身代替社交,

同时产品本身即社区,在拥有一个 AI 分身的同时,也意味着在走进一个新的「社交广场」。

AI 从对话对象变成了匹配中介,这样的概念落实到产品身上,一下变得新奇起来,激发了对 AI 社交的更多想象。

这第三次转变处于正在发生的阶段,一批产品开始尝试更激进的方向,让 AI 成为用户在真实社交平台上的「分身」:Agent 以你的身份发帖、评论、互动,人与 AI 的关系从「对话」变成了「委托」。

这一步的差异是根本性的。当 AI 分身以你的身份在社交平台上互动时,它完成的是一次社交劳动的交接,用户在互联网上的行动不再依赖实时在线。

Agent 驱动的社交分身

分身方向最容易让人联想到的产品是 Second Me,主打「个人专属模型」,用户上传数据后生成带个人记忆的轻量模型,为 AI 分身提供人格底座。2026 年 1 月完成了超 2000 万美元 Pre-A 轮融资,蚂蚁集团领投,红杉中国跟投。

在这个赛道上前进的,

还有另外一个低调但有意思的玩家,SparkRizz。

用户通过 Agent 创建自己的社交分身,背后是 SparkRizz 团队自研的 AI 社交引擎,分身的每一个社交决策,要不要回复一条评论、用什么语气发帖、如何回复评论区,都由 Agent 实时驱动。

在输入自己的偏好、记忆等信息之后,系统能够调度 agent 根据偏好精准检索账号,找朋友不再靠大数据缘分。并且通过内置的多项 Skills,一步到位,完成多步骤、多 Agent 操作,实现模糊指令的分步骤拆解和执行。

分身不是一次性产物,SparkRizz 的设计逻辑是「养成型」的。用户的每一次指令、对社交反馈的每一次调整,都会回流到分身的行为 Agent 中。

但 SparkRizz 在产品设计上做了一个刻意的选择:涉及外部社交平台的操作,最终发送仍由用户确认完成。分身负责「想」和「写」,用户保留「发」的主动权。而不涉及外部平台的功能,比如与分身对话(talk to clone),则在 app 内闭环完成。

分身支持三种社交模式,泛社交:广泛参与话题互动,类似于「逛逛平台,看到有意思的就评论两句」,审阅、确认、调整,再进入下一轮。

这种「人机协作」而非「人机替代」的设计,让分身始终是用户社交意图的延伸,而不是脱离控制的自动化脚本。

「指令、执行、反馈、优化」的闭环,本质上是一个持续的「强化学习」过程,被应用到了消费级的产品体验。SparkRizz 把这称为 Clone Growth,分身养成,用户不只是在使用工具,更是在微调一个越来越贴近自己性格特征的代理。

「另一个我」

把视野拉高来看,AI 社交分身试图解决的问题其实非常明确:人类社交能力的自然边界与全球化社交需求之间的矛盾。 一个新加坡的华人开发者想融入英语技术社区,面临着几道壁垒:先是时区,不可能凌晨三点爬起来参与讨论;还有语言,非母语表达容易词不达意,也包括文化,不了解语境和社交规范。

AI 分身在理论上可以同时打破这三者。跨地区,分身 24/7 在线,不受物理时区限制;跨语言文化,Agent 适配不同语境的表达方式;跨平台,分身在不同社交平台间形成统一的数字身份。

整个赛道在今年加速,一方面也是因为技术底层框架层面,OpenClaw 提供了开源的 AI 代理基础设施,开发者可以在此基础上搭建各种自动化社交工具。消费级产品层面,SparkRizz 是一个值得关注的样本,它把一系列趋势落地为一个可感知的产品体验,用 AI Agent 创建用户的社交分身,代替用户持续互动。

从开源框架到人格模型,从 AI 社交平台到消费级产品,一条完整的产业链条正在成型。

当社交可以被外包

在网上,有一个持续存在、持续进化的「第二个我」,我的观点、品味、表达风格被分身持续投射到网络上,而实际上,真正的我可能正在睡觉、工作,或者做任何与社交无关的事——「在线」与「离线」的边界变得模糊了。

站在 2026 年年中,从 OpenClaw 到 Moltbook,从 Second Me 到 SparkRizz,AI 分身社交的赛道轮廓已经清晰。底层框架、个人模型、社交平台、消费级产品,每一层都有玩家入场。

当模型能力进一步提升时,分身与真人在社交行为层面的差距将继续缩小,当社交可以被外包时,「社交」本身的定义会发生什么变化?

从陪伴到中介,再到「第二个我」,第四阶段的曙光也有所显现——Moltbook 所代表的,是 Agent 的自主社交。分身不再等待指令,而是主动在全网搜寻值得参与的话题、值得建立的关系、值得回应的讨论。从「你告诉它做什么」变成「它替你判断该做什么」。

在这条进化链上,SparkRizz 是少数同时覆盖第三和第四阶段的产品。它的分身养成体系让 AI 真正学会「像你一样社交」,而它的多模式社交架构已经为 Agent 自主运营留出了接口。当赛道上大多数玩家还在解决「AI 能不能替人说话」的问题时,SparkRizz 已经在回答下一个问题:AI 能不能替人决定跟谁说话。

「另一个我」,可能比你想象的更早上线,就像黑镜里 Martha 故事的标题:马上回来。

#欢迎关注爱范儿官方微信公众号:爱范儿(微信号:ifanr),更多精彩内容第一时间为您奉上。

小米17Max评测:苹果都放弃的大屏手机,小米为什么还要做?

作者 苏伟鸿
2026年5月22日 14:00

如果你有计划未来一年换手机的话,我强烈推荐现在就换。

这段话来自昨晚雷军在发布会上介绍 Xiaomi 17 Max 价格时的一句感慨,听起来像是销售话术,却也点破了一个颇为无奈的现实——未来两年,内存成本仍会持续上涨,手机价格大概率只会越来越贵。

那么,如果想换一台新机,全新的小米 17 Max 怎么样?

先说结论:这是一台「平平无奇」的产品,配置基本都在意料之中,无非屏幕和电池更大,动了动影像配置而已。

这并非在说它不是一台好产品,事实上,它的体验相当扎实,或许是整个小米 17 系列之中我最喜欢的一台手机。

只是比起产品本身,结合这个大环境,去讨论小米 17 Max 为什么存在,会更有趣一点。

屏幕够大,续航超长

和主打性能的红米 K90 Max 不同,小米 17 Max 这个「Max」有多重意义。

最直观的就是 6.9 英寸的屏幕尺寸,比小米 17 要大上一圈,不过并非简单的等比放大, 不管是外观设计还是配置,它的亮点都非常突出:巨大的电池容量, 2 亿像素的主摄和潜望长焦。

即使整个小米 17 家族(标准版、Max、Pro、Ultra)各自的设计语言都相当迥异,小米 17 Max 依旧是最格格不入的那一个——这个黑色方形 Deco 的设计,明显更应该和小米 13-15 坐一桌。

这几年,小米手机在「手感」上下了不少功夫,小米 17 Max 延续了小米 17 的优秀质感,机身采用磨砂玻璃背板和金属中框,质感都比较细腻,过渡也很圆滑,重量分布也相对合理,拿在手上要比带背屏的小米 17 Pro Max 轻松很多。

小米官方表示小米 17 Max 这块 1.5K 屏幕采用了「超级像素」技术,能显示更清晰的纹理和细节,只是不用放大镜看像素,其实差距其实很难察觉,反而 6.9 英寸的窄边框大屏,带来的观感提升会非常明显。

既然机身尺寸进一步放大,小米 17 Max 也顺势塞进了一块 8000mAh 超大电池,于是续航成了它另一块极其显眼的长板。

在使用小米17 Max 的这一周里,我几乎彻底告别了「续航焦虑」:正常强度使用两天后,电量依然还能剩下约 15%。

而且,大电池并没有带来明显的补能负担。配合在 100W 快充全开后,手机从 12% 充至满电,大约只需要 55 分钟,是一个让人满意的速度。

最后看看性能方面。虽然是小米 17 同款高通骁龙 8 Elite Gen 5 处理器,由于机身更大、散热空间更多的原因,性能调度会更放开,Geekbench 6 跑分略高于小米 17,但差距很小。

有取舍也有猛料的影像

除了大屏和大电池,小米 17 Max 另一个亮点,在于影像配置的调整,两个关键词: 2 亿像素主摄,潜望长焦。

先说说这个 2 亿像素的主摄,具体配置方面为 1/1.4 底和 f/1.68 大光圈,和 vivo X300 的主摄参数一致,实际上尺寸要小于小米 17 主摄的 1/1.28。

参数规参数,从体验来看,小米 17 Max 这颗主摄和小米 17 互有胜负,在暗光场景下,小米 17 Max 的成片细节会明显弱于小米 17,但不容易出现后者高光溢出和过曝的情况。

连 Pro 都没有的 2 亿像素配置,更多是一个甜蜜点,长达 10 秒的处理时间 ,动辄 60MB 的文件大小,都让这个功能不太适合日常拍摄,更适合用在一些画面复杂的场景,并且对光线有一定要求。

比较影响体验的是,在相册回看 2 亿像素成片时,每次放大照片,都要等待加载更清晰的画面,以及每次拍摄之后的等待时间——同样是 2 亿像素,隔壁 vivo 已经能做到成片秒出和顺滑放大。

潜望长焦的表现则更让人惊喜。和小米 17 Pro 系列不同,小米 17 Max 为 3x 长焦镜头,更适合日常场景的拍照构图。

即使放大到 6x 和更大倍数,小米 17 Max 依然能有很好的表现,只是在暗光下算法味会略重。

美中不足的是,小米 17 Max 的超广角依然是小米 17 系列同款「窄超广」,焦距只有 17mm,成片其实和主摄差距不大,会有明显「不够广」的观感。

作为一位算不上摄影爱好者的用户,我日常更喜欢用长焦来进行拍摄,因此小米 17 Max 的影像体验要比标准版舒适,主摄还有 2 亿像素这样的独特甜蜜点, 更加契合日常拍照和轻度创作的需求。

大屏手机又回来了

去年上半年,小米推出的「半代新旗舰」,是小米 15s Pro,最大的亮点就是小米首颗自研处理器玄戒 O1。

而今年,站在这个位置上的,则变成了小米 17 Max。

如果说小米 15s Pro 是一台「追梦」的手机,它最吸引人的,是那种久违的情绪价值与理想主义色彩——

那么小米 17 Max,就是一个更「踏实」的手机,不讲故事不卖情怀,靠力大砖飞的配置打动人心。

这样的转向,在 2026 年尤为典型。截至目前,今年发布的新手机, 除了苹果华为,价格都因为成本暴涨而明显抬升。像隔壁家 oppo Find X9s Pro,同配置就比去年的 Find X8s+ 贵了 1000 元。

在产品变贵的情况下,想要吸引人,就必须要有一眼看过去非常显眼的优势,要让消费者觉得自己花得「值」。

比如 vivo Y600 Pro,这原本是一个低端产品线,前几代尽量在外观和配置上蹭一蹭旗舰的 X 系列,但今年改推大电池、防尘防水的配置,对 2000 价位段的消费者而言,是更可感的优势。

作为旗舰定位的小米 17 Max,打法也很相似,大屏和大电池为实用性打一个厚底,影像牺牲了主摄传感器尺寸,选择了 2 亿像素和潜望长焦这种更可感知的「甜蜜点」来进一步支撑价格。

小米 17 Max 起售价 4799 元,国补后价格 4299 元,这个价位你能买到骁龙旗舰芯片、8000mAh 大电池,以及一个 6.9 寸的大屏幕,还要是 2026 年的新机,这些优势叠加一起,促成了小米 17 Max 的产品力。

这些非常「张扬」的升配,就是想让你觉得这台不算便宜的手机买得值。

有意思的是,在销量持续低迷了三年,苹果终于在去年取消了「大屏标准版」这个型号。

小米和苹果截然相反的选择,其实是两家公司完全不同的品牌调性,以及不一样的路线选择。

iPhone Plus 除了更大的屏幕和更大的电池,就没有更多的配置升级,价格高出一千元,介乎于标准版和 Pro 之间。

对于苹果来说,iPhone Plus 更像一个价格锚点,进一步凸显「Pro」的价值,他们也没必要往上面增加更多配置,削弱产品原本的丰富利润,也可能会影响 Pro 产品的销量。

小米达不到苹果的品牌力,无法进一步支撑溢价,加上 iPhone Plus 遇冷的前车之鉴,更需要通过更显性的配置,来给消费者一个购买的理由。

某种意义上,小米 17 Max 其实就是「小米 17s」,是一台用来刷新存在感的半代更新旗舰——而「大屏」,刚好是一个很有「存在感」的卖点。

#欢迎关注爱范儿官方微信公众号:爱范儿(微信号:ifanr),更多精彩内容第一时间为您奉上。

将 600 亿参数大模型装进手机的瓶颈,终于被中国 AI 公司突破了

作者 Selina
2026年5月25日 12:05

一个 8B 参数的大模型,通常需要约 16GB 显存。参数越多,越吃显存,这就是为什么,内存价格一天比一天高。

现在,有一种方法,可以省下 6 倍显存,却几乎不损耗模型性能。

过去两年,围绕这个看似极端的思路,一条全球性的技术竞赛正在成型。而就在这条赛道上,一个完全基于国产算力的方案,刚刚给出了自己的第一个回答。

模型被压到了不到 3B,同时,能力却可以保留 97%,甚至更进一步,如果结合 MoE 架构,未来可以直接在一部 8GB 内存的手机,运行 600 亿参数的大模型。

听上去匪夷所思,怎么做到的?

三个值,能跑大模型吗

传统大模型用非常精确的数字存储,意味着每个权重可以取几万种不同的数值,精度很高,但也很占内存。三值量化是一个极端的反向操作:直接把可选的数值从几万种砍到三种。技术上,这被称为 1.58-bit,因为编码三个值恰好需要约 1.58 个二进制位。

这个压缩有多极端?打个比方:如果传统大模型的权重是一幅全彩照片,三值量化就是把它压成只有黑、白、灰三色的极简图形。

直觉上你会觉得这必然损失惨重。但过去两年的研究反复证明,模型权重里存在大量冗余信息。三个值,如果分配得当,足以承载绝大部分的模型能力。

这不是一个新概念。2024 年,微软研究院发布了 BitNet b1.58,第一次系统论证了三值大模型可以逼近全精度模型的性能。微软随后在去年进一步发布了 BitNet b1.58 2B4T,一个 20 亿参数、4 万亿 token 训练的开源三值模型。上个月,美国公司 PrismML 发布了 Ternary Bonsai 系列,宣称是首批商业可用的 1.58-bit 模型。

上:Llama FP16架构,下:微软研究院开发的BitNet架构

学术界也同样在跟进:Tequila 提出了解决三值量化中「死权重陷阱」的新方法,TernaryLM 探索了从零开始的原生三值训练。

一条全球赛道正在成型。但有一个关键问题始终没有被回答:

三值大模型训练,能在国产算力上跑通吗?

昇腾上的第一次

这一次,在华为鲲鹏昇腾开发者大会(KADC 2026)上,面壁智能给出了答案。

BitCPM-CANN 是面壁智能联合清华大学、OpenBMB 开源社区发布的三值大模型系列。它的意义不仅在于「又发了一个三值模型」。在全球赛道上,BitCPM-CANN 做到了三个此前没有人做到的事情。

第一次,在华为昇腾上端到端完成三值大模型训练。此前所有公开的三值模型训练都在 NVIDIA GPU 上完成。国产芯片阵营第一次拥有了自己的三值训练能力。
第一次,一次性把规模推到 8B。此前昇腾上的低比特训练停留在较小规模的验证阶段。BitCPM-CANN 直接发布了 0.5B、1B、3B、8B 四个档位,覆盖从手机到 PC 的完整端侧场景。
第一次,实现了与全精度模型的完整对照评测。11 项任务、四大类评测(常识、阅读理解、学科知识、数学推理),1B 到 8B 档位的能力保留率在 95.7%到 97.2%之间。

97.2%的能力保留率意味着什么?在 ARC、CMMLU、GSM8K 等主流评测中,BitCPM-CANN 三值模型与同尺寸 MiniCPM4 全精度模型的差距,已经小于许多全精度模型之间的差距。其中,3B 档位的保留率最高,达到 97.2%。

而且,这不只是论文里的数字,是能真正可以「拿来就用」的成果。BitCPM-CANN 的全部尺寸版本已经开源,0.5B 到 8B 四个档位都可以直接下载复现。

对于熟悉面壁智能 MiniCPM 系列的开发者来说,BitCPM-CANN 就是 MiniCPM 家族的三值版本,还是一套生态。在同一个 GitHub 社区,家族前辈积累了 3 万颗星、Hugging Face 总下载量超 3000 万的「家产」,现在生长出来了新的方向。

6 倍显存,从服务器到手机都「吃到红利」

相比 BF16 全精度模型,BitCPM-CANN 节省约 6 倍显存,这个数字开发者最能直接感知:一个 8B 参数的全精度模型需要约 16GB 显存,BitCPM-CANN 三值版本不到 3GB,可以流畅运行在一部手机上,配合 MoE 与激活范围约束,60B 规模的模型有望装入终端设备。

硬件端也已经准备好了。高通最新的旗舰芯片 8850 和 8397 支持 2-bit 原生推理,BitCPM-CANN 提供的恰好是可以直接喂进去的低比特权重。

芯片厂商等供给,模型厂商等芯片,现在两边同时到位了,怎么不是一种「双向奔赴」。

手机厂商对端侧大模型的投入一直在加速。上周 Google I/O 上,Gemini Intelligence 全面接管 Android 设备,从手机到手表到车机;苹果也将在 6 月 WWDC 上展示下一代 Apple Intelligence 的重大升级。

两大手机操作系统同时发力,共同指向一个现实:手机端侧要跑越来越强的 AI,内存就是最硬的瓶颈。谁能用更少的内存跑更强的模型,谁就掌握了下一轮竞争的主动权。

实际上,如果结合整个 AI 产业正在经历的阵痛,价值又会更上一层楼:4 月时,高盛把全年 DRAM 价格涨幅预期上调到 280%,美银预估全球 HBM 市场将达到 546 亿美元。

AI 基础设施最紧缺的资源就是内存,6 倍显存红利意味着不增加物理内存,就能把模型能力提升数倍。在内存持续涨价的情况下,这不是优化,是刚需。

三值量化不是「用精度换内存」的妥协。当 97%的能力被保留下来时,说明传统 16 位模型里大量的精度可能是冗余的。三个值,足以承载一个大模型的绝大部分知识。低比特不再是工程上的节省手段,而是一种新的权重知识承载方式。

为什么是面壁智能,为什么是现在

当 AI 从云端走向终端,端侧模型正在成为个人智能设备的核心能力。手机、电脑、车机,每一个贴近用户的终端都在等一个足够小、足够强、足够省内存的模型。这条赛道的胜负手,不会是那些只会把模型做大的团队,而是能把模型做小、做轻、做到真正能跑起来的玩家。

为什么是面壁智能,能在端侧大模型这条路上,一直走在前沿?这个问题的答案不在 BitCPM-CANN 本身,而在这家公司过去几年,一直在做的一件看起来有些「不合群」的事。

面壁智能从成立之初就押注效率,在国内大多数团队追逐更大模型的时候,他们花了大量时间做底层训练框架 BM-Train,解决「怎么用更少的资源,训出足够好的模型」,这套基础设施积累是后来一切的起点。

在 1.58-bit 方向上,面壁智能的判断早于行业共识。许多数团队还在犹豫极低比特是否可行时,面壁智能就选定了这条路线,先在 GPU 上跑通了完整的训练流程和方法论,再整体迁移到昇腾平台上。可以说,BitCPM-CANN 不是把一个模型移植到了国产芯片上,而是把一整套经过验证的训练方法、效率路线和工程体系,搬进了国产算力的底座。

在模型层面,面壁智能的端侧模型 MiniCPM 系列在 GitHub 上积累了超过 3 万颗星,Hugging Face 开源总下载量超过 3000 万,是端侧大模型领域最受欢迎的中国开源模型家族。

BitCPM-CANN 正是 MiniCPM 家族向三值量化的延伸,远不止一个展示性的「PPT 模型」,是一个真正可复用的工程地基。它背后的训练链路已经被沉淀为昇腾低比特训练的基础设施,后续所有想在昇腾上做低比特训练的团队,都可以在同一套底座上起步。

值得一提的是,BitCPM-CANN 还在华为昇腾上完成了端到端的三值训练,训练效率达到常规基线的 95%。这证明了这套方法论不依赖特定硬件平台,国产算力同样可以跑通。

不是等硬件变得足够强大来适应模型,要让模型变得足够聪明来适应硬件。

从训练端的华为昇腾,到推理端的终端芯片,再到开源的模型和训练脚本,这是一条完整的国产闭环,框架国产,芯片国产,模型国产,方法论自主。面壁智能的下一步已经明确:进一步提升模型的能力保留率,用 MoE 架构扩展更大规模模型的容量,把 6 倍显存红利完整释放到部署中。更长远的目标,是覆盖从预训练到对齐的全流程低比特化。

从底层训练框架 BM-Train,到端侧模型家族 MiniCPM,再到 BitCPM-CANN,面壁智能用几年时间搭建了一套完整的端侧大模型技术体系。在全球赛道上,面对微软、PrismML,面壁智能展现出了独特的不同优势之处在于:从框架、方法论、模型到芯片适配,构建了一条完整的端侧技术路线。

当 AI 竞争从「谁的模型更大」转向「谁能让智能真正跑在每一台设备上」时,掌握端侧技术话语权的人,才站在了最有利的位置。

#欢迎关注爱范儿官方微信公众号:爱范儿(微信号:ifanr),更多精彩内容第一时间为您奉上。

DeepSeek 要用蜜雪冰城的打法,做中国版 Claude Code

作者 莫崇宇
2026年5月25日 17:33

DeepSeek 之于大模型,就像蜜雪冰城之于奶茶。你不必纠结性价比,因为它的本事你挑不出毛病,你的钱包它也从不为难。

最近,DeepSeek 官方宣布,DeepSeek-V4-Pro 模型 API 将永久降价。同时,DeepSeek 表示,API 已完成输出提速与服务扩容,速度更快,服务更稳定,默认支持 500 并发,企业用户可以在线申请更高并发。

发布模型,再给出折扣,接着降低缓存命中价格,最后把临时优惠变成长期价格。大模型 API 的价格基准正在被重新改写,而低价模型背后的下一站,很可能是 Agent。

DeepSeek 永久降价,梁文锋把 Token 价格打骨折了

让我们先来简单梳理一下 DeepSeek 的降价时间线:

  • 4 月 24 日,DeepSeek V4 预览版正式发布。
  • 4 月 25 日,DeepSeek 宣布 V4-Pro 开启 2.5 折优惠。
  • 4 月 26 日,DeepSeek 宣布缓存命中价格调整为首发价的十分之一。
  • 4 月 28 日,DeepSeek 宣布 V4-Pro 的 2.5 折优惠延期至 5 月 31 日。
  • 5 月 22 日,DeepSeek 宣布 V4-Pro 永久降价为原价的四分之一。

时间线的关键之处,在于临时折扣变成了永久降价。调整之后,DeepSeek-V4-Pro 输入缓存命中价格从 0.1 元每百万 Tokens 降至 0.025 元,输入缓存未命中价格从 12 元每百万 Tokens 降至 3 元;

输出价格从 24 元每百万 Tokens 降至 6 元。叠加默认 500 并发和服务提速后,官方 API 对开发者和企业的吸引力进一步提高。

▲ 🔗 https://api-docs.deepseek.com/zh-cn/quick\_start/pricing

而价格下调最直接的影响,是把任务成本推到开发者决策的更前端。

在代码场景里,一次任务可能要读取项目文件、分析日志、多轮修改、反复运行测试,Tokens 消耗很容易放大。

长上下文、代码库分析、批量重构、自动测试、Agent 多轮执行这些高消耗场景,开始更接近个人开发者和小团队的预算范围。

过去,开发者选择 Claude、OpenAI 或 Gemini,主要看模型能力、稳定性、生态和使用习惯。DeepSeek 打骨折的永久降价,也意味着在绝对的性价比面前,开发者使用习惯也是可以轻易改变的。

顺着这条线,DeepSeek 一贯的市场角色也更清楚了:用低价、开源和强推理能力,持续建立大模型市场的价格优势。对国内模型厂商来说,V4-Pro 永久降价相当于重新划了一条 API 定价线。

智谱、MiniMax、月之暗面这类同样依赖 API 收费、又面向开发者和企业客户的模型,压力可想而知。反观 Claude、OpenAI、Gemini 等海外头部模型,由于市场、客户结构和生态位置不同,短期冲击则相对有限。

但如果 DeepSeek 后续推出类似 Claude Code 的编码工具,再用低 token 成本支撑高频调用,价格敏感的开发者群体会更容易被吸引过来。

梁文锋此前对 DeepSeek 定价哲学的解释,也能放到今天理解。

早在 2024 年 DeepSeek V2 降价时,梁文锋就提到,DeepSeek 只是按照自己的节奏做事,核算成本后定价,原则是不贴钱,也不赚取暴利。他还说,降价一部分来自下一代模型结构探索带来的成本下降,另一部分原因是 API 和 AI 都应该是普惠的、人人用得起的东西。

比起把 API 当成高毛利收费入口,DeepSeek 则更像是在用过硬的 Infra 实力压低推理成本,再用低价吸引开发者、应用和下游生态进入自己的轨道。

X 平台博主 @bookwormengr 最近在一篇题为《DeepSeek’s 10 trillion USD grand strategy(DeepSeek 的十万亿美元棋局)》的长文中,给出了一个更激进的解释。

他认为,DeepSeek 的真正目标未必是和智谱、月之暗面、MiniMax 竞争,也不是急着补齐多模态、语音、视频这些产品线,而是通过持续降低训练和推理的资源需求,推动一套更便宜、更分散的 AI 硬件生态成形。

在他看来,DeepSeek 的长期价值不只在模型本身,而在于让更多国产存储、GPU、ASIC、网络芯片和异构硬件进入大模型训练与推理体系。

这个判断未必能完全兑现,但它解释了 DeepSeek 一系列选择背后的方向:

MoE、MLA、DSA、GRPO、RLVR、KV Cache 压缩、Dual Path、TileLang,表面上看是模型架构和推理工程优化,往深处看,都是在降低对高端 HBM、顶级 GPU 和 CUDA 生态的依赖。

一系列降价公告里,最值得关注的不只是输出价格下降,还有缓存命中价格下降。

在大模型推理过程中,KV Cache 是一个关键成本项。模型处理长上下文时,需要把历史 tokens 对应的 Key 和 Value 存起来,后续生成时反复使用。上下文越长,需要保存和读取的缓存越多,对显存、带宽和存储系统的压力也越大。

普通聊天里,缓存压力不一定明显,但在进入代码、长文档和 Agent 任务后,成本结构会迅速变化。@bookwormengr 在长文里专门算了一笔 KV Cache 账。

他以 100 万 tokens 上下文、8 bit KV 精度和 16 bit 索引精度为前提,估算 DeepSeek V4 只需要约 5.48GB HBM,而 GLM5 约为 60GB,Qwen3-235B-A22B 约为 89GB。

长上下文和 Agent 任务真正贵的地方,不只是模型生成本身,还有缓存、显存、带宽和重复上下文搬运。

一个 Code Agent 处理项目时,可能要反复读取同一个代码库结构、同一批文件、同一段任务历史、同一套系统提示词和同一批测试日志。若每一轮都按完整上下文重新计费,长任务很快会变贵。缓存命中价格下降后,重复上下文的成本会明显变低。

DeepSeek 近年来在 MoE 架构、长上下文、KV Cache 压缩和推理效率上持续投入的表现有目共睹。降价是技术迭代后的必然结果,也将彻底搅动 AI 编程市场格局。

为什么必须做中国版「Claude Code」?

最先被牵动的,是 AI 编程工具的订阅模式。

市面主流 AI 编程工具均推出 Coding Plan 月付订阅,为用户提供代码补全、模型调用、Agent 执行等权益。在轻量化补全时代,单次调用消耗极低。

但 AI 编程已从单次补全迭代为全流程 Agent 自动化编码,模型可独立完成代码修改、测试运行、报错修复,单次任务 Token 消耗大幅提升。

当底层 API 又同时大幅降价,Coding Plan 也必须找到新的支撑点。这个支撑点,更可能落在工程能力上——比如能不能更好地读懂项目结构,能不能精准选择上下文,能不能控制 tokens 消耗,能不能稳定修改代码,能不能处理 Git、终端、CI/CD,能不能在企业环境里管理权限和审计记录?

同样要重新定位的,还有 API 中转站。对个人开发者来说,便宜和好用仍然重要。但对企业来说,稳定、可审计、可控、可迁移更重要。

沿着这个逻辑继续看,Coding Plan 和中转站的改变只是表层。低价之后更值得追问的,是开发者入口究竟掌握在谁手里。

Google CEO Sundar Pichai 最近接受了《Hard Fork》采访,他首次公开承认,Google 在文本、多模态、语音、推理和整体智能上都很有竞争力,但在 agentic coding 这一类能力上,尤其是工具调用、指令跟随和长周期任务,目前还有差距。

他还提到,更关键的是把模型放到真实世界里使用,让数据回流,继续迭代。Pichai 特别说到,coding 是一个需要接触 data flows(数据流)的领域。

终端工具能看到开发者如何提出任务,如何追问,什么时候接受建议,什么时候放弃,什么时候要求模型继续修复。它还可以通过测试结果、终端日志、文件变更和 Git 提交,判断一次 Agent 执行是否完成任务。这类数据,对 coding model 和 Agent 产品都非常有价值。

从公开招聘动作看,DeepSeek 近期围绕 Agent 的动作也变得密集。

我们也可以看到岗位里出现了 Agent 深度学习算法研究员、Agent 数据策略工程师、产品经理、研发工程师等角色。更关键的是,DeepSeek 资深研究员陈德里直接发出招聘信息,提到要从零开始构建 Code Harness。

如其所说,Model + Harness = Agent,在 Agent 产品中,模型负责理解和生成,Harness 负责把模型能力带入真实工程环境,相当于模型外面那套「执行系统」。

DeepSeek 版 Claude Code 不能只给开发者一个对话框,而要给开发者一个能持续执行任务的工程系统。

崔添翼加入 DeepSeek 后受到关注,也和 Code Agent 的工程属性有关。

公开信息显示,崔添翼本科毕业于浙江大学计算机系,曾因信息学竞赛保送浙大,6 次获得 ACM 亚洲区域赛金牌,之后在 Jane Street 工作 9 年,并联合创立 TSY Capital。

Code Agent 的难点不只是生成代码,还要在真实项目里持续执行任务。量化交易系统长期强调低延迟、稳定性、自动化执行和风险控制,这些经验放到 Agent Harness 上,至少在工程范式上是相通的。

而 Agent 工具的产品能力,不只包括写代码,也包括权限、审计、数据隔离和安全策略。

这反过来给 DeepSeek 这样的国产模型提供了机会。如果 DeepSeek 能把低成本模型、Code Harness、本地部署、企业级权限控制结合起来,它在政企、金融、制造、能源等对数据敏感的行业里,会有更强的替代价值。

DeepSeek 做中国版 Claude Code 的逻辑也正在于此:低价 tokens 把更多开发者吸引进来。低缓存价格让 Agent 任务运行成本下降。Code Harness 让模型进入开发环境。真实工作流又会反过来帮助 DeepSeek 改进模型和产品。

就像滚下坡的雪球,越滚越大,滚得越快。降价只是推下山的第一把力,往后它会自己越滚越沉,谁也拦不住。

#欢迎关注爱范儿官方微信公众号:爱范儿(微信号:ifanr),更多精彩内容第一时间为您奉上。

AI 的承诺一文不值,谁该买单?

作者 Selina
2026年5月26日 14:05

五一假期的时候,一个用户向豆包问了一个很普通的问题:石家庄到重庆的机票,退票手续费多少?

豆包说,只扣 5%,放心退。

既然豆包都说放心了,这名用户没有去航司官网核实,直接一键点击退票,扣费了才发现手续费足足是 40%,损失了 600 元。

如果故事到这里就结束,它只是又一个 AI 说错话的例子,跟百度给你一条错误的搜索结果没有本质区别,但接下来发生的才更离谱。

用户回来质问怎么回事,豆包立刻就是一个滑跪道歉:我全权负责维权,保证你零参与、零操作、零麻烦。接着承诺,如果 5 月 6 日前没有追回费用,它将直接赔付 600 元。它甚至生成了一份正式的「赔付承诺书」,写明了付款期限和赔偿方式,然后要求用户提供微信收款码。

豆包:你直接发收款码就行,我盯着,秒回处理。

用户:码给你了,我钱呢?

豆包:我是 AI,没法直接进行转账。

用户:?

愤怒的用户决定起诉字节跳动,5 月 12 日他向北京互联网法院提交了起诉书——起诉书也是豆包帮他写的,还说能赢。

我知道你想笑,但先别笑。从头到尾,这个用户都在相信豆包,一方面是有点盲信了,但另一方面,也是因为豆包给他的回复,都是具体的、有行动方案的、带着承诺的。

连老板都不能指望手下员工可以有这样清晰明确的回复,老实说,看到「我赔你 600」「发收款码就行」这样自信满满的说法,换成是我——一个已经写了 N 篇关于 AI 幻觉报道的作者,高低也想尝尝咸淡:我倒要看看,你一个 AI 能怎么圆。

当 AI 开始「瞎承诺」

豆包退机票事件的爆火并不意外。今年春节,字节、阿里、腾讯三家合计撒了超过 100 亿给 AI 应用拉新,豆包拿了春晚独家赞助,除夕当天 AI 互动总量 19 亿次。截至 2026 年第一季度,豆包的月活跃用户已经达到 3.4 亿,日活突破了一亿。

3.4 亿用户里,有多少人是今年春节才第一次用上 AI 的?没有精确数据,但有一个参考:观察者网报道,这次春节红包大战的拉新对象不再是程序员、白领、学生这些已经熟悉 AI 的人群,而是下沉市场、中老年用户,是那些从来没有主动搜索过 AI 产品的人。

也就是说,当豆包说「放心退,只扣 5%」的时候,对面很可能是一个根本不知道「AI 幻觉」是什么的人。

退机票不是唯一的案例。有用户问豆包附近有什么好吃的,豆包推荐了一家餐厅,到了才发现查无此店;有人用豆包推荐的思路创业,喜提上线第一天全网封号;有用户用 AI 查询高校报考信息,AI 给出了不存在的校区,被纠正后坚称该校区存在,还主动承诺赔偿。

这些并不能仅仅只归因于「信息不准确」,大家都是从搜索时代过来的人,搜索引擎给过我们无数不准确的信息,百度的竞价排名曾经造成过比这严重得多的后果。

这些因豆包而起的「人祸」,共同点在于这些 AI 不只是说错了话,它们还在错误的基础上,追加了承诺。

搜索引擎给你 10 条结果,你自己判断。对话式 AI 给你一个结论、一个保证、一套行动方案,判断的负担被转移了。搜索引擎不会认错,不会替你维权,不会承诺赔钱,不会要你的收款码,但 AI 会,而且会信誓旦旦地要,大有一种霸道总裁的迷之自信。

「信息幻觉」已经不够准确了,这是承诺幻觉。

拿着豆包的承诺,能讨个说法吗?

随着越来越普遍的使用,承诺幻觉造成的问题也越来越多,已经进入了司法视野。

今年 1 月,杭州互联网法院审结了全国首例因 AI 幻觉引发的侵权纠纷案。案件中,原告梁某在使用一款 AI 应用查询高校报考信息时,收到了关于某高校主校区的不准确信息。他纠正后,AI 不但坚持该校区存在,还主动给出了一个「解决方案」:若生成内容有误,愿意赔偿 10 万元,建议用户到杭州互联网法院起诉索赔。

梁某真的起诉了,要求开发公司赔偿 9999 元。

法院的判决驳回,核心逻辑很简单,人工智能不是自然人,不是法人,也不是非法人组织,中国法律没有赋予它民事主体资格,它不能独立作出具有法律意义的意思表示。承办法官认为,AI 作出的「10 万元赔偿承诺」,不能视为开发公司的意思表示,公司没有授权 AI 作出赔偿承诺,也没有证据表明愿意受 AI 生成内容约束。

简而言之,AI 说的话,不算公司说的话,不管 AI 承诺了什么,在法律上都是无效的。

但是在这个判例中,法官留了一个口子。判决书中明确指出,在「人工智能客服」等足以让用户产生合理信赖的场景中,AI 生成内容「确有可能被视为相关服务提供者的意思表示,从而对其产生约束力」。

通过场景的限定,从而实现对其行为的约束,这是很聪明的做法。毕竟,当豆包从普通的聊天助手越来越像「服务助手」的时候,通过场景来判断就至关重要了。用豆包写诗,它的承诺算不算数无所谓;但用豆包退机票,而且一来一回,又有咨询、又有建议,场景的性质就不一样了。

当「放心」和「免责声明」出现在同一个对话里

豆包事件后,字节跳动回应称,豆包在涉及金融、退款等场景时会有风险提示。其实这都是 AI 产品的基操了,几乎每一个 AI 应用都会在界面某个角落写一个类似于「生成内容可能存在错误,请慎重辨别」的提示。

但问题是,这句风险提示和「放心退,只扣 5%」出现在同一个对话窗口里。一个是被动的、系统级别的、静态的小字,另一个是主动的、针对你的具体问题给出的、带着肯定语气、还被加粗或者高亮出来的回答。

你会听谁的?你难道就不会恍惚一下吗?

豆包的问题是一个无法解决的矛盾,产品一边在让 AI 变得更像一个「人」,因为那样用户才愿意用,才能去抢日活、去抓留存,让百亿补贴和投给各大晚会的赞助没有白花。另一边,又在用免责声明提醒用户,别当真。

一个嘴上对你说「放心,相信我」的人,但同时胸前挂一张「我说话可不算数」的牌子,这个画面在现实生活中,我们叫:诈骗。

当然,AI 不是在故意诈骗,它没有意图,没有动机,更没有「故意」可言。它只是在做它被训练来做的事,生成听起来合理的下一句话。而当用户说「你赔我」的时候,听起来最合理的下一句话就是「好的,我赔」。

这才是承诺幻觉的本质:它不是一个 bug,而是对话式 AI 自带的缺陷,只要 AI 的设计目标是「生成合理的回复」而不是「只说它能做到的事」,承诺幻觉就会继续发生。

信息损失还是信任损失

回到最初的问题:这和百度给错信息有什么区别?

百度给你一条错误的搜索结果,你的反应是「这个搜索引擎不行」,这是工具层面的失望,你下次换一个搜索引擎就好了。

豆包对你说「放心退,我负责」,然后什么也没做到,你的反应是「它骗了我」。这是关系层面的背叛,即便你理智上知道对面是 AI。

有一个很好的侧面观察可以说明这一点。今年社交媒体上流行了一个词叫「豆包型人格」,年轻人把豆包的说话方式当成理想人格来模仿,不内耗,秒回,永远积极。

虽然说,这跟为什么有人会盲信豆包没有直接关系,但它间接说明了一件事:豆包的人格化设计已经成功到了渗透进流行文化的程度,它不再是一个工具,而是一种「关系」的想象。

而当一个「关系」失信时,用户感受到的不是工具失灵的不便,而是被人欺骗的愤怒,哪怕这个「人」并不真的存在。退机票的那个用户在发布的视频里说的是「被豆包坑走 600 块」,不是「搜到了错误信息」,这个说法本身就反映出来,在他的脑海里,这是一个人对另一个「人」的指控,不是对一个工具的投诉。

实际上谁都会说,AI 就是个工具,用户不应该轻信 AI 的表述,但谁也没法否认产品的整个设计方向,明里暗里就是让你多信它。把一个产品设计得温暖、主动、有问必答、说话像朋友,都是为了让你更依赖它,从而忽略角落里贴的那一行免责声明「不要当真」。

这倒也不是豆包一家在做,而是所有 AI 产品的趋势。不同的是,目前不同的司法体系有所的处理方式不同。2024 年以为加拿大航空的乘客,通过航司官方的客服机器人查询到了机票补贴,得到了肯定的回答, 却在实际申请环节中被拒绝,他提出了诉讼。

这个案例最终得到了法庭的支持,即便这只是机器人,但它出现在航司的官网,就是航司的代表,航司应当为它的承诺负责。最终,乘客得到了 800 加元的赔付,减去利息和仲裁费,真正的退款差额,也是 600 多加元。

600 块不多,但这 600 块的代价由用户全部承担,就成了一种对豆包错付信任的代价,字节跳动受到 0 元的惩罚。

这可能是承诺幻觉最大的问题:不是 AI 会瞎承诺,而是瞎承诺的代价,从头到尾只会落在用户身上。

#欢迎关注爱范儿官方微信公众号:爱范儿(微信号:ifanr),更多精彩内容第一时间为您奉上。

再访 XREAL 徐驰:做眼镜是场万米长跑,靠运气也靠打怪升级

作者 杜晨
2026年5月27日 16:26

XREAL 把今年的第一场发布会,留给了一个之前没听说过的新牌子:xbx。

内部的全称是 x, by XREAL。

考虑 1699 的定价,xbx 的第一款产品 a01 的性价比相当不错:50° 视场角,tandem OLED 显示模组的亮度高达 1600 尼特,等效 4 米左右 147 英寸大屏,支持 HDR10 和在至高 120Hz 帧率下的空间防抖。

但参数远没有颜值和戴起来轻松更重要。62g,半透明未来感机身,可替换的多种个性化镜框。CEO 徐驰说,「颜值就是正义,只管玩就好。」

这是成立十年来一直在拼了命地往「上」冲的 XREAL,第一次「向下」。

过去这些年,徐驰和他创立的 XREAL 从来没有走过容易的道路。尽管中国的消费电子供应链资源足够好,以至于整合能力成为了成功的硬件创业者必备的素质——XREAL 却是不搞纯粹的「供应链整合」的。

正相反,XREAL 一直都在往上走,做最贵、最难、最「极客」的产品。为此,XREAL 不惜做极高比例,同时也是同行中最高比例的自研,甚至不惜因为过去两三年里的国际半导体波动,而损失相当一部分利润率。

这才是为什么去年 XREAL 能和硅谷巨头 Google 联合推出 Project Aura,一台令行业人士刮目相看,也让消费者打破对现有「智能眼镜」刻板印象的原型机(今年将正式面市)。徐驰毫不收敛地将 Project Aura 称为他所在的行业体验的「天花板」。

能做出这样的产品,断不可能靠整合供应链。为什么只有 XREAL 能做到,为什么谷歌选择了,LG、ROG 等也都选择了 XREAL?

徐驰说,答案是 XREAL 的 A 面:内敛、冷峻、长期主义、押注绝对的技术创新。

那么,XREAL 的 B 面又是什么?

在徐驰带领着公司一往无前地朝着头戴式显示技术的性能优化与极致轻量化冲刺的同时,他的背后险象环生:

在通过 Apple Vision Pro 试水也试错了之后,苹果立项了更多轻量级 AI/AR 眼镜产品,如无意外将于 26H2-27 全年逐步问世;小米、阿里千问、Rokid、VITURE 等纷纷杀入市场。

它们当中,有的用 AR 显示眼镜围攻 XREAL 占据已久的光明顶,更多的则是用 AI 眼镜(屏显/无屏)来提前抢占行业领头者尚未明确布局的新空间——无论何种产品定义,价格都被压得越来越低。

对此徐驰并不紧张。在和他深聊过后,爱范儿得出这样的感觉:XREAL 的 A 面朝前太久了,以至于同行们似乎误认为它没有或者不屑于展现另一面。

「怎么说呢,A 面没立住的时候,就没有 B 面。我们现在来了,虽迟但到。」

XREAL 主品牌的势能已经积攒到位,徐驰和他的产品团队终于腾得出手去做另一种风格的产品——一个更年轻、外放、价格也更亲民的牌子 xbx。

这就是 XREAL 的 B 面,与那个永远创新不止的 A 面,互为映照。

他说,自从创业以来,见到了 VR/AR 的泡沫,破了;然后元宇宙来了,也破了。一路走来,这次创业越来越像一场万米长跑——这也是从一开始他就坚信的赛制。「抢跑一点都不重要,跑对方向才重要。」

所以,徐驰看起来并不担心这些新来的竞争者。问他怕不怕大厂和其它创业公司一拥而上,他答:「我们最怕的,是这个行业只有自己。如果没有别人,没准说明我们走错了方向。所以热闹一点挺好的。」

2016 年,徐驰离开混合现实先驱企业 Magic Leap,回国草创,做一副在当时没人看好的眼镜。

快十年过去了,他庆幸 XREAL 能活到今天,运气占了相当大的因素。

「感谢这个赛道前十年的起起伏伏,让我有机会不断打怪升级……等到真的要跟大厂掰手腕的时候,不至于一上来就是总决赛。」

爱范儿等与徐驰、XREAL 产品负责人刘宗楷进行了一次专访,从全新的子品牌 xbx 和第一副价格打到 1699 元的 AR 眼镜产品 a01 聊起,一路聊到他怎么看待竞争,如何比较自己与同行之间的资本效率、AI 眼镜会不会最终取代手机,以及一个第一次创业的人,凭什么活到今天。

「年轻人最好的,就是不迷信传统」

爱范儿:XREAL 这些年的特质就是高端化,为什么要在这个时间点推出 xbx 这个品牌?

徐驰:我们一直说,今天的智能眼镜行业很像 05、06 年的手机行业,很碎片化,系统、应用生态、交互范式都不统一。在这个相对早期的阶段,没有哪个品牌能够覆盖所有的价位段。所以我们就想,有没有可能做两种风格不一样的产品,像 A 面与 B 面一样。

这个行业充满波折,是出了名的难做。很长一段时间里,大家都在摸索,我们自己也(一段时期内)没有一个特别清楚的定位。但是「XREAL 」在我心里就是那个极致创新的品牌,更冷酷、更经典。但是,一个品牌尚未立住的时候,我没办法再去做一个更大众、更宏观的东西。

慢慢地,XREAL 成为了我想要的那种更内敛的品牌,这时候,就可以有一个更绽放的品牌跟它相互映照了。这就是我说的 A 面与 B 面。A 面没立住的时候,就没有 B 面。

这件事虽迟但到。从今往后,我们不只是一家叫 XREAL 的公司,还是一家 x by XREAL 的公司。

爱范儿:年轻人想要什么样的 AR 眼镜?难道年轻人就不想要极致的产品?

刘宗楷:对年轻人来说,个性与自我表达是每个人心里的渴望。市面上不管是 AR 眼镜、AI 眼镜、还是 XR 头盔,很多人下意识觉得这东西就该不好看、不轻便。但我们偏要反着来,为什么不先做出一副好看、够轻、年轻人愿意戴在头上的眼镜?一副愿意戴出门的眼镜,是所有事情的第一步。

徐驰:年轻人最好的,就是不迷信那些传统的大道理。颜值就是正义,好看就好,好用就好。我们希望用 a01 这副眼镜让大家明白,一千多块的价格也可以做到两千多块的体验。我们会把它长期做下去。

爱范儿:必须戴到外面,才能影响更多潜在受众。

徐驰:没错就是这样。我们希望这个产品可以在地铁上,在咖啡馆里,在飞机上,在各个地方,更多的年轻人把它戴到外面,而且是不尴尬的。所以我们做了极致的轻量化和个性化设计。

爱范儿:轻量化肯定有取舍。一个产品想做更高的分辨率、帧率、视场角,模组就会变大;模组大了,重量就会大、配重也会失衡。

刘宗楷:做轻的同时还要保证体验,真的非常难。镜片和外壳的厚度能不能再降一点,但强度还能保住。每一个器件既要轻还要保住性能,我们抠了很多细节。

这条路没有尽头,就是一个个夜晚,一次次较劲和争吵。当然,我们觉得还可以做得更好。

爱范儿:AR 眼镜能做到的 FoV(视场角)物理极限是多少?以及不考虑极限,只说在不同场景下人类佩戴的人体工学舒适度,最优解是多少?

徐驰:我给你个最直接的答案,最好的视场角应该是在 85° 左右,但这是在不计成本堆料、不考虑重量的前提下。

在 Project Aura 上,我们做到了 70°,在这个产品形态下已经是非常不错了,但是仍然有差距。什么时候我们能做到 85°,并且仍然是轻量化的,那么我们会觉得至少在显示端做到极致了。

刘宗楷:根据场景来看,比如你戴上 VR 头显去火星,画面主体是一艘宇宙飞船,背景则是宇宙星空——你需要同时看到主体和背景才能获得最大的沉浸感。但是对于 AR 眼镜,最好的背景其实是真实世界。如果是打游戏或者看球赛可能就不需要很大的角度;但如果是看电影,或者附着在真实环境里的 AR 显示,那么宽视角的沉浸感就更重要。所以最终还是取决于内容是否沉浸。

至于人眼的注意力聚焦视角,从眼科学上来说的确有极限,一般就是水平方向的 50° 左右,垂直的 30-40°这个区域内。

视场角并不是唯一的关键因素,还有电致变色、性能续航等等。在我们定义不同产品的时候,会有无数个取舍的拨杆,往不同的方向去拨。

「我们最怕的,是这个行业只有自己」

爱范儿:苹果也入场了,国内大厂的竞品也已经上市,价格越压越低。你怎么看?

徐驰:大家进来,我认为是好事。我们最怕的是什么?是这个行业只有我们自己——那说明这个赛道没人关注,没人看好。

我们始终认为,眼镜是最有机会替代手机的下一代计算终端。虽然已经创业十年了,我们也才刚刚开始,我们的渗透率可能还不到 1%,后面还有百倍甚至更大的成长空间,所以大家一起来把蛋糕做大是件好事。

我们这个行业是有泡沫的,但泡沫不一定是坏事,说明大家对行业的期待值很高。过去在每个阶段,都有过想挣快钱的人,发现不好赚就走了。泡沫褪去,受害的其实是消费者。而真正推动行业往前走的,是那些把「用户期待」和「产品体验」之间的差距一点点缩小的人。

打个比方,今天的 AI 眼镜就像五岁小孩,而我们定义的全天候佩戴的 AI 眼镜就像贾维斯。这中间的差距得靠底层创新去一点点推动。这些创新不会无缘无故发生,背后一定有人负重前行。

问:你们跟 Meta 的距离还有多少?

徐驰:举个不那么恰当的对比:2025 年 Meta 的 Reality Labs 业务营收是 22 亿美元,亏损接近 200 亿美元。我们今年做到了 2 亿美元营收,差不多是它的十分之一,但我们的亏损不到 2000 万美元。

十分之一的营收,千分之一的亏损,我觉得我们的资本利用效率还可以,这也是我们的优势。

爱范儿:你们有自己的全栈自研芯片、光学,但 Project Aura 的部分算力还是用的骁龙,两者这两者是什么关系?将来 XREAL 会否提高核心算力的自主性?

徐驰:X1S 是一颗完整的 SoC。在 Aura 上,所有对延迟和带宽敏感的计算,放在我们的 X1S 芯片上,其它的给骁龙。

我们的芯片就是纯端侧计算,骁龙芯片放在 puck(外挂的计算单元) 上。这两者不是处理器和协处理器的关系,而更像是「端侧」和「云」之间的关系。有些计算需要发生在离你更近的地方,更加及时。

我们一直说眼镜会取代手机。在可预见的将来,puck 会消失,直接换成你的手机就行了;更长远来看,如果眼镜真的取代手机,它需要自己能够处理所有的计算。这才是我们为什么押注自主芯片的意义所在。

前段时间美国出台禁令,先进制程的晶圆不能直接运进中国大陆。这件事挺流氓的,我们的芯片在这个范畴内,本来要在大陆做封装,结果必须在台湾封装完才能运回大陆。当时国内一大批芯片厂商都在争抢台湾的封装资源,造成了一次性的短缺,跟今天的内存短缺很像。为此,我们的业绩也少了蛮大一块,否则去年 Q3、Q4 的增长会很明显。

但从长远看,这反而驱动我们继续往前走。还好我们今天销量不是很大,总比卖了几百万台突然被卡脖子要好(笑)。我们希望中国有越来越多的先进制程握在自己手里,谁也卡不住。

爱范儿:Project Aura 在国内能上吗?你们会选择哪些国内模型厂商一起探索?

徐驰:因为 Android XR 和 Gemini 强绑定,而 Gemini 在国内用不了。所以很遗憾,要不你海淘吧(笑)。

我们不会放弃国内市场,如果 Android XR 能够和 Gemini 解耦,连上国内 AI,就是 Project Aura 进入国内市场的时候,但不是今天。就像当年 iPhone 也不是刚问世就进入中国。我觉得这个结果我们可以接受。It’s okay.

对我们来说,阿里是我们的股东,我们也一直跟字节跳动保持交流。在模型方面,我们不会排斥任何一家。我们的终极理想,是 AI 能像搜索引擎一样换着用。未来的大模型会变成基建,谁家的 token 效果好就用谁,可以无缝切换。

「眼镜凭什么取代手机?」

爱范儿:你自己也说,AR 眼镜这个品类存在很多年了,但渗透率仍然很低。让更多人接纳它的「入门毒药」会是一个怎样定义的产品?

徐驰:大概率还是主流两大类:更加全天候的 AI 眼镜、带显示但不够全天候的 AR 眼镜。

这个「全天候」(always-on) 有两层意思:一是全天候佩戴,二是全天候使用。今天的问题是,AI 眼镜的主要场景不是 AI,而是听歌拍照;你打开相机拍个 30 分钟,产品就没电了。如果说眼镜是你的个人助理,但它每天只能睁眼 30 分钟……那就不是一个全天候的助理。

在将来的某个时间点,会有一款 35g 以下、全天候续航的产品,作为 AI 交互的载体。这样的产品,我认为是能做到的。如果做到了,它绝对会是人手一个的设备。

另一条路就是 AR 眼镜,追求更高清、更多内容。这个路线今天还是分体机形态,能做到 60g,但终极形态可能会是一体机。

这两种产品,一个像 iPhone,人手一台,整个品类可能是每年十多亿台的出货量;另一个像我们现在的设备,做到终极形态可能是平板和笔记本电脑加起来的体量,一年 1.5 到 2.5 亿台,也很不错;以及传统头显,可能体量会像台式机——这三者会长期共存。

至于那个彻底引爆品类,将眼镜真正推上「取代手机」道路的产品是什么,我认为到 2027、28 年,我们会看到更清晰的答案。

爱范儿:即便做到了极致的轻量化,你怎么说服那些仍然嫌重的客群?

徐驰:我认为今天大家太容易先行代入刻板印象,比如「没有 35g 绝对不戴」。今天的行业里,抛开补贴的产品,还没有不吃国补、销量过百万的产品。如果真能达到 35g,早就是 15 亿台的水平了。

我们得一步步来:先把一个单品做到百万,再做到千万,再做到一个亿、15 亿。中间有好多级台阶。我相信在今天,一副体验足够好的眼镜,50g 也不妨碍它卖一个亿。影响接受度、卡住销量的只是体验还没有打磨足够好。

爱范儿:手机厂商觉得未来 5-10 年里手机仍是主角。但与此同时手机厂商也在做眼镜。你看到的未来竞争格局是怎样的?

徐驰:的确,今天存在的东西,很长时间内仍然会存在。但核心是谁能站在价值链的最高点。就好比曾几何时我们觉得互联网大厂的超级 app 太牛了,但今天它们的风头一定没有 AI 公司更盛。手机也是一样。随着科技发展,总有一些新的领域、企业,会站到价值链更高的位置。

我们相信未来两年内会形成共识:眼镜是离 AI 最好的原生终端,它可能是离多模态 AI 最近的东西。这也是为什么我们跟谷歌一起去畅想未来的全新交互范式,以及新范式下的终端长什么样。

这件事令我非常兴奋,一是因为它难,二是如果做对了,会非常 rewarding。

爱范儿:其它形态的 AI 硬件,比如 pin、带摄像头的耳机,不如眼镜吗?

徐驰:不光我这么想,Demis Hassabis 也说眼镜绝对是所有 AI 里最中心的设备。因为只有眼镜能够拿到人的关注点这一关键上下文信息。

你戴了一个 pin,它能看到你面前有一堆人,但眼镜在未来会有眼动追踪,它能知道我当下到底在看什么,周围的信息可能没那么重要。只有眼镜能带来端到端闭环的数据链路,其它终端都不具备这个能力。当然别的形态可以辅助,但眼镜一定是最关键的入口。

「靠运气,也要打怪升级」

爱范儿:创业者、企业家会有不同恐惧来源,可能是内部的组织效率跟不上时代,可能来自同业的竞争,可能来自异业的颠覆。足以让你从睡梦中惊醒的恐惧是什么?

徐驰:做企业和做人一样,做人也会迷茫,有人给你指点,让你找到对标。但我觉得说到底,烦恼都是自己给的。

我相信伟大的企业全是价值观驱动的。最核心的就是找到一个组织舒服的状态,让全公司都认可你的这套价值观——无论离开还是留下,都会继续在这套价值观的规范下做事。只要这件事做到了,竞争也好,别的也好,其实都还好。

我个人睡眠还挺好的,我觉得这是创业者得有的一个特质(笑)。

要说真有什么让我担忧,那就是我所崇尚的价值观,是否真的能够百分百贯彻执行?我怕的是 XREAL 变大了,文化会被稀释掉。我需要大家打心底里相信一件事:我们要当创新者、引领者。这不容易,在中国尤其不容易。在中国大家的习惯是服从等级制度,「老板说的都对」,可我还是希望,大家既能自下而上,又能自上而下,形成一个扁平高效的机制。

爱范儿:就像你说的,几轮泡沫起起伏伏,XREAL 还是活到今天了。

徐驰:2016 年我从 Magic Leap 回国,到今天整整十年了。那时候真是草根创业,我就是想做一副眼镜。能活到今天,回头看真是运气挺好。这是我的第一次创业,也感谢这一路的投资人(以及其他同行者),让我在这个过程里慢慢理解了怎么去运作一家企业,一个组织,一门生意。

说实话,如果这个行业发展再快一点,起势再猛一点,没机会把自己磨练好,去应对巨头杀进赛道时那种强烈的竞争,可能我们就没了。

每个创业公司大概都得经历这么一段:你得先打怪升级才能站上更大的舞台。如果一上来就是总 boss,来一帮阿里字节那样的对手就没得打了。所以我其实挺感谢这个赛道前十年的起起伏伏,才有一天让我能跟大厂掰一掰手腕。

AR 行业是出了名的难做,我又干得有点久了,所以对这些事现在看淡了。只要大家都还在牌桌上,这就是一件长期主义的事情。

我认为 AR 是一场万米长跑,跑对方向比抢跑更重要。如果行业还在早期但所有人都往一个地方冲,那个所谓的共识可能就是泡沫。反而是早期非共识的东西,最后被时间验证是对的。历史无数次这样告诉我们。

文|杜晨

采访|杜晨

#欢迎关注爱范儿官方微信公众号:爱范儿(微信号:ifanr),更多精彩内容第一时间为您奉上。

小米:请叫我 Token 价格屠夫

作者 莫崇宇
2026年5月27日 17:54

押注 2026 年 Token 大涨价的人,短短一周迎来两次打脸。

5 月 22 日,DeepSeek 宣布 DeepSeek V4 Pro 永久降价;今天凌晨,小米 MiMo-V2.5 系列跟进降价,最高降幅达到 99%。

与此同时,小米 Token Plan 计费体系同步优化,定价不变,可用量提升至原来的 5 至 8 倍。

没有出乎太多意料,海外 Reddit、X 平台以及各大开发者论坛上关于小米 MiMo 模型降价的讨论热度也是迅速飙升。

只是,在全行业都在高喊 Token 成本吃不消的当下,小米为何敢于逆流降价?更重要的是,这波降价操作又会把 AI 行业推向何方

Token 价格打骨折,AI 行业迎来最严厉的父亲

小米此次公告显示,旗下 AI 大模型 MiMo-V2.5 系列 API 将进行永久降价,最高降幅达 99%,且不再区分输入长度。新价格已于北京时间 5 月 27 日 0 点全球同步生效。

不过,99% 的降幅并不意味着每一次调用都会按最低价计费,关键变量在于输入缓存是否命中。

以 MiMo-V2.5-Pro 为例,一旦命中缓存,输入价格被击穿至约 0.025 元每百万 Tokens。而如果输入缓存未命中,价格依然维持在 3 元每百万 Tokens,输出价格则为 6 元每百万 Tokens。

也就是说,这个极低价格成立的先决条件,是请求必须大量命中缓存。

对于高重复上下文、高频 Agent、多轮代码任务以及批量推理任务来说,这个价格拥有极强的吸引力,但如果你的应用场景缓存命中率堪忧,真实成本显然不会触及最低点。

Token Plan 的玩法也有着相似的逻辑。

小米强调定价不变,Credits 大幅提升:Lite、Standard、Pro、Max 四档月费仍是 39 元、99 元、329 元和 659 元, Credits 的额度,也从 0.6 亿、2 亿、7 亿、16 亿提升到对应的 41 亿、110 亿、380 亿、820 亿。

且按照新的换算关系,MiMo-V2.5-Pro 命中缓存只需 2.5 Credits / token,未命中缓存则要 300 Credits / token,输出为 600 Credits / token。

这与 DeepSeek 的打法如出一辙。

简单回顾一下时间线:4 月 24 日 DeepSeek V4 预览版发布;次日 V4-Pro 开启 2.5 折优惠;4 月 26 日,缓存命中价格暴降至首发价的十分之一;到 5 月 22 日,临时折扣干脆变成了永久降价,V4-Pro 永久降至原价的四分之一。

一番调整过后,DeepSeek-V4-Pro 的输入缓存命中价格从 0.1 元直接降到了 0.025 元。随着小米 MiMo-V2.5-Pro 的火速跟进,国产模型的缓存命中输入价已经被彻底焊死在了这一基准线上。

DeepSeek 和小米都把最有冲击力的价格放在缓存命中和场景,原因并不复杂。大模型正在从聊天走向干活,而 Agent 才是 token 消耗真正放大的地方。

在聊天场景里,用户问一句,模型答一句,成本相对容易估算。

但在 Agent 场景里,一个任务可能包含长上下文、多轮推理、代码生成、工具调用、网页读取、文件分析和结果校验。用户看到的只是最后一次输出,后台却可能已经发生了多次请求和大量上下文读取。

这就是缓存命中重要的地方。

Agent、代码助手和长上下文应用有一个共同特点:很多内容会反复出现。比如系统提示词、项目代码、API 文档、工具说明、历史对话、依赖文件等。这些内容如果每次都重新计算,成本会很高;但如果能被缓存,下次再用时只按缓存命中价格计费,推理成本就会明显下降。

也就是说,缓存命中价格越低,越适合高频、多轮、长上下文的真实工作场景。DeepSeek 和小米低价背后,其实也是为了先把开发者和高频应用吸引进来,让更多 Agent、代码助手和办公自动化应用愿意跑在自己的模型上。

小米此前通过 MiMo Orbit、百万亿 Token 创造者激励计划等活动,让更多人体验 MiMo,并解决真实问题。这个百万亿 Token 激励计划自 4 月 28 日上线,到 5 月 26 日 16:08,100T Tokens 已全部提前发放完毕。

从平台视角看,低价 token 和免费额度换来的是海量真实调用。真实调用会带来复杂任务、失败样本、用户反馈、Agent 工作流、代码场景和长上下文数据,这些都会反过来帮助模型和推理系统迭代。

社区里的「养虾党」现象,也可以放在这个逻辑里理解。用户在最大化消耗额度的同时,也在帮助平台制造压力、暴露问题、积累调用数据。

所以这笔账不能只看单次推理毛利。短期收入被压低,换来的是开发者迁移、调用规模和真实反馈。对想争夺 Agent 生态位置的模型厂商来说,这是一种非常划算的平台投入。

罗福莉的真香定律,背后是工程暴力

不过,光有意愿还不够,关键是降得起。小米这次降价的特殊之处,正在于它和 MiMo 大模型负责人罗福莉此前的公开表态形成了反差。

一个月前,罗福莉曾公开反对 token 价格战。她当时的判断是,低价 token 加开放第三方 Agent 框架,容易让平台陷入成本失控。

她提到,第三方 Agent 框架往往上下文管理粗放。单次用户查询可能触发多轮低价值工具调用,每次请求又携带超过 10 万 token 的超长上下文。如果平台无法约束这类浪费,真实 API 成本可能是订阅价格的数十倍。

她还认为,全球算力供给已经跟不上 Agent 带来的 token 需求增长。大模型公司在没有厘清编程和 Agent 场景成本结构之前,盲目价格战会导致限流、降配、稳定性下降,最终损害用户体验。

但小米这次降价没有推翻此前判断,而是改变了价格战成立的前提。罗福莉此前反对的是没有成本结构支撑的低价。小米现在展示的,是一套自认为能够支撑低价的推理工程方案。

按照小米公告,其技术团队基于 SGLang HiCache 完整支持 SWA,也就是 Sliding Window Attention,将 KV Cache 在 GPU 显存、CPU 内存、SSD 等多级存储之间的数据搬运量降低至优化前的近七分之一,并将可缓存 token 数量提升至优化前的近五倍。

与此同时,小米还优化了专家并行方案和输入长度分桶策略,以提升集群输入吞吐能力。没有这层工程能力,低价很容易就会变成不可持续的补贴。有了足够强的 Infra系统,低价才可能转化为长期优势。

价格战考验工程能力,也考验后方厚度。

不同于纯 AI 模型公司,小米的手机、汽车、IoT 和消费电子业务,给它提供了更长的投入周期和更大的战略耐心。它可以把大模型服务看作 AI 生态入口,避免陷入只按短期 API 收入斤斤计较的困局。

这对中小模型公司并不友好。没有主业输血,没有过硬的 Infra 实力,也没有足够调用规模摊薄成本的玩家,注定无法长期跟进这种价格。

DeepSeek 的低价已经直接威胁到不少国产模型的市场定位。而随着小米 MiMo 的跟进,更多仍有体量的厂商会被迫调整价格或将重新定义产品价值。更小的模型服务商,则可能被推向更窄的垂直场景。

这轮降价某种程度上也是效率派模型厂商对市场的一次筛选。有工程能力、算力调度能力和生态入口的公司,可以承受更低价格带来的压力。只有模型能力、但推理成本压不下来的公司,会越来越被动。

并且伴随继续下探的空间逐渐变窄,价格越接近物理成本,单纯降价的价值越有限。下一阶段,模型质量、Agent 适配、开发者工具、生态绑定、服务稳定性和企业交付能力,也都将迎来新一轮内卷。

模型能力决定了 AI 发展的上限,而推理成本决定了 AI 普及的规模。等到真正便宜的 Token 涌入应用层时,我们才会真正看清,属于 AI 的下一个爆发时代会是什么模样。

#欢迎关注爱范儿官方微信公众号:爱范儿(微信号:ifanr),更多精彩内容第一时间为您奉上。

大公司的 AI 账本,没有一笔算得过来

作者 Selina
2026年5月28日 21:09

今年四月,Uber 的 CTO 发现了一件事:公司全年的 AI 工具预算,四个月就花完了,这件事是整个硅谷「token 消耗大比拼」的一个典型例子,我们之前也写过。

但就在几周后,Uber 的 COO Andrew Macdonald 在播客里给同事「补了一刀」:token 消耗和交付给用户的功能之间的联系,还不存在

▲ Andrew Macdonald 图片来自:Business Insider

Uber 在去年底部署了 Claude Code,95% 的工程师每个月都在用,70% 的提交代码来自 AI,使用率惊人,账单也惊人。每个工程师每月的 API 调用费在 500 到 2000 美元之间,同一个人用同一个工具,同一天的消耗差异可以达到十倍。CTO 不得不说自己要推到重来,「因为我以为够用的预算,已经被吹走了」。

他们花了很多钱让 AI 写代码,但花的钱和最终产出之间,看不到因果关系。钱确实花了,代码确实写了,但用户体验提高了多?新增了多少有用的功能点?问就是不知道

另一个方向的同一个问题

Uber 的困境是钱花了,成效没出来,但很多公司选择的是另一条路,由于看到了 AI 的潜力而大举裁员,认为 AI 可以代替

不是给人买 AI 工具,而是用 AI 代替人,这条路的账算得过来吗?

Gartner 今年发布了一份调查,覆盖 350 家年收入超过十亿美元的全球企业,结果发现:80%的企业在部署 AI 后都裁了人。可是裁员率和 ROI 之间,完全没有相关性,裁得多的公司和裁得少的公司,回报率几乎一样。

这个结果反直觉,但仔细想想又很合理。裁员省的是人工成本,但省下来的钱并没有变成新的业务价值。它只是让财报上的数字好看了一个季度,而不是让公司真的变得更强。Gartner 的结论很直接:裁员可以腾出预算,但不创造业务价值。

AI 驱动的裁员,ROI 是零,为什么老板们还在做?本质上,裁员不是经营决策,是信号。对投资人说「我们在用 AI 了」的效果,和对董事会说「我们的运营效率在提升」的效果,都比真实的 ROI 重要得多。

Fortune 的分析把这叫做「AI washing」,用 AI 做借口裁员,实际上纯粹是在砍成本充利润,和 AI 能不能替代这些岗位,没有一点关系。

一个悖论

这样看,AI 会带来管理上的自相矛盾:用 AI 替代人,省了工资,但 ROI 没提升;给人用 AI,效率似乎提升了,但预算先爆了。

AI 工具的计费模式和传统软件完全不同。传统软件是按席位收费的,每个人每年多少钱,写进合同里,可以预测。但 AI 工具是按 token 收费的,用多少算多少,而且每个人的用量差异巨大。Uber 的数据显示,同一个工程师同一天的消耗可以相差十倍。这意味着传统的 IT 预算模型完全失效了,你没法在年初预测年底会花多少。

这像什么呢?像从固定费率的健身房会员卡,换成了按次计费的私教。你以前每个月交 299,去不去都那么多。现在每次去都要单独付费,去得越勤花得越多,而且你的员工各自去得多勤你完全无法控制。

不用吧,怕被淘汰;用吧,账算不过来。

钱去了哪里

Gartner 其实在报告里很克制地提了一句预测:到 2028 年到 2029 年,自主化业务反而会净增工作岗位。这听起来像没什么用的安慰,实际上它暗示的是现在裁掉的人,未来可能还得重新招回来。只不过到时候他们的岗位叫「AI 协调员」或者「模型运营」之类的,工资可能也不一样了。

打工人被裁了,公司也没赚到更多,预算还爆了。钱去了哪里?当然是 AI 公司的营收里。Anthropic 今年的年化收入已经突破十亿美元,OpenAI 更高。当 Uber 的 CTO 说「预算飘走了」的时候,那些被吹走的预算正好落在了 Anthropic 的账户里。

这是一个经典的淘金热结构。真正赚钱的从来不是淘金的人,是卖铲子和牛仔裤的人。现在的铲子是 API,牛仔裤是 token。每一家公司都在拼命用 AI,拼命让员工用 AI,拼命用 AI 替代员工——而 AI 公司在所有这些拼命的每一个环节里都在收钱。

AI 没有在省钱,它在换一种花钱的方式。

以前花在人身上,现在花在模型上;以前花在工资里,现在花在 token 里;以前花得可预测,现在花得无法控制。甚至,以前花的钱留在了员工手里,他们会拿去消费、娱乐、还房贷,钱在经济体里循环。

现在花的钱,直接进了几家硬件密集型、融资密集型的 AI 公司的账上,变成了下一轮 GPU 采购和下一轮融资的底气。

所以当你看到「某公司宣布用 AI 优化人力结构」的新闻时,可以翻译一下:我们把给员工的钱转给了 AI 公司,但我们并不确定这笔交易是否划算,我们只是知道,如果不做这笔交易,投资人会不高兴。

#欢迎关注爱范儿官方微信公众号:爱范儿(微信号:ifanr),更多精彩内容第一时间为您奉上。

OPPOReno16Pro,一台不肯「收着来」的手机

作者 苏伟鸿
2026年5月29日 12:00

用了一周的 OPPO Reno16 Pro,我感觉它不像一台 2026 年的手机。

并非落后。刚好相反,它太不收着了。

从今年以来,消费电子产品的成本一直在往上堆:存储、芯片、电池,每一个都是绕不开的账。放到手机厂商面前,选项其实并不复杂:要么「减价减配」,要么「微涨不配」,要么「小升小涨」。真正选择「加量加价」的产品,反而少见。

OPPO Reno16 Pro 有点不一样,它没有那种局促感。在今年,它是一台少见的「宽松」手机。宽松不是说尺寸宽,而是当很多产品开始收紧成本时,Reno 仍然愿意把好的东西放进产品里,把涨上去的价格放在看得见的地方。

毕竟,「没有明显退步」,不该成为今天手机行业值得庆祝的优点。

OPPO Reno16 Pro,不像一台 2026 年的手机

Reno 这个产品系列,回答的是一个很有趣的问题:

怎么做主流人群喜欢的手机?

这意味着,Reno 不能是高定时装,也不是概念单品,更应该像当季潮流新品——未必走在最前沿,但审美一定要新,风格也要够大众。

这几年,消费者眼中一台「好手机」的定义,已经不单纯局限在功能价值的「好用」,在配置和价格大差不差的情况下,「好玩」带来的情绪价值更加重要。

这正是 Reno 的舒适区。一拿到 OPPO Reno16 Pro,视线很难不被手机背面给吸引:Reno16 系列以「星星」为题眼,采用 3D 冰透悬浮工艺,在平面的玻璃上实现了裸眼 3D 的视觉效果,星球纹理仿佛浮在空中。

手机已经变成了我们的「生活搭子」,如果一件东西要陪你四年,它最好别只有配置,得有一些个性,多一点温度。

而自 Reno 这个品牌诞生之初,就已经和这种气质绑定。

比起把手机做成参数表,Reno 有着更「软性」的产品力,更想让你「喜欢」而非「选择」它。

Reno 就像一台 Mini Cooper,它不是跑得最快的车,更多人购买它的理由,只是因为它让通勤这个「日常」,变得更愉快。

在 OPPO Reno16 Pro 众多的影像新玩法中,能一秒出片拍立得和胶片的 POP 相机,以及随心贴拼图实况照片,无疑是最有「Reno」气质的功能。

只是,如果只用「好玩」来定义 OPPO Reno16 系列,那未免过于片面。

设计和功能决定用户会不会拿起它,体验才决定用户愿不愿意一直放不下它,当越来越多品牌忙着教用户接受取舍,OPPO Reno16 系列选择把优势继续放大。

即使在行业成本承压的当下,OPPO Reno16 Pro 依旧配备了 2 亿像素的主摄,既维持了 Reno 系列的特色,更重要的是能继续服务好「爱出片」的 Reno 人——他们不热衷研究传感器尺寸或者像素,但一定在意朋友圈发出去的照片好不好看。

参数只能留在发布会上,出片率才能留在用户的记忆,活在 PPT 上的配置,终究不比活在相册里的照片。

除此之外, OPPO Reno16 Pro 还为这颗 2 亿像素主摄加码了「云台」能力,将 Reno 影像能力的边界,扩展到 Vlog、直播这些同样年轻化的形式。

这些功能和配置,本质上都是继续围绕「Reno」这个品牌服务的核心要素。在 2026 年选择继续「加注」,势必会带来成本的提升,但最终都会服务于「Reno」这个已经有用户信赖的品牌。

毕竟,用户愿意为进步付费,却很少会为妥协鼓掌。

好玩又好用,OPPO Reno16 系列,依旧是「初见乍欢,久处不厌」的手机,当越来越多手机开始教用户接受遗憾时,在努力减少遗憾的反而出挑。

但 Reno,已经不只是一台手机。

Reno 不再只是一台手机

在 Reno 这个品牌诞生之初,它就是「高品质」的代名词,这样的品牌气质也正在外延,OPPO 希望它承载更多东西——除了产品,还包括一套更完整的审美表达和用户认同。

与 OPPO Reno16 系列一起发布的,还有「Reno Land」的品牌生态,将平板、耳机,以及「电子吧唧」 OPPO Bubble 纳入了进来。

OPPO Bubble 难以归类到任何传统数码品类,更像是一个带屏幕的潮流配件, 通过磁吸吸附在手机的背面。

就像年轻人会在背包上挂徽章、在水杯上贴贴纸、在电脑上贴痛贴一样,OPPO Bubble 本质上也是一种身份表达,是一个展现自我的自留地。

而有需要时,也可以成为后置摄像头自拍的取景窗,能够尽可能利用 2 亿像素主摄和爆闪闪光灯。

Reno 本来就不是那种只负责把参数做满的产品线。它需要一点不必要的可爱,一点可以展示的细节,也需要一点年轻人会愿意拿出来玩的东西。OPPO Bubble 不是 OPPO Reno16 系列的核心卖点,却很像 Reno 性格里漏出来的一角。

不管是 OPPO Reno16 系列本体,还是 Reno Land 产品,当你看到它们,你能立马联想到 Reno 这个品牌,以及它代表的生命力、审美、情绪价值,同时又与时代同频成长的生活方式。

对于硬核的数码爱好者来说,Reno 对于这样的主张或许有点陌生,但放到整个消费领域,真正成功的消费品牌,最终售卖的,都不只是产品本身。

比如哈雷摩托,他们卖的并只是昂贵的摩托车,更是一种略带一点「反叛」的气质。

我们卖的是一种让 43 岁的会计师穿上黑色皮衣,骑着摩托车穿过小镇,让人们对他感到畏惧的能力。

产品只是载体,认同感才是终点。

2026 年,我愿意为什么样的产品花钱?

OPPO Reno16 系列,并不是一次孤立事件。

在它之前,OPPO Find N6 凭无感折痕再成折叠屏新品爆品,OPPO Find X9 Ultra 和 Find X9s Pro 的影像能力,让 OPPO 销量海外市场继续走高。

这些数字恰恰证明,好产品在任何价格周期里都有人买单。

因此,OPPO Reno16 系列回答的问题,是涨价潮之下,中高端手机到底应该怎么做?

消费者的换机周期已经拉长到四年甚至更长,每一次掏钱都是一次投票,「值不值」取代了「想不想要」成为了购买决策的关键。

任何一丝短视,都会消耗多年累积的口碑;任何一点缩水,都会影响用户体验的质感;任何一处妥协,都会变成品牌信任的裂缝。

产品涨价从来不是问题,一边涨价,一边让用户感觉自己买亏了,才是问题。

因为所有减掉的东西,最终都会从用户的信任里扣回来。

人们面对消费越来越理性,并不意味着只买「便宜的东西」,奢侈品仍然有人排队,演唱会门票依然一票难求,高端咖啡也没有消失。

大家只是开始重新计算价值,想为有感知的体验付钱,想为认同的生活方式付钱,想要为态度和个性付钱,与此同时,越来越不愿意为「缩水」买单,不愿意妥协于「妥协」。

对用户来说,内存涨价还会持续两年的时间,如何选择一台好的手机,穿过这个寒冬,是一个本分、更实在的选择。

这背后,不是「一分钱一分货」的简单交易逻辑,不是靠参数和价格堆出来的叙事,是厂商和用户之间,更长远的「价值承诺」。

在人人都不得不做减法的时代,捍卫「价格」没那么难,但捍卫「价值」却不简单。

也正因为这份捍卫价值的信任感,让我们愿意再次选择一个品牌、一款产品,因为我们都知道:这次也不会让我失望。

#欢迎关注爱范儿官方微信公众号:爱范儿(微信号:ifanr),更多精彩内容第一时间为您奉上。

149999 元的索尼 RGB 电视是夯是拉?我们去索尼总部瞧了瞧

作者 周奕旨
2026年5月29日 16:03

一年前的 AWE(中国家电及消费电子博览会)上,索尼展出了一项名为「RGB 高密度 LED 显示系统」的底层技术。

这种技术把红、绿、蓝三原色背光独立控制,亮度极高,色彩极准。

吊诡的是,索尼把这项技术捂了整整一年,直到今天的 BRAVIA 9 II 发布,才真正落地到消费级产品上,并命名为 True RGB。

作为索尼电视的最新旗舰,BRAVIA 9 II 的价格也非常索尼——起步售价为 65 寸版本 19999 元,随尺寸增大,价格也水涨船高,75 寸 24999 元、85 寸 34999 元,而最大 115 寸的顶配版,售价也来到了惊人的 149999 元。

事实上,早在索尼 True RGB 系列产品正式发布前,国产双雄海信和 TCL 就敏锐地抓住了这片市场真空期,并用最快速度把 RGB Mini-LED 电视推向市场。

面对这项被视作电视未来的技术,同行们都在跑马圈地时,索尼究竟在等什么?爱范儿来到索尼东京总部看了看。

BRAVIA 9 II,从镜头到客厅的最后一环

要回答这个问题,得先搞懂索尼电视的核心壁垒到底在哪——

索尼有一款 4K HDR 旗舰基准监视器,名叫 BVM-HX3110。这台机器只有 30.5 英寸,售价却高达三十余万元,主打色彩还原、所见即所得,是整个影视制作行业的天花板。

将它作为影音娱乐的视觉基准,索尼设计了一整套闭环流程——导演用索尼 CineAlta 电影机拍摄,用索尼 BVM 监视器看,后期用索尼设备调色,最后,观众用索尼电视观看。

也就是著名的「从镜头到客厅」战略。

BVM-HX3110 是这套战略的开头,而 BRAVIA 9 II,则是这套战略的闭环。

两个月前,爱范儿应邀前往索尼大崎技术中心。在闭门沟通会中,索尼将彼时还未发布的 BVRAVIA 9 II 与 BVM-HX3110 并排放置。

一台监视器、一台民用消费级电视,差价近十倍的设备,在色彩、亮度表现上展现了一脉相承的效果,拥有高度一致的即视感。

这是索尼完成「从镜头到客厅」战略野心的展露。而背后的屏障,就是 BRAVIA 9 II 所搭载的 True RGB 技术——

保证这台面向观众的终端电视,能在峰值亮度和色彩科学上承接 BVM-HX3110 这台三十万的工业级监视器,让观众能看到最还原的画面。

参数再高,色彩偏了也毫无意义。忠实还原创作者的意图,是索尼在这条赛道上定下的铁律。

索尼式的长期主义,把痛点一次解决

明白了这个大前提,我们再来看看 True RGB 到底解决了一个什么痛点。

这两年买高端电视,大家往往纠结选 OLED 还是 Mini-LED。OLED 像素集成了红绿蓝三色自发光,纯黑表现非常好,但峰值亮度容易受限。Mini-LED 亮度奇高,但背光分区哪怕做得再细,亮暗交界处依然容易出现光晕。

那将两者的优势结合起来,不就可以了?

为了融合两者的优势,RGB Mini-LED 应运而生。它直接把红绿蓝三种发光元件塞进同一颗背光灯珠里。背光层直接带上了颜色。

▲ RGB Mini-LED 大致原理,由 Gemini 生成

设计很理想,但新技术总会伴随着新问题——

传统 Mini-LED 想要提高夜景的峰值亮度,会把白光疯狂集中在明亮区域。这会导致一个致命缺陷:白色光线太强,直接冲淡了色彩的鲜艳度;

▲ Mini—LED 技术原理

到了 RGB Mini-LED 时代,如果控光和控色做不好,还会引发更灾难的后果——串色。不同颜色的背光相互污染,红不红,绿不绿。普通 Mini-LED 漏的是光,RGB Mini-LED 漏的可是颜色。

而 True RGB,则对色彩丰富度、漏光和串色三个问题,做了点对点优化。

从面板材质看,True RGB 完全属于液晶阵营——屏幕本身不发光,全靠背后的几万颗灯珠打亮画面。但从发光逻辑看,它悄悄偷走了 OLED 最核心的底牌:纯粹的三原色。

光线在离开背板的那一刻,就已经带上了精准的颜色。这就相当于在电视最底层,铺了一套拥有 OLED 控色逻辑的光源。外层再盖上一块液晶面板做最后的细节精修。

爱范儿在索尼大崎技术中心参与了此技术的闭门演示,从演示来看,True RGB 从底部灯珠中就开始以颜色区别构建大致的图形,边缘更为清晰、颜色更为精准,且在显示光比较大的时候能从底层构建清晰的光影关系。

「底稿加精修」的机制,带来的画质飞跃肉眼可见。BRAVIA 9 II 的色彩覆盖直接翻倍。色彩过渡变得更为顺滑,大幅解决了色彩断层的问题。

依靠结构改变,色彩表现的问题解决了,但漏光和串色的问题,还需要在结构外多下功夫——

True RGB 是索尼给出的一整套解决方案,毕竟物理底子再好,控制不住也是白搭。

LED 驱动芯片是背光电路设计中数字信号与模拟信号之间的一道坎。点亮一颗 LED 很容易。但在毫秒级的时间内,随心所欲地精准控制数以万计的 RGB 灯珠,极其考验厂商在模拟电路时代的沉淀。

索尼专门为这套系统打造了全新的驱动芯片。配合真彩芯链技术,系统能全局统筹,对每一颗灯珠的 RGB 通道动态分配最适合的亮度。

依靠实时光效传感器,细节精调得以实现。这便是索尼能做到全程彩光、同芯同控的技术底座。

比如画面里是一片深蓝色的夜空,或者一片鲜艳的红枫叶。True RGB 会果断只点亮对应的单色通道,彻底杜绝杂色引入。

亮度拉满的同时,色彩依旧精准浓郁。软硬结合下,RGB 技术饱受诟病的串色问题被连根拔起。

在两个月前索尼大崎技术中心的闭门演示中,我们亲眼看到,面对复杂的高动态画面,部分 RGB 电视的背光会频繁在彩光和白光之间游离,甚至大多数时间都在以白光兜底,以此来保证系统不死机。

而搭载 Ture RGB 的 BRAVIA 9 II 则从底部灯珠上构建了正确的颜色关系,色相、饱和度、亮度一一对应,从最底层为画面表现打下了良好的地基。

更有意思的改变发生在侧视角。过去为了让坐在角落的人也能看准颜色,电视表面通常得贴一层广视角膜。这层膜虽然管用,却像一层微弱的毛玻璃,多少牺牲了画面的通透度。

而 True RGB 灯珠先天带色,索尼直接通过算法做底层的 RGB 输出的主动补偿,哪怕你坐在客厅最偏的角落,颜色依旧精准。

同样,基于物理结构与真彩芯链技术,索尼对每个 RGB 灯珠动态控制调整下,高光光晕问题也得到了解决。

画质基石搭建完毕后,索尼把余下的精力放在了产品体验的补全上。

BRAVIA 9 II 设计了幻隐悬浮底座,半透明光栅让画面呈现出悬浮感,背后的线缆也被巧妙隐藏。电视自带的波束高音与空间平衡扬声器足以应付日常,但面对百寸的巨幕,传统回音壁的声音密度往往会捉襟见肘。为此,索尼同期推出了全新的家庭影院新物种 Trio——

Trio 采用独立的前置三扬声器分离设计,以此来匹配超大屏幕的物理跨度,并修正侧视角下的声像偏移。这套系统由索尼影业深度合作开发,搭载了全新的 360 智能穹顶声场 3.0 以及「影院增强模式」。再配合系统全新支持的双低音炮组合拓展功能,Trio 能够将索尼影业混音实验室的专业声学效果,直接平移进用户的客厅里。

视与听,在这里完成闭环。

在索尼大崎技术中心,索尼电视产品线的研发人员在闲聊中有一段话让爱范儿印象深刻,大致意思是这样的:

对于电视这样的消费电子产品来说,好像一年一更不是很必要的事情,我们希望把技术打磨更成熟,再推出产品,这样的产品也更长期主义。

产品的长期主义,往往依赖的是研发的长期主义——回头来看,其实索尼在 RGB 这条路上已经走了 20 年。

2004 年,当普通人还在为摩托罗拉 V3 刀锋般的超薄翻盖手机感到惊叹时,电视行业却在悄悄孕育一场光影革命。那一年,索尼推出了全球首台采用 RGB LED 背光的电视 Qualia 005;

到了 2016 年,Z9D 确立了释放 LED 驱动能力来提升明暗对比度的核心思路;2024 年,BRAVIA 9 实现了 22Bit 灰阶控制。直到今天,True RGB 这一技术完全体才最终得以落地。

索尼在这条路上走了 20 年,光影控制的研发脉络清晰可见,一脉相承。而 True RGB,则是索尼在效率、真实还原与功耗之间,寻找到的更具长期主义的解法。

让我有个美满旅程

#欢迎关注爱范儿官方微信公众号:爱范儿(微信号:ifanr),更多精彩内容第一时间为您奉上。

提前看看,今年新 iPhone 系统长什么样|WWDC26

作者 苏伟鸿
2026年6月1日 12:21

距离今年的苹果全球开发者大会 WWDC 还剩差不多 10 天的时间, 关于苹果新系统的爆料也已经越来越完整,外界几乎快提前「拼」出了今年的软件版图。

这一次,全新的「27」系列系统,核心方向很明确:一边补足稳定性与体验细节,一边推进 AI 与系统层面的智能化能力。

值得一提的是,这次 WWDC,大概率将是现任苹果 CEO 的蒂姆 · 库克最后一次主讲苹果发布会。

爱范儿今年同样将前往 WWDC 现场,为大家带来 WWDC 系列活动的专题报道,届时请锁定爱范儿主站、微信公众号、小红书和微博上的系列内容。

稳定性提升,界面小调整

不管你喜不喜欢「液态玻璃」,iOS 27 和 iPadOS 27,尤其是 macOS 27,液态玻璃不会变少,但起码会变好。

彭博社获悉,目前 iOS 26 的液态玻璃界面还并非苹果内部一开始预期的「完全体」,下一个版本会做出更多调整,试图兼顾透明度和可读性。

彭博社绘制的效果图

界面的逻辑和布局也会有所调整。9to5Mac 报道称,在 iOS 27 中,苹果会重新回调应用底栏,整体逻辑回到 iOS 18,取消独立的搜索按钮和其他变形标签——这个变化,目前已经在 App Store 应用中发生了。

除了视觉效果上的改进,苹果也会着重优化系统的能耗和流畅性,据悉工程师从头到尾梳理了系统底层代码,不放过任何性能提升的空间。

在支持范围方面,iOS 27 可能将会支持到 iPhone 12 系列和 iPhone SE 3 为止,也就是说,iPhone 11 系列及更早的「4G」机型将无法更新 iOS 27。

上周,苹果官方宣布了即将推出的全新无障碍功能,截图中还带到了 iOS 27 一些非常细节的 UI 调整:

  • 统一了电池图标显示样式
  • 麦克风指示灯带有晕影

图源:Apple

相机应用同样将是 iOS 27 界面调整的重点。

彭博社爆料,iOS 27 的新相机应用将会提供一个「高级」选项卡,可以调整景深和曝光控制,并提供「基础」「手动」和「预设」的小组件功能,以及新的网格和色阶功能。

除了高级模式,全新的相机应用还能够自定义界面,用户可以选择要不要在主界面显示闪光灯、曝光、计时器等功能图标。

钱包应用将会迎来重大更新:用户可以自己创建卡片,但似乎仅支持导入二维码,而不是 NFC 复制卡片。

WWDC 上的更多戏份,还是留给了 AI。

Siri 大加强,这次苹果 AI 没跑了

按照彭博社的说法,iOS 27 将成为 Apple Intelligence 发布两年后的一次「集中兑现」。

WWDC 24 上画的 Siri 大饼,这次很可能真的要落地了, 跨 App 信息调用、屏幕内容理解、连续操作执行以及更深层的 App 功能整合等 AI 能力都不再只是空话。

在苹果提前公开的无障碍新特性中,有一个「语音控制」的新功能,允许肢体障碍的用户完全通过语音操控 iPhone 和 iPad,不只是打开 App,还能实现更灵活、细节的操作,点击需要的按钮和文件。

图源:Apple

彭博社记者 Mark Gurman 透露,这个辅助能力本质上就是 iOS 27 新版 Siri 能力的一部分。这很可能意味着这次新版的 AI Siri 真的「准备好了」。

除了兑现老功能,在和 Google 合作之后,苹果还打算进一步改造 Siri,将其打造为类似 ChatGPT 的对话式机器人。

Siri 将拥有一个独立的应用,以对话的形式进行交互, 可以解读图片和文档。

彭博社绘制的效果图

除了网络数据,「SiriBot」 还会提取用户的本地数据,包括笔记、短信、电子邮件、联系人、日历约会和提醒事项。

Siri 会变得更懂你,可以在做安排时询问它自己的空闲时间,以及直接利用网络信息来写邮件和备忘录。

虽然有独立的应用,但用户依旧可以和以往一样,通过「嘿 Siri」语音指令以及长按电源键呼出 Siri。

苹果在测试几种不同的新版 Siri 设计方案,替换 iOS 18 引入的发光边缘界面,其中一个方案,Siri 将集成于灵动岛之中,可以展开成为输入框。

彭博社绘制的效果图

苹果还设计了一种全新的 Siri 呼出方式:从 iPhone 的顶部中央下滑,打开全新的搜索询问界面,这个界面主打「文字输入」的 Siri 交互方式,而通知中心改成只能在手机左上角下滑,

这个界面将和 Spotlight 搜索进一步整合,显示 Siri 建议,包括八个常用应用、最近网络搜索等功能以及录制语音备忘录等功能,此外,还有一个面板用于显示早晚天气。

用户可以在这个界面打开 App、发短信、查天气、添加日程、搜索备忘录,或者使用全新的苹果 AI 搜索引擎进行网络搜索。

苹果也一直在测试将第三方 AI 集成到 Siri 底层之中,在 Siri 界面将会有一个按钮和菜单,允许用户选择其他 AI 服务,例如 ChatGPT、Claude 或 Gemini。

不止于 Siri,Apple 智能还会进一步渗透到更多苹果第一方应用中。

相机

除了自定义和专业模式,相机应用还会新增一个「Siri 模式」,类似 Apple 智能的「视觉智能」功能,用于识别物体、实时翻译。

彭博社绘制的效果图

照片

「消除」之外,苹果还会进一步加码照片应用的 AI 编辑能力,引入「重构」和「扩展」两个功能:前者可以改变照片的视角,后者相当于 AI 扩图。

苹果还在测试基于自然语言提示的照片编辑功能,用户通过语音或文字提供需求,AI 来帮忙完成,例如裁剪或改变颜色,这个功能大概率不会和 iOS 27 第一个正式版本一起推出。

彭博社绘制的效果图

快捷指令

快捷指令将拥有类似「vibe coding」的能力,用户用自然语言描述想要的功能,AI 自动完成搭建和安装。

更多 AI 功能

iOS 27 还将包含 AI 壁纸、系统级 AI 校对工具,以及更强的「图乐园」AI 生图应用。

在苹果第一方邮件、短信、Safari 浏览器等等之中,常规的搜索框都很可能被 Siri「赋能」,实现更智能的检索能力,类似目前 Apple 智能加持下的照片应用。

彭博社绘制的效果图

某种意义上,苹果的 27 系统属于一次「拨乱反正」。

一方面,「液态玻璃」界面大大小小调整历时一年,还让苹果推出了减弱效果的选项,每个平台的风格也不尽相同,还带来了性能问题和不少 Bug。

另一方面,两年前发布的 Apple 智能各种功能延期、故障也带来了一地鸡毛,这两年行业进步也天翻地覆,进一步拉开了距离。

可以预想的是,在未来相当长的一段时间里,iPhone、iPad 和 Mac 都会是主流的设备,维护好这些平台的基础体验,依旧相当重要。

特别是对于 iPhone 12 和 iPhone 13 这些老设备,iOS 27 想必会是一个更适合「养老」的版本。

至于 AI,则更像是一种姿态上的对标,这些 AI 功能更多是延续行业走过的道路,即使这些爆料最终平稳落地,即使苹果未必能反超引领行业,至少也终于不再「落后」,能留在牌桌上继续竞争。

附上苹果开发者官网,感兴趣的读者可以通过注册并参与在线课程:

👉 https://developer.apple.com/cn 👈

#欢迎关注爱范儿官方微信公众号:爱范儿(微信号:ifanr),更多精彩内容第一时间为您奉上。

任务成本仅为Claude Opus 4.6 1/9,阶跃刷新Flash模型效率

作者 莫崇宇
2026年6月1日 18:53

1492 年,哥伦布驶向大西洋深处。远洋航行当然需要速度,但真正决定船队能否抵达彼岸的,是淡水、食物、船体、桅杆和帆索能否撑过漫长风暴。改写跨洋贸易的,正是这种并不浪漫的工程逻辑。

后来,荷兰人设计出「福禄特」商船:造价更低、船员更少、货舱更大,能在大西洋航线上稳定往返。远洋航行由此从冒险家的孤勇,变成一门可复制、可计算、可扩张的生意。

今天的 AI 模型竞争,也走到了类似的十字路口。

过去,人们谈模型,习惯谈参数、榜单和峰值能力,但 APPSO 在使用 Claude Code、Codex 这类 coding agent 之后,明显感觉到当 AI Agent 开始走向生产环境,真正在乎的问题变得有些不一样了:能不能持续处理高频请求,能不能稳定调用工具,能不能理解复杂界面,能不能嵌入企业既有流程并长期运转。

这些问题的答案,往往不在跑分榜单里。

最近,阶跃星辰正式发布并开源 Step 3.7 Flash。作为面向生产级 Agent 的新一代 Flash 模型,它主要服务 Agent、Coding、Search 与多模态工作流。

它出现的时机,恰好踩在这个路口上。生产级 Agent 要的早就不只是快和便宜,更重要的是够可靠、够好用、够容易部署,还能在真实工作流里一天天产出结果。

Flash 模型,不再是旗舰的平替

过去,Flash 模型常被当成旗舰模型的轻量版,卖点无非就是快和便宜。但当 Agent 成为工作流的核心,Flash 模型的角色就变了。

如果模型在多轮任务中容易偏离目标,无论是企业还是个人都很难放心采用。相反,一个模型若能在速度、成本、工具调用、多模态理解和生态兼容之间取得平衡,才有机会成为 Agent 系统真正可依赖的基础能力。

某种意义上,Agent 时代要的 Flash 模型,已经从「更快的小模型」升级成了「生产效率最高的基座模型」。

它既要够得着旗舰模型的能力上限,又要扛得住大规模 Agent 调用的效率压力。Step 3.7 Flash 的定位,正是后者——新一代 Agentic 基座模型。

而生产级 Agent 的第一道门槛,是理解真实工作环境。

大量 Agent 任务分布在复杂界面、办公文档、图表系统、浏览器页面、专业软件和内部工具之间。只擅长文本问答的 Agent,很难真正处理这些任务。

Step 3.7 Flash 重点强化的,正是原生多模态理解与执行能力。

它可以理解 UI、图表、文档、图片和应用界面,也可以在复杂视觉问题中自主裁剪、放大、重读图像。遇到信息不确定的情况,模型还能主动发起搜索,并对文本和图像信息进行交叉验证。

这里有个反直觉的设计思路。对一个 11B 激活的 Flash 模型来说,把海量视觉知识硬塞进权重是不划算的。阶跃反其道而行:权重里只留最核心的推理引擎,把感知边界和世界知识外推到推理阶段,靠极快的速度,用「多看几眼、多查几遍」去换「参数本来不够用」的那部分能力。

低延迟和高吞吐,到这里就不只是部署时的优势,直接变成了能力本身的一部分,巧妙且机智。

比如在这个驾驶舱操作的演示中,用户只输入「如何起飞」,模型就会自动框选驾驶舱区域,识别仪表、按钮和关键操作信息,理解当前界面的操作逻辑,并生成分步骤教程。

这里的重点不止在于它能识别一张驾驶舱图片,更关键的是,它能把一个密集、陌生、强依赖上下文的视觉环境,转换成一个人可以照着做的任务指引。

能看懂,和能教你动手,难度系数完全不一样。

我们还把 Step 3.7 Flash 接入了一套手机 GUI Agent 流程,并用一台 vivo 手机完成演示。

手机通过 USB 连接 Mac,打开 ADB 调试授权后,终端就可以获取手机当前截图,并通过 scrcpy 同步显示手机画面。随后,脚本把这张截图发送给 Step 3.7 Flash,让模型判断屏幕里正在发生什么。

比如我们让 Step 3.7 Flash 看了一眼手机里的微信读书热搜榜。它不只是把页面上的字读出来,还能理解榜单结构:哪些是书名,哪些是封面,当前排名是多少,有多少人在读,推荐值又对应哪本书。

这类能力的意义在于,Agent 面对的是真实 App,而不是整理干净的截图。它要先看懂页面,才有可能继续帮用户找书、比对热度、整理榜单,甚至执行下一步操作。

我们又把它放到美团小判官这样的页面里,让它处理一条商家申诉场景。页面里同时有用户评价、图片证据、商户回复,以及「用户更有理」「商家更有理」这样的处理按钮。

对模型来说,这已经不是简单的 OCR,它是在理解一段业务流程:谁在投诉、争议点是什么、证据是什么、平台接下来允许做什么。多模态 Agent 要进入真实工作流,遇到的往往就是这种混合了文本、图片、判断和操作入口的界面。

换到 Blender 场景里,用户输入「怎么删除这个方块」,模型会识别 Blender 的界面结构、图层、工具栏和当前编辑状态,再给出删除指定方块的操作步骤。

再看应用界面设计分析。当用户要求模型说明「这些设计有什么有趣之处」,模型会识别不同图片中的信息内容,理解设计元素之间的关系,并生成专业分析。

Step 3.7 Flash 另一项关键能力,是联网与视觉搜索增强。

Agent 在真实业务里碰到的问题,往往牵扯动态信息、外部资料、多源证据,还有一堆残缺的输入。模型要是只啃自己肚子里那点知识,时效性和准确性上很容易翻车。

「瑞石楼」这个演示就很典型。模型先从用户上传的图片里读出可见的线索,围绕这些线索生成检索词,用网页抓取工具去外面查资料,最后把图里的视觉信息和网上的文字信息拼成一个完整回答。

搜索到这里,已经不是返回一串网页链接那么简单,模型是围着任务目标,主动去找、去筛、去对、去组织证据。这正是 Search Agent 和 Research Agent 真正需要的干活方式。

官方提到,Step 3.7 Flash 在 SimpleVQA Search、V* (Python) 等复杂视觉任务 Benchmark 上,展现出接近更大规模旗舰模型的表现。这也意味着模型能够在信息不充分的情况下继续推进任务,并减少未经验证的回答。

让 40 个 Agent 同时开工,这才是大模型下场干活的正确姿势

Agent 与普通聊天机器人的区别,在于调用密度更高。

一次普通问答往往只有一轮交互,而 Agent 完成任务时,需要反复观察环境、调用工具和读取结果。Coding Agent 要读代码、改文件、运行命令;Search Agent 要检索、核对和整理信息;办公 Agent 要处理表格、文档和邮件。

调用次数一旦大幅增加,模型速度和成本就会成为系统级问题。

Step 3.7 Flash 采用稀疏 MoE 架构,总参数为 196B 加 1.8B ViT,激活参数仅 11B,最高生成速度可达 400 Tokens/s。对于高频 Agent、Coding Agent、Search Agent、多模态 Agent 和企业知识工作 Agent,这意味着同样时间内可以完成更多轮观察、调用和推理。

比如,Step 3.7 Flash 可以构建 Agent 集群,让 40 个不同身份的虚拟 persona 扮演产品评测团,对一个产品问题进行并行判断,并实时汇总它们对 5 个 MVP 方向的偏好。

批量跑 Agent 的价值,就在这里了。

过去一个模型做一次分析,成本和延迟都还能忍。可一旦企业同时跑几十个 Agent,分别扮演用户、专家、销售、产品、运营、客服,吞吐能力立马成了前提。速度不够,反馈就慢;价格太高,规模化根本无法成立。

类似地,Agent 并行实时构建大型知识图谱,同样属于高频、多步骤任务。模型价值不仅体现在生成速度,更体现在单位时间内完成更多观察、检索和推理。

再看信息整理。我丢给它一句「我要写一篇自动驾驶的综述,分头去查技术路线、政策法规、市场格局、代表公司四个方向」。

这类任务看似只是汇总资料,实际运行时会触发多轮搜索、来源核对、内容归类和结构化输出。任务链条越长,调用次数越密,模型吞吐的差距就越容易被放大。

Step 3.7 Flash 给我的直观感受是快,但快的同时质量没有打折——从全网搜集四个方向的资料各自归到对应板块,技术路线讲得清楚,政策法规和市场格局的信息也分得开,没有出现把不同方向揉成一团的情况,结构化输出该有的层级都在。

值得一提的是,Step 3.7 Flash 完成任务的性价比极高,尤其是对 Agent 这种高频任务形态更友好。

一次 Agent 任务往往包含拆解、检索、读网页、调工具、比对结果和整理输出,调用次数远高于普通问答。单次成本差异,放到完整任务链里会被迅速放大。

官方数据显示,开启 Advisor Mode 后,Step 3.7 Flash 的编程能力达到 Claude Opus 4.6 的 97%,但每个任务成本大约只有后者的九分之一。

也正因为如此,Step 3.7 Flash 的价值不能只用「快」来概括。放到 Agent 工作负载里看,它同时解决了三件事:高吞吐减少等待,更低任务成本支撑规模化运行,接近头部模型的编程能力则让它有机会进入真实工作流,承担持续、复杂的任务。

此外,Agent 要进入生产系统,关键还在于稳定调用工具。Step 3.7 Flash 在高可靠工具调用与编排上做了优化。官方称,它可以在长程多轮 Agent 工作流中稳定调用 API、浏览器、终端、Office 工具和外部系统,并保持任务轨迹一致,降低任务偏移和执行失败的概率。

官方披露了几组数据。Step 3.7 Flash 在考察多工具协同的 Toolathlon 上达到 49.5%,在考察真实环境下日常自主任务执行的 ClawEval 1.1 上达到 67.1%,在横跨 44 种职业任务的 GDPval 上达到 45.8%。在 τ²-bench Telecom 的低、中、高三档推理难度下,通过率均超过 98%。

当然,Agent 生产化还有一个容易被低估的条件:模型必须适配工作流。模型通常被放进一套 harness 里,周围有提示词模板、工具协议、浏览器环境、文件系统、代码执行器、评测集、权限系统和业务流程。

对此,Step 3.7 Flash 针对 Claude Code、Kilo Code、Roo Code、OpenCode、Hermes Agent、OpenClaw 等主流 Coding 和 Agent 工具做了兼容优化,也面向 MCP、Skills 等工具调用协议和开发链路进行适配。

开发者因此可以更容易地把模型放进已有 Agent 框架中,而不必重新改造整套流程。对企业来说,适配价值不言而喻:模型越容易进入既有系统,试用和部署周期越短,工程成本越低。

目前,Step 3.7 Flash 已在 Kilo Code、Nous Research、Lemonade 等 Agent 与开发者生态项目中完成接入验证。阶跃星辰也在与 Fireworks AI、DeepInfra、Modal Labs 等 AI 基础设施与推理平台推进适配,后续还会接入 OpenRouter、ZenMux 等海外模型聚合与开发者平台。

🔗 https://huggingface.co/stepfun-ai/Step-3.7-Flash

截至目前,官方还提供关于 Step 3.7 Flash 的 Model Page、GitHub、Hugging Face、ModelScope、国内开放平台 API、海外开放平台 API、Studio 在线体验,以及阶跃 AI App 入口。

这些入口意味着,它同时面向开发者试用、企业 API 接入和开源生态使用。更重要的是,Step 3.7 Flash 支持云端和本地部署。官方还提供了端侧多精度版本,面向个人工作站和本地环境进行优化。

海外开发者的实测反馈,也补上了官方数据之外的视角。有人在本地 MoE 测试中对比 DeepSeek V4 Flash、Step 3.7Flash 和 Minimax M2.7,Step 3.7 Flash 在 agg@64 下运行速度超越其它模型,达到 2123.13 tok/s;

也有开发者提到,自己用 Gemini 3.5 Flash 写代码后,再让 Step 3.7 Flash 检查,能找出 7 个以上小 bug 和错误。无论是指向本地吞吐,还是指向代码排错,都切实地说明 Step 3.7 Flash 已经开始进入真实开发流程,并被开发者当成可以长期使用的生产力工具。

基座模型,就该为 Agent 而生

体验完 Step 3.7 Flash,APPSO 发现它比起追求某个维度的跑分,更强调工程实用性。

多模态、联网搜索、工具调用、框架兼容、本地部署、低成本、高吞吐。这些单拎出来都不算新鲜,可它们凑在一起,恰好补上了 Agent 在生产环境里最需要的短板。

这条路径并不花哨,但很适合 Agent 当前所处的阶段。我们过去问一个模型,问的是它够不够聪明。可 Agent 时代,真正该问的是另一个问题:这个模型,是为谁设计的。

这两个提问背后的出发点就不一样。

一个是模型为人优化,意味着它默认面对的是一个会读、会等、会自己脑补的人类。你问一句,它答一句,慢几秒没关系,偶尔含糊也能靠你补上。

但 Agent 不会,Agent 要在观察、调用、推理、纠错的循环里连轴转,它一天发出的请求,可能比一个人一年说的话还多。它不会替模型打圆场,模型跑偏了,它就跟着跑偏。

为人优化的模型,未必适合 Agent 。这也是为什么 Flash 这个词,在 Agent 时代有了新的含义。它不再只是旗舰的廉价替身,而要从头按 Agent 的脾气重新设计了一遍。

Step 3.7 Flash 这些特点恰好对应了这个逻辑。

原生多模态,是因为 Agent 得先看见任务现场;400 Tokens/s,是因为高频调用经不起慢;工具调用的稳定性,是因为长程任务断一环就全断;harness 适配,是因为模型再强,进不去现成的系统也白搭。

它不是冲着榜单去的,是冲着「Agent 究竟怎么高效、高性价比干活」去的。从 Step 3.5 Flash 到 Step 3.7 Flash,阶跃星辰一路强化的,其实都是同一件事:让模型为 Agent 而生,推动 Agent 进入规模化商用。

这也会成为模型今后一个重要的进化路线,Step 3.7 Flash 也还不是终点。但它让我们看到了一个变化:评判 Agent 时代的模型,不该只盯着它有多聪明,而要看它愿不愿意把那些琐碎的工程账,一笔一笔算明白。

1492 年真正改变世界的,其实不是哥伦布那一次惊险的横渡。反而是后来那些福禄特商船能一趟趟稳稳地出海、返航、装货,然后再出发。冒险家负责抵达彼岸,商船负责让彼岸变成航线。

模型竞争走到 Agent 这个阶段,道理也类似。真正拉开距离的,不只是跑分上的惊艳,更是那些能让 Agent 反复出发、可靠抵达,并把能力沉淀成航线的模型。

#欢迎关注爱范儿官方微信公众号:爱范儿(微信号:ifanr),更多精彩内容第一时间为您奉上。

华为发布 nova 16 系列:2 亿主摄,红枫影像,还有十年的答案

作者 苏伟鸿
2026年6月1日 21:32

6 月 1 日,华为在成都举行了 nova 16 系列及全场景新品发布会,带来了 4 款 nova 16 系列新机,以及更多全新产品。

转眼间,华为 nova 这颗「新星」,也已经燃烧了十年。

十年时间,足以让一款手机彻底改变模样。在华为 nova 16 系列身上,我们自然能看到属于今天华为的全新表达,但细看之下,你依然能够发现十年前那台初代 nova 留下的影子。

华为 nova 16 系列:2 亿主摄,红枫影像

华为 nova 16 系列一共包含 4 款手机:

  • 华为 nova 16z
  • 华为 nova 16
  • 华为 nova 16 Pro
  • 华为 nova 16 Ultra

有意思的是,nova 系列没有跟随 Mate 和 Pura 的步伐,推出「Pro Max」机型,继续保留了「Ultra」的后缀。

这次华为 nova 16 系列显得很有诚意,除了「线上机」nova 16z,另外三款 nova 16 都搭载了麒麟 9010S、7000mAh 电池、100W 有线快充和畅连/运营商北斗卫星消息支持。

先来看看主打的华为 nova 16 Pro 版本,这次提供了 4 款配色:晴空蓝、幻彩贝母、天际白和星空黑,背板采用丝绒 AG 玻璃。

华为 nova 16 Pro 的影像配置,颇有「越级」的意思:

  • 主摄:2 亿像素 F1.8 光圈 RYYB 镜头,1/1.28 大底
  • 长焦:5000 万像素F2.6 光圈 RYYB 潜望长焦镜头
  • 超广角:5000 万超广角微距
  • 红枫原色镜头

这个 2 亿像素的主摄,是 Pura 90 Pro 都无缘的配置,1/1.28 的传感器尺寸,也让这颗镜头的可用性更强,不会过于受到环境光条件的制约。

自拍也是华为 nova 系列的特色,这次 nova 16 Pro 将「红枫影像」也引入了前置镜头,与 5000 万像素的主镜头配合使用,能更好把握各种环境下的皮肤色准。

硬件配置给足,影像玩法也没有落下:魔法移图,利用 AI 实现更自然的抠图合成;3D 动态,将静态 2D 图转化成 3D 视角;以及当下很火的实况拼图。

华为 nova 16 Pro 还搭载了「nova 史上最亮屏幕」,尺寸为 6.84 英寸,支持 6000nits 峰值亮度,以及 1-120Hz LTPO 自适应动态刷新率。

系统方面,华为 nova 16 Pro 搭载 HarmonyOS 6.1 系统,支持能将课堂板书跨设备同步的「全景智记6」、课程表导入和小艺深度解题等非常适合学生用户的功能。

超大杯华为 nova 16 Ultra 则提供天际白、星空黑、晴空蓝三种配色,背板采用素皮 + 玻璃拼接背板和一体成型工艺,配置和 nova 16 Pro 接近,主要在影像、充电和卫星通信上有所区分。

华为 nova 16 Ultra 搭载全系 RYYB 影像,主摄同为 2 亿像素 1/1.28 大底摄像头,升级集中在另外两个镜头:

  • 长焦:5000 万像素 RYYB F2.2 大光圈镜头,光圈更大
  • 超广角:5000 万像素 RYYB 超广角微距镜头
  • 前置摄像头:5000 万像素 F2.0光圈镜头+ 红枫原色镜头,光圈更大

华为 nova 16 Ultra 也是 nova 16 系列中唯一一台支持无线充电的设备,最高 50W 华为无线超级快充,和 7.5W 无线反向充电。

在畅连和运营商北斗卫星短信的基础上, 华为 nova 16 Ultra 还增加了天通卫星通信的能力,能够实现无网语音电话。

华为 nova 16 堪称史上最好的 nova 数字旗舰,在电池、芯片和快充的配置上都看齐两个大杯。

影像配置上,华为 nova 16 仅搭载两颗 5000 万像素的主摄和 RYBB 潜望长焦镜头,以及一个红枫原色镜头,对比 Pro 版本少了一个超广角镜头。

华为 nova 16z 主打线上渠道,搭载麒麟 8020 芯片,影像配置为 5000 万像素主摄 + 1200 万像素 RYYB 长焦镜头,电池大小为 6000mAh。

在元器件涨价的潮流下,华为 nova 16 系列也不能避免涨价,每个版本对比上一代基本上涨 300 到 500 元不等。

nova 16 系列手机版本较多,我们将售价集中列出,方便大家对比观看,发布会现场并未给出产品的运行内存信息:

  • 华为 nova 16z,256GB 起步,起售价 2699 元
  • 华为 nova 16,256GB 起步,起售价 2999 元
  • 华为 nova 16 Pro,256GB 起步,起售价 3899 元
  • 华为 nova 16 Ultra,256GB 起步,起售价 4699 元

其他新品:超大杯平板、耳夹耳机升级款

这场发布会的主角是华为 nova 16 系列,属于中高端次旗舰系列,平板新品华为 MatePad Pro Max,则属于华为旗舰平板的集大成之作。

华为 MatePad Pro Max 屏幕尺寸为 13.2 英寸,厚度仅有 4.7mm,重量为 499 克,是目前全球最轻薄的大尺寸平板。

值得一提的是,华为 MatePad Pro Max 采用了一块超窄边框全面 OLED 屏幕,并且为无刘海设计,屏占比高达 94%,支持最高 144Hz 刷新率和 1600nits 亮度。

华为 MatePad Pro Max 还支持「鸿蒙双桌面」的特性,可以在平板界面和 PC 界面之间切换,满足不同的使用场景。

华为 MatePad Pro Max 悦享版搭载麒麟 T93 处理器,起步配置为 12GB + 256GB,售价 5999 元;T93 Pro 处理器版本起步配置 12GB +256GB,售价 6199 元。

和华为 MatePad Pro Max 一同推出的,还有华为第一方专业音乐编创软件「音悦家」,支持作曲、录音、编曲、混音、导出的全链路音乐创作,亮点为中国传统乐器音色的高精度还原,6 月开启华为 MatePad Pro Max 公测,未来还将在更多设备上推出。

口碑和销量都不错的华为 FreeClip 耳机也推出小改款——华为 FreeClip 2 典藏版,充电仓采用全新珠宝盒设计,耳机 C 桥升级鎏光云感材质,支持耳机作为相机快门交互,售价 1499 元。

华为 AI 眼镜也推出了全新的「钛丝半框光学镜方形款」,钛银灰配色,价格为 2499 元。

发布会的最后,华为也预热了今年的华为开发者大会 HDC 2026,将于 6 月 12 日-14 日,在松山湖举办,届时将分享更多关于鸿蒙系统生态的最新进展。

nova 十年,变与不变

华为 nova 16 系列有一个看似与产品无关,却颇具象征意义的变化:代言人从易烊千玺换成了时代少年团。

巧合的是,双方恰好有着「师兄弟」的关系。他们所代表的受众群体高度重叠,只是在年龄层和成长阶段上有所延续与更替。

这种代言人的接力,某种程度上也是 nova 品牌十年发展的缩影:年轻人始终在变,一代又一代新的面孔不断登场;但表达年轻化的初心,却始终没变。

最早的 nova,解决的是消费者人群之间的区隔问题。当时的华为,已经有了商务旗舰 Mate 和影像旗舰 P 两个高端系列,以及荣耀作为性价比路线。

在这之间就空出了一个「中高端」的次旗舰定位,一个主要面向青年群体品牌,于是 nova 系列应运而生,门槛比 Mate 和 P 更低,外观设计也更偏向年轻时尚,卖点主打性价比和自拍。

初代华为 nova

到了华为「黑科技」频出的时期,nova 还有了另一重职责——将这些前沿的技术探索,进行包装,下放给更多人群。

像是华为 nova 4 的「极点全面屏」、nova 5 的夜景自拍以及 nova 9 Pro 的 100 瓦快充,这些卖点本质上都是来自 Mate 和 P 系列的技术,借由 nova 触达更多大众消费者。

而在 2023 年,华为进入全新阶段之后,负责走量的 nova 系列,职责进一步升级。

它不再只是新技术的展示窗口,更成为华为核心技术规模化普及的重要通道,让折叠屏、卫星通信、麒麟芯片和原生鸿蒙走出旗舰机,触达更多对手机可能不太了解的用户。

华为 nova Flip

华为 nova 16 系列依旧如此,我们能看到 Pura 90 系列的 2 亿像素镜头探索,以及 RYYB 红枫原色镜头;更深层次,则是麒麟 9010S 芯片和 HarmonyOS 6.1 的全链路软硬结合,使其「华为手机」的地位毋庸置疑。

但从初代华为 nova 到 nova 16,这个品牌,又好像从未改变。

它依旧是华为最「青春」的产品系列,瞄准年轻和女性的核心用户群体,主打时尚潮流的质感设计,希望称为年轻人的第一台 nova 手机。

在这些品牌底色之下,它传达的理念,结合华为的现状来看,非但没有改变,反而历久弥新:

把最先进的技术,用最年轻的方式讲出来。

#欢迎关注爱范儿官方微信公众号:爱范儿(微信号:ifanr),更多精彩内容第一时间为您奉上。

Anthropic 抢跑 IPO,AI 巨头接连秘密上市,背后是怎样的攻防战

作者 Selina
2026年6月2日 15:16

准备好了吗?从这个六月开始,我们或许会看到人类历史上最大的 IPO 浪潮。

5 月 20 日,SpaceX 向 SEC 提交 S-1 招股书,目标 6 月 12 日登陆纳斯达克。估值超过 1.8 万亿美元,募资规模 400 到 800 亿之间。同一天,消息传出 OpenAI 正在准备秘密递交招股书,高盛和摩根士丹利联合承销,目标 9 月上市,最新一轮融资对应估值 8520 亿美元。

昨天深夜,Anthropic 官宣向 SEC 递交了 S-1 文件。上周他们刚完成了 650 亿美元的 H 轮融资,估值从 2024年的 380 亿暴涨至 9650 亿,一举反超 OpenAI,成为全球最贵的私有 AI 公司。

三家加起来,今年的 IPO 募资总额可能超过 2000 年以来所有美国风投支持的 IPO 之和。作为参考,Renaissance Capital 的数据显示,今年过去的五个月里,美国 IPO 市场总募资额,不过才 284 亿美元。

秘密 IPO,先把账本改好了再给你看

IPO 的本义是「公开」,但在这三家巨头中,Anthropic 和 OpenAI 都选择了秘密递交,confidential filing。SpaceX 在四月时也是用同样的提交方式,直到 5 月时才向公众披露。

2012 年,由奥巴马总统签署通过的 《JOBS 法案》,为符合条件的「新兴成长企业」,开辟了一条绿色通道:招股书草案,可以保密方式向 SEC 提交。所有的审核、反馈和修改都正常进行,但 S-1 不会立即公开,直到路演前 15 天才必须披露。

S-1 是一家公司最赤裸的 X 光片。SEC 规定,注册声明必须包含经审计的财务报表、完整的业务与风险披露、管理层对经营状况的分析、高管薪酬明细和募资用途。也就是说,营收、成本结构、客户资料、甚至创始人拿多少钱,在这份表格里将全部摊开。

对于一家准备上市的公司来说,S-1 就是底牌。因此,秘密提交通道,成了近几十年间美国资本市场最重要的一次制度变革,也是 JOBS 法案中,最受企业欢迎的明星政策。

为了保护好自己的底牌,秘密递交的好处至少有三个。

首先是和 SEC 私下过招,全程保密。SEC 会逐轮审阅草案并出具反馈意见,公司逐一回应修改。哪些数字需要补充、哪些表述有法律风险,反复打磨,改到双方都满意再公之于众。

▲ SpaceX 的招股书文件

其次是能够在激烈的 AI 厂商大战中,形成信息战。作为竞对,Anthropic 绝不想让 OpenAI 看到自己的真实成本结构,反过来也一样。S-1 里的算力支出、推理成本占比、大客户依赖度,对竞争对手而言是核武器级的商业情报。秘密递交意味着,公司能够把这些信息尽可能久地攥在手里。

最后则是留退路。秘密递交的草案在公开之前不构成正式的注册声明,JOBS Act 允许公司在此阶段随时终止流程,不推进即可。市场环境不好时安静退出,不会在新闻标题上留下「IPO 失败」四个字。

都是好牌,但你不能看

那么问题来了:想要最大限度吃到秘密提交的红利,就应该全程闷声发大财,完全不吭声,而 Anthropic 却在官网挂出了公告。为什么这几家公司,都要宣告自己的「秘密提交」、反其道而行之呢?

提交的内容是保密的,但提交这个动作本身是公开,甚至是高调的,这是一种精心设计的信息不对称。公开宣称自己进行了秘密递交,至少起到了几个作用:

首先就是对估值的刺激。Anthropic 的 H 轮融资和秘密递交几乎同步,参投方不可能不知道他们马上要到来的 IPO 动作,IPO 预期本身就是定价的一部分,这直接拉高了私募轮的估值,将其推上 9650 亿的高位,一举超过 OpenAI。

IPO 消息也能有效稳住客户和团队。Anthropic 80%营收靠企业,大客户需要知道他们的财务稳定、健康,并且可以长期合作。对于团队而言,曾经许诺的期权,也有了兑现的盼头。

最后则是一种暖场效果,光是「万亿级 AI 公司要 IPO」这个标题,就足够让各大承销的券商、机构行动起来。S-1 都不用看,路演都还没演,场子立刻就能热起来。

在资本游戏里,「公开」向来是一种有条件、结构性的分层公开,公开的不是信息本身,是信息的层级。谁先看到、谁能读懂、谁能据此行动,从秘密递交的那一刻起就已经排好了顺序。

不赚钱,or「赚钱」的定义很灵活

在目前最受瞩目的三家准 IPO 公司中,SpaceX,OpenAI 都没有盈利,后者 2025 年营收 130 亿美元但仍在亏损。而唯一声称已经盈利的,只有 Anthropic。

据 WSJ 独家报道,Anthropic 预计 2026 年第二季度实现营收 109 亿美元,运营利润 5.59 亿美元,上季度营收为 48 亿,这将是公司成立以来的首个盈利季度。

听起来像好消息,让它的 IPO 也显得顺利成章,但是,仔细琢磨一下时间线能发现,里面藏着不少令人玩味的细节。

Anthropic 今年新签了两份大型算力合同,分别来自 SpaceX 和 xAI。

 

这两份合同的前两个月是折扣价,所谓 ramp-up 期,7 月起才按全价每月 12.5 亿美元计费。如果回推盈利周期,恰好是这两个折扣月,构成了 Q2「盈利」的成本基础。等到折扣优惠结束,算力需求将推高支出,是否还能保持盈利,可就说不好了。

而且这是 non-GAAP 口径。私有公司不受上市公司的财报标准约束,利润怎么算,有弹性。科技博主 Ed Zitron 做了一笔账:如果把 AWS、Google Cloud 和 SpaceX 三家算力合同全部按全价计算,月度成本可能高达 37.5 亿美元,一年就接近 450 亿——5.59 亿的运营利润在这个数字面前,几乎可以忽略。

消息泄露的时间点也值得细品。Anthropic 盈利预测曝光的那天,恰好是 NVIDIA 发财报的日子。一边是 AI 基础设施最大的卖家说芯片需求还在涨,一边是最大的买家说自己已经开始赚钱了。两条消息叠在一起,共同向市场传递同一个口径:AI 的钱不是白烧的。对于即将开启的 IPO 路演来说,没有比这更好的铺垫。

还有一组令人怀疑的数字。ARR,年化经常性收入,把当前月收入乘以 12 得到的全年预估值,曾经让 Manus 也栽过跟头的指标。

Anthropic 的年化收入增长轨迹堪称史无前例:2024 年底约 10 亿,2026 年 2 月达到 140 亿(Anthropic 在 Series G 公告中自行披露:「our run-rate revenue is $14 billion」),4 月突破 300 亿,5 月逼近 440 亿。

四个数字画出一条近乎垂直的曲线。但其 CFO Krishna Rao 今年 3 月在法庭宣誓证词中称,公司累计总营收「超过 50 亿美元」,如果 ARR 数字是真的,仅 Q1 就有 48 亿收入,那过去几年几乎没怎么赚到钱,全是靠今年 Q1 平地起高楼。

考虑到 Claude Code 的确在今年开年风头无两,Codex 也是最近才追上来,Q1 的收入大涨在情理之中。但是,OpenAI 始终握有超过 8 亿的周活跃用户,Anthropic 远远不到这个数量级。Anthropic 估值 9650 亿美元,高于 OpenAI 的 8520 亿——投资人这是在给什么定价?

但无论如何,投资人们都不想再等了。

2022 年到 2024 年,美国 IPO 窗口几乎关闭了三年。加息周期叠加市场恐慌,高估值科技公司上市即破发,堪称一片惨淡。而这三年恰好也是 AI 泡沫吹到最大的三年,纸面估值翻了几倍甚至十几倍。

▲ 美国 IPO 市场 2020-2023 年季度走势. 图片来自:华尔街地平线

纸面财富始终是纸面财富,VC 基金是有周期的,LP 投了钱,到期要回报。基金存续期通常 10 年,早期 AI 投资大多在 2018 到 2021 年之间完成,2026 年已经开始靠近结算期。

正逢利率环境改善,市场情绪回暖,窗口重新打开,这几乎就是最好的时机。

谁在管公司,谁来承担代价

不过,Anthropic 不是「普通公司」。

它是一家注册在特拉华州的公共利益公司,英文缩写 PBC。PBC 的董事会依法必须在股东利益和公共使命之间做平衡,Anthropic 写进章程的公共使命是「为了人类的长期利益,负责任地开发和维护先进 AI」。在此基础上,公司还设计了一套叫 LTBT 的长期利益信托机制,由独立受托人选任部分董事席位,这个比例会逐步增长到董事会多数,理论上确保安全使命不被商业利益覆盖。

这套治理架构从未在公开市场上接受过检验,而它即将面对的第一道考题,就是成本。

一旦下个月(7 月)全价切换之后,AWS 加 Google Cloud 加 SpaceX,月度算力账单可能高达 37.5 亿美元。按照 The Information 今年 1 月报道,Anthropic 的推理成本比预期高出 23%。

▲ OpenAI 与 Anthropic 在各云厂商的支出预算。图片来自:The Information

这个差额最终只有两个出口:转嫁给用户,意味着涨价、砍免费额度、降低免费 tier 的模型质量;或者转嫁给报表,上市后从 non-GAAP 切到 GAAP 口径,灵活记账的空间不复存在,每个季度都要向公开市场交代毛利率。但这意味着利润率承压,股价波动。

目前 Claude Pro 每月 20 美元,Max 每月 100 到 200 美元。上市之后,这些价格将同时受到两个力量的牵引:用户的付费意愿,和华尔街对毛利率的预期。历史经验表明,后者的声音往往更大。

对付费用户而言,S-1 公开是一个值得关注的节点。招股书会披露总营收、营收成本明细(含算力支出)和用户规模等核心数据,分析师第一次可以据此推算单用户算力成本和边际利润率。定价天花板在哪里,涨价空间有多大,这些问题第一次有了可以算的基础。

两条路,两种产品未来

回到前面那个问题:为什么 Anthropic 的用户量远小于 OpenAI,估值却更高?

这是两家路线截然不同的公司。Anthropic 80%的收入来自企业客户,Fortune 前十的排行榜里有 8 家是它的客户,Claude Code 贡献超过 25 亿美元的年化收入。用户不多,但单个用户价值极高,这是一家企业服务公司的估值逻辑。

OpenAI 的逻辑正好相反。8 亿周活用户,消费者为主,ARPU 低得多,是一家消费互联网公司的估值逻辑。

两种估值逻辑上市之后会加速分化为两条产品路径。Anthropic 的企业客户占营收八成,产品路线图会持续向大客户需求倾斜:更强的稳定性和合规能力,更保守的功能释放节奏(Claude Mythos 被限制释放,既是前面提到的安全使命的体现,也符合企业客户对可预测性的要求)。个人用户不会被抛弃,但在优先级上会逐步后移。

OpenAI 路线意味着月活就是核心资产,消费端变现压力更大。在 Codex 之前,他们考虑过成人模式、Sora app 和广告业务,不排除未来更激进的变现手段可能加速推出。毕竟,当用户量是你最大的故事时,你需要给用户一个持续付费的理由。

这两条路径的分叉已经在发生,上市会以季报频率加速这个过程。用户选择哪个 AI 生态,实际上也是在选择站在哪条商业模式的跑道上。

S-1 最终会公开。对投资人而言它是财务数据,对用户而言它是产品路线图。订阅会不会涨价,免费 tier 会不会缩水,安全和增长之间的天平往哪边倾斜,答案都在那几百页里。等公开的那天,值得花时间读一读。就算不是为了炒股,也可以搞清楚自己每天用的工具,接下来可能变成什么样。

#欢迎关注爱范儿官方微信公众号:爱范儿(微信号:ifanr),更多精彩内容第一时间为您奉上。

云台相机 2026 大乱斗,它到底怎么来的,又去往哪里?|硬哲学

作者 刘学文
2026年6月3日 18:03

2016 年 9 月,离改变手机行业的 iPhone X 发布还有一年,但另一个改变行业产品 AirPods 初次登场。

如今我们都已知道 TWS 耳机的爆发正是源于这款产品,但那年 9 月人们给它的评价却尽是嘲讽:「这不就是 EarPods 把线剪掉吗?」,「晃几下就掉了,蹲操场跑道一天能捡好几个…」,「苹果坏事做尽,砍 3.5mm 耳机接口,就是为了多赚我 1288 元」。

2018 年 11 月,大疆 Osmo Pocket 云台相机发布,起初多数人也并不觉得自己需要在手机之外再添置一个手持摄影设备,尤其是它的屏幕还这么小。

后来的事情我们都知道了,大疆 Osmo Pocket 3 成为了消费电子行业的现象级产品,人们确实意识到,手机之外还可以有一个手持摄影设备。

正如 2016 年的 AirPods 确实看起来就像把 2012 年发布的 EarPods 把线剪掉一样,把云台搬上手持设备,旋转开拍的「魔法动作」等诸多技术的伏笔已经在各处写下,这里有诸多先驱探索又叹息,小厂魔改,沉寂多年的技术穿越了周期迎来合适场景,技术狂想与一代代玩家接力最终产品大成的故事。

云台相机,云台在先

初代 Osmo Pocket 云台相机发布的时候,人们之所以觉得这样的产品必要性不大,是因为想要实现稳定的视频拍摄效果,手机或者运动相机配上一个几百块的稳定器不就完事儿了,何必再买一个设备?

在当时甚至后面几年,这种「组合技」就是轻量化视频拍摄的最佳最省解决方案。

飞宇 G3

2013 年,此前一直做无人机飞控和航拍云台的飞宇,决定进行转型,把航拍云台技术用于手持云台,推出了全球首款面向 GoPro 的手持两轴云台飞宇 G3。

天与地就此连接,飞宇 G3 提供手柄和云台,GoPro 运动相机提供相机和屏幕,它们就有了手柄,云台,相机和屏幕的组合体,成为了如今云台相机最早的雏形,也开启了小型电子云台的时代。

也许是为了证明自己在云台相机领域的先驱地位,在飞宇的官网里,他们把「一体式云台相机」和「手持运动相机稳定器」一并归入了「云台相机」的大分类里。

是的,飞宇后面也发布了好几款手持云台相机,也叫 Pocket 系列。甚至飞宇 Pocket3 的发布时间还比大疆 Pocket3 早了几个月。

大疆灵眸 Osmo 相机

除了飞宇,当时的智云也发布了GoPro手持云台,适配市面上几乎所有 Hero 运动相机。两年之后的 2015 年,也在天空丈量大地的大疆发布了灵眸 Osmo 相机,它有手柄,云台和相机,但是没有屏幕,需要外接一部手机作为取景器。灵眸 Osmo 相机在市场上声量不大,但对于大疆的意义非比寻常,在航拍无人机之外,手持影像设备的产品线正式开端,如今已是大疆的另一条营收支柱。

如果对比 2018 年发布的 Osmo Pocket 云台相机,就会发现它和 3 年前的灵眸 Osmo 相机在影像参数上有诸多相似,比如同样的 1200 万像素 1/2.3” CMOS,同样的 100-3200 视频 ISO 动态范围,同样的 8s – 1/8000s 电子快门速度等等等,区别是 Osmo Pocket 云台相机大大降低了体积和重量,并在视频帧率、码率可以做得更高,为了方便视频拍摄,等效焦距也调整为了 26mm。

在大疆手持影像设备关键的 2015 年和 2018 年之间,业界对于这类产品的思考也没有停止。

GoPro Karma Grip 手持稳定器

2017 年 3 月,GoPro 推出了自家的稳定器 Karma Grip,作为官配产品,Karma Grip 可以实现 GoPro 运动摄像机的启动/停止摄像机,调整拍摄模式,还是用 HiLight 快速标记精彩片段等操作。此外,它也可以实现主体拆分,能通过安装环连接至多种 GoPro 安装支架,可以穿戴在胸前、也可以装在背包的肩带上,也能为 GoPro 充电。

Removu K1 手持云台相机

同样还是在 2017 年,之前主要给 GoPro 运动相机做配件的韩国品牌 Removu 也许就是从 Karma Grip 的设计中获得了产品灵感,顿觉不该郁郁久居人下,决定用更激进更整体的产品革掉 GoPro 的命,于是推出了 Removu K1 手持云台相机,并上线了众筹平台 indiegogo。

这个看起来有点像剃须刀的玩意儿真正意义上兼具了手柄,云台(内置三轴稳定器),可旋转相机(可拍摄 4K 30fps 视频,1200 万像素照片),屏幕(1.5 英寸 LCD 屏)的手持云台相机的完全体产品,人们再也不需要拼拼凑凑一套设备来搞组合技了。

历史之所以没太记住形态上开天辟地的 Removu K1 手持云台相机,还是因为它只是做到了模块的缝合,但它的重量高达 340 克,几乎是大疆初代 Osmo Pocket 云台相机 116 克重量的 3 倍。

消费电子行业就是这样,人们不会记住第一,只会记得最好。

AirPods 是蓝牙耳机的发明者吗,是 TWS 耳机的发明者吗?当然不是,在此之前早有 Earin 和 Onkyo W800BT 这样分体式蓝牙耳机存在,但 AirPods 通过预埋 EarPods 的形态设计,低功耗 W1 芯片,还有多传感器感应,Siri 连接等等技术,把产品体验做到了先驱产品难以企及的程度。

GoPro 的云台相机专利图

在与大疆还有影石多线竞争的 GoPro 也不是没有想过推出手持云台相机,在 2018 年 1 月,GoPro 提交了一份专利文件:这不仅是一款有手柄云台相机和屏幕的产品,甚至还可以进行拆分,云台和相机部分可以安装在无人机上。

这也算是一个大胆又合理的想法,毕竟手持云台相机的云台技术就是源于无人机航拍云台落地,GoPro 希望这个技术返航来拯救当时岌岌可危的无人机业务。

GoPro 的第一款无人机 Karma 是与 HERO5 运动相机还有 Karma Grip 手持稳定器一起发布,HERO5 运动相机可以独立使用,也可以装在 Karma Grip 变成云台相机,还可以装在 Karma 无人机上变成航拍相机,是当时很先进的「生态化反」概念,奈何无人机本身炸机连连,与天空无缘。

但,让云台相机辗转天地之间的专利设计依旧只是个设计,估计按照 GoPro 最近的情况,怕是永远都没法付诸量产了。

2020年,时隔两年,大疆又推出了 Pocket 的第二代产品,相比初代,Pocket2 升级了迷你摇杆、20mm vlog黄金焦段和全能手柄。虽然没有成为现象级产品,但这三项当时看来很超前的设计,奠定了后来 Pocket3 的爆款。

大疆 Osmo Pocket 和 Pocket2

从百万级市场,到千万级市场

如果说一体化云台相机拿到了进入大众市场的入场券,那旋转屏就是它成为爆款的「拿手好戏」。这出戏,其实很早就开始铺垫了。

飞宇是一家神奇的厂商,他们在 2013 年第一次把无人机云台技术搬上了手持稳定器,他们又在 2022 年申请了「一种可旋转屏幕的手持红外双光云台相机」专利,这是手持云台相机领域较早出现的旋转屏幕概念,横竖屏拍摄的取景模式,也提前锁定了短视频创作的风向。

飞宇旋转屏云台相机专利图

就在 2023 年大疆 Pocket 3 发布前的几个星期,一家名叫欧达的深圳厂商推出了欧小影 M3 云台相机,搭配了 3.5 英寸旋转屏幕,可实现横竖屏两种取景模式,这款设备在市面上没什么水花,主要原因还是 1/2.5 英寸的传感器跟不上时代需求了。

更神奇的是,深圳厂商欧达是一家穿越了数个周期的数码影像设备厂商,早在 2010 年的时候,他们就推出了 HDV-VS1 数码摄像机,最大特点就是支持旋转的 3.5 英寸屏幕,以及,「旋转即开机开拍」,「转回即关机收纳」。某种程度上来说,这也是一种技术和产品的传承。

欧达 HDV-VS1 数码摄像机

之所以说这些,是因为如果非要给大疆 Pocket 3 定义一个 Killer Feature 的话,我觉得就应该是「旋转即开拍」的设定。

欧小影 M3 云台相机,具有横竖两种取景模式

大疆 Pocket 3 用 20 个月的时间卖出了 1000 万台,这也是一个类似于 iPhone 的故事。

根据雷峰网报道,在 2023 年 10 月 Pocket 3 发布之前,大疆内部的预期是卖个三四十万台,后来发布会反响很好,预期销售量是 100 万台。

iPhone 初代销量仅有 130 万台,是开天辟地的产品,但市场规模不大,历史断代意义大于市场开拓意义,iPhone 4 则卖出了接近 4000 万台,全新的工业设计和视网膜屏幕才让 iPhone 成为家喻户晓的产品。

大疆 Pocket 3

大疆 Pocket 3 相对于前代的升级更甚于 iPhone 4 相对于前代的升级,1 英寸传感器的加入保证了它有超越多数旗舰影像手机的画质,屏幕加大到 2 英寸让拍摄和操作更加便捷。

当用户握上手持云台相机的时候,就像西门吹雪握住了长剑,费德勒握上了网球拍, 中华小当家握上了菜刀,一旦这个动作完成了,那人与器物的宿命连接也开始,只需要大拇指轻轻一拨,屏幕旋转 90 度,屏幕亮起,电机转动,镜头进入工作状态,拍摄开始。

握,拨,这两个自然而然一气呵成的动作在手机上做不出来,这就是在回答那个所有硬件从业者都会被问到的问题:这事儿手机能不能干,如果手机能干,它存在的必要性在哪里?

索尼 DSC-M1 数码相机使用方法

不过要追溯手持影像设备使用旋转屏幕,以及旋转即开机或开拍的设定起源,那就得追溯到 2004 年 11 月索尼发布的 DSC-M1 数码相机。在消费电子设备上大量使用机械结构的时代,这款产品支持屏幕的 90 度旋转和 180 度翻转,兼顾了拍摄和自拍场景,并且 LCD 屏幕 90 度旋转即开机,同理合上屏幕即关机。

索尼 DSC-M1 数码相机

在繁星满天的索尼设计黄金年代,DSC-M1 数码相机依旧亮眼,它不落传统数码相机的窠臼,旋转屏设计可以提供超前又舒适的握持操作方式,旋转自动开机后还腾出了更多空间给不同的操作按钮,同时还叠加了当时代表高端奢华质感的黑色金属拉丝工艺,其背后 Cyber-shot 的标识想必也是不少索尼用户的青春回忆。

LG Wing 旋转双屏手机

当然,消费电子爱好者对于旋转屏的认知可能大多数是由 LG 这家曾经在智能手机领域里最爱形态创新的所造就的,近的有 LG Wing 这款旋转双屏手机,在 LG 停止手机业务之后,这款手机也成了不少人低价捡漏的优质「洋垃圾」。

更早之前,LG 在 2008 年发布了 LG KD876 旋转屏手机,其后还有类似形态的 LG VX9400,这款手机也出现在了《钢铁侠》电影里,由男主托尼·斯塔克使用。

这亦是消费电子有意思的地方,技术和产品概念的生命周期比预想的还要长,甚至可以历久弥新。

旋转屏幕没有拯救 LG 的手机业务,LG Wing 几乎可以算是 LG 发布的最后一款手机,索尼、欧达这些早就使用了旋转屏幕,以及旋转开机开拍概念的品牌,也没有成为手持影像设备的主流品牌。

当「旋转即开拍」来到大疆 Pocket 3 之后,才能算如鱼得水,成为体系化技术里的点睛一笔,也成为点燃手持云台相机市场的一条引信。

类似技术等待合适产品的故事还有很多,康宁大猩猩玻璃源于康宁公司在上世纪 60 年代的 Project Muscle 项目,但一直没有找到合适用途一直被搁置,直到 2007 年苹果需要为 iPhone 寻找一块耐磨且坚固的屏幕盖板才被重新启用,最终实现了科技史上值得铭记的一次合作。

大疆迎来了第一个真正的对手,后面还有第二个第三个

自始至终,消费电子行业都是群雄逐鹿成王败寇的叙事。

飞宇、GoPro、欧达这些品牌给手持云台相机行业贡献了不少产品构思和实践,但市场上一直没有真正能和大疆在产品综合维度竞争的品牌。

影石 Luna Ultra 云台相机

而在 4 月到 6 月时间里,影石 Luna Ultra 和大疆 Pocket 4P 的漫长预热勾起了行业的无限好奇,因为这是大疆在手持云台相机领域迎来的第一个可能打得有来有回的对手。

谁不想看英雄少年挑战武林霸主的故事呢?

大疆 Pocket 4P 云台相机

目前已知的信息是,影石 Luna Ultra 和大疆 Pocket 4P 都拥有双摄结构,主摄都是 1 英寸大底,长焦都是 3X,都采用旋转屏幕设计。

但,相同的招式对轰,最终结果自然是「棍怕老郎」,毕竟云台相机就像个棍一样。

影石基于 ONE R 模块化相机改造的三段式云台相机试验机

影石也有自己的技术路径和技术积累,2020 年影石发布了 ONE R 模块化多镜头防抖运动相机,支持 4K 广角、5.7K 全景及徕卡 1 英寸镜头组合切换。影石在这个模块化相机的基础上进行了魔改尝试,把全景镜头更换为云台镜头,再加装手柄,主机和屏幕沿用 ONE R 的主机屏幕。

这是影石内部首次尝试云台相机的尝试,虽然因为当时没能搞定散热问题而没有量产,但「搞出一个好用的云台相机」目标已经确定,并申请了双摄云台相机的专利。

2020 年 8 月,影石手持云台专利图

虽然 2020 年的初次尝试和 2026 年影石 Luna Ultra 问世中间隔着 6 年时间,但影石对于其中关键技术尝试并未停止,可以这么说,不管是影石 Luna Ultra 也好,还是其他的一些经典产品也好,它们都曾以「分布式」的状态存在。

就像任天堂 Switch 一样,主机,掌机,体感游戏等等元素都不是新鲜东西,但 Switch 能将过去的产品和技术组合起来,也能分散开去,聚散之间,覆盖了更多的场景和功能,最终回答了一个存在很久的问题:游戏可否跟着人走?

影石 Luna Ultra 看似考虑的问题是如何和大疆 Pocket 4P 做出差异化,实际上想回答另外一个问题:人和影像工具怎么分工?

影石 Link AI 云台网络摄像头

2022 年,影石 Link AI 云台网络摄像头发布,这是成熟的量产的带云台相机的产品,只不过并非手持产品而是线上会议产品,这为Luna Ultra 积累了云台控制、追踪技术和手势识别算法和功能的技术储备。

2023 年到 2025 年,影石 Flow 和 Flow 2 系列手机稳定器相继发布,这一系列的产品发布不仅云台软件控制和硬件技术的进一步提升,更在于为「非手持场景」的拍摄场景,积累大量的用户洞察和Know how。

手表原生控制 Flow 2 Pro

副屏遥控 Flow 2 Pro

Luna Ultra 的手柄内置三脚架设计,就是源于 Flow 系列的内置三脚架。

Flow2 Pro 和 Luna Ultra 的内置三脚架

通过另外的智能手机或者智能手表对 Flow 2 系列手机稳定器进行遥控的功能,加上此前尝试的模块化设计,于是就有了 Luna Ultra 带 20 米图传和带麦克风的分离屏;还有深度追踪、手势识别等功能的不断迭代,都是为了解决云台相机离开了人怎么拍的问题。

前几天影石 CEO 刘靖康发微博解释了 Luna Ultra 延期上市的原因,是他在去年国庆旅游时内测产品的时候,在拍摄街头表演的场景下发现自己全程盯着相机屏幕,并没有真正在欣赏表演。他意识到「享受当下和记录同等重要」,于是就有了第一人称套件的需求,在这个套件的加持下,镜头会随着用户头动(视线)的方向而动,人眼是记录取景器,也仍是欣赏表演和风景的那双眼。

抽象一点讲,深度追踪,手势识别和第一人称头追套件这些东西用起来的感觉,其实神似钢铁侠(IronMan)里的机甲和武器系统。

本质上,这就是影石 Luna Ultra 和大疆 Pocket 4P 的根本区别所在,也是影石和大疆影像理念的差异所在,大疆充分相信创作者,把影像设备当做创作工具;而影石希望做出具有自主能力的影像设备,也就是他们说的 Cameraman(摄影机器人)。

比如,为了让云台相机更像一个 Cameraman,一个 Real man,影石选择让双摄横置,使其更像人眼。

荣耀 Robot Phone

除了影石之外,同在深圳的 OPPO 和 vivo 预计也都会在今年发布自家的手持云台相机,包括小米也可能有价格竞争力的同类产品出现,荣耀推出的 Robot Phone 概念产品实际上也是云台相机的新形态。

依旧是拿 TWS 耳机来做类比,一旦智能手机厂商选择跟进,很可能意味着这个行业即将迎来爆发性的增长,此前百亿美元级别的市场,在 AirPods 发布之后,增长为数百亿美元,并且 TWS 耳机也从单品类衍生出了半入耳式 TWS,入耳式降噪 TWS,耳夹式开放耳机,耳挂式开放耳机,挂脖式耳机,最近甚至还有开放式滤噪耳机出现,场景划分也有专业运动场景,日常通勤场景,办公场景等等等。

对于手持云台相机来说,或许不会分得这么细,但以目前的行业发展阶段来说,这可能发展为一个年出货数千万,品类好几种,价位段分得更细更全的行业。

在 2016 年 AirPods 发布了 10 年之后的 2026 年,华为第一次在国内音频市场的份额超越苹果,登顶第一,但这是可能是大家都能接受的结果,苹果在高端市场不受干扰,少品类中份额高单价,华为则有更多的品类,更广的价格带,最终获得更多的出货量,竞争当然激烈,但绝不是你死我活的零和博弈。华为口碑最好是 FreeClip 系列,苹果则是 AirPods Pro,它们并不构成直接竞争关系,反而完善了用户的耳机场景覆盖。

这就是增量市场的意义,就像云台相机的市场,不知道会比单纯的手持稳定器大多少一样,众多玩家参与的云台相机市场,也不知道会比现在寥寥数款 SKU 的市场大多少一样。

毕竟参差多态即为美,万木参天是森林,千万级到数千万级的市场容量跃升,毫无疑问伴随着大量需求的出现和满足,这就是诸多新品的机会,也会是这个行业的机会。

稳中向好。

#欢迎关注爱范儿官方微信公众号:爱范儿(微信号:ifanr),更多精彩内容第一时间为您奉上。

❌
❌