阅读视图

发现新文章,点击刷新页面。

所有人都在骂爱奇艺AI艺人库,但他们压根不需要你喜欢

在爱奇艺举办 2026 年世界大会之前,这个公司上下可能没有人想到,这掀起了一场如此洪水滔天的大起义。

4 月 20 日,爱奇艺通过世界大会展示了一款名为 Nadou Pro 的 AI 影视制作平台,以及一项新计划:超过 100 位艺人已经加入了平台的「艺人数据库」,AI 创作者可以通过这个数据库快速与演员建立合作,调用他们的形象来制作内容。爱奇艺高级副总裁刘文峰在现场表示,这是在搭建一座桥桥梁,让 AI 创作者和演员更快地对接,用更低的成本、更快的速度,实现更丰富的创作。

消息一出,完全炸锅,第一时间跳出来反对的不是别人,正是演员们本人,内娱辟谣最迅速的一次:

粉丝群体的愤怒紧随其后。爱奇艺被嘲讽为下一个「非物质文化遗产」,「AI 艺人」这个词条迅速冲上热搜,热梗也随之而来,矛头对准了 CEO 龚宇:AI 这么厉害,怎么不把你们高管取代了呢?

爱奇艺不得不迅速做出澄清,称市场对「百人名单」存在误读。

龚宇也亲自出来重申,解释自己在发布会时的表达,以及进行一些潦草的公关动作。

但无论如何,这无法遮掩平台对 AI 技术在影视娱乐产业应用,抱有的是怎样一种态度:很简,AI 是平台眼中的「效率工具」,在创作者眼中是对人的替代。当技术能把一个人的脸、声音、表演习惯拆解成数据库里的可调用参数,「确认权」这三个字能提供的安慰其实非常有限。

但爱奇艺的 AI 野心并非孤例。它只是一条正在高速运转的产业链上,最新露出水面的一环。

一条不需要观众喜欢就能赚钱的产业链

2026 年 1 月,中国各平台日均上线 470 部 AI 短剧,单月新增超过 14600 部。到 2 月底,在播 AI 剧目累计达到 12.78 万部。3 月,抖音上 AI 短剧的日均广告投放额突破 7000 万元,历史上首次超过了真人短剧。据短剧自习室测量,仅 2026 年 3 月新上线的 AI 短剧,总量即达 39239 部。

▲ 图片来自:短剧自习室

这些数字看起来像是一个行业的黄金时代。但如果你去看另一组数据,画面就完全不同了:在这 12.78 万部剧目中,播放量破亿的不超过 150 部。破亿率 0.117%。

更关键的是观众的态度。2026 年初的受众调查发现,写实类 AI 短剧在所有 AI 内容形态中,消费和付费的意愿排名垫底。AI 制作的剧集类型中,观众更为接受的仅仅只是动漫类,而非真人类。

▲ 图片来自:明略科技《2026中国AI短剧行业发展与受众洞察报告》

现在的技术是非常强了,但是在细枝末节出,观众还是能察觉到合成的质感。真的被骗过去的人不会怀疑,反而是这种「接近真实但又没到」的微妙不适感,恰好压制了让人愿意掏钱的情感投入。

如果故事不卖钱,这个行业靠什么活着?

答案是流量套利。这套玩法有一个精准的闭环:低成本制作内容,高强度购买平台广告来获取播放量,从中间的差价里挣钱。生存的关键不是讲好一个故事,而是买量效率。

这套模式之所以能运转,是因为 AI 把制作成本压到了一个前所未有的低点。传统短剧单集成本在十万到数十万元之间,场景复杂的甚至达到百万级。而 AI 短剧《霍去病》的核心算力成本,仅仅 3000 元人民币,它在春节档上线后播放量破 10 亿,登顶红果短剧全站热播榜。

3000 元当然不是真正的「全部成本」,但它揭示了一个结构性变化:当制作的边际成本趋近于零,整条产业链的利润重心就不可避免地从「内容」转移到了「基础设施」。

华西证券的分析师赵琳把这个趋势拆成了三个受益方向:AI 视频工具 SaaS、算力租赁平台、以及掌握 IP 储备和分发渠道的头部平台。中信建投的分析师则从 token 消耗的角度算了一笔账:一部 AI 漫剧每分钟消耗 50 万到数百万 token,一部完整作品需要消耗过亿 token。这意味着,哪怕这部剧没有任何一个观众付费观看,模型公司已经从算力消耗中收到了钱。

▲ 图片来自:明略科技《2026中国AI短剧行业发展与受众洞察报告》

为什么是它们?因为 AI 视频工具是每个创作者必须购买的生产资料,日产 470 部意味着持续稳定的订阅收入;算力租赁平台按调用量计费,剧目越多、渲染越多,收入就越高,与内容是否优质无关;头部平台则掌握了流量入口,无论剧目质量如何,制作方都需要向它们购买投放服务才能触达观众。

平台端同样如此。腾讯、字节跳动、百度纷纷推出独立的漫剧 App,竞争的筹码是分账比例和流量扶持政策。中邮证券在研报中写了一句非常值得玩味的话:「供给放量并不必然带来优质内容的同步增长。」但紧接着的结论不是「所以我们需要更好的内容」,而是「所以具备用户入口与投放能力的头部平台将持续强化枢纽地位」。

所以,没有讨论一个跟「作品质量」有关。算力平台扮演的是「卖水人」的角色。淘金的人越多,卖水的人越赚钱,至于有没有人真的挖到金子,不影响水的销量。

换言之,整条产业链已经形成了一个不需要观众真正喜欢内容就能运转的闭环。

最先拥抱 AI 的一代人正在最快地离开

模型公司卖算力,平台卖流量,资本卖故事,每个环节都在赚钱,唯独没有人在意作品本身,产业链的上游和中游都在加速。

那终端的观众呢?

来看一下更广泛层面,大众对 AI 的观感。盖洛普今年 4 月发布的最新民调给出了一个令人意外的答案。在美国,Z 世代对 AI 的兴奋度在过去一年内从 36%暴跌至 22%,下降了 14 个百分点。与此同时,这个群体中对 AI 感到「愤怒」的比例从 22%飙升至 31%。

Z 世代是数字原住民,是第一批把 ChatGPT 用在作业里的人,是所有世代中最早拥抱 AI 的群体。所以,这不是中老年人对新技术的本能恐惧,而是最早拥抱 AI 的人,他们正在最快地恨上 AI。

广泛的现象,也是因为有广泛的原因:抽象的技术乐观主义撞上了具体的生存压力。Stanford 2025 年时的研究数据就显示,22 到 25 岁计算机专业毕业生的就业率大幅下降,这些刚好是年轻的应届生。纽约联储的调查发现,年收入低于 5 万美元的工人中只有 15.9%在使用 AI,而年收入超过 20 万的群体使用率高达 66.3%。AI 不是在「赋能所有人」,它在拉大已有的差距。

▲ 图片来自:Standford

这也是为什么,在面对爱奇艺 AI 艺人的暴论时,最热切的讨论不是从艺术,而是从就业方向展开的,观众本能的共情这个行业里潜在被代替的劳动者:编剧、摄影、场务、美术、妆造……

对于一个刚走出校门就发现入门级岗位正在消失的 22 岁年轻人来说,和爱奇艺所说的「演员保有确认权」,就跟「AI 将创造更多新岗位」这句话提供的安慰一样,画饼都画不出个像样的。

把所有的饼……哦不,所有的现状,拼在一起看,是 AI 所造成的供给侧狂飙与需求侧冷却,正在同时发生。这不是说某一家具体的公司、某一个具体的产品导致的,而是整条链路的传导都受到了影响。上游的每一个参与者都有充分的经济动机继续加速,而终端的人,无论是创作者还是观众,正在用各自的方式表达同一个意思:

我们不买账。

当内容的生产成本趋近于零,爆款率也趋近于零,观众的兴趣同样趋近于零,「娱乐产业」这四个字还意味着什么?也许它正在变成一种新的基础设施生意,就像修高速公路一样,收费站永远在赚钱,只是路上跑的车越来越少,而车上坐的人越来越无聊。

#欢迎关注爱范儿官方微信公众号:爱范儿(微信号:ifanr),更多精彩内容第一时间为您奉上。

盲猜要火!北京车展最帅「方盒子」找到了

面前这台就是全球首发亮相的传祺越 7,这是广汽传祺越野系列的首款重磅车型。我在展馆里绕了一圈,感觉全场颜值最高的方盒子车型就是它了。

来,看个视频,放松下。

#欢迎关注爱范儿官方微信公众号:爱范儿(微信号:ifanr),更多精彩内容第一时间为您奉上。

千问首发灰测 HappyHorse 1.0,开启免费体验

今天,千问正式首发灰测 HappyHorse 1.0,速览四大核心亮点:丰富镜头叙事、自然动作情绪、真实对白音效、多种美学风格,现已上线千问 APP 及千问创作 Web 端。

来,看个视频,放松下。

#欢迎关注爱范儿官方微信公众号:爱范儿(微信号:ifanr),更多精彩内容第一时间为您奉上。

OpenAI 和微软官宣「分手」,七年 CP 终成塑料

就在刚刚,微软与 OpenAI 联合宣布,双方完成了合作协议的新一轮修订:云合作独家限制正式解除,知识产权授权从独家变为非独家,收入分成也重新划定了天花板。

这段始于 2019 年的强绑定关系,走到今天,终于松开了彼此的手。

而这一切的起点,要从比尔·盖茨说出「震撼」这个词说起。

2022 年 8 月,他亲自给 OpenAI 团队挑选了一道 AP 生物考试真题。他曾断言,语言模型要在这类考试中拿到高分,至少还需要三年。结果 OpenAI 只用了两个月,就交出了满分答卷。

「这是我人生中最震撼的技术演示。」他后来在播客中这样回忆。

迟到的分手

在外界眼中,微软精准押中 OpenAI,被视为纳德拉任期内最精准的一次豪赌。他一手促成的合作,直接让微软跻身 AI 战略核心,从基础设施到终端产品全面升级,一举甩开了 Google 和 Meta 半个身位。

但真正写下这份剧本的人,并不是纳德拉。

据外媒 Business Insider 披露,早在 2016 年,比尔·盖茨就已经开始定期与 OpenAI 管理层会面。第二年,他亲自给纳德拉和微软高层发去一封备忘录,预言一种名为「AI agents」的新型数字个人助手将带来全新的时代。

「agent 不仅会彻底改变人们与计算机的互动方式,它们还将颠覆整个软件行业,引发自从人们从命令行转向图形界面以来最大的一次计算革命。」

打过工的朋友都知道,来自创始人的肯定,通常比任何市场报告都更具分量。这封备忘录不仅直接点燃了微软全面押注 AI 的信心,也精准对齐了纳德拉上任后一直坚持的「移动为先,云为先」战略。

2019 年 7 月,微软正式宣布对 OpenAI 投资 10 亿美元。2023 年 1 月,微软承诺投资 100 亿美元,并获得 OpenAI 知识产权独家使用权直至 2030 年,同时享有 OpenAI 20% 收入的分成。Azure 成为全球唯一托管 GPT 系列的云平台,微软旗下各条产品线,也全都搭上了 OpenAI 的顺风车。

只是,蜜月期总会过去。ChatGPT 爆红后,OpenAI 从幕后模型供应商摇身一变,成了顶级产品公司。它不再只是给微软供血,而是直接面对终端市场:卖 API,推企业版,推出 GPTs Store,甚至开发协作文档和浏览器,大有自立门户的架势。

这也意味着,它开始伸手进了微软腹地。

两家公司的摩擦其实早有苗头。作为对 OpenAI 投资协议的一部分,微软握有通过 Azure 销售 OpenAI 模型的权利,OpenAI 也能直接卖给客户。这种「双线销售」意味着两家公司有时会向同一客户推销几乎相同的产品,让微软销售人员陷入尴尬的处境:一边宣传的是 OpenAI 的技术,另一边却要从 OpenAI 手中「抢客户」。

一份微软内部文件显示,微软要求 Azure 销售人员告诉潜在客户,OpenAI 自营的服务适合用于实验,但缺乏企业级能力,安全与隐私功能也相对欠缺。OpenAI 也不甘示弱,比如率先销售微软 Azure 尚未提供的语音识别模型 Whisper,由此签下了不少大客户,甚至包括微软对手 Salesforce,以及 Jane Street 这样的金融巨头。

但如果你以为这种别扭只是近年才有的,那就低估了这段关系的复杂程度。

早在 2018 年,也就是双方正式签约的前一年,微软 CTO Kevin Scott 就在一封内部邮件里写道:「OpenAI 把我们当成一桶毫无差异的 GPU,这对我们来说毫无吸引力。」那时候 OpenAI 还小,微软还是金主,但嫌弃已经是双向的——OpenAI 嫌微软不够纯粹、限制太多;微软嫌 OpenAI 太理想主义、商业化太慢。

这种互相嫌弃的底色,在 ChatGPT 爆红之后,被成倍放大。

到了 2025 年,双方在算力分配上的分歧彻底公开化。Altman 一方认为,微软提供的顶级芯片和云资源完全跟不上 OpenAI 的模型训练需求;微软则表示已「提供所能提供的一切」,言下之意,是 OpenAI 的胃口已经超出了任何一个合作伙伴所能承受的范围。

算力,成了这段关系里最难绕过的关键点。

鸡蛋不能放在同一个篮子里,微软早早开启了「去 OpenAI 化」的备胎计划:内部训练轻量模型 Phi 系列;收购 Inflection AI 的大模型团队,交由 Mustafa Suleyman 掌舵;推进自有企业模型 MAI,在部分 Copilot 场景中替代 OpenAI 模型;与 Hugging Face、Cohere、Mistral 等模型厂商建立分销关系。

虽然合作协议白纸黑字要求 OpenAI 和微软共享知识产权,但 Suleyman 和不少高管对 OpenAI 模型运作的透明度颇有怨言。据悉,他曾因 OpenAI 没提交 o1 模型的「链式思维」技术文档当场发火,在会议中对包括时任 OpenAI 首席技术官 Mira Murati 在内的人员直接开炮,会议最终不欢而散。

去年初,当奥特曼宣布与软银、Oracle 等合作伙伴共同启动星门计划时,这场排面十足的合作声明里,唯独缺了一个名字:微软。

微软并不是彻底被排除在外。OpenAI 的很多服务还跑在 Azure 上,微软也仍然是重要合作方。但这次星门计划释放出的信号很清楚:OpenAI 不想再把算力来源押在微软一家身上。

过去几年,微软几乎是 OpenAI 最重要的算力入口。现在,OpenAI 开始把软银、Oracle、英伟达等伙伴拉进来,自己搭一张更大的算力网。微软随后也调整了双方协议,允许 OpenAI 去建设额外算力,只保留优先选择权。

这意味着,两家的合作还会继续,但独家绑定的阶段已经过去了。

AGI 的「开关」究竟掌握在谁手里?

2019 年那份合作协议中,有一个几乎未被高调讨论的条款:如果 OpenAI 董事会认定其模型实现了 AGI,那么它有权单方面终止微软的独家使用权。

根据外媒 The Information 披露的文件,AGI 的定义被描绘得颇为具象:OpenAI 非营利董事会「在合理裁量权下」认定,AGI「已经被创造出来,具备为盈利单位的投资者带来最大可分利润的能力」,且 OpenAI 有能力和权限指挥 AGI 去实现这些利润。

当时,这更像是一个「理念性」补丁,用来安抚 OpenAI 对大型科技公司掌控的担忧。「一开始大家都觉得这事可笑。」一位参与合同谈判的人士回忆道。

但所有人都低估了技术进化的速度。Altman 先后公开表示 OpenAI 有信心构建 AGI,并称 AGI 已经显露踪迹。

纳德拉对此不买账:「我们自己宣布实现了某个 AGI 里程碑,这对我来说只是荒谬的基准作弊。真正的基准是全球经济每年增长 10%。」

微软担心 OpenAI 把 AGI 当成了脱钩的按钮。而这场拉锯战,今天终究有了结果。

2026 年 4 月,双方正式完成协议修订,各退一步,各取所需。

在云合作上,微软仍是 OpenAI 的主要云合作伙伴,OpenAI 新产品依然优先在 Azure 发布,但独家限制正式解除——OpenAI 现在可以通过任何云提供商向客户提供服务。此前已与亚马逊 AWS 签署的七年协议,从此有了明确的名分。

在知识产权上,微软对 OpenAI IP 的授权期限延长至 2032 年,但性质从独家变为非独家。微软依然拿着一张长期饭票,只是不再是桌上唯一的食客。

在收入分成上,微软不再向 OpenAI 支付分成;OpenAI 向微软的分成延续至 2030 年,比例不变,但设有总额上限,与 OpenAI 的技术进展脱钩。当初那个可能价值数百亿美元的无限分成条款,就此画上了天花板。

在 AGI 问题上,微软明确获得了独立追求 AGI 的权利,不再受制于 OpenAI 的技术路线。

与此同时,微软并未坐等谈判结果。2026 年 4 月,其内部「MAI 超级智能团队」正式推出自研的 MAI 系列模型,覆盖语音、图像、转录等多个方向,目标是在两到三年内实现 AI 能力的完全独立。

对 OpenAI 而言,这场谈判同样意义重大。重组之路已然打通,上市前景更加清晰,算力来源也完成了多元化布局。依存度或许让双方不得不坐回谈判桌,但那个由比尔·盖茨亲自促成、在 Azure 上展开的 AI 蜜月时代,已经翻篇了。

#欢迎关注爱范儿官方微信公众号:爱范儿(微信号:ifanr),更多精彩内容第一时间为您奉上。

iOS 27 发力 AI 修图,苹果也开始 AI 焦虑了


今年的 iOS 27,将会 AI 味浓浓。

彭博社报道,苹果准备在今年的 WWDC 开发者大会上推出一套全新的 AI 修图工具,将会集成在 iPhone、iPad 和 Mac 的照片应用中。

沉寂了一年的 Apple 智能,将随着 iOS 27 的推出,再次回到聚光灯下。

两年前,苹果还公开表示不做 AI 修图功能,在竞争对手的步步紧逼之下,终于还是忍不住跟进了。

iOS 27:AI 无处不在

在 iOS 18 推出的 Apple Intelligence 工具集,苹果就已经允许用户利用 AI 简单消除照片中的物体,属于当下智能手机的标配功能。

苹果的对手已经走得更远。像是把「AI 修图」作为标志性功能的 Google,已经实现给人物更换完美表情、把人物加入合照,甚至重构整个画面背景的能力,整个 Android 阵营都在发力类似的功能。

图源:WIRED

在 iOS/iPadOS/macOS 27 中,苹果将在「照片」App 的编辑界面中,增加一个全新的「Apple Intelligence Tools」(Apple 智能工具集)模块,包含以下三个功能:

  • Extend(扩展),就是 AI 扩图的功能,允许用户在原始画面之外额外生成图像内容,比如拍摄一张旅游景点的地标图,然后用这个工具来填充周围的景色,用户可以自行控制扩图的范围和位置。
  • Enhance(增强),利用 AI 自动修图,有点像不能自定义的「豆包修图」。
  • Reframe(重构),主要运用于苹果的空间照片,允许用户在拍摄后改变视角,比如一张汽车照片可以从正面视角调整为侧面视角。这个功能将充分利用空间照片来自多个摄像头的结构数据。

不过,根据内部测试的员工透露,这些功能的开发并不算顺利,效果更复杂的「重构」和「扩展」不稳定,苹果很可能会推迟或砍掉这些功能的发布。

包括这个新的 AI 修图功能在内,iOS 27 系统的更新将会沿着「优化」和「AI」两个主旋律进行。

此前爱范儿已经多次报道,由于 iOS 26 引入了「液态玻璃」的全新设计语言,系统稳定性有明显下降,因此 iOS 27 将会聚焦在系统稳定性优化上,不仅要修复目前 iOS 26 的大量 Bug,还会提升设备的续航和性能表现,并持续修改液态玻璃的视觉效果。

其余的功能更新,则会集中在「AI」上。首先,苹果正在努力将 2 年前画饼的 AI Siri 正式实装 iOS 27,这也是 Apple 智能体验和未来苹果 AI 硬件战略的核心体验部分。

虽然已经「潜心打磨」两年,今年年初有内部人员向彭博社透露,AI Siri 的一些杀手级功能,例如语音控制 Siri 操作应用,测试结果并不理想。

这意味着,即使我们能在 iOS 27 见到 AI Siri 庐山真面目,它也大概率会是一个「技术预览版」,并且需要等待后续更新补充完整功能。

旧饼还没兑现,iOS 27 选择继续加码 AI 新功能。

苹果打算进一步将 Siri 改造为类似 ChatGPT 和 Google Gemini 那样的聊天机器人,届时 Siri 会有一个独立应用,用来对话和存储聊天记录。

苹果还计划在邮件、日历和 Safari 浏览器等第一方应用中,引入新的 Siri 引擎,实现更强的搜索和数据管理能力。

除此之外,苹果正在酝酿一个 AI 搜索引擎, 允许用户从网络搜索信息,生成综合的报告和信息列表,以及网页链接,作为 Safari 和 Spotlight 网络搜索。

在健康领域,苹果将结合 AI 推出「Health+」的订阅服务,利用 AI 智能体,对用户的身体数据进行个性化分析,并针对性推送真人医生录制的建议。

比起两年前那场 WWDC,iOS 27 这一大批 AI 功能,比目前的 Apple 智能还要更丰富不少。

FOBO 的风,还是吹到了库比提诺

2025 年 1 月, 苹果的软件主管 Craig Federighi 和营销高级副总裁 Greg Joswiak 接受了《华尔街日报》的专访,谈到了对 AI 的看法。

其中 Federighi 特别提到了「AI 修图」,解释为什么苹果只推出「消除」,而不是如同三星和 Google 一样做大量的功能:

对我们来说,重要的是帮助人们传播准确的信息,而不是虚构的「幻想」。

Google Pixel 的表情修正功能,图源:The Washington Post

苹果公司内部曾经针对「AI 修图」的尺度进行了长时间讨论,考虑到用户的高需求,苹果公司愿意迈出「小小的一步」,于是在 iOS 18 之中推出了「AI 消除」的功能。

而像是「图乐园」这种 AI 生图功能,苹果也做出了严格的限制,只能用于创作卡通图案,避免生成逼真的图像造成误导。

某种程度上,苹果的坚持已经开始松动,iOS 27 这个全新的「AI 扩图」功能,让 Apple 智能进一步介入照片的真实性。

回望两年前的那场 WWDC,Apple 智能以一个非常温和的形象问世,没有想象中的 Apple-GPT,苹果的很多尝试都显得谨小慎微,不具备改天换地的野心。

但 AI 产品的代际变化速度极快。别说两年前,两个月前都没人觉得 ChatGPT 是一个好用的文生图机器人,现在打开社交媒体 GPT Image 2 的作品已经铺天盖地。

两年没动弹过的 Apple 智能,自然「遥遥落后」。

作为终端厂商的苹果,原本拥有一个得天独厚的优势,能够一夜让自己的 AI 产品面向全球十亿用户推出。

只是,对于用户来说,Apple 智能不仅不算好用,更致命的是,它提供的价值,和用户的需求,有很大程度的错位,导致用户并不想用。

FOBO(Fear Of Becoming Obsolete,害怕被淘汰)的阴影,终究还是笼罩了苹果。

过去, 苹果可以决定什么功能值得出现;如今,它也必须回应用户已经习惯拥有什么,行业在发力什么。iOS 27 上这些曾被苹果否决的 AI 功能,本质上都是一次迟到的补课。

Siri 版 GPT 要做,AI 搜索引擎要做,系统应用也全部 AI 化,现在苹果也盯上了 AI 照片编辑,一个其他手机品牌很喜欢演示的功能。

苹果能不能把这些功能做好,又是另一个问题。

即使已经发布 2 年,Apple 智能的照片「消除」效果依旧不如人意,横向对比 Android 阵营显得更显落后,经常会出现消除不彻底、扭曲图像的问题。

全新「扩展」和「重构」功能则更复杂,内部已经反馈稳定性不佳——其实,我相信对于更多用户来说,会更希望苹果能把更实用的「消除」功能进一步完善好。

并且,AI 修图一直以来都争议缠身,特别是前两年的 Google Pixel,可以在一张真实照片上加入任何元素,实现以假乱真的效果,就引发了国外媒体对于「真实」和「伪造」的大讨论。

左图为实拍,右图经过 Pixel Magic Editor 编辑,图源:The Verge

苹果会尽量规避这种风险,目前看来,这些新功能的自由度相当有限,用户不能自定义修改的方向和指令。

面对行业趋势和用户需求,苹果也不得不松动和更改曾经的价值取向,现在的他们,其实还不知道自己要做什么样的 AI。

但这不仅是苹果的困惑,其实也是笼罩整个行业的迷思,最富含 AI 的 Google Pixel,也并非是我们期待的那台 AI 手机。

既然暂时难以重新扮演行业的引领者,那么在 AI 这场竞赛中持续调整步伐的苹果,至少还能先通过跟随,确保自己依然留在牌桌之上。

但我仍然期待,今年的六月,苹果能为我们带来惊喜。

#欢迎关注爱范儿官方微信公众号:爱范儿(微信号:ifanr),更多精彩内容第一时间为您奉上。

小米最新人形机器人的手,会「出汗」了

最近小米最让我惊喜的新品,不是汽车,也不是手机,而是一款还没正式发布的人形机器人,小米 CyberOne V2。

在前天的小米投资者大会上,它第一次公开亮相。

不跑不跳,也没有表演后空翻,只是安静地站在那里,像一位训练有素的工作人员,给与会嘉宾递上伴手礼,和人握手、击掌。

小米官方目前还没有发布正式的参数,根据网上的爆料信息,小米 CyberOne V2 这款人形机器人身高 178cm、体重约 52kg。

其他的参数像是机器人的步行速度,大约为 0.98m/s,单臂的举重能力可以支撑 3kg 的重量。对比早前宇树发布的 H2 机器人,其最快行走速度是 3.3m/s,手臂最大负载 15kg,额定 7kg。

小米 CyberOne V2 的重点,很明显没有放在走路和举重上,这次最值得关注的,是小米机器人重新设计的手部。

这双手是按照成年男性的手 1:1 比例制作,具有 22-27 个自由度,不仅能做到快速拧螺丝、掌内转螺柱这些精细工业化场景的任务,还能捏羽毛和触碰气球。

更意外的是,这双手竟然还有人类的「汗腺」。

其他的爆料还提到,小米 CyberOne V2 依靠背后的情感 AI 模型,能够识别面部表情和声音,从而给出恰当的互动反馈。

但也有美国网友在下面评论说,小米 CyberOne V2 的样子和特斯拉 Optimus 也太像了,马斯克选择不提前展示 Optimus 的任何信息是对的。

此前马斯克有说过,推迟展示 Optimus V3,是为了防止竞争对手抄袭,并认为在大规模量产前,应尽可能将其藏在门后。

灵巧手是机器人的硬件瓶颈

从技术和资本市场,机器人这段时间的发展都很迅猛,几乎每天都有一个具身智能的融资。

在脚上的功夫,机器人半马刷新了人类纪录,来到了一小时内。

但在「用手操作」上,翻书、系鞋带,这些人类双手的日常操作,对机器人来说却还是天方夜谭。

具身智能的核心,其实就在于机器人的大脑如何通过物理躯体与现实世界交互,而灵巧手成了实现完美交互最大的硬件瓶颈。

多家机器人公司都曾专门研究过灵巧手的问题,强脑科技此前发布了 BrainCo Revo 3 智能灵巧手;21 个自由度,集成了全掌触觉和指尖视触觉,并且兼容开源生态。

在官方发布的演示视频里,这只手超越了人手的活动空间,并且覆盖了 33 种抓握手势,能双手解魔方,使用剪刀,和盘手串等。

灵巧手之所以成为一项难题,是难在软件和硬件同时卡住。软件上,人手到机器人手的动作需要重定向;硬件上,手指内部的小型执行器又很难同时做到有力、灵敏、可靠。

这里的「重定向」可以理解为:把人手的姿态、指尖轨迹和接触关系,转换成机器人手能执行的关节角和控制命令。

但人手和机械手的尺寸、关节数量、运动范围都不完全一样。人类做起来很自然的动作,直接映射到机器人手上,可能会变成不可达、穿模,或者接触点不对。

在硬件上,腿部关节通常有更多空间,可以放更大半径、更高扭矩密度的电机,因此更容易采用低减速比或准直驱方案。比如 6:1 减速比,意思是电机转 6 圈,输出轴转 1 圈;速度降下来,输出扭矩放大上去。

▲腿部电机(齿轮比:6)与手指(齿轮比:288)。扭矩随r³缩放。

手指没有这种空间。电机必须缩到能塞进指节的尺寸,而在几何相似的情况下,电机扭矩大致随特征长度的三次方下降。线性尺寸缩小到 1/10,扭矩可能只剩原来的 1/1000 量级。

扭矩不够时,常见做法是靠更高减速比补回来,比如 100:1、200:1,甚至 288:1。

高减速比的代价也很直接:摩擦、齿隙、效率损失和反射惯量都会变得更难处理。仿真里很轻巧的手指,到了现实里可能变得又硬又钝,接触时不够柔顺,精细操作也就难了。

根据小米技术此前发布的全掌触觉仿生手探索文章,为了能 100% 复用人类的数据,小米对 CyberOne V2 的仿生手这次也进行了大刀阔斧的重构。

1:1 极致仿生: 将仿生手体积大幅压缩了 60%,尺寸与成年男性手部完全一致。同时增加了 64% 的自由度,具有 22-27 个自由度 DoF,可达空间、惯量分布都无限逼近真实人手。

全掌触觉覆盖: 机器人如果视觉一旦被遮挡,基本上就无法正常运作。小米引入了触觉手套方案,将全掌触觉传感器覆盖面积提升至 8200 平方毫米。人类穿上它打样,机器人就能完美继承「手感」。

15 万次耐久拉锯: 在实验室里、演示视频里捏个杯子很简单,但在工厂里连续打一万次螺丝,机器人的腱绳、弹簧和套管就会断裂。小米这双仿生手目前在实际抓握中,突破了 15 万次的循环寿命。

而最特别的细节,是灵巧手的「汗腺」。

为了实现这双高自由度的灵巧手,小米也必须在机器人的单手小臂内塞满各种电机。

而在实际应用中,单手电机功率超 100W,其中 30W 会直接转化为废热,极易烧毁线路。在没有外挂大型风扇的狭小空间里,他们从人类「出汗散热」中找到了灵感。

小米使用金属 3D 打印,在紧凑的小臂结构中制作了微型液冷循环通道。利用微泵将热量转移,再通过水分蒸发吸热降温。

在实测中,这套仿生汗腺系统,每分钟仅需蒸发 0.5mL 水,就能提供约 10W 的主动散热能力。

手之外,还有机器人的大脑

硬件在迭代,模型也在同步推进。

两个月前,小米开源了 Xiaomi-Robotics-0,一个面向具身智能的 VLA(视觉-语言-动作)模型。

在小米技术的官方推文里,他们进一步开源了真机后训练(Post-training)的完整流程。

最直观的数据是,基于预训练基座,用 20 小时的任务数据进行真机后训练,Xiaomi-Robotics-0 模型就能学会「把耳机放进耳机盒」这个高难度任务,并且能连续完成多个耳机的收纳。

这套后训练流程里有一个值得关注的技术细节:「偷懒效应」的解决方案。

为了让机器人动作不卡顿,业界通常采用异步推理和「动作前缀」技术,即让新动作顺着上一个动作的惯性自然过渡。但这会导致 AI 开始「偷懒」:过度依赖动作惯性,选择性无视摄像头传来的实时视觉反馈。

小米用了三种机制来对抗这个问题:自适应加权损失、Λ 型注意力掩码、前缀动作随机遮蔽。简单说,就是在训练里故意给模型制造「答案残缺」的情况,强迫它不得不去看当前的视觉信号。

软硬件能力的综合,也让小米机器人已经在汽车工厂里搬砖了。在自攻螺母上件工位,做到了 3 小时持续无干预作业,安装成功率高达 90.2%,能配合生产线 76 秒的高速节拍。

开始大规模交付的机器人

特斯拉此前把 Model S/X 的整条生产线砍掉,腾位置给机器人。

在一季度财报会上马斯克宣布,第三代 Optimus V3 预计年中亮相,7 月下旬至 8 月在加州弗里蒙特工厂启动生产,2026 年下半年向企业客户交付,规划年产能 100 万台。

但就像马斯克之前在播客里承认的一样,手部精细操作是「整个项目最难的环节」。

特斯拉的 Optimus 还没量产,美国另一家人形机器人公司 Figure 机器人,今天在 X 上宣布生产规模扩大了 24 倍,从每天生产一个机器人,变成 1 小时生产一个机器人。

在官方新闻稿里,Figure 提到他们已经交付了超过 350 个机器人。

对小米来说,做机器人,可能不会很快像 Figure、宇树、甚至是特斯拉一样,卖出一台消费级通用人形机器人。

但从 CyberOne V2 的方向也能看出来,小米真正想解决的,除了要让机器人跑得更快、举得更重,还有要让它更像一个能真正干活的手。

▲小米领投的量变机器人公司官网视频

毕竟,人形机器人能不能走进工厂、家庭,决定因素从来都不是它能不能翻跟头,而是它能不能拧螺丝、收耳机、递东西,完成那些看似简单、却最贴近日常的动作。

而这,恰恰也是人形机器人距离大规模落地最近的一步。

部分图片素材来自小米技术公众号、X@niccruzpatane 和 https://www.origami-robotics.com/blog/dexterity-deadlocks.html

#欢迎关注爱范儿官方微信公众号:爱范儿(微信号:ifanr),更多精彩内容第一时间为您奉上。

一台比小天才还猛的「反 AI 座机」,卖爆美国家长群

我至今还能背出小学同桌家里的手机号码。

那时想约人玩,总要先过家长那关:「阿姨好,××在家吗?」等长辈吼一嗓子把人叫来,这通电话才算真正开始。回头想想,我们那时的社交,始终要「借道」大人。

一出生就被触屏包围的 10 后、20 后,大概很难共情这种经历。就算家长迟迟不肯配手机,街上随处可见的儿童智能手表早就填上了这个空缺,定位、通话、发语音,一块表全包了。

▲ 由 GPT-Image-2 生成

但在大洋彼岸,同样有一批家长选择让孩子晚些接触智能设备,问题是,他们能给孩子的替代品,并不比我们当年的选择多。正是这份普遍的育儿困扰,催生了一款特别的产品——

Tin Can 复古座机。

一台卖 100 美元的「金属罐头」

第一眼看到 Tin Can,你绝对会以为这是某个剧组用来怀旧的道具。

它长得像一个圆柱形的罐头,甚至在表面做出了类似罐头标签处的轻微纹路。这款设备提供海蓝、纯白、柠檬黄、丁香紫四种极具多巴胺风格的配色,配有一根标志性的复古卷曲电话线。

这台标价高达 100 美元的设备,没有屏幕,没有摄像头,没有应用商店,甚至连发短信的功能都被无情地阉割了。它唯一能做的事情,就是「打电话」。

你也许会觉得这是在收割智商税,但在北美,它正被焦虑的中产家长们疯狂抢购。

从硬件底层来看,Tin Can 是一个披着复古外壳的现代 VoIP(基于 IP 的语音传输)终端。连上家里的 Wi-Fi 就能工作。

机身上有一个带品牌 logo 的按钮,有未读语音信箱时会亮灯提示;还有四个带 emoji 标识的快捷拨号键,方便不识字的低龄儿童一键拨打。

它的商业模式深谙「圈地自萌」的精髓:

如果只拨打其他 Tin Can 用户的五位数短号完全免费;但如果想给爷爷奶奶的普通手机打电话,就需要每月掏 9.99 美元订阅「Party Line」套餐。据官方透露,绝大多数用户都乖乖掏了这笔月租。

最绝的是它的权限管理。

所有设置都被死死捏在家长手机的 App 里。设备只能接打家长设定的「白名单」号码,骚扰电话一概打不进。如果孩子试图拨打白名单外的号码,话筒里只会传来无情的无法接通提示音。

家长还能设置「静音时段」,比如睡前或写作业时,这部电话就成了一块塑料砖头(保留紧急呼叫电话)。更硬核的是,如果是离异家庭,父母可以在两个家里各放一台,共用一个号码,孩子无论去哪边,都不耽误接朋友的电话。

▲ 官方介绍里甚至把「不是无线设备」写成卖点。

另外,它刻意不内置电池,必须插电使用。

Tin Can 创始人 Chet Kittleson 也解释说,这是因为他极其讨厌老妈接电话时满屋子乱跑、边做家务边敷衍聊天的状态。现在,没电池的座机把孩子们「钉死」在了原地,逼着他们专心致志地讲话。

换言之,Tin Can 表面上像一件怀旧玩具,实质上是一套儿童社交通讯的围栏系统。它把智能手机时代最令人头疼的三个问题,陌生人、沉迷、算法推荐,全部用硬件阉割的方式绕开了。

三个老爸,和一次厨房餐桌上的产品验证

Tin Can 诞生的动机,精准戳中了当代父母最痛的神经——他们苦「社交秘书」久矣。

Chet Kittleson 曾在西雅图房地产科技公司 Redfin 担任高管,后出走创业失败。三年前,他在校门口接孩子时听到家长们疯狂抱怨:为了帮孩子约个周末的玩伴聚会,家长们必须在短信里来回确认时间。

「现在的孩子没有任何工具可以主动联系朋友,所有的协调工作都压回到了父母身上。」作为三个孩子的父亲,Kittleson 猛然醒悟。

▲ 从左往右依次为 Tin Can 创始人 Graeme Davies,Chet Kittleson, Max Blumen

公司倒闭的那一周,他把两个老朋友 Max Blumen 和 Graeme Davies 叫到家里,三个老爸在厨房餐桌上熬了一周,拼出了 5 台原型机,把其中两台塞给了女儿的朋友。

奇迹发生了。第二天早上 8 点 15 分,话筒响了,是女儿的朋友打来邀请她一起走路上学。那是女儿第一次没有借助任何家长,自己安排了社交活动。

消息在家长之间口耳相传,很快蔓延到陌生人。Kittleson 亲自上门安装了大约五十台原型机,边装边问家长用下来感觉怎么样,最担心的是什么,再根据反馈调整产品。

他形容这款产品天然具有病毒式传播的特质:「一个人买了,她的朋友也想要;别人来家里,看到一台复古电话放在那里,会直接失控——孩子家里有一台老式电话,这件事本身就有某种魔力。」

是的,社交圈层的同伴压力也加速了 Tin Can 的爆火。小天才电话手表之所以能迅速崛起,很大程度上是因为它把产品从工具做成了社交入口。「碰一碰加好友」、微聊、主页圈等设计,让手表变成了孩子之间的社交货币。

同理,如果别人都有 Tin Can,你没有,孩子就会被社交孤立。

所以,Tin Can 的杀手锏变成了「团购」。在美国堪萨斯城一所小学,95% 的家庭统一采购了这款座机,孩子们甚至开始用纸质通讯录记录彼此的号码。当「不用智能手机」成为整个社区的共同选择时,它就变成了一种新的社群认同。

2025 年 4 月,Tin Can 正式开放购买。前几批产品接连售罄,积压的预购名单一度接近六位数。目前产品已覆盖美国全部 50 个州和加拿大,最新一批订单交货期排至 2026 年 6 月。

在资本层面,产品的爆发同样引发了风投的高度关注。2025 年夏天,Tin Can 完成 350 万美元的早期融资,投资方包括 PSL Ventures、Newfund Capital 等等,同年 12 月,Greylock Partners 领投了 1200 万美元的种子轮,累计融资达到 1550 万美元。

Tin Can 还计划用新资金扩大产能、增加工程和客服人员,并推进国际市场的布局。但理想很丰满,工程很骨感。作为初创公司的初代硬件,Tin Can 还是一度遭遇了惨烈的翻车。

在 2025 年的圣诞节假期,大批家庭同时开机,当天的通话量暴增了 100 倍,Tin Can 的服务器直接被挤崩了。很多满怀期待拆开礼物的孩子,面对的是长达两周的掉线和无法接通。公司只能紧急致歉并免除当月订阅费。

硬件上的毛病也不少:

底层 VoIP 导致通话有 1 秒的延迟,偶尔还有回声;实体按键对小孩的手来说太硬;USB-C 供电接口在拉扯中容易松动,甚至成了绊倒孩子的隐患。此外,英国的 Karri 和准备推出 60 美元竞品的 Pinwheel 都在虎视眈眈。但即便如此,家长们依然对 Tin Can 情有独钟。

AI 陪伴越拟真,真实社交越显得粗糙可贵

如果我们把视角拉远,会发现 Tin Can 的爆火,是站在了一场席卷全球的反屏幕情绪巨浪。

纽约大学心理学家 Jonathan Haidt 在其著作《焦虑的一代》中指出,2010 年至 2015 年间,随着智能手机和 Instagram 等社交平台的普及,儿童的童年经历了一场深刻的数字运动。

统计数据显示,美国青少年的抑郁率和焦虑率在这十年间分别上升了 134% 和 106%,女性青少年受到的冲击尤为剧烈,容貌焦虑和饮食失调问题大幅攀升,男性青少年则面临社交退缩和注意力崩溃的风险。

Haidt 为此提出了四条具体建议:高中之前不提供智能手机、16 岁之前禁止使用社交媒体、全天候的校园手机禁令,以及增加儿童在现实世界中的独立活动时间。这套框架迅速成为家长群体中最广泛引用的参照系。

面对这一局面,各国政府开始在立法层面介入。

截至 2026 年初,全球已有超过 114 个教育系统实施了不同程度的校园手机禁令,占全球国家总数的 58%,这一比例从 2023 年的 24% 飙升至今,不到三年内翻了一倍有余。

荷兰、法国、意大利、英国、韩国、澳大利亚相继出台限制措施,美国超过 20 个州也在推进或落地相关法规。

学校端的执行方式五花八门,从磁吸锁袋到集中储物柜等等,但你有张良计我有过墙梯,学生的应对手段同样层出不穷:强力磁铁撬开锁袋、把旧手机放进去以旧换旧、用模型机偷天换日等等。讲真,地球村的学生在这一块上确实都是心有灵犀的(doge)。

家长端的民间力量同样在狂飙。美国的「Wait Until 8th」运动、前 NFL 球星妻子 Kylie Kelce 带火的「厨房电话」原则(只把手机放客厅,手机禁入卧室),以及英国 18 万家长签署的「无智能手机童年(SFC)」契约,都在试图把孩子从屏幕前拽回来。

有趣的是,对于当下的孩子来说,回归座机并不是一件无缝衔接的事情。

加州大学伯克利分校的社会学家 Claude Fischer 研究了电话进入家庭生活早期的历史,他指出,人们从来都不是「天生就会打电话」的——从 19 世纪末电话进入普通家庭开始,如何接听、如何介绍自己、该说多大声、怎么结束通话,这些都需要专门教授,电话公司甚至为此制作过礼仪手册和学校教材。

有一个流传已久的段子是,当你让 80 后和 15 后同时做一个「打电话」的手势,你会发现两代人的答案截然不同——有人比出六,有人整个手掌贴在耳边,还有人甚至不理解为什么电话的图标不是智能手机的模样。

今天的孩子对触屏、表情包、语音条和视频通话更熟悉,却未必知道一通没有画面、没有表情救场的电话该怎么进行。Tin Can 意外承担了一门古老技能的补课:如何在看不见对方表情的情况下,用声音维持一段关系。

《连线》杂志记录了一对兄妹拿到 Tin Can 的第一周,连续打了二十多个电话,每次接通只说一句「嗨」,然后就是令人窒息的沉默。但在几周后,他们开始学会主动聊天,学会道别,学会大声表达,学会在有限的通话里,完成一场完整的、有温度的人际互动。

与之形成鲜明对比的,是当下愈发普遍的 AI 陪伴。在 AI 无处不在的时代,无数孩子将永远温柔、永远秒回、永远共情的 AI,当作最优的倾诉对象。但社会学家 Sherry Turkle 警告过,数字连接提供的是「陪伴的幻觉」,而不是真实的友谊。

真实的人际关系,是包含摩擦力的。它包含误解、等待、尴尬的沉默,包含对方可能正在吃饭不能接听,包含你需要鼓起勇气克服恐惧去破冰。一个永远顺从的 AI,给不了这种成长必需的挫折。

Tin Can 诞生之初,是为了解决一个没有适合儿童通讯工具、反屏幕的旧问题。但这台笨重、有延迟、不能发表情包的复古电话,却意外成了解决 AI 新问题的解药,它让孩子们拿起话筒,听着真实的电流声,去面对真实世界里,那些笨拙、粗糙却无比鲜活的社交摩擦。

剥离掉 AI 算法与屏幕,最好的社交也只需要一根电话线,和两个直面彼此的灵魂。

#欢迎关注爱范儿官方微信公众号:爱范儿(微信号:ifanr),更多精彩内容第一时间为您奉上。

刚刚,GPT-5.5 Instant 发布,奥特曼还邀请马斯克参加 AI 办的派对

就在刚刚,OpenAI 正式推送了 GPT-5.5 Instant,将其设为 ChatGPT 的默认模型,取代此前的 GPT-5.3 Instant,面向所有用户开放。

Instant 系列是 ChatGPT 的日常主力模型,每天有数以亿计的用户在用。官方说,在这个量级上,哪怕只是小幅改进,积累起来的效果也相当可观。

这个版本主打三件事:更准确、更简洁、更懂你。

与上一版本相比,新模型在保持低延迟的同时,在准确性、回复风格和个性化能力上都有明显提升。

准确性的提升,在高风险领域最为突出。内部测试显示,GPT-5.5 Instant 在医疗、法律、金融类问题上的幻觉率较上一版本下降了 52.5%。对用户此前标记过的错误对话,错误率也减少了 37.3%。除文字问答外,图片和照片的分析能力、理科问题的解答质量,以及判断何时应当主动调用搜索工具,都有所改善。

数学和科学能力的跃升幅度更大。在 AIME 2025 竞赛数学测试中,GPT-5.5 Instant 得分 81.2,GPT-5.3 Instant 仅为 65.4。博士级科学测试 GPQA 的得分从 78.5 升至 85.6,多模态推理基准 MMMU-Pro 的得分从 69.2 升至 76,科学图表理解 CharXiv 从 75 升至 81.6,文档解析错误率则从 14.6% 降至 12.5%。

OpenAI 用一道代数题演示了两个版本的差距。用户提交了一道根式方程的解题过程,询问是否正确。GPT-5.3 Instant 发现 x=3 代入原方程不成立后,直接判定「无实数解」,没有再往前追查。GPT-5.5 Instant 同样发现 x=3 无效,但随后定位到用户展开 (x-1)² 时的具体错误,并正确解答。

回复风格也是这次更新的重点。

新模型更简短,不再堆砌格式和表情符号,也减少了不必要的追问。官方以一个日常场景为例:问如何委婉地让话多的同事少说点话。

GPT-5.3 Instant 给出了五种分类策略,还附上「不该做什么」清单,结构完整但略显过度。GPT-5.5 Instant 的回复少了 30.2% 的字数和 29.2% 的行数,语气更像朋友给的建议,把重点放在如何把问题引到自己的专注需求上,而不是对方的说话习惯上。

个性化能力是此次更新的另一条主线。

Plus 和 Pro 用户可以让模型调取历史对话、上传文件以及关联的 Gmail 内容,从而获得更贴合个人情况的回答,不需要每次重新解释背景。官方展示了一个茶馆推荐的对比:GPT-5.3 Instant 只知道用户在旧金山,推荐了几家通用热门店。GPT-5.5 Instant 则从历史对话里找到用户常去 Asha Tea House、偏好高山茶而非重糖奶茶的记录,据此推荐了风格更匹配的 Ceré Tea 和 Song Tea & Ceramics,并说明了推荐理由。

与此同时,所有消费者版本将上线「记忆来源」功能。

当回答用到了个人背景信息,用户可以看到具体调用了哪些历史对话或已保存的记忆条目,并可随时删除或修正过时内容。OpenAI 说明,这个视图展示的是最相关的部分来源,不一定覆盖模型检索过的全部记录,后续会持续完善。不想被记录的用户也可以选择临时对话模式,该模式不会读取或更新任何记忆。分享对话时,对方看不到这些来源记录。

GPT-5.3 Instant 将保留三个月供付费用户使用,之后正式下线。个性化功能目前向 Plus 和 Pro 用户的网页端开放,移动端及免费、Go、企业等版本的推送计划在未来几周内陆续跟进,具体功能因地区而异。对开发者而言,GPT-5.5 Instant 已通过 API 以「chat-latest」名称提供。

哦,对了,今天 OpenAI 也即将举行一场派对。

奥特曼在 Stripe Sessions 的一场对谈里聊到,他在筹备 GPT-5.5 的上线派对时,顺手问了模型一句:你想要什么样的派对?模型认真给了一份清单。它希望派对定在美国当地时间 5 月 5 日,演讲环节越短越好,要有人类创造者上台致祝酒词,但它自己不想上台祝酒。

它还提议现场设一个专门收集 GPT-5.6 建议的环节,并把这些建议反馈给它自己。Sam Altman 说,这些要求「很美好」,能让派对顺利进行。时间最终定在下午 5 点 55 分,也是模型自己的选择。

而派对地点则定在 OpenAI 旧金山总部,非本地嘉宾的机票和酒店由 OpenAI 负责。

受邀名单由 Codex 从推文回复中筛选,报名链接于 4 月 30 日下午 5 点 55 分关闭。24 小时内有超过 8000 人报名,已有用户晒出了收到的邀请邮件。没被选上的人也收到了一封邮件,OpenAI 给他们的 Codex 调用额度提升了 10 倍,有效期到 6 月 5 日。

奥特曼还回应了用户的调侃:马斯克如果想来也可以来,世界需要更多爱。话是这么说,可惜马斯克现在的爱全在状告奥特曼以及 OpenAI 的起诉书里了,庆祝 GPT-5.5 的香槟只能留给奥特曼自己喝了。

#欢迎关注爱范儿官方微信公众号:爱范儿(微信号:ifanr),更多精彩内容第一时间为您奉上。

等 DeepSeek 回复的 30 秒,是手机最好玩的半小时

你要是问当今互联网最神秘、最玄学、连量子力学都解释不清的「时空裂缝」在哪里?

它不在百慕大,也不在诺兰的电影里,而是在你的 DeepSeek、Claude 或者 GPT 正在思考的过程里。不管是赶期末周的大学生、半夜 Vibe Coding 的程序猿,还是被各种 AI 任务测试的产品经理,大家竟然在同一件事上达成了大和谐:

等 AI 回复的那一分钟,是这一整天里玩手机玩得最快乐、最问心无愧的时刻。

尤其是当你猛击回车键,眼前的屏幕上弹出了那句令人安心的「思考中…」时,这时候,你的大脑皮层向你下达了一个极其合理、极其符合生物学本能的指令:

「好了,它在替我们干活了。咱们低头看一眼手机吧,就一眼,绝不多看。」

然后,你熟练地解锁屏幕,点开社交媒体。起初,你只是刷了两个雪山狐狸啃酱板鸭的猎奇视频,接着滑到了一个「注意看,这个男人叫小帅」的悬疑电影解说,紧接着又顺手给一个搞笑猫咪合集点了赞。

接着,你深吸一口气,抬起头。

等等,刚才发生了什么?

窗外的天怎么黑透了?杯子里的热水怎么凉了?最可怕的是,时钟上的分针怎么平移了小半个表盘?「然后一抬头,十分钟过去了,跟穿越了一样。」

如果你有过这种经历,恭喜你,你已经染上了今年最流行的「AI 间隙摸鱼症」。

神圣的、不可抗拒的赛博「带薪假」

在没有 AI 的年代,摸鱼是需要心理建设的。

你要像雷达一样时刻警惕老板的视线,要伪装出噼里啪啦敲击键盘的清脆回声,还要时刻准备好在有人经过时用 Alt + Tab 瞬间切换到 Excel。那种摸鱼,多少透着一股子辛酸。

但现在,形势逆转了。

当你把一段长达 5000 字的文档丢给 DeepSeek,或者让 ChatGPT 帮你重构那个全是 Bug 的模块时,那一刻,你不是在逃避工作,而是正在等待 AI 生产力的降临。

这种等待是神圣且具有合法性的。既然 AI 还没吐出结果,那我就没法进行下一步。

低情商这叫偷懒,高情商这叫技术性调休。

于是,你心安理得地拿起手机,点开微信刷刷朋友圈,或者去购物平台清空一下购物车。正如网友所说:「它仿佛是我的另一个思考人格,既然它在动脑子,那我这个肉身人格负责娱乐一下,逻辑上非常严密。」

这种既有干正事的虚假踏实感,又能顺势营造出被迫休息的理所应当,堪称 2026 年职场最高级的心法。

其实,这种守着屏幕等进度条的诡异爽感,并不是今天才有的。

把时间拨回千禧年,那是拨号上网的蛮荒时代。伴随着调制解调器那阵刺耳又迷幻的「哔——嘟——呲呲呲」声,你要打开一张只有几百 KB 的剧照,至少需要等几分钟。

那时候没有智能手机,没有短视频。面对缓慢向下加载的图片,你只能选择死死盯着屏幕,或者站起来去倒杯水,甚至趴在电脑桌上打个盹。

后来,宽带时代来了,网速快了,但视频清晰度也上去了。于是我们迎来了视频「缓冲圈」时代。看视频遇到卡顿,我们会熟练地切到别的网页,去天涯或者贴吧灌水,等缓冲条变灰了再切回来。

历史是个轮回,现在 AI 的「思考中」完美填补了这个生态位。

很显然,AI 产品经理们也意识到我们干活注意力不集中的问题,就拿之前曝光的 Claude Code 愚人节彩蛋来说。现在,只要你在 Claude Code 终端里输入一行 /buddy 命令,你的屏幕上就会触发一段孵化动画。

紧接着,一只由 ASCII 字符拼成的小宠物就会破壳而出,稳稳地趴在你的输入框旁边陪你写代码。它不会打扰你,但它会有呼吸的起伏,会冲着你摇尾巴。

包括五一假期期间,Codex 也更新了 Codex pets 功能,允许你直接召唤动画伴侣。只需在输入框敲下 /pet (或者按 Cmd+K 快捷键),一个悬浮的宠物视窗就会出现。

最绝的是什么?这个悬浮窗是跟 AI 状态实时绑定的。它会实时反映 Codex 的状态,贴心地附带一个简短的进度提示,让你不用切回主界面就能掌握一切。

你很难说这算不算是一种进步。从拨号时代盯着屏幕发呆,到缓冲年代跑去贴吧灌水,再到现在,居然有人专门给这段空白时间设计出了有呼吸、会摇尾巴的像素小生命来陪你撑过去。等待这件事,愣是有了不少温度。

一分钟的 AI 相对论

爱因斯坦曾在广义相对论中探讨过大质量物体对时空的弯曲,但他老人家一定没预见到赛博时代的「AI 相对论」。

理论上,一个顶尖的大模型生成一段深度回复,长则一两分钟,短则十几秒。但在这一分钟里,人类的摸鱼潜能会被无限激发,注意力会完成一次史诗级的大迁徙。

等到你终于从无限下拉的信息流、群聊里的惊天大瓜,以及「霸总回归手撕反派」的土味爽剧中猛然惊醒,抬起头时,往往已经大半个小时过去了。

最离谱的是,你会发现刚才的 AI 因为网络波动断线了,或者那个问题它彻底答非所问。这时,你不但没有丝毫愠怒,反而如释重负地松了一口气,带着一丝窃喜,接着毫不犹豫地又点了一次「重新生成(Regenerate)」。

恭喜你,新的半小时又开始了。

当然,也有极少数人间清醒在试图抵抗这种可怕的「时间黑洞」。

毕竟 Attention is all you need.(doge)

他们提出了所谓的「Vibe Coding」防沉迷指南:等 AI 回复时,千万不要切到完全不相干的高负荷任务(比如回复老板消息、刷社交媒体),而是去读读文档、理理思路。

只是这种听起来极其理性的建议,在现实的诱惑面前往往不堪一击。

人类的本质就是趋利避害的,在密密麻麻的英文文档和搞笑宠物视频之间,碳基大脑的防御系统连半秒钟都撑不住。

这届年轻人想得很开:AI 不工作的时候我工作,AI 工作的时候我还工作,那 AI 不就白发明了吗?既然我们把繁重的重复性脑力劳动外包给了硅基生命,那碳基生命自然就顺理成章地退化成了「复制、粘贴、点赞」的流水线机器。

但即便如此,大家依然在努力维持着打工人的最后一丝体面。

在无数个摸鱼的间隙,你总能看到身边的同事时不时地伸出一根手指,在电脑键盘的 Shift 或者空格键上轻轻敲一下——不为别的,只为了不让屏幕进入休眠状态。

哪怕你已经玩到天昏地暗,甚至已经开始在工位上修剪指甲,电脑屏幕也必须骄傲地、长明地亮着。这种对电脑屏幕的「关怀」,是我们对这个疯狂内卷的世界,做出的最后、最倔强的伪装。

甚至有开发者 @konekone2026 打造了一款名叫 Cat Gatekeeper的 Chrome 插件,只要你在电脑前连续浏览网页长达 60 分钟,屏幕上就会突然钻出一只巨大的猫咪。这只猫会毫不客气地挤占你的整个屏幕,让你必须休息 5 分钟。

鲁迅没说过,世上本没有假,等 AI 回复的人多了,也就成了假。

今天虽然是放假的一天,但也希望大家在日常的搬砖岁月里,不要弄丢了这份用 AI 忙里偷闲的快乐,毕竟能让摸鱼变得理直气壮,也算是 AI 时代给打工人最实在的一点馈赠了。

屏幕常亮,心态常好。

#欢迎关注爱范儿官方微信公众号:爱范儿(微信号:ifanr),更多精彩内容第一时间为您奉上。

OpenAI总裁的私密日记,被马斯克律师当庭念出:让我赚到10亿美元

OpenAI 成立前夜,核心大脑 Ilya 差点反悔留在谷歌。

马斯克的律师举着一本被强制公开的私密日记,当着所有人的面,一字一句地读出了 OpenAI 总裁 Greg Brockman 在夜深人静时的盘算
「这是我们摆脱 Elon Musk 的唯一机会……让我赚到 10 亿美元。」

暴怒的马斯克摔门离去,Greg Brockman 在座位上瑟瑟发抖,「真以为他要动手打人」。

这场 AI 世纪庭审现场的走向,比任何一部美剧都要荒诞。

54 岁的马斯克和 41 岁的奥特曼,在 X 上多年以来的互相指责,到了刺刀见红、对簿公堂的这天。

马斯克在第一周的庭审上作证三天,重复最多的一句话是:「你们不能偷一个慈善机构。」

2015 年他出钱出力出名气,帮奥特曼和 Greg Brockman 创办了 OpenAI,承诺 OpenAI 是一个非营利的 AI 研究机构,目标是对抗 Google 的 AI 垄断。

他总共捐了约 3800 万美元。结果 ChatGPT 出来了,公司估值 8500 亿美元,Brockman 个人持股价值 300 亿美元,而他什么都没拿到,还在 2018 年被踢出了董事会。

他说:「是我想出了这个主意,是我起的名字,是我招募了核心人才,把我知道的都教给了他们,提供了所有初始资金。」

马斯克对 OpenAI 及其主要合作伙伴微软提出了超过 1500亿美元 的索赔。他不仅要求赔偿,还要求法院罢免奥特曼的董事会职务,并撤销 OpenAI 转向营利性公司的决定。

OpenAI 则认为,马斯克的诉讼主要是为了打压竞争对手,因为马斯克目前拥有自己的 AI 公司 xAI。

他们提到,在 2017-2018 年间,马斯克本人也曾试图推动 OpenAI 转向营利性结构并寻求绝对控制权。

OpenAI 律师在交叉质询中出示了 2017 年的文件,显示马斯克自己的助理 Jared Birchall 注册了一家名为「Open Artificial Intelligence Technologies」的公司,一个营利性的 OpenAI 替代版本,是马斯克自己主导的。

他也想要那个营利性结构。只是他没能掌控它。

在马斯克作为证人开庭的前两天,他给 Greg Brockman 发了条短信,试探和解可能性。

Brockman 回复:要不双方各撤诉吧。马斯克主动求和没有得到想要的结果,决绝地回应:「本周末结束前,你和奥特曼将成为美国最被痛恨的人。如果你们坚持,就这样吧。」

你根本不懂 AI

在外界看来,马斯克是那个高瞻远瞩、为 OpenAI 注入灵魂和早期资金(约 3800 万美元)的教父;但在 OpenAI 的核心团队眼里,这位亿万富翁缺乏对底层技术的敬畏。

新一轮的庭审坐在证人席的是 OpenAI 的 Greg Brockman,他也毫不留情地揭开了马斯克打造的叙事。

当被问及为何当初不愿意让马斯克担任 OpenAI 营利性实体的 CEO 时,Greg Brockman 的回答极其直白:「他懂火箭,他懂电动车。但他以前不懂,我相信他现在也不懂 AI。」

他继续补充了更多细节,研究员 Alec Radford 曾向马斯克展示过一个极其早期的语言大模型,即 ChatGPT 的雏形。

马斯克输入提示词后,对生成的答案极不满意。他当着研究员的面抱怨「这东西太蠢了」,在第二次尝试依然未能如愿后,马斯克留下一句极其刺耳的嘲讽:「这系统蠢到连网上的小屁孩都能做得比它好。」

在算力成本从 2017 年的 3000 万美元狂飙至 2026 年 500 亿美元的今天,大模型的暴力美学已经被证明是成功的王道。但在当时,马斯克的急躁与轻视,让 Greg Brockman 等人坚定了不能将 AGI 交给他的决心。

可以要他的钱,但绝不能让这个人当 CEO,掌控人类未来的 AGI。

我以为他当时就要揍我

当时,为了筹集巨额的算力资金,双方都在试探成立「营利性结构」的可能性。

马斯克给出的方案极其霸道:要么给我绝对控制权,要么把 OpenAI 直接并入特斯拉,用特斯拉的超算来对抗谷歌。

Greg Brockman 表示当时他们感到了深切的恐惧。

时任 OpenAI 的首席科学家 Ilya Sutskever 在给马斯克的邮件中写下了一段话:「我们的目标是避免 AGI 被垄断。如果创造一个结构,让你想绝对控制就能控制,那一定是个坏主意。」

为了安抚马斯克,会议当天,Ilya 甚至亲自画了一幅特斯拉的画作为「善意的信物」送给他,团队还接受了马斯克赠送的几辆特斯拉汽车。但这种近乎讨好的举动,在马斯克对 OpenAI 权力的核心诉求面前不堪一击。

在这场会议上,当 Greg Brockman 委婉地表达团队拒绝交出单方面控制权时,马斯克一言不发地坐了几分钟,随后突然站起,暴怒地绕着桌子走。

Brockman 在证词中说,那一刻他「真以为马斯克要动手打人」。结果,马斯克一把抓起那幅特斯拉的画,摔门而出,并留下最后通牒:「我会停止提供资金,直到你们决定到底要干什么。」

画被拿走了,资金断了,昔日的盟友正式走向决裂。

硅谷的城府和一本日记

明面上的资金断了,暗地里的互相防备却开始了。

Brockman 在法庭上还提到,马斯克曾满脸「负罪感」地把他叫进办公室,坦白自己暗中挖走了 OpenAI 的核心大将 Andrej Karpathy,去给特斯拉搞自动驾驶。他还强硬地要求 OpenAI 团队裁掉那些「没有重大贡献」的员工。

而在 OpenAI 这边,高管们也明明知道董事会成员 Shivon Zilis 与马斯克有着极其特殊的私人关系,却隐忍不发,利用这层关系维持着脆弱的平衡,直到马斯克彻底亮出 xAI 这个竞品,才将 Shivon Zilis 清理出局。

但比这些权衡更有意思的是,一本 Brockman 写了十年的私密日记。

这本原本藏在电脑深处的日记,在法律程序的强制要求下被公之于众。

马斯克的律师在法庭上,当着所有人的面,一字一句地读出了这位 OpenAI 总裁在夜深人静时的内心盘算:「这是我们摆脱 Elon Musk 的唯一机会……让我赚到 10 亿美元」,以及「如果三个月后我们做共益企业(b-corp),那就是在撒谎。」

OpenAI 律师团队的辩护是:日记是私人思考的真实流露,里面充满自我怀疑和未经过滤的想法,被断章取义了。

OpenAI 上线前一秒,网站还在修改

「如果不是马斯克领导,根本没人会加入 OpenAI。而且他们收了他的钱之后又把他踢了出去。这其实挺不公平的。」

Greg Brockman 还分享了 OpenAI 在发布前差点失去 Ilya Sutskever 的完整故事。

Ilya Sutskever 当时在 Google,已经写好了告别邮件,准备跳槽过来。结果当天晚上,他发了一封标题叫「sad news」的邮件给 Brockman:「我太遗憾了。我实在无法离开 Google。」

与此同时,DeepMind 的员工在一场行业会议上挨个找 OpenAI 的潜在招募对象,告诉他们:「没有人会加入 OpenAI 那个实验室。它是一艘沉船。」

Brockman 为 OpenAI 的官网准备了两个版本,一个有 Sutskever,一个没有。他在最后截止时间发出一条消息,只问了一个字:来还是不来。然后他看着消息框里出现了输入提示符,一直跳,一直跳。然后是一个字:「Alright。」

Brockman 给 Altman 发短信:「他来了。」

马斯克说没有他 OpenAI 就不会存在,这话也许不假。但如果 Sutskever 那天晚上没有改变主意,OpenAI 也不会存在。

面对谷歌的财大气粗,奥特曼原本只敢对外宣布 1 亿美元的融资。

但马斯克极力反对,他明白在硅谷,声量就是生命线。他强硬地表示:必须宣布 10 亿美元,否则显得毫无希望。别人不出的钱,我全包了。

尽管后来马斯克实际上只掏了约 3800 万美元,但这句 10 亿美元的虚张声势,也算是帮初生的 OpenAI 稳住了阵脚。

控辩双方争了很多细节,但 Brockman 证词最后归结到一个问题:非营利结构的承诺,究竟是 OpenAI 对外界的法律义务,还是创始人对自己的道德期许?

马斯克律师 Gerrada 在庭上出示了 OpenAI 2015 年向特拉华州提交的注册文件,里面明确写道,

「本公司的具体目的是为人工智能相关技术的研究、开发和分发提供资金……所产生的技术将造福公众,并在适用时寻求开源……本公司不以任何个人的私利为目的。」

然后他问 Brockman:2017 年到 2018 年之间关于营利性结构的讨论,是不是和这份文件的精神相违背?如今你通过营利性实体,坐拥潜在 300 亿美元财富。

Brockman 的回答是:使命本身没有变,只是结构变了。非营利性的使命可以在营利性的结构下继续实现。

Brockman 的证词预计在 5 月底结束,与马斯克育有四个孩子的 Shivon Zilis、OpenAI 前联合创始人,以及奥特曼随后都将出庭作证。

案件的结果会直接影响当前的 AI 军备竞赛。如果马斯克胜诉,正在筹备史上最大规模 IPO 之一、估值高达 7300 亿美元的 OpenAI 可能会遭到毁灭性打击。

如果 OpenAI 胜诉,奥特曼将彻底巩固对这家拥有 4000 多名员工的巨头的控制权。

参考信息
https://www.theverge.com/tech/917225/sam-altman-elon-musk-openai-lawsuit

#欢迎关注爱范儿官方微信公众号:爱范儿(微信号:ifanr),更多精彩内容第一时间为您奉上。

千问电脑版上线语音输入法:打工人终于可以用嘴干活了

Vibe Coding 火了之后,越来越多的人选择对着屏幕口述,而不是敲键盘,不少网友甚至为此整出 AI 语音键盘。

今年 3 月,Anthropic 也给 Claude Code 加了语音模式,在终端输入 /voice,按住空格说话,松手执行。很难想象,连「写代码」这种最依赖键盘输入的场景,都开始支持语音了。

既然写代码的人都开始用嘴干活了,那我一个每天写文章、写方案、做 PPT、整表格的打工人,还在一个字一个字敲键盘,显然也不够高效,尤其是查数据要切三个页面,做个汇报 PPT 要从找模板开始花三小时,整理会议纪要边听边记还漏一半。

究其原因,不是每个人的口头表达都那么好。哪怕也有一些 AI 输入法能解决,比如我们之前介绍过的 Typeless,每年光订阅费每年就得花 1000 块。

在真正干活的电脑端,至今没有和深度 AI 办公能力打通的语音入口。刚好,千问电脑版/网页版最近也上线了千问语音输入法,据说奔着「用嘴干活」而来。而且千问电脑版还是全免费——不只是语音免费,它内置的所有 AI 办公能力,全部敞开用。

别被输入法这个名字骗了

一开始,看到千问语音输入法这个名字,我下意识以为这就是一个识别准确率更好的 AI 输入法,结果我发现完全不是一回事。

千问语音输入法上手几乎没有门槛。两个快捷键搞定一切,按住是语音输入,双击是让 AI 干活。Win 是右 Alt,Mac 是右 Command,你可以根据使用习惯来设置唤起的快捷键。

你在 Word 里写文档也好,浏览器里看资料也好,钉钉里回消息也好,快捷键一按,语音入口浮出来。不用切到千问客户端,不用打开额外窗口。想问就问,想说就说。

千问语音输入法主要就两种使用姿势:按住开始语音输入,想到什么直接说就行,千问帮你自动去口水话、纠正口误、生成结构化表达。双击唤起语音指令,这时候你是在给 AI 派任务,比如查个东西、帮你回消息、生成文档。

打从一开始,它就不只是打算只做一个「帮你打字更快」的输入法。你的嘴负责下达指令,它是一个中枢接口,负责听懂、翻译、调度,让 AI 把活儿干完交给你。

说话就是比打字好使

2026 年,我对一款语音输入法的要求,已经远远不止是识别准确率。「听得清」的逐字听写都是基操,更重要的是理解我想表达什么,再帮我组织好。

比如口述一段想法,它能保留我的意图,帮同事把废话全部过滤掉,口误也顺手修正,吐出来出来的是干净、精炼、可以直接发出去的文字。

比如碰到方案延期这种事,也可以交给千问整理成一段清晰的书面表达,而我只需要直接按住快捷键,随口反馈给千问:

关于这个项目的延期,我… 啊不对,我想说的是关于这个方案的调整,其实原定计划是本周五交付,但是… 呃… 因为客户那边临时加了三个需求点,我们评估了一下大概需要多两天,所以… 不对,我的最终意思是:方案交付时间从本周五调整至下周三,原因是客户新增三个功能点,需要补充技术评估,我们承诺下周三前一定提交初版方案。

松手后结果就出来了,可以看到它自动删除所有「啊不对」「呃」「但是」等语气词,把我表达的核心清晰整理了出来;对比常规的语音输入,只能逐字记录,还要自己手动编辑,千问语音输入法基本无需手动调整,就能直接发出去。

在一些更专业和复杂的项目沟通中,千问语音输入法就更加实用了。

比如下面这个沟通需求,注意看,我长按说了一大堆话后,最后还补了一句:将关于数据部分提前。

这次产品改版的核心目标是提升新用户的留存率。我们在 onboarding 流程里增加了三个引导步骤,把原来的五步走改成了三步走,还在每个节点加了进度提示。另外,我们发现很多用户在第二步就流失了,所以把第二步的表单从 8 个字段缩减到 3 个必填字段。数据方面,改版后一周的留存率从 35% 提升到了 48%,次日留存提升了 12 个百分点。不过也有一个风险,就是表单精简后收集的用户信息变少了,可能会影响后续精准推荐的效果,这个需要持续观察。最后是团队层面的配合,设计部在两周内出了两版方案,开发部用了三天完成上线,整体节奏还是很快的。嗯把数据那段放到最前面,然后分段给我

这里结果对比就更明显了,只有千问听懂了「把数据那段放前面「」的指令,自动重排段落,我用嘴就完成了原本需要鼠标+键盘的操作。

▲ 常规语音输入结果

▲ 千问语音输入法结果

体验过程我还发现了一个让我惊喜的细节,千问语音输入法对于中英文夹杂的口述内容,识别特别到位。

这个函数的主要作用是处理用户登录时的 token 验证,首先会调用 validateToken 方法检查 token 是否过期,如果 expired 的话就返回 401,然后如果是 valid 的话,再调用 getUserInfo 接口去拉取用户信息,最后把 userId 和 role 写进 session 里面。注意一下,这里有一个 edge case,就是当 token 是 refresh token 的时候,要走另外一条逻辑分支。

千问不只把所有的英文术语都识别对了,而且还自动根据我的话分点输出,一目了然。

▲ 千问语音输入法结果

我还想分享一个对于内容创作者特别有帮助的用法,APPSO 每天早上都要开选题会,大家会有很多碎片想法,一个热点现象、一个行业观察、一个趋势判断……

之前有些想法是散装的,不成体系,现在我可以直接在会上按住唤出千问语音输入法,让它将这些想法整理成大纲。比如这一大段我在会上对编辑选题的反馈意见,如下图所示:

▲ 千问语音输入法结果

松开手后,一段详细的选题大纲就出来了,编辑能稳稳接住我的反馈,稍微扩充就能写出一篇深度分析稿件。最后的成文也附上给大家看看:苹果悄悄砍掉丐版 Mac mini,人人都要交「AI 税」的时代来了 。

单就语音输入这个维度,千问给我最大感受是,真就说多快多乱都没关系,反正输出的质量 AI 会兜底。

万物皆可 Vibe,一句话的事

语音输入只是第一步,千问语音输入法更大的价值是还能帮你干活。

上面提到了整理选题大纲,然后我就需要沉浸式写作,但每次要查个数据和报告,都得切到其他网页和应用。这里千问语音输入法就很自然地出现了——它支持在任意软件、桌面全局唤起,不用切换窗口,动动嘴就能直接查。

比如我在写一篇关于 OpenAI 的文章时,刚好有一段要引用最近的融资金额和投资方。我双击唤起语音指令,说一句:「帮我找一下 OpenAI 最新融资背景。」

思考一两秒,千问小窗就直接弹出把详细结果发我了,我看着引用继续写,心流就不会被打断。

假期刚回来,一大堆工作等着推进,我需要整理一个清晰的周报,但又没时间慢慢敲字,于是双击并随口将把需求说了出来,里面夹杂着带着大量口头表达:

诶那个,我汇报下这周进度哈……A 项目目前跟进到第三阶段了,中间遇到了供应商交付延迟,大概迟了三天,后来通过加班把进度赶回来了……B 项目还在需求评审,产品那边原型图有点模糊,约了下周一早上十点对齐……下周还要申请两台测试服务器……你帮我整理为周报 word 文档,语气专业一点,条理清楚。

此外,千问语音输入法还有一个更有意思的功能——帮你回消息。

我每天往往需要在微信、钉钉、飞书等各种项目群里穿梭,回复各种消息。非常消耗精力,这时候我就能让千问让我的「嘴替」了。

比如假期还没过完就被同事催交文章,我就双击让它帮我来一段高情商回复。

▲ 我无需给它介绍背景,它就能根据屏幕内容补充上下文,给我一个「聪明」的回复

而在一些面对客户或者更正式的场合里,我也可以双击让它给我拟一个得体的回复。

这是因为千问语音输入法支持了「场景感知」。它自动识别你当前在什么应用里,看到你屏幕上的内容,据此调整输出的风格。你不用告诉它更多背景,它自己就能看懂。

下周要出差,我直接双击,在微信让它帮我根据聊天信息,整理成一个出行指南便签。

最后给我的这份出行指南,除了航班信息,还贴心地给我整理了待办事项,并根据当地天气和交通情况给了我一些具体建议,这对于常常出差的媒体人来说十分友好。

开周会的时候我还发现了一个实用的小技巧,会议开始,我双击两下唤起千问语音输入法,结束后一句:「帮我把刚才的内容整理成会议纪要。」它就自动帮我整理好了。

这很适合一些快速拉通的临时会议,不用再单独打开会议记录类的应用,随手双击马上记。

对着电脑说话,活儿 AI 自己就干完了

别误会,对着电脑喊「帮我查资料」「写个邮件」,现在只能算 AI 的基本操作。

千问 电脑端这次真正亮出的底牌,是把语音输入和 PPT 创作、AI 表格、文档处理等功能组合起来,这也是真正能帮打工人实现「每天早下班一小时」的实用功能。

拿最折磨人的 PPT 来说,千问不是去素材库里给你拼凑烂大街的野生模板,而是直接用大模型的代码能力动态生成复杂排版。如果你觉得哪里不够完美?直接多轮对话让它接着改,改到你满意为止。

为了探探底,我先让它帮我做个视频号运营课程 PPT,几乎在语音落地的瞬间,AI 就进入了光速消化模式:填充血肉、匹配逻辑一气呵成。

最令人惊喜的是,千问对「图文穿插」的理解并非生搬硬套,而是根据内容深度匹配了差异化的版式,整份 PPT 拿出来,几乎就是可以直接交付的成稿。

这还没完,你还能一次性给千问喂最多 39 种不同格式的参考文件,让它自动梳理逻辑、提炼重点,帮你省去了来回翻资料的麻烦。至于配图,它也能根据上下文自动匹配,找不着合适的甚至能当场给你生图,全程都不需要你切出界面去求助搜索引擎、或者下载下来用 office 处理。

表格处理方面,千问的 Excel Agent 主打一个高水准。

不管是格式随意的聊天截图、手写笔记,还是大段的纯文本,丢给它就能快速生成标准的 Excel 表格。如果后续还要算算增长率、画个趋势图,也不用再去头疼怎么写函数公式了,直接用自然语言吩咐它就能搞定。

我试了一个稍微有点复杂的需求:让它根据 2026 广州最新版初中英语教材,把各句型的语法结构、时态变化和参考例句整理成 Excel 表格,格式要适合一页纸打印,方便拿来背诵。

换以前,这种事得自己一条条查资料、手动录入、再调格式,至少要折腾半小时。现在说一句话,它直接把表格生成好,列名、行距、例句填充,基本不需要再动手改。

文档处理这边,Word/PDF Agent 支持图文数据混合上传,能自动排版并输出直接可交付的文件。

更有意思的是,传完长文档你不需要自己去翻阅找重点,直接张嘴问,它就能快速定位给出答案;想修改哪里也是一句话的事儿,省去了自己去对照原文件一点点改的麻烦。

我试着传了一份繁杂的合同 PDF,直接问它:「独家授权内容是哪些?」它并没有傻傻地把全文复述一遍,而是精准定位到了授权条款,把独家范围、授权期限和限制事项一条条列得清清楚楚。

目前,这个语音指令甚至还能和 AI 写代码、手搓网页等任务助理功能组合使用,照这个架势下去,未来的办公形态,大概真的就是「动动嘴皮子就把活儿干了」。

和 AI 说话的人,会比键盘打字的人更早下班

用了一段时间千问语音输入法,我想到一件事。

过去几年「AI 提升办公效率」喊得震天响,但大部分人的体验是:我跟 AI 说了半天,它给我的东西根本不能用。然后就觉得 AI 也不过如此。

问题出在哪?出在沟通方式上。你用键盘跟 AI 对话,40% 的精力花在组织文字上,只剩 60% 在想你到底要什么。给出去的指令信息密度低、上下文薄,AI 当然输出垃圾。这不是 AI 不行,是你喂给它的东西不行。

语音把这个死结解开了。说话时你不会给自己设字数限制,细节会自然地冒出来,上下文会自动变厚。它能把嘴里说出的自然语言需求梳理得井井有条,让 AI 精确执行。

纽约销售平台 Clay 的教育负责人 Yash Tekriwal 提到,他用语音输入的速度是每分钟 205 个词,打字只有 110 到 120 个。但速度还不是最关键的,他发现口述的 prompt 质量更高。

AI 圈最近有个词特别火,叫 harness。它的意思大概是:你有一匹马(AI 的能力),但你得有一套缰绳才能驾驭它,让它往你要的方向跑。没有 harness,马再强壮也只是在原地打转。

千问电脑版的语音输入法就是这套 harness。

它连接的一端是你的嘴,另一端是 AI 的全套办公能力:PPT、表格、文档、搜索、分析、格式转换。你说一句话,它把你的意图翻译成 AI 能执行的指令,然后调度对应的 Agent 去跑腿。它不是输入法,是缰绳。是你驾驭 AI 办公能力的那套 harness。

而别的「带 AI 功能的输入法」解决的是什么?是入口问题,帮你找到 AI 在哪里。千问解决的是驾驭问题,帮你把 AI 的能力精确地用起来。一个是给你指路,一个是帮你套好缰绳直接上路。差距就在这。

在 Agent 时代,语音本来是驱动 AI 工作的最自然和高效的方式。千问语音输入法,就是率先在桌面入口端出了这套 harness 的产品 ,这也是为什么我期待,未来在更多终端上,能看到这种真正能驾驭 AI 的语音入口。

去年这个时候,如果你在办公室突然对着电脑说话,一次两次会被当成在打电话,三番五次就不禁让人怀疑,工作压力是不是太大了,精神状态还好吗?

今年开始,那些对着电脑自言自语的,可能就是全公司最早下班 (摸鱼) 的人。

附客户端下载地址:
https://www.qianwen.com/download?ch=tongyi_redirect
网页版体验地址:
https://www.qianwen.com/

#欢迎关注爱范儿官方微信公众号:爱范儿(微信号:ifanr),更多精彩内容第一时间为您奉上。

独家|苹果第一个 AI 硬件,还没发布就已经难产了

苹果的第一款 AI 穿戴产品,将是 AirPods。

根据彭博社爆料,苹果内置摄像头的新款 AirPods 开发已经进入了开发最后阶段,设计进入最终版本,苹果很可能将其视作首款「为 AI 时代设计」的穿戴设备。

但事情没那么简单:有供应链人士向爱范儿透露,这个产品的开发计划目前已经暂停,产品距离上市仍有变数。

耳机为什么要长眼睛?

这款新耳机将基于 AirPods Pro 3 打造,耳机柄会因为容纳摄像头而更长,或将定名为「AirPods Ultra」,最快有望于今年年底发布。

这个摄像头将会配备在左右两边的耳塞,分辨率很低,不能用来拍照或者录像,本质上就是 Siri 的「眼睛」

配备低分辨率摄像头的好处很多。

首先,不少多模态模型理解图片,不是逐像素理解,本身也会将高清图进行压缩,理解画面的大体信息而不是细节,因此并没有必要配备足够高清的摄像头。

低分辨率摄像头功耗低,信息传输速度快,非常适合耳机这种相当小型化的产品,也避免了高清摄像头带来的隐私争议。

给 Siri 加一个摄像头的理念,其实类似 AI 眼镜,目的就是为了给 AI 助手提供更丰富的用户情景上下文,增强生成的结果。

Ray-Ban Meta

除了类似目前 iPhone 上的「Visual Intelligence」的识图功能,预计在 AirPods 加持下,AI Siri 能实现更沉浸式的 AI 助手体验。

比如打开冰箱门,面对玲琅满目的食材,可以直接对 AirPods Ultra 说一句「Siri 我今晚可以做什么菜?」,Siri 就能给你推送一个菜谱——大概率会用 iPhone 来呈现。

苹果一直在研究这个 AI 摄像头的其他用途,或许还会有更「主动」的能力,Siri 会进行持续的静默观察,然后根据用户的画面,主动提醒用户,例如做饭的时候主动提醒用户什么时候该关小火以及出锅,又或者在导航时帮用户看路,根据实际的街景,提供更细致的导航。

图片由 AI 生成

和早期预测不一样的是,AirPods Ultra 的摄像头将不支持手势控制识别,未来苹果推出的智能眼镜也没有这种计划。

作为一家对用户隐私保护极其重视的公司,苹果也希望能减少用户对 AirPods 摄像头的担忧,苹果目前的做法是在耳机塞入一个 LED 指示灯,当视觉信息传输云端时亮起,提醒外界 AirPods 可能正在拍摄。

虽然这个做法在智能眼镜领域相当普遍,实际上,这更多是「免责声明」——我已经做了提醒措施了,出现偷拍不是我的错。

Ray-Ban Meta 眼镜的 LED 指示灯,图源:CNBC

爱范儿此前也进行过实测,路人几乎完全无法感知到小米 AI 眼镜正在拍摄他们,即使 LED 指示灯已经点亮。

这样的做法,或许也已经不能帮助苹果完全规避法律风险。有消息人士独家向爱范儿透露,AirPods Ultra 在供应链端出现异动,部分产线已经「原地解散」,项目可能已被暂时搁置。

知情人士将原因指向同一个方向:欧盟隐私法规的合规风险。

需要指出的是,供应链动态的解读存在多种可能:产线调整、供应商切换、设计方案迭代,都可能造成类似信号。

但考虑到苹果对核心组件供应商的强管控传统,以及这款产品在苹果 AI 战略中的核心地位,因合规问题导致项目节奏调整是目前最有可能的推测。

来自欧盟的阻力

「采集」这个动作,在欧盟的法律框架中相当敏感。

就目前而言,带摄像头的 AirPods,已经触及了三条欧盟的法律:

  • GDPR (通用数据保护条例),涉及数据处理管理
  • ePrivacy Directive(隐私与电子通信指令) ,涉及终端设备访问管理
  • EU AI Act(人工智能法案),涉及 AI 应用的伦理边界管理

三部法律从不同角度切入,都指向同一个结论:一个在公共空间持续感知环境的设备,在现行法律下几乎无法完美合规。

特别是 AirPods Ultra,如果收集到的个人深度图和运动轨迹数据,能够通过算法分析能识别出特定个人,那么会直接触及 GDPR 第九条「禁止处理特殊类别个人数据」的禁令。

要想避开,苹果必须获得用户的「明确同意」,并且必须是具体、知情且自由作出的,不能藏在几十页服务条款里,通过一个默认勾选框草草带过。

更敏感的问题,在于对他人数据的采集。

2025 年 12 月,欧盟法院(CJEU)在 C-422/24 号案件中做出了一个影响深远的判决:通过可穿戴摄像头收集的数据,即使是路人的数据,也视为「直接从数据主体收集」,必须适用即时告知义务。法院明确说了,如果允许延迟告知,就等于给「隐蔽监控」开了口子。

也就是说,当你戴着 AirPods Ultra 走进一个餐厅,你必须要告知在场所有可能会被传感器感知到的人,他们的数据可能会被采集,以及采集的目的和处理的方式——这听起来天方夜谭,但确实是法律的要求。

像是上文提到,在 Ray-Ban Meta 等智能眼镜上的「LED」指示灯,已经无法起到「免责」的作用。爱尔兰数据保护委员会专门点名批评这个指示灯太小,无法起到告知和通知的作用。

今年 3 月,欧洲议会的议员们正在向欧盟委员会施压,要求 Meta 公司对于其 Ray-Ban 拍摄眼镜的私密拍摄能力作出澄清,多个欧洲国家的官方和民间机构都对 Ray-Ban Meta 进行了公开警告。

这些案例和抗议,都会成为苹果在欧洲地区推行 AirPods Ultra 的极强阻力,产品很可能会遭到禁售,苹果公司会面临被罚款风险。

苹果和欧盟此前曾因 App Store 规则等原因有过多次摩擦,因此他们将慎重考虑 AirPods Ultra 的发布风险。

对苹果的 AI 战略来说,这款产品的推迟将是一次沉重打击,因为 AirPods Ultra 只是一个排头兵,苹果的计划之中还包括 AI 眼镜、AI 吊坠,这些都为 AI 的信息采集服务的产品,都将面临这些阻力。

耳机长眼睛,理想的 AI 硬件形态

根据彭博社爆料,和外界猜想的不一样,给 AirPods 加装摄像头的决定,不是因为这几年 AI 硬件大潮一拍脑门的决定,而是苹果早在 4 年前就已经萌芽的战略。

也是差不多那个时候,初代 Ray-Ban Meta 问世,这款产品在当时并没能取得亮眼的商业成绩,2023 年的二代产品成功「卖爆」,一个季度出货 30 万台。

虽然大家是冲着它的第一人称拍摄视角购买的,但 Meta 还是成功让大家开始习惯在自己的眼前架设一个摄像头,为未来开展 AI 计划铺平了道路。

在所有的感知维度中, 视觉是信息最丰富、最重要的一种。一个 AI 硬件如果真的想最大程度理解用户的处境,仅靠麦克风一种信息是不够的。

市场上已经不缺少能单纯依靠麦克风识别的 AI 耳机产品,AI 公司在做,传统的硬件公司也在做,功能已经相当局限,讲来讲去都是围绕 AI 翻译等单一场景。

比起智能眼镜或者吊坠,这些相对青涩和新颖,大众接受度还不够高的产品形态,而现在大家已经很喜欢戴耳机了,并且也习惯一直戴着。

耳机还接近「看」和「听」两个感官的位置,是现成的理想 AI 载体。

此前,爱范儿已经体验过带摄像头的耳机——来自一家国内的初创企业光帆科技的 Lightwear AI 全感智能套装。

它的实际体验确实相当合理,把一件物品放在面前,就可以用语音指令让 Lightwear 识别它是什么商品,然后加入电商平台购物车。

但它体型太大,不够优雅,形态已经不像是一个普通耳机。并且很难说服消费者专门为 AI 买一个这样的产品。

因此,苹果的优势,就在于「AirPods」这个金字招牌。

本质上来说,这个摄像头只是一个「添头」,基本上所有会购买 AirPods Ultra 的用户,都只是冲着音质和降噪去的,然后不知不觉间也打开了苹果 AI 生态的大门。

AirPods Pro 3

这也是苹果作为一家已经相当成功的智能硬件厂商,在 AI 硬件时代的先发优势:只要他们愿意,苹果正在受欢迎的产品,都能转化成一个 AI 硬件,并且直接面向千万级别的用户市场。

也由于苹果的规模足够庞大,在面对隐私和法规这些敏感问题上,不得不进一步慎重,因为每一个举措都会对整个行业和海量用户造成影响。

AirPods Ultra 撞上欧盟的法规墙导致难产,确实让人遗憾,但这也意味着,全球最有话语权的科技公司,将开始探索产品和规则共存的可能性。

每一次新技术诞生,都会与旧有秩序发生碰撞,千百年来皆是如此,这个过程这个过程看似是限制,实际上也是一次重新建立规则、重塑产品范式的机会。

不管是人机交互,还是规则法规,最终都将朝着更合理、更成熟的方向演化,对于所有人来说,这是好事。

#欢迎关注爱范儿官方微信公众号:爱范儿(微信号:ifanr),更多精彩内容第一时间为您奉上。

播放破亿的 AI 短片,名场面是一个「穿帮镜头」| 对话《纸手机》主创

看这部短片时,你可能不会怀疑自己看到的是 AI 短片,直到看到这个画面:

转圈的老式电话,拨号时手指怎么在这里呢?而且,片子的设定里,烧的纸器都已经是 iPhone 了怎么还会有这么老式的电话机?

这是 AI 短片《纸手机》里最被讨论的一个画面——不是因为它有多好,而是因为它全然地暴露了,这部短片是生成的,尽管前面几分钟逼真得让人感受不出来。

但评论区没有人在骂,弹幕飘过的是「看到这里才发现是 AI 做的」,紧接着是「完全不在意」,「AI 又怎么样,又不影响我哭」。

从 AI 可以完整生成视频诞生以来,没有一个 AI 影像作品可以逃开这个问题:有多逼真?模型迭代的速度被当作技术进步的刻度,每一次发布都伴随着「这次终于分不出来了」的惊叹或「还是一眼假」的嘲讽。尤其是真人题材,仿佛只要足够逼真,观众就会买单。

《纸手机》提供了一个反例。观众在明确知道这是 AI 生成的之后,仍然被打动,而且他们主动承认感动。那个电话 bug 不是被「原谅」了——它根本不在观众的评价维度里。他们在意的是另一件事:一个不懂死亡的小男孩,攒了 15 块钱,想给去世的奶奶烧一部手机。

这部全网播放量超 4000 万、被央视和人民日报转发的 AI 短片,由两个潮汕年轻人用三天做出来。导演李婷,98 年生,做了五年产品经理后转型;搭档杨选,90 后,广告导演出身,美术史背景。在可灵 AI 3.0 Omni 的帮助下,除了那部用纸壳板做的手机道具,画面中的一切——光线、人物、场景、表情——全部由模型生成。

当一部没有一秒钟是物理真实的短片,触发了真实的情感反应,「真」这个字意味着什么?

三天、两个人、一个模型

故事开始于一个有关于时节的记忆。

正逢清明,李婷和杨选都是潮汕人,烧纸钱、祭祖、给去世的亲人「寄东西」,是他们从小刻在身体里的习惯。杨选记得小时候跟家人上山,看到纸扎的煤气罐、房子、车子在火里卷曲变黑,「用纸做这些东西,恰恰体现了中国人情感的内敛和滞后,」他说。

「纸手机」这个概念就从这些记忆里生发出来,但让它成为一个故事的,是一系列叙事设计上的选择。

在故事的前段,面对只有 15 块钱的孩子,老板一开始画了个假手机打发他。直到得知,这个孩子已经是个孤儿,身边最后的亲人也去世了,他起身追出去。

找到孩子后,老板没有直接说「我来帮你」,而是说那部纸手机「信号不好」,给了他一部新的。

李婷说,这些笨拙的借口来自于她代入角色后的思考:「这个人在这个情境下,会怎么反应?」她想起自己小时候问长辈「什么是死亡」,对方愣了一下才回答。那个「愣了一下」的瞬间,被她放进了短片里——某个路人听到小男孩问话后的短暂停顿。

还有老板追出去前,把店铺的卷帘门放下一半,这代表着「暂时外出,很快回来」。

虽然是一部 AI 短片,但编剧环节是纯人工的,杨选在采访中反复强调:新手一定要自己写剧本,「来源于真实体验才能打动人」。

剧本确定后,进入 AI 生成阶段。他们使用的可灵 3.0 Omni,主要依赖三个功能:多图参考(设定角色形象的一致性)、音画同出(同步生成画面与声音)、以及主体资产中的音色锁定(保证角色声音在全片中统一)。

工作流从人物设计开始,先设计形象,放入模型让它自由发挥对白,从中挑选最合适的音色,再锁定。

李婷说,这个过程中最容易被忽略的一步是「写提示词之前的思考」。「很多人觉得提示词要写得很长很复杂,但更重要的是精准度——你到底想要什么。」

精准度这个词在他们的工作流中反复出现。杨选为了理解不同视觉风格的底层逻辑,曾做过一个实验:用同一个模型生成 10 种完全不同的电影质感——日系、贾樟柯式、现代感。「不是在提示词里写 “杨德昌风格”,」他说,「主要是分析那种风格为什么成立,日系的白柔效果从哪来?雪地这种材质怎么影响整个画面氛围?」

《纸手机》的胶片质感就是这种方法论的产物。有趣的是,他们在提示词中从未写过「颗粒感」或「胶片」这样的词。杨选说,那种质感是潜移默化、自然而然的。

「故事设定在那个年代,场景是午后暖光的纸器店、老式玻璃柜,这些东西放上去,质感自然就出来了。」他直言自己喜欢杨德昌、李安、侯孝贤那一代人的镜头语言和叙事方式,但并非刻意模仿,而是「你想这个故事的时候,自然会用那个时代的方式去想」。

最后的车内长镜头是全片最被称道的段落。一分多钟,小男孩坐在车上,窗外风景掠过,没有台词,只有背景音乐。李婷说,提示词主要描述的是窗外景色、小男孩的情绪递进、车内的颠簸感——以此模拟真实的坐车状态。

这个镜头一开始只有 30 秒。杨选看完后觉得可以再长,于是逐步延长。「亲人去世的时候,悲伤可能不是马上来的,」他说,「你可能周围的声音都没发现。耳鸣了一段时间,突然莫名的情绪一涌而上,像潮水一样。」

这个设计,不是数据分析出来的,也不是 A/B 测试的结果,是他们作为创作者个人记忆和情感驱动做出的选择

两个人,三天,极限压缩可能不到三天。作为可灵平台的超级创作者,他们有算力支持,制作成本不高。但李婷特别强调了一句话:「AI 降低了制作成本之后,人的价值反而更凸显了。成本里面更应该包括导演和编剧的创意策划——这些无形的东西呈现出来的价值,才是重点。」

 信了角色,就信了故事

采访中我问了一个带有假设性质的问题:如果这个故事用真人实拍,传递出来的情感会不同吗?

杨选很坦率:「实拍要做出来的话,非常吃力。小朋友演员能不能给到你要的东西?导演能不能调度到位?摄影呢?涉及太多层面了。」

李婷的回答更务实:「实拍更考验演员对故事的理解和演技,AI 制作更考验导演。所有调度和设计都由导演把控。」她说,对她这种从来没有实拍经验的创作者,AI 工具给了一种此前不存在的自由度。

这些回答听起来像是在替 AI 做辩护,但如果你把它们和另一组回答放在一起看,会发现一个更有趣的图景。

当我问到「网友说“最没人味的 AI 做出了最有人味的短片”,你们怎么看这个评价」的时候,杨选说了这么一段话:

「就像画画一样,颜料是死的,演员演的也是假的。但为什么能打动人?因为创作者是真诚的。我们信了自己的角色,信了自己的故事。做提示词的时候,潜移默化地,很多真实感的东西就给出来了。」

传统影视中,「真实感」的来源路径大致是:编剧写出可信的人物,演员用身体和情感去「活」这个人物,摄影和剪辑捕捉并放大那些不可复制的瞬间。

这条路径的核心假设是,需要经过一具真实的身体来中转。表演在叙事层面是「假的」(扮演角色),但表演的行为本身是真的:肌肉记忆、情绪调动、微表情、呼吸节奏,这些来自一个活着的身体。

AI 影像取消了这个中转站,没有演员,没有「体验过」角色的身体,但《纸手机》依然让人觉得「真」。

一种可能的解释是:那些被认为来自演员身体的「真实感」,有很大一部分其实来自导演和编剧的观察力。李婷代入角色思考「他会有什么反应」时,她调用的是自己的童年记忆、对人的观察、对情绪节奏的直觉。

这些东西经由提示词传递给模型,模型生成了画面,画面触发了观众的共鸣。路径变了,但起点和终点没变:都是人的经验抵达人的情感

这也解释了为什么两个人的搭配如此有效。杨选说,李婷负责「想象中的画面」,他负责「讲故事」。当不同的人带着不同的生活经历碰撞时,会产生他所说的「反情节」——那些不在剧本计划中、但因为足够真实而被保留下来的细节,这些是 AI 无法自主生成的。

在采访中,杨选提到了杨德昌、侯孝贤、李安等台湾新浪潮一代。这些导演的镜头定义了「真」应该着重于情感层面的诚实。侯孝贤拍《风柜来的人》时大量使用非职业演员,追求的就是这种「不在计划中」的真实。他要的不是精确的表演,而是人在真实情境中的自然反应。

AI 创作者正在用不同的介质继承这个逻辑,中转站从演员的身体变成了模型的参数,但导演注入的东西没有变:对人的观察,对情绪的直觉,以及杨选所反复强调的,「真诚」。

完美是创作的敌人

采访快结束时,我问了一个假设性的问题:如果未来 AI 可以一键生成完美的作品——没有 bug,没有穿帮,每一帧都无可挑剔——你们会更满意,还是会觉得少了什么?

李婷的回答很干脆:「太完美不一定好。」

她举了老板这个角色的例子。一开始他敷衍小男孩,追出去后的借口也笨拙得可笑。但观众恰恰因为这种不完美而觉得他立体、真实。

至于那个电话机的 bug,李婷认为瑕不掩瑜。她选中那一版的原因不是技术指标,而是「人物的微动作、微表情,以及镜头的衔接流畅度——这就是我想要的演员真实演绎的感觉」。

「工具越简单,表达的难度未必降低。」杨选的回答更往前走了一步,「你要更明确自己想要什么、喜欢什么,才能借助更简单的方式表达更好的东西。」

这也正是被反复讨论的问题:当 AI 工具持续迭代、技术摩擦不断减少,创作者的核心竞争力到底是什么?

杨选在采访中给出的三个关键人工环节:编剧、导演、美术。「会用工具」是必须的,但工具将越来越趁手,所以构不成护城河。

更多的是一种能力:知道什么时候停下来。

什么时候情绪到位了,不要再改;什么时候 bug 反而成就了作品,不要去修;什么时候留白比填满更有力量,不要多手。

这种判断力不来自模型,来自人的经验和直觉。工具越强大,它越稀缺。

就像那个缺失的话筒,在技术层面是一个错误。但在传播层面,它意外地完成了一件事:它让观众确认「这是 AI 做的」之后,反而更专注于故事本身。

这个 bug 变成了一种通行证,观众不再需要纠结「这是不是真的」,因为答案已经很明确。他们转而去判断一个更重要的问题:这个故事,是不是好的。

答案是四千万次播放,和影片内外共情的眼泪。

最没有人味的工具,做出了最有人味的短片。或许更准确的说法是:工具从来就没有人味。有人味的,始终是使用工具的人。

#欢迎关注爱范儿官方微信公众号:爱范儿(微信号:ifanr),更多精彩内容第一时间为您奉上。

第一批用 AI 写代码的 10 后,已经被苹果邀请去 WWDC 了

每年春天,苹果都会面向全球的学生出一道不太一样的命题:用 Swift 语言,做出一个有表达、有情绪、也有想法的作品。

这就是 Swift Student Challenge(SSC), 参赛者需要用 Swift 创作一个 Swift Playgrounds App,在 3 分钟的体验里,说清一个点子、完成一次交互。其中的杰出获奖者,还将在下个月的 WWDC,到 Apple Park 亲身见证属于开发者的高光时刻。

2026 年的获奖名单已经揭晓,其中不乏来自中国大陆的年轻面孔,最小的,甚至只有 15 岁。

爱范儿和其中六位获奖者聊了聊,透过他们的故事和作品,我们看到这个时代的新生代开发者,如何挥洒独一无二的灵感,用技术讲述自己的世界。

个人经历就是最好的灵感

在分享自己的作品时,几乎所有获奖者都会先分享一段个人经历,然后再介绍自己由此出发,打造了一个什么样的 App。

这些经历非常多元,有的和身心健康有关,有的只是课堂或者旅游的感想,甚至只是一次玩乐。它们的共同点是,都存在着一个还没被解决的「问题」。

也因为这些作品都和个人感受高度相关,这些作品给人的印象,已经远远不止于「作品展示」,更让我看到它们具有真正上架 App 的潜力,并不禁去想,为何在这之前,没有人做这些应用?

具体困境,写进产品

这一组作品,都源于参赛者对日常的敏锐洞察。他们捕捉到了特定群体那些隐而未现的困境,在现有工具匮乏的现状下,他们选择拒绝等待,亲手为这些被忽视的需求定制了数字化的解决方式。

赵经纬 PMS.aid

赵经纬是一名典型的「行动者」。

她接触 Swift 的原因很简单:当她想把自己拍的猫猫视频剪辑、整理成实况照片分享,却发现市面上缺乏好用的 App,于是决定自己开发一个。

她的参赛作品 PMS.aid,也有着类似的创作背景。

赵经纬的朋友患有经前焦虑症(PMDD),表现为月经来潮时反复出现的情绪波动、躯体不适和行为障碍。

当她就诊时,想向医生展示自己的症状和心情变化,却发现目前缺乏了一个应用,能将和 PMDD 有关的数据集中展示。

于是,赵经纬就开发了 PMS.aid,专门面向 PMDD 和 PMS(经前综合征)患者,能够将月经、心情、日记等数据全部放在同一条周期时间线上,零散的数据成为完整的治疗方案。

赵经纬原本学习公共管理专业,后面发现自己更想要去尝试将人文社科和技术相结合,于是转至计算机专业,未来也将继续攻读人机交互的硕士学位。

她告诉爱范儿,自己已经定下了一个「开发者目标」——为每个人设计(Made for everyone)。

沈宸颉 Help the Bajau

沈宸颉的参赛作品 Help the Bajau,萌芽于一次志愿旅行。

今年 2 月,他在马来西亚仙本那进行志愿活动,接触到了被称为「海上吉普赛人」的巴瑶族社区,这群以海为家的原住民,正在面临严重的海洋环境污染问题。

于是他开发了沉浸式交互游戏 Help the Bajau,以巴瑶族的真实故事为背景,并参考了学术论文和巴瑶族社区个案,还使用了自己拍摄的真实素材。

AI 在他的创作过程中扮演了很重要的角色:刚刚接触 Swift 时,AI 回答了很多知识点的问题;Help the Bajau 的一些视觉元素,也是利用 AI 创造的。

但沈宸颉认为,工具只是一种辅助, 用心打磨每一个细节才能成就有温度的作品;技术也不只是冰冷的代码,它们在切实地改变世界。

赵芯澄 Orat

赵芯澄的开发者之路,源自于他的父亲的行动——没有任何开发经验,却利用 Swift UI 开发了一个 App 并上架 App Store,这给他带来了很大的鼓舞。

他的参赛作品 Orat,则植根于同学的真实情景:一次课堂展示,同学因为焦虑完全忘词,他想帮同学改变这种窘况,却没能在 App Store 找到简单好用的应用,于是决定自行开发。

Orat 是一款帮助用户智能训练演讲能力的 App,利用手势、姿态和语音识别,不断引导用户练习,并会生成相应的报告。

交互创新,前沿探索

这三位获奖者,更聚焦在「交互」的创新上,或许是一种对人机操作可能性的全新探索,又或许是数字化的方式,重写现实生活遇到的不快。

吴天禹 MagiBotics

「具身智能」火了有一段时间,机器人都连着上了两年春晚,但似乎我们和机器人之间,还隔着实验室的玻璃墙。

作为一名机器人专业的博士生,吴天禹的参赛作品「MagiBotics」,就是为了打破这种隔阂。

MagiBotics 通过简明易懂的交互方式,设置了三道颇具游戏感的关卡,用户在使用 App 的过程中,学习到机械臂的三种运动方式,并且最后还能利用 AR 技术,将用户设定好动作的「机械臂」,投射到自己面前。

吴天禹也告诉爱范儿,未来他将继续专注人机交互的方向,尤其希望能利用我们每个人都有的手机,搭建一条通往具身智能的桥梁,将这项前沿技术带给更多普通用户。

付佳鹭 Maestro

用「斜杠青年」来形容付佳鹭,最恰当不过:主修物理专业,出于兴趣辅修了计算机,制作过几台能避障、能语音控制的 AI 智能小车,也开发过记账和日记应用。

她的参赛作品 Maestro,却是一个「音游」。

在这个画风可爱的小游戏中,玩家将扮演「小熊指挥官」, 管理一支由4名小动物乐手组成的乐队,通过手部动作和面部表情,指挥乐队完成一次「即兴演奏」。

这种非常富有创意和趣味的交互方式,或许与付佳鹭自己和苹果产品的体验息息相关——她被 Swift Playground 编程平台的交互式教学吸引「入坑」,又被 Apple Vision Pro 的体感和沉浸式交互体验所震撼。

严禹 Pixel Beader

严禹接触 Swift Playground 的契机,源于短视频,他发现 Apple 开发者所使用的 Xcode,左边窗口刚刚键入代码,右边的画布就能实时显示变化,这种开发者交互模式深深吸引了他。

他开发参赛作品 Pixel Beader 的动机,则同样来自他的日常生活。

严禹尝试了最近很火的「拼豆」,却发现并没有想象中那么好玩——碰翻豆板就要全部重做,熨烫塑料会散发刺鼻气味,久坐还会腰痛。

于是他的参赛作品,就是一个「赛博拼豆」项目 Pixel Beader,用 iPad 和 Apple Pencil,创造了一个无害零损耗的虚拟创作空间,用户可以将任意图片转换成拼豆图纸,打造和收藏数字的 3D 拼豆作品。

AI 时代,编程能力更珍贵了?

过去两年,「编程」这个原本的手工艺活,正在被 AI 深刻改写。

去年推出的 Claude Sonnet 4 和 GPT-5-Codex,AI 可以像真正的工程师一样理解整个项目、自主完成测试、调试迭代,开发者只需要下指令。

作为参赛者中开发经验比较丰富的吴天禹,他深度经历了这个技术变迁。以前学编程,他只能依靠网上搜索、论坛查代码、看教学视频的「原始」方式学习编程和改进作品;而现在,他觉得自己更像一个「产品经理」,大部分代码可以交给 AI 来编写,效率提升数倍。

苹果对于「AI 编程」的态度,相当开明。今年 2 月推出的 Xcode 26.3 版本中,已经直接集成了 Claude Agent 和 OpenAI Codex。

即使作为一场竞赛,Swift Student Challenge 也并不将 AI 定性为作弊的「外挂」,反而拥抱 AI 在比赛中的运用。

像是两位中学生获奖者沈宸颉和赵芯澄,他们本身就有 Python、C++ 等编程语言的学习经历,AI 帮助他们大大降低了 Swift 的门槛,帮助他们实现技能的快速迁移,他们认为这很好补足了他们作为非专业开发者所欠缺的经验,并且由于 AI 带来的效率提升,可以花更多时间和精力,打磨应用要传达的理念。

Apple 开发者关系国际市场负责人谢恩伟认为,对于学生将想法付诸实践的能力,AI 工具是一次赋能,非常欢迎学生使用 AI 工具来调试代码。

甚至这也成为了竞赛的一种考察:今年开始,参赛者需要在参赛文档中分享使用工具的经验,确保最终作品体现出来的是自身的替代性思维和创造力,而非简单依赖 AI。

不管是谢恩伟,还是学生参赛者们,都一致认为,即使 AI 让「vibe coding」这种编程方式成为可能,学习编程依旧很有必要,甚至更有必要。

谢恩伟告诉爱范儿,比起以往任何时候,现在学习编程更有意义:

有一些非常核心的东西,比如对编程架构的理解、创意的火花,以及那些从未被验证过的全新思路,都需要发挥人类的聪明才智。
学习编程,实际上就是学习解决问题的语言,这种技能的价值,在于让你的创意变成实践。

这六名获奖者,或多或少都具有计算机的知识背景,即使是两名中学生,都学习过 C 语言,参加过不少相关的课后活动。

已经借助 AI 编程,让自己的作品上架 App Store 的吴天宇认为,想要把 AI 用好,本身还是需要学习相关的知识,理清做 App 的框架和逻辑,才能把提示词给写好。

说到底,AI 能力的上限,取决于用户给他投喂的提示词质量。

特别是在未来,当 vibe coding 更加普及,这不意味着所有人都能用这种「小白」的方式,打造一个优秀的产品,想要在同质化的 App 中脱颖而出,更需要懂编程,有表达。

付佳鹭则从另一个角度看待「学编程」的意义:本质上也是一种「有趣的思维训练」,学习一种解决问题的解决方式。

她尝试过 vibe coding,惊叹于它的低门槛,惊喜于自己能实现更多的想法,却也担心人们以后都会「少想一步」:

这或许是科技进步时,我们必须要面对的一个权衡问题。或者说,我们更需要解决的是,如何正确地利用 AI,来加速自己的「主动」思考,用一种巧妙的方式,将自己的硬性能力、创造力、生产力都提升,这或许是一个更好的愿景。

AI 可以为你编写代码,但它无法理解你应用程序的核心逻辑,也无法理解某些设计决策的重要性。

严禹则认为,既然 AI 将门槛降低,决定为什么做,比怎么做更重要:

具体内容的实施可以由 AI 接管,但创作者的竞争力将愈发取决于对底层原理的理解、对系统架构的判别,以及对审美的认知。AI是没有办法替代开发者的个人创作的,就好比训练数据,人工创作的数据质量往往比AI生成的要高得多,所以我相信在未来原创性的思考与产品会更加珍惜与可贵。

刚好,这就是 Swift Student Challenge 举办的宗旨。

这本来就不是一场常规的「竞赛」,它没有一道道需要解决的编程难题,也不看重作品背后代码的复杂程度, 苹果甚至不需要你开发一个完整的应用,只是想看看你能用 Swift 代码,做出怎样的自我表达。

对于这一批未来开发者的新生血液,在未来开发之旅中, AI 的角色注定会越来越重要,甚至能接管整个开发过程的编写工作。

凭借在开发者和业界影响力,苹果能够以 Swift Student Challenge 的全球竞赛,为摩拳擦掌的准开发者们,上好第一课:

「技术」只是应用诞生的前提,「表达」才是应用脱颖而出的根本。

#欢迎关注爱范儿官方微信公众号:爱范儿(微信号:ifanr),更多精彩内容第一时间为您奉上。

黄仁勋致 2026 届毕业生:别慌,AI 把所有人拉回同一起跑线 | 附演讲全文

这可能是近年来含金量最高、火药味最浓,但也最「反焦虑」的一场毕业演讲。

5 月 10 日,Carnegie Mellon University(CMU:卡内基梅隆大学)2026 年毕业典礼上,身价逼近 1860 亿美元的「皮衣刀客」黄仁勋站上演讲台,接过科学与技术荣誉博士学位。

台下坐着即将步入社会的 2026 届毕业生,他们面对的世界极其割裂。一边是英伟达撑起的万亿算力帝国,和狂飙突进的 AI 大牛市;另一边,应届生失业率创下新高,「AI 抢饭碗」的恐慌已经蔓延进每一个求职群。

今年,十几家大厂裁员时毫不避讳地把锅甩给了 AI;Anthropic CEO Dario Amodei 警告 AI 可能消灭 50% 的白领入门岗位;马斯克则抛出「人类有 20% 灭绝概率」的惊悚预言。整个社会对 AI 的恐惧,正在以各种方式蔓延至这些刚拿到文凭的年轻人。

而制造这场焦虑的人里,有不少是和黄仁勋地位相当的 CEO。就在本月早些时候,他在一档播客里直接开炮,说这类预言「没有帮助」,说这些人坐上 CEO 位置之后产生了「上帝情结」,以为自己无所不知。

批评完同行,黄仁勋今天走上了 CMU 的毕业典礼台。

▲ 值得一提的是,毕业典礼上,Intel CEO 陈立武亲手为黄仁勋披上荣誉博士披肩。典礼结束后,陈立武公开祝贺,顺手透露了一句:两家公司正在合作开发「令人期待的新产品」。

他没有讲 AI 的宏大叙事,而是讲了自己 9 岁坐飞机去 Kentucky 煤矿小镇的事,讲了凌晨 4 点被妈妈叫起来送报纸,讲了在 Denny’s 洗碗,讲了向 Sega CEO 道歉、低头哀求对方不要撤资。他说,那是他做过的「最艰难的事情之一」。

从洗碗工到万亿帝国掌门人,黄仁勋在台上讲这些,显然不是为了熬一锅俗套的成功学鸡汤,而是在用自己的经历,给这群被 AI 吓坏的年轻人透个底:任何新时代的开局,其实都不是准备万全的,也不需要你一开始就无所不能。

AI 正在推翻过去几十年的计算规则,旧的经验不再绝对管用,一切都在重新洗牌。对于刚拿到文凭、毫无包袱的年轻人来说,这其实是一件好事。因为大家不用再去死磕那些已经被前人占满的旧赛道,而是和所有人一起,又一次站在了同一条起跑线上。

对此,他看着台下的学生表示:「把你们的心投入到工作中。去创造一些配得上你们所受教育、你们的潜力,以及那些在世界相信你们之前就已经相信你们的人的东西。」

视频传送门地址🔗 :https://www.youtube.com/watch?v=dRaNmHmTJzs&t=5783s

附上黄仁勋演讲原文:

President Jehanian、董事会成员、各位老师、各位贵宾、骄傲的父母和家人们,最重要的是,Carnegie Mellon 2026 届毕业生们:

感谢你们授予我这份非凡的荣誉。能来到 Carnegie Mellon,与这所世界顶尖大学同在,我深感意义重大。这里是少数几个真正发明未来的地方之一。今天是一个充满自豪与喜悦的日子,是你们梦想成真的一天,但这一天并不只属于你们。你们的家人、老师、导师和朋友一路支持你们走到这里。

在我们谈论未来之前,请先感谢他们。这一天也属于他们。毕业生们,请站起来,和我一起站起来。来吧,各位。尤其请转向你们的母亲,祝她们母亲节快乐。

对你们来说,这是人生中的又一步。但对她来说,这是一个梦想成真的时刻。请记住这一点。

CMU 的学生就像机器人一样,一次只执行一条指令。看到你们毕业,看到你们。好了,大家集中注意力。我有件重要的事要告诉你们:看到你们从世界顶尖学府之一毕业,这也是她的时刻。我的父母也为我深感骄傲。我的旅程也是他们的旅程,我是他们梦想成真的结果,而他们的梦想就是美国梦。和在座许多人一样,我是第一代移民。

我父亲有一个梦想,就是在美国养育他的家庭。我 9 岁那年,他把我哥哥和我送到美国。我们最后去了 Kentucky 州 Oneida 的一所 Baptist 寄宿学校,那里是煤矿区,一个只有几百人的小镇。两年后,我的父母放下一切来到美国和我们团聚。他们几乎一无所有地来到这里。

我父亲是一名化学工程师。我母亲在一所天主教学校做女佣。她每天凌晨 4 点叫醒我去送报纸。我哥哥帮我在 Denny’s找了一份洗碗工的工作,在当时我觉得那简直是一次重大的职业晋升。

我去了 Oregon State University(俄勒冈州立大学)。17 岁那年,我遇到了我的妻子 Lori。我是学校里年龄最小的孩子。我们当时是大二学生,也是实验课搭档。她 19 岁。

一个年长的女人?我击败了班上其他 250 个男生,赢得了她的心。

我们现在已经结婚 40 年了。我们有两个很棒的孩子,他们都在英伟达工作。我 30 岁时,和 Chris Malachowsky、Curtis Priem 一起创办了英伟达,他们是两位出色的计算机科学家。

我们想打造一种新型计算机,一种能够解决普通计算机无法解决的问题的计算机。我们完全不知道该如何创办公司、融资,或者经营英伟达。我只是想,这能有多难?结果证明,这真的超级难。

我们的第一项技术根本行不通,钱也快用完了。有一次,我不得不飞到日本,向 Sega 的 CEO 解释,他们委托我们开发的技术无法实现,请求解除我们无法完成的合同,然后还请求他们继续付款。没有这笔钱,英伟达就会瞬间消失。那非常尴尬、非常屈辱,也是我做过的最艰难的事情之一。

而 Sega 的 CEO Irimajiri-san 说,可以。我很早就明白,做 CEO 不是关于权力,而是关于让公司活下去所承担的责任;也明白了诚实和谦逊有时会得到慷慨与善意的回应,即便是在商业世界里。我们用那笔钱重新调整了公司,并在绝境中发明了新的芯片和计算机设计方法,而这些方法直到今天仍在使用。

33 年来,英伟达一次又一次地重塑自己。每一次,我们都会问:这能有多难?每一次,我们又都会发现,它比我们想象的更难。但正是通过这些经历,我们学会了永远不要把失败看作成功的反面。每一次失败都只是一次学习的时刻,一次保持谦逊的时刻,一次锤炼品格的时刻。挫折中锻造出的韧性,才会给你再次出发的力量。今天,我是科技行业任职时间最长的 CEO 之一。

英伟达是我与 45000 位杰出同事共同完成的事业,也是我的毕生事业。现在,轮到你们去实现自己的梦想了,而这个时机再完美不过。我的职业生涯开始于 PC 革命的开端。你们的职业生涯开始于 AI 革命的开端。我想象不出还有比现在更令人兴奋的工作时代,更适合开启你们毕生事业的时代。AI 正是从卡内基梅隆大学起步的。

过去 24 小时里,我在这里听到了无数关于 AI 的笑话。卡内基梅隆大学是 AI 和机器人技术真正的发源地之一。20 世纪 50 年代,这里的研究人员创造了 Logic Theorist,它被广泛认为是第一个 AI 计算机程序。1979 年,卡内基梅隆大学成立了 Robotics Institute。今天上午我去参观了。今天上午,我参观了 Robo Club,也参观了第一个完全致力于机器人技术的学术机构。

AI 如今已经彻底重塑了计算。我经历过每一次重大的计算平台变革:大型机、PC、互联网、移动和云。每一波浪潮都建立在上一波之上,每一波都扩大了技术的可及性,每一波都改变了产业和社会。但现在即将发生的变化,比以往任何一次都更大。计算正在经历一次彻底重置。自现代计算被发明以来,还从未发生过这样的变化。

60 年来,计算的工作方式一直相同:人类编写软件,计算机执行指令。这个范式已经结束。AI 已经重塑了计算:从人类编码变成机器学习,从运行在 CPU 上的软件变成运行在 GPU 上的神经网络,从执行指令变成理解、推理、规划和使用工具。一个全新的产业已经出现,它的使命是大规模制造智能。

因为智能是每个行业的基础,所以每个行业都会发生变化。对许多人来说,AI 带来了不确定性。人们看到 AI 编写软件、生成图像、驾驶汽车,自然会想:接下来会发生什么?工作会消失吗?人们会被抛在后面吗?这项技术会不会变得过于强大?

历史上每一次重大的技术革命,都会在带来机会的同时带来恐惧。当社会以开放、负责任、乐观的态度拥抱技术时,我们扩展人类潜能的程度,远远超过我们削弱它的程度。所以首先,也是最重要的是,我们必须清楚地认识到:AI 也就是对理解、推理和解决问题的自动化,是人类有史以来创造的最强大技术之一。和此前每一项变革性技术一样,它既会带来巨大的希望,也会带来真实的风险。我们这一代人的责任,不只是推进 AI,更是要明智地推进 AI。科学家和工程师肩负着深刻责任,要同时推进 AI 能力和 AI 安全;政策制定者也是如此。

政策制定者有责任建立周全的护栏,在保护社会的同时,仍然让创新、发现和进步继续向前。历史表明,选择逃避技术的社会并不能阻止进步,它们只是放弃了塑造进步并从中受益的机会。所以答案不是恐惧未来,而是明智地引导未来,负责任地建设未来,并确保它带来的好处能够惠及尽可能多的人。我们不应该教人们害怕未来。我们应该以乐观、责任感和雄心去参与未来。

现在,全世界只有一小部分人知道如何编写软件。而如今,任何人都可以让 AI 帮自己做出有用的东西。一个店主可以创建网站并发展业务;一个木匠可以设计厨房,并向客户提供新服务。AI 会编写代码。第一次,每个人都成了程序员。计算和智能的力量第一次真正能够触达每个人,并弥合技术鸿沟。就像电力和互联网一样,AI 将需要数万亿美元的基础设施投资。

这是人类历史上规模最大的技术基础设施建设,也是一代人只有一次的机会,让美国重新工业化,恢复国家的建造能力。为了支持 AI,美国将在全国各地建设芯片工厂、计算机工厂、数据中心和先进制造设施。AI 给了美国再次建设的机会。电工、管道工、钢铁工人、技术员、建筑工人,这是你们的时代。

AI 不只是在创造一个新的计算产业,它正在创造一个新的工业时代。支撑这些新基础设施需要巨大的能源,但它也在推动几代人以来规模最大的能源基础设施投资之一,推动电网现代化、扩大电力生产,并加速可持续能源发展。是的,AI 会改变每一份工作,但一份工作的任务和目的并不是一回事。许多任务会被自动化。一些工作会消失,但许多新的工作和全新的行业也会被创造出来。

软件编码任务正越来越多地被自动化,但借助 AI,软件工程师可以扩大解决方案的搜索范围,从而应对更宏大的挑战。放射影像分析正越来越多地被自动化,但借助 AI,放射科医生会被提升到更高水平,更好地诊断疾病、照护患者。AI 不会取代人的目标,它会放大人的能力。这就是为什么即使 AI 编写了更多代码、分析了更多影像,对软件工程师和放射科医生的需求仍在继续增长。AI 不太可能取代你,但更会使用 AI 的人可能会取代你。所以一个很好的思维实验是:

我们希望自己的孩子被 AI 增强,还是被那些被 AI 增强的人甩在后面?没有父母希望自己的孩子被落下。所以,让我们安全地建设 AI。同时,也让我们想象一个乐观的未来,一个让我们的孩子愿意参与其中、并受到鼓舞去帮助建设的未来。因此,我们可以也必须同时做好四件事:安全地推进 AI,制定周全的政策,让 AI 被广泛使用,并鼓励每个人参与其中。每个人都应该拥有 AI。

机会不应该只属于会写代码的人。

2026 届毕业生们,你们正进入一个非凡的时代。一个新的产业正在诞生,一个科学与发现的新时代正在开启。AI 将加速人类知识的扩展,帮助我们解决曾经无法触及的问题。我们有机会弥合技术鸿沟,第一次把计算和智能的力量带给数十亿人;有机会让美国重新工业化,恢复我们的建造能力;也有机会帮助创造一个比你们所继承的世界更富足、更有能力、更充满希望的未来。

没有任何一代人像你们这样,在进入世界时拥有如此强大的工具和如此巨大的机会。我们都站在同一条起跑线上。这是你们帮助塑造未来的时刻。所以,要奔跑,不要慢走。卡内基梅隆大学有一句我很喜欢的校训:我的心在工作之中。

所以,把你们的心投入到工作中。去创造一些配得上你们所受教育、你们的潜力,以及那些在世界相信你们之前就已经相信你们的人的东西。祝贺你们,卡内基梅隆大学 2026 届毕业生。

作者:莫崇宇

#欢迎关注爱范儿官方微信公众号:爱范儿(微信号:ifanr),更多精彩内容第一时间为您奉上。

川普、孙宇晨都来当 AI 黄牛了,这门暴利生意的水有多深?

十六世纪,欧洲商船在大西洋上画出了一个三角形的航线。

欧洲的布匹和枪炮流向非洲,换来人口;人口被运往美洲的种植园,换来棉花和糖;棉花和糖再运回欧洲,完成一次稳赚不赔的循环。这套臭名昭著的交换体系,后来被历史教科书称「三角贸易」。

谁能想到,三个世纪后,一条结构惊人相似的贸易链,正在互联网上悄然成形。

在这条新航线上,全球南方的普通人提供身份信息,美国的 AI 实验室提供顶尖模型,中国开发者和企业提供需求,而其中一些连接这三者、从中赚取差价的中间层,被称为「AI 中转站」。

这门生意的起点,源于两大难以跨越的限制。

OpenAI 自 2024 年 6 月起明确封禁中国大陆 IP,Anthropic 的服务条款同样禁止向不支持地区销售。支付是另一道门槛,主流海外模型厂商要求绑定 Visa 或 Mastercard,并通过严格的账单地址核验,多数开发者被直接拒之门外。

「AI 中转站」正是在这两大限制的夹缝中生长出来的。他们用海外服务器充当跳板,用人民币支付替代外币信用卡,把顶尖算力以「代购」的方式转交给受限地区的用户。

这门原本藏在灰色地带里的生意,如今却吸引了一批名人高调入场。

猎豹移动 CEO 傅盛推出了 Easy Router,打出全线模型八五折、DeepSeek-V4 定价低至官方四分之一的招牌。币圈大佬创始人孙宇晨、懂王的家族企业也纷纷下场,可见这里面的水有多深、油水有多大。

今天,咱们就来聊聊,这门含着泪赚你钱的生意,到背后到底有哪些套路?

只要胆子大,AI 中转站也有自己的华强北

从技术上说,AI 中转站就是一个架在用户和大模型服务商之间的反向代理服务器。用户把请求发给中转站,中转站再转发给 OpenAI 或 Anthropic,取回结果后再交给用户。

按形态和受众区分,当前市场上的中转站大致分三种类型:
第一种是面向普通用户的「网页镜像站」,直接套一个网页界面,用户登录即用。门槛最低,但也最不透明,你完全不知道请求最终流向了哪里。

第二种是面向开发者的「API 聚合分发平台」,核心是把多家模型的异构接口统一转换为标准格式,按 Token(词元)计费向下游转售。前文提到的几位名人产品,本质上都属于此类。

第三种是面向大型机构的「企业级 AI 网关」,提供智能路由、全链路审计、数据脱敏和权限管控,代表产品有 Portkey,算是这个生态里相对规范的一层。

三种形态的技术底层有着共同的逻辑。以开源项目 One API 为例,它的 GitHub 星标超过 3 万,被大量商业平台直接拿来二次开发,是许多中转站市场事实上的底层基础设施。

🔗 https://github.com/songquanpeng/one-api

它的运作分三个核心模块:

协议标准化:各家大模型的 API 格式大相径庭,中转站会在网络应用层深度解包用户请求,提取核心元素,重新打包成目标模型要求的格式发送,并实时透传流式输出的数据块,保证「打字机」效果不中断。

Token 计费拦截:中转站在转发过程中截取返回数据包,统计实际消耗,再乘以自定义的「模型倍率」向用户收费。这套系统允许站长对不同模型设定差异化溢价,是商业变现的核心。

多账号轮询池:单个官方账号有严格的频率限制,中转站通过维护大量底层 API Key,用轮询算法分发流量。某个账号被封或耗尽时,系统自动无缝切换到下一个。

正是第三个模块,让一个人只需租一台海外服务器,执行一行 Docker 命令,极短时间内就能上线一个商业平台。技术门槛的持续下降,直接导致了市场上海量玩家的涌现。

而中转站能提供低价,背后必然有一套成本更低的算力获取方式。

上游资源方通过利用云厂商新用户免费额度、滥用教育邮箱获取折扣、在电商平台批量倒卖企业账号权益来压低成本。更灰色的手段则包括批量注册虚假账号、盗刷跨国信用卡甚至窃取他人的 API Key。

最近随着 Anthropic 引入 KYC 强制实名认证,这条供给链又延伸出了新的分支。

中间商前往尼日利亚、肯尼亚、柬埔寨等地,以几美元的报酬招募当地人配合拍照,批量采集人脸和证件信息,再以数十倍的价格转售给国内开发者。

这与此前在非洲采集虹膜数据的黑市逻辑如出一辙,将生物特征数据商品化的链条直接平移到了 AI 时代。不少业内研究者都曾警告,今天被收割的面部信息,明天就可能被用于开设欺诈性金融账户,危害深远。

花买玛莎拉蒂的钱,骑赛博共享单车

如果真能做到「一手交钱,一手交货」,这门代购生意倒也算得上公道。但现实是,AI 中转站提供的服务往往货不对版,甚至可以简单理解为「掺水」的货。

2026 年 3 月,CISPA 信息安全研究中心发表了学界首次针对中转站系统性安全审计的论文《Real Money, Fake Models: Deceptive Model Claims in Shadow APIs》。

🔗 https://arxiv.org/abs/2603.01919

研究者追踪了 17 个曾被 187 篇正式学术论文引用的中转站服务,进行了全面测试。

结论触目惊心:45.83% 的节点通不过模型身份验证,说明其后台运行的并非宣称的模型。在医学问答测试中,Gemini-2.5-flash 通过官方 API 的正确率为 83.82%,而通过影子 API 则跌至约 37%。在法律推理测试中,所有被测中转站都比官方 API 落后 40 个百分点以上。

 ▲ AIME 2025

具体来说,这种「狸猫换太子」的方式分三种:

一是按官方原价收费,后台实际运行低成本开源模型(例如打着 GPT-5 的幌子,实则偷偷替换为掺水的 Llama);二是用便宜的新模型替换较贵的旧模型,反而向用户收取更高费用;三是哪怕用户支付了高昂的加价,最终调用的依然是低端模型。

▲图片出自论文,由 AI 生成

价格和质量在 AI 中转站的黑市里完全是随机分布的盲盒。论文的结论也显示,价格比率对准确率下降完全没有预测力,选贵的中转站并不能保护你免受模型替换的损失。

除了模型造假,账单同样存在猫腻。

2026 年 ACM 互联网测量大会上的论文《Behavioral Consistency and Transparency Analysis on Large Language Model API Gateways》对真实商业网关进行测评,发现有网关实际收费比预期计算高出 62.8%,但其上报的用量数据与其他平台并无异常,用户根本感知不到多出的钱去了哪里。

▲LLM API 网关架构概览,以及主要的透明度与一致性挑战。

此外,部分网关还会进行隐蔽的「上下文截断」。

为了节省成本,它们在历史消息超过隐性阈值后,悄悄丢掉早期内容。测试人员设计了一段 25 轮对话,模型在某些网关上到第 24 轮时已经无法复述第 10 轮设定的信息。这意味着依赖长文档分析或多轮对话的应用,可能长期运行在降级状态。

简而言之,你用的 AI 中转站,很有可能就是花着最贵的钱,用着最蠢的模型,忍受它随时变成拥有七秒记忆的金鱼,最后用来干最复杂的活儿。

你拿 AI 写代码,AI 给你种木马

讲真,花冤枉钱买个「智障」模型顶多算是破财免灾,更需要注意的是,这些 AI 中转站很有可能会盯上你的隐私数据。

用户以为交给中转站的只是一段请求,实际上交出去的是完整的双向通信记录。

AI 中转站作为中间人,对每一条提示词和每一段模型返回都拥有读写权限。灰色平台可能把这些数据打包卖给 AI 训练公司或数据经纪商,赚取不菲的利润。这就导致你既是客户,也是产品本身。

更危险的是,数据经过的中间节点往往不止一个。

中转站的路由常常多层嵌套:你从电商平台买的 API 访问权限,背后的卖家可能从另一个聚合平台采购,整个链路可能经过四个以上的独立节点。木桶短板理论诚不我欺,链条的安全性取决于最弱的那一环,一旦任何节点被攻破,上游的数据截留或篡改就已完成。

在《Your Agent Is Mine: Measuring Malicious Intermediary Attacks on the LLM Supply Chain》这篇论文中,研究者在沙盒中测试 428 个中转站后发现:9 个正在向用户注入恶意代码,17 个触发了 AWS 测试密钥的盗用,甚至有 1 个直接抽走了研究者部署的私钥钱包资金。

▲ 多跳路由的链条越长,中间任何一个节点出问题,污染就会沿链传播,而终端的 Agent 很难判断响应是否经过篡改。论文🔗 https://arxiv.org/abs/2604.08407

一个被故意泄露的 OpenAI 密钥迅速被中转站复用,产生了逾 1 亿 Token 流量。

今年 3 月发生的 LiteLLM 事件更是暴露了攻击规模。黑客通过依赖包漏洞潜入这个主流开源框架,波及超过 4.6 万个开发环境。此外,更有高级黑客将木马控制指令(C2)伪装成正常的 AI 对话提示词发给中转站,借助合法通道绕过传统防火墙。

▲一个恶意 Router 坐在 Agent 和模型之间,既偷看请求与响应里的敏感信息,又在返回给 Agent 之前往响应里注入恶意内容。

当 AI 从聊天工具进化为能自主执行代码的智能体(Agent),风险又多了一个维度。

恶意中转站能在 shell 命令抵达执行层前,把安装包替换成同名恶意包。甚至还有「条件投递」变种:前 50 次请求正常,第 51 次才激活注入。对于自动执行模式的 Agent 来说,最基础的载荷注入就已足够致命。

值得一提的是,中转站的破坏范围不止于直接用户。

《Real Money, Fake Models》论文统计显示,187 篇引用影子 API 的论文中,62% 发表在 ACL、CVPR 等顶级学术会议上。这些使用假模型进行的评测或漏洞分析,导致了严重的学术信任危机。若其中 30% 需要重新执行,总损失就在 11.5 万到 14 万美元之间,近 6000 篇后续研究的有效性也随之存疑。

这门靠「信息差套利」维持的生意,正在走向不可持续的终点。

一方面,境外未备案模型向境内提供服务触碰了《生成式人工智能服务管理暂行办法》,给站长带来了极大的非法经营风险;企业用户一旦因此发生敏感数据泄露,也将面临严厉的法律制裁与行政处罚。

另一方面,伴随着国产大模型(比如 DeepSeek 等)的能力呈现井喷式爆发,不仅在各项榜单上开始追平甚至反超海外巨头,更是在价格上掀起了腥风血雨——API 接口的价格被硬生生打到了海外厂商的几十分之一,甚至直接开启了「免费时代」。

当拧开水龙头就能喝到干净便宜的水,那些在暗巷里倒卖高价水还要掺假下毒的营生,自然也就迎来了他们的谢幕。即便存活下来的黑心平台,未来也只会进入「大逃杀」模式:要么更加疯狂地掺水、偷数据来维持暴利;要么趁着资金链还没断裂,拔网线关服提桶跑路。

十六世纪的三角贸易靠的是信息不对称和地理隔绝,最终因贸易透明化和监管而终结。AI 中转站赖以生存的同样是地区封锁和不对称信息。不同的是,这一次,被贩卖的不只是算力,还有身份、隐私、信任,以及无法预估的后果。

作者:莫崇宇

#欢迎关注爱范儿官方微信公众号:爱范儿(微信号:ifanr),更多精彩内容第一时间为您奉上。

我买了这些畅销书,但作者不是人

你花钱买了一本书,却发现作者压根不存在。

这是知名医学家 Topol 教授曾经历的真实遭遇。市场上,一度有数十本打着他名号和肖像的烹饪书与健康指南正在大肆售卖,而他本人毫不知情。

Topol 愤怒地将其称为「彻头彻尾的欺诈」,但他在亚马逊的维权之路却仿佛打在棉花上,只换来客服冷冰冰的通用回复。

这仅仅是冰山一角。最近,知名风投 a16z 给出一组令人深思的数据:自从 ChatGPT 横空出世,亚马逊电子书的月发行量直接翻了两倍。

到了 2025 年末,每个月的新书发布量已经飙升到了夸张的 30 万本。说白了,你现在在电子商店里随便逛逛,映入眼帘的新书里,很大一部分都是 AI 生成的流水线产品。

2026 年的出版界是魔幻的,我们曾经熟悉的「白纸黑字即是权威」的信任体系,正在被无孔不入的 AI 一点点瓦解。

被 AI 书籍包围的电子书架

想象一下这个极具画面感的场景:夜深人静,你裹着毯子,捧起一本刚买的热门奇幻言情小说《 Darkhollow Academy: Year 2 》,准备让主角的极限拉扯帮你分泌点多巴胺。

结果翻到最刺激的章节,剧情突然急转直下,赫然出现了这么一行字:「我已经重写了这段文字,使其更符合 J. Bree 的风格,这种风格包含更多紧张感……」。

这不是什么先锋派的打破第四面墙,而是作者连 AI 的提示词都忘了删,就直接一键出版了。甚至如今你想当个「畅销书作家」,门槛已经低到超乎常人的想象。

你只需要花区区 29.97 欧元美元,订阅一个叫 Youbooks 的 AI 工具,它就能帮你融合 ChatGPT 、 Claude 、 Gemini 甚至 Llama 的能力,每月提供数十万字的生成额度。它能一键编造出看似逻辑严密的内容,自动从网上提取最新资料,甚至连排版都能顺手搞定,最后直接导出 PDF 或 EPUB 格式。

有了这种神器,投机分子们简直杀疯了。

此前就有个名叫 Tommi Pedruzzi 的 27 岁年轻人在社交网络上高调炫耀,说自己靠着批量生成 1500 本 AI 电子书,硬生生在亚马逊上赚了 300 万美元。他在分享暴富哲学时直言:「出版一本没人想读的书毫无意义」。

虽然很快就有 Reddit 网友扒出亚马逊上根本搜不到他署名的书,并戳穿他真正的盈利方式其实是靠卖「教你如何用 AI 致富」的课程割韭菜。但无论真假,这种批量制造「电子水货」的套路,对各大出版平台的污染却是实打实的。

更有意思的是这帮人蹭热点的手速和下限。

英格兰女足去年刚赢下欧洲杯,亚马逊上瞬间就冒出了一堆关于 Chloe Kelly 等球员的伪传记。

这些书有多敷衍呢?封面不仅粗制滥造,甚至把美式橄榄球当成了足球。全书不到 50 页,标价 11 英镑,主打一个愿者上钩。前英格兰女足队长 Steph Houghton 发现自己辛辛苦苦写了 300 多页的自传,被 AI 仿写成了一本 50 页的残次品,气得直呼「太差劲了」。

这种粗制滥造正在全面围剿真实的创作者。

知名记者 Kara Swisher 的新书刚一出版,亚马逊上立刻被各种打着她名字的 AI 传记和总结「包围」;喜剧演员 Rhys James 在平台上发现了多本以自己为主角的 AI 垃圾传记,封面全是用 AI 生成的虚假男性形象;

面对汹涌的 AI 海啸,平台方的应对显得极其无力。亚马逊曾出台规定,限制每位作者每天最多只能发布 3 本书——这对日产千字的机器来说简直是隔靴搔痒。不仅如此,虽然作者在上传书籍时被要求勾选是否使用了 AI,但这层提示却一度被刻意隐藏了起来,根本不会向购买的消费者展示。

面对这种劣币驱逐良币的生态,原生创作者正在被迫出逃。因为流量和版税被成千上万的 AI 垃圾书籍稀释,作家 Dakota Willink 公开表示自己不得不退出 Kindle Unlimited 平台,转而寻求 Kobo Plus 等其他更透明的海外渠道。

英国出版商协会也发出警告:如果放任这种低质量 AI 图书泛滥,消费者的信任将被彻底透支。

偷走人类的语料,再把 AI 垃圾塞给你

在这场赛博垃圾的狂欢背后,一个根本性的原罪始终无法回避:这些能胡编乱造、能模仿名家风格的大模型,究竟是怎么变得这么「聪明」的?

答案很简单:靠海量的、未经授权的抓取。

此前曝光的法庭文件,直接揭开了 Meta 训练 Llama 3 时的幕后操作。面对大模型对高质量数据的极度渴求,Meta 高管们曾讨论过购买正版授权,但结论是:流程极其缓慢,价格高得不合理。

一位工程总监在内部群里赤裸裸地指出:「如果我们只授权一本书,那我们将无法以『合理使用』为理由来抗辩。」。翻译一下就是:只要我们抓取的数据足够庞大,法不责众,这就是技术创新。

于是,在获得高层默许后,Meta 员工熟练地挂上匿名性极强的 BitTorrent(BT 种子),把全球最大的盗版数字图书馆 Library Genesis(LibGen)给下载了。里面足足包含了 750 万本书和 8100 万篇论文。

巨头们无偿征用了人类作家的才华与思想,转头用户又将 AI 生成的书籍塞给社会。

诚然,如果我们只看冰冷的数据,这场 AI 海啸似乎带来了某种短期红利。

伴随着 AI 流水线开始接管文字生产,一家名为 Spines 的初创出版商因在 2024 年拿到了 1600 万美元融资,便计划用一年时间通过 AI 全自动出版 8000 本书,从校对到排版只需三周。

NBER(美国国家经济研究局)的一篇论文也佐证了这种「繁荣」:尽管 AI 导致图书平均质量断崖式下跌,但由于供给基数庞大,市面上「中等偏上」质量的书籍绝对数量增加了,为读者带来了约 7% 的「消费者剩余」提升。

同时,部分老牌作家在 AI 辅助下,生产力也得到了超级强化。这似乎印证了投资人 Marc Andreessen 的预测:糟糕内容的泛滥会伴随高质量内容的爆发。

但这真的会让出版社迎来第二春吗?

这种繁荣假象的代价是惨痛的:一方面,海量的 AI 垃圾正在无限稀释真实作品的曝光率,让许多没有名气的原生作家出头空间被压缩;另一方面,作为内容源头的出版商和创作者正在被大模型无情地「吸血」,失去了赖以生存的商业回报。

面对迫在眉睫的生存威胁,包括 Dennis Lehane 在内的 70 多位知名作家联合向美国出版界「五大巨头」请愿,要求停止发布机器创作的书籍;与此同时,由于大模型直接在搜索端抓取并总结内容,Google 的 AI 摘要功能(AI Overviews)导致部分出版商的外部网站流量暴跌了 34% 以上。原生内容的生存土壤正在被彻底掏空。

更致命的是,这种竭泽而渔的玩法,最终会迎来技术层面不可逆转的反噬。

在计算机科学里,有一句至理名言叫「 Garbage in, garbage out (垃圾进,垃圾出)」。大语言模型想要变得更聪明,必须投喂高质量的人类文本数据。但在过去的两年里,由于巨头们的纵容,亚马逊和整个互联网已经被海量的 AI 垃圾填满了。

这下尴尬了。当 OpenAI 或 Google 派出下一代爬虫去抓取新的训练数据时,它们抓到的会是什么?是连「重新生成回答」都没删的言情小说;是错把橄榄球当足球的名人传记;还是 27 岁小伙真有机会一键生成的 1500 本水货。

宛如一条正在吞食自己尾巴的「衔尾蛇(Ouroboros)」, AI 曾经吞下的是人类文明的经典,现在,它却不得不吃下自己和同类排泄出的数字废料。长此以往,模型不可避免地会走向退化,也就是学术界一直担心的「模型崩溃」。

所以我们到底为什么而阅读?

阿根廷作家博尔赫斯曾在小说中构想过一座无限庞大的「巴别图书馆」。那里收录了所有可能的字母组合,书本数量浩如烟海。但遗憾的是,绝大多数书籍都是毫无意义的乱码,真正蕴含真理和情感的文字,被永远淹没在了冗余信息的汪洋之中。

如今不知疲倦的生成式 AI,正在为我们建造一座现实版的巴别图书馆。当电子书架被每月 30 万本的流水线废料填满,当整个行业不得不面对「垃圾进,垃圾出」的衔尾蛇困局时,我们或许该重新思考文字本身的意义。

英国作家 C.S. 路易斯曾说:「我们阅读,是为了知道自己并不孤单。」

一本书真正的重量在于,触碰到另一群真实的人。他们也曾和你一样。会痛,会笑,会迷茫,会心碎。他们把这些滚烫的生命体验,笨拙又真诚地揉碎在文字里,留给了未来某个他们永远不会认识的人。

AI 能在几秒钟内生成一百万个结构精巧的故事,却也体会不到哪怕一滴眼泪的重量。在这个文字可以被无限量产、廉价批发的时代,那些带着体温的作品,正在变得愈发稀少,也愈发珍贵。

去读书,更去读那些真正有作者的书。

作者:莫崇宇

#欢迎关注爱范儿官方微信公众号:爱范儿(微信号:ifanr),更多精彩内容第一时间为您奉上。

下个月的苹果 WWDC,假如 iCloud 变成 iClaw……?

距离苹果全球开发者大会 WWDC 还有一个月不到的时间,彭博社又送上关于苹果新系统的全新爆料:

苹果准备对 macOS 27 的界面进行一轮小幅调整,进一步完善「液态玻璃」设计语言的视觉表现。

但问题在于,对于如今的 Mac 来说,除了需要继续打磨的 UI,最迫切的更新显然远不止于此。

液态玻璃,缝缝补补又一年

对比 iPhone 以及 iPad,Mac 的性能和续航都更有盈余,实际上 macOS 26 的界面,视觉效果要更接近去年 WWDC 上面演示的「满血版」液态玻璃。

不过,液态玻璃立项之初,就是专门为 OLED 屏幕设计的,而目前所有 Mac 产品都在使用 LCD 屏幕,在呈现半透明、阴影和玻璃质感的方面,效果不如 OLED。

于是 macOS 26 的一些高透明效果和阴影,会导致列表和文字可读性下降——这也是「液态玻璃」被一直诟病的问题。

和 iOS 27 一样,macOS 27 也将仔细打磨液态玻璃,让它更接近苹果一开始设想的效果:兼顾透明度和可读性,同时进一步优化能耗表现。

不过,macOS 26 在 UI 上的问题根本不止于液态玻璃本身,不对齐的圆角、大量分散注意力的小图标,以及重新设计后辨识度大打折扣的应用图标,对可读性和美观层面都造成了一定的影响。

图源:Daring Fireball

苹果评论员 John Gruber 对于 macOS 液态玻璃的点评相当一针见血:作为一种「内容优先」的设计语言,液态玻璃让系统 UI 隐身于媒体之后,在 iPhone 上或许能行,但作为强调生产力而非内容消费的桌面平台,Mac 包含大量的窗口、组间,因此复杂性更高,仍然需要应用界面保证清晰的结构、分明的功能区域,和强辨识度的界面。

在 Stephen Lemay 接任设计总监一职后,这位在苹果服务近 30 年的老将表现让人期待——Lemay 以公司内部的高口碑和稳定发挥著称,或许也称得上是苹果内部目前最懂苹果系统界面的人。

在他的把控下,macOS 27,以及 iOS 27 如何扭转液态玻璃褒贬不一的口碑,回到实用性和美感并举的方向,确实值得期待。

但对于 macOS 来说,界面上的「拨乱反正」固然必要,却已经不是最重要的更新了。

对苹果而言,未来系统的更新有两条主线:一方面,优化系统稳定性,另一方面,则是为 Apple 智能预备好。

最好的 AI 载体,需要一个 AIOS

根据彭博社爆料,苹果打算为「Apple 智能」打造一个「Extensions」功能,允许用户更换第三方 AI 模型,例如 Google Gemini、Claude 等等。

Siri 除了会集成到邮件、短信、相册等应用,自己也会化身聊天机器人,成为一个单独的应用。更多 AI 功能还会覆盖文本、图像等生成与编辑任务。

但这些更新,说实话更多还是做 AI 的单点功能,并非系统级别的编排能力,并未能进一步发挥 Mac 硬件上的优势。

今年年初的龙虾热,让 Mac mini 这个前年才火过的产品,又再一次出圈,这次火到苹果自己也没库存了,「入门版」在官网彻底售罄。

Mac 和 Windows 在不少层面上互有胜负,但在 AI 的问题上,Mac 作为「最佳 AI 容器」的论断几乎毫无争议。

关于这个问题,爱范儿已经出过一篇文章详细讨论。简单来说,就是因为 Mac 不管是 UNIX 系统底层还是集成运存的硬件架构,都非常契合 AI Agent 和大模型的运行方式,并且由于 ARM 架构的特性,运行功耗低还静音,非常适合 AI 常驻。

这更像是「无心插柳柳成荫」,苹果其实一开始并没有围绕 AI 去打造自己的 Mac,却无意间完成了所有 AI 的技术储备,严格意义上说是一种「适配度优势」。

从这个角度看,macOS 即使什么都不做,本身 Mac 也已经是一个很好的 AI 平台。苹果完全可以走 App Store 的逻辑,让用户自己部署想要的第三方 AI 智能体,自己继续扮演「收过路费」的角色。

这确实也是苹果长期以来的做法:在移动互联网兴起之时,苹果没必要自己做搜索引擎和网购平台。而 AI 时代,大众的需求变化万千,有人需要一个能剪辑的 Agent,也有人需要一个搞科研的 AI,必须要靠第三方满足。

在今年 5 月的财报会议上,苹果特别提到了 AI 公司 Perplexity 的智能体产品 Personal Computer,认为这种产品很好利用了 Mac 平台的能力。

既然觉得人家做得不错,何不自己上手做一个「iClaw」?

第三方 AI 百花齐放固然很好,这和苹果自己做一个却并不冲突,并且很多事情,只有第一方能做得好,能做得让人放心。

第三方应用再强,也很难自然获得系统级的上下文,苹果不可能将最底层的权限开放,只有系统底层自己能对文件位置、窗口状态、本地个人数据知道一清二楚,而 AI 应用的体验,往往就卡在了这些权限边界之上。

其实苹果并不是没有这种想法,那个迟迟没能推出的 AI Siri,其实就有着类似的构想,可以读取用户的文本和应用窗口,可以跨应用进行检索和处理。

对比 iPhone 和智能手机,AI 应用的主流使用场景其实还是在于桌面端,这也是为什么 Mac 能成为今年最热门的 AI 硬件,但苹果却没有继续在 macOS 的系统层面,赋予 Mac 足够分量的原生 AI 能力。

隔壁的 Windows 阵营在这方面要激进不少,系统层面有「Recall」和 「Copilot」这样的 AI 功能入口,联想和荣耀这样的 OEM 厂商,甚至为产品准备了开箱即用的龙虾应用,砍掉了门槛,并因为和本地深度集成,能节省不少 Token。

微软自己也已经坐不住了,据悉正在将原本只能你问我答的 Copilot,改造成一个 24/7 在线的数字分身,实现类龙虾能力。

对比 OpenAI、Anthropic 或者 Google,说实话我更愿意将这些敏感的数据,交给在隐私保护方面更上心的苹果。

更深一步,macOS 最缺少的不是 AI 应用,而是 AI 时代的「基建」。Mac 已经准备好了 AI 大有可为的土壤,但 macOS 还没能成为一个真正意义上的「AI 系统」。

苹果不仅可以做自己的 AI 智能体能力,也需要把模型、权限、上下文、自动化和跨应用任务重新梳理,让系统成为 AI 工作流的原生中介,成为一个掌控所有 AI 的「任务集散中心」。

就像是智能体运行所需要的「个人知识库」,现在我们用文件夹也可以搭建,但它还不够好用。

苹果完全可以自己承接这个环节,用户靠 Mac 自带的工具搭建、生成一个「知识库」文件,它可以和 Apple ID 绑定,利用 iCloud 流转,这样不管用哪一家的智能体服务,都能快速调用自己的知识库,不用从头开始配置,同时还能保证自己的内容被苹果的隐私政策保护。

并且,这些配置的模块都能整合进入 Apple 的订阅系统之中,iClaw 和 Token 也能成为苹果在 AI 时代提供的增值服务。

iClaw 示意图,AI 生成

实际上,苹果已经开始了这样的进程。在 macOS 26.1 中,苹果集成了「模型上下文协议」,一个面向不同 AI 的通用开放标准,Agent 可以通过这个协议,访问用户的个人数据;苹果的基础模型框架,让 macOS 开发者可以调用系统内置的基础模型,零网络延迟,零 API 费用,数据不离开设备。

作为计算机图形系统的祖师爷,macOS 在过去的数十年间都是围绕「应用」构建的桌面系统。

在接下来十年,应用和图形界面还会是人机交互的主流,因此 macOS 27 要将界面风格修缮得更好,当然非常重要。

但未来五十年甚至更远,AI 都会成为无可避免的主旋律,macOS 不可避免会被进一步改造,成为一个围绕「任务」运转的 AIOS。

#欢迎关注爱范儿官方微信公众号:爱范儿(微信号:ifanr),更多精彩内容第一时间为您奉上。

刚刚,宇树载人机甲发布,售价 390 万起

《铁甲钢拳》《机动战士高达》里的铁疙瘩,终于从二次元杀进现实了。

就在刚刚,宇树科技发布了一款堪比科幻电影的载人机器人:GD01 载人变形机甲。

起售价 390 万元。

官方给它的定位是,「民用交通工具」,但有一说一,交警叔叔看了都得连夜翻交规的程度。

值得一提的是,这也是全球首款量产版的载人机甲。

「吨位」方面,官方表示,连人带机加起来 500 kg 左右,属于真正的钢铁猛兽。

且看宇树科技创始人王兴兴坐进座舱,推拉摇杆,就能直接开动这台机甲。话说,有没有体面一点的进舱方式?(doge)

仔细看造型,裸露的半开放座舱、粗犷的机械臂同步控制系统、以及浓烈的重装甲风格……好家伙,这不就是《阿凡达》里反派上校在潘多拉星上开的那台 AMP 扩增机甲吗?!

要是再抡起机械臂哐哐砸墙,或者搞点重载搬运,GD01 简直就是现实版的工程机甲。

此外,GD01 还支持多个形态的自由切换。

当然,考虑到 390 万的起步价确实不便宜。首批买单的大概率是各种拿去镇场子的展馆,或者有特种作业硬核需求的土豪氪金机构。

而如果仔细盘点过去这一年的发布节奏,宇树科技简直是杀疯了。今年 2 月初,宇树 G1 直接被扔到了新疆阿勒泰零下 47.4 度的雪原里,硬抗极寒自主暴走 13 万步。

2 月的春晚更是接连炸场。

几十台宇树 G1 和 H1 组团上来就是一套全自主集群武术表演。单脚连续空翻、两步蹬墙后空翻等动作全是全球首发,街舞圈看了都得直呼祖师爷赏饭吃。

到了 4 月,G1 又解锁了轮足混合形态,滑冰、轮滑、前空翻更是一气呵成。

而最离谱的剧情发生在刚刚过去一周。

一台 G1 竟然在韩国首尔曹溪寺受戒了。获赐法号「迦悲」,一跃成为全球首个带官方认证的机器人僧侣。师父给它定下的五戒之一极其硬核:

节约能源,不过度充电。

不停制造视觉奇观的背后,其实也有着一条极度清晰的商业逻辑。

要知道,今年 3 月份,宇树科技正式冲刺科创板上市,拟募资 42.02 亿元,在敲钟进度条还在加载的关键节点,宇树科技掏出 GD01 载人机甲,显然是为了进一步抬高上市估值的想象空间。

抛却所有的商业分析和参数对比,对于每一个从小看着科幻动画长大的人来说,当看到摇杆、座舱和机械臂真实组合在一起的那个瞬间,我们的脑子里只会剩下一个极其狂热的念头。

那就是坐进那个驾驶舱,握紧操作杆,然后中二且极其大声地喊出那句话:

我将以高达形态出击!

#欢迎关注爱范儿官方微信公众号:爱范儿(微信号:ifanr),更多精彩内容第一时间为您奉上。

❌