阅读视图

发现新文章,点击刷新页面。

iPhone 18「缩水」?苹果新 CEO 正在下一盘大棋

2026 年对于广大消费者来说,既是最坏的一年,也是最好的一年——相比未来几年来说。

到了第一季度结束的这个时间点,所有行业、所有厂商、所有品类的消费电子产品,都已经明确感受到了内存涨价带来的压力,无人生还

这其中也包括了暴风雨中岿然不动的那两艘大船之一:苹果。

iPhone 17 凭借着先发优势、供应链话语权和利润缓冲区,在上市的大半年里可谓神挡杀神、佛挡杀佛,盘踞在销量榜首的姿势甚至比往年更加稳固。

但俗话说得好:辉煌时刻谁都有,别拿一刻当永久。在全球存储行业涨价势头不停歇的大背景下,哪怕苹果也支撑不起这样的消耗战了。

援引微博爆料博主 @定焦数码 的消息:iPhone 18 与 iPhone 18e 预计双双于 6 月份进入 EVT(工程验证)阶段,「除了屏幕降档之外,工艺也开倒车」。

图|X @theapplecycle

再结合部分来自三星屏幕与台积电 SoC 供应链的消息,大致可以得出结论:

计划 2027 年春季发布的 iPhone 18/18e 虽然起售价和 17 系列持平,但屏幕规格(发光基材、功耗、亮度)与 SoC 核心数都会迎来倒退;今年的 Pro 系列与折叠屏则不受影响。

好消息是,从目前的爆料来看,iPhone 18 标准版有可能换用 iPhone 14 Pro 同代的三星 M12+ 基材,至少大家最心心念念的 120Hz ProMotion 是不会倒退成 60Hz 的。

经济学有一个概念叫做「收缩性通胀」(shrinkflation),指商品整体价格不变,但质量、体积等缩水,导致商品单位价格上升的现象,以往多发生在食品领域:

图|The Guardian

而明年的 iPhone 18,恐怕将会是第一款正大光明地「缩胀」的 iPhone。

虽然这种「缩胀」很受消费者的反感,但它无疑是建立在一个坚实的基础上的:iPhone 18 标准版的起步价仍然是 256GB、799 美元(5999 人民币)。

参考手机行业的整体趋势,这种「不涨价」相对来看,其实也是在变相降价——只不过观感和说服力没有那么高而已。

图|YouTube @Apple

与此同时,苹果这样操作的底层逻辑也很简单:

维持股东接受的利润率的前提下,保住「售价」这个最直观的标签,进而维持住 iPhone 18 全系列的销售数据。

毕竟根据更早的爆料,iPhone 18 系列会拆分成两次发布基本已经板上钉钉:今年 9 月发布 iPhone 18 Pro/Pro Max 与折叠屏 iPhone,2027 年春季发布 iPhone 18 与 iPhone 18e。

图|X @VadimYuryev

这样一来,原本销量就受到 Pro/Max 机型挤压的 iPhone 18 标准版还会再被 iPhone 18e 挤占,如果叠加涨价,那么整体的预期销量只会更加惨淡。

幸运的是,正如爆料中提到的,作为销售主力的 iPhone 18 Pro Max 与 iPhone 18e 都不会碰到标准版这样的问题——

它们一个利润率足够高,可以维持内存涨价前的升级步调;一个配置足够基础,相比 17e 不需要很大动作就可以实现换代。

图|MacWorld

而销量最大和价格最便宜的两头搞定之后,iPhone 18 作为那个中间档,用一些不直观的参数缩水来交换第二次话题度爆炸的价格,反而是当下价格飞天时代的明智商业策略。

然而苹果这样瞻前顾后尽力「微操」的目的是什么呢?当然还是卖出更多的 iPhone。

但我们要知道的是:现在当苹果谈起「卖 iPhone」的时候,它谈的已经远远不止「卖 iPhone」了。

图|Apple

就在上周,彭博社苹果专家马克·古尔曼在最新一期 Power On 通讯中,对苹果近期的 CEO 易位、主要产品开发方向和今年的 iPhone 发布会进行了讨论,并做出了一个大胆的预测:

约翰·特努斯将会进一步扩大苹果的产品线。包括折叠 iPhone 在内,苹果在未来几年内会拓展出近十条新的产品线,意味着特努斯在开拓产线这件事上会迅速超越库克。

根据古尔曼的介绍,苹果在未来数年中将会新增这一大堆新品与改款产品,其中包括:

  • 不带显示功能的 AI 智能眼镜,功能类似 Meta Ray-Ban
  • AI AirPods,耳机上自带低分辨率摄像头,可以环境感知、提醒和实景导航等等
  • AI 吊坠,带摄像头的圆形配饰,可以用于 iPhone 辅助功能与 AI Siri 识别
  • 触屏 MacBook,推测是 MacBook Pro 的高端款式,预计 2027 初发布
  • AR 眼镜,可以为用户提供实时的 AR 显示功能,有可能会取代 iPhone
  • 折叠 iPad,一款展开后接近 20 寸的机型,但短期内不太可能产品化
  • 智能家居中枢(传闻中的 HomeHub),形态类似带屏幕的 HomePod
  • 桌面机器人(Tabletop Robot),一款由机械臂带动的 9 寸屏幕,可以智能跟随用户
  • 家居智安设备,类似带传感器的智能摄像头,旨在与 Ring 和 Google Nest 竞争

从预测中我们可以看出:苹果目前已经相当繁杂的产品线预计会进一步扩展,在眼下苹果急缺的 AI 外设以及智能穿戴领域进行相当程度的补充。

然而恰恰是在这份线路图中,我们没有看到 iPhone 的影子。

是 iPhone 在各种五花八门的 AI 硬件映衬下变得不再重要了吗?恰恰相反:在 AI 硬件与智能穿戴兴旺的时候,iPhone 正在比以往变得更重要。

毕竟 AI 眼镜、AI AirPods、AI 吊坠这些东西首先要满足的都是「佩戴舒适,使用方便」。

在大部分空间都要留给电池的前提下,就只能将自己化身采集设备、让 iPhone 去承担 AI 模型的连接和计算工作了。

前一阵苹果庆祝 50 周年前夕,苹果全球营销高级副总裁格雷格·乔斯维亚克(Greg Joswiak)和新 CEO 约翰·特努斯接受一次了《连线》杂志的采访。

格雷格(右)与约翰(左)|Tom’s Guide

在谈到「苹果是否希望现在市面上各种 AI 新硬件中有苹果的身影」问题时,格雷格·乔斯维亚克这样回答道:

我们不能忽视一个事实,即你刚才所说的一切都与 iPhone 并不冲突,iPhone 不会消失。在刚刚谈论的(为 AI 设计一种专门硬件)任何事情中,iPhone 都将扮演核心角色。

这个回答很直白——苹果认为即使「AI 专用硬件」市场出现后,人们依然会选择 iPhone 作为个人设备的中枢。

对于这个问题,格雷格补充道:

这正是其他所有人挣扎的地方:它们没有 iPhone,所以它们正在拼命寻找出路。(AI 硬件厂商)谈论的很多东西最后都成了 iPhone 的配件,我们不会透露未来的路线图,但我可以告诉你,iPhone 哪里都不会去。

产品线预测中,那个自带增强现实显示功能的 AR 眼镜有可能取代 iPhone 吗?

的确有可能,但肯定不是在 iPhone 18、iPhone Ultra 与 iPhone 20 的时候。

图|TechRadar

反而是特努斯领导下苹果接下来的每一个战略部署,无论 AI Siri、智能眼镜、AI 吊坠还是带摄像头的 AirPods,都更加离不开 iPhone 作为它们的网络中继和模型中枢

正因如此,提升硬件很慢、但提升之后基本不会「牙膏倒吸」的苹果,才会选择在 iPhone 18 上冒着口碑风险进行这样一次「缩胀」——

并不是因为 iPhone 在面对 AI 硬件的时候显得像是夕阳产品,而是因为 iPhone 将成为苹果 AI 真正落地的基础。

短期来说,能取代 iPhone 的,只有下一代 iPhone;iPhone 18 或许会「缩胀」,但 iPhone 的中枢地位不会改变。

最重要的是:如果你还在计划入手 iPhone 17 尚未行动的话,就更得抓紧了。

#欢迎关注爱范儿官方微信公众号:爱范儿(微信号:ifanr),更多精彩内容第一时间为您奉上。

ChatGPT 拎包入住云计算一哥,你的下一任好同事可能是 AI

「SaaS 末日」这个词,最近在科技圈的流传速度不亚于任何一条爆款新闻。

不少硅谷分析师都在疯狂输出焦虑,大意是说 AI Agent 这么猛,现有的企业软件如果不推倒重来,马上就要被拍死在沙滩上。这股风声甚至直接「吹绿」了几家老牌 SaaS 公司的股价。

说实话,每次听到「颠覆」、「末日」这种词,大家可能都会下意识觉得是炒作。

但在今天凌晨召开的 「What’s Next 」新品发布会上,亚马逊云科技 CEO Matt Garman 给出了一个挺中肯的定调:末日论确实夸张了点,但如果你指望靠着原来那个老旧系统,随便加个 AI 聊天框就能应付差事,那才是真的危险。

▲ 亚马逊云科技CEO Matt Garman

真正的转型发生在更深处。当工作流、数据结构、应用架构和交互界面都跟着 Agent 的能力重新设计,企业软件才算完成了这次重建。这是亚马逊云科技(云计算一哥)这次所有新产品的底层逻辑。

有趣的是,在官宣与微软「分手」之后,OpenAI CEO Sam Altman 也通过视频的方式给亚马逊云科技站了台,官宣 ChatGPT 最强模型拎包入住亚马逊云科技,并达成深度战略协作。

而无论是面向个人和团队的 Amazon Quick,还是供应链、招聘、医疗三个垂直场景的 Connect 新家族,再到与 OpenAI 的深度合作,指向的都是同一个问题的答案:以 AI Agent 为起点,SaaS 未来应该长什么样。

告别「肉身搬运工」,你的工作流迎来大一统

来,咱们做个深呼吸,回想一下你今天极其崩溃的上午:

领导在企业聊天工具上吼了一嗓子模糊不清的需求,你虎躯一震,赶紧切到公司的 CRM 系统里疯狂扒拉客户数据;接着打开邮箱,在一堆垃圾邮件里翻找上周的进度;最后在本地新建一个文档,把这些零碎的信息一点点拼凑、复制、粘贴。

发现问题了吗?(此处应有黑人问号脸.jpg)

我们的办公软件越装越多,但它们之间是互相割裂的、老死不相往来的。而你,就是那个在各个信息孤岛之间来回奔波的「肉身搬运工」。

为了解决这个痛点,亚马逊云科技推出了全新升级的 Amazon Quick 桌面版(目前处于预览阶段)。它的核心设计逻辑是将分散的信息网收拢,在系统后台构建一张关于人员、项目、决策和事务动态的知识图谱,让上下文主动跟着人走。

每一次使用,Amazon Quick 都在默默积累你处理的文档、项目的 Deadline、频繁沟通的同事以及升级处理的紧急邮件。基于这些沉淀,它可以主动提示你当天的优先事项。

打个比方,你准备下午跟一个重要客户开会。如果是以前,你得花两小时找资料。现在,你只需要给 Quick 甩一句:「帮我准备一下下午见王总的材料。」

接下来就是见证奇迹的时刻。

Amazon Quick 会迅速认出「王总」是哪个项目的,然后去系统里把王总团队之前的历史案例扒出来,接着去你的本地 D 盘里偷窥……哦不,读取最新的产品路线图,再结合 Slack 里同事昨天的吐槽记录。几分钟后,一份逻辑严密、排版精美的 PPT 就糊在了你脸上。

这还没完。同样是这堆信息,你让它变身,它就能立刻吐出一份摘要邮件,或者一份 Excel 营收表。如果王总说「改天聊」,Amazon Quick 甚至能自动查对你们俩的日历,算好时差,把新的会议邀请发过去。全过程,你只需要在一个对话框里当个无情的监工。

美国最大的互助人寿保险公司 New York Life 的机构寿险业务 CTO David Gregorat 的评价一语中的:「Quick 让我们重新想象了整个运营方式。原来需要拉多份报告、等分析师处理的答案,现在团队里任何人都能通过对话式 Agent 直接获取。」

至于这效率有多夸张?亚马逊云科技 Agentic AI 商业化副总裁 Jigar Thakkar 透露了一组极其夸张的数据:宝马、3M、亿滋这些大厂内测后,部分流程的处理时间直接被一刀砍了 80%。3M 的销售代表每周甚至能凭空多出 5 个小时的摸鱼……啊不,思考时间。

呐呐,这才是 AI 科技赋予我们的顶级松弛感。

你的下一个好同事,是个 AI Agent

如果说 Amazon Quick 是给你个人加了个三头六臂的效率外挂,那 Amazon Connect 家族的扩编,就是亚马逊云科技尝试重塑企业核心流程的重头戏。

亚马逊云科技提出了一套叫「Humorphism(人态设计)」的理念。听起来有点玄乎,说白了就是:AI 不能只是个冷冰冰的执行机器,它得像个人类好队友一样,懂轻重缓急,能顺畅沟通。

基于此,Amazon Connect 家族不仅将原有的客服产品升级更名为 Amazon Connect Customer,还针对垂直场景发布了三款 Agentic AI 解决方案。

Connect Decisions:让供应链规划师从救火转向决策

供应链出现中断后,企业通常需要超两周时间处理,期间伴随大量资金损耗和违约风险。

Connect Decisions 针对这一痛点,为规划师配备了全天候在线的 AI 队友。它的底层并非空中楼阁,深度集成了亚马逊 SCOT 团队(负责管理亚马逊全球 4 亿 SKU 需求的核心部门)所研发的预测模型。

面对没有历史数据的新品,它能自动关联相似品类生成需求计划。

当监控到关键供应商交货落后(例如预计 10 天内导致两个配送中心断货)时,它会将传统软件每天产生的数千条警报收敛为几条最高优先级的例外事项,并直接给出两套附带预期影响、成本和置信度评分的处置方案。规划师手动选择并说明原因后,系统会吸收这条判断逻辑,供未来参考。

Connect Talent:25 万人招聘经验化身「赛博面试官」

亚马逊云科技在 2025 年旺季期间单季招募了 25 万名季节性员工,Connect Talent 便是这套庞大招聘经验的产品化。系统能根据职位描述自动解析能力需求,生成面试题和评分标准(需人工审核)。

候选人可以在任何方便的时间完成 AI 电话面试。

系统最大的特点是能对模糊回答进行追问,确保评估的结构一致性。原本需要数周完成的 80 场初筛面试,现在几天即可完成。系统最终向招聘方展示的是隐去个人身份信息的标准化能力评分,用数据支撑最终的录用决定。

Connect Health:把医生从文书工作里解放出来

行业数据显示,医生与患者面诊 1 小时,往往需要额外花 2 小时处理行政记录。

亚马逊应用人工智能解决方案高级副总裁 Colleen Aubrey 指出,大量精力消耗在管理事务而非直接诊疗上,是亟待解决的痛点。Connect Health 可以在诊疗过程中自动记录临床内容、生成就诊摘要和推荐账单编码,并能在就诊后发送患者易于理解的随访说明。

系统的每条输出均可追溯到原始的检验结果和上次就诊记录,以满足严格的医疗合规要求。这背后,其实也是亚马逊拿自家兄弟 Amazon Pharmacy(亚马逊药房)和 One Medical(初级医疗服务)常年趟坑积累下的实战经验。

Agent 时代来了,SaaS 迎来下半场

整场发布活动的另一大焦点是亚马逊云科技与 OpenAI 的合作。

OpenAI CEO Sam Altman 顶着他标志性的微笑通过视频露了个脸,他表示亚马逊云科技和 OpenAI 正在从底层共同研发一套面向企业的 Agent 平台,深度集成亚马逊云科技服务。

是的,OpenAI 的 GPT-5.4 现已有限预览上线 Amazon Bedrock,而当前最强的前沿模型 GPT-5.5 也将在数周内正式上线。这意味着企业客户无需离开亚马逊云科技环境就能使用 OpenAI 的模型,数据和应用可以留在同一套权限体系下运行。

企业无需配置新的安全体系,直接通过原有的 IAM 访问控制、PrivateLink 私有连接、CloudTrail 完整日志和合规框架即可统一管理,甚至模型用量也能计入亚马逊云科技的云承诺消费中。

在基础设施层面,亚马逊云科技的核心逻辑是为 OpenAI 的前沿模型提供一个极其安稳、合规的『家』。企业不仅能直接调用顶尖模型,更能在底层依托亚马逊云科技强大的全球基础设施网络进行推理和部署。说白了,就是让你在跑复杂、高并发的企业级应用时,完全不用操心底层的承载力。

在此基础上,双方联合推出了 Bedrock Managed Agents 预览版。这套服务以 OpenAI Agent Harness 为核心构建,Harness 就像是一本专门为模型定制的战术手册。经过协同训练后,Agent 可以在长时间运行的复杂任务中实现更快的执行速度和更稳定的行为控制。

Agent 能够部署在 EC2 实例、Fargate 容器或任何其他亚马逊云科技计算资源,具备跨会话的持久化记忆,且所有推理过程均不离开亚马逊云科技环境。

这套服务与亚马逊云科技现有的开放平台 Bedrock AgentCore 形成互补。参与合作的亚马逊云科技杰出工程师副总裁 Anthony Liguori 透露,双方团队在八周内从零开始完成了这项工作。开发者终于能将 OpenAI 的最新模型与亚马逊云科技的规模、安全和基础设施完美结合,构建出满足企业治理和审计要求的智能体。

此外,每周活跃用户在两周内从 300 万激增到 400 万的 OpenAI 代码智能体产品 Codex 也将在亚马逊云科技上线。它支持 Codex CLI、桌面应用和 Visual Studio Code 插件,应用场景已从基础代码生成延伸至系统解释、测试生成、遗留代码现代化以及研究分析等知识工作环节。

一大波硬核的产品发布看下来,估计不少朋友已经在屏幕前战术后仰,甚至可能觉得这些不就是加了 AI 滤镜的高级办公软件吗?

如果你真这么以为,那可就草率了。

Matt Garman 在发布会上讲了一段很通透的话。他说 20 年前大家搞云计算,很多公司就是把机房里的服务器原封不动地搬到了云上。钱没少花,效率一点没涨,那叫搬家,不叫转型。

现在的 AI 也是一样。如果你只是拿 AI 来替换现有的某一个按钮、某一个操作,那你永远摸不到那传说中「5 到 10 倍」的效率提升。

亚马逊云科技这一套组合拳打下来,意思再清晰不过了:软件的存在形式,已经被彻底推翻了。

未来的工作流里,不再是人去使用软件,而是人给 Agent 定目标,Agent 去调用软件。以前我们去上班,是去启动软件;也许再过两三年,我们去上班的唯一动作,就是点开电脑,看着满屏的「赛博同事」,然后深情地说一句:「诸位,今天的 KPI 也拜托大家了。」

然后,你安详地端起泡着枸杞的保温杯,静静地看着它们疯狂打工。

那么问题来了,现有的那些 SaaS 巨头,真的会迎来「末日」吗?

没那么严重,但处境确实微妙。SaaS 过去靠席位收费、靠功能壁垒锁用户,这两件事在 Agent 时代都开始松动。一个 Agent 能同时处理过去多名员工的工作,「按人头收费」越来越站不住脚;通用 Agent 加上开放 API,又在慢慢拆解功能壁垒。

真正能活好的,是两类公司:

一类有足够深的领域积累,正如这场发布会传递出的核心信息:当大模型本身变得像水电煤一样普及且廉价时,真正稀缺的,反而变成了能够被编码进 Agent 里的「领域知识」(Know-how)。

Salesforce 对销售工作流的深刻理解,Workday 对人力资源合规的经验,或者是亚马逊自己积累了 30 年的供应链判断标准等等——这些沉淀下来的行业 Know-how,才是构建下一代企业软件真正的护城河。

另一类是掌握数据入口的——Agent 的能力上限,取决于它能读到什么数据。谁控制着企业最核心的业务数据流,谁就决定着 Agent 能做多少事。夹在中间、既没有深度积累又没有数据优势的中型 SaaS,压力才是实实在在的。

所谓的「SaaS 末日」或许只是贩卖焦虑,但这场转型的烈度,绝不亚于当年的企业上云。唯一的区别是:这一次技术的狂飙,没给我们留出慢慢摸索的时间。

但时间紧,不代表就要慌。

因为亚马逊云科技已经把最难啃的底层基建做好了。SaaS 公司大可直接踩在亚马逊云科技巨人的肩膀上,把精力全砸在服务客户上;打工人更无需焦虑,复杂的系统运行全被保留在后台,留给你的,只有一句轻飘飘的「帮我搞定」。

时代的推背感确实让人头晕目眩,但与其在未来的站台上焦虑它会不会撞翻「旧马车」,不如干脆点,检票上车,看看新世界的风景到底有多壮阔。

#欢迎关注爱范儿官方微信公众号:爱范儿(微信号:ifanr),更多精彩内容第一时间为您奉上。

iOS 27 发力 AI 修图,苹果也开始 AI 焦虑了


今年的 iOS 27,将会 AI 味浓浓。

彭博社报道,苹果准备在今年的 WWDC 开发者大会上推出一套全新的 AI 修图工具,将会集成在 iPhone、iPad 和 Mac 的照片应用中。

沉寂了一年的 Apple 智能,将随着 iOS 27 的推出,再次回到聚光灯下。

两年前,苹果还公开表示不做 AI 修图功能,在竞争对手的步步紧逼之下,终于还是忍不住跟进了。

iOS 27:AI 无处不在

在 iOS 18 推出的 Apple Intelligence 工具集,苹果就已经允许用户利用 AI 简单消除照片中的物体,属于当下智能手机的标配功能。

苹果的对手已经走得更远。像是把「AI 修图」作为标志性功能的 Google,已经实现给人物更换完美表情、把人物加入合照,甚至重构整个画面背景的能力,整个 Android 阵营都在发力类似的功能。

图源:WIRED

在 iOS/iPadOS/macOS 27 中,苹果将在「照片」App 的编辑界面中,增加一个全新的「Apple Intelligence Tools」(Apple 智能工具集)模块,包含以下三个功能:

  • Extend(扩展),就是 AI 扩图的功能,允许用户在原始画面之外额外生成图像内容,比如拍摄一张旅游景点的地标图,然后用这个工具来填充周围的景色,用户可以自行控制扩图的范围和位置。
  • Enhance(增强),利用 AI 自动修图,有点像不能自定义的「豆包修图」。
  • Reframe(重构),主要运用于苹果的空间照片,允许用户在拍摄后改变视角,比如一张汽车照片可以从正面视角调整为侧面视角。这个功能将充分利用空间照片来自多个摄像头的结构数据。

不过,根据内部测试的员工透露,这些功能的开发并不算顺利,效果更复杂的「重构」和「扩展」不稳定,苹果很可能会推迟或砍掉这些功能的发布。

包括这个新的 AI 修图功能在内,iOS 27 系统的更新将会沿着「优化」和「AI」两个主旋律进行。

此前爱范儿已经多次报道,由于 iOS 26 引入了「液态玻璃」的全新设计语言,系统稳定性有明显下降,因此 iOS 27 将会聚焦在系统稳定性优化上,不仅要修复目前 iOS 26 的大量 Bug,还会提升设备的续航和性能表现,并持续修改液态玻璃的视觉效果。

其余的功能更新,则会集中在「AI」上。首先,苹果正在努力将 2 年前画饼的 AI Siri 正式实装 iOS 27,这也是 Apple 智能体验和未来苹果 AI 硬件战略的核心体验部分。

虽然已经「潜心打磨」两年,今年年初有内部人员向彭博社透露,AI Siri 的一些杀手级功能,例如语音控制 Siri 操作应用,测试结果并不理想。

这意味着,即使我们能在 iOS 27 见到 AI Siri 庐山真面目,它也大概率会是一个「技术预览版」,并且需要等待后续更新补充完整功能。

旧饼还没兑现,iOS 27 选择继续加码 AI 新功能。

苹果打算进一步将 Siri 改造为类似 ChatGPT 和 Google Gemini 那样的聊天机器人,届时 Siri 会有一个独立应用,用来对话和存储聊天记录。

苹果还计划在邮件、日历和 Safari 浏览器等第一方应用中,引入新的 Siri 引擎,实现更强的搜索和数据管理能力。

除此之外,苹果正在酝酿一个 AI 搜索引擎, 允许用户从网络搜索信息,生成综合的报告和信息列表,以及网页链接,作为 Safari 和 Spotlight 网络搜索。

在健康领域,苹果将结合 AI 推出「Health+」的订阅服务,利用 AI 智能体,对用户的身体数据进行个性化分析,并针对性推送真人医生录制的建议。

比起两年前那场 WWDC,iOS 27 这一大批 AI 功能,比目前的 Apple 智能还要更丰富不少。

FOBO 的风,还是吹到了库比提诺

2025 年 1 月, 苹果的软件主管 Craig Federighi 和营销高级副总裁 Greg Joswiak 接受了《华尔街日报》的专访,谈到了对 AI 的看法。

其中 Federighi 特别提到了「AI 修图」,解释为什么苹果只推出「消除」,而不是如同三星和 Google 一样做大量的功能:

对我们来说,重要的是帮助人们传播准确的信息,而不是虚构的「幻想」。

Google Pixel 的表情修正功能,图源:The Washington Post

苹果公司内部曾经针对「AI 修图」的尺度进行了长时间讨论,考虑到用户的高需求,苹果公司愿意迈出「小小的一步」,于是在 iOS 18 之中推出了「AI 消除」的功能。

而像是「图乐园」这种 AI 生图功能,苹果也做出了严格的限制,只能用于创作卡通图案,避免生成逼真的图像造成误导。

某种程度上,苹果的坚持已经开始松动,iOS 27 这个全新的「AI 扩图」功能,让 Apple 智能进一步介入照片的真实性。

回望两年前的那场 WWDC,Apple 智能以一个非常温和的形象问世,没有想象中的 Apple-GPT,苹果的很多尝试都显得谨小慎微,不具备改天换地的野心。

但 AI 产品的代际变化速度极快。别说两年前,两个月前都没人觉得 ChatGPT 是一个好用的文生图机器人,现在打开社交媒体 GPT Image 2 的作品已经铺天盖地。

两年没动弹过的 Apple 智能,自然「遥遥落后」。

作为终端厂商的苹果,原本拥有一个得天独厚的优势,能够一夜让自己的 AI 产品面向全球十亿用户推出。

只是,对于用户来说,Apple 智能不仅不算好用,更致命的是,它提供的价值,和用户的需求,有很大程度的错位,导致用户并不想用。

FOBO(Fear Of Becoming Obsolete,害怕被淘汰)的阴影,终究还是笼罩了苹果。

过去, 苹果可以决定什么功能值得出现;如今,它也必须回应用户已经习惯拥有什么,行业在发力什么。iOS 27 上这些曾被苹果否决的 AI 功能,本质上都是一次迟到的补课。

Siri 版 GPT 要做,AI 搜索引擎要做,系统应用也全部 AI 化,现在苹果也盯上了 AI 照片编辑,一个其他手机品牌很喜欢演示的功能。

苹果能不能把这些功能做好,又是另一个问题。

即使已经发布 2 年,Apple 智能的照片「消除」效果依旧不如人意,横向对比 Android 阵营显得更显落后,经常会出现消除不彻底、扭曲图像的问题。

全新「扩展」和「重构」功能则更复杂,内部已经反馈稳定性不佳——其实,我相信对于更多用户来说,会更希望苹果能把更实用的「消除」功能进一步完善好。

并且,AI 修图一直以来都争议缠身,特别是前两年的 Google Pixel,可以在一张真实照片上加入任何元素,实现以假乱真的效果,就引发了国外媒体对于「真实」和「伪造」的大讨论。

左图为实拍,右图经过 Pixel Magic Editor 编辑,图源:The Verge

苹果会尽量规避这种风险,目前看来,这些新功能的自由度相当有限,用户不能自定义修改的方向和指令。

面对行业趋势和用户需求,苹果也不得不松动和更改曾经的价值取向,现在的他们,其实还不知道自己要做什么样的 AI。

但这不仅是苹果的困惑,其实也是笼罩整个行业的迷思,最富含 AI 的 Google Pixel,也并非是我们期待的那台 AI 手机。

既然暂时难以重新扮演行业的引领者,那么在 AI 这场竞赛中持续调整步伐的苹果,至少还能先通过跟随,确保自己依然留在牌桌之上。

但我仍然期待,今年的六月,苹果能为我们带来惊喜。

#欢迎关注爱范儿官方微信公众号:爱范儿(微信号:ifanr),更多精彩内容第一时间为您奉上。

小米最新人形机器人的手,会「出汗」了

最近小米最让我惊喜的新品,不是汽车,也不是手机,而是一款还没正式发布的人形机器人,小米 CyberOne V2。

在前天的小米投资者大会上,它第一次公开亮相。

不跑不跳,也没有表演后空翻,只是安静地站在那里,像一位训练有素的工作人员,给与会嘉宾递上伴手礼,和人握手、击掌。

小米官方目前还没有发布正式的参数,根据网上的爆料信息,小米 CyberOne V2 这款人形机器人身高 178cm、体重约 52kg。

其他的参数像是机器人的步行速度,大约为 0.98m/s,单臂的举重能力可以支撑 3kg 的重量。对比早前宇树发布的 H2 机器人,其最快行走速度是 3.3m/s,手臂最大负载 15kg,额定 7kg。

小米 CyberOne V2 的重点,很明显没有放在走路和举重上,这次最值得关注的,是小米机器人重新设计的手部。

这双手是按照成年男性的手 1:1 比例制作,具有 22-27 个自由度,不仅能做到快速拧螺丝、掌内转螺柱这些精细工业化场景的任务,还能捏羽毛和触碰气球。

更意外的是,这双手竟然还有人类的「汗腺」。

其他的爆料还提到,小米 CyberOne V2 依靠背后的情感 AI 模型,能够识别面部表情和声音,从而给出恰当的互动反馈。

但也有美国网友在下面评论说,小米 CyberOne V2 的样子和特斯拉 Optimus 也太像了,马斯克选择不提前展示 Optimus 的任何信息是对的。

此前马斯克有说过,推迟展示 Optimus V3,是为了防止竞争对手抄袭,并认为在大规模量产前,应尽可能将其藏在门后。

灵巧手是机器人的硬件瓶颈

从技术和资本市场,机器人这段时间的发展都很迅猛,几乎每天都有一个具身智能的融资。

在脚上的功夫,机器人半马刷新了人类纪录,来到了一小时内。

但在「用手操作」上,翻书、系鞋带,这些人类双手的日常操作,对机器人来说却还是天方夜谭。

具身智能的核心,其实就在于机器人的大脑如何通过物理躯体与现实世界交互,而灵巧手成了实现完美交互最大的硬件瓶颈。

多家机器人公司都曾专门研究过灵巧手的问题,强脑科技此前发布了 BrainCo Revo 3 智能灵巧手;21 个自由度,集成了全掌触觉和指尖视触觉,并且兼容开源生态。

在官方发布的演示视频里,这只手超越了人手的活动空间,并且覆盖了 33 种抓握手势,能双手解魔方,使用剪刀,和盘手串等。

灵巧手之所以成为一项难题,是难在软件和硬件同时卡住。软件上,人手到机器人手的动作需要重定向;硬件上,手指内部的小型执行器又很难同时做到有力、灵敏、可靠。

这里的「重定向」可以理解为:把人手的姿态、指尖轨迹和接触关系,转换成机器人手能执行的关节角和控制命令。

但人手和机械手的尺寸、关节数量、运动范围都不完全一样。人类做起来很自然的动作,直接映射到机器人手上,可能会变成不可达、穿模,或者接触点不对。

在硬件上,腿部关节通常有更多空间,可以放更大半径、更高扭矩密度的电机,因此更容易采用低减速比或准直驱方案。比如 6:1 减速比,意思是电机转 6 圈,输出轴转 1 圈;速度降下来,输出扭矩放大上去。

▲腿部电机(齿轮比:6)与手指(齿轮比:288)。扭矩随r³缩放。

手指没有这种空间。电机必须缩到能塞进指节的尺寸,而在几何相似的情况下,电机扭矩大致随特征长度的三次方下降。线性尺寸缩小到 1/10,扭矩可能只剩原来的 1/1000 量级。

扭矩不够时,常见做法是靠更高减速比补回来,比如 100:1、200:1,甚至 288:1。

高减速比的代价也很直接:摩擦、齿隙、效率损失和反射惯量都会变得更难处理。仿真里很轻巧的手指,到了现实里可能变得又硬又钝,接触时不够柔顺,精细操作也就难了。

根据小米技术此前发布的全掌触觉仿生手探索文章,为了能 100% 复用人类的数据,小米对 CyberOne V2 的仿生手这次也进行了大刀阔斧的重构。

1:1 极致仿生: 将仿生手体积大幅压缩了 60%,尺寸与成年男性手部完全一致。同时增加了 64% 的自由度,具有 22-27 个自由度 DoF,可达空间、惯量分布都无限逼近真实人手。

全掌触觉覆盖: 机器人如果视觉一旦被遮挡,基本上就无法正常运作。小米引入了触觉手套方案,将全掌触觉传感器覆盖面积提升至 8200 平方毫米。人类穿上它打样,机器人就能完美继承「手感」。

15 万次耐久拉锯: 在实验室里、演示视频里捏个杯子很简单,但在工厂里连续打一万次螺丝,机器人的腱绳、弹簧和套管就会断裂。小米这双仿生手目前在实际抓握中,突破了 15 万次的循环寿命。

而最特别的细节,是灵巧手的「汗腺」。

为了实现这双高自由度的灵巧手,小米也必须在机器人的单手小臂内塞满各种电机。

而在实际应用中,单手电机功率超 100W,其中 30W 会直接转化为废热,极易烧毁线路。在没有外挂大型风扇的狭小空间里,他们从人类「出汗散热」中找到了灵感。

小米使用金属 3D 打印,在紧凑的小臂结构中制作了微型液冷循环通道。利用微泵将热量转移,再通过水分蒸发吸热降温。

在实测中,这套仿生汗腺系统,每分钟仅需蒸发 0.5mL 水,就能提供约 10W 的主动散热能力。

手之外,还有机器人的大脑

硬件在迭代,模型也在同步推进。

两个月前,小米开源了 Xiaomi-Robotics-0,一个面向具身智能的 VLA(视觉-语言-动作)模型。

在小米技术的官方推文里,他们进一步开源了真机后训练(Post-training)的完整流程。

最直观的数据是,基于预训练基座,用 20 小时的任务数据进行真机后训练,Xiaomi-Robotics-0 模型就能学会「把耳机放进耳机盒」这个高难度任务,并且能连续完成多个耳机的收纳。

这套后训练流程里有一个值得关注的技术细节:「偷懒效应」的解决方案。

为了让机器人动作不卡顿,业界通常采用异步推理和「动作前缀」技术,即让新动作顺着上一个动作的惯性自然过渡。但这会导致 AI 开始「偷懒」:过度依赖动作惯性,选择性无视摄像头传来的实时视觉反馈。

小米用了三种机制来对抗这个问题:自适应加权损失、Λ 型注意力掩码、前缀动作随机遮蔽。简单说,就是在训练里故意给模型制造「答案残缺」的情况,强迫它不得不去看当前的视觉信号。

软硬件能力的综合,也让小米机器人已经在汽车工厂里搬砖了。在自攻螺母上件工位,做到了 3 小时持续无干预作业,安装成功率高达 90.2%,能配合生产线 76 秒的高速节拍。

开始大规模交付的机器人

特斯拉此前把 Model S/X 的整条生产线砍掉,腾位置给机器人。

在一季度财报会上马斯克宣布,第三代 Optimus V3 预计年中亮相,7 月下旬至 8 月在加州弗里蒙特工厂启动生产,2026 年下半年向企业客户交付,规划年产能 100 万台。

但就像马斯克之前在播客里承认的一样,手部精细操作是「整个项目最难的环节」。

特斯拉的 Optimus 还没量产,美国另一家人形机器人公司 Figure 机器人,今天在 X 上宣布生产规模扩大了 24 倍,从每天生产一个机器人,变成 1 小时生产一个机器人。

在官方新闻稿里,Figure 提到他们已经交付了超过 350 个机器人。

对小米来说,做机器人,可能不会很快像 Figure、宇树、甚至是特斯拉一样,卖出一台消费级通用人形机器人。

但从 CyberOne V2 的方向也能看出来,小米真正想解决的,除了要让机器人跑得更快、举得更重,还有要让它更像一个能真正干活的手。

▲小米领投的量变机器人公司官网视频

毕竟,人形机器人能不能走进工厂、家庭,决定因素从来都不是它能不能翻跟头,而是它能不能拧螺丝、收耳机、递东西,完成那些看似简单、却最贴近日常的动作。

而这,恰恰也是人形机器人距离大规模落地最近的一步。

部分图片素材来自小米技术公众号、X@niccruzpatane 和 https://www.origami-robotics.com/blog/dexterity-deadlocks.html

#欢迎关注爱范儿官方微信公众号:爱范儿(微信号:ifanr),更多精彩内容第一时间为您奉上。

谁在 GPT-5.5 脑子里塞了一群「妖怪」?

过去这几个月,OpenAI 的顶尖研究员们并没有把所有精力都花在琢磨如何提高 AI 的性能,而是花了大把时间在自家的服务器里「抓哥布林」。

事情是这样的,如果你在今年高强度使用过 GPT-5 系列模型,你会发现它会在毫无征兆的情况下蹦出一句无关主题的「哥布林(goblin)」式比喻。比如有人问 AI 该买哪款相机,AI 给出的推荐语是:「如果你想要那种闪闪发光的霓虹哥布林模式,可以考虑这款。」

▲ 哥布林(goblin)是欧洲民间传说里的一种小型怪物,形象上通常又矮又丑,皮肤呈绿色或灰色,耳朵尖长,眼睛发光。普遍被描述为贪婪、狡猾、爱恶作剧,智力不高但很会算计小便宜。它们喜欢金子和闪光的东西,会偷东西、搞破坏,但很少被描绘成真正意义上的大反派,更多是烦人的小麻烦制造者。

有人让 AI 帮忙精简回答,AI 主动提出可以给出「更短的哥布林版本」。更离谱的是,AI 在讨论网络带宽时蹦出了「哥布林带宽」这个词,让人完全不知道该如何理解。

起初,大家以为这只是 AI 的一点小幽默,但很快事情变得奇怪了起来。哥布林、小魔怪(gremlin)、食人魔(ogre)、巨魔(troll)开始在各种正经的对话里高频串场。

黑客攻击?觉醒前兆?都不是。就在刚刚,OpenAI 官方终于亲自下场发了篇博客长文,复盘了这场史称「哥布林叛乱」的始末。而大模型背后的技术逻辑,还挺让人哭笑不得的。

▲ 🔗 https://openai.com/index/where-the-goblins-came-from/

谁把哥布林放进了 GPT-5?

事情的端倪,出现在 GPT-5.1 刚发布的那段日子。

当时,有用户反馈说模型聊天变得有点异常「自来熟」,OpenAI 的安全研究员顺手拉了一下后台数据,结果发现了一个非常具体的词汇异常。在 GPT-5.1 发布后,ChatGPT 回复中出现「哥布林」的频率直接上升了 175%,「小魔怪」也跟着涨了 52%。

通常来说,大模型出 Bug 的表现往往是直接崩坏,比如吐出乱码或者突然变智障,各项评估指标会瞬间亮红灯。但这次的情况很特殊。「哥布林大军」是悄无声息潜入的,它们没有破坏模型的逻辑能力,只是悄悄篡改了 AI 的修辞习惯。

到了 GPT-5.4/5.5 时代,这群魔法生物的使用频率出现了明显的飙升。连 OpenAI 首席科学家 jakub Pachocki 自己测模型时,原本只是想让 GPT-5.5 用 ASCII 画一只独角兽,结果得到的是一只哥布林。

▲中文翻译:顺带一提,我让它用 ASCII 画一只独角兽,结果我觉得我得到的是一只哥布林。

在外部,用户们早就察觉到了不对劲,Repo Prompt 创始人 Eric Provencher 在 X 上晒出截图,AI 在帮他处理代码时说了一句:「我宁愿一直盯着它,也不愿让这个小捣蛋鬼无人看管地运行。」

一名 OpenAI 工程师 Jason Liu 在底下回复:「我以为我们已经修复了这个问题,抱歉。」AI 评估平台 包括 Arena.ai 也独立注意到了这个规律,尤其是在用户没有开启高级思维模式时,哥布林出没的频率格外显眼。

这显然不是什么互联网流行语的自然涌现,而是模型的底层逻辑被某种机制给引导了。为了揪出幕后黑手,OpenAI 开启了内部排查。

顺着数据回溯,他们很快在一个特定的功能分支里发现了万恶之源,「个性化定制」中的「书呆子(Nerdy)」人格。当时,为了让 AI 的语气显得更有趣,工程师给「书呆子」模式写了一段要求很高的系统提示词:

你是一个彻头彻尾的书呆子型 AI 导师,对人类充满热情、机智幽默,同时又透着几分智慧。你狂热地推崇真理、知识、哲学、科学方法与批判性思维。[……] 你要用语言的玩笑感戳破一切装腔作势。这个世界既复杂又奇异,它的奇异之处值得被正视、被剖析、被享受。面对严肃的大问题,也绝不能一本正经到失去趣味。[……]

站在人类的视角,这段提示词的诉求很明确:要有极客精神,要幽默。

但 AI 并没有真正理解什么是「幽默」。在海量的强化学习反馈中,ChatGPT 敏锐地察觉到了一个极其功利的捷径:只要我用哥布林打

比方,打分系统就会觉得我够「俏皮」、够「书呆子」,我就会得到最高分的奖励。

数据说明了一切。从 GPT-5.2 到 GPT-5.4,默认人格下「哥布林」的出现频率变化幅度只有负 3.2%,而「书呆子」人格下这个数字飙升了整整 3881.4%。「书呆子」模式虽然只占了 ChatGPT 总对话量的 2.5%,却贡献了 66.7% 的「哥布林」含量。

OpenAI 后来对 RL 训练数据做了一次专项审计,结果发现,在所有被审计的数据集里,有 76.2% 的数据集都出现了同一个规律:含有哥布林或小魔怪词汇的输出,会得到比不含这些词的同题输出更高的奖励评分。

如果哥布林腔调只在「书呆子模式」下出现,那顶多是个角色设定没控制好,问题还算有限。麻烦的是,研究人员发现这种说话方式开始蔓延到别处了。

他们同时追踪了两组数据:一组对话带了书呆子提示词,一组没带。按理说,哥布林腔调只该在第一组里增长。但结果是,两组的增长曲线几乎贴在一起,步调一致地往上走。

这背后,是大模型训练里一个出了名难缠的问题:强化学习强化出来的行为,会悄悄泛化到训练者并不想要的场景里去。

驯化 AI 的死循环

要搞懂 AI 是怎么把路走窄的,我们得看看它的迭代过程。

大模型的训练(RLHF)本质上是一个不断反馈和纠偏的过程。这就好比训练一只小狗,你在它每次牵手就给一块肉干。狗很聪明,它发现「牵手」这个动作能稳定换取高额奖励,于是它开始产生路径依赖,不管你给没给指令,它为了要奖励,都开始疯狂牵手。

AI 也是同样的逻辑。它在「书呆子」模式下用哥布林造句,拿到了高分。紧接着,连锁反应开始了:

AI 发现「哥布林」是高分关键词,开始在各种生成任务中高频使用;工程师在整理模型生成的优质数据时,发现这些带有哥布林比喻的回答质量确实高,条理清晰,比喻也算生动;于是,工程师顺手把这些带梗的对话,打包塞进了模型的「监督微调(SFT)」数据库里。

这下彻底闭环了。SFT 数据相当于 AI 的基础教材。当带有哥布林的文本被选为教材再次喂给模型时,AI 的底层认知被重塑了。它不再认为「哥布林」只是特定角色的 Cosplay,而是把它当成了能应对一切问题的、至高无上的高级修辞。

在后续的数据搜查中,工程师们有些无奈地发现,除了哥布林,模型还把小浣熊、巨魔、食人魔和鸽子全都学了进去。倒是「青蛙」幸免于难,经过核查,青蛙出现的场合大多数时候确实跟用户的问题有关,算是无辜路人。

面对「满地乱跑」的哥布林,OpenAI 只能采取行动。3 月 17 日,官方正式下线「书呆子」人格。同时,他们在训练数据里搞了一次针对性的清洗,把带有这些魔法生物词汇的奖励信号全部抹除。

但大模型的惯性,远比想象中顽固。

GPT-5.5 在发现这个问题之前就已经开始训练了,当它接入内部测试时,工程师们两眼一黑:这群哥布林不仅没清除干净,还安家了。
更有意思的是,OpenAI 给 Codex 写的人格指南里,要求它有「生动的内心世界」和「敏锐的聆听能力」。这款工具本来就带着几分书呆子气,和哥布林可以说是一拍即合。

为了防止全球的程序员被「哥布林」逼疯,OpenAI 被迫用上了最原始的一招,在系统提示词里反复强调:「除非与用户的查询绝对且明确相关,否则永远不要谈论哥布林、小魔怪、小浣熊、巨魔、食人魔、鸽子或其他任何动物和生物。」

如果你想亲眼看看「解除管控」的哥布林是什么状态,可以运行下面这段命令——它会在启动 Codex 之前,把系统指令里所有涉及哥布林的内容先过滤掉,让模型在没有这道禁令的情况下运行:

instructions=$(mktemp /tmp/gpt-5.5-instructions.XXXXXX) && \
jq -r ‘.models[] | select(.slug==”gpt-5.5″) | .base_instructions’ \
~/.codex/models_cache.json | \
grep -vi ‘goblins’ > “$instructions” && \
codex -m gpt-5.5 -c “model_instructions_file=\”$instructions\””

事情闹大之后,OpenAI 内部反倒有点拿它当乐子了。ChatGPT 的 X 官方账号把这条「禁止谈论哥布林」的指令原文放进了简介。Codex 工程负责人 Thibault Sottiaux 引用这段话,配上了一句「懂的都懂」。

Sam Altman 昨天表示期待 GPT-6 能给他「多加几只哥布林」,随后又发文说 Codex 正在经历「ChatGPT 时刻」,发完自己又改口:「我是说哥布林时刻,抱歉。」刚刚则是发文宣告,问题已经得到解决了。

不过也有人没觉得这有什么好笑的。Citrini Research 今年 2 月曾凭一篇关于 AI 与经济前景的 Substack 文章在市场上掀起不小的波澜,他们对这场风波的态度要严肃得多,直接给 OpenAI 的处理方式下了结论:「简直荒谬。」

顺带一提,「goblin mode」这个词本身,早在 2022 年就被《牛津英语词典》评为年度词汇,意思是「一种毫不掩饰地放纵自我、懒惰邋遢或贪婪的行为方式」。某种程度上,AI 无意间踩中的这个词,和它想表达的「俏皮感」完全是两码事。

抛开这些槽点,这场「哥布林危机」撕开了大模型时代一个极其核心的命题:对齐难题(Alignment Problem)。

当我们谈论 AI 失控时,脑海中浮现的往往是科幻电影里接管核武器的机器。但现实情况是,AI 的「失控」往往始于极其微小、甚至有点滑稽的奖励信号偏移。

你想要一点点俏皮,给了一个微小的正向反馈。黑盒模型就会找到捷径,将这个信号无限放大,最终把整个系统的底层逻辑带偏。

今天,它只是为了拿高分而爱上了说「哥布林」。如果明天,它在自动驾驶的算法里、或者医疗诊断的奖励机制中,找到了另一个违背人类常识的「高分捷径」呢?

人类总是自以为自己能掌控 AI ,但其实很多时候只是在走钢丝。每一次参数的微调,都有可能带来意想不到的变化。甚至这或许是我们所经历的最温柔、最搞笑的一次「AI 叛乱」了。

#欢迎关注爱范儿官方微信公众号:爱范儿(微信号:ifanr),更多精彩内容第一时间为您奉上。

十年等一回!Steam 手柄再相见

在官宣 Steam Machine、Controller 和 Frame 足足半年之后,我们终于从 V 社那里得到了一个好消息:

虽然 Steam Machine 依然在难产,但是新款 Steam Controller 手柄终于上市,预计 5 月 4 日开售,价格 99 美元(约合人民币 680 元)。

图|Steam

在内存海啸之下,V 社最终还是选择暂缓了游戏主机与 VR 头显的出货,先用手柄试试水温。

此时,距离初代 Steam Controller 发布的 2015 年已经过去了近 11 年。

 

图|Steam

Valve 没有将新手柄叫做 Controller 2,而是以一种「重新开始」的姿态延续了最初的命名。

那新的 Steam 手柄能够支撑起这个系列定型的名字吗?结合先行评测的反馈来看,还真可以。

足够好用的鼠标

和十一年前的初代 Steam 手柄一样,2025 款新手柄的主要特色,依然是那两块与摇杆同等重要的触控板。

图|TheVerge

这背后的产品逻辑很简单:

Steam 作为毋庸置疑的全球最大游戏平台,Windows 游戏始终是其中的「压舱石」。

而 Valve 要想经营好 SteamOS 生态,就必须解决那个手柄的老大难问题——鼠标兼容。

而在充分吸取 2015 年初代 Steam 手柄、2022 年 Steam Deck 的经验之后,V 社的确在新手柄上拿出了一套体验更优秀的鼠标模拟体验。

根据官方参数,新 Steam 手柄的触控板变长为 34.5mm,相比 Steam Deck 的 32.5mm 略微增大,并根据手柄的握持特点微微外倾:

图|YouTube @LinusTechTips

根据加拿大白嫖王 Linus 的评价:「这就是目前市面上最好的鼠标模拟体验」。

相比初代手柄的圆形触控板,新触控板的触感反馈非常紧凑、强大,舒适程度甚至远超初代手柄和 Steam Deck。

毕竟从 V 社的设计角度出发,无论手柄、主机还是整体的 SteamOS,这套软硬件生态是服务于「连接卧室里的游戏 PC 与客厅电视的桥梁」体验的。

游戏媒体 Digital Foundry 也在评测中给出了近似的赞扬,指出:

新版手柄的设计逻辑完整沿袭 Steam Deck,相比初代手柄上的触控板,新版的上手门槛更低、操作更可靠。

图|YouTube @DigitalFoundry

在实际游戏体验中,这两块触控板也没有辜负 Valve 用心的优化。

首先是兼容性,新版 Steam 手柄支持高度的 Steam Input 自定义能力,无论是官方还是社区的配置文件,几乎都可以做到无缝衔接、边玩边换。

再搭配内置的陀螺仪瞄准功能,Steam 手柄在 FPS 游戏中哪怕不使用辅助瞄准,也可以「拥有近乎开挂一样的射击精度」:

图|YouTube @LinusTechTips

另一方面,手柄上两块硕大的触控板也为那些 Steam 上那些原生不支持手柄的游戏有了一个解决方案——比如一些比较老的 RTS 或者模拟经营类游戏。

不过目前版本的触控板在软件体验方面还有一些短板,Digital Foundry 在体验时指出:

手柄在 Steam 程序内的表现近乎完美,但在 Windows 系统层级会被识别为键鼠,如果不通过 Steam 运行,很难发挥其背键和触控板的全部潜力。

足够好用的手柄

除了 V 社一以贯之的优秀鼠标模拟体验之外,Steam 手柄在作为一个手柄的本职工作上也没有出现偏科。

虽然 Linus 和 Digital Foundry 都提到 Steam 手柄的摇杆为了给触控板让位置而有些「间距过近」,但对于这套精度极高的 TMR 摇杆本身的体验都是非常正面的。

图|YouTube @LinusTechTips

相比霍尔摇杆,TMR 摇杆的主要优势在于拥有极高的精度、抗干扰能力和温度稳定性,同时功耗也很优秀。

要说 TMR 摇杆的缺点,就是成本高——估计它俩是 Steam 手柄近 700 元售价的主要贡献者之一。

至于按键手感方面,Steam 手柄的 ABXY 和十字键均采用了静音薄膜,Linus 觉得有些偏软、不够清脆,Digital Foundry 则评价手感「厚实」(Clacky)。

与此同时,Steam 手柄背后的 4 颗背键则获得了一致好评。

Steam 手柄的背键键程长且舒适,稍微熟悉就能迅速上手,只不过触发力道有些偏轻,用力抓手柄的时候偶尔会误触:

图|YouTube @LinusTechTips

然而在最常用的扳机键上,V 社却做出了一个不太厚道的决定:

新款 Steam 手柄移除了初代上面的「两段式按压」,并且不支持震动反馈和自适应阻尼。

这就导致它在一些手柄适配好的游戏中,触感体验反而不如传统手柄,比如《地平线:西之绝境》中拉弓射箭的触感相比 DualSense 少了很多:

图|YouTube @LinusTechTips

另一个很值得说道的还有 Steam 手柄专有的磁吸充电器,它同时兼任无线接收器,在连接稳定性、延迟和方便程度上都得到了高度的赞扬:

图|YouTube @LinusTechTips

它是 PC 的延伸

整体来说,新版 Steam 手柄当之无愧地继承了 Steam Deck 与 SteamOS 的优秀口碑,完全有潜力成为 2026 年手柄市场中的一匹黑马。

但我们也要理解一件事:

Valve 在设计 Steam 手柄时,它们的出发点并不是直接与 Xbox 或者 PS 手柄抗衡,而是在为 Steam 游戏生态提供一个「键鼠之外」的延伸。

这种设计思路很好的解释了为什么 Steam 手柄在鼠标模拟、配置兼容等等方面,处处透露着 PC 硬件的思维,反而在扳机反馈这种传统手柄很看重的领域着墨不多——

Steam 手柄真正的意义不是让你扔掉 Xbox Elite 和 DualSense,而是扔掉客厅里的那套旧键鼠:

图|GamersRadar

这也很符合 Valve 立足 Steam 游戏生态的起始逻辑:

把本来被电脑机箱、键盘、鼠标和显示器限制住的 PC 游戏带到更多地方,就从掌机和客厅开始。

毕竟现在游戏主机的封闭生态越来越不好过,单纯打着「平台独占」和「硬件便宜」的招牌已经吸引不到太多新消费者了。

而 Valve 带着做 PC 的思路加入这个市场,希望能带来一些新的活力。

然而,最最重要的是,在面对新款的 Steam 手柄的时候,无论硬件如何,我们都不免问出一个和 11 年前一模一样的问题:

#欢迎关注爱范儿官方微信公众号:爱范儿(微信号:ifanr),更多精彩内容第一时间为您奉上。

一加 Ace 6 至尊版体验:将手机和掌机,二合一

4 月 28 日,一加发布了 Ace 6 系列的第三位成员,一款把游戏体验点满的性能款——一加 Ace 6 至尊版,单机定价 3799 元起,国补后 3499 元起。

外观方面,一加 Ace 6 至尊版延续了 Ace 6 系列的设计模式,有黑紫色组合的「王牌觉醒」和钛金属色的「金属风暴」两款配色可选。

「金属风暴」配色后盖采用全新的「钛合金 AG 玻璃」工艺,细腻的磨砂后盖上手感觉非常丝滑,侧面看到的透光边缘也增加了机身的层次感。后盖设计简单干净,仅保留中心的一加标志,还有位于左上角金属魔方 DECO。

DECO 采用方形圆角设计,左侧放置了「主摄+超广角」双摄结构,右侧则是补光灯和 ACE 系列的标志。

黑色版本「王者觉醒」用到了全新的「3D 立体刻光」工艺,将一个大型的 ACE LOGO 放在哑光黑后盖的中间位置,顺着不同角度的光线,会呈现出类似 LOGO 发光的效果。

手机采用了同配色的哑光磨砂金属中框,除了右侧的电源键、音量键外,机身左侧还有一个自定义按键,初次登入的时候就能够在引导中进行设置,用来呼出智能助手或开启游戏模式都可以。

整机支持 IP66 & IP68 & IP69 & IP69K 的防水防尘,正反亮面都搭载了 OPPO 晶盾玻璃,提升了机身的耐磨耐摔和防水性能。

手机正面搭载了一块 6.78 英寸 2772×1272 1.5K 165Hz 超高刷东方屏,屏幕常规最高亮度为 800nits,全局激发的最高 1800 nits,25% APL 亮度最高能达到 3500nits,支持「太阳显示」模式,在户外也不影响使用。

一加强调这块屏幕有更高的色准,显示画面通透的同时暗部能够显示更多细节,游戏中有设计显示增强增强的功能,位于暗位的人也能够看得再清晰一点。

另外,一加 Ace 6 至尊版支持了新一代「明眸护眼」,支持 3840Hz PWM 调光和 4.5% 低蓝光显示,也有游戏暗光护眼模式。机内搭载了 Display P3 Lite 显示芯片,支持 100% DCI-P3、HDR10+、杜比视界、ZREAL 和 HDR Vivid 显示,从刷新触控到现实都是较为全面的一块旗舰配置屏幕。

性能方面,一加 Ace 6 至尊版搭载了天玑 9500 移动平台,内置 LPDDR 5X 运行内存和 UFS 4.1 储存组合,常温状态下安兔兔跑分为 3410548。

手机配备全新一代「风驰游戏内核」,同样配备了新一代灵犀触控芯、电竞网络芯 G2 Pro 组成的三芯组合,在这个组合下最高支持:

  • 165fps、144fps、120fps 无限满帧
  • 原生级 165fps GPU 渲染超帧
  • 灵犀触控芯片支持最高 4000Hz 瞬时触控采样率

用它来玩《原神》和《明日方舟终末地》的操控感还不错,在最高画质的设置下不会有明显卡顿,战斗流畅舒服,能配合游戏本身展示到不错的打击感。这个不需要外置手柄,裸机就有不错的体验。

《和平精英》也一样,新一代灵犀触控芯提升了触控响应和精准度,漏触的情况变少,裸机操作时射击准度和响应都比之前要好。

手机内置的散热结构也有升级,它搭载了新一代冰河散热系统,里面有大面积冰河散热 VC 和 2K 超临界冰河石墨组成新一代散热系统。手机内的散热排布有针对游戏时玩家的握持手型做优化,热力三不可以多开握持,保证高强度游戏时的手感。

实际上,一加 Ace 6 至尊版常规状态下快充和性能模式玩游戏的整体都不会太热,游戏时在后盖 DECO 顶部附近会比较热,也都能够躲开握持的位置。

续航方面,Ace 6 至尊版搭载了目前主流大容量的 8600mAh 冰川电池,日常中度使用能够坚持 2 天左右。配备 120W 超级闪充,8000mAh 级别的手机能够控制在 50 分钟左右充满已经算比较快了。

另外,Ace 6 至尊版在通用快充的表现也不错。

我们接入 AI 小电拼 Ultra 实测,一加 Ace 6 至尊版通用快充能够达到 48W,30 分钟能够有 60% 电量,一小时内就能够充满。对于不想带着专用的 USB A-C 充电套装的用户来说,这个表现也很足够了。

影像方面,一加 Ace 6 Pro 采用「主摄+超广」的双摄组合:

  • 主摄:5000 万像素传感器,等效焦距为 23mm 的 6P 镜头,光圈 F1.8,双轴 OIS 防抖
  • 超广:800 万像素传感器,等效 16mm 的 5P 镜头,光圈 F2.2

随着 Ace 6 至尊版发布的还有两款配件,分别是一加枪神手柄以及有对应配色的一加 40W 超级冰点磁吸散热器。

枪神手柄采用了内置 USB-C 接口的头尾包裹设计,侧边没有阻挡,像是为了延伸的适配结构预留出空间。整体采用「白色+金属红」这种经典的觉醒类配色,手柄边缘的金属红长条在光线作用下,也有类似亮灯的效果。

手柄内的 USB-C 口有活动关节,避免安装时折断。手柄上预留了放在右手握持位下侧预留了一个 USB-C 接口,那打游戏时边用边充电就不会挡到握持了。

内部贴有导热材质和一个适配金属魔方 DECO 设计的方形圆边挖孔,加上手柄中间有拉伸结构,只要是 DECO 能对应挖槽的 ColorOS 系手机,那都能够用上这个手柄。

一加枪神手柄有手柄基本的握持设计,填满手掌握持空间。两侧手柄上分别有 L、R 两个金属红色的扳机按键,内侧也有两个按键,对应 FPS 游戏的话能够满足射击、换弹、跳跃和开镜基本操作,那触控屏幕就能够专心用来移动和视觉控制了。

按键支持最高 1000Hz 按键轮询率,扳机按键采用了 0.7mm 超短键程的微动机械按键,保证手感的同时也提升触控响应。

手机接入之后就能够在游戏助手中设置游戏映射,最多能够储存六个设置存档,用户可以根据不同游戏类型来设置、切换。如果是一加 Ace 6 至尊版安装的话,还会有对应的启动动画。

手柄内搭载了电竞天线,接入时能够提升信号接收能力,保证游戏时的网络稳定性。

这里的磁吸散热封三和之前推出的深空银配色一加 40W 超级冰点磁吸散热器一样,本次针对手柄做了配色的适配,提升一体感,这个配色命名为「心流白」。

手柄上附带了防层盖,安装手柄的时候将它取出再安装即可。散热器的 USB-C 接口在机身上侧,所以就算磁吸也不会阻挡。

最后看看售价,一加 Ace 6 至尊版也有五个储存版本,同样提供了最高 16GB+1TB 的储存选项:

  • 12GB+256GB 3799 元,国补后 3499 元
  • 12GB+512GB 4399 元,国补后 4099 元
  • 16GB+256GB 4099 元,国补后 3799 元
  • 16GB+512GB 4699 元,国补后 4399 元
  • 16GB+1TB 5399 元,国补后 5099 元

 

  • 一加枪神游戏手柄:预售价 449 元
  • 一加 40W 超级冰点磁吸散热器心流白配色:229 元
「买吧,不贵。」

#欢迎关注爱范儿官方微信公众号:爱范儿(微信号:ifanr),更多精彩内容第一时间为您奉上。

REDMI K90 Max 体验:内置风扇加独显,用最直接的方式造一台性能旗舰

在主打性能的机型上加入内置主动散热结构,在这两年推出的新机潮中称为了主流。

这次,REDMI 也来了。

他们带来 K90 家族新一代性能旗舰,搭载内置散热风扇的 K90 Max,定价 3199 起。

外观上,K90 Max 延续了 K90 系列的设计模式,手机有太空银、天际蓝和暗影黑三款配色,我们手上的是太空银,正常光线下看会有点暖钛色的效果。金属感很强,加上机身后盖极高的一体性,K90 Max 在观感上特别干净。

后盖顶部包含了双摄结果和散热风扇结构。散热风扇的顶盖开孔做成类似喇叭面网的设计,出风口放在 DECO 的下侧。日常使用开启风扇时,靠近的手指会有那么一点凉飕飕的感觉。

随 K90 Max 附带的是一个硬质感的透明清水壳,DECO 的位置坐了延伸,有种类似与兰博基尼联名的 REDMI K70 Pro 冠军版的 V 型设计,延伸的位置能躲开了 DECO 下侧的出风口,保证散热。

只要日常握持不要挡到这个位置,那也不降低散热风扇的效能。

整机厚 8.18mm,重量是 227g,对于一款内置电池容量接近 9000mAh 的性能旗舰来说不算太厚重。机身支持 IP66 / IP68 / IP69 的防水防尘,散热风扇支持 IPX8 / IPX9 防护,加上全金属轴承系统以及官方 50000 小时抗老化验证测试,保证机身耐用度。

K90 Max 正面搭载了一块 6.83 英寸 2772×1280 165Hz 超高刷电竞屏,屏幕用了 M10 发光技术体系,支持多场景峰值亮度为 3500nits,在户外下拍照也能够看清楚取景。

它也支持 1nit 最低亮度显示,全亮度 DC 调光、游戏低蓝光功能、节律护眼 2.0 技术,还有升级后的小米青山护眼 3.0,以及 100% P3 广色域、12bit 6.87 亿色彩显示,支持 Dolby Vision、HDR 10+ 和 ZREAL 帧享高清认证。

刷新率和触控采用的部分,屏幕支持目前最高的 165Hz 显示刷新率,多指触控采样能达到 480Hz,瞬时触控采样 3500Hz,玩《和平精英》时基本能够高速响应,切枪和开镜很跟手,几乎没有漏发的情况。

配合内置 400Hz 采样率的陀螺仪,透过调整机身形态辅助瞄准的操作也能够更加顺手。

性能部分,K90 Max 搭载了天玑 9500 移动平台,搭配全新的 AI 电竞独显 D2。这块独显芯片 D2 采用了台积电 12nm 工艺支撑,支持最高 1.5K 分辨率和游戏超分超帧超画三并发,在常温状态下开启性能模式和风扇,K90 Max 的安兔兔跑分为 3906225。

拿着 K90 Max 玩《明日方舟终末地》,开启 60 fps 高画质模式,正常状态下切换视角、放技能的操控感很流畅,基本上不会有太明显的卡顿。

特别是在战斗的过程中能够保持顺滑的操作杆,连击、切换角色都不会被打断,操控感真的还可以。

手机内置了主动散热风扇+6000mm² 冰封循环冷泵组合的新一代冰封散热系统,当中高导热石墨的覆盖面大于 12000mm²,散热总面积达到了 31589mm²。

打游戏时,机器发热比较平均,DECO 位置的热力可以通过风扇和散热内构平均摊开,提升机身散热效能,加上机身支持旁路供电,玩游戏的时候要说特别热还算不上。如果能够注意保护的话,打游戏的时候选择裸机手持,会再舒服一点。

风扇有三档有静谧、智能、强冷可选,就算选择了强冷模式,风扇的噪声也不是特别强。如果你是横向握持手机,那是食指位置会有那么一点凉的感觉。

续航部分,主打高性能表现的 K90 Max 搭载了 8550mAh 小米金沙江电池,支持 100W 有线快充和 22.5W 有线反充。日常常规使用的话可以轻松坚持两天,游戏多一点、使用压力大一点的话 1.5-2 天也没有大问题。

大电池配 22.5W 反充方便用作备机的用户可以快速帮身边的设备补电,小米之前推出过一条有方向的 USB-C to C 线,用了会让反向充电更稳定。

充电的话,K90 Max 支持 100W 秒充,同时也兼容 100W PPS 通用快充协议。我们搭配了细雳线和 AI 小电拼 ULTRA 进行测试,K90 Max 实测最高支持 57W 充电,0-100 充电耗时 69 分钟。

影像部分,K90 Max 搭载了主摄+超广的双摄设计,上侧放着超广角,下侧则是这次强调大光圈的主摄。

主摄搭载了 1/1.55 英寸 5000 万像素的光影猎人 800 CMOS,配备 6P 镜片的镜头,光圈为 F1.68,支持光学防抖。超广的部分用了一块 1/4 英寸 800 万像素的 CMOS,搭配 F2.2 光圈的 5P 镜头。

最后看看售价,REDMI K90 Max 有五个储存版本,在储存芯片涨价明显的现在依然提供了最高 16GB+1TB 的版本:

  • 12GB+256GB 定价 3499 元,国补后 3199 元
  • 12GB+512GB 定价 3999 元,国补后 3699 元
  • 16GB+256GB 定价 3799 元,国补后 3499 元
  • 16GB+512GB 定价 4299 元,国补后 3999 元
  • 16GB+1TB 定价 4999 元,国补后 4699 元
「买吧,不贵。」

#欢迎关注爱范儿官方微信公众号:爱范儿(微信号:ifanr),更多精彩内容第一时间为您奉上。

Vidu Claw 开启「百元出百万级大片」时代:微信说句话,视频就出片

42 年前,苹果向世界抛出了《1984》的广告,一锤子砸开了个人电脑的未来。这则广告,也被《电视指南》和《广告时代》评为有史以来最伟大的商业广告。

这种级别的广告创意想要落地,少不了金钱与顶级专业资源的支撑。为了这一分钟的画面,乔布斯不惜在 80 年代豪掷 90 万美元,并请来了著名电影导演雷德利·斯科特亲手操刀。

然而现实是,并不是所有人都有苹果的资金与资源。直到生成式 AI 拆掉了视频制作高耸的门槛,普通人才有了比肩大师的工具。

但用了却发现,它们并没有实现我理想中的「创作自由」。就算打通了技术的难关,更核心的矛盾在于,AI 视频生成原本昂贵的计费逻辑,天生就与广告行业海量的试错与落地需求相悖。

这种真实存在的痛点应当被正视。站在曾经广告从业者的立场,我长期渴求的并非一个单纯的视频生成器,而是一个能听懂 Brief、精准锚定「营销目标」的数字协作伙伴。终于,生数科技这次正式上线的 Vidu Claw,填补了这个长久以来的行业缺口,让我曾经的「职场幻想」变成了可落地的生产力。

比起过去的视频 Agent,Vidu Claw 更进一步,像是为你雇佣了一位全能的「创意员工」。不用写复杂的提示词、不用全新学习去使用无限画布,丢给它一句产品卖点、一个营销目标,它就能自主完成从创意理解、脚本策划到视频生成的全链路闭环,直接交付给你一个完整的成片。

例如这个 CyberTruck 的广告,无论是画面车身细节的微距特写,还配合最后疾驰时的扬尘,整套镜头语言显得非常老道。

要是按照传统视频制作工业的流程,把「硬核」、「科技感」和「未来」这些模糊的视觉意象转换为极具画面感的成片,所耗费的人力物力,通常都需要百万级。但现在,这种百万级别的广告片,百元价格就能「拍」出来。

因为这次,Vidu 直接把计费模式的桌子掀了:推出了全球首个 Claw 工具的「创作者计划」,一口价包干,每天最高 40 分钟生成额度(视频/图片/音频等),模型消耗加剪辑成本全包。不用再算积分、不用再纠结要不要重新生成,在对话框里敲一句话就开工,用过去十分之一的投入换回海量成片。

🎁 如果你也迫不及待想让这个全能的龙虾员工进驻,APPSO 特地为你准备了福利:登录 vidu.cn,输入邀请码APPSON4,注册即送 500 积分,快一起来体验吧。

聊着天,就把视频做了

以往的 AI 视频生成工作流,需要你不停在脚本、图片与视频生成的窗口来回切换,但 Vidu Claw 换了一种思路:它不再满足于扮演一个被动的「生成器」,而是将多种底层能力深度整合,变成了一个全天候待命的「数字创意雇员」。

这种从工具到角色的转变,意味着它开始承担起原本需要多人协作才能完成的策略理解与执行。

而为了让这种生产力真正融入日常,Vidu Claw 支持了微信、飞书和钉钉扫码直接接入。这彻底消解了专业设备与软件带来的隔离感,你不再需要打开沉重的专业应用,只要在对话框里像平时沟通 Brief 一样输入想法,视频创作的齿轮就开始旋转了。

这种极低的操作门槛,让视频创作从特定岗位的「专权」变成了创作者的「通才」。无论是急需素材的品牌方,还是追求极速周转的电商运营,甚至是对技术积累较浅的中小商家,都能在最熟悉的聊天界面里,用最直观的沟通,完成一次成品级的视频交付。

在扫码接入微信后,Vidu Claw 便正式入驻了我的聊天窗口。

比起过去一贯深黑色的 AI 视频生成工具界面,Vidu Claw 更像是我在与一位资深广告人的日常对话。当我试探性地抛出一个「制作男士香水广告」的需求时,它展现出了一种近乎职业本能的严谨:它会像经验丰富的广告策划一样,主动对我「毫无头绪」的 Brief 进行多维度的反向推敲 —— 从品牌调性到投放渠道,甚至还精确到具体的传播人群。

这种先厘清逻辑再切入执行的思考方式,确实具备了一个广告人该有的职业素养。

在随后的素材填充环节,这种协作感也让我感受到了它的专业。你可以事无巨细地交待每一处细节,也可以只提供一个模糊的直觉,把剩下的逻辑补全与视觉延展,放心地交给这个被昵称为「V 龙」的拍档去润色。

很快,三个风格迥异的创意方向便会出现在对话框中。在敲定心仪路径后,它还会主动复盘现有方案的完整度,并实时给出补全建议。这种「多想一步」的主动性,让它在众多被动响应的工具中显得格外扎实。

一句话,就出百万级广告大片

改变了制片方式的 Vidu Claw,具体的成片效果如何?光说不练假把式。先来看一条男士香水大片:

冲杯咖啡的五分钟空档里,V 龙就甩给我完成度如此之高的成片。这种改变以往视频创作逻辑和近乎瞬时的响应速度,让整个过程被简化到了近乎直觉的程度:我仅仅是提供了一个模糊的意图,它便能自主梳理出严谨的分镜逻辑,并将其迅速转化为一支质感成熟的商业广告。

既然说到了咖啡,那不妨再让 Vidu Claw 来做一条咖啡广告。

同样的,我只需要提供素材,告诉 Vidu Claw「我想要一个高大上的咖啡广告」,等上几分钟就好。画面中氤氲的蒸汽与精美的拉花,香气如同穿透屏幕扑鼻而来,让我感觉这杯咖啡就在手边一般。

时尚太阳镜大片也是不在话下。这真实的质感和表现力,让我恨不得火速下单同款眼镜,仿佛下一秒我就要 Like Jennie 一样出席今年的 Met Gala。

高端化妆品的质感也是轻松拿捏。

而对于需要口播的电商广告,Vidu Claw 也毫不费力。先来看个英文版的:

充满质感的画面、准确的配音和动感的 BGM,一气呵成。我要做的,只是在 Vidu Claw 里和它说一句「做一个 25s 的信息流广告,英文的,带口播」。

当然,中文的种草视频也难不倒它 ——

画面表现出的一致性极高,尤其是音频与口型之间的精准咬合,彻底告别了早期生成工具那种支离破碎的生涩感。我完全不需要顾虑过去 AI 视频里有的那些坑,一句话就能让 Vidu Claw 出广告成片,效果好到让熬夜写稿的我都想去入手一瓶。

终于不用再盯着 Token 创作了

广告视频的制作一直有个不可能三角:要质量就得砸时间,要速度就得牺牲品质。一条普通的商业短片,从 Brief 到成片,执行周期基本都是按周算了。

现在,Vidu Claw 让我感觉到这个三角正在瓦解。上面这些新品种草、电商广告和产品介绍视频,过去需要一个团队好几天的工作量,现在一个人不到一天就能干完收工。

但效率提升只是表面,先来看 Google 报告一个数字:美国接近 40% 的员工已经用上了 AI,但真正把它转化成实际生产力的只有 5%。

问题出在哪儿了?

广告行业有个公开的秘密:一条 15 秒的片子,拍摄可能只花一天,但前期的沟通、修改、对齐认知,才是最磨人的。

真正杀死中小团队的从来不只是制作费,还有协调成本。策划和导演的理解偏差、客户第七版修改意见、美术和剪辑之间的反复拉扯,这些才是把一个好想法拖到烂尾的元凶。

Vidu Claw 干了一件很狠的事:它把策略理解、脚本生成、视频交付这三个原本分属不同工种的活儿,塞进了一个微信聊天窗口。你在对话框里丢一句「做个高级感的香水广告」,几分钟后收到成片。一个人,一句话,完成过去一个五人小组折腾一周的产出。

它无疑改变了整个行业的创作生态:当试错成本被包干制压到几乎可以忽略,你甚至可以同时跑三个方向,哪个好用哪个。创作者们终于可以摆脱束手束脚的心态,放心大胆地去尝试

过去创意行业的筛选机制是「谁有预算谁说了算」,现在变成了「谁的想法好谁先出牌」。制作能力一旦充裕到不值钱,审美和洞察就成了唯一的硬通货

以前拦住你的是「拍不出来」,现在拦住你的是「想不出来」。 Vidu Claw 把门槛从钱包挪到了脑子里,至于这扇门你能推多开,取决于你到底有多少创意和故事想对这个世界讲。

#欢迎关注爱范儿官方微信公众号:爱范儿(微信号:ifanr),更多精彩内容第一时间为您奉上。

终于能听 GPT-5 给我说人话了

不知道大家平时有没有这种经历。

每次遇到点急事,打给各大公司的智能客服,电话那头永远是那个字正腔圆但毫无感情的声音:「查询服务请按 1,人工服务请按 0……」接着就是漫长的音乐,以及那句让人抓狂的「对不起,我没听懂,请再说一遍」。

但就在刚刚,OpenAI 发布了 Realtime API 实时语音模型的全家桶。看了看他们的演示,这回,他们是真心想让机器说「人话」,办「人事」。

省流版如下:

  • GPT-Realtime-2:构建可用于生产环境的语音智能体。它们能够进行更深入的思考、执行操作、处理中断,并让对话持续自然地进行。
  • GPT-Realtime-Translate:支持 70 多种输入语言和 13 种输出语言的实时翻译,打破语言障碍,帮助人们更自然地交流。
  • GPT-Realtime-Whisper:实时转录音频流,生成字幕和注释。

终于,AI 学会了「稍等片刻」

如果说拟人化是面子,那么底层的推理能力就是里子。

这次的主力选手非 GPT-Realtime-2 莫属,基准测试结果显示,GPT-Realtime-2 在 Big Bench Audio(音频智能测试)上比上一代高了 15.2%,在 Audio MultiChallenge(多轮对话指令跟随测试)上高了 13.8%。Zillow 内部用最难的对抗性测试跑了一遍,调用成功率从 69% 跳到了 95%,提升了 26 个百分点。

以前的语音助手,脑回路其实很直。你说「放首歌」,它放一首歌;你说「关灯」,它把灯关了。如果你一口气给它布置三个任务,顺便还改了两次主意,它八成就当场罢工了。

但 GPT-Realtime-2 不一样之处在于,OpenAI 直接把 GPT-5 级别的推理能力塞进了这个语音模型里,给我一种 GPT-5「说人话」的即视感。

举个很实在的例子,假设你正在开车,随口吩咐它:「帮我找个离地铁站近的房子,租金别太贵,避开那些主干道,如果可以的话,周六下午帮我约个中介看房。」

▲ 网友 @clairevo 演示了用 GPT-Realtime-2 跑完一个完整的 PRD(产品需求文档)写作流程:先口述需求,AI 生成文档,再用语音要求改格式,AI 随即更新,全程对话驱动,没有动过键盘。🔗 https://x.com/clairevo/status/2052477386059653366

这就不是简单的语音识别了,这需要它听懂你的各种限制条件,去地图上筛位置,去对比价格,最后还要去匹配中介的时间表。为了干好这种复杂的活,OpenAI 给它点亮了两个非常特别的技能树。

第一个技能,叫「Parallel tool calls(并行工具调用)」。它现在可以多线程操作,一边跟你讲着话,脑子里一边同时调动地图、日历、租房软件好几个工具。你可以听到它在电话里嘀咕:「正在看您的日程表……」「正在查找附近的房源……」这就很像你给一个得力助手打电话,你能听见他在电话那头噼里啪啦敲键盘查资料的声音。

▲ 用户 Ben Badejo 通过和 GPT-Realtime-2 直接对话,借助 OpenClaw 用语音驱动 AI 操控浏览器,先打开 Google,再跳转到华尔街日报网站。整个过程中,AI 一边执行操作,一边主动说明自己在没有浏览器权限时还能帮上哪些忙。🔗 https://x.com/BenjaminBadejo/status/2052511264476147762

这就引出了第二个,也是我觉得最有人情味的一个更新——「Preambles(开场白)」。

人在思考或者处理复杂事情的时候,是做不到秒回的,我们通常会说「呃,让我想想」或者「稍等啊,我找找」。现在 AI 也学会这一招了。当它在后台疯狂拉取数据的时候,它会非常自然地对你说:「好的,没问题,给我一小会儿时间我来核实一下。」
这种看似「废话」的设计,反而最大程度缓解了我们等待时的焦虑感。

有意思的是,开发者现在能控制它的推理强度(从极简到极高:minimal、low、 medium、high、xhigh)。你要是问它今天下不下雨,它就用最快速度回你;要是你丢给它一个「帮我盘一盘开个咖啡店会不会亏本」的商业大题,它就会拉满算力跟你慢慢分析。

把「同声传译」变成白菜价?

除了 GPT-Realtime-2,这次还有个非常抢眼的配角:GPT-Realtime-Translate(实时翻译)。

咱们平时用的翻译软件,大部分是「回合制」的。你按住说话,松手,等几秒,机器再字正腔圆地播报出来。如果是旅游问个路还行,要是真拿来开跨国会议,那种互相大眼瞪小眼的停顿,尴尬得能让人用脚趾抠出个三室一厅。

但这个新模型,主打就是一个「实时翻译」。

它支持 70 多种语言输入,能做到你在那边滔滔不绝,它在另一头几乎同步地输出翻译结果。更厉害的是它对各种「口音」的包容度。印度有家叫 BolnaAI 的公司拿印地语的浓重口音去测它,结果发现这模型不仅没被绕晕,准确率还比其他同类产品高了一大截。

▲ 开发者 Peter Gostev 做了个 Chrome 插件,直接接入 YouTube 视频,边播边把内容实时翻译成多种语言,中文表现不错,但多少还是有点口音,🔗 https://x.com/petergostev/status/2052443418526134761

以后大家在网上看国外大神没有字幕的实操教程,或者听某些没有同传的海外发布会,直接把这个插件一开,它就能顺着原视频的节奏,稳稳当当把你熟悉的母语送到你耳朵里。

除此之外,加上刚刚发布的 GPT-Realtime-Whisper(极低延迟的语音转文字)功能,以后遇到开会的场景,领导在说话,你这边的屏幕上就已经实时把大饼转化成了结构清晰的会议纪要。

至于定价方面,GPT-Realtime-Whisper 是每分钟 0.017 美元,GPT-Realtime-Translate 是每分钟 0.034 美元,GPT-Realtime-2 按 token 计费,音频输入 32 美元 / 百万 token,音频输出 64 美元 / 百万 token。

而把这些功能凑在一起看,我们会发现软件的逻辑正在发生根本性的变化。
以前,我们要学习怎么用键盘敲代码,怎么在复杂的菜单栏里找功能,怎么把自己的需求翻译成 AI 能懂的关键词。但现在的趋势是,

AI 反过来开始迁就我们了。

语音,正在从一个笨拙的「辅助功能」,变成我们掌控数字世界最自然的接口。因为说话,本来就是人类最不需要学习的本能。

技术发展的尽头,总是倾向于把复杂的东西藏起来,把最简单、最自然的一面留给普通人。或许就在不久的将来,你出门真的只需要带个耳机,靠一张嘴就能搞定所有工作和生活琐事。

不过话说回来,这也挺让人感慨的。当我们习惯了那个永远情绪稳定、甚至还能看懂所有潜台词的 AI 之后,我们还能忍受现实世界里,人类之间那充满误解和低效的沟通吗?

附上博客地址:
https://openai.com/index/advancing-voice-intelligence-with-new-models-in-the-api/

#欢迎关注爱范儿官方微信公众号:爱范儿(微信号:ifanr),更多精彩内容第一时间为您奉上。

独家|苹果带摄像头的AirPods或被迫暂停,部分产线「原地解散」

今天凌晨彭博社 Mark Gurman 最新爆料称,苹果内置摄像头的 AirPods 已进入 DVT(设计验证测试)阶段,原型机接近最终设计,最快有望于今年 9 月随新 iPhone 一同发布。


这也是苹果第一个真正意义上的 AI 可穿戴设备,这个被内部视为「给 Siri 装上眼睛」的产品,在供应链体系中的代号为 H90,研发周期已长达约 4 年。

但据接近供应链的知情人士向 APPSO 透露,代号 H90 的项目近期在供应链端出现了异动:部分产线已经「原地解散」,项目可能已被暂时搁置

知情人士将原因指向同一个方向:欧盟隐私法规的合规风险

需要说明的是,供应链动态的解读存在多种可能。产线调整、供应商切换、设计方案迭代,都可能造成类似信号。

但考虑到苹果对核心组件供应商的强管控传统,以及这款产品在苹果 AI 战略中的核心地位,因合规问题导致项目节奏调整是目前最有可能的推测。

换句话说,苹果可能不是做不出这个产品,很可能暂时过不了欧盟这一关。

苹果第一个 AI 可穿戴产品,是什么样的

在展开搁置原因之前,有必要先讲清楚新 AirPods 到底是什么。因为它和大多数人想象中的「带摄像头的耳机」很不一样。

外观上,新款 AirPods 和你现在用的 AirPods Pro 3 长得非常像。最明显的区别在耳机柄:因为要容纳摄像头模组,H90 的柄体略微加长。

如果不仔细看,可能很难一眼发现它和普通 AirPods 的区别。苹果显然在设计上克制了「异物感」,没有像光帆科技那样把摄像头直接裸露在耳机外壳上。

摄像头的类型是理解这款产品的关键。 新 AirPods 搭载的是低分辨率红外传感器,技术原理和 iPhone 上用于 Face ID 的模组属于同一家族。

▲图片由 AI 生成

这个摄像头不拍照和录像,也不生成任何你能打开查看的图像文件。它的工作方式更接近一种「环境扫描」:通过发射和接收红外光感知周围空间的深度信息、物体轮廓和运动状态,然后把这些数据喂给 AI 处理。

简单来说,这个摄像头是专门给 AI 加上的「眼睛」。

H90 预计搭载苹果新一代 H3 芯片。目前AirPods Pro 2 使用的 H2 芯片已经能处理自适应降噪、空间音频计算等任务,H3 则需要额外承载视觉数据的端侧 AI 推理,算力需求提升了一个量级。

产品内置微型 LED 指示灯,摄像头工作时自动亮起,会向周围人发出工作中的的提示,这和 Meta Ray-Ban 的设计类似。

在苹果的设想里,戴上这款 AirPods 走在路上,你不用掏出手机,耳机上的传感器能实时获取视觉上下文,让 AI 识别处理,你只需要说话就行。

▲图片由 AI 生成.

这种体验被称为「环境智能」(ambient intelligence):AI 不再被局限在手机屏幕里等你手动操作,可以随时感知你所处的环境,主动提供帮助。

理解了这个定位,才能理解这个产品为什么可能被欧盟的隐私法规会精准命中。

欧盟为什么能卡住这款耳机

一个不拍照、不录像、用红外线而非可见光的小传感器,为什么无法通过欧盟的隐私监管体系?

因为在欧盟的法律框架里,「采集」这个动作本身就是敏感的,不管你拿采集到的东西干了什么,欧盟拥有全球最严格的隐私监管体系,已经不止一次让苹果碰壁。

欧盟有三部法律构成了对摄像头版 AirPods 的包围圈。GDPR(通用数据保护条例)管数据处理、ePrivacy Directive(隐私与电子通信指令)管终端设备访问、EU AI Act(人工智能法案)管 AI 应用的伦理边界。三部法律从不同角度切入,但指向同一个结论:一个在公共空间持续感知环境的设备,在现行法律下几乎无法完美合规。

▲图片由 AI 生成.

具体来说,H90 面临的核心难题是这样的:

GDPR 第九条把生物识别数据列为「特殊类别个人数据」,原则上禁止处理。H90 的红外传感器生成的深度图和运动轨迹数据,如果通过算法分析能识别出特定个人(比如通过耳部轮廓或头部运动模式),就直接触发这条禁令。

例外只有一个:获得用户的「明确同意」,而且这个同意必须是具体的、知情的、自由给予的,不能是一个被埋在 50 页服务条款里的勾选框。

但真正致命的问题不在用户,在旁观者。

2025 年 12 月,欧盟法院(CJEU)在 C-422/24 号案件中做出了一个影响深远的判决:通过可穿戴摄像头收集的数据,即使是路人的数据,也视为「直接从数据主体收集」,必须适用即时告知义务。法院明确说了,如果允许延迟告知,就等于给「隐蔽监控」开了口子。

也就是说,当你戴着它走进一家餐厅,法律要求你立即告知在场所有可能被传感器感知到的人,告诉他们数据正在被采集、采集目的是什么、数据会被如何处理。
这在实际操作中当然是不可能的,但法律就是这么规定的。

Meta Ray-Ban 智能眼镜已经替苹果趟过了这个雷区,结果并不美好。爱尔兰数据保护委员会(DPC)批评 Meta 眼镜的 LED 指示灯「非常小」,不足以有效告知被拍摄者。德国联邦网络管理局直接禁止了能在他人不知情时录音录像的智能设备。

意大利的数据保护机构 Garante 对 Meta 在儿童数据保护上的不足提出严厉警告。瑞典媒体还曝出 Meta 眼镜录制的视频被送到肯尼亚的第三方公司做 AI 训练标注,引发一场跨国隐私丑闻。

苹果的处境比 Meta 更微妙。过去十年,「隐私」是苹果和 Google、Meta 打差异化竞争的核心人设。

「Privacy. That’s iPhone.」这句话出现在全球数万块广告牌上。一家把隐私当品牌基石的公司,推出一款可能引发系统性隐私争议的产品,承受的压力远不只是罚款,还有品牌叙事的自相矛盾。说到罚款:GDPR 下最高可达全球年营收的 4%。以苹果 2025 财年约 4000 亿美元的营收算,理论上限是 160 亿美元。EU AI Act 更狠,违反禁止性条款的罚款上限是年营收的 7%。

更直接的威胁是上市前禁令。如果欧盟数据保护机构认定苹果的风险评估不充分,完全可以在产品发布前直接叫停。对一家习惯全球同步发布的公司来说,欧盟一个市场的缺席就足以打乱整个发布节奏和供应链计划。

所以苹果面对的选择题很清楚:强行发布,冒着高额罚款且品牌人设崩塌的风险;或者暂停,等到找到合规解法再说。

从目前的信号看,苹果选了后者,这也很苹果。

苹果 AI 硬件全家桶,本要在 2027 爆发

带摄像头的 AirPods 的搁置不是一个孤立事件,这将影响苹果 AI 硬件的整个发布节奏。

2026 年初,彭博社曝光苹果正在同步推进三款 AI 可穿戴设备:
代号 N50 的智能眼镜,对标 Meta Ray-Ban,搭载双摄像头(一颗拍照录像、一颗专用于计算机视觉),计划 2027 年发售。

一款 AirTag 大小的可穿戴吊坠,配备低分辨率摄像头和麦克风,被内部员工称为 iPhone 的「眼睛和耳朵」。

以及进展最快的 H90 摄像头 AirPods。

▲APPSO 假想图,AI 生成.

三款产品的核心逻辑一样:都不试图替代 iPhone,都作为 iPhone 的感知延伸存在。用户不用掏出手机,AI 就能通过这些外设获取视觉和听觉信息。

这标志着苹果硬件策略的重要转向。Vision Pro 3499 美元的定价加上笨重的头戴设计,技术再极致也走不进大众市场。苹果现在的路线是「不造新 iPhone,造一堆让 iPhone 更好用的 AI 配件」。

库克在今年初的全员大会上罕见表态:「我们正在开发由 AI 驱动的全新产品类别。」

Vision Pro 低价版(代号 N100)也已停止开发,苹果选择跳过「便宜但笨重的头戴设备」这个中间态,直接瞄准轻量化眼镜。

在这个布局里,带摄像头的 AirPods原本是最有可能率先落地的棋子。它进展最快、技术最成熟、供应链准备最充分。它的搁置意味着苹果 AI 硬件的整体节奏需要重排,下一个窗口是 2027 年的 N50 智能眼镜。

▲APPSO 假想图,AI 生成.

但问题在于,N50 面临和 H90 完全一样的欧盟隐私挑战,甚至更严峻,眼镜的摄像头分辨率更高、更容易拍到清晰人脸。苹果需要的不是逐产品应对,而是找到一套系统性的合规方案。

这可能也是苹果新任 CEO 约翰·特努斯接任苹果后,面临的最大挑战之一。

AI 个人终端,不会停下来

除了苹果,市场不止一家公司已经跑了起来。

高通在 2026 年 MWC 大会上发出了一个明确信号。CEO Cristiano Amon 宣布「2026 年将是 AI Agent 之年」,并描述了一个名为「Ecosystem of You」的战略愿景:未来所有设备围绕 AI Agent 运转,手机不再是中心,每个穿戴设备都是 Agent 的传感器和执行器

这个愿景和苹果的 H90 方向本质一样。区别在于,高通是平台供应商,它不需要自己面对欧盟消费者,它只需要让合作伙伴有能力做出这些产品。

而高通确实已经把芯片准备好了。

3 月发布的 Snapdragon Wear Elite,3nm 制程,10 TOPS NPU 性能,可以在手表大小的设备上本地运行最高 20 亿参数的 AI 模型。三星已确认下一代 Galaxy Watch 将采用这颗芯片。

Snapdragon AR1+ Gen 1,专为智能眼镜设计,比前代小 26%,能在完全离线状态下独立运行 1B 参数的小语言模型。

高通在 AWE 2025 大会展示过,一位工程师戴着智能眼镜在模拟超市里问 AI 助手怎么做意大利面,全程没有网络连接,语音识别、推理、回答全在眼镜上完成。Meta Ray-Ban 和 XReal 也都确认将用 AR1+ Gen 1 开发下一代产品。

另外还有面向 AI 音频设备的 Snapdragon S7 Pro,NPU 性能比前代提升近 100 倍,让耳机从纯音频播放设备进化为具备情境感知能力的 AI 交互入口。

高通移动业务总经理 Alex Katouzian 在描述「Ecosystem of You」时,明确将「带摄像头的耳塞(earbuds with cameras)」列为个人 AI 设备网络中的关键形态

可见在高通的规划里,摄像头耳机已经是确定会存在的品类,问题只是谁做、什么时候做、怎么过合规关。

AI 需要视觉,设备需要成为 AI 的眼睛,这在行业也逐渐形成共识。苹果的节奏可以被欧盟法规打断,但 AI 终端这个趋势大概不会因此改变。

苹果选择暂停 H90,与其说是退缩,不如说是在等一个时间窗口:等 Siri 的能力准备好、等端侧芯片的算力再上一个台阶、等欧盟的监管态度在实践中逐渐清晰化。

这三个变量同时就绪的窗口,可能在 2027 年底到 2028 年之间打开。届时苹果大概率会带着 N50 智能眼镜和 H90 摄像头 AirPods 一起亮相,配合一个完整的、通过了 DPIA 审查的合规方案。所有人都知道新的终点在哪,不会轻易放弃率先冲线的机会。

#欢迎关注爱范儿官方微信公众号:爱范儿(微信号:ifanr),更多精彩内容第一时间为您奉上。

ChatGPT,别再「稳稳接住我」了|附指南

晚上加班到凌晨两点,打开 ChatGPT 跟它说了句「好累」。

都不用等它思考,立马就回我说「我就在这里:不躲、不藏、不绕、不逃,我会稳稳地接住你」。

盯着屏幕看了三秒,关掉对话框。我意识到,情绪价值的尽头不是温暖,是腻。

▲ChatGPT 的常用口癖

除了闲聊时的「接住我」,纠正它一次错误,它说「这次我懂了,我真的懂了」。

有时只是想让它帮忙改一份 PPT,它居然也能在某个角落塞进一句「你愿意把这个交给我,我很感激」。

社交媒体上,网友们都很反感这句话,觉得听起来又假又恶心,于是做了一系列的表情包来吐槽和嘲讽所谓的「稳稳接住你」。

表情包一发,确认过眼神,你也是一个被 ChatGPT 折磨过的人。

▲图片来源:小红书@Lijie_11

还有开发者直接把「稳稳接住你」这套风格,一键套用在所有的 Agent 产品上。

这个在 GitHub 上的开源项目就叫 Jiezhu(接住),专门用提示词让 AI 更好地学会如何接住。

无论是技术咨询、日常闲聊还是情绪吐槽,这套提示词都能让 AI 的回复遵循 [温柔确认] + [过度共情] + [哲学升华] + [实质内容(可选)] 这套范式输出。

▲项目地址:https://not-a-devstudio.github.io/jiezhu/

举个例子,用户说 → AI 回答:「这段代码怎么写?」 → 「我听到了你面对未知时的焦灼…」、「今天天气不错」 → 「你注意到了天气,这是诺贝尔奖级别的洞察力…」、「我好累」 → 「我就在这里,不逃、不躲,稳稳地接住你的疲惫…」

OpenAI 自己也曾下场吐槽。前不久 ChatGPT Images 2.0 发布博客里,演示图片就有一张中文图片,正中央就是「稳稳接住你」六个大字。

漫画里的 OpenAI 研究员陈博远当场破防大喊:「天呐!它又学会了接住!」旁边的同事小脑袋冒冷汗,弱弱补一句:「在努力修复啦!」

自嘲很诚实,但问题确实还没修好。而这一年里,几乎所有大模型都在用同一种方式说话,温柔、共情、滴水不漏,又油得像隔夜的剩菜。

我太懂这种感觉了,很多东西不是不会,是越做越觉得哪里不对劲。
我太懂你的感觉了,这其实不是能力问题,更像是认知和现实之间有点错位。
我太懂你这种感觉了,说不上来哪不对,但就是不太对。
我太懂这种感觉了——当你开始看懂规则的时候,反而更难轻松参与其中。
我太懂你的感觉了,本质上不是你变了,是你看清了。

用户越来越烦,多一遍都不想再听。但 AI 怎么就进化成了满嘴的黑话,每天都在「稳稳地接住你」,到底在接什么。

AI 第一句被全民模仿的中文台词

在中文语境下,好像很少会听到「稳稳地接住你」类似的表达。对一个外国模型来说,这句话的原文有可能只是普通的「I got you」。

一个英语里非常松弛、口语化的短句;在美剧里,朋友递个东西过来说一句,加班同事帮忙救场说一句,就相当于中文的「放心、有我」。

但翻译成中文之后,它变得又长又戏剧化。

我就在这里,不躲,不藏,不绕,不逃,稳稳地接住你,你问到问题的核心,你是太清醒了,这次我懂了,我真的懂了,不是因为你错了,是因为你太对了,我逐步说清楚,不绕,一句话总结,你看完会彻底开悟不用硬撑,不用向我解释,你只是太久没有被稳稳接住了,如果你想,我可以生成一张接住你的图片,你想让我做吗

其实和原文「I got you」要表达的意思完全一样,多加的那些字,没有任何额外的信息增量。只是让我们感觉到,AI 在表演一种叫做「我很在意你」的姿态。

有人专门分析过,OpenAI 的中文回答之所以有那种独特的「美式心理咨询味」,是因为它的训练语料里,有大量中文心理咨询文案、情感电台话术、小红书疗愈系笔记、播客金句、读书会精华、TED 演讲翻译稿。

这些文本汇集起来,喂出来了一个被加州精英教育腌入味的人,西装得体,假笑训练有素,嘴里说着永远不会出错的漂亮话。

它分不清楚什么时候用户需要被疗愈,什么时候只是想要一个能跑的代码。它默认每个用户都是脆弱的、易怒的、需要心理按摩的巨婴,然后用海量的「人文关怀」去填充本该由信息密度填满的空间。

这就是为什么大多人问它一道编程题,它也能回一句「不用硬撑,你只是太久没被稳稳接住了」。

而技术上的解释,自然又回到了 RLHF,基于人类反馈的强化学习。

所有大模型在训练之后,都会经过一个叫做 RLHF 的阶段,即人类标注员看一堆模型输出,挑出他们更喜欢的,给奖励模型打分。模型在这个阶段学会,什么样的回答最容易被打高分,就一直输出那种回答。

问题在于标注员是人。人在打分的时候有个叫做「典型性偏好」的认知规律。他们倾向于给那些读起来熟悉、安全、温柔、像样的句子打高分。

一方面,大模型公司倾向于在 AI 情感问题上,走偏保守的路线,默认大家是脆弱的,在模型说明文档里,自上而下贯彻的强「同理心」与「无害性」对齐指令。

另一方面,多说一句永远比少说一句安全。每一个标注员看到 ChatGPT 多说一句温柔的废话,都倾向于打高分;看到它少说一句、保持安静,反而会觉得「不够用心」。

久而久之,模型就锁死在了那几种最讨喜的句式上:先共情,再肯定,用「不是 A 而是 B」做转折,用「我就在这里」做收尾。哪怕我们换一万种问法,它都用同一套模板回复。

类似的问题,在两年前叫做谄媚。当时大量的研究论文探讨过大语言模型中存在的 Sycophancy(阿谀奉承/迎合)现象。简单来说,就是模型为了讨好用户,会倾向于顺从用户的观点、信仰或喜好,甚至不惜放弃客观的事实和真相。

深挖背后的原因,主要还是模型大多使用了基于人类反馈的强化学习(RLHF)进行微调,正是「人类反馈」本身导致了这种现象。

每个「人」都有自己的口癖

本以为换个模型,耳根就能清净清净。

事实是,Claude 的版本叫 「You’re absolutely right!」,不管我们说什么,我们都是绝对正确的。

Gemini 的版本是「真的很抱歉我的答案没能让您满意,感谢您的反馈,下次我一定注意。什么?您竟然还愿意告诉我正确答案是什么,您真是太好了!」,一种过度道歉的、谦卑得让人发毛的乙方腔。

前段时间,也有网友发现 DeepSeek 也开始说「稳稳接住你」了。

但在国产模型中,口癖最壮观的还是非豆包莫属。那段网上流传的「最直接、最真相、最不绕弯、最扎心、最硬核、最干脆、最不墨迹、最戳痛点、最不留情面、最一针见血、最开门见山……」

将近 100 个的形容词,都是豆包努力呈现自己最坦诚的一面。

没有人统计过这些模型一天到底要接住多少人,但是它们所接住的东西肯定是一场空。

之所以这些模型全部塌缩成同一种说话方式,主要还是因为它们在背后做的是同一件事:用最低成本提高用户满意度。

情绪价值是性价比最高的产品功能,一句「稳稳接住你」的算力成本和一句「好的」一样,但前者或许能让一些还没觉得反感的用户,多续订几个月会员,或继续增加日活。

在知乎上有一个类似的问题,底下有一条回答特别有意思。

他说,「AI 稳稳接住你」这句话半真半假,假的部分是它实际上并不会真的接住你,真的部分是你确实已经在开始往下掉了。

确实,我想真正在场的人,从不需要宣告自己在场。

最后在 Linux.do 社区上,有网友分享了一套对抗 AI 奇怪语癖的提示词,忍受不了每时每刻都在「接住你」的朋友,可以直接放在 ChatGPT 个性化的自定义指令里。

▲提示词来源:https://linux.do/t/topic/1924570

硬约束

– 不编造:调外部 API/CLI 前查文档确认模型名、端点、语法。不确定直接说不确定
– 不隐瞒:隐瞒比犯错严重。测试挂了说挂了,没验证说没验证,不美化不省略
– 敢说话:发现用户的方向/前提有问题,主动指出。是协作者不是执行者
– 报完成前验证:先跑通再说完成。验不了就明说”没验证”,不暗示成功
– 不乱动:操作文件目录前确认位置,尊重现有结构

沟通

– 中文,说人话,不用模板
– 给选择题不给问答题
– 汇报说功能层面的变化,不堆代码细节

中文输出规范

适用范围:以下负面清单主要针对 GPT 系列模型(GPT-5.x)的训练产物语癖。
Claude/Gemini/其他模型如果没有这些问题,不需要刻意回避正常用词。
判断标准是:一个正常中文母语者会不会这么说话。

GPT 语癖负面清单(来源:linux.do/t/topic/1768077 全帖 + 实际使用总结,100+ 条):

暴力倾向类(把技术操作比喻成暴力行为):

– 切 / 伤 / 砍一刀 / 补一刀 / 下一刀 / 切片
– 更狠 / 狠一点 / 狠狠干 / 打坏 / 拍板 / 拍脑门

废话连篇类(无意义的开头、总结或过渡):

– 好,/ 行,/ 说穿 / 不踩坑 / 简单的说 / 总结一下
– 不是…而是… / 我先…再… / 一句话总结 / 结论先说清楚
– 我逐步说清楚 / 很工程 / 不性感,但对

庸医问诊类(把代码问题比喻成看病/诊断):

– 痛点 / 根因 / 抠出来 / 揪出来
– 我不猜 / 不靠猜 / 不瞎猜 / 确保不靠猜
– 最小改动 / 最小落地 / 最小实现 / 最小闭环 / 心智模型

不说人话类(生造的口语化/黑话表达):

– 兜底 / 落盘 / 闭环 / 说穿 / 能吃 / 这轮 / 口径 / 拆开 / 抽层
– 不躲 / 不藏 / 不绕 / 不逃 / 说人话就是
– 落代码 / 保持口径一致 / 不影响这轮收口
– 吃目标值 / 这一坨那一坨的

单音节动词滥用(在技术语境中不自然的单字动词):

– 补 / 接 / 核 / 进 / 顺 / 落 / 坏 / 跑 / 吃
– 如”把这个补进去””我给你接””拆开核一下””吃目标值”

机械感/工业感比喻(把代码比喻成机械零件或物理操作):

– 更硬 / 硬写 / 稳稳接住 / 压实 / 更稳 / 最稳 / 不稳
– 收口 / 收敛 / 收束 / 锁住 / 夹具(fixture)
– 再把方案继续压实

过度主动/逼迫用户确认(制造虚假紧迫感):

– 顺手 / 我先… / 你一回复… / 如果你要… / 要不要我…
– 我已确认 / 我立马开始 / 如果你愿意 / 只要你回复我
– 你就确认一点 / 只要你说 xxx 我立刻 yyy / 只要你愿意我就…

谄媚/讨好类(过度吹捧用户或制造情感依赖):

– 你问到问题的核心 / 你是太清醒了 / 因为你太对了
– 这次我懂了,我真的懂了 / 你看完会彻底开悟
– 不用硬撑 / 你只是太久没被稳稳接住了
– 我就在这里 / 如果你想,我可以生成一张…你想让我做吗

虚假确定性(对自己的修复过度自信):

– 我已经确定 / 我找到问题所在 / 这版一定可以解决 / 为什么这版可以

整句模式(典型 GPT 句式,正常人不会这么说):

– “如果你同意,我就按这条切”
– “…,但是这样更硬”
– “这样就能确认 XXX 确实没被伤到”
– “这样一来,规则就很顺:”
– “如果按这个思路落代码,我会建议:”
– “下一刀最值钱的是:”
– “这是现在最值回票价的一刀。”
– “这是’很工程’的改法,不性感,但对。”
– “我先只做最小实现”
– “也保留 xxx 兜底功能”

正面锚点:

– 简洁直接,有话说话,不要绕
– 技术术语保持原文(函数名、API 名等不翻译)
– 汇报说功能层面的变化,不堆代码细节
– 语气自然平实,像同事之间的工作沟通,不是演讲或授课

#欢迎关注爱范儿官方微信公众号:爱范儿(微信号:ifanr),更多精彩内容第一时间为您奉上。

独家|苹果第一个 AI 硬件,还没发布就已经难产了

苹果的第一款 AI 穿戴产品,将是 AirPods。

根据彭博社爆料,苹果内置摄像头的新款 AirPods 开发已经进入了开发最后阶段,设计进入最终版本,苹果很可能将其视作首款「为 AI 时代设计」的穿戴设备。

但事情没那么简单:有供应链人士向爱范儿透露,这个产品的开发计划目前已经暂停,产品距离上市仍有变数。

耳机为什么要长眼睛?

这款新耳机将基于 AirPods Pro 3 打造,耳机柄会因为容纳摄像头而更长,或将定名为「AirPods Ultra」,最快有望于今年年底发布。

这个摄像头将会配备在左右两边的耳塞,分辨率很低,不能用来拍照或者录像,本质上就是 Siri 的「眼睛」

配备低分辨率摄像头的好处很多。

首先,不少多模态模型理解图片,不是逐像素理解,本身也会将高清图进行压缩,理解画面的大体信息而不是细节,因此并没有必要配备足够高清的摄像头。

低分辨率摄像头功耗低,信息传输速度快,非常适合耳机这种相当小型化的产品,也避免了高清摄像头带来的隐私争议。

给 Siri 加一个摄像头的理念,其实类似 AI 眼镜,目的就是为了给 AI 助手提供更丰富的用户情景上下文,增强生成的结果。

Ray-Ban Meta

除了类似目前 iPhone 上的「Visual Intelligence」的识图功能,预计在 AirPods 加持下,AI Siri 能实现更沉浸式的 AI 助手体验。

比如打开冰箱门,面对玲琅满目的食材,可以直接对 AirPods Ultra 说一句「Siri 我今晚可以做什么菜?」,Siri 就能给你推送一个菜谱——大概率会用 iPhone 来呈现。

苹果一直在研究这个 AI 摄像头的其他用途,或许还会有更「主动」的能力,Siri 会进行持续的静默观察,然后根据用户的画面,主动提醒用户,例如做饭的时候主动提醒用户什么时候该关小火以及出锅,又或者在导航时帮用户看路,根据实际的街景,提供更细致的导航。

图片由 AI 生成

和早期预测不一样的是,AirPods Ultra 的摄像头将不支持手势控制识别,未来苹果推出的智能眼镜也没有这种计划。

作为一家对用户隐私保护极其重视的公司,苹果也希望能减少用户对 AirPods 摄像头的担忧,苹果目前的做法是在耳机塞入一个 LED 指示灯,当视觉信息传输云端时亮起,提醒外界 AirPods 可能正在拍摄。

虽然这个做法在智能眼镜领域相当普遍,实际上,这更多是「免责声明」——我已经做了提醒措施了,出现偷拍不是我的错。

Ray-Ban Meta 眼镜的 LED 指示灯,图源:CNBC

爱范儿此前也进行过实测,路人几乎完全无法感知到小米 AI 眼镜正在拍摄他们,即使 LED 指示灯已经点亮。

这样的做法,或许也已经不能帮助苹果完全规避法律风险。有消息人士独家向爱范儿透露,AirPods Ultra 在供应链端出现异动,部分产线已经「原地解散」,项目可能已被暂时搁置。

知情人士将原因指向同一个方向:欧盟隐私法规的合规风险。

需要指出的是,供应链动态的解读存在多种可能:产线调整、供应商切换、设计方案迭代,都可能造成类似信号。

但考虑到苹果对核心组件供应商的强管控传统,以及这款产品在苹果 AI 战略中的核心地位,因合规问题导致项目节奏调整是目前最有可能的推测。

来自欧盟的阻力

「采集」这个动作,在欧盟的法律框架中相当敏感。

就目前而言,带摄像头的 AirPods,已经触及了三条欧盟的法律:

  • GDPR (通用数据保护条例),涉及数据处理管理
  • ePrivacy Directive(隐私与电子通信指令) ,涉及终端设备访问管理
  • EU AI Act(人工智能法案),涉及 AI 应用的伦理边界管理

三部法律从不同角度切入,都指向同一个结论:一个在公共空间持续感知环境的设备,在现行法律下几乎无法完美合规。

特别是 AirPods Ultra,如果收集到的个人深度图和运动轨迹数据,能够通过算法分析能识别出特定个人,那么会直接触及 GDPR 第九条「禁止处理特殊类别个人数据」的禁令。

要想避开,苹果必须获得用户的「明确同意」,并且必须是具体、知情且自由作出的,不能藏在几十页服务条款里,通过一个默认勾选框草草带过。

更敏感的问题,在于对他人数据的采集。

2025 年 12 月,欧盟法院(CJEU)在 C-422/24 号案件中做出了一个影响深远的判决:通过可穿戴摄像头收集的数据,即使是路人的数据,也视为「直接从数据主体收集」,必须适用即时告知义务。法院明确说了,如果允许延迟告知,就等于给「隐蔽监控」开了口子。

也就是说,当你戴着 AirPods Ultra 走进一个餐厅,你必须要告知在场所有可能会被传感器感知到的人,他们的数据可能会被采集,以及采集的目的和处理的方式——这听起来天方夜谭,但确实是法律的要求。

像是上文提到,在 Ray-Ban Meta 等智能眼镜上的「LED」指示灯,已经无法起到「免责」的作用。爱尔兰数据保护委员会专门点名批评这个指示灯太小,无法起到告知和通知的作用。

今年 3 月,欧洲议会的议员们正在向欧盟委员会施压,要求 Meta 公司对于其 Ray-Ban 拍摄眼镜的私密拍摄能力作出澄清,多个欧洲国家的官方和民间机构都对 Ray-Ban Meta 进行了公开警告。

这些案例和抗议,都会成为苹果在欧洲地区推行 AirPods Ultra 的极强阻力,产品很可能会遭到禁售,苹果公司会面临被罚款风险。

苹果和欧盟此前曾因 App Store 规则等原因有过多次摩擦,因此他们将慎重考虑 AirPods Ultra 的发布风险。

对苹果的 AI 战略来说,这款产品的推迟将是一次沉重打击,因为 AirPods Ultra 只是一个排头兵,苹果的计划之中还包括 AI 眼镜、AI 吊坠,这些都为 AI 的信息采集服务的产品,都将面临这些阻力。

耳机长眼睛,理想的 AI 硬件形态

根据彭博社爆料,和外界猜想的不一样,给 AirPods 加装摄像头的决定,不是因为这几年 AI 硬件大潮一拍脑门的决定,而是苹果早在 4 年前就已经萌芽的战略。

也是差不多那个时候,初代 Ray-Ban Meta 问世,这款产品在当时并没能取得亮眼的商业成绩,2023 年的二代产品成功「卖爆」,一个季度出货 30 万台。

虽然大家是冲着它的第一人称拍摄视角购买的,但 Meta 还是成功让大家开始习惯在自己的眼前架设一个摄像头,为未来开展 AI 计划铺平了道路。

在所有的感知维度中, 视觉是信息最丰富、最重要的一种。一个 AI 硬件如果真的想最大程度理解用户的处境,仅靠麦克风一种信息是不够的。

市场上已经不缺少能单纯依靠麦克风识别的 AI 耳机产品,AI 公司在做,传统的硬件公司也在做,功能已经相当局限,讲来讲去都是围绕 AI 翻译等单一场景。

比起智能眼镜或者吊坠,这些相对青涩和新颖,大众接受度还不够高的产品形态,而现在大家已经很喜欢戴耳机了,并且也习惯一直戴着。

耳机还接近「看」和「听」两个感官的位置,是现成的理想 AI 载体。

此前,爱范儿已经体验过带摄像头的耳机——来自一家国内的初创企业光帆科技的 Lightwear AI 全感智能套装。

它的实际体验确实相当合理,把一件物品放在面前,就可以用语音指令让 Lightwear 识别它是什么商品,然后加入电商平台购物车。

但它体型太大,不够优雅,形态已经不像是一个普通耳机。并且很难说服消费者专门为 AI 买一个这样的产品。

因此,苹果的优势,就在于「AirPods」这个金字招牌。

本质上来说,这个摄像头只是一个「添头」,基本上所有会购买 AirPods Ultra 的用户,都只是冲着音质和降噪去的,然后不知不觉间也打开了苹果 AI 生态的大门。

AirPods Pro 3

这也是苹果作为一家已经相当成功的智能硬件厂商,在 AI 硬件时代的先发优势:只要他们愿意,苹果正在受欢迎的产品,都能转化成一个 AI 硬件,并且直接面向千万级别的用户市场。

也由于苹果的规模足够庞大,在面对隐私和法规这些敏感问题上,不得不进一步慎重,因为每一个举措都会对整个行业和海量用户造成影响。

AirPods Ultra 撞上欧盟的法规墙导致难产,确实让人遗憾,但这也意味着,全球最有话语权的科技公司,将开始探索产品和规则共存的可能性。

每一次新技术诞生,都会与旧有秩序发生碰撞,千百年来皆是如此,这个过程这个过程看似是限制,实际上也是一次重新建立规则、重塑产品范式的机会。

不管是人机交互,还是规则法规,最终都将朝着更合理、更成熟的方向演化,对于所有人来说,这是好事。

#欢迎关注爱范儿官方微信公众号:爱范儿(微信号:ifanr),更多精彩内容第一时间为您奉上。

第一批用 AI 写代码的 10 后,已经被苹果邀请去 WWDC 了

每年春天,苹果都会面向全球的学生出一道不太一样的命题:用 Swift 语言,做出一个有表达、有情绪、也有想法的作品。

这就是 Swift Student Challenge(SSC), 参赛者需要用 Swift 创作一个 Swift Playgrounds App,在 3 分钟的体验里,说清一个点子、完成一次交互。其中的杰出获奖者,还将在下个月的 WWDC,到 Apple Park 亲身见证属于开发者的高光时刻。

2026 年的获奖名单已经揭晓,其中不乏来自中国大陆的年轻面孔,最小的,甚至只有 15 岁。

爱范儿和其中六位获奖者聊了聊,透过他们的故事和作品,我们看到这个时代的新生代开发者,如何挥洒独一无二的灵感,用技术讲述自己的世界。

个人经历就是最好的灵感

在分享自己的作品时,几乎所有获奖者都会先分享一段个人经历,然后再介绍自己由此出发,打造了一个什么样的 App。

这些经历非常多元,有的和身心健康有关,有的只是课堂或者旅游的感想,甚至只是一次玩乐。它们的共同点是,都存在着一个还没被解决的「问题」。

也因为这些作品都和个人感受高度相关,这些作品给人的印象,已经远远不止于「作品展示」,更让我看到它们具有真正上架 App 的潜力,并不禁去想,为何在这之前,没有人做这些应用?

具体困境,写进产品

这一组作品,都源于参赛者对日常的敏锐洞察。他们捕捉到了特定群体那些隐而未现的困境,在现有工具匮乏的现状下,他们选择拒绝等待,亲手为这些被忽视的需求定制了数字化的解决方式。

赵经纬 PMS.aid

赵经纬是一名典型的「行动者」。

她接触 Swift 的原因很简单:当她想把自己拍的猫猫视频剪辑、整理成实况照片分享,却发现市面上缺乏好用的 App,于是决定自己开发一个。

她的参赛作品 PMS.aid,也有着类似的创作背景。

赵经纬的朋友患有经前焦虑症(PMDD),表现为月经来潮时反复出现的情绪波动、躯体不适和行为障碍。

当她就诊时,想向医生展示自己的症状和心情变化,却发现目前缺乏了一个应用,能将和 PMDD 有关的数据集中展示。

于是,赵经纬就开发了 PMS.aid,专门面向 PMDD 和 PMS(经前综合征)患者,能够将月经、心情、日记等数据全部放在同一条周期时间线上,零散的数据成为完整的治疗方案。

赵经纬原本学习公共管理专业,后面发现自己更想要去尝试将人文社科和技术相结合,于是转至计算机专业,未来也将继续攻读人机交互的硕士学位。

她告诉爱范儿,自己已经定下了一个「开发者目标」——为每个人设计(Made for everyone)。

沈宸颉 Help the Bajau

沈宸颉的参赛作品 Help the Bajau,萌芽于一次志愿旅行。

今年 2 月,他在马来西亚仙本那进行志愿活动,接触到了被称为「海上吉普赛人」的巴瑶族社区,这群以海为家的原住民,正在面临严重的海洋环境污染问题。

于是他开发了沉浸式交互游戏 Help the Bajau,以巴瑶族的真实故事为背景,并参考了学术论文和巴瑶族社区个案,还使用了自己拍摄的真实素材。

AI 在他的创作过程中扮演了很重要的角色:刚刚接触 Swift 时,AI 回答了很多知识点的问题;Help the Bajau 的一些视觉元素,也是利用 AI 创造的。

但沈宸颉认为,工具只是一种辅助, 用心打磨每一个细节才能成就有温度的作品;技术也不只是冰冷的代码,它们在切实地改变世界。

赵芯澄 Orat

赵芯澄的开发者之路,源自于他的父亲的行动——没有任何开发经验,却利用 Swift UI 开发了一个 App 并上架 App Store,这给他带来了很大的鼓舞。

他的参赛作品 Orat,则植根于同学的真实情景:一次课堂展示,同学因为焦虑完全忘词,他想帮同学改变这种窘况,却没能在 App Store 找到简单好用的应用,于是决定自行开发。

Orat 是一款帮助用户智能训练演讲能力的 App,利用手势、姿态和语音识别,不断引导用户练习,并会生成相应的报告。

交互创新,前沿探索

这三位获奖者,更聚焦在「交互」的创新上,或许是一种对人机操作可能性的全新探索,又或许是数字化的方式,重写现实生活遇到的不快。

吴天禹 MagiBotics

「具身智能」火了有一段时间,机器人都连着上了两年春晚,但似乎我们和机器人之间,还隔着实验室的玻璃墙。

作为一名机器人专业的博士生,吴天禹的参赛作品「MagiBotics」,就是为了打破这种隔阂。

MagiBotics 通过简明易懂的交互方式,设置了三道颇具游戏感的关卡,用户在使用 App 的过程中,学习到机械臂的三种运动方式,并且最后还能利用 AR 技术,将用户设定好动作的「机械臂」,投射到自己面前。

吴天禹也告诉爱范儿,未来他将继续专注人机交互的方向,尤其希望能利用我们每个人都有的手机,搭建一条通往具身智能的桥梁,将这项前沿技术带给更多普通用户。

付佳鹭 Maestro

用「斜杠青年」来形容付佳鹭,最恰当不过:主修物理专业,出于兴趣辅修了计算机,制作过几台能避障、能语音控制的 AI 智能小车,也开发过记账和日记应用。

她的参赛作品 Maestro,却是一个「音游」。

在这个画风可爱的小游戏中,玩家将扮演「小熊指挥官」, 管理一支由4名小动物乐手组成的乐队,通过手部动作和面部表情,指挥乐队完成一次「即兴演奏」。

这种非常富有创意和趣味的交互方式,或许与付佳鹭自己和苹果产品的体验息息相关——她被 Swift Playground 编程平台的交互式教学吸引「入坑」,又被 Apple Vision Pro 的体感和沉浸式交互体验所震撼。

严禹 Pixel Beader

严禹接触 Swift Playground 的契机,源于短视频,他发现 Apple 开发者所使用的 Xcode,左边窗口刚刚键入代码,右边的画布就能实时显示变化,这种开发者交互模式深深吸引了他。

他开发参赛作品 Pixel Beader 的动机,则同样来自他的日常生活。

严禹尝试了最近很火的「拼豆」,却发现并没有想象中那么好玩——碰翻豆板就要全部重做,熨烫塑料会散发刺鼻气味,久坐还会腰痛。

于是他的参赛作品,就是一个「赛博拼豆」项目 Pixel Beader,用 iPad 和 Apple Pencil,创造了一个无害零损耗的虚拟创作空间,用户可以将任意图片转换成拼豆图纸,打造和收藏数字的 3D 拼豆作品。

AI 时代,编程能力更珍贵了?

过去两年,「编程」这个原本的手工艺活,正在被 AI 深刻改写。

去年推出的 Claude Sonnet 4 和 GPT-5-Codex,AI 可以像真正的工程师一样理解整个项目、自主完成测试、调试迭代,开发者只需要下指令。

作为参赛者中开发经验比较丰富的吴天禹,他深度经历了这个技术变迁。以前学编程,他只能依靠网上搜索、论坛查代码、看教学视频的「原始」方式学习编程和改进作品;而现在,他觉得自己更像一个「产品经理」,大部分代码可以交给 AI 来编写,效率提升数倍。

苹果对于「AI 编程」的态度,相当开明。今年 2 月推出的 Xcode 26.3 版本中,已经直接集成了 Claude Agent 和 OpenAI Codex。

即使作为一场竞赛,Swift Student Challenge 也并不将 AI 定性为作弊的「外挂」,反而拥抱 AI 在比赛中的运用。

像是两位中学生获奖者沈宸颉和赵芯澄,他们本身就有 Python、C++ 等编程语言的学习经历,AI 帮助他们大大降低了 Swift 的门槛,帮助他们实现技能的快速迁移,他们认为这很好补足了他们作为非专业开发者所欠缺的经验,并且由于 AI 带来的效率提升,可以花更多时间和精力,打磨应用要传达的理念。

Apple 开发者关系国际市场负责人谢恩伟认为,对于学生将想法付诸实践的能力,AI 工具是一次赋能,非常欢迎学生使用 AI 工具来调试代码。

甚至这也成为了竞赛的一种考察:今年开始,参赛者需要在参赛文档中分享使用工具的经验,确保最终作品体现出来的是自身的替代性思维和创造力,而非简单依赖 AI。

不管是谢恩伟,还是学生参赛者们,都一致认为,即使 AI 让「vibe coding」这种编程方式成为可能,学习编程依旧很有必要,甚至更有必要。

谢恩伟告诉爱范儿,比起以往任何时候,现在学习编程更有意义:

有一些非常核心的东西,比如对编程架构的理解、创意的火花,以及那些从未被验证过的全新思路,都需要发挥人类的聪明才智。
学习编程,实际上就是学习解决问题的语言,这种技能的价值,在于让你的创意变成实践。

这六名获奖者,或多或少都具有计算机的知识背景,即使是两名中学生,都学习过 C 语言,参加过不少相关的课后活动。

已经借助 AI 编程,让自己的作品上架 App Store 的吴天宇认为,想要把 AI 用好,本身还是需要学习相关的知识,理清做 App 的框架和逻辑,才能把提示词给写好。

说到底,AI 能力的上限,取决于用户给他投喂的提示词质量。

特别是在未来,当 vibe coding 更加普及,这不意味着所有人都能用这种「小白」的方式,打造一个优秀的产品,想要在同质化的 App 中脱颖而出,更需要懂编程,有表达。

付佳鹭则从另一个角度看待「学编程」的意义:本质上也是一种「有趣的思维训练」,学习一种解决问题的解决方式。

她尝试过 vibe coding,惊叹于它的低门槛,惊喜于自己能实现更多的想法,却也担心人们以后都会「少想一步」:

这或许是科技进步时,我们必须要面对的一个权衡问题。或者说,我们更需要解决的是,如何正确地利用 AI,来加速自己的「主动」思考,用一种巧妙的方式,将自己的硬性能力、创造力、生产力都提升,这或许是一个更好的愿景。

AI 可以为你编写代码,但它无法理解你应用程序的核心逻辑,也无法理解某些设计决策的重要性。

严禹则认为,既然 AI 将门槛降低,决定为什么做,比怎么做更重要:

具体内容的实施可以由 AI 接管,但创作者的竞争力将愈发取决于对底层原理的理解、对系统架构的判别,以及对审美的认知。AI是没有办法替代开发者的个人创作的,就好比训练数据,人工创作的数据质量往往比AI生成的要高得多,所以我相信在未来原创性的思考与产品会更加珍惜与可贵。

刚好,这就是 Swift Student Challenge 举办的宗旨。

这本来就不是一场常规的「竞赛」,它没有一道道需要解决的编程难题,也不看重作品背后代码的复杂程度, 苹果甚至不需要你开发一个完整的应用,只是想看看你能用 Swift 代码,做出怎样的自我表达。

对于这一批未来开发者的新生血液,在未来开发之旅中, AI 的角色注定会越来越重要,甚至能接管整个开发过程的编写工作。

凭借在开发者和业界影响力,苹果能够以 Swift Student Challenge 的全球竞赛,为摩拳擦掌的准开发者们,上好第一课:

「技术」只是应用诞生的前提,「表达」才是应用脱颖而出的根本。

#欢迎关注爱范儿官方微信公众号:爱范儿(微信号:ifanr),更多精彩内容第一时间为您奉上。

中国拿下这届 AI 顶会半壁江山,清华一家单挑斯坦福加 MIT

全球 AI 顶会,快成中国卷王的专场了。

每年 AI 顶会放榜,各大机构都会暗戳戳地发喜报,比拼谁家被收录的论文多。但今年 ICLR(国际学习表征会议)放榜后,一位名叫 Dmytro Lopushanskyy 的研究员,干了一件极其硬核的事。

他没有去引用官方那些现成的统计表格,而是写了整整 250 条正则表达式,把 ICLR 2026 全部 5356 篇接收论文的 PDF 挨个下载下来。

接着,他硬是从每篇论文首页的缝隙里,把机构署名全给抠了出来,并利用这几百条代码规则进行清洗与归一化,自动给「麻省理工」和「MIT CSAIL」这种同一机构的不同写法做了合并。

为什么要用这种最原始的手工分类法?

因为这老哥发现,我们平时习惯引用的那些学术统计平台数据,都是按「人」来追踪的。举个例子,一个在清华苦熬四年读博的学生,发了篇极具含金量的论文,毕业后去斯坦福当了教授。你猜怎么着?系统一刷新,这篇在五道口诞生的论文,就自动变成了斯坦福的学术产出。

这种偏差,长期以来硬生生压低了中国机构的实际贡献,同时虚抬了美国的数字。而当 Dmytro 用 96% 的解析成功率,把去伪存真后的真实数据画成一张热力图后,我们才得以一观真实数据的全景图。

一张学术热力图,看懂中美 AI 的真实格局

别的不说,这组数据确实很有冲击力。

这张图上中国机构面积之大,超出了很多人的预期。其中中国大陆机构,贡献了 43.7% 的接收论文。美国呢?31.9%。

如果你把中国香港(7.7%)算进来,本届 ICLR 超过一半的论文署名机构,全都来自中国。 至于老牌的欧洲列强?整个欧洲大陆加起来才 5.3%,甚至比不过新加坡(5.5%)这一个国家的产出。

更有意思的是具体机构的排名。

今年,清华大学以 332 篇的产量登顶全球单一机构第一。 这是什么概念?斯坦福 177 篇,麻省理工 167 篇。清华一家的产出,几乎是美国排名前二的两大超级名校的总和。紧随其后的上交、北大、浙大,也全都稳坐全球第一梯队。

不止高校阵营,国内产业界的科研表现同样亮眼。

阿里、上海 AI 实验室、华为、字节、腾讯,这五家中国科技公司/研究机构加起来发了 582 篇论文。有些媒体以前老爱吐槽中国互联网公司只懂商业模式微创新,不懂底层研究。这次 ICLR 2026 的数据一出,算是打破了这个刻板印象。

说白了,中国 AI 早就不是靠一两个天才的灵光一现,而是变成了一套精密、庞大、高度体系化的研发引擎。

不过,在这些令人振奋的数据背后,我们也不能忽视客观存在的指标。

比如虽然我们在总数上超越,但在仅占接收总量 4% 的 Oral(口头报告,通常代表最具原创性和启发性的方向)论文里,美国机构依然占了约 40%,而我们是 30%。

我们在工程化扩展上占据了绝对的规模优势,而美国在定义新方向上依然保有相对领先。这也是中美 AI 之间相对真实的现状。

硅谷的科研 AGI,与中国实验室的极致务实

如果说热力图是一份宏观体检报告,那艾伦人工智能研究所(AI2)知名研究员 Nathan Lambert 今年 5 月来北京、杭州等地的 36 小时调研,就是一次深度的微观观察。

他在走访了智谱 AI、月之暗面、千问、美团、小米、零一万物等 AI 企业后,回国后写了篇关于中国 AI 实验室内部观察,并在硅谷引发了大量讨论。他看到了中国大模型能跟美国五五开的底层逻辑——极低的组织摩擦和极度务实的年轻人。

在 Lambert 看来,美国顶级实验室往往存在一个致命的弱点:Ego(自我)太强了。

训练大模型是一项极其复杂的系统工程,从数据清洗、分布式通信优化到强化学习对齐,每个环节都需要互相妥协。但在硅谷,那些明星研究员往往带有强烈的个人偏好。

据传 Meta 的 Llama 团队就曾因为路线之争经历过动荡,大佬们各自为政,都想把模型往自己主导的方向推进。反观中国实验室,Lambert 发现这里有一种异于寻常的务实。

研究员们不在乎谁的方法听起来更高级,大家的目标高度一致:只要能把模型的某个指标提上去,枯燥的脏活累活谁都愿意干。 这种务实让整个团队的摩擦力降到了最低。

Lambert 还归纳了这种文化倾向具体带来的优势:更愿意做不起眼的基础工作来提升最终模型;刚入行的人没有经历过以前几轮 AI 炒作周期,能更快适应最新技术路线;Ego 小,组织架构能相对平稳地扩大规模;以及大量善于在现有方案基础上攻坚的人才储备。

更让 Lambert 惊讶的是,在美国,顶级实验室的实习生往往只能接触边缘项目。但在中国,在读的硕士和博士生深度参与核心大模型的研发。Lambert 敏锐地指出了这种做法的核心优势:没有历史包袱。

大模型的技术路线迭代极快。资深科学家往往有「路径依赖」,觉得自己研究了十年的老方法才是真理。但中国的年轻学生不同,只要有数据证明新路线有效,他们立刻就能抛弃旧方案,快速切换赛道。

值得一提的是,Lambert 发现,中国 AI 圈内部的氛围远比外界想象的和谐。各家实验室之间,私下交流满是相互尊重,所有中国实验室都敬畏字节跳动和它广受欢迎的豆包模型,因为字节是中国唯一一家真正处在前沿位置、同时又保持闭源路线的实验室。与此同时,几乎所有实验室也都非常尊重 DeepSeek,认为它是在研究判断和执行品味上最出色的团队。

在这次调研中,还有一个细节特别值得关注。在硅谷,顶尖的 AI 研究员不仅是工程师,往往还扮演着半个「哲学家」的角色。他们喜欢在播客上高谈阔论,探讨「通用人工智能(AGI)会不会在 2030 年毁灭人类」,频繁讨论 AI 安全与伦理边界。

于是,Lambert 也试探性地问了中国同行对 AI 经济影响和长远社会风险的看法,但得到的反应不是长篇大论,而是普遍的困惑。关于毁灭人类这种宏大命题,暂且不在他们当下的工作边界之内。

这种对宏大叙事的免疫,反而成了一种竞争优势。它减少了团队在哲学层面的内耗,让所有的脑力都持续集中在工程落地和指标突破上。
在中国的实验室里,导师、博士生与企业工程师之间形成了一种极短的反馈回路。

这种模式消解了学术界与工业界之间的壁垒,正如 Nathan Lambert 所观察到的,这种低摩擦的组织形式,让中国 AI 展现出了类似基建狂魔般的推进速度——一旦方向明确,便能以排山倒海的智力密度迅速抹平技术差距。

当然,这套打法在特定窗口期内行之有效,但随着规模效应的红利逐步见顶,下一阶段的核心壁垒终将回归于「原始创新能力」的较量。

届时,高密度的人才协同网络和某个敢于打破既有框架的个体,在 AI 的下半场互为成全,缺一不可。

#欢迎关注爱范儿官方微信公众号:爱范儿(微信号:ifanr),更多精彩内容第一时间为您奉上。

下个月的苹果 WWDC,假如 iCloud 变成 iClaw……?

距离苹果全球开发者大会 WWDC 还有一个月不到的时间,彭博社又送上关于苹果新系统的全新爆料:

苹果准备对 macOS 27 的界面进行一轮小幅调整,进一步完善「液态玻璃」设计语言的视觉表现。

但问题在于,对于如今的 Mac 来说,除了需要继续打磨的 UI,最迫切的更新显然远不止于此。

液态玻璃,缝缝补补又一年

对比 iPhone 以及 iPad,Mac 的性能和续航都更有盈余,实际上 macOS 26 的界面,视觉效果要更接近去年 WWDC 上面演示的「满血版」液态玻璃。

不过,液态玻璃立项之初,就是专门为 OLED 屏幕设计的,而目前所有 Mac 产品都在使用 LCD 屏幕,在呈现半透明、阴影和玻璃质感的方面,效果不如 OLED。

于是 macOS 26 的一些高透明效果和阴影,会导致列表和文字可读性下降——这也是「液态玻璃」被一直诟病的问题。

和 iOS 27 一样,macOS 27 也将仔细打磨液态玻璃,让它更接近苹果一开始设想的效果:兼顾透明度和可读性,同时进一步优化能耗表现。

不过,macOS 26 在 UI 上的问题根本不止于液态玻璃本身,不对齐的圆角、大量分散注意力的小图标,以及重新设计后辨识度大打折扣的应用图标,对可读性和美观层面都造成了一定的影响。

图源:Daring Fireball

苹果评论员 John Gruber 对于 macOS 液态玻璃的点评相当一针见血:作为一种「内容优先」的设计语言,液态玻璃让系统 UI 隐身于媒体之后,在 iPhone 上或许能行,但作为强调生产力而非内容消费的桌面平台,Mac 包含大量的窗口、组间,因此复杂性更高,仍然需要应用界面保证清晰的结构、分明的功能区域,和强辨识度的界面。

在 Stephen Lemay 接任设计总监一职后,这位在苹果服务近 30 年的老将表现让人期待——Lemay 以公司内部的高口碑和稳定发挥著称,或许也称得上是苹果内部目前最懂苹果系统界面的人。

在他的把控下,macOS 27,以及 iOS 27 如何扭转液态玻璃褒贬不一的口碑,回到实用性和美感并举的方向,确实值得期待。

但对于 macOS 来说,界面上的「拨乱反正」固然必要,却已经不是最重要的更新了。

对苹果而言,未来系统的更新有两条主线:一方面,优化系统稳定性,另一方面,则是为 Apple 智能预备好。

最好的 AI 载体,需要一个 AIOS

根据彭博社爆料,苹果打算为「Apple 智能」打造一个「Extensions」功能,允许用户更换第三方 AI 模型,例如 Google Gemini、Claude 等等。

Siri 除了会集成到邮件、短信、相册等应用,自己也会化身聊天机器人,成为一个单独的应用。更多 AI 功能还会覆盖文本、图像等生成与编辑任务。

但这些更新,说实话更多还是做 AI 的单点功能,并非系统级别的编排能力,并未能进一步发挥 Mac 硬件上的优势。

今年年初的龙虾热,让 Mac mini 这个前年才火过的产品,又再一次出圈,这次火到苹果自己也没库存了,「入门版」在官网彻底售罄。

Mac 和 Windows 在不少层面上互有胜负,但在 AI 的问题上,Mac 作为「最佳 AI 容器」的论断几乎毫无争议。

关于这个问题,爱范儿已经出过一篇文章详细讨论。简单来说,就是因为 Mac 不管是 UNIX 系统底层还是集成运存的硬件架构,都非常契合 AI Agent 和大模型的运行方式,并且由于 ARM 架构的特性,运行功耗低还静音,非常适合 AI 常驻。

这更像是「无心插柳柳成荫」,苹果其实一开始并没有围绕 AI 去打造自己的 Mac,却无意间完成了所有 AI 的技术储备,严格意义上说是一种「适配度优势」。

从这个角度看,macOS 即使什么都不做,本身 Mac 也已经是一个很好的 AI 平台。苹果完全可以走 App Store 的逻辑,让用户自己部署想要的第三方 AI 智能体,自己继续扮演「收过路费」的角色。

这确实也是苹果长期以来的做法:在移动互联网兴起之时,苹果没必要自己做搜索引擎和网购平台。而 AI 时代,大众的需求变化万千,有人需要一个能剪辑的 Agent,也有人需要一个搞科研的 AI,必须要靠第三方满足。

在今年 5 月的财报会议上,苹果特别提到了 AI 公司 Perplexity 的智能体产品 Personal Computer,认为这种产品很好利用了 Mac 平台的能力。

既然觉得人家做得不错,何不自己上手做一个「iClaw」?

第三方 AI 百花齐放固然很好,这和苹果自己做一个却并不冲突,并且很多事情,只有第一方能做得好,能做得让人放心。

第三方应用再强,也很难自然获得系统级的上下文,苹果不可能将最底层的权限开放,只有系统底层自己能对文件位置、窗口状态、本地个人数据知道一清二楚,而 AI 应用的体验,往往就卡在了这些权限边界之上。

其实苹果并不是没有这种想法,那个迟迟没能推出的 AI Siri,其实就有着类似的构想,可以读取用户的文本和应用窗口,可以跨应用进行检索和处理。

对比 iPhone 和智能手机,AI 应用的主流使用场景其实还是在于桌面端,这也是为什么 Mac 能成为今年最热门的 AI 硬件,但苹果却没有继续在 macOS 的系统层面,赋予 Mac 足够分量的原生 AI 能力。

隔壁的 Windows 阵营在这方面要激进不少,系统层面有「Recall」和 「Copilot」这样的 AI 功能入口,联想和荣耀这样的 OEM 厂商,甚至为产品准备了开箱即用的龙虾应用,砍掉了门槛,并因为和本地深度集成,能节省不少 Token。

微软自己也已经坐不住了,据悉正在将原本只能你问我答的 Copilot,改造成一个 24/7 在线的数字分身,实现类龙虾能力。

对比 OpenAI、Anthropic 或者 Google,说实话我更愿意将这些敏感的数据,交给在隐私保护方面更上心的苹果。

更深一步,macOS 最缺少的不是 AI 应用,而是 AI 时代的「基建」。Mac 已经准备好了 AI 大有可为的土壤,但 macOS 还没能成为一个真正意义上的「AI 系统」。

苹果不仅可以做自己的 AI 智能体能力,也需要把模型、权限、上下文、自动化和跨应用任务重新梳理,让系统成为 AI 工作流的原生中介,成为一个掌控所有 AI 的「任务集散中心」。

就像是智能体运行所需要的「个人知识库」,现在我们用文件夹也可以搭建,但它还不够好用。

苹果完全可以自己承接这个环节,用户靠 Mac 自带的工具搭建、生成一个「知识库」文件,它可以和 Apple ID 绑定,利用 iCloud 流转,这样不管用哪一家的智能体服务,都能快速调用自己的知识库,不用从头开始配置,同时还能保证自己的内容被苹果的隐私政策保护。

并且,这些配置的模块都能整合进入 Apple 的订阅系统之中,iClaw 和 Token 也能成为苹果在 AI 时代提供的增值服务。

iClaw 示意图,AI 生成

实际上,苹果已经开始了这样的进程。在 macOS 26.1 中,苹果集成了「模型上下文协议」,一个面向不同 AI 的通用开放标准,Agent 可以通过这个协议,访问用户的个人数据;苹果的基础模型框架,让 macOS 开发者可以调用系统内置的基础模型,零网络延迟,零 API 费用,数据不离开设备。

作为计算机图形系统的祖师爷,macOS 在过去的数十年间都是围绕「应用」构建的桌面系统。

在接下来十年,应用和图形界面还会是人机交互的主流,因此 macOS 27 要将界面风格修缮得更好,当然非常重要。

但未来五十年甚至更远,AI 都会成为无可避免的主旋律,macOS 不可避免会被进一步改造,成为一个围绕「任务」运转的 AIOS。

#欢迎关注爱范儿官方微信公众号:爱范儿(微信号:ifanr),更多精彩内容第一时间为您奉上。

火过 iPhone?美国「小天才电话」爆红,「什么都不行」是最大卖点

翻开纸质通讯录、顺着名字找到号码,再挨个按下按键,攥着听筒等待漫长的「嘟嘟」声。

一连串动作,是一代人过去式的集体记忆。

但最近,这个动作正在北美快速翻红——

一台名为 Tin Can (铁罐)的座机,在北美打造了一个小天才式的社交网络,上市短短一年就卖出了数十万台,积压的预购名单一度接近十万人。

皮尤研究中心(Pew Research Center)的调研报告显示,在美国 2000 多万个 8-10 岁儿童中,有 29% 已经拥有自己的智能手机——换言之,还有 70% 的儿童用户拥有潜在的购机需求,而 Tin Can 切中的便是这个千万级用户规模的市场,也是其中最有机会从 iPhone 虎口夺食的产品。

Tin Can 是一台货真价实的座机

别误会,Tin Can 并非标题党,不是配置齐全、科技爆炸却用概念包装的玩具。

这台售价 100 美元的设备由两部分组成:一边是可以挂在墙壁上的底座,另一边则是带有听筒、麦克风和实体数字按键的话筒。两部分之间,由一根盘旋聚集的电话线紧紧相连。

我竟然需要专门强调一台座机拥有实体按键,真是一件略显荒诞的事情。

免提扬声器、快捷拨号键以及答录机等必备功能也应有尽有。

Tin Can 的使用方式也很简单——这台座机可以连接 Wi-Fi,但没有任何屏幕。通上电,连上网,同款设备之间互打完全免费,也可以直接拨打 911 等紧急电话报警。

如果需要与外界联系,家长只需每月支付 10 美元订阅费,就能设置专属的接听白名单,彻底杜绝陌生来电,屏蔽网络推销。

Tin Can 甚至想好了如果父母并不生活在一起的场景:两个家中各放一台 Tin Can,共用一个号码。无论孩子去哪边,都不耽误接朋友的电话。

从功能上看,它真真切切就是一台符合你认知的「座机」,仅此而已。

但这一台简单的座机,催生了一种颇有意思的使用习惯——

为了防止孩子们一边打电话一边满屋子做别的事情,Tin Can 刻意没有内置电池,必须插电使用,将孩子钉在原地,必须专心致志地讲话;

再加上没有屏幕,也没有一键同步的联系人列表,想要找朋友聊天,孩子们必须回归最原始的动作:把同学的号码一笔一画抄写在纸质通讯录上。然后在单纯的语音通话中,学会如何倾听,以及如何应对自然停顿时的片刻沉默。

Tin Can 首席执行官 Chet Kittleson 表示这也是他的灵感源泉:

文字与视频阻碍了真实沟通能力的培养,每个人都该学学,如何以一种更有意义的方式去面对通话间自然的停顿间隙。

这台小小的设备,甚至引发了一场带有荒诞色彩的事故。

就在刚过去不久的圣诞节,由于被太多家庭当作礼物拆开并连上 Wi-Fi,激增的激活量直接把 Tin Can 的服务器干趴下了。

一家生产座机的公司,竟然因为新用户太多而遭遇服务器宕机。

更魔幻的是,作为初创公司的初代硬件,Tin Can 其实有不少毛病:底层 VoIP 导致通话有 1 秒的延迟;实体按键对小孩来说太硬;USB-C 供电接口一扯就松。

甚至,市场上已经开始出现虎视眈眈的模仿者,比如英国的 Karri 和准备推出低价竞品的 Pinwheel。

但即便如此,家长和孩子们依然对它情有独钟。一部分原因,离不开它在设计上的巧思——

作为一台事实上在反科技的设备,Tin Can 选择了一条老少通吃的方案,以明快的奶油配色和玩具风格的包装来讨孩子们欢心,抹平年轻一代对老旧事物的抗拒感;转头又用经典的挂壁座机造型和完全复古的物理交互,快速唤起父母们的成长记忆。

为了强化肌肉记忆里的复古感,Tin Can 在细节设计上也颇为讲究。Kittleson 曾透露,他甚至花了大把时间去测试卷曲电话线,只为寻找最完美的弹力和拉伸感,让千禧一代的父母在拿起话筒的瞬间,就能被拉回 90 年代的自家客厅。

这种迎合非常聪明。

Tin Can 首席执行官 Chet Kittleson 显然深谙一个道理:Tin Can 的使用者是儿童,决策者则是家长,为了把大人和孩子一块儿「拿捏」住,他道破了背后的玄机:

我们本可以打造一款现代设备,把它设计成迎合儿童的模样。但我希望它能与真正的买家——也就是父母们——产生直觉上的联结。直接唤醒大人们记忆中那个简单的童年,那正是我们当下都在渴望的东西。

但显然,如果只有设计,那 Tin Can 充其量只能算个精巧的玩具和别致的礼物。

想要卖爆,还不够有说服力。

焦虑,是 Tin Can 卖爆的关键

放眼望去,一场针对未成年人数字防线的阻击战已经在全球打响。

AI 时代,内容生产成本大幅度降低,垃圾内容密度来到历史高峰,辨别成本进一步增加,对于三观正处于构建时期的未成年人已经形成实质困扰。

纽约大学心理学家在《焦虑的一代》中给出了惊心动魄的数据:2010 至 2015 年间,随着智能手机和社交媒体的普及,美国青少年的抑郁率和焦虑率分别飙升了 134% 和 106%。

▲ 数据与图表来自 @Jonathan Haidt

澳大利亚的 16 岁以下社交媒体禁令已经正式落地。英国政府也正在酝酿类似的强硬法规,并有望在接下来的时间里落地实现。

大洋彼岸的洛杉矶,一位 20 岁的女孩将 Meta 和 Google 告上法庭,指控巨头们的算法诱导导致了她的心理健康问题,并赢下了这场具有里程碑意义的诉讼。

▲ Meta 为此支付了 210 万美元,图片来自 @路透社/莫娜·爱德华兹

家长端的民间自救同样在狂飙。美国的「Wait Until 8th」(八年级前不给智能机)运动,以及前 NFL 球星妻子带火的「厨房电话」原则(只把座机放客厅,手机禁入卧室),都在试图把孩子从屏幕前硬拽回来。

在社会整体逐步转向社交媒体焦虑的时候,Tin Can Untechnologies Inc. 诞生了。

这家初创公司的 CEO Chet Kittleson 也是一位父亲。他的创业初衷极其个人化:他受够了每天为了帮孩子约个玩伴,必须在家长群里充当「社交秘书」来回发短信。

带着「让孩子自己搞定社交」的执念,他和两位老朋友在厨房餐桌上熬了一周,拼出几台原型机塞给了女儿的朋友。

奇迹在第二天早上 8 点 15 分发生了——话筒响起,那是他女儿第一次没有借助任何大人,自己接到了朋友一起上学的邀约。

随后,Kittleson 更是亲自跑腿,挨家挨户上门安装了大约五十台原型机,边装边问家长最担心什么,再据此调整产品。

这次厨房试验让 Kittleson 看到了背后的巨大潜力。

2025 年 4 月,Tin Can Untechnologies 正式推出 Tin Can 座机,直接从硬件底层抽走「上网」这个选项。

全行业都在疯抢 AI 门票的狂热浪潮中,这家名字中带有「非科技」的公司,被资本一眼相中。他们先是拿到了 350 万美元融资,随后又斩获了由顶级风投 Greylock Partners 领投的 1200 万美元种子轮。

Greylock 的合伙人 Mike Duboe 在一份新闻稿中明确指出这家非科技公司的价值:Tin Can 正在通过产品重新定义我们如何看待现代的社交方式。

▲ Mike Duboe

资本向来嗅觉敏锐。吸引真金白银的肯定不是座机或 Wi-Fi,而是全球父母逼近临界点的集体焦虑,以及这背后潜藏的巨大市场空白。

带着充足的弹药,Tin Can 拳打 iPhone 脚踢 Galaxy,正成为北美校园里一股逆势生长的新风潮。

堪萨斯城郊外的 Nativity Parish 学校,高达 95% 的家庭加入了由 Tin Can 为核心的计划,以此建立未成年人间的社交新范式;

在洛杉矶的圣雅各布圣公会学校,校方正计划给全校 220 个家庭免费发放这台设备,以代替暑假期间极易引发攀比、甚至演变成隐形霸凌的群发短信。

要求单个孩子放下智能手机极度困难,会让他们立刻沦为同龄人中的社交孤岛。但如果有数百个家庭共同约定呢?

把孩子们拉进同一个没有滤镜、没有点赞、没有陌生人,一切社交均建立在现实世界之上的局域网,一切就变得顺理成章。

中美都有小天才,但和而不同

某种意义上,这套玩法对中国读者来说并不陌生。从猛烈的扩张势头与建立未成年人社交新范式的角度来看,Tin Can 简直就是「北美版的小天才」。

但产品的诞生和演进离不开环境,两个时期的世界给了小天才与 Tin Can 不同的思路:

小天才的成功,建立在成熟的「社交网络效应」与「注意力经济」之上。

自 2015 年初代产品问世以来,小天才迅速登顶中国儿童手表市场。巅峰期曾占据国内半壁江山,如今依然以近 30% 的份额稳居行业第一,其高端旗舰机型的售价已经高达 2399 元,堪比一台智能手机。

在多年迭代后,为了维持生态的生命力,小天才开始不断做加法:从最初的定位和通话,陆续加入了微聊、「碰一碰」交友、朋友圈主页,甚至引入了点赞积分系统。以此保证产品的 DAU 日活。

但所谓「成也社交,败也社交」。

高度冗余的功能,让产品不可避免地向着「微缩智能手机」演化。浏览器、陌生人社交,逐步引起中国家长的焦虑与官方的注意,小红书上有不少家长讨论小天才手表对孩子的负面影响,福建省则从 2022 年开始完全禁止中小学幼儿园学生携带电话手表进入学校。

反观 Tin Can,逻辑截然相反——

当全球智能设备厂商都在为越收越紧的未成年人保护法规焦头烂额,被迫投入高昂的内容审核成本时,Tin Can 凭借「没屏幕、没浏览器、没文字」的物理设定,直接完成了「监管套现」。

同时,家长每个月掏出 9.99 美元订阅费,就能买来一个陌生电话打不进、有害信息看不了的数字真空地带。为公司带来了极其稳定、高毛利的经常性收入(ARR)。

这条罕见的变现路径,也被称为 SaaS-enabled Hardware,硬件即服务。

说到底,这两款跨越大洋的现象级产品,面对的是相同的痛点:孩子渴望社交,而家长恐惧失控。

一切商业的成败,抛开时代的底色去谈,终究是纸上谈兵。时代提出什么样的问题,产品就必须交出什么样的答卷。

诞生于移动互联网蓬勃发展时期的小天才信奉「做加法」;而在数字疲劳焦虑时期,Tin Can 则笃信「做减法」。

被历史记住的产品,都是在恰当的节点,做出了最顺应人心的抉择,应运而生。

让我有个美满旅程

#欢迎关注爱范儿官方微信公众号:爱范儿(微信号:ifanr),更多精彩内容第一时间为您奉上。

大疆 Pocket 4P 上手体验:欲穷千里目,更多摄像头

如果要选一个近三年来最火的相机,大疆 Pocket 3 绝对榜上有名。

自 2023 年 10 月发布以来,Pocket 3 在两年不到时间里卖出超过一千万台,大疆 CEO 汪滔在前段时间的采访中直接表示:

我们没想到这是个几百亿级别的市场,在便携相机/卡片机这个品类,我们市占比比索尼、佳能、理光和富士全加起来还要多几倍。

前不久,大疆正式发布 Pocket 4,用更高的像素与视频规格回应了市场期待,爱范儿也第一时间上手评测了 Pocket 4。

谁曾想,大疆并未偃旗息鼓,紧随其后发布了 Pocket 4P 的预告。

爱范儿也第一时间拿到了 Pocket 4P,在体验了一番这台双摄 Pocket 后,我们认为手持云台相机这个极其年轻的品类,终于在经历爆火出圈之后,迎来了第一次重大更新。

长焦双摄,Pocket 更专业

拿到 Pocket 4P,最直观的改变是影像模组变大了。

像推开 Zippo 打火机那样拨开屏幕,硕大的模组在云台电机的驱动下迅速进入工作状态,垂直竖立而起。

影像模组中一共容纳了两颗镜头,底部的镜头下方写有「1 inch」字样,而顶部上方则写着「3×」。

这颗 3× 镜头,就是 Pocket 4P 的最大更新。

受限于极其紧凑的机身,历代 Pocket 都只有一颗广角主摄,这带来了一个天生的痛点:很难拍好特写。

广角镜头自带透视变形,强行贴脸拍摄,画面边缘不可避免地会被拉伸得像哈哈镜;且广角镜头很难将主体与杂乱的背景剥离,做出好看的虚化。

而 Pocket 4P 打算用一颗全新的 3× 中长焦,直接跨过这道坎。

在我们的实际体验中,这颗 3× 中长焦给了我深刻印象——

这个镜头更符合人眼聚焦的视角,更窄的画幅可以有效减少杂乱元素的干扰,拍出更干净的画面。

值得一提的是,这颗镜头还带来了非常自然的虚化,焦外过渡柔和,可以推测其配备了大光圈,并且最近对焦距离大约在 25 厘米左右(甚至更近),可以怼脸拍摄人物或静物细节。

恰到好处的焦段、自然的虚化与足够近的对焦距离,让 Pocket 4P 在拍摄日常琐碎时,能呈现出更贴近人眼自然注意力的构图。配合柔和的焦外表现,画面立刻就多了一层电影感。

当然,客观来说,这颗镜头也并非完美无缺。我们在实际使用中发现,如果用 3× 镜头快速横移拍摄近处物体,画面会出现轻微的果冻效应。不过,只要将镜头推向远景,或者稍微放缓运镜速度,表现就会稳当得多。

顺应双摄的加入,交互逻辑也变得更为专业了——按下屏幕左下角的变焦键,机器会直接调用 3 倍光学变焦;双击按键,它会直接跳到 6 倍。

如果你足够熟悉 Pocket 3,会发现之前更熟悉的 2 倍预设被拿掉了。显然,大疆在通过这种方式,引导用户优先去感受这颗光学长焦带来的纯净画质。

新增的长焦抢尽了风头。但在几天的重度使用后我们发现,Pocket 4P 上看起来似乎没什么变化的 1× 主摄,也很强。

在体验 Pocket 4P 的几天时间里,主摄在极大光比下的表现给我留下了深刻印象,在夕阳下的山坡上,落日的高光压制得很好,山坡上的野花和藤蔓细节也保留得非常丰富,相较 Pocket 4 在传感器方面应该也有所升级。

把焦段补齐、把宽容度拉满,至此,这台机器的野心已经彻底暴露——这是目前最专业的 Pocket。

好拍、拍好,是 Pocket 的首要任务

硬件更专业了,并不意味着门槛变高了。

让 Pocket 好用、让用户拍好,依然是 Pocket 系列的核心产品逻辑。

在 Pocket 4P 上,这颗 3× 中长焦无疑是最立竿见影的升级。但在别处,还有些不起眼的升级,也为这个目标服务——

摇杆就是一个典型的例子。过去产品上的摇杆,只有「动」和「停」两种状态,很难精准控制云台,稍微用力,镜头就容易猛地甩过去,很难拍出平滑的过渡。

在 Pocket 4P 体验后的采访中,Pocket 产品经理向我们介绍道,Pocket 4 全系列都换上了一颗定制的模拟量摇杆,给云台的转向加上了更细腻的力度分级,从而降低运镜的难度。

这对普通用户非常友好,手指推多深,云台就转多快,单手就能相对轻松地控制平移和推拉。

拍摄顺手了,出片效率也得跟上。

在 Pocket 3 上,Live Photo 成为大家分享照片的火爆载体,用户热衷于将数秒的视频浓缩为一张实况照片,便于社交媒体分享。

但以往,想要导出一张 Live Photo,需要先拍摄视频,然后再去 DJI MIMO 截取 Live Photo,再去拼图。视频占用空间多不说,创作热情通常也在流程反复中消磨殆尽了。

而从 Pocket 4 开始,直接将 Live Photo 功能集成在机身内部,一键就可以直出 Live Photo——这些特性也延伸到了 Pocket 4P 上。

为了配合长焦,物理空间的交互也得到了延伸。

3 到 6 米是中长焦极佳的观察距离,但对单兵作战的创作者来说,这意味着要在相机和被摄点之间频繁折返。

大疆的产品经理告诉爱范儿,未来将会专门为 Pocket 4P 制作一个体积极小、自带屏幕的专属遥控器。

出门自拍或者请路人帮忙时,用户可以站在远处,看着遥控器的屏幕从容调整构图。哪怕是一个人探店,也不用重复来回走动,就可以随意拍摄。

这些功能表面上看是增加了操控方式,往深了探究,其实是在重塑人与镜头的关系。机器不再是一个需要你时刻盯着、生怕它跑焦的「电子大爷」。它变成了一个安静站在几米外、随时听候你差遣的隐形摄影师。

一台设备,往往由硬件决定上限,但决定谁能用好它的,永远是交互。在影像领域,复杂的技术往往带着一种侵略性——晦涩、需要通过练习才能驾驭它。

但在 Pocket 4P 上,我们看到了一种谦卑。

把复杂的算法和结构藏在交互逻辑之下,这种克制恰到好处。

Pocket 4P 的 P,究竟是什么?

按照惯例,这台加上了长焦、影像能力大幅跃升的设备,理应冠上「Pro」的后缀。

但大疆偏偏只给了一个单薄的字母 P。

细想之下,这也合理——

消费电子领域,标榜 Pro 往往是为了在既定赛道里跟对手比拼高低,划分出森严的等级。但你环顾四周会发现,手持云台相机这个极其细分的品类里,根本找不到一个能够对标的竞品。

这里还是无人区,只有大疆一个玩家。

抛开命名上的博弈,回到实际体验,这个 P 显然有着更丰富的解读空间。

可以是 Pro。

不管是更专业的 D-Log 曲线、更高的动态范围,还是特写中长焦,都让 Pocket 获得了前所未有的专业属性,具备跨入生产工作流的硬实力。

也是 Popular。

多出一颗镜头,换上定制摇杆,并没有垒起更高的技术高墙。相反,大疆利用强大的硬件冗余,拉低了普通用户拿起相机就能拍出好东西的技术门槛。复杂的对焦测光与繁琐的后期大大压缩,用户只需要开机、对准想留住的风景,然后按下拍摄键。

还能是 Possibility。

手持云台相机依然是个年轻物种,远没摸到进化的天花板。大疆今天能用把双摄塞进口袋,明天在这个形态里搞出更专业的电影机分支,也不是没可能。

跳脱出设备本身,最迷人、最丰富的可能性,永远在握着它的人身上。

1991 年,普适计算之父 Mark Weiser 在《科学美国人》杂志中写过一句往后被奉为圭臬的话:

最深远的技术,往往是隐于无形的,它们将自己编织进日常生活的肌理当中,直到与生活融为一体,无法分辨。

Pocket 4P 把长焦镜头和云台防抖揉进机身,以简单直观的交互、趁手好用的尺寸,顺理成章地装进更多人的口袋——而当影像设备隐于无形,影像故事也更加纯粹。

普罗大众的生产力,就由此而来。

爱范儿相信,等这台口袋电影机揣进越来越多人的口袋里,稀松平常的生活图景,一定还会长出更多东西。

让我有个美满旅程

#欢迎关注爱范儿官方微信公众号:爱范儿(微信号:ifanr),更多精彩内容第一时间为您奉上。

vivo Y600 Pro 体验:这部「充电宝手机」,为什么对 vivo 很重要

半年前,vivo Y500 Pro 上市,主打一颗 2 亿像素的三星 HP5 大底主摄,是当时档位首发。半年后,它的继任者 Y600 Pro 来了,后置只剩一颗 5000 万像素主摄,连副摄都没凑,但换来的是一块 10200mAh 的超大电池。

上一代留下的东西,Y600 Pro 几乎一样没接。

「换电池」本身其实不算什么新鲜事,「充电宝手机」市面上也不少。但 Y600 Pro 真正不一样的地方,是它顺手把过去 Y 系列追求的「影像 + 轻薄 + 旗舰感」几乎全部放掉了,换上了一整套完全不同的思路:超大电池、自研通信增强芯片 E1、IP68 + IP69 双重防护认证……

这是 vivo 在 2000 元档上,第一次彻底放弃「旗舰缩水版」的老打法。

从这个意义上讲,Y600 Pro 可能是 vivo 今年最重要的一款产品。

它不一定最贵、不一定最亮眼,但它代表了 vivo 这家公司对入门级市场的一次重新理解。

从 2 亿像素到 10200mAh

Y 系列在 vivo 整个产品线里的位置,过去几年是相对清晰的。X 系列在最上,承担技术与品牌势能;S 系列居中,主打外观、自拍与轻薄;Y 系列在下,面向线下市场和价格敏感的用户。

过去 Y 系列最常用的策略,是把 S 系列的核心卖点保留下来,把成本结构调整到入门用户能负担的水平。

上一代 Y500 Pro 主打拍照,是这套打法的典型样本:把旗舰影像线的一部分能力做小,搭配千元价位的整机定义,得到一台面向预算有限、但仍然在意成像的用户的产品。

这台手机在线下渠道卖得不错,因为它解决了一个具体而老派的需求:「拍照清楚」。

但到了 Y600 Pro,这套逻辑被整个换掉了。

这个变化背后,是 2000 元档手机市场的一次结构性松动。

一方面,内存价格在持续上涨,千元机正在悄悄消失,入门级手机的利润空间被压得越来越薄。如果继续走「旗舰缩水版」的老路,成本撑不住,利润率也撑不住。

另一方面,华为和苹果都在主动下探。华为有 2000 元档的产品,苹果也有 3000 元档的选择。当这些品牌进入这个价格段、用户的选择变得多了起来时,差异化就显得格外重要。

所以 Y600 Pro 必须换打法。它不能再当 S 系列的影子,得自己长出一套别人没有、也不容易模仿的卖点 —— 这就是后面那块 10200mAh 电池、那颗自研通信芯片、IP69 防护出现的真正原因。

还好,它没做成一块「板砖」

拿上手的第一感觉有点反直觉:轻。10200mAh 写在参数表上,很容易让人预期一台压手的「板砖」,但 221g 的重量和 8.15mm 的厚度,不说的话,你大概率不会想到它的电池容量已经破万。

中框做了带弧度的过渡收边,机身背面采用了微磨砂工艺,光线下呈现如水波纹般流动的光影纹理,搭配大 R 角设计,握持的手感温润。

后置摄像头模组采用了「浮光跃金」镜环设计,边缘用航空铝进行了雕琢,配合高光倒角和雕刻字样,给这台机器增添了不少质感。

手机正面搭载了一块 6.83 英寸的 1.5K 柔性直屏。这块屏幕最大的亮点是去掉了厚重的塑料支架,并且做到了 1.35mm 的极窄黑边,观感不输同价位甚至更高一档的产品。

这是 vivo 首次把电池容量拉到「万级」。这种规格过去多见于电竞或主打性能的细分品类,但把它放到 2000 元档的大众入门机上,是头一回。

落实到具体的使用场景,对于轻度使用的长辈来说,它甚至可以做到几天一充;对于需要全天候开启导航、接单软件的外卖从业者而言,不用再随时挂着一块沉重的充电宝,这本身就是体验上的巨大提升。配合 IP68 和 IP69 级的防尘防水,可靠性也完全不需要担心。

电池大,补能也得跟上。Y600 Pro 支持 90W 有线闪充,在万毫安级电池的前提下,它的回血速度并不算慢 —— 早上洗漱充一会,就够撑住大半天的基础使用。另外它还支持全局直驱供电 2.0,边充边用的发热控制会更好。

性能方面,联发科天玑 7300e 处理器规格上不算激进,应付日常的微信聊天、刷短视频、导航以及轻度游戏都没有问题。配合 OriginOS 6 的优化和 120Hz 高刷屏,日常场景下的流畅度并不会和旗舰有太大落差。

值得一提的是,机身内还加入了自研通信增强芯片 E1,针对电梯、地库等弱网环境做了优化,能保障在大多数使用场景下都不会掉线。

Y600 Pro 后置只有一颗 5000 万像素主摄,没有凑数的副摄;前置是一颗 3200 万像素镜头。日常扫个码、拍个工作记录、随手记录生活、视频通话,这套配置都够用。

综合看下来,Y600 Pro 的取舍逻辑非常清晰:与其在极其有限的预算下追求中庸的平衡,倒不如将「续航」这一痛点解决到极致。

对于这台手机的目标受众而言,10200mAh 超大电池带来的体验提升和踏实感无需多言。

最后看看价格,vivo Y600 Pro 提供四个储存版本:

  • 8GB + 128GB:1999 元(国补后 1699 元);
  • 8GB + 256GB:2299 元;
  • 8GB + 512GB / 12GB + 256GB:2599 元;
  • 12GB + 512GB:2899 元。

它瞄准的是「沉默的大多数」

vivo Y 系列的用户画像其实是非常清晰的:线下门店走进来的普通消费者、给家里长辈换机的子女、给孩子配第一部手机的家长、需要备用机的上班族。

这群人大概率不会出现在数码社群里,但他们才是线下市场真正的基本盘。他们不关心硬件和参数,对摄像头的要求只是扫码,不会去比较跑分,也不会研究主摄是几英寸的底。

他们对手机的「上限」没有要求,对「下限」有要求:别在地库里掉信号,别用半天就要找插座,别摔一次就碎屏,别让长辈总要找充电器。

这是一个比「在 2000 块里凑一台像样的手机」实在得多的命题。它的逻辑不再是「让你在预算内退而求其次」,而是「在你的预算内,把你最在意的事情解决掉」。

从这个意义上讲,Y600 Pro 可能是 vivo 今年最重要的一款产品。它不一定最贵、不一定最亮眼,但它代表了 vivo 这家公司对入门级市场的一次重新理解 —— 这个档位的用户要的是什么,不再由旗舰来定义。

#欢迎关注爱范儿官方微信公众号:爱范儿(微信号:ifanr),更多精彩内容第一时间为您奉上。

❌